Сап, программач мурмурмурмур Я недо-говно-кодер, не знаю, что такое ООП и очень смутно представляю, что такое, например, O(n). Пару лет назад учил Python и R, сейчас Python почти забыл, на R пишу всякие скрипты по работе (для расчётов, генерации табличек Excel заданного формата, немного операций с текстами и т.д.) Работа слегка макакинговая но скрипты снижают градус уныния. В перспективе хотел бы вкатиться во всякую аналитику и т.п. (немного могу в статистику, совсем немного игрался с Data Mining). Хочу от вас советов мудрых, что мне лучше всего делать дальше. Менять язык на что-то более современное и крутое? Читать книги/проходить курсы, если да, то посоветуйте, какие? Закатать губу, и не лезть в компанию солидных людей?
>>761772 (OP) Ебать ты даже работу нашел с R. Дави в этом направлении, хули. Повспоминай всю хуйню, выучи новую на Dataquest и Datacamp, попробуй себя в Kaggle и замути анализ данных на рабочем месте. Перспективы просто охуенные.
>>761852 >Ебать ты даже работу нашел с R Намекаешь, что R никому особо не нужен? >Dataquest Datacamp Kaggle Спасибо, анон, загуглю. >замути анализ данных на рабочем месте Вряд ли взлетит, для анализа данных у нас есть специально обученные люди, меня пошлют нахуй если я вместо выполнения своих обязанностей начну их дублировать. А есть возможность замутить анализ данных левому дяде по фрилансу?
>>761857 О чём именно мне с ним поговорить? Я же как бы понимал, на что иду, когда откликался на вакансию.
R умер, сейчас в моде питон. Но по твоему рассказу ты дно какое-то. Тебе надо перепрофилироваться на нормальные обязанности, если не хочешь оказаться в жопе через некоторое время. Вот те специально обученные люди, ты должен стать одним из них.
>>762106 Спасибо за мнение. >R умер, сейчас в моде питон По-моему, всё ещё дохрена людей, особенно в области анализа данных, юзают R. Не пруфанёшь своё утверждение? >те специально обученные люди, ты должен стать одним из них Да, я хочу, меня интересует, что для этого предпринять. >по твоему рассказу ты дно какое-то Да, есть немного :-(
Раз тут тред про R, спрошу про свое, но довольно близкое.
Я вот через месяц получу диплом врача, но за шесть лет надоело, поэтому последний курс больше угорал по медицинской науке. При этом есть склонность к математике, навыки эникейщика и кое-какие поверхностные знания в "научной статистике". Ну и на данный момент я помогаю с банальной обработкой данных простых исследований. Типа как обезьянка считаю хи-квадраты двумя кнопками Охуительная новость в том, что значительная часть к.м.н. и д.м.н. в душе не ебут, что это и как это делать, такие дела
Проблема в том, что это же все методы вековой давности, а на всяких хабрах используют всякие бутстрепы и прочие нейронные сети. Все это в медицинских исследованиях применяется чуть чаще, чем никогда. Видимо, потому что никто не умеет, лол. А мне прям очень хочется этим заниматься, и поле непаханое есть. Но я же, блядь, выпускник меда, и мои знания в математики остановились в районе Ньютона-Лейбница, а теорию вероятностей я не знаю вообще. Какой-нибудь ШАД требует отличных базовых знаний, которых у меня нет. С чего начинать, куда двигаться? Советов мудрых хочу.
>>762177 >всякие бутстрепы и прочие нейронные сети. Все это в медицинских исследованиях применяется чуть чаще, чем никогда. Видимо, потому что никто не умеет, лол. Ну это ты так думаешь. Очень даже применяют в медицине всякие новомодные алгоритмы датамайнинга и машин лернинга, но не в расеюшке, разумеется. В цивилизованном-то мире вон http://www.dmmh.org/ целые международные конференции организуют по вопросам использования датамайнинга в медицине. Наверняка полно и сборников трудов и даже целых серий на эту тему в каких-нибудь шпрингерах.
>>762225 Ну, вот именно, что не в рассеюшке и пока довольно далеко от клинической практики, с представителями которой я общаюсь. Мне даже пристать с просьбами "поучите меня" особо не к кому.
>>762238 >Мне даже пристать с просьбами "поучите меня" особо не к кому. Тута спрашивай. Но применение всяких алгоритмов в медицине ничем не отличается от применения их где угодно еще.
>>762274 Так я за этим и пришел. Все предыстория про мед тому, что базовых знаний у меня нет и нужна точка старта. Начал пока с курса МФТИ на курсере, нормально?
>>762170 >Да, я хочу, меня интересует, что для этого предпринять. Поговори по душам с начальником. Если он не проникнется, пройди ШАД и пытайся в Яндекс.
Решил вам, бэтмены, ответить скопом. Я пилю проекты в области machine learning / text mining, на питоне. Причины простые - каждый проект раньше начинался с nltk и sklearn, в последние месяцы к ним добавился tensorflow. Мои кореша, занимающиеся анализом картинок, так же сидят на theano/tf/caffe и что там еще на пистоне? Все эти библиотеки делают ведущие научные группы сша/канады/европы в области vision/machine learning/nlp/deep learning.
Ждите прорыва в медицине в виде алгоритмов анализа истории болезни, методов анализа вакцин, автоматического анализа МРТ и тд.
Часто я встречаю репозитории на Матлабе и почти никогда - на R.
Если бы я занимался актуарной математикой или кредитным скорингом - расписал бы тут за R.
>>762177 >Какой-нибудь ШАД требует отличных базовых знаний, которых у меня нет Для поступления в ШАД требуются алгебра и анализ на уровне первого курса, плюс основы алгоритмов. Вполне можно задрочиться и поступить, пусть и не на бесплатное отделение.
Не хочу создавать новый тред - поясните за Wolfram Mathematica. Есть ли смысл тамошний язык программирования (я - НИИшник в области материаловедения) для облегчения расчетов или лучше перекатиться в Python?
Кстати, практичный вопрос по R - как строить "изотермы" по данным? Скажем, есть у меня график (пикрилейтед), возле каждой точки указано среднее арифметическое значение (состоит из двух-трех замеров с разбросом в 10-20 единиц). Можно ли построить линию, отвечающую значению 40 или 50? Как приблизительно выглядит код?
>>761772 (OP) > Работа слегка макакинговая но скрипты снижают градус уныния. А мне один борщехлеб заливал про матан, что дескать ему платят бабло за НАУКУ (фрилансил на этом R). По сути это ведь тот же Excel? Там тоже были какие-то статистические функции, и диаграмы можно рисовать.
>>764094 Мне нужно провести линии, которые отвечают какому-то одному значению на графике (пикрилейтед), при этом желательно, чтобы программа учитывала разброс значений в каждой точке. Я когда-то читал известную книгу "An Introduction to Statistical Learning" (дропнул после первой главы и засел за мат. статистику, может когда-то продолжу), так там похожая процедура называлась K-Nearest Neighbors.
>>764993 >An Introduction to Statistical Learning У меня в списке на прочтение лежит уже не первый месяц. Сложная?
>Мне нужно провести линии, которые отвечают какому-то одному значению на графике Охъ. С этим, увы, помочь не могу (я не очень задрачивал всякие джиджиплоты). Могу предложить костыль, как соединить ломаными линиями точки с (примерно или точно) одинаковыми значениями третьей переменной через polygon Будет выглядеть примерно так: (не стал воспроизводить все точки)
>>765148 Я осознаю, что существуют безмозглые пидоры, у которых в список значимых критериев может входить, к примеру, синтаксис языка. Hу так накласть мне на них. Меня интересуют объективные критерии, а не цацки всякие.
>>765123 Я ничего не знаю про VBA, анон. Скажи, он умеет парсить текстовые документы или какие-нибудь XML файлы, загружать данные по ссылке из интернетов, запускать код из файла, работать с географическими картами, считать временнЫе ряды или главные компоненты или более 9000 разных статистических тестов? Да, половину этого умеет не сам R, а разнообразные пакеты под него - есть ли такие пакеты под VBA и появляются ли новые так же часто, как для R? А у VBA есть IDE, которая умеет подставлять код, соединяться с системой контроля версий и генерировать self-contained файлы (т.е. и с текстом, и с кодом, который можно запустить) и отчёты в pdf или html?
>>765153 >синтаксис языка Синтаксис в R, честно говоря, не очень по сравнению с Питоном. Зато он векторизован, т.е. одной операцией a + b можно почленно сложить 2 набора по N чисел.
Да, я довольно поверхностно смотрю на язык, я же нуб.
>>766277 read.table по дефолту предполагает определённый формат ввода - пробел/таб как разделитель столбцов и т.д. и т.п. Набери в консоли ?read.table и читни справку, если ещё не. В твоём случае лучше всего использовать "сокращённую" функцию:
read.csv по умолчанию считает разделителем столбцов запятую. header = FALSE значит, что у таблицы нет шапки (а её нет). na.strings = '' - пропущенные значения обозначены пустыми строками (это две одинарные кавычки, а не одна двойная) stringsAsFactors = F убережёт от геморроя.
Я недо-говно-кодер, не знаю, что такое ООП и очень смутно представляю, что такое, например, O(n).
Пару лет назад учил Python и R, сейчас Python почти забыл, на R пишу всякие скрипты по работе (для расчётов, генерации табличек Excel заданного формата, немного операций с текстами и т.д.)
Работа слегка макакинговая но скрипты снижают градус уныния.
В перспективе хотел бы вкатиться во всякую аналитику и т.п. (немного могу в статистику, совсем немного игрался с Data Mining).
Хочу от вас советов мудрых, что мне лучше всего делать дальше.
Менять язык на что-то более современное и крутое?
Читать книги/проходить курсы, если да, то посоветуйте, какие?
Закатать губу, и не лезть в компанию солидных людей?