просто я полистал, и понял, что есои бы я был сферческим вкатывальщиком в вакууме, я бы почти ни хрена не понял из этой болтологии. Даже элементарные вещи это только запутывает (там автор умудрился сделать главу про статистику ДО главы по терверу, и в ней пытался путано на пальцах объяснить, что такое несмещенная оценка дисперсии, послав в итоге на википедию)
кстати да, совсем забыл про всевозможные бесплатные программы от https://bioinf.me/education
Сам я совсем другими штуками занимаюсь, но институт биоинформатики обычно очень хвалят. Курсы на степике у них имхо слабоваты, но их годичные программы оч хороши, и там есть два трека: для информатико-математиков, которые вкатываются в биологию, и наоборот
алсо да, подтянуть по матану и терверу отличные курсы на степике от computer science center (особенно по терверу, он прям эталонный) — лаконичные лекции и достаточно потные задания, можно пройти довольно быстро, и при этом сильно преисполниться, если решать самому. По линейной алгебре на степике есть хороший курс на английском языке, забыл кто автор, но на английском он один там.
ну смотри какое дело, давай пройдемся по порядку.
Первое: язык программирования вторичен, это может быть с таким же успехом и R, в любом случае, на уровень, достаточный для написания околонаучного кода, он подтянется сам собой в процессе попыток чото сделать (ниже будут упомянуты курсы, в процессе которых вполне себе подтянется питон), книги читать для этого имхо бесполезно.
Второе: если ты хочешь делать scientific ds/ml, особенно учитывая что ты из околомеда (там это ваще критично), надо достаточно уверенно прошариться в прикладной статистике — ставить корректные гипотезы и делать корректные выводы из экспериментальных данных, понимать статистическую значимость результатов. К сожалению достаточно часто люди из разных наук, использующие статистику, делают это из рук вон плохо и это большая беда в академии, которая много обсуждается. Книжек по статистике много разных уровней, мой фаворит из условно-начальных (всякую статистику на котиках упоминать не буду все же) это "All of Statistics" Ларри Вассермана, несмотря на название, она очень сжатая, лаконичная и ясная, и при этом дает хорошее понимание предмета, если ты делаешь все упражнения (в интернете есть решения, с которыми можно сверяться). В целом хорошие книжки по этому и другим топикам ищутся по следующей схеме: вбиваешь в поиск на амазоне, смотришь рейтинги и отзывы людей, читаешь описания.
Третье: собственно сам заветный AI. Тут надо понимать одну вещь — этим словом накрывают большую и неоднородную область машинного обучения, которая в свою очередь условно делится на две большие области — т.н. классического машинного обучения (оно же статистическое обучение) и глубинного обучения (его щас и форсят в основном как AI, нейроночки то бишь). Если тебя интересует анализ результатов всяких экспериментов, анализ табличных данных и т.д. это больше в классический мл. Можно начать с хорошего бесплатного курса https://mlcourse.ai/book/index.html, там надо и покодить, и подумать. Хорошие книжки: Introduction to Statistical Learning (для начинающих), Elements of Statistical Learning / Pattern Recognition and Machine Learning (для продолжающих, первая с точки зрения классической статистики, вторая с точки зрения байесовской, скорее всего ты начнешь удавливать разницу, когда приблизишься к "продолжающему" уровню).
Нейронки в околомедицине в основном используются для всяких задач компьютерного зрения, насколько я знаю из рассказов коллег, работающих в медтехе. Отличный (бесплатный!!) курс от физтеха по дип лернингу https://m.vk.com/dlschool_mipt с самых азов (питон и немного классического мл для затравки) до вполне себе продвинутых тем, можно проходить самостоятельно (материалы доступны), можно регистрироваться на очередную волну и проходить в режиме онлайн, есть продвинутый поток и поток для начинающих, полный курс расчитан как раз на год (два семестра). С книгами все похуже, это область, которая завязана на свежие статьи, есть классическая книжка Deep Learning Гудфеллоу, многие детали там устарели, но это отличное чтиво, чтоб в целом уловить методологию и интуицию. Есть еще всякие книжки типа Deep Learning with Python and *Framework_name*, их советовать не буду, хотя хвалят в целом из таких книгу автора Себастьяна Рашки, но я убежден, что книги должны быть про теорию, а не про копипаст кода.
Что я считаю хорошими книгами: хорошая книга имеет внутри минимум рукомахания и позволяет при внимательном прочтении получить явное и безусловное понимание предмета и способность ответить на сравнительно тонкие и глубокие вопросы.
Ложка дегтя: повторить математику в объеме основных фактов все-таки придется, а именно — дифференциальное и интегральное исчисление одной и нескольких переменных (даже не матанализ, а буквально производные/интегралы, то, что называется calculus), линейную алгебру (любой стандартный инженерный курс), базовую теорию вероятностей (то же самое что и с линалом). Несмотря на то, что почти вся профильная литература и вышеупомянутые курсы включают в себе краткую пробежку по требуемой математике, особенно если всплывают какие-то более продвинутые вещи, которые не входят в базовые требования, практика показывает, что без некоторой предварительной математической зрелости людям обычно очень тяжко (в том же Deep learning School до конца доходит традиционно мало человек). Хорошо повторить требуемую конкретно для области математику можно в вводной главе книги Probabilistic Machine Learning: An Introduction, более подробный рассказ нескольких избранных тем можно найти в книге Mathematics for Machine Learning.
Все вышеупомянутые книги кроме статистики выложены авторами в доступ бесплатно, ну и конечно же в первую очередь стоит обратить внимание на практику и не пытаться читать все книжки сразу. В целом можно умеренно-интенсивно освоить достаточно солидный объем за год-полтора, так что удачи!
минимальная математическая подготовка есть?
для "самых маленьких", но не ленивых, хорошо подойдет этот бесплатный self-paced курс: https://mlcourse.ai/book/index.html
не поленился и нашел книжку на английском, на случай если переводчик косячил, но все равно: вещи объяснены плохо, такие книги читать не стоит даже начиная с нуля, пользы от них будет ноль
это все если че не снобизм, а совет перекатывающимся в область: если вы хотите, то будьте готовы к тому, что на собесах (по крайней мере поначалу) будут спрашивать и формулы, и задавать вопросы на вполне конкретное понимание математики, и в принципе ваше дальнейшее развитие предполагает вашу готовность и способность читать вполне себе научные статьи, поэтому сначала освежайте математику, а потом сразу выкидывайте книжки, где нет формул и все объясняется водяным текстом аля "ну вот у нас тут гиперплоскость максимизирует расстояние но ее может и не существовать"
Честно говоря, назначение книги непонятно вообще, галопом по европам какое-то — по питону/sql/mapreduce все равно надо будет знакомиться с нормальными источниками, по статистике/мл все безумно поверхностно и рукомахательно, тут надо понимать одну вещь: без минимального математического бекграунда (подразумевается хотя бы собирательный курс т.н. "высшей математики" в объеме обычной инженерной/экономической/etc. специальности — базовый линал, дифференциально и интегральное исчисление, базовый тервер) такие штуки все равно не схватишь, а если какой-то минимальный бекграунд есть, то надо открывать более солидные книжки "для самых маленьких" — Introduction to Statistical Learning например, или Mathematics for Machine Learning, если хочется освежить некоторые (довольно рандомные) темы из математики, ну а дальше уже по всей классике. И для минимального подъема статистики тоже какие-нибудь пиндосские книжки с упором на first course in и практическое применение. Эта же книжка судя по фоткам учит буквально запускать модели из sklearn и рукомахательно их объясняет, это плохо, потому что дает токмо иллюзию понимания.
Алсо перевод местами режет глаз, видно что переводчик не знаком с общепринятым переводом дсной терминологии на русский язык (переподгонка лол).
очень органичен был в прослушке и в босхе, и в целом классный актер ((