просто я полистал, и понял, что есои бы я был сферческим вкатывальщиком в вакууме, я бы почти ни хрена не понял из этой болтологии. Даже элементарные вещи это только запутывает (там автор умудрился сделать главу про статистику ДО главы по терверу, и в ней пытался путано на пальцах объяснить, что такое несмещенная оценка дисперсии, послав в итоге на википедию)
кстати да, совсем забыл про всевозможные бесплатные программы от https://bioinf.me/education
Сам я совсем другими штуками занимаюсь, но институт биоинформатики обычно очень хвалят. Курсы на степике у них имхо слабоваты, но их годичные программы оч хороши, и там есть два трека: для информатико-математиков, которые вкатываются в биологию, и наоборот
алсо да, подтянуть по матану и терверу отличные курсы на степике от computer science center (особенно по терверу, он прям эталонный) — лаконичные лекции и достаточно потные задания, можно пройти довольно быстро, и при этом сильно преисполниться, если решать самому. По линейной алгебре на степике есть хороший курс на английском языке, забыл кто автор, но на английском он один там.
ну смотри какое дело, давай пройдемся по порядку.
Первое: язык программирования вторичен, это может быть с таким же успехом и R, в любом случае, на уровень, достаточный для написания околонаучного кода, он подтянется сам собой в процессе попыток чото сделать (ниже будут упомянуты курсы, в процессе которых вполне себе подтянется питон), книги читать для этого имхо бесполезно.
Второе: если ты хочешь делать scientific ds/ml, особенно учитывая что ты из околомеда (там это ваще критично), надо достаточно уверенно прошариться в прикладной статистике — ставить корректные гипотезы и делать корректные выводы из экспериментальных данных, понимать статистическую значимость результатов. К сожалению достаточно часто люди из разных наук, использующие статистику, делают это из рук вон плохо и это большая беда в академии, которая много обсуждается. Книжек по статистике много разных уровней, мой фаворит из условно-начальных (всякую статистику на котиках упоминать не буду все же) это "All of Statistics" Ларри Вассермана, несмотря на название, она очень сжатая, лаконичная и ясная, и при этом дает хорошее понимание предмета, если ты делаешь все упражнения (в интернете есть решения, с которыми можно сверяться). В целом хорошие книжки по этому и другим топикам ищутся по следующей схеме: вбиваешь в поиск на амазоне, смотришь рейтинги и отзывы людей, читаешь описания.
Третье: собственно сам заветный AI. Тут надо понимать одну вещь — этим словом накрывают большую и неоднородную область машинного обучения, которая в свою очередь условно делится на две большие области — т.н. классического машинного обучения (оно же статистическое обучение) и глубинного обучения (его щас и форсят в основном как AI, нейроночки то бишь). Если тебя интересует анализ результатов всяких экспериментов, анализ табличных данных и т.д. это больше в классический мл. Можно начать с хорошего бесплатного курса https://mlcourse.ai/book/index.html, там надо и покодить, и подумать. Хорошие книжки: Introduction to Statistical Learning (для начинающих), Elements of Statistical Learning / Pattern Recognition and Machine Learning (для продолжающих, первая с точки зрения классической статистики, вторая с точки зрения байесовской, скорее всего ты начнешь удавливать разницу, когда приблизишься к "продолжающему" уровню).
Нейронки в околомедицине в основном используются для всяких задач компьютерного зрения, насколько я знаю из рассказов коллег, работающих в медтехе. Отличный (бесплатный!!) курс от физтеха по дип лернингу https://m.vk.com/dlschool_mipt с самых азов (питон и немного классического мл для затравки) до вполне себе продвинутых тем, можно проходить самостоятельно (материалы доступны), можно регистрироваться на очередную волну и проходить в режиме онлайн, есть продвинутый поток и поток для начинающих, полный курс расчитан как раз на год (два семестра). С книгами все похуже, это область, которая завязана на свежие статьи, есть классическая книжка Deep Learning Гудфеллоу, многие детали там устарели, но это отличное чтиво, чтоб в целом уловить методологию и интуицию. Есть еще всякие книжки типа Deep Learning with Python and *Framework_name*, их советовать не буду, хотя хвалят в целом из таких книгу автора Себастьяна Рашки, но я убежден, что книги должны быть про теорию, а не про копипаст кода.
Что я считаю хорошими книгами: хорошая книга имеет внутри минимум рукомахания и позволяет при внимательном прочтении получить явное и безусловное понимание предмета и способность ответить на сравнительно тонкие и глубокие вопросы.
Ложка дегтя: повторить математику в объеме основных фактов все-таки придется, а именно — дифференциальное и интегральное исчисление одной и нескольких переменных (даже не матанализ, а буквально производные/интегралы, то, что называется calculus), линейную алгебру (любой стандартный инженерный курс), базовую теорию вероятностей (то же самое что и с линалом). Несмотря на то, что почти вся профильная литература и вышеупомянутые курсы включают в себе краткую пробежку по требуемой математике, особенно если всплывают какие-то более продвинутые вещи, которые не входят в базовые требования, практика показывает, что без некоторой предварительной математической зрелости людям обычно очень тяжко (в том же Deep learning School до конца доходит традиционно мало человек). Хорошо повторить требуемую конкретно для области математику можно в вводной главе книги Probabilistic Machine Learning: An Introduction, более подробный рассказ нескольких избранных тем можно найти в книге Mathematics for Machine Learning.
Все вышеупомянутые книги кроме статистики выложены авторами в доступ бесплатно, ну и конечно же в первую очередь стоит обратить внимание на практику и не пытаться читать все книжки сразу. В целом можно умеренно-интенсивно освоить достаточно солидный объем за год-полтора, так что удачи!
минимальная математическая подготовка есть?
для "самых маленьких", но не ленивых, хорошо подойдет этот бесплатный self-paced курс: https://mlcourse.ai/book/index.html
не поленился и нашел книжку на английском, на случай если переводчик косячил, но все равно: вещи объяснены плохо, такие книги читать не стоит даже начиная с нуля, пользы от них будет ноль
это все если че не снобизм, а совет перекатывающимся в область: если вы хотите, то будьте готовы к тому, что на собесах (по крайней мере поначалу) будут спрашивать и формулы, и задавать вопросы на вполне конкретное понимание математики, и в принципе ваше дальнейшее развитие предполагает вашу готовность и способность читать вполне себе научные статьи, поэтому сначала освежайте математику, а потом сразу выкидывайте книжки, где нет формул и все объясняется водяным текстом аля "ну вот у нас тут гиперплоскость максимизирует расстояние но ее может и не существовать"
Честно говоря, назначение книги непонятно вообще, галопом по европам какое-то — по питону/sql/mapreduce все равно надо будет знакомиться с нормальными источниками, по статистике/мл все безумно поверхностно и рукомахательно, тут надо понимать одну вещь: без минимального математического бекграунда (подразумевается хотя бы собирательный курс т.н. "высшей математики" в объеме обычной инженерной/экономической/etc. специальности — базовый линал, дифференциально и интегральное исчисление, базовый тервер) такие штуки все равно не схватишь, а если какой-то минимальный бекграунд есть, то надо открывать более солидные книжки "для самых маленьких" — Introduction to Statistical Learning например, или Mathematics for Machine Learning, если хочется освежить некоторые (довольно рандомные) темы из математики, ну а дальше уже по всей классике. И для минимального подъема статистики тоже какие-нибудь пиндосские книжки с упором на first course in и практическое применение. Эта же книжка судя по фоткам учит буквально запускать модели из sklearn и рукомахательно их объясняет, это плохо, потому что дает токмо иллюзию понимания.
Алсо перевод местами режет глаз, видно что переводчик не знаком с общепринятым переводом дсной терминологии на русский язык (переподгонка лол).
если бы ты послушал песню стиви вандера, то понял бы, что оттуда не просто семплы взяты — гангстас парадайз это практически дословный (в плане музыки) кавер на оригинал. Но и сделано это было, конечно, с разрешения вандера
ну мы с таким успехом можем любую программу которая сохраняет куда- о какие-то данные назвать субд, но нет же, у слова субд есть вполне четкое определение
ну там явно не собственная субд хахахах
щито? ютрэк это вообще не субд, это хуйнюшка для управления рабочими процессами
у джетбрейнсов есть своя внутренняя субд что ли?
только его не существует в природе...
а куда они привели компанию и каким именно звонком была смерть сегаловича?
до катастрофы:
а) яндекс был силен как никогда
б) надо понимать что это бизнес, которые строился два десятка с лишним лет полностью завязанный на конкретный регион, и занимающий в регионе нишу, которую в других регионах занимают другие бизнесы
в) из этого следует, что такой бизнес нельзя магически взять и увести в другую юрисдикцию, потому что это вызовет недовольство власти, а в бизнесе, завязанном на регион это недопустимо — он просто перестанет существовать в прежнем виде и неважно каким он был до этого.
да, в 2014 году с властью резко стало куда хуже, но повторюсь, простой вопрос, что им было делать? сказать "все ребята, мы закрываемся, потому что принципы", сотрудников на мороз а самим как дуров уезжать и делать свой телеграм? или не закрывать, но сдать бездарным госуправленцам и их прокладкам полностью, чтоб те медленно гробили компанию? ну они в итоге сделали такой выбор, какой сделали, да, он сложный и неоднозначный, но эти люди живут в мире совсем другой ответственности, там нельзя не идти на компромиссы
я не понаслышке знаком с it сектором, его работниками и их переживаниями. да, многие уедут, но многие останутся, и спектр возможных причин гигантский, далеко не все уезжают даже при наличии финансовых возможностей.
"китай прикроет" это не универсальная отговорка, просто я в принципе реалистично смотрю на вещи, и понимаю, что значительная часть мира к санкционным ограничениям не присоединилась, и пускай открыто раздражать сша мало кто рискнет, работа в серую все равно продолжится, такие вещи не так просто отследить. (забыли, как сименс после 14 года турбины в крым ставил? сейчас конечно немцев не будет, но азиаты это не немцы)
Да, режим в этот раз учинил катастрофу, но это не повод хоронить всех, кто не уехал
яндекс еще осенью ввел в строй огромные вычислительные кластеры (во-первых). во-вторых, яндекс компания не российская и юридически для них далеко не все потеряно. в-третьих, не стоит питать иллюзий, что китайцы и другие азиаты не будут приторговывать железом в серую, подороже конечно, но что сделать, выбора не будет, так или никак
лично мне пока неизвестно о сворачивании каких-либо из их значимых проектов "на перспективу". в любом случае я смотрю на вещи оптимистично, в руководстве яндекса опытные умные люди, не чета основной массе российских госуправленцев, и черные лебеди уже были, пусть и не настолько противные как сейчас
ну и у яшки скоро будет новый большой источник прибыли — облачные вычисления, потому что в рф они много кому нужны, а на ажуры, авсы и иже с ними очевидно дорога закрыта почти всем тут
ну да, и яндекс постоянно этими инвестициями занимается, как никак единственная достойная бигтех компания постсовка, просто речь о том, что львиная часть этих минусов легко исчезнет, если на время подзатянуть пояса и не тратить деньги на то, что не является необходимым прямо сейчас
свободные (валютные, что важно) деньги яндекса на конец февраля легко гуглятся, там достаточно солидная сумма. дефолт может быть, если все держатели облигаций вдруг резко потребуют их выкупа, что, естественно, маловероятно, просто яндекс обязан о таких рисках предупреждать, но все из этого раздули хз что
эти минусы складываются из постоянных затрат на дальнейшее расширение, rnd, экспериментальные проекты, которые открываются и закрываюся, и так далее, так у любой крупной корпорации. очевидно, что в случае полномасштабного дерьма они будут лишние расходы срезать (уверен, что минус в "прочих инициативах" резко станет меньше, если они, например, перестанут сейчас заниматься экспериментами с беспилотными авто
this, яндекс богатая контора с диверсифицированным бизнесом, обслуживающая преимущественно внутренний рынок, а предполагаемое банкротство, с которым все так носятся, выросло из гораздо более безобидной новости. Всем людям, которые заявляют что-то про "ололо не война так бесчестие": с морально-этической точки зрения конкретно взятого человека вы конкретно правы, но нюанс в том, что управленцы таких компаний не могут вести никаких войн, им надо думать о десятках тысяч сотрудников, да и крупные акционеры им не дадут принять никаких судьбоносных решений. я понимаю, что всем нравится приводить пример героического дурова, который съебал в туман с миллионами в кармане и набрал себе новую команду, но куда съебывать тысячам сотрудников яндекса, которые платят ипотеки и которым детей кормить надо? Учитывая, что такой политически спорный юнит — новости — у яндекса всего один, вообще странно, как все на него накидываются, как будто они все там добровольно выполняют требования апешечки (повторюсь, легко быть оппозиционным героем когда ты один, но не когда от тебя зависит дохуя людей, я почти уверен, что ни волож, ни бунина, ни кто там еще этому не рады, и госконтролю они в свое время сопротивлялись как могли)
на нетфликсе уже был крайне отбитый и мясной (в хорошем плане, такой филигранный треш редко снимают) "ночь идет за нами", собственно воспринимался как угашенная версия рейда и это было круто, но тут гляжу на причастных людей и думается, что будет пресно до безумия
говно инкаминг
вот да, тоже чот подумалось об этом. в моменте смотрелся конечно свежо, но в целом это странный плод странной эпохи с поголовным увлечением тридэ и всем вот этим вот. cgi там конечно титанический даже по нынешним меркам, но все равно все выглядит как пестрый пластмассовый мультик, неприятное ощущение. ну и максимально стерильный сюжет, да
впервые его включили по специальному каналу связи астронавту Томасу Песке, находящемуся на Международной Космической Станции.бедолага, за что его так
ии приз за самый бессмысленный булщит-бинго комментарий уходит тебе. пампампам
очень органичен был в прослушке и в босхе, и в целом классный актер ((