Машинное обучение — одно из самых перспективных направлений IT. По некоторым прогнозам, мировой рынок Machine Learning к 2027 году вырастет до $117,19 млрд (а еще в 2019 году он составлял только $8,43 млрд). Специалисты по машинному обучению становятся все более востребованными, так что, если вы подумываете об IT-карьере или уже ее строите, ML может стать неплохим вариантом. А чтобы вам было легче на первых порах, T&P попросили экспертов отрасли посоветовать материалы для начинающих специалистов.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/224/image/base_1c51003925.jpeg)
Никита Учителев
Руководитель группы машинного обучения и анализа данных, Яндекс Маркет
Если начинающий специалист сможет разобраться хотя бы с половиной каждой из этих книг, он точно справится с большинством современных прикладных задач.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Книги
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/230/image/base_008571b8bd.jpeg)
The Elements Of Statistical Learning
Trevor Hastie
Издательство: Springer, 2009
Справочник по большинству классических методов и алгоритмов машинного обучения на английском языке. Давно стал для меня настольной книгой на работе, раз в пару месяцев заглядываю и освежаю в памяти какие-то детали. Интересно еще следить за ходом мысли — какой метод из какого вытекает. Это помогает понять, зачем вообще его использовать.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/231/image/base_76b8fb030a.jpeg)
«Создаем нейронную сеть»
Тарик Рашид
Издательство: «Вильямс», 2017
Предыдущая книга посвящена классическим методам, а вот изучение нейросетевых технологий, на мой взгляд, лучше всего начинать с этой. Здесь много наглядных материалов на тему того, как работают конкретные архитектуры сетей, а еще понятно излагаются базовые принципы, которые закладывались в эту технологию. Вывести их самому, по примерам в открытом доступе, довольно сложно.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/232/image/base_fe81713697.png)
Quantifying The User Experience
Jeff Sauro
Издательство: Morgan Kaufmann, 2012
Неплохая книга про метрики и продукт. Когда вы получаете практический опыт обучения ML-моделей, техническая составляющая постепенно отходит на второй план. В фокусе оказывается анализ различных метрик, которые меняются под действием продуктов на основе этих моделей. Советую начать разбираться с этими процессами как можно раньше: они часто бывают такими же сложными, как и разработка самих моделей.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/233/image/base_ec9ffbd2df.jpeg)
«Конечномерные векторные пространства»
Пол Халмош
Издательство: Государственное издательство физико-математической литературы, 1963
Необычная рекомендация, во время учебы в МФТИ читал эту книгу как сборник стихов. Написано и переведено очень интересным языком — пример того, как в математике нужно формулировать мысли и
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/228/image/base_094538575f.jpeg)
Валерий Лобанов
Data Scientist, специалист в области динамического ценообразования, Spacecode
В ML нужно начинать не только с теории и практики. Важно попутно заполнять пробелы в знаниях математики.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Курсы
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/248/image/base_0e5f18ca10.jpg)
Курс лекций «Машинное обучение», Соколов Е. А.
На мой взгляд, нет ничего лучше для освоения базового курса ML. Много информации в максимально понятном формате как по классическому ML (github), так и по DL (github) с разбором реальных приложений.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/250/image/base_ded47bba19.jpg)
Репозиторий ШАД Яндекса
Загляните сюда, если предыдущий курс покажется легким. Здесь есть отдельные материалы по каждой области DS.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/247/image/base_46c6c0801d.jpg)
«Байесовские методы машинного обучения», Ветров Д. П.
Курс лекций, который отлично подходит для расширения кругозора.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Книги и статьи
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/235/image/base_b402de8c1d.jpeg)
«Глубокое обучение. Погружение в мир нейронных сетей»
Николенко С. И.
Издательство: «Питер», 2019
Отличная книга, чтобы узнать о ML в целом. За последние годы она уже стала классикой по ML на русском языке, читается легко — почти как художественная.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/234/image/base_e25d00a398.jpeg)
«Вероятность. В 2 книгах. Книга 1»
Ширяев А. Н.
Издательство: МЦНМО, 2021
Поможет освежить математическую базу, а лекторий ФПМИ заполнит пробелы в других областях.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/236/image/base_8bcbe82cc2.jpeg)
«Компьютерный анализ данных: теория обучения машин»
Червоненкис А. Я.
Издательство: «Яндекс», 2009
Немного устаревшая, но классическая книга одного из основателей советской школы ML. Подходит для расширения кругозора.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/246/image/base_f9dc5eac84.jpg)
Статьи на arxiv, paperswithcode и т. д.
Для тех, кто разобрался с предыдущими материалами и все понял.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/223/image/base_ea2811ebc9.jpg)
Татьяна Савельева
CEO, Yandex SupportAI
Хорошо бы «заботать» фундамент, понять базовые вещи, а потом читать статьи, которые вышли за последний месяц. В сфере глубокого обучения все меняется примерно каждые полгода. Здесь нужно выучить ствол дерева и ветви, а листья постоянно обновлять, руководствуясь любопытством и пользой для конкретных задач.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Курсы
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/251/image/base_ec8b76e4df.jpg)
Курс лекций, Воронцов К. В.
Фундаментальная штука, создает очень хорошую базу с понятной аксиоматикой и очень строгими выводами.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Книги
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/238/image/base_3ceb716246.jpeg)
«Думай медленно… решай быстро»
Даниэль Канеман
Издательство: «АСТ», 2021
Перед тем как разбираться с искусственным мозгом, стоит разобраться со своим и начать с себя.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/237/image/base_1b7c4ba9bd.jpeg)
«Глубокое обучение»
Ян Гудфеллоу
Издательство: «ДМК Пресс», 2017
Это хардкор, для тех, кто хочет разобраться в глубинах.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/225/image/base_463476112e.jpg)
Константин Гаврильчик
Руководитель двух команд машинного обучения «Модерация» и «Десант», ЦИАН
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Курсы
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/249/image/base_5a4422686d.jpg)
Deep Learning course at Skoltech / Yandex School of Data Analysis
Поставил слеш, потому что это почти один и тот же курс от одних и тех же экспертов. Домашние задания курса подходят новичкам, но будут полезны даже middle-специалистам. Позволяют понять, как DL работает на низком уровне, а не на уровне формул и черных ящиков-фреймворков.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/252/image/base_272e5e9d38.jpg)
Deep Learning Specialization, Andrew Ng
Серия лекций, автор хорошо объясняет на пальцах. Отлично помогают понять, что вообще происходит в тех или иных задачах и областях. Несколько лет назад я читал оригинальные статьи по Contrastive Loss, Triplet Loss, ArcFace, когда пытался разобраться с Metric Learning, но упорно не понимал, о чем вообще идет речь. Эти лекции очень пригодились, и статьи пошли намного легче!
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Книги
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/253/image/base_f8e72715e9.jpg)
«Математическая статистика»
Натан А. А., Горбачев О. Г., Гуз С. А.
Издательство: «МЗ Пресс», 2005
Думаю, далеко не лучшая книга по статам, не самая простая, но в свое время она очень помогла мне на одном из курсов Физтеха.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/239/image/base_fed693a1c1.jpeg)
«Алгоритмы: построение и анализ»
Автор: Т. Кормен
Издательство: «Вильямс», 2021
Мне эта книга помогла научиться по-другому мыслить и, соответственно, писать намного более эффективный код в реальных продакшен-системах. На моей практике за последний год даже несколько раз пришлось имплементировать достаточно нетривиальные алгоритмы на графах.
Помимо всего прочего, я бы рекомендовал просто читать статьи. Сегодня уже можно найти огромное количество классических материалов. Конечно, чтобы в них разобраться, нужно иметь неплохую математическую базу, но тем не менее это позволяет намного больше узнать об ML. А еще иногда полезно почитать исходники кода популярных библиотек: xgb, lgb, тот же sklearn, — открывает много нового. Правда, это уже вряд ли подойдет новичкам.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/227/image/base_535105606a.jpg)
Глеб Ершов
Senior Data Analyst, AliExpress Russia
Начинающим специалистам я бы советовал планомерно разбираться в теории и параллельно смотреть какие-то практические вещи.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Курсы
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/254/image/base_1fb80fa9d3.jpg)
«Deep Learning на пальцах»
Лекции, которые читают магистрантам НГУ и студентам CS центра Новосибирска.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/255/image/base_2380016e6f.jpg)
«Прикладная статистика»
Курс лектора НИУ ВШЭ Филиппа Ульянкина на GitHub.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Книги
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/256/image/base_f1c3f4289d.jpg)
«Математическая статистика»
Чернова Н. И.
Издательство: Новосибирский государственный университет, 2007
Это то, что точно стоит почитать из множества хороших учебников по статистике.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/240/image/base_29f237877a.jpeg)
«Теория вероятностей»
Боровков А. А.
Издательство: URSS, 2021
А эту книгу я бы порекомендовал, если с мат. аппаратом уже все хорошо. Как мерило собственных знаний можно использовать вот эту шпаргалку: желательно понимать все, что там написано.
Когда вам окончательно станет понятно, что такое лосс-функция, можно начать разбираться, как работают нейронки, например. Есть очень понятная методичка по их основным принципам от того же Филиппа Ульянкина. А дальше читайте «Глубокое обучение. Погружение в мир нейронных сетей» Николенко и «Глубокое обучение» Гудфеллоу. Последнюю скромно называют Библией нейронных сетей.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/226/image/base_3ed319649a.jpg)
Екатерина Малышева
Senior Data Scientist, S7 TechLab
Список материалов отсортирован от простых к сложным — как я бы сама изучала.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Курсы
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/257/image/base_9c6d53294e.jpg)
Специализация «Машинное обучение и анализ данных» от МФТИ и Яндекса
Вводный курс машинному обучению и анализу данных от МФТИ и Яндекса с примерами из бизнеса. Все материалы есть на GitHub.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/258/image/base_c442f3c74b.jpg)
Курс лекций «Машинное обучение», Соколов Е. А.
Хорошая основа для прохождения собеседований.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/259/image/base_93bac56a61.jpg)
Samsung Research Russia Open Education
Несложные курсы от Samsung по CV и NLP на Stepik. Много практики, приятно проходить. Рекомендую «Нейронные сети и компьютерное зрение» и «Нейронные сети и обработка текста».
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/260/image/base_ef3b151f35.jpg)
Курс лекций «Машинное обучение», Воронцов К. В.
Зубодробительные, но очень полезные лекции Воронцова по статистическим тестам. Подходят для более глубокого погружения в тему и изучения не только стандартных методов.
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
Книги и статьи
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/051/315/image/base_db4aeea71a.png)
![](https://storage.theoryandpractice.ru/tnp/uploads/image_block/000/063/261/image/base_ccbb4c312d.jpg)
Блог Александра Дьяконова
Полезные статьи с более детальным погружением в отдельные темы. Советую читать после курсов Соколова. А потом можно приступить к «Глубокому обучению» Гудфеллоу — книге об основах машинки и глубокого обучения. Хорошо подходит для плавного вкатывания в DL.
Комментарии
Комментировать