Новый герой в рубрике «Молодые ученые»: Илья Толстихин учит компьютеры решать задачи за человека, рассматривает науку как способ найти смысл в жизни, не собирается уезжать на Запад и восхищается физиком Ричардом Фейнманом.

Образование: кафедра математических методов прогнозирования факультета Вычислительной математики и кибернетики МГУ им. Ломоносова в 2010 году.

Что исследует: относительно молодое направление математики (на фоне прочих фундаментальных разделов), которое называется теория машинного обучения (machine learning), а конкретнее — теория вычислительного обучения (computational learning theory или просто COLT). Это наиболее математизированный подраздел того, что в совокупности принято называть «искусственным интеллектом».

Особые приметы: читает Пруста и Керуака, увлекается электронной музыкой, гордится своими родителями, любит объяснять своей девушке, зачем обучать машины, жил 6 лет в Японии.

Работать первый раз я начал летом после третьего курса — устроился в Лабораторию Касперского через сервис отправки резюме. График рабочий был удобный (с ночными сменами) и позволял не пропускать много занятий в университете — так что это был удачный вариант, ну и платили хорошо. Тогда я работал в смене вирусных аналитиков, так благополучно прошел 4 курс. В университете я особо инициатив не проявлял, правда, учился на 5 (в итоге закончил с красным дипломом).

В какой-то момент (примерно через полтора года после начала работы) я почувствовал, что сложившийся ритм жизни не приносит мне никакого творческого удовлетворения. Я почувствовал, что я попал на автопилот и если что-то не поменять — так и проживу всю жизнь в рутине повседневности. Я принял решение уволиться с работы и поступить в аспирантуру. Главной целью было загрузить свой мозг, который простаивал без дела и стимулов. До того момента наукой я не занимался совершенно. Стоит отметить, что мои родители — физики-теоретики. Папа — доктор физико-математических наук, преподает на Физтехе и работает в Курчатовском институте. Мама — кандидат, работает в Физическом институте РАН. Так что «что такое наука», «как ей занимаются» и «как все это происходит» я наблюдал ежедневно. Я горжусь своими родителями: всегда очень приятно, когда я говорю, что мама — кандидат, папа — доктор, а люди в ответ: «Нормальная семейка…»

15 декабря Илья Толстихин и его коллега Борис Янгель расскажут и покажут, чем они занимаются в своих лабораториях в ходе [лекции](http://theoryandpractice.ru/seminars/22836-zachem-uchit-kompyutery-dumat-mashinnoe-obuchenie-i-iskusstvennyy-intellekt-15-12), которую «Теории и практики» устраивают в Библиотеке-читальне имени Тургенева.

В процессе увольнения из Лаборатории Касперского я начал активно общаться с научным руководителем и проситься в аспирантуру. Сначала мне отказали. Потом было дано тестовое задание — разобраться в некой математической теории из нашей области. Я справился — и в результате написал хороший диплом. В 2010 году, после выпуска, я поступил таким образом в аспирантуру Вычислительного центра РАН в отдел Интеллектуальных систем. Помимо этого там же я являюсь инженером-исследователем.

В свете колоссального роста объемов информации, с которыми сегодня экспертам приходится работать практически во всех областях, их работа усложняется. Людям вручную становится очень сложно управляться с кучей данных. В то же время ежедневно во всевозможных областях эксперты занимаются анализом огромных объемов информации и поиском в них закономерностей — или «извлечением из них знаний». Подобные задачи встречаются повсеместно — в банковском деле, в медицине, в компьютерном зрении.

Машинное обучение изучает способы «научить» компьютер выполнять такие задачи за человека. Компьютер обладает огромной вычислительной способностью — он может просмотреть гигабайты данных. Если его «научить», как это делать, он может обнаружить в данных такие закономерности, которые пропустит или не заметит даже самый высококлассный эксперт в этой области. Весь вопрос в том, как «научить» его выискивать в данных действительно хорошие закономерности. При этом хотелось бы, чтобы ему для этого требовалось как можно меньше данных.

Сначала (когда я решил поступать в аспирантуру) наука была для меня эдаким авантюрным способом придать жизни какой-то смысл, интерес и краски. Когда я доказал свою первую теорему в дипломе — я загорелся. Сложно описать это чувство: я недели три ходил и все время крутил в голове одну задачку. И в один день вдруг ее решил. Это было не в точности как у Менделеева — но что-то подобное. Я думал на автомате над задачей и вдруг что-то выстрелило. С тех пор я начал читать много статей, учебников по математике. Выступил на одной международной конференции со своими исследованиями. Короче — начал серьезно изучать математику — по крайней мере, те ее области, которые «выстреливают» в теории машинного обучения.

Когда я окончил университет, деньги, отложенные перед уходом с работы, закончились, и стало ясно, что надо искать работу. Я связался с ЛК и предложил им нанять меня заниматься наукоемкими задачами. В итоге все устроилось чудесно — я попал в маленькую группу, которая занимается решением различных задач, связанных, так или иначе, с автоматизацией обработки информации. Ровно по моему профилю. Изучение теории в аспирантуре идеально совместилось с применением ее на практике на работе.

Существенная часть работы антивируса заключается в пополнении антивирусных баз — это как аптечка с таблетками от разных болезней. Если в аптечке есть таблетка от нового вируса — то пользователи в безопасности. Если появляется новый вирус — то надо как можно быстрее сделать под него новое лекарство, а то пользователи будут болеть. В «Касперском» созданием таких «таблеток» занимаются целые отделы. Но вирусов новых выходит очень много и, более того, часто оказывается, что создание новой таблетки — достаточно рутинный и однотипный процесс. Почему бы не научить делать это компьютер? Хотелось бы дать роботу кучку похожих болезней и попросить его создать такую «комплексную» таблетку, которая лечила бы от всех подвидов одной и той же болезни. Когда я только попал в эту группу, мы как раз начали заниматься созданием такого робота. В результате нам это удалось, и он в неплохом темпе набирает сейчас обороты.

Слушать лекции Ричарда Фейнмана — удовольствие отдельного порядка.

При написании «таблеток» экспертам в ЛК приходится обрабатывать и просматривать огромное количество разных файлов. Какие-то из них чистые (не заразные), другие — вредоносные. Таким образом, помимо создания таблетки, надо еще эффективно и быстро обнаружить новую болезнь (желательно перед тем, как она успеет заразить наших пользователей). Сейчас я занимаюсь несколькими проектами: один из них — разработка нового метода, который бы позволил быстро и эффективно обнаруживать зловредные и еще не детектируемые нами файлы, чтобы как можно быстрее создать новую таблетку. Во всех этих задачах я очень активно использую теорию машинного обучения. И не без плодов — ведь она такими задачами и занимается.

У меня отличный научный руководитель — он не дает мне скучать. Постоянно подбрасывает новые задачи, предложения — например, 3 месяца назад я устроился на кафедру алгоритмов и технологий программирования факультета инноваций и высоких технологий Московского физико-технического института ассистентом. Я там веду и одновременно разрабатываю семинары по курсу машинного обучения. Параллельно я вынашиваю идею подготовить свой спецкурс на родном ВМиК МГУ и дописываю с товарищем препринт (это такая маленькая книжечка, выходящая маленьким тиражом в институте, в которой собраны последние результаты более или менее законченного исследования).

Так сложилось, что мы с родителями жили в Японии 6 лет. Там они работали в институте. Условия были просто чудесными, мы очень полюбили тамошний образ жизни. Я ходил там в садик, потом в школу. Но когда мне исполнилось 10, родители приняли решение вернуться. Они хотели, чтобы я получил образование в России.

Опыт жизни за границей и решение моих родителей вернуться сильно повлияло на мое видение этого вопроса. Объективно я вижу много преимуществ в занятии наукой за границей — например, в Штатах. Там отличные условия для исследований, очень сильные научные группы. Там фактически бурлит область, которой я занимаюсь. Да и платят за границей, конечно, не так, как тут.

Но пока что я не вижу для себя непреодолимых преград для продолжения занятий наукой у нас в России. Здесь у меня есть очень хорошие и сильные учителя, к которым я всегда могу обратиться за знаниями. Есть доступ ко всем статьям, я могу ездить на конференции, читать книги, разбираться со всем самостоятельно. Да и с деньгами пока что проблем нет — вместе со всех моих деятельностей набегает нормально (правда, чувствую, они возникнут, как только появится семья). А ехать на Запад (или еще куда-то) без строгой мотивации не вижу абсолютно никакого смысла.

Единственное, над чем думаю последнее время — съездить на непродолжительную стажировку в институт к какому-то из известных специалистов нашей области, понабраться опыта и непосредственно «повариться» в тамошнем котле. Я искренне верю в силу отечественной науки. Рассмотрим хотя бы мою область. Всемирно признанная классическая серия работ, положившая начало теории вычислительного обучения (чрезвычайно развитой и популярной сейчас во всем мире), была написана в конце шестидесятых здесь нашими соотечественниками — Вапником и Червоненкисом.

У нас в стране есть чрезвычайно сильные научные школы, основанные классиками мирового уровня. Это очень важно — кто и как воспитывает молодое поколение. Я очень благодарен своим родителям, а также МГУ и научному руководителю за то, что мне достаточно рано привили культуру мышления. Именно благодаря им я чувствую внутри себя острую потребность новых знаний и саморазвития, которая буквально движет мной последние годы во всех начинаниях. Хочется не подвести всех, кто был до нас, и тех, кто будет после, и совместными усилиями не дать исчезнуть или ослабнуть богатым научным традициям нашей страны.

В русской науке есть, конечно, ряд проблем. Например — финансирование. Хотя в моей области в меньшей степени нужны лаборатории, реактивы разные, приборы, агрегаты или установки, чем, например, в химии или физике. Мне достаточно иметь компьютер, ручку и тетрадку. Но есть исследования и в моей области, которые в России провести сложно. Например — приложения в медицине или нейробиологии. Там нужны ЭКГ и прочие дорогие и большие агрегаты. Моя область крайне популярна сейчас на Западе. У нас она почему-то в меньшей степени развивается — а там находятся главные очаги, исследовательские центры, конференции и журналы. Все стараются пробиться туда, публиковаться и выступать там. Но и у нас постепенно все разгоняется: например, набирают обороты наши конференции — международная «Интеллектуализация обработки информации» и всероссийская «Математические методы распознавания образов». Кстати, последние 2 года я корректировал сборники обеих конференций.

Приложения для машинного обучения в медицине и нейробиологии связаны с интерфейсами, которые считывают различные измерения головного мозга и позволяют пользователю управлять виртуальными объектами и даже физической электроникой посредством лишь мыслей (и небольшой концентрации).

Я всеми силами стремлюсь достичь состояния, когда я сам честно смогу назвать себя ученым. Для этого, по-моему, недостаточно полистывать время от времени статьи, читать книжки и размышлять над задачами. Это определенный образ жизни — достаточно сложный, активный и занятой. Нужно вести исследования, получать результаты и публиковать их. Нужно обязательно читать в университете (или институте) свой курс — я считаю, это очень важный опыт и, может быть, даже долг ученого — передавать свои знания новым поколениям. Для меня еще важно пытаться популяризировать науку, показывать ее пользу, давать людям понять, зачем все это вообще нужно. Уметь объяснить, чем же ты там занимаешься в институте, неподготовленному слушателю — это тоже очень важный навык. Когда я рассказываю своей девушке, зачем и как компьютер нужно учить думать, вскрывается куча вопросов, над которыми я раньше не задумывался или которые я не до конца понимал.

Магазин Shakespeare and Co, который существует с 1951 года, специализируется на англоязычной литературе и устраивает книжный фестиваль раз в 2 года. Молодым писателям разрешают работать и, если нужно, даже жить. Именно для этого на последнем этаже стоят 13 кроватей. Еще 9 магазинов, в которые должен зайти каждый, кто умеет читать, — в [специальном обзоре T&P](http://theoryandpractice.ru/posts/2142-10-knizhnykh-magazinov-v-kotorye-dolzhen-zayti-kazhdyy-kto-umeet-chitat).

Кроме науки и работы я стараюсь посвящать достаточно времени чему-то из области искусства и творчества. Я очень люблю музыку: ездил осенью на большой фестиваль электронной музыки в Польшу. Страшно понравилось — следующим летом обязательно поеду в Барселону — там один из самых крупных фестивалей современной электронной музыки проходит. Пытаюсь сам сочинять, записывать.

Я очень полюбил читать. Почему-то раньше без особого удовольствия проглатывал книги, а сейчас читаю много и разной литературы. Очень воодушевляют книги больших ученых или книги о них. Люблю читать мысли людей, которые открыли что-то большое и новое. Особенно люблю все связанное с физиком Ричардом Фейнманом. Есть такая отличная книга — «Вы, конечно, шутите, мистер Фейнман». Потрясающий был человек и ученый. Играл на бразильских барабанах, получил Нобелевскую премию по физике, много путешествовал, откалывал отличные шуточки. Почитайте книгу — будете громко смеяться. Еще у него есть отличный курс лекций по теоретической физике для «чайников» (написанного Фейнманом по мотивам его настоящего большого полноценного курса).

Сейчас я читаю Марселя Пруста «В поисках утраченного времени». Параллельно читаю «Одинокий странник» Керуака на английском — купил в отличном книжном магазине Shakespeare&Co в Париже. Будете неподалеку — обязательно зайдите!