Высшая школа экономики при участии Яндекса открыла факультет компьютерных наук, в котором будут давать базовые знания для будущих специалистов по работе с Big Data, от разработчиков компьютерного зрения до аналитиков рекомендательных систем. О том, кто справится с задачей отфильтровать огромные массивы данных и можно ли этому научить, T&P рассказал декан нового факультета и руководитель академических программ Яндекса Иван Аржанцев.

— Почему возникла потребность в новом факультете?

— Инициатива шла от Яндекса, Высшая школа экономики ее поддержала. Яндекс уже больше семи лет развивает академические программы для студентов. За это время в компании накопился большой опыт работы с вузами — магистратуры и программы Яндекса есть в МФТИ, СПбГУ, МГУ и других вузах. Магистратура Яндекса была и в Вышке. Кроме этого, в 2007 году была открыта Школа анализа данных Яндекса (ШАД). В ШАД Яндекс привлек авторитетных преподавателей и представителей науки, создав собственную программу двухлетней подготовки очень востребованных разработчиков технологий анализа данных, машинного обучения, информационного поиска, компьютерного зрения — всего, что связано с Big Data. И даже с учетом всего этого разнообразия выпускники по-прежнему нарасхват. Мы узнали про проект «больших факультетов» и договорились, что можем вместе готовить студентов уже с первого курса. Так в Вышке появился новый факультет.

— Интерес компании в том, чтобы подготовить себе кадры?

— Интересы Яндекса уже давно не ограничиваются тем, чтобы найти себе сотрудников. За последние 7 лет Яндекс подготовил больше трех тысяч специалистов, при этом в самой компании осталась работать треть, остальные ушли в другие компании или науку. Задача Яндекса — создать среду для развития компьютерных наук в России. Если мы будем заниматься исключительно подготовкой сотрудников «для себя», а не созданием информационной среды с ее проектами, конференциями, научными школами, совсем скоро окажемся в ситуации, что развивать технологии некому. Если не будет набрана критическая масса специально подготовленных людей, мы не сможем развить тот потенциал, который сейчас есть у отрасли.

— Какие будут образовательные программы на новом факультете?

— Бакалаврских программ две: первая — по программной инженерии, вторая — по прикладной математике и информатике. В магистратуре три направления — системная и программная инженерия, анализ и принятие решений, науки о данных. Что касается межфакультетского взаимодействия, мы надеемся, что предложенный нами цикл курсов смогут выбирать студенты других факультетов. Сейчас мы разрабатываем цикл по анализу данных, открытый для других факультетов, например, для экономистов или социологов. И уже с этого года мы планируем выступать в научно-популярном лектории ВШЭ, где будем рассказывать о прикладной математике и современных информационных технологиях.

— Вы с мехмата МГУ, человек из классической, старой университетской системы, а сейчас создаете факультет, где существует прямая связь между университетом и бизнесом. Как вам кажется, насколько это важный ход для развития образования?

— Пожалуй, я не совсем «человек из старой университетской системы». Последние два года, параллельно с научной и преподавательской работой в МГУ, я занимаюсь академическими программами в Яндексе. Но вообще вы коснулись больной темы. У меня самого внутри постоянный диалог между фундаментальным представлением о науке и чем-то более прикладным. Наша задача сейчас — найти баланс. Можно сделать прекрасный фундаментальный факультет, который будет заниматься глубокими, но отвлеченными от жизни задачами, и это одна крайность. Другая крайность — сделать практические курсы, где будут учить «нажимать кнопки». Нужно искать компромисс между глубоким и содержательным и практичным и востребованным, и мы сейчас его ищем.

Мы смотрим на ведущие российские и зарубежные вузы, в числе которых Стэнфорд, MIT. Пытаемся понять, в чем разница между отечественной и западной традицией. У нас, действительно, больше аудиторной нагрузки, больше обязательных курсов. При этом в Вышке есть система факультативов и индивидуальных траекторий, студент может выбирать, что ему интересно. У нас не будет конкуренции между образованием, наукой и бизнесом, потому что мы будем готовить людей и для бизнеса, и для науки.

— Как вам кажется, все образование должно смотреть в сторону бизнеса?

— Теоретическая и фундаментальная наука обязательно останется. Ей способен заниматься на высоком уровне очень небольшой процент людей, и у них должна остаться эта возможность. Нужна ли чистая математика? Обязательно. Другой разговор, в каком масштабе она нужна. Трудно сказать, что в будущем выстрелит. Если вы возьмете теорию чисел, абстрактнейшую область математики, то в 30-е годы ХХ века были получены результаты о точках на эллиптических кривых, и эти результаты приводились в пример в качестве глубоких и содержательных, но бесполезных знаний. А в начале XXI века именно они нашли применение в криптографии и теории кодирования. Так что трудно сказать, что из абстрактной науки найдет применение, поэтому развивать нужно все.

© Олег Бородин

© Олег Бородин

— Но сейчас в России перекос в сторону фундаментальной науки.

— Да, но опять же нельзя однозначно сказать, хорошо это или плохо. С одной стороны, наши ребята легче меняют специализацию, у них шире кругозор, область интересов. Когда они уезжают учиться или работать на запад, их ценят именно за это и они очень востребованы. С другой стороны, в начале работы им тяжелее. Приходится переучиваться, приобретать навыки, нужные для решения конкретных задач. Задача нового факультета — совместить прикладное и фундаментальное направления.

— В ближайшем будущем каждый, кто хочет развиваться и быть в авангарде, должен разбираться в компьютерных науках?

— Если ставить границы жестко, то нет. Не все должны быть врачами и не все должны быть компьютерными специалистами, но базовые знания точно будут полезны всем. На нас всех сейчас валится огромное количество информации. Эту информацию нужно отфильтровывать, структурировать, вычленять то, что нужно именно вам — вот здесь и пригождается методология анализа данных.

— В каких областях, например?

— Да везде, честно говоря. Происходит информатизация промышленности, государственного управления и многих научных областей. Информация накапливается, данных становится все больше и больше, и с определенного момента старые алгоритмы больше не работают для огромных массивов данных, а значит, нужны новые, и, повторюсь, в самых разных областях. Вычислительные ресурсы и технологии обработки данных Яндекса уже используются для экспериментов для анализа распада мезонов в ЦЕРНе. Технологии поиска по картинкам, из области компьютерного зрения, можно использовать в медицине для диагностики заболеваний: машина может проанализировать гораздо большее число признаков, чем человек. Технологии анализа данных одни и те же, вопрос — куда мы захотим их приложить.

— А как в общих чертах работает такой анализ?

— Давайте продолжим на примере из медицины. Представьте себе, что вы опытный врач. Ваш пациент говорит, что заболел, и вы смотрите на совокупность симптомов — на важные признаки. Глядя на них, вы можете сказать, что это — ангина, грипп или симуляция. А если вы начнете учить молодого врача, то можно предложить ему наблюдать за вашими действиями и слушать ваши комментарии. Через некоторое время молодой врач набирается опыта и готов диагностировать заболевания самостоятельно. Это и есть аналог машинного обучения. Только для компьютера вы заменяете реального пациента набором признаков, на которые нужно смотреть: температура — важно, состояние слизистой носа — важно, цвет волос — не важно. После этого формируете обучающую выборку — по данным из практики указываете, что такие-то наборы признаков соответствуют такому-то заболеванию. Проанализировав ее, алгоритм при новом вводе набора признаков сам определит, какому заболеванию этот набор отвечает.

— За какими IT-профессиями будущее?

— Вот, например, разработчик компьютерного зрения. Такой профессии лет десять назад еще не было. Сейчас эта вакансия открыта на сайте Яндекса. Так что сегодняшний школьник уже может сказать: «А я хочу быть разработчиком компьютерного зрения». Какие разработчики будут востребованы через пять лет, спрогнозировать нереально, все настолько быстро меняется, что только успевай поворачивать голову. Но одно можно сказать точно — базовые знания для них даст наш факультет.

Если же говорить про направления, одно из таких — рекомендательные системы. Например, вы ищете, что посмотреть, а умная система вам советует. Плохая система рекомендаций действует «в лоб»: вы ищете боевик, и она вам подсказывает боевики с похожими названиями. Более умная система адаптируется под ваши особенности, понимает, кто вы как пользователь, анализирует, какие запросы вы делали раньше, и старается адекватно подобрать то, что соответствует вашим сегодняшним интересам.

Специалисты для решения подобных задач так востребованы, что их постоянно не хватает. Чем больше хороших мест — факультетов, школ, лабораторий, где их будут готовить, тем лучше. Переизбытка не будет, ведь такие специалисты нужны в разных отраслях.