Конкурс для студентов технического профиля

Минимальные требования:

1) Поисковый робот, индексирующий страницы на домене университета, заданные пользователем, и распознающий биографии.

2) Алгоритм выделяет информацию и структурирует в базу данных по следующим типам данных: 1) Фамилия Имя, 2) Должность, 3) Название университета, 4) Биография, 5) Ссылка на резюме/cv если есть, 6) ссылка на профиль в интернете, 7) рабочий телефон, 8) электронный адрес.

Дополнительные требования:

1) Выделить из биографий должности и названия университетов и компаний в которых ранее работал или учился преподаватель и сформировать реляционную базу данных.

2) Сделать кластеризацию по темам/предметам, которыми занимаются преподаватели и сформировать реляционную базу данных. Алгоритм может быть реализован на любом из следующих языков программирования: java, C++, Python, Ruby, JavaScript (node.js). Целевая операционная система: GNU/Linux.

В работе можно использовать любые готовые библиотеки при условии, что они распространяются по лицензии GPL, MIT или аналогичной с доступным исходным кодом. Алгоритм должен быть реализован в виде сервиса, взаимодействие с которым осуществляется по протоколу http. Формат передачи данных: json.

Формат работ: pdf с описанием поискового робота и ссылкой на сервис.

Главный приз — работа в международном стартапе по бизнес-образованию Coursalytics.

Конкурс проводится в рамках проекта «Востребованное образование». При реализации проекта используются средства государственной поддержки, выделенные в качестве гранта в соответствии с распоряжением Президента Российской Федерации №79-рп от 01.04.2015 и на основании конкурса, проведенного Общероссийской общественной организацией «Российский Союз Молодежи».

Подробная информация и подача работ по ссылке.

Смотрите также