Искусственный интеллект обычно не ассоциируется с гуманитарным образованием. Однако в РГГУ на отделении интеллектуальных систем в гуманитарной сфере не просто работают над проблемами искусственного интеллекта — там его создают. Александра Сербина поговорила для T&P с руководителем отделения Виктором Финном о том, как заниматься интеллектуальными роботами и бороться с раком в стенах гуманитарного университета.

Виктор Финн

руководитель отделения интеллектуальных систем в гуманитарной сфере РГГУ, доктор технических наук, профессор.

— Считается, что гуманитарии не занимаются проблемами искусственного интеллекта. Ваше отделение полностью меняет эту картину. Над какими проблемами вы работаете?

— Главный продукт искусственного интеллекта — это интеллектуальные системы, которые представляют собой компьютерную систему, имитирующую и усиливающую познавательную деятельность человека. Это достаточно общие слова, но эта компьютерная система имеет следующую архитектуру. Во-первых, это базы фактов и знаний, что составляет информационную среду. Во-вторых, решатели задач, то есть мозг системы. Наконец, комфортный для пользователя интерфейс.

Однако система с такой архитектурой только тогда является интеллектуальной, когда она способна имитировать и усиливать некий джентельменский набор познавательных способностей человека. Интеллектуальная система должна уметь распознать в данных существенные характеристики, то есть должен быть элемент приближения к интуиции человека. В ней также должна присутствовать способность воспроизведения рассуждений, которые не сводятся только к дедукции о выведении истины, а предполагают возможность выдвигать гипотезы, совершать умозаключения и прочее. Таким образом, рассуждение — это синтез некоторых познавательных процедур, с помощью которых из фактов и знаний можно извлечь некие новые знания. Наконец, интеллектуальная система должна обладать способностью реализовывать в интерактивном или автоматическом режиме способность порождать последовательность: цель — план — действие.

Для современных интеллектуальных систем цель сформулирована в виде некого задания, а вот дальше возможно осуществлять некий план или его корректировать и, соответственно, реализовывать эту цепочку: цель — план — действие. К тому же интеллектуальная система должна обладать рефлексией, то есть оценивать результаты своей деятельности как некие качественные характеристики иногда и количественные.

Далее должны следовать функции аргументации и способности использовать память. Интеллектуальная система должна уметь отвечать на вопрос «почему?». Способность к обучению и использованию памяти (аналог человеческой памяти). Есть еще такая тонкая способность — уточнять идеи до хорошо определимых понятий, то есть она должна иметь свойство продуктивного мышления. Понятно, что в автоматическом режиме вы этого не сделаете, но в интерактивном режиме, по мере обработки данных, преобразуете в некие точные конструкции. Наконец, еще одна тонкая способность — это способность менять свои знания по мере поступления новых сведений из окружающей среды. Это способность к адаптации знаний. Наконец последняя из способностей, которая интеллектуальная система должна реализовать, это умение интегрировать полученные знания и превращать их в некоторую общую теорию.

— Получается, что вы создаете и анализируете механическую модель гуманитарного назначения?

— Интеллектуальные способности не могут быть реализованы в автоматическом режиме, только интерактивном. Интеллектуальная система есть партнерская человеко-машинная система. Тем самым разговоры о том, что компьютеры нас когда-то победят и возникнут роботы, которые станут неуправляемыми, — это удел фантастов. На самом деле будущее компьютерной науки на практике заключается в реализации разных компьютерных систем, вступающих во взаимодействие с человеком и усиливающих его познавательную деятельность. Они призваны помогать решать такие задачи, которые человек в реальном времени решить не может.

«Разговоры о том, что компьютеры нас когда-то победят и возникнут роботы, которые станут неуправляемыми, — это удел фантастов»

То, что я перечислил, является общей проблематикой искусственного интеллекта, а наша задача состоит в том, чтобы методы искусственного интеллекта и интеллектуальных систем реализовать в сфере гуманитарных наук. Или лучше определить их шире — в науках о человеке и обществе, что позволяет включить в данный перечень, например, медицину. Основные наши достижения как раз относятся к применению интеллектуальных систем в фармакологии, медицине и социологии, а также в технической диагностике.

— Каких результатов удалось добиться в ваших исследованиях?

— Мы создаем интеллектуальные системы в науках о жизни и социальном поведении. Создают это некоторые преподаватели отделения, а также сотрудники базовой кафедры Всероссийского института научной и технической информатики (ВИНИТИ РАН), где данное научное направление начинало развиваться. Мы объединили с ними усилия. В РГГУ на нашем отделении имеется Учебно-научный центр интеллектуальной робототехники и Учебно-научный центр проблем и методов интеллектуального анализа данных, где происходит как раз реализация этих проблем. Кроме того, на кафедре математики и логики интеллектуальных систем создается целая серия онтологий — они создаются под руководством профессора Евгения Беньяминова.

Наши системы реализуют, так называемый, ДСМ-метод автоматического порождения гипотез. ДСМ потому, что назван по имени Джона Стюарт Милля, который придумал теорию индуктивных рассуждений. Он был одним из пионеров этого направления, а до него был Фрэнсис Бэкон и Уильям Гершель. Созданные нами системы, которых довольно много, например, предсказывали биологическую активность химических соединений, то есть определяли их продуктивные и антипродуктивные функции.

Была защищена кандидатская диссертация с использованием наших интеллектуальных систем. Она была посвящена диагностике красной волчанки — это очень опасное нефрологическое заболевание. Была создана система, которая занималась автоматической диагностикой этой болезни. Технология была апробирована в диссертации очень известного исследователя Елены Захаровой, которая в настоящий момент заведует отделением нефрологии Городской клинической больницы им. Боткина. Наша система отлично работала, но в двух случаях из четырех возможных ответов (фактическая истина, фактическая ложь, фактическое противоречие и неопределенность) система выбрала ответ «фактическое противоречие». Этот ответ предполагает, что система не может выбрать между «да» и «нет». Оказалось, что консилиум профессоров затруднялся с постановкой диагноза как раз в этих двух случаях. Понятно, что система интеллектуальная, если она затрудняется там, где затрудняются специалисты высокого класса.

Дальше началось наше сотрудничество с Российским онкологическим научным центром. У нас имеется три авторских свидетельства по онкологии, что на самом деле не тривиально. Первая система прогнозировала продолжительность жизни больных, страдающих от меланомы (после курса лечения). Меланома, как правило, быстротекущее заболевание, излечимое только на первых стадиях. Было предположение, что некий белок S100 играет роль маркера, то есть он ответственный за течение болезни и продолжительность жизни после лечения. Эта гипотеза подтвердилась: мы обнаружили, что при некотором процентном содержании данного белка после лечения больной живет пять лет и дольше, а при другом процентном содержании — меньше пяти лет, а иногда даже меньше года. Следовательно, если поступает новый больной, используя нашу систему, можно определить, попадает ли он в группу риска. Эта система имеет большое гуманитарное значение.

Еще с одной лабораторией данного центра была разработана система, которая предсказывает, будут ли осложнения после операции в брюшной полости при онкологических заболеваниях. Третье авторское свидетельство буквально сейчас оформляется и тоже посвящено предсказанию продолжительности жизни после операции рака молочной железы, который является самым распространенным онкологическим заболеванием.

Сейчас мы делаем работу, на мой взгляд, самую продвинутую, вместе с бывшим Институтом гастроэнтерологии департамента здравоохранения Москвы. Там проводилось исследование панкреатита — неприятного заболевания поджелудочной железы. Некоторые больные панкреатитом в какой-то момент получают диабет, а другие — нет. Наша система устанавливает для вновь поступившего больного, будет у него в дальнейшем диабет или нет. При этом была применена новая методика, рассматривались последовательные расширения: сначала было 80 историй болезни, потом 123, потом 150. Нам нужно было понять, сохраниться ли некая закономерность возникновения диабета или его отсутствие при таком расширении. Таким образом, надо было проверить, что добавление новых данных устойчивое и оно не дает никаких отклонений. Используя разные процедуры, мы получили соответствующие результаты: система предсказала все в точности, без единой ошибки, то есть выдержала экзамен.

— А в чем заключается ДСМ-метод?

— Он состоит из некоторых важных компонентов. Во-первых, это точная характеризация условий применимости. Во-вторых, необходима существование в базе фактов причинно-следственных зависимостей. В-третьих, это ДСМ-рассуждения.

Способность к рассуждению у нас реализуется и автоматизируется при помощи соответствующих программ: это индукция, сравнение данных и получение из них гипотез о причинно-следственных отношениях. Мы формализовали методы Милля, впервые в истории, о чем сообщили англичанам, но они как-то не отреагировали на наши достижения. Известно точно, что американцы пытались реализовать миллевские методы, но у них не вышло, а у нас вышло.

Затем, в этих ДСМ-рассуждениях есть аналогия. Если у вас есть гипотеза о причинах позитивных и негативных, с их помощью вы можете предсказать для неизвестного случая, будет ли наличие некоего эффекта или не будет. Это вторая часть ДСМ-рассуждения.

Наконец, в ДСМ-рассуждении есть третья часть — так называемая абдукция, которую придумал великий американский ученый Чарльз Сандерс Пирс. Абдукция — это принятие гипотез на основании объяснения. Если у вас есть некая гипотеза и она некоторым образом объясняет начальные факты, тогда вы эту гипотезу принимаете, потому что она имеет объяснительную силу.

— А для гуманитариев такие интеллектуальные системы подходят?

— Некоторое время назад были проведены раскопки новгородских берестяных грамот знаменитыми академиками Яниным и Зализняком. Если не ошибаюсь, то им удалось собрать более тысячи берестяных грамот. Они опубликовали книгу, где практически все эти грамоты и информация по ним была приведена. Сотрудник ВИНИТИ Светлана Гусакова и на тот момент ее аспирант Алексей Комаров выполнили очень интересную работу, связанную с этим изданием. Их задача заключалась в том, чтобы по грамотам определить их датировку, то есть работа была посвящена атрибуции исторических источников. Наша система определила каждую из 400 берестяных грамот, используя заданные параметры. Было показано, что и в сфере атрибуции исторических источников интеллектуальные системы и наш ДСМ-метод, полученный посредством формализации некоторых идей Джона Стюарта Милля, работает.

Есть еще две области, где мы получили результаты. Для РГГУ очень важная область — социология. Нами создана единственная в России интеллектуальная система анализа социологических данных, больше ничего такого в России нет. В Америке есть соответствующая известная система SPSS, но она имеет некоторые методы искусственного интеллекта — например, метод «деревья решений» и разнообразные статистические методы. Это главный инструмент современных социологов.

Наша система стала плодом работы профессора РГГУ и сотрудника ВИНИТИ Марины Михеенковой. Она защитила докторскую диссертацию в 2012 году на тему развития методов качественного формализованного анализа, а в этом году моя аспирантка Анна Волкова защитила диссертацию относительно этой системы качественного анализа социологических данных. Данная система способна анализировать данные и предсказывать какие-то поведенческие эффекты, есть они или нет, она порождает причинно-следственные зависимости. Сейчас возникла задача исследовать гражданскую активность в малых городах России. Мы планируем, что эта система будет усилена для решения этой исследовательской задачи.

«Нами создана единственная в России интеллектуальная система анализа социологических данных, больше ничего такого в России нет»

— Это была ваша инициатива по изучению данной темы?

— Нет, это было предложено сотрудниками Института социологии РАН и, в частности, одним из авторов нашей предыдущей системы Светланой Климовой. Они уже провели полевое исследование, качественно сделали эвристическое исследование. Данные сейчас находятся в процессе обработки

Еще одно направление, которое у нас есть, — это интеллектуальные роботы. У нас по инициативе ректора РГГУ Ефима Иосифовича Пивовара был создан Учебно-научный центр интеллектуальной робототехники при участии Института прикладной математики имени М.В. Келдыша РАН.

Возглавил этот Учебно-научный центр профессор Владимир Павловский, один из ведущих специалистов в области робототехники. В настоящее время он заканчивает книгу «Введение в робототехнику» с главами, посвященными интеллектуальным роботам. Это устройства, состоящие из трех модулей. Первый модуль — это интеллектуальная система. Второй модуль — это сенсорика, это получение информации из внешнего мира, зрительная, слуховая, даже тактильная. Два этих модуля образуют когнитивную систему. Если к когнитивной системе вы добавляете мехатронику — то есть движение, ориентацию в пространстве и манипуляторы, вы получаете интеллектуального робота.

По мере того как вы будете развивать вашу интеллектуальную систему и сенсорику, вы будете создавать различного класса интеллектуальных роботов. Это могут быть роботы-исследователи, это могут быть common sense-роботы, которые могут как-то помогать в быту, и, наконец, это могут быть, как ни страшно это сказать, боевые роботы.

Вообще робототехника — это почтенная область, достаточно сейчас развитая. Есть беспилотные самолеты-роботы, подводные роботы, автомобили-роботы, которые сами двигаются. Есть медицинские роботы, которые делают операции. Есть бытовые роботы, которые помогают. Но все это роботы, грубо говоря, одной задачи. А интеллектуальный робот — который может решать различные познавательные проблемы, принимать участие в их решении, имея некие универсальные логические средства. У него развитая логика и средства обработки знаний, так что он может решать разные задачи, связанные с познавательной деятельностью.

Конечно, их использование возможно в экстремальных ситуациях и в труднодоступных областях. Например, исследование Марса. Это вполне решаемые в будущем задачи. Или на пожаре, где человек не может действовать. Например, роботы-саперы тоже относятся к этому типу, но они считаются роботами одной задачи.

В нашем Учебно-научном центре имеется французский робот NOА, на котором, в частности, происходит процесс обучения наших студентов, которые пишут для него соответствующие программы. У этого робота хорошая механика, он может разговаривать на нескольких языках, но логики у него практически нет, поэтому наша задача — оснастить его логикой, чтобы он смог выполнять различные задачи.

— Cтуденты сами разрабатывают программы для него?

— Естественно, процесс находится в ведении преподавателей, но при активном участии студентов. Например, одна из наших студенток Елизавета Елагина создала планировщик поведения робота. В скором времени мы будем публиковать ее результаты. Наша выпускница, а теперь и наш преподаватель Татьяна Волкова занимается роботами и руководит студенческими исследованиями.

— Отделение интеллектуальных систем в гуманитарной сфере вышло из Института лингвистики РГГУ. Обучение там считается по праву одним из самых сложных. Какие карьерные перспективы у ваших выпускников?

— У нас есть данные, в 2012 году у нас был юбилей, и мы собрали выпускников и проанкетировали их. Довольно интересная картина. Подавляющее большинство работает в сфере программирования в крупных фирмах программистами, аналитиками, разработчиками или программными менеджерами. Какое-то количество людей с нашим образованием выбрали, конечно, иную стезю: кто-то стал даже киноведом, кто-то занимается издательской деятельностью, у некоторых свой бизнес. Но таких меньшинство. Наши работодатели — это Yandex, ABBYY, Samsung, «Ашманов и партнеры». Моя недавно защитившаяся аспирантка — ведущий программист фирмы Samsung. Это дорогого стоит. Многие пошли в банковскую сферу. Они все хорошо работают, безработных нет потому, что они программисты-аналитики, то есть они могут заниматься не только программной деятельностью, но и создавать свои аналитические модели.

Нашими выпускниками широко пользуется фирма ABBYY, по поводу которой я сделаю злобное высказывание. Наших выпускников они, конечно, трудоустраивают, но с нашим отделением сотрудничать не хотят. Это одна из проблем русского капитализма. Например, в Америке некие фирмы заинтересованы в выпускниках неких кафедр, поэтому они поступают следующим образом: они, во-первых, поддерживают эту кафедру, во-вторых, заключают договора со студентами, поддерживают их и потом трудоустраивают. Вот это реальная поддержка. И они имеют хороших специалистов, так как способствуют повышению качества образования выпускников. У нас все абсолютно не так. И мы не знаем, кто в этом виноват. Но я уверен, что это ошибка и упущение. Можно было бы получить обеим сторонам гораздо больше при организации сотрудничества.