Книжные издательства всегда умели удивлять обложками: поразительно, как возможно изобрести 200 разных способов проиллюстрировать «Лолиту» Набокова, чтобы замаскировать скандальный роман, или сколько можно найти однотипных пейзажей для книг о путешествиях. Исследователи из японского Университета Кюсю задались вопросом: возможно ли угадать содержание книги по обложке и может ли искусственный интеллект стать экспертом в этом вопросе? «Теории и практики» приводят краткое содержание эксперимента и его результаты.

Вопрос был сформулирован так: сможет ли сверхточная нейронная сеть (то есть искусственная нейронная сеть, нацеленная на распознавание изображений и сконструированная из четырех слоев по 512 нейронов каждый) правильно определить жанр книги, проанализировав ее обложку? Брайан Кендзи Ивана и Сеичи Ушида скачали 137 788 уникальных обложек книг 20 жанров с сайта Amazon.com. Они обучали нейронную сеть распознавать жанр книги по ключевым символам на обложке, используя 80% из всех обложек. Еще 10% обложек они использовали, чтобы закрепить результаты обучения. И оставшиеся 10% — чтобы провести тест.

Визуализация выходных данных эксперимента. Для ...

Визуализация выходных данных эксперимента. Для большей наглядности точки отображаются линейно в двумерном подпространстве с использованием метода главных компонент. Стрелки — оси каждой книжной категории. Цвет стрелки выбран случайным образом. Примеры изображений книжных обложек в каждой категории представлены в увеличенном виде.

Ученые пришли к выводу, «что эксперимент был точным до 21,9% для книг из первой группы данных; 32,1% — для книг из второй группы данных, и 40,2% — для книг из третьей группы данных». Этот показатель точности значительно выше простой случайности. Система, конечно же, не была идеальной. Из-за трудностей, связанных с распознаванием образов и неоднозначностью книжных обложек, возникли некоторые проблемы в категоризации. Особенно трудно искусственному интеллекту было разбираться с биографиями и мемуарами, медицинскими и научными книгами, а в категоризации детских книг возникли проблемы с выделением комиксов из общей массы детской литературы. Зато лучше всего удалось справиться с книгами категорий «Компьютеры и технологии» и «Путешествия», так как у их обложек более высокая степень корреляции с содержанием. Ученые надеются, что их нейронная сеть сможет со временем самостоятельно проектировать книжные обложки без участия человека.