Исследователи Эрез Айден и Жан-Батист Мишель для своей книги «Не нанесено на график: Big Data как оптика человечества» разработали совместно с Google приложение для изучения употребления слов за всю историю книгопечатания.

Бесконечные цифровые коды, которые пользователь интернета ежедневно оставляет за собой, могут достигать невообразимых масштабов. Исследователи Эрез Айден и Жан-Баптист Мишель, представители дисциплины, которую обычно называют digital humanities, нашли способ, как «приручить» эти цифры.

Исследователи потратили семь лет на изучение содержания 30 миллионов книг, оцифрованных Google, для чего они предварительно разработали программу Google’s Ngram, которая позволяет изучать употребимость тех или иных терминов. В результате последующего анализа они сделали выводы об изменения культурных ценностей относительно экономики, политики, науки и искусства.

Книга «Не нанесено на график» в первую очередь важна новой методологией, позволяющей по-новому взглянуть на человеческую интеллектуальную историю. Как замечает автор блога Brain Pickings, вместо гипотезы, которая, как правило, предшествует научному исследованию, такая методология предлагает то, что «научный эстеблишмент так поспешно отбрасывает как „исследование, основанное на любопытстве“ — экспериментальное, свободное от гипотез исследование процессов, отношений и феноменов».

Сами авторы описывают возможности, которые Big Data предлагает для науки следующим образом: «Как оптические линзы, которые позволяют надежно изменять и управлять светом, цифровые медиа делают возможным уверенно изменять и управлять информацией. При достаточном объеме цифровых записей и достаточной мощи компьютера, мы можем занять новую точку зрения, с которой можно наблюдать за человеческой культурой, она может внести неоценимый вклад в то, как мы понимаем мир и свое место в нем».