Потерю голоса можно компенсировать благодаря специальному донору. Журнал The Atlantic пишет о том, как звуковое протезирование стремительно набирает популярность и как современные технологии позволяют нам конструировать голос из микроединиц речи точно так же, как мы конструируем текст, используя разные шрифты. T&P перевели из текста самое главное.

Когда Роджер Эберт (известный американский телеведущий и кинокритик — прим. T&P) из-за рака потерял нижнюю челюсть, а вместе с ней и голос, компания, занимающаяся трансформацией текста в речь, создала синтетический голос специально по заказу кинокритика. Его компьютеризованный голос, созданный из записанных в течение его долгой успешной карьеры звуков, звучал более или менее натурально, но все-таки весьма своеобразно.

Эберт смог вернуть то, что он потерял при удалении голосовых связок — собственный голос.

Большинство людей, которые теряют возможность говорить из-за рака горла или живут с болезнью Паркинсона, вынуждены заменять свои собственные голоса на синтетические универсальные голоса, похожие друг на друга (вспомнить хотя бы компьютерный монотонный голос Стивена Хокинга). Конечно, хорошо, что люди, потерявшие голос, все-таки могут быть услышаны, но их речь лишена самого главного — уникальной звуковой идентичности.

Однако сейчас ведутся активные исследования в этой области, направленные на то, чтобы изменить эту ситуацию — создаются алгоритмы для построения естественных уникальных голосов по принципу речевого протезирования.

Работает эта технология следующим образом: добровольцы приходят в специально оборудованную студию и читают несколько тысяч предложений из книг вроде «Белого Клыка» Джека Лондона или «Волшебника страны Оз». Затем команда ученых, если это возможно, знакомится с записями голоса того, для кого создается искусственный голос, и старается учесть особенности его произношения при создании звукового протеза. Ученые разбивают каждую букву голосовых записей на микроединицы речи, а затем, используя специальную программу, смешивают два голосовых образца, создавая новый голос и новый набор слов, в которых нуждается человек, чтобы общаться. Технологии позволяют нам создавать и воспринимать голос точно так же, как мы создаем и воспринимаем компьютерные шрифты.

Несмотря на то, что алгоритмы создаются автоматически, создание полноценного голоса —весьма кропотливая работа. Для того чтобы создать простейший голос, необходимо, чтобы донор прочитал как минимум 800 предложений, а для того, чтобы он звучал максимально естественно, нужно прочитать вслух как минимум 3000 предложений. Несмотря на сложность этой процедуры люди, как оказалось, весьма охотно становятся донорами голосов. Сейчас в банке голосов уже больше 10000 аудиообразцов, и это количество скоро заметно увеличится, так как ведется разработка приложения для iPhone, которое позволит донорам делать голосовые записи в удобное время.

Подробности можно прочесть здесь