Американские ученые, разработавшие технологию синтезирования человеческих голосов, сейчас работают над созданием защиты этой технологии от использования в преступных целях.
Как сообщает New Scientists, программа Natural Voices, разработанная в лаборатории компании AT&T, может разговаривать любым голосом, опираясь на его предварительную запись. Программа копирует интонации и характерные особенности произношения, свойственные образцу.
Создание каждого нового синтезированного голоса занимает от 10 до 40 часов. Сначала человека, голос которого хотят перевести в компьютерный вид, записывают в специальной студии. Затем голос переводится в цифровой вид и анализируется. Результаты поступают на вход программы синтеза.
Пока в искуственном голосе, воспроизведенном компьютером, еще присутствуют некоторые следы, по которым его можно отличить от натурального голоса. Однако создатели технологии надеются, что уже через несколько лет смогут точно воссоздавать любой голос по записи.
Программа предназначается для работы в центрах обработки телефонных звонков, в составе программного обеспечения, переводящего текст в речь, а также в автоматических голосовых лентах новостей. Можно придумать и другие варианты использования данной технологии: например, создание разговаривающих виртуальных копий таких известных людей, как Владимир Ильич Ленин.
Хотя сейчас технология пока далека от совершенства, разработчики уже беспокоятся о том, что она может быть использована и в преступных целях. Довольно часто в детективах обыгрывается, например, идея телефонного звонка, которым жертву вызывают на место преступления или устраняют главного свидетеля. Обычно в таких случаях дело поручается людям, которые имитируют голоса, либо преступник сам старается изменить голос с помощью носового платка. С возникновением технологии синтезирования голоса у детективщиков и преступников появятся новые возможности, а у полиции лишняя головная боль.
Напомним также, что известный хакер Кевин Митник получал доступ к компьютерным системам различных фирм, просто звоня в приемную фирмы под видом одного из сотрудников и спрашивая пароли. Очевидно, что система подделки голоса в этом случае очень кстати: можно будет спросить пароль голосом президента компании. Не говоря уже о широких возможностях, которые открываются для изготовителей аудиокомпромата.
Поэтому в настоящее время в AT&T уже разрабатывают средства защиты новой технологии. В частности, предполагается создание систем распознавания искусственных голосов на основе специально встроенных в них "водяных знаков" в виде определенных сигналов, которые не слышны человеческим ухом, но могут быть отслежены специальными детекторами. С их помощью можно будет определить, настоящий ли человек говорит с вами по телефону, или это синтезированный голос.