В США разработали алгоритм обмана систем распознавания речи

В США разработали алгоритм обмана систем распознавания речи

Американские специалисты по компьютерным наукам создали вредоносный алгоритм, который умеет искажать речь человека в процессе ее преобразования в текст.

Как сообщает «Хайтек», за счет скрытых шумов устройство слышит скрытые слова и преобразует их в голосовые команды со скоростью 50 знаков в секунду.

Новый алгоритм исследователи протестировали на примере системы преобразования речи в текст DeepSpeech от Mozilla, которая доступна на GitHub. Они зашифровали в аудиосигнале скрытое послание, и именно его распознала система. Специалисты заставили программу преобразовывать в желаемый текст даже музыку, которую DeepSpeech изначально не должна была воспринимать как речь. Добиться искажения удалось в 100% случаев.

Ранее те же исследователи нашли другой способ взлома голосовых помощников. Они придумали скрытые голосовые команды — шумы, которые виртуальные помощники принимали за текст. Однако такой системой вряд ли стали бы пользоваться злоумышленники — шумы были слишком заметными и звучали устрашающе. В отличие от скрытых голосовых команд новая технология позволяет искажать речь незаметно.

- В своей работе я хотел сделать потенциальную атаку более скрытой. С помощью новой методики я могу, например, взять видеоролик, добавить к нему немного вредоносных шумов, заново загрузить его — и система распознавания речи расшифрует его совсем иначе. При этом услышать искажения будет невозможно, — сообщил один из экспертов Николас Карлини.

Таким образом, ничто не помешает злоумышленникам зашифровать команду в рекламном ролике на телевидении или в популярной песне на радио, считает автор исследования. Технология в теории может позволить преступникам контролировать виртуальные помощники, такие как Alexa или Siri.