Американские специалисты по компьютерным наукам создали вредоносный алгоритм, который умеет искажать речь человека в процессе ее преобразования в текст.
Как сообщает «Хайтек», за счет скрытых шумов устройство слышит скрытые слова и преобразует их в голосовые команды со скоростью 50 знаков в секунду.
Новый алгоритм исследователи протестировали на примере системы преобразования речи в текст DeepSpeech от Mozilla, которая доступна на GitHub. Они зашифровали в аудиосигнале скрытое послание, и именно его распознала система. Специалисты заставили программу преобразовывать в желаемый текст даже музыку, которую DeepSpeech изначально не должна была воспринимать как речь. Добиться искажения удалось в 100% случаев.
Ранее те же исследователи нашли другой способ взлома голосовых помощников. Они придумали скрытые голосовые команды — шумы, которые виртуальные помощники принимали за текст. Однако такой системой вряд ли стали бы пользоваться злоумышленники — шумы были слишком заметными и звучали устрашающе. В отличие от скрытых голосовых команд новая технология позволяет искажать речь незаметно.
- В своей работе я хотел сделать потенциальную атаку более скрытой. С помощью новой методики я могу, например, взять видеоролик, добавить к нему немного вредоносных шумов, заново загрузить его — и система распознавания речи расшифрует его совсем иначе. При этом услышать искажения будет невозможно, — сообщил один из экспертов Николас Карлини.
Таким образом, ничто не помешает злоумышленникам зашифровать команду в рекламном ролике на телевидении или в популярной песне на радио, считает автор исследования. Технология в теории может позволить преступникам контролировать виртуальные помощники, такие как Alexa или Siri.