Японские инженеры разработали новый метод незаметного управления голосовыми помощниками в умных колонках с помощью ультразвука. Они предлагают испускать ультразвуковые колебания с такими параметрами, что по мере распространения в воздухе они меняются и вблизи колонки превращаются в слышимые, но заметные лишь для людей, расположенных вплотную к устройству. Статья о разработке опубликована в IEEE Transactions on Emerging Topics in Computing.

Современные голосовые помощники связаны с аккаунтом пользователя и имеют доступ к личным данным, а также возможность управлять другими устройствами. Все это делает их удобными инструментами в повседневной жизни, но вместе с этим повышает их ценность в глазах злоумышленников, поэтому исследователи в области информационной безопасности в последние годы стали активно разрабатывают методы взлома голосовых помощников, чтобы создать защиту от таких вмешательств. При этом в основном они исследуют не стандартные методы взлома программного обеспечения, а нетривиальные способы, основанные на особенностях распространения звука.

Например, некоторые исследователи предлагали использоватьультразвуковые команды, которые превращаются в слышимые с микрофоне, зашифровывать в уже слышимых аудиозаписях незаметные команды или формировать команды с помощью лазерного луча, направленного на микрофон. Из этих трех подходов лишь первый обеспечивает незаметную человеку атаку, но он чувствителен к расстоянию до колонки, а также уровню окружающего шума.

Исследователи под руководством Тацуи Мори (Tatsuya Mori) из Университета Васэда тоже использовали в качестве основы ультразвук, но применили его иным способом, благодаря чему он не так зависит от расстояния и особенностей микрофонов умной колонки. Для этого инженеры использовали массив из узконаправленных параметрических ультразвуковых динамиков.


Схема самопроизвольной демодуляции звука в воздухе

Ryo Iijima et al. / IEEE Transactions on Emerging Topics in Computing, 2019


С помощью амплитудной модуляции исходная звуковая команда кодируется в ультразвуковые колебания на несущей частоте и боковых полосах частот. По мере распространения волн от динамиков к цели (колонке) звук самопроизвольно демодулируется из-за того, что волны распространяются в нелинейной среде (воздухе), из-за чего образуются слышимые человеку, но направленные колебания. При этом из-за распространения в воздухе волны постепенно затухают. В результате вдоль прямой от динамиков в сторону колонки образуется область, в которой присутствует слышимый для человека и колонки звук, а параметрами этого звука и области можно управлять. Помимо схемы с одним динамиком исследователи также научились создавать подобным образом звук на пересечении направленного излучения двух массивов динамиков.


Две схемы создания неслышимых команд

Ryo Iijima et al. / IEEE Transactions on Emerging Topics in Computing, 2019


Эксперименты с умными колонками Google Home и Amazon Echo показали, что метод позволяет активировать колонки в помещении на расстоянии почти 20 метров, а также передавать успешно распознаваемые ими команды на расстоянии до 12 метров. При этом в случае с перекрестной схемой создания звука наблюдатели практически не могли заметить команды, а при использовании одного массива голосовые команды все же были различимы в части случаев.


Прототип системы

Ryo Iijima et al. / IEEE Transactions on Emerging Topics in Computing, 2019


В начале года датские инженеры создали насадку для умных колонок, сохраняющую их функции, но защищающую приватность пользователей. Большую часть времени она испускает прямо в микрофон колонки белый шум и тем самым не дает ей слышать звуки в помещении, но, когда пользователь говорит активационную фразу, она активирует колонку и выключает шум, давая голосовому помощнику работать в обычном режиме.

Григорий Копиев

Источник: https://nplus1.ru/news/2019/12/17/audio-hotspot

Вернуться к списку