Истина Мир Ученые разрабатывают технологию изменения голоса, чтобы пресекать «мошеннические» схемы

Ученые разрабатывают технологию изменения голоса, чтобы пресекать «мошеннические» схемы

by Истина

Boffins devise voice-altering tech to jam 'vishing' schemes

Исследователи из Израиля и Индии разработали защиту от мошеннических автоматических звонков.ASRJam — это система распознавания речи, которая использует алгоритм изменения звука под названием EchoGuard для применения естественных звуковых возмущений к голосу человека, говорящего по телефону. Он способен тонко искажать человеческую речь таким образом, что сбивает с толку большинство систем распознавания речи, но не людей-слушателей.Эта технология необходима, поскольку последние достижения в области машинного обучения, преобразования текста в речь (TTS) и автоматического распознавания речи (ASR) позволили довольно просто автоматически совершать телефонные звонки с целью мошенничества.

Эти «вишинговые» атаки, такие как фишинг по электронной почте, но с использованием голоса вместо текста, приводят к тому, что преступники и мошенники используют TTS для создания реалистично звучащего голоса, который произносит слова, которые, как они надеются, привлекут жертв. Если получатель вызова отвечает, система ASR злоумышленника пытается преобразовать его голосовой ответ в текст, чтобы серверная модель могла расшифровать сказанное, разработать ответ и вести разговор достаточно долго, чтобы получить конфиденциальную информацию или побудить жертву к действию.Согласно отчету CrowdStrike о глобальных угрозах за 2025 год, с первой по вторую половину 2024 года число жертв вишинга увеличилось на 442 процента. В первой половине того же года Федеральная торговая комиссия США заявила, что использование голоса, сгенерированного искусственным интеллектом, для телефонных звонков незаконно.Как Кристал Морин, бывший аналитик разведки ВВС США и стратег по кибербезопасности в компании infosec Sysdig, рассказала The Register в декабре 2024 года, фишинг на основе голоса становится все труднее обнаруживать по мере совершенствования моделей искусственного интеллекта.Фредди Грабовски (Университет Бен-Гуриона в Негеве), Гилад Грессель (Амрита Вишва Видьяпитам) и Исроэль Мирский (Университет Бен-Гуриона в Негеве) предложили защиту от вишинга, описанную в подготовленной к печати статье под названием «ASRJam: Human».- Дружественное подавление речи с помощью искусственного интеллекта для предотвращения автоматических телефонных мошенничеств».

Они утверждают, что компонент ASR в настройках мошенников представляет собой самое слабое звено.»Наше ключевое понимание заключается в том, что, снижая производительность ASR, мы можем разорвать цепочку атак», — объясняют они в своей статье. «С этой целью мы предлагаем систему проактивной защиты, основанную на универсальных враждебных возмущениях, тщательно обработанном шуме, добавляемом к звуковому сигналу, который сбивает с толку системы ASR, оставляя при этом нетронутым восприятие человеком».

Исследователи говорят, что они считают себя первыми, кто предложил проактивную защиту от автоматизированной голосовой связи мошенничества, которые достаточно практичны для внедрения.ASRJam защищает от вишинга, запуская алгоритм EchoGuard в режиме реального времени на устройствах конечных пользователей. Инструмент невидим для злоумышленников, что затрудняет его обход.

EchoGuard также универсален – он в той или иной степени работает против любой модели искусственного интеллекта. Он также использует нулевой запрос, то есть не требует выборочного вывода ASR для генерации звукового возмущения, способного нарушить модель ASR.

Авторы говорят, что, хотя за последние несколько лет были предложены другие методы подавления ASR-помех (AdvDDoS, Kenansville и Kenku), «ни один из них не подходит для интерактивных сценариев; их помехи, хотя часто и понятны, являются резкими для восприятия и непрактичными для интерактивных сценариев».

ASRJam лучше, утверждают они, потому что EchoGuard изменяет голос тремя способами: реверберацией, колебаниями микрофона и временным акустическим ослаблением.Изменяя характеристики отражения звука, имитируя изменения положения микрофона и незначительное сокращение времени звучания, исследователи утверждают, что их метод «обеспечивает наилучший баланс между четкостью и приятностью звучания», основываясь на опросе, который они провели с неопределенным числом участников.Они опубликовали веб-сайт, на котором представлены оригинальные образцы речи и копии, обработанные с помощью EchoGuard и других алгоритмов для сравнения.Исследователи сравнили ASRJam/EchoGuard и другие методы с тремя общедоступными наборами данных (Tedlium, SPGISpeech и LibriSpeech) и шестью моделями ASR (DeepSpeech, Wav2Vec2, Vosk, Whisper, SpeechBrain и IBM Watson).»По всем параметрам EchoGuard неизменно превосходит все базовые глушители», — заявляют авторы в своей статье. «Наш метод обеспечивает наивысший показатель успешности атаки в каждой протестированной ASR-системе, во всех наборах данных, за одним незначительным исключением: SpeechBrain (SB), где он немного превосходит другие».

Авторы говорят, что считают это приемлемым, поскольку SpeechBrain не распространен в реальные развертывания и их производительность не очень хороши для обычных систем ASR.Они также отмечают, что все протестированные методы автоматического распознавания речи не работают в сравнении с моделью Whisper от OpenAI, которая, по их мнению, лучше отфильтровывает посторонние шумы, потому что разработчики обучали ее на особенно большом наборе данных, который включал множество зашумленных выборок.

Тем не менее, EchoGuard защищает от шепота лучше, чем другие глушители.

«Важно отметить, что, хотя абсолютный показатель успешности атаки на Whisper может показаться скромным (например, 0,14 на LibriSpeech), это все равно означает, что 1 из 6 расшифровок значительно искажена, что может быть достаточным для прерывания мошеннических разговоров, особенно в контексте интерактивного диалога где неправильное понимание ключевых терминов или намерений может подорвать работу целого поколения магистров», — утверждают они.

Ведущий исследователь Грабовски рассказал The Register, что, по его мнению, будущая работа улучшит эффективность ASRJam и EchoGuard в борьбе с Whisper.»В настоящее время ASRJam является исследовательским проектом, но мы активно работаем над улучшениями с целью его коммерциализации в ближайшем будущем», — сказал он. ®

Сайт о православной жизни, богослужениях, обществе, новых технологиях, а также статьи, направленные на укрепление нравственных ценностей. Пользователи могут найти ответы на часто задаваемые вопросы о православной культуре, ознакомиться с церковными новостями, а также участвовать в онлайн-дискуссиях. Цель проекта — стать источником духовного вдохновения.

Что такое истина?

Истина — это отражение реальности в ее подлинном виде, без искажений и заблуждений. Она является фундаментальной ценностью в философии, науке, религии и повседневной жизни, помогая людям осознавать и понимать окружающий мир. 

Выбор редактора

Новости