В Новосибирске IT-эксперт рассказал, как умные колонки подслушивают своих владельцев

Голосовые помощники и всевозможная умная техника знает о своих хозяевах многое. Пользователи все чаще задаются вопросом, кто и как использует эти знания. В интервью BFM-Новосибирск исследователь в области кибербезопасности, сотрудник физического институт РАН Алексей Родионов рассказал о том, стоит ли считать умную технику шпионом в доме, и что можно сделать, чтобы защитить личную жизнь от лишнего внимания.

В Новосибирске IT-эксперт рассказал, как умные колонки подслушивают своих владельцев
© Bfm.ru Новосибирск

– Учитывая принцип действия голосовых помощников (голосовых станций, смартфонов, и прочей умной техники), могут ли их владельцы сохранять приватность?

Принцип работы всех коммерческих устройств по распознаванию речи, будь то голосовые станции, смартфоны, умная техника один – для распознавания речи и генерации ответов требуется активное подключение к сети Интернет. Распознавание речи требует большое количество вычислительных ресурсов, наши телефоны и персональные компьютеры для этого не подходят. К тому же, компании вроде Google и Yandex используют внутренние разработки с закрытым кодом, поэтому устанавливать их на клиентские устройства опасно – код можно взломать и получить доступ к технологиям на миллиарды долларов. Такая же история с генерацией текста и text-to-speech (преобразование речи в голос). Например, чтобы запустить аналог ChatGPT3.5 (актуальный на сентябрь 2021), потребуется оборудование ~ 250 тысяч рублей – видеокарта последней модели, мощный процессор, большое количество оперативной памяти, а также быстрый диск для чтения ответов и базы знаний. На выходе мы получаем только текст, отдельная история про его преобразование в голос. По итогу имеем очень большие затраты с очень маленьким КПД (например вы пользуетесь ассистентом суммарно 10 минут в день, остальные 1430 минут он простаивает и потребляет электроэнергию), в то время как сервера Yandex/Google занимаются этим процессом 99.9% рабочего времени.

фото с сайта ru.freepik.com

- «Прослушка» умной техники разговоров своих владельцев – это реальность или надуманные страхи?

В литературе и технологиях по распознаванию голоса существует специальный термин "hotword". Это слово-триггер, после произнесения которого умное устройство вам откликается и начинает слушать ваш голосовой запрос. Именно поэтому в Яндекс.Станциях доступны только два активационных слова – "Алиса" и "Яндекс", в Apple – "привет, Сири", в Google – "окей, гугл" и так далее. Такие специальные слова тренируются не на тысячах, а на сотнях тысяч вариантов произношения, чтобы избежать ложные срабатывания (например слово «полиция» для машины весьма созвучно со словом «алиса», поэтому здесь важно точнее угадывать фразы). Умные устройства (колонки со стоимостью от 5000 рублей) работают именно по такой схеме: не передают ваш голос на сервера ровно до тех пор, пока не услышат ключевое слово (hotword).

Но для того, чтобы услышать ключевое слово, нужно всё время слушать звуки, и колонки это делают, но локально, без подключения к Интернету. Это очень легко проверить: выключите wi-fiроутер, скажите активационное слово «алиса», колонка его услышит, активируется для прослушки и сразу же сообщит об ошибке подключения к Интернету. С телефонами ситуация другая – компании Google иApple ограничивают использование сторонних приложений, поэтому, встроенные GoogleAssistant и Alexaиспользуют локальное распознавание, а приложение Яндекса, как стороннее, слушает речь постоянно (в запущенном состоянии). Но прослушка всех в режиме реального времени – миф, так как вычислительные мощности для распознавания десятков миллионов устройств нужны колоссальные. А вот скрытая активация устройства по какой-нибудь определенной фразе, например «взрыв», «убийство», «бомба» - похоже на правду, но ни разу не было доказанных примеров. Возможно, такие активационные фразы добавляются по запросу от спецслужб. Но нужно именно активационное слово.

фото с сайта ru.freepik.com

- Что можно сделать человеку, если он не готов отказываться от умной техники, но при этом хочет защитить приватность? Включать/выключать доступ к микрофону? Что еще?

Если за вами идет слежка от государства (но я настаиваю на том, что это в исключительных случаях, по запросу суда и наличии технических возможностей у производителя ПО, ОС, страны), то, возможно отключение микрофона вам не поможет. Многие люди заклеивают камеру (на эту тему даже есть французский сериал «Киберсталкер», рекомендую), то найдется другая камера, микрофон, умное устройство, способное вас подслушать, например, если вы живете в общежитии и заклеили камеру/выключили микрофон, при этом ваш сосед – игровой стример, который ведет трансляцию в Интернет, подключая свою камеру, микрофон, то ваша безопасность сходит на ноль. Я бы посоветовал принять цифровой мир и понять, что чаще всего прослушка и отслеживание устройств требуется для рекламных целей: вам предлагаются вещи, о которых вы говорите, еду, которую вы покупаете, исходя из геолокации, и другие контекстные товары.

Поэтому, ограничиться можно только от крупных корпораций. Например:

1. Поставить adblock (блокировщик рекламы), тогда ваши данные не улетают направо-налево со всех посещаемых сайтов.

2. Не покупать дешевую технику. Например, средняя цена телевизора с диагональю 55 дюймов – 60 тысяч рублей, но вам на глаза попадается товар с функцией SmartTV, голосовым управлением, от не самого известного бренда, но стоит такой телевизор всего 20 тысяч рублей. Выгодная покупка, скажете вы? Скорей всего, такой телевизор делает скриншоты ваших просмотров, регулярно ведет запись через микрофон, а потом продает ваши данные в рекламные агентства. Потому что низкая цена компенсируется скрытой передачей ваших приватных данных, которые продают на рекламных рынках. Почитайте инструкцию к телевизору, возможно, мелким шрифтом это может быть написано, особенно про «диагностические данные» и «отправку анонимной статистики». Только вот статистика выходит не совсем анонимная – отправляется id вашего устройства, ваш ip-адрес, и скриншот видео, которое вы смотрите в данный момент.

фото с сайта ru.freepik.com

3.Для тех, кто считает приватность превыше всего – покупать устройства без привязки к конкретному поставщику ОС (Android, iOS), и с полным доступом управления системными и аппаратными настройками. Например, есть смартфон PinePhone, на него можно установить открытую ОС на базе Linux, у вас полный доступ к функциям. Но на таком устройстве не будут работать приложения банков, брокеров, так как они отказываются поставлять свой софт в контролируемое пользователем пространство. К тому же, функционал у данного смартфона весьма скромен, он отстает по характеристикам от последних моделей на 4-5 лет, а цена у него будет высокая. Потому что здесь работает правило из пункта 2.

4. Использовать self-hosted решения. Это набор программ, которые имеют открытый исходный код и позволяют устанавливать себя на компьютер клиента. Например, приложение Яндекс.Диск имеет закрытый исходный код, вы не сможете сами убедиться, отправляют ли рекламные данные о вас, как часто, и как это отключить. Но есть альтернатива – NextCloud, похожа на связку документы+диск+фотографии, её можно установить на свой компьютер, на свой телефон, код приложения открыт, можно посмотреть, как происходит взаимодействие между клиентом и сервером. Но, как вы выше заметили, есть некоторые ограничения: вы должны быть квалифицированным специалистом в сфере IT, безопасником или программистом, который может самостоятельно осмотреть код и подправить его под себя. Или же довериться тысячам других людей, использующих это приложение. Вам нужен выделенный сервер, расположенный в доверенном месте (например, дома), где вы имеете физический доступ к железу и можете настроить систему под себя. Вам нужен постоянный IP адрес, чтобы подключаться к этому серверу из любой точки мира, а не только из домашней wi-fi сети. Затраты эти небольшие, но регулярные – раз в месяц. Если вы технически подкованный – то справитесь с установкой сами, если нет – наймете специалиста-установщика за деньги, но он уже будет иметь доступ к вашему компьютеру, поэтому может оставить закладку или бэкдор для благих или плохих целей.

фото pressfoto с сайта ru.freepik.com

Конкретно я перестал пользоваться облачными сервисами типа Google Фото, Документы, Диск и их аналогами от других компаний еще в 2021 году, держу все документы, файлы, фото, календари на своей машине в квартире. Выходит довольно дорого, но частично от слежки я ушел.

5. Настроить дома блокировщик рекламы piHole или adGuard. Зачастую компании передают данные от телефонов, телевизоров, колонок не напрямую, а в скрытую, например через протокол DNS. Рассмотрим пример, который есть у меня дома. У меня стоит 2 колонки Яндекс.Станция, есть техника Apple (TV, macbook, iphone), телевизор Samsung. Вот мой ежедневный топ по блокировкам запросов от программы piHole:

Чаще всего блокируется запрос на сервера яндекс, просто рекордсмен. Легко понять, что аббревиатура MS означает Microsoft, iCloud – сервера apple, и на третьей строчке также есть Samsung. А теперь интересные данные – телевизор я включал неделю назад, колонкой пользуюсь три раза в день – прошу погоду, включаю кондиционер, включаю музыку. Получается, что мои колонки обращаются на сервера Яндекса каждые 30 секунд, хотя я не пользуюсь колонками так часто. Выключенный телевизор делает это 300 раз за день. Устройства apple делают это тоже довольно часто, но здесь указаны только заблокированные случаи, где потенциально могут передаваться мои метрики устройств. На саму работу устройств это не влияет, все сервисы доступны.

Если бы я не настроил блокировщик данных, то все они доходили бы куда надо, а Яндекс косвенно мог получать информацию, подключен ли я к сети или нет (один запрос в 30 секунд позволяет буквально в режиме реального времени это делать). У меня был опыт использования колонки Dexp на базе Алисы, та версия стоила около 3000 рублей, и я думаю, что функции ‘hotword’ у нее не было, так как количество запросов превышало текущие в 50-100 раз.

Ранее BFM-Новосибирск рассказывал о массовом взломе Telegram-каналов у новосибирских бизнесменов. Также мы рассказывали о рисках, связанных с нейросетями.