«Глаз» заставят выявлять противоправный контент в рунете. Посильна ли эта задача?

В Роскомназдоре определили разработчика «умной» системы поиска противоправного контента в интернете. На эти цели выделят почти 58 млн рублей. Сама система, названная «Окулус», или «Глаз» в переводе с латыни, должна появиться уже к декабрю.

«Глаз» заставят выявлять противоправный контент в рунете. Посильна ли эта задача?
© BFM.RU

Согласно техзаданию, «Окулус» будет в реальном времени анализировать фото, видео и тексты на сайтах, в соцсетях и мессенджерах на предмет запрещенной информации. Разработчик должен будет не только создать саму систему, но и предоставить заказчику наборы данных, или, как их еще называют, дата-сеты, для ее обучения. Чуть меньше четырех месяцев явно недостаточно для такого объема работ, считает директор по науке и технологиям Агентства искусственного интеллекта, автор и ведущий ютуб-канала «Душкин объяснит» Роман Душкин:

Роман Душкин директор по науке и технологиям Агентства искусственного интеллекта, автор и ведущий ютуб-канала «Душкин объяснит» «Проблема в том, что я не представляю, что за такое время можно качественно разметить дата-сет. А кто это будет проверять? Я боюсь, у Роскомнадзора даже специалистов таких нет. Вот что я хочу подчеркнуть: у разработчика, юридического лица, может завестись какой-нибудь специфический человек, который своими действиями отравит дата-сет. И нейросетевое решение, которое получится в итоге, станет работать вроде бы корректно, но его можно будет вывести из строя специфическим изображением, которое будет ему показано в будущем. И потом этот человек станет, например, шантажировать все наше государство, на службе у которого это решение стоит. Об этих вопросах вообще мало кто задумывается. За те деньги, которые обозначены в конкурсной документации, такое не делается».

Разработкой «умного» «Глаза» займется московская компания «Эксикьюшн Эр Ди Си». По данным «СПАРК-Интерфакс», она основана в 2014 году, собственники — частные лица. Один из совладельцев ранее был учредителем другой компании, которая, судя по информации на ее сайте, занималась внедрением решений немецкого разработчика корпоративного софта SAP. Эта компания уже ликвидирована, а чем занимается «Эксикьюшн Эр Ди Си», точно не известно, своего сайта у нее нет. В карточке компании указано число сотрудников — 29. Есть ли среди них программисты, непонятно. С другой стороны, ничто не мешает привлечь команду разработчиков со стороны. Но проект масштабный, и вряд ли десяток-другой программистов с ним справятся.

Мощность системы должна составить 200 тысяч изображений в сутки, это значит, что в секунду она должна анализировать два кадра или картинки. Как сообщил газете «Коммерсантъ» директор по цифровым технологиям ГРЧЦ Константин Буланов, для стабильной работы системы понадобится не менее 48 серверов, оснащенных графическими ускорителями.

Для анализа содержимого всего рунета этих мощностей будет недостаточно, эта задача нерешаема в принципе. Продолжает руководитель по развитию бизнеса Rubbles Ян Чижевский:

Ян Чижевский руководитель по развитию бизнеса Rubbles «При наличии обучающей выборки — того контента, который запрещен, — можно построить модель, которая будет его детектировать в тексте, в изображениях, в картинках и прочее. Вопрос: что дальше будет происходить? Как можно применить эту модель для детекции всего сегмента рунета? Это даже теоретически кажется невозможным, не говоря уже обо всем интернете, даже сегменте рунета. И нужно предположить какой-то невероятный объем вычислительных мощностей, чтобы хотя бы на определенном сегменте это работало. Скорее реализация подобного алгоритма детектирования противоправного контента [возможна] для соцсетей или ряда сайтов. Вот это выглядит понятной задачей».

В числе приоритетных нарушений, которые должна выявлять система «Окулус», — призывы к массовым беспорядкам, оскорбление общества, государства, официальных государственных символов, конституции или госорганов, призывы к суицидам, любая информация, связанная с изготовлением и приобретением наркотиков, а также пропаганда нетрадиционных сексуальных отношений среди детей.