Алгоритм предсказал, когда интернет-общение становится токсичным

Исследователи из Корнеллского университета ( США ) создали алгоритм, который отделяет вежливую переписку от оскорбительной. Об этом сообщается на сайте университета. Создатели надеются, что их инструмент поможет модерировать чаты и форумы в интернете.

Для обучения алгоритма исследователи использовали базу данных Wikipedia — Talk pages. Эта платформа предназначена для редакторов статей, которые обмениваются мнениями о верификации информации. Специалисты отобрали 1 270 диалогов, начинающихся с вежливых фраз. Они обучили компьютер отделять уважительное отношение от оскорбительного. К примеру, обращения, вроде «спасибо за помощь» (thanks for your help) или «пожалуйста, найди источники к этой правке» (please find sources for your edit) расценивались как вежливые, а такие фразы, как «твои источники не имеют значения» (your sources don’t matter) причислялись к грубым. Исследователи также заметили, что диалоги, в которых с самого начала часто употреблялось местоимение «ты» (you), с большей вероятностью оканчивались язвительными высказываниями.

Один из участников работы Кристиан Данеску-Никулеску-Мизил (Cristian Danescu-Niculescu-Mizil) объяснил ее значение:

«Каждый день миллионы людей спорят друг с другом в интернете, и отслеживать их в реальном времени невозможно. Наша система поможет модераторам перенаправлять их внимание в нужную сторону. У людей есть интуитивное ощущение того, когда разговор идет наперекосяк, но мы не угадываем в ста процентах случаев. Нам интересно, сможем ли мы создать такую систему, которая преодолеет наше собственное интуитивное ощущение».

Авторы исследования провели эксперимент, чтобы узнать, кто лучше определяет токсичность: человек или машина. Точность респондентов равнялась 72 процентам. Результат алгоритма не превышал 65 процентов. В будущем они надеются увеличить это показатель.

В июне искусственный интеллект DeepMind научили воссоздавать трехмерную сцену по фотографии.