Исследователи Лаборатории языковой конвергенции НИУ ВШЭ – Санкт-Петербург составили эмоциональный словарь для искусственного интеллекта, так называемый «мультимодальный эмоциональный датасет». Об этом сообщает пресс-служба НИУ ВШЭ.

© Unsplash

Словарь для ИИ состоит из различных фрагментов видео, которые при обработке позволят программам более точно распознавать то, что чувствует человек. Искусственный интеллект будет использовать для этих целей звук, текст, и визуальные данные – сообщают ученые.

«То, что раньше делал лингвист на основе словаря, теперь делают вычислительные модели, только их словарь должен быть организован по-другому. Вместо пары «слово – толкование» используется пара «текстовый фрагмент – эмоциональная метка», – рассказала заведующая Лабораторией языковой конвергенции Анастасия Колмогорова.

Созданный датасет – это не просто набор данных, заявляют в НИУ ВШЭ. Он решает сразу несколько важных задач: служит надежным источником для обучения новых моделей, становится инструментом для оценки уже существующих систем и выступает в роли «золотого стандарта» для исследований в области эмоциональной речи на русском языке.