Томские специалисты создали программу для определения эмоциональной окраски текстов СМИ
Специалисты Национального исследовательского Томского политехнического университета создали систему, которая при помощи технологий искусственного интеллекта (ИИ) автоматически распознает тональность текстов в медиа. Разработка позволит усовершенствовать системы мониторинга медиаресурсов, которые, в частности, используют социологи, сообщил ТАСС в субботу руководитель проекта, профессор ТПУ
.
В основе программы - набор сверточных нейронных сетей (CNN) и сетей долгой краткосрочной памяти (LSTM), на основе которых система классифицирует тексты. Авторы работы "обучили" программу на двух базах данных для английского и русского языков. Отечественный набор обучающей и тестовой выборок содержал 10 тысяч фрагментов новостных статей.
"Русскоязычная версия программы позволяет распознавать три класса тональности текстов - негативную, нейтральную и позитивную степень эмоциональной окраски. Результат точности классификации превышает 70%. Программа может использоваться для анализа текстов в средствах массовой информации в качестве дополнения к существующим метрикам оценки", - сказал
Владимир Спицын
.
Версия программы, предназначенная для работы с английским языком, позволяет распознавать уже не три, а пять классов тональности текстов - негативную, нейтрально-негативную, нейтральную, нейтрально-позитивную и позитивную степень эмоциональной окраски. Точность классификации в этом случае также превышает 70%, отметил ученый.
"Подобные решения позволят расширить возможности для анализа медиаресурсов, которые сегодня применяются социологами, учеными и аналитиками, специализирующимися на анализе информации из СМИ. Новый инструмент позволит создавать более точную картину влияния тех или иных событий на медиапространство, а также проводить более глубокий анализ контента в социальных сетях", - пояснил представитель ТПУ.