Исследователи научили ИИ узнавать персонажей книг по их репликам и описаниям

Ученые из Института искусственного интеллекта AIRI научили ИИ узнавать персонажей книг Джона Рональда Руэла Толкина по их репликам и описаниям, а также определять характер взаимоотношений между ними. Об этом «Газете.Ru» рассказали в AIRI.

Исследователи научили ИИ узнавать персонажей книг по их репликам
© Газета.Ru

Для обучения исследователи взяли работы Джона Рональда Руэла Толкина и опубликованные после смерти писателя записи под редакцией его сына. В список вошли «История Средиземья», «Властелин колец» и «Хоббит».

С помощью токенизации исследователи извлекли из текста 156482 предложения и в режиме «ручной настройки» получили список из 518 имен, 15 расовых лейблов и биографических фактов. После уточнения списка общее количество наименований для анализа составило 880.

Затем ученые описали алгоритм автоматического анализа произведений. Содержащийся в исследовании набор шагов можно использовать для решения ряда практических задач. Например, проводить анализ нормативной документации и суммаризацию юридических текстов, чтобы переписывать сложные документы простым и понятным обычному человеку языком.

Технология применима для обучения диалоговых ботов и переводчиков, а также поможет сэкономить время при поиске информации в больших объемах текста.