В пресс-службе НИУ ВШЭ сообщили, что ученые вуза разработали новый подход к обучению языковых нейросетей, позволяющий им лучше понимать и различать юмор.
Ученые предлагают использовать более разнообразные и близкие к естественному общению данные для обучения, что значительно повышает точность распознавания юмора.
В экспериментах с нейросетями, включая RoBERTa, ChatGPT и Flan-UL2, ученые проверили способность моделей выявлять юмор в диалогах из произведений Льюиса Кэрролла, Чарльза Диккенса и других, а также в ироничных социальных медиа-сообщениях. Оказалось, что модели, обученные на разнообразных данных, успешнее справлялись с этой задачей.
Александр Баранов, один из авторов исследования
«Мы показали разным моделям «Лавку древностей» Диккенса, а это очень грустная история, и попросили оценить происходящее. Выяснилось, что некоторые модели считают, что все диалоги из литературы XIX века смешные. И даже больше: все, что слишком непохоже на новости XXI века, воспринимается ими как юмор».