Создана нейросеть, ускоряющая поиск близких по смыслу научных статей

МОСКВА, 13 мая. /ТАСС/. Специалисты Московского государственного университета им. М. В. Ломоносова разработали мультиязычную нейросеть для научных электронных библиотек, которая позволяет быстрее находить близкие по смыслу публикации с результатами исследований. Об этом сообщила пресс-служба МГУ.

Нейросеть SciRus-tiny внедрена в научную электронную библиотеку elibrary.ru. Теперь похожие публикации в ней можно искать не только по ключевым словам, точность подбора которых влияет на количество и содержание документов, но и по текстам самих статей.

"Нейросетевой поиск позволяет задать в качестве условия запроса аннотацию, полный текст научной статьи или даже подборки статей по интересующей тематике. Система автоматически подберет документы, максимально близкие по своей тематической направленности", - уточнил руководитель междисциплинарной группы проекта, заведующий кафедрой физического факультета МГУ Алексей Хохлов, чьи слова приводятся в сообщении.

Кроме функции поиска с помощью нейросети, пользователи библиотеки могут искать публикации по таким параметрам, как совместное цитирование, просмотр публикаций пользователями, состав авторов, дата выпуска статьи и другим.

"Важной для нас особенностью данной модели является ее мультиязычность, поскольку научная электронная библиотека содержит документы на различных языках. Также тестирование подтвердило высокую эффективность модели, что расширяет круг задач и приложений, где она может быть использована. В стадии разработки - применение нейросети для идентификации авторов в публикациях, тематической классификации научных статей, а также в новом интерфейсе расширенного поиска на elibrary.ru", - прокомментировал генеральный директор библиотеки Геннадий Еременко, чьи слова приводит пресс-служба МГУ.

Нейросеть была создана сотрудниками Института ИИ МГУ при поддержке портала elibrary.ru. Авторы также опубликовали нейросеть в интернете, открыв доступ для всех пользователей.

О библиотеке

Библиотека elibrary.ru - крупнейшая в России база научных публикаций, интегрированная с Российским индексом научного цитирования. Платформа была создана в 1999 году по инициативе Российского фонда фундаментальных исследований (в 2022 году преобразован в Российский центр научной информации). Согласно данным на сайте проекта, сегодня пользователям портала доступны рефераты и полные тексты более 38 млн научных публикаций и патентов, в том числе электронные версии более 5,6 тыс. российских научно-технических журналов. Общее число зарегистрированных организаций - более 2 800, индивидуальных пользователей - 1,7 млн, представляющих 125 стран.