В мире
Новости Москвы
Политика
Общество
Происшествия
Наука и техника
Шоу-бизнес
Армия
Игры

«Яндекс» разработал нейросеть по расшифровке дореволюционной орфографии

Орфографические правила в до прихода власти большевиков имели некоторые отличия. Например, в употреблении была буква «i» и некоторые другие знаки, в том числе некоторые окончания и суффиксы. В дальнейшем реформы шли в сторону упрощений письма и ухода в прошлое ряда атавизмов.

«Яндекс» научил нейросеть дореволюционной орфографии
Фото: runews24.rurunews24.ru

Для этого нейросеть Яндекса «Поиск по архивам» изучила 2,5 млн страниц архивных документов, которые научилась расшифровывать в текст. В результате система «понимает» дореформенные особенности начертания букв и орфографии, тем самым ища необходимую информацию по каталогу или через строку поиска.

В каталог вошли сотни тысяч рукописных строк из реальных текстов XVIII -XIX веков и десятки миллионов сгенерированных примеров. Таким образом новый сервис поможет в работе историков, социологов, демографов, генеалогов, а также тем, кто хочет найти сведения о своей семье.