Нейросети Яндекса расшифруют архивные рукописные документы

«Яндекс» научил нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам». Об этом «Вечерней Москве» в среду, 25 января, сообщили в пресс-службе компании.

Нейросети «Яндекса» расшифруют архивные рукописные документы
© Unsplash
— Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд, — рассказала руководитель «Поиска Яндекса» Елена Бубнова.

Компания смогла научить нейросети расшифровывать архивные записи XVIII — начала XX веков со сложной дореволюционной орфографией. Построенный на основе системы оптического распознавания символов алгоритм учитывает особенности почерка, узнает утратившие актуальность буквы и понимает особую структуру архивных документов.

Специалисты компании обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных исторических текстов и десятков миллионов сгенерированных примеров.

Сервис повысит эффективность работы историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье. В базе сервиса можно быстро находить документы с упоминанием фамилии, населенного пункта или любых других слов.

До этого сообщалось, что новая функция голосового помощника «Яндекс. Алиса» поможет разобраться с сортировкой домашнего мусора. С помощью нового навыка «Чистая Москва» чат-бот расскажет, для чего разделять отходы и как правильно это сделать.