КМУ — 2022: «Когда историку не с кем поговорить, он говорит с искусственным интеллектом»

03 декабря 2022, 13:38

В Сочи проходит третий и завершающий день II Конгресса молодых ученых. В его рамках состоялась сессия «Глубина исторической памяти и искусственный интеллект». На ней эксперты обсудили, как нейросети помогают нам сохранить важные исторические документы и исследовать историю нашей страны. Как искусственный интеллект читает рукописи Петра I (которые могут разобрать далеко не все историки) и как нужно делать программы для исследователей — читайте в репортаже InScience.News.«Сейчас надо двигаться дальше и придумывать, как это все сохранить и дать возможность доступа к этой информации»Первой выступила Анна Кочетова, главный специалист Российского государственного архива социально-политической истории. Она рассказала о том, что из себя представляет современный архив. Когда несколько лет назад началась оцифровка документов, казалось: «Вот оно!». Но нет. Оцифровка происходит, однако она очень сложна. Только профессиональные историки могут что-то найти в системах, где публикуют цифровые копии документов. «Мы поняли, что надо подходить с тематической точки зрения и создавать порталы, посвященные какой-то теме», — рассказала Кочетова. Однако эти программы тоже ограничены. Весь научно-справочный аппарат (или просто поисковая система) очень сложный и, чтобы его сделать, нужно потратить много ресурсов.Кочетова отметила, что технологии, которые сейчас разрабатываются, нужно разрабатывать и с точки зрения гуманитарных наук. «Сейчас надо двигаться дальше и придумывать, как это все сохранить и дать возможность доступа к этой информации», — подытожила она.Выступила и Наталья Тойкина, председатель Комитета по делам архивов при правительстве Удмуртской Республики. «В будущем мы должны быть ориентированы на неподготовленного пользователя», — заявила она. Уже сейчас создана система, которая содержит в себе все метрические книги региона. Но пока у нее есть ограничения. Было бы удобнее искать людей по фамилии, имени и отчеству, отметила Тойкина. Однако одному сотруднику на всю эту работу понадобится 717 лет. Поэтому нужна большая команда, чтобы сделать все оперативнее. С компанией «Директум» было принято решение создать нейросеть, которая будет распознавать почерк. «Будущее за искусственным интеллектом», — заявила Тойкина.Никита Башнин, старший научный сотрудник Санкт-Петербургского института истории Российской академии наук, рассказал о проекте «Digital Петр». В нем искусственный интеллект вычитывал рукописи Петра I (у которого, как известно, был очень специфичный почерк).Башнин обратил внимание, что необходимо продолжать развивать машинное обучение с IT-компаниями. Это позволит научиться читать средневековую скоропись и узнать исторические процессы, например как возникали населенные пункты в нашей стране (ведь есть разные подходы к этому вопросу). Искусственный интеллект сможет даже делать прогнозы. Например, массив данных перед крупным событием (к примеру, Смутой) можно проанализировать вместе с событиями после.«Когда историку не с кем поговорить, он говорит с искусственным интеллектом», — прокомментировал модератор Константин Могилевский, председатель правления Российского исторического общества.Башнин добавил, что необходимо ввести понятие «умная оцифровка». То есть с носителя нужно читать не только то, что там написано, но и, например, характеристики бумаги, которая в разные времена была разной.Документы всем!Кирилл Фесенко, председатель Ассоциации «Русское библиографическое общество», председатель НП «ИнфоРост», рассказал о том, что раньше все поиски в архиве делались вручную и очень долго. А сейчас есть возможность использовать базы данных, искусственный интеллект для поиска информации, и нужно предоставлять ее не только исследователям, но и непрофессиональным пользователям.Фесенко также отметил, что запросы историков не строгие: они хотят доступные оцифрованные документы на сайтах с удобными интерфейсами. Кроме того, исследователи страдают от информационной перегруженности. Ученые стремятся к более простому источнику информации, поэтому программное обеспечение для доступа к архивным коллекциям должно быть очень простым и интуитивно понятным.Александр Барков, заведующий кафедрой генеалогии и современной архивной работы Российского государственного социального университета, рассказал о том, что оцифровка исторически важных документов очень важна. Он рассказал о пяти этапах исполнения этой задачи. Первый заключается в том, как законодательно регулировать оцифровку, второй — сама оцифровка. Следующим этапом стало распознавание текстов, а после необходимо структурировать данные. Последний шаг — разработка правил формулирования запросов исследователей. Искусственный интеллект можно использовать на последних трех этапах. Нейросети позволят облегчить эти процессы и сделать их более быстрыми и эффективными. Для этого нужно внедрить масштабный пилотный проект, считает Барков.Подписывайтесь на InScience.News в социальных сетях: ВКонтакте, Telegram.

КМУ — 2022: «Когда историку не с кем поговорить, он говорит с искусственным интеллектом» — © InScience

Интернет

Анна Кочетова

Константин Могилевский

Александр Барков

РАН

Сочи