Как нейросеть может помочь в деле сохранения татарского языка

Генерация идей, улучшение текстов и многое другое. Часть 1-я

Как нейросеть может помочь в деле сохранения татарского языка
© Реальное время

Как стало известно, в сервис "Переводчик" от "Яндекса" добавят более 20 языков народов России, а для некоторых из них будет также встроена нейросетевая технология распознавания и синтеза речи. Первым языком, с которым система начнет работать в этом формате, станет татарский, самый популярный в поиске агрегатора язык после русского. Райнур Хасанов, председатель Всемирного форума татарской молодежи и IT-специалист, ежедневно использующий сервисы искусственного интеллекта для улучшения, упрощения и ускорения работы над различными проектами, рассказал о своем опыте работы с площадкой.

Что делают "Нейротатары"

Как изменит эта новость жизнь татароязычного населения? Ведь это означает, что пользователи смогут наговаривать запросы в поиске гаджетов, картах и мессенджерах на татарском языке, а виртуальный ассистент "Алиса" научится читать сказки на языке Тукая. Проект реализуется совместно с Федеральным агентством по делам национальностей и региональными языковыми институтами.

Отметим, что работать с малыми языками нейросетям сложнее, поскольку переведенных текстов, на которых можно учиться, мало. С другой стороны, выручает, что татарский — тюркский язык, а значит, можно создать единую модель для родственных языков.

— К сожалению, многие сервисы искусственного интеллекта пока не поддерживают татарский язык, — говорит Хасанов. — Но у нас с сообществом активистов "Нейротатарлар" есть понимание, как это изменить. Для этого мы собираем самый большой монокорпус татарского языка, который позволит обучать открытые (open-source) языковые модели. Монокорпус также будет доступен для всех, чтобы мировые корпорации могли использовать его для обучения своих моделей.

Начнем с ChatGPT

— Думаю, уже не осталось людей, которые не слышали про эту "нейронку", но все же малая часть до конца не понимает, что собой представляет этот ИИ и какие реальные возможности скрываются под его функционалом, — говорит Хасанов. — ChatGPT — это умная программа, созданная для общения с людьми. Она может отвечать на вопросы, помогать с написанием текстов, давать советы и поддерживать беседу. Представьте себе робота, который умеет разговаривать, но вместо голоса он использует текст. Вы пишете ему вопросы, а он отвечает, стараясь быть полезным и понятным.

Получается сервис, который может отвечать на любые вопросы, писать тексты, переводить тексты, анализировать данные, генерировать идеи, составлять планы и многое другое. Как и у всех нормальных SaaS-решений, у него есть бесплатная и платная версии. Бесплатная работает только с моделью GPT-3.5, и сам сервис доступен лишь по VPN. Но как все это можно применить для популяризации татарского языка? Начнем с того, что GPT-4o, в отличие от своих ранних версий, лучше понимает и пишет на татарском языке. Поэтому с ним можно генерировать тексты на татарском языке.

— Вот, допустим, пример: я попросил его найти в интернете информацию про наш летний фестиваль татарской городской культуры "Печән базары", — говорит Хасанов и отправляет скриншот.

Неидеально, есть какие-то фактические ошибки, но в целом очень даже неплохо.

Генерация текстов

Сервис может создавать разнообразные тексты, включая статьи, рассказы, диалоги и сценарии, что особенно полезно для писателей, работающих над книгами и комиксами на татарском языке. Допустим, вы хотите сделать татарский комикс, ресурс поможет сгенерировать его идею. Эти же сценарии можно использовать для создания анимационного фильма, запросив разделение на сцены. Также инструмент подходит для генерации реалистичных диалогов, что полезно для сценаристов мультфильмов и комиксов.

И хотя сервис лучше работает с английским языком, его можно использовать для перевода текстов на татарский язык. В связке с переводчиками, такими как "Яндекс Переводчик", Tatsoft, это может значительно ускорить процесс адаптации контента.

Мозговой штурм и генерация идей

— ChatGPT может предложить новые идеи и направления для ваших проектов, — указывает Хасанов. — Это полезно для авторов, которые ищут вдохновения или новые подходы к своей работе. Допустим, вы хотите создать проект для развития татарского языка, но не знаете, с чего начать. Вы можете задать ChatGPT вопрос: "Чего не хватает в интернете для популяризации татарского языка среди молодежи?" — и он предложит вам варианты. Размышляя над его ответами, вы сможете найти интересную область, в которой можно реализовать свой проект. А также прописать дорожную карту.

Обработка и улучшение текстов

Инструмент может помочь в редактировании и улучшении существующих текстов, делая их более связными и читабельными. "Как я говорил выше, ChatGPT 4o уже неплохо пишет на татарском языке, а также может находить ошибки и исправлять их. В частности, к концу этого лета мы с ребятами готовим наш аналог Grammarly, который поможет в работе с татарскими текстовыми материалами", — говорит Хасанов.

В следующей части поговорим про конкретные плагины сервиса, а также такие сети, как Leonardo Ai, HeyGen, Suno.