Российский ИИ обучат на отечественных данных

Права отечественных авторов, чьи произведения использует искусственный интеллект (ИИ), получат дополнительную защиту, IT-компаниям будет проще патентовать свои технические решения, а сфера охраны и использования больших данных получит прозрачные правила игры. Об этом говорили в понедельник на заседании Совета по вопросам интеллектуальной собственности, которое провела председатель Совфеда Валентина Матвиенко.

Развитие новых технологий привело к небывалому росту мошенничества и многочисленным нарушениям авторского права. На фоне того, что технология ИИ активно внедряется, до сих пор неясно, откуда разработчики берут данные и давали ли на них разрешение правообладатели. Матвиенко привела примеры с корпорацией Google, которая перерабатывает и продает другим компаниям данные из российского цифрового сегмента, а также с ChatGPT, воспроизводящим фрагменты произведений классических и современных авторов, не сообщая ни имен, ни источника заимствования.

На площадке Межпарламентской ассамблеи СНГ уже разрабатывают модельный закон "О технологиях ИИ". По мнению спикера Совета Федерации, правильно изучить и успешный опыт стран БРИКС, других государств и выработать подход, который смог и защитить авторов, и при этом соблюсти права разработчиков.

Другая проблема - в нежелании высокотехнологичных компаний патентовать собственные технические решения. Матвиенко видит причину в том, что IT-бизнес не всегда может воспользоваться правовым полем для патентования разработок, поэтому нужны поправки в Гражданский кодекс.

Еще один чувствительный вопрос связан с охраной и использованием больших данных, или Big Data, колоссальный объем которые невозможно эффективно обработать без суперкомпьютеров. Политик убеждена, что новый нацпроект "Экономика данных" заработает в полную силу только с соблюдением баланса интересов разработчиков и пользователей. Сейчас основная часть больших данных сконцентрирована у государственных сервисов, мобильных операторов и социальных сетей, но каждого хранит их "за семью печатями".

"Чтобы большие данные стали фактором экономического развития страны, нам нужно пересмотреть действующие подходы, безусловно, с учетом всех аспектов информационной безопасности и охраны персональных данных граждан", - подчеркнула Валентина Матвиенко.

Заместитель председателя правительства Дмитрий Чернышенко предложил создать специальный научный дата-хаб для загрузки туда данных о научных исследованиях и конструкторских разработках, выполненных за государственные средства. Для этого потребуется отрегулировать сферу оборота научных данных, чтобы обеспечить обучение отечественных генеративных моделей ИИ. Если использовать зарубежные, то возможны искажения, в том числе идеологические, предупредил вице-премьер.

Российский ИИ станет конкурентоспособным, если максимально оцифровывать имеющийся "багаж знаний" и переводить на русский и другие языки народов нашей страны то, чего не хватает, заявил директор по развитию технологий ИИ компании "Яндекс" Александр Крайнов. Ведь большие языковые модели, которые генерируют тексты, обучаются на всех доступных текстах в мире, что и определяет их способность к цитированию.

О том, что применение ИИ и других цифровых технологий помогает Роспатенту справляться с растущим объемом заявок без потери качества экспертизы, сообщил его руководитель Юрий Зубов. Федеральная служба развивает инструменты патентной аналитики и прогнозирования, внедряет технологии для анализа трехмерных моделей и автоматизации работы с мировыми патентными данными.

"Очень важно, чтобы мы были страной цивилизованной защиты авторских прав и создавали условия для коммерциализации разработок, чтобы молодежь продолжала работать у нас", - подвела итоги заседания Валентина Матвиенко.

Российская Газета: главные новости