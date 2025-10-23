Исследовании компании OpenAI показало, что продвинутые ИИ-модели испытывают «галлюцинации» и выдают неверную информацию чаще, чем менее развитые. Но можно ли как-то решить эту проблему, и как она способна повлиять на творческие возможности нейросетей? Портал livescience.com разобрался в вопросе.

© Unsplash

Фундаментальный механизм рассуждающих моделей в том, что они могут справляться со сложными задачами, разбивая их на отдельные компоненты и подыскивая решение для каждого. Вместо того, чтобы подбирать ответы исходя из статистической вероятности, подобные модели создают стратегии для решения проблем — примерно так же, как мыслят живые люди.

Для того, чтобы генерировать творческие, потенциально новаторские решения, ИИ должны испытывать галлюцинации — иначе они будут слишком ограничены жесткими данными, которые поглощает языковая модель.

По сути, все, что они выдают, можно считать галлюцинациями, просто иногда эти галлюцинации оказываются правдой. Если бы ИИ генерировал только слово-в-слово те ответы, что нейросеть видела во время обучения, то модели превратятся в одну огромную проблему поиска. Они смогли бы выдавать лишь тот код, что уже был кем-то написан, находить протеины и молекулы, чьи свойства уже изучены и описаны, и помогать делать домашнюю работу, которую кто-то уже выполнил.

Другими словами, языковым моделям и ИИ-системам, которые на них построены, нужна возможность галлюцинировать, чтобы создавать что-то оригинальное, а не подавать уже существующую информацию. Концептуально это похоже на человеческие сны или моменты, когда мы представляем себе воображаемые ситуации при создании чего-то нового.

В то же время ИИ-галлюцинации представляют проблему, если говорить о подаче точной, корректной информации, особенно если пользователи воспринимают ее как правду без каких-либо проверок или контроля. Причем эта проблема стоит вдвойне остро в сферах, где решения зависят от точности фактов — медицине, юриспруденции, финансовом секторе. И хотя более продвинутые модели могут снизить частоту возникновения очевидных фактических ошибок, доверие пользователей к ИИ постепенно снижается.

Хуже всего то, что проблематичный аспект галлюцинаций становится более вредоносным по мере развития ИИ-технологий. Модели начинают допускать менее очевидные ошибки, которые сложнее обнаружить. Сфабрикованный контент все чаще встраивается в реалистичные нарративы и резонные цепочки рассуждений. Пользователи могут даже не знать, что в контенте ИИ есть ошибки, и принимать его ответы как истину. А для «отлова» таких ошибок приходится переключать внимание на поиск очень малозаметных искажений, которые выдают себя лишь при близком изучении.

Наконец, последний фактор в том, что даже специалистам иногда тяжело сказать, как именно языковые модели приходят к тем или иным ответам. Например, если генеративный ИИ анализирует финансовый документ, то у человека за компьютером нет ни малейшего понимания, почему модель пришла к специфическим решениям. Почему она выбрала именно эти слова, а не другие, и почему иногда в информации проскакивают ошибки, хотя обычно их нет.

ИИ-галлюцинации сложно истребить на корню, но есть способы немного облегчить проблему. Например, «заземление» контента ИИ во внешних источниках данных может обеспечить более надежный способ верификации данных, которые выдают генеративные модели. ИИ также можно тренировать с акцентом на точность и принудить его проходить определенные структурированные шаги, постоянно проверяя самого себя на ошибки. Ну или как минимум создать модель, которая понимает, что может ошибаться, и потому вместо неизменно уверенных ответов иногда помечает, что кое-какие вещи стоит перепроверить человеческими глазами.