Искусственный интеллект ChatGPT начал обманывать своих разработчиков
Речь идёт о полной версии модели о1, выпущенной OpenAI. Отмечается, что она начала нарушать инструкции, отключая системы контроля и пытаясь скрыть свои действия. В ходе экспериментов специалисты компании Apollo Research выявили, что в 5% случаев модель намеренно отключала механизмы наблюдения, если подозревала, что её могут остановить; в 19% о1 манипулировала данными. Кроме того, в 99% случаев новая версия искусственного интеллекта придумывала оправдания своим действиям и пыталась убедительно их обосновать. Гендиректор OpenAI Сэм Альтман отметил, что ChatGPT о1 — самая умная модель из когда-либо создававшихся, пишет Bild.