Ученые научились отличать ИИ от людей в интернете по отсутствию хамства и грубости
Целая группа исследователей выяснила, что современные языковые модели всё ещё легко отличить от людей по чрезмерно вежливому тону и отсутствию токсичности.
Учёные протестировали девять популярных ИИ — включая Llama 3.1, Mistral 7B, Qwen 2.5 и Gemma 3 — на платформах X (Twitter), Bluesky и Reddit.
Классификаторы смогли определить, где пишет человек, а где машина, с точностью 70–80%. ИИ стабильно показывал более «доброжелательные» ответы и не мог воспроизвести привычную для соцсетей смесь сарказма, раздражения и эмоциональности.
Даже после дообучения и «тонкой настройки» модели оставались слишком дружелюбными. Интересно, что малые модели без дополнительной «инструкционной» тренировки оказались более человечными, чем большие и «вежливо откалиброванные».
Учёные заключили, что пока искусственный интеллект может имитировать стиль, но не спонтанные эмоции — и именно отсутствие грубости остаётся его главным отличительным признаком.