Chatbot Arena манипулирует рейтингами ИИ?

Chatbot Arena выглядела красиво. Удобная платформа: две модели отвечают на один и тот же запрос, пользователь выбирает, чей ответ лучше — вслепую, без знания, кто есть кто. Всё выглядит как демократичный конкурс качества. Но под внешней нейтральностью скрывается тщательно выстроенная система перекосов. И теперь это не догадки, а факт.

Главное сейчас