Китайцы нашли способ обучения ИИ без запрещенных чипов Nvidia

Ant Group, технологический гигант из Китая, совершил прорыв в области искусственного интеллекта (ИИ), разработав новую методику обучения ИИ-моделей. Инновационная система позволяет отказаться от использования американских графических процессоров Nvidia, опираясь на китайские полупроводниковые решения, включая чипы от Huawei и Alibaba. Об этом сообщает издание Bloomberg.

Китайцы нашли способ обучения ИИ без запрещенных чипов Nvidia
© Газета.Ru

В основе разработки лежит архитектура Mixture of Experts. По заявлениям компании, достигнутые результаты сопоставимы с производительностью GPU Nvidia H800. Этот успех укрепляет позиции Китая в технологической гонке на фоне ограничений со стороны США на экспорт передовых технологий.

Достижение Ant Group рассматривается как важный шаг в противостоянии между китайскими и американскими технологическими корпорациями. Ранее компания DeepSeek продемонстрировала возможность создания современных больших языковых моделей (LLM) без огромных инвестиций, характерных для OpenAI и Google. Хотя Ant Group продолжает применять решения Nvidia в ряде проектов, в новых разработках компания ориентируется на альтернативных поставщиков, включая AMD, и особенно на китайских производителей полупроводников. В условиях усиления экспортного контроля со стороны США это позволяет китайским компаниям не снижать темпы технологического развития и уменьшить зависимость от зарубежных поставщиков. В первую очередь, от Nvidia, которая не может поставлять в КНР оборудование для обучения ИИ.

Согласно научной публикации за март, ИИ-модели Ant Group в некоторых тестах демонстрируют превосходство над разработками Meta (признана в России экстремистской и запрещена). Однако эти данные пока не подтверждены независимыми экспертами.

Благодаря оптимизированной стратегии Ant Group снизила стоимость обучения ИИ-модели объемом в 1 трлн токенов с 6,35 млн юаней до 5,1 млн юаней. (Токены – минимальные единицы текста, используемые для обучения LLM). Компания планирует внедрить новые языковые модели Ling-Plus и Ling-Lite в промышленные решения, в том числе в медицине и финансах. Для развития ИИ-инфраструктуры в здравоохранении Ant Group приобрела китайскую платформу медицинских онлайн-сервисов Haodf.com. Также развиваются мобильное приложение Zhixiaobao (ИИ-ассистент) и сервис финансовых рекомендаций Maxiaocai на основе ИИ.

В научной работе отмечается, что Ling-Lite показала лучшие результаты в ключевом англоязычном тесте по сравнению с одной из версий Llama от Meta. Обе модели, Ling-Lite и Ling-Plus, превзошли аналоги DeepSeek в бенчмарках на китайском языке. Ling-Lite содержит 16,8 млрд параметров, а Ling-Plus – 290 млрд параметров и относится к категории больших языковых систем. Обе модели представлены разработчикам как решения с открытым исходным кодом. Для сравнения, GPT-4.5 от OpenAI оценивается в 1,8 трлн параметров, а DeepSeek-R1 – в 671 млрд.