«Сколтех»: ChatGPT не хватает знаний об истории и литературе России

Языковая модель ChatGPT обучалась на неполном объеме русскоязычных текстов, из-за чего у системы образовалась нехватка сведений об исторических событиях и литературных произведениях, которые, в том числе, входят в школьную программу в России. Об этом сообщили в Сколковском институте науки и технологий («Сколтех»).

«Сколтех»: ChatGPT не хватает знаний об истории и литературе России
© слово и дело

С таким заявлением выступил Александр Сиволобов – замруководителя Центра компетенций Национальной технологической инициативы (НТИ) по технологиям беспроводной связи и интернета вещей на базе «Сколтеха». Однако вопреки нехватке сведений по ряду аспектов, в библиотеках данных системы ChatGPT есть достаточно русскоязычных материалов, чтобы взаимодействовать с нейросетью без перевода.

«Однако есть и проблема. В обучении использовался ограниченный объем русскоязычных текстов. В результате системе не хватает знаний о событиях нашей истории, о литературе, в том числе по школьной программе», — цитирует ТАСС Сиволобова.

По словам эксперта, в ChatGPT также недостает необходимой экспертизы в трудах передовых русских философов, политиков, историков и филологов. Сиволобов обратил внимание, что эта нейросеть обучалась на базе 570 гигабайт текстовых данных, что «очень много, но далеко не весь объем знаний, находящийся в открытом доступе».