19 марта 2025, 14:24

Компания LG представила первую в Корее модель искусственного интеллекта «Exaone Deep»

Exaone Deep-32B превосходит китайский DeepSeek в математике, но уступает в языковых возможностях

Фото: Getty Images

Авторы Ю Джи Хан, Ким Со ен. The Chosun daily, перевод Я – Дальний Восток.

18 марта компания LG представила первую в Южной Корее модель искусственного интеллекта (ИИ), способную рассуждать. В отличие от традиционного ИИ, который находит ответы на основе предварительно изученных данных, ИИ, способный рассуждать, находит ответы с помощью логических, поэтапных мыслительных процессов, схожих с человеческими. Ключевым примером является китайская модель DeepSeek, которая недавно привлекла внимание мировой общественности своей экономичной и высокопроизводительной моделью. Поскольку технологические гиганты, такие как OpenAI и DeepSeek, конкурируют в разработке ИИ, способного рассуждать, новая модель LG выводит Южную Корею на новый уровень. Однако LG не выпустит его для публичного использования, а оставит для внутренней разработки продуктов.

Компания LG AI Research представила Exaone Deep с основной моделью Exaone Deep-32B. Модель содержит 32 миллиарда параметров, которые упрощают подключение данных для обучения и анализа ИИ. Чем больше параметров, тем выше производительность, но для этого требуется больше чипов ИИ. Поэтому компании всё больше внимания уделяют оптимизации производительности при меньшем количестве параметров.

В DeepSeek R1 671 миллиард параметров, в то время как в Exaone Deep-32B их всего около 5%. Несмотря на это, тесты производительности показывают, что модель LG не уступает DeepSeek-R1. В сравнительных тестах с ведущими моделями ИИ для обработки данных, такими как DeepSeek и QwQ-32B от Alibaba, Exaone Deep-32B особенно преуспел в математике. На математической олимпиаде в США в 2024 году он набрал 90 баллов, опередив DeepSeek-R1 (86,7) и QwQ-32B от Alibaba (86,7). На математической секции CSAT в Южной Корее в 2025 году он набрал 94,5 балла, что стало самым высоким результатом среди конкурирующих моделей. Он также хорошо справился с научными задачами для докторантов, набрав 66,1 балла, опередив QwQ-32B от Alibaba (63,3).

Однако он отставал в навыках программирования и владения языком. В тесте на многозадачное понимание языка (MMLU) он набрал 83 балла, уступив Alibaba (87,4) и DeepSeek (90,8). Один из отраслевых экспертов объяснил: «Модели ИИ для рассуждений предназначены для решения математических и научных задач, поэтому их языковые возможности, естественно, уступают более крупным моделям».

Исследовательский центр LG AI также представил облегчённую модель Exaone Deep-7.8B и модель Exaone Deep-2.4B для устройств. В институте заявили: «Несмотря на то, что облегчённая версия занимает всего 24% от размера модели 32B, она сохраняет 95% производительности, в то время как модель для устройств обеспечивает 86% производительности, занимая всего 7,5% площади». LG также опубликовала исходный код модели в открытом доступе для разработчиков, как и DeepSeek.

LG предлагает исходный код бесплатно, но сама модель ИИ используется только внутри компании. Для её публичного использования, как в случае с ChatGPT, потребуются огромные центры обработки данных и как минимум несколько триллионов вон.

Среди южнокорейских компаний Naver также разрабатывает модели ИИ. В 2023 году она запустила HyperCLOVA X и с тех пор сократила количество параметров примерно на 60%, улучшив при этом производительность. По словам Naver, эксплуатационные расходы новой модели снизились более чем на 50%. Компания также разрабатывает специализированную модель ИИ для обработки данных. Ведущий стартап в области ИИ Upstage также недавно начал полномасштабную разработку ИИ для обработки данных.

Текст: ЯСИА-ДВ