Опубликовано: 24 марта 2025 г. / Обновление с: 24 марта 2025 г. - Автор: Конрад Вольфенштейн
Наступление ИИ Южной Кореи: Глобальные стандарты Exaone Deep STAHS
LG представляет Exaone Deep: революционное агентное ИИ на основе открытого исходного кода
С Exaone Deep, LG AI Research опубликовала еще одну аргументированную модель искусственного интеллекта как открытый исходный код, которая привносит усилия по ИИ Южной Кореи на мировую сцену. Модель, представленная в марте 2025 года, в то время как GTC Nvidia Developer Conference характеризуется его способностью формулировать, проверять, проверять и принимать автономные решения на основе ее. Это инновационное решение искусственного интеллекта знаменует собой переход к эпохе «Агентного ИИ» и позиционирует LG среди немногих глобальных компаний, которые продвигают эту технологию вперед. С впечатляющими достижениями в математических, научных и кодирующих критериях с эффективным размером модели Exaone Deep является значительным прогрессом в разработке ИИ.
Семейство моделей Exaone и их развитие
С самого начала до глубокого
Основа для Exaone Deep была заложена в декабре 2020 года с основанием LG AI Research. Под руководством председателя LG Corp Koo Kwang-Mo, исследовательский отдел был запущен с целью обеспечения долгосрочного будущего LG с помощью технологий искусственного интеллекта. На управленческом собрании Ку подчеркнули: «Мы должны разрабатывать ИИ с предвидением, чтобы поддерживать двигатели для роста в 2030 -х годах».
Разработка семейства моделей Exaone началась с Exaone 1.0 в декабре 2021 года, модели «Supergiant AI» с около 300 миллиардов параметров. За этим последовал Exaone 2.0 в июле 2023 года и Exaone 3.0 в августе 2024 года, последняя как первая модель AI в Южной Корее, стала важной вехой. В конце 2024 года Exaone 3.5 следовал с улучшенным соблюдением инструкций и пониманием более длинных контекстов. Exaone Deep опирается на это развитие и сосредоточено специально на навыках рассуждения.
Техническая архитектура и варианты модели
Exaone Deep основан на архитектуре трансформатора декодера на трансформаторах и доступен в трех вариантах размера:
- Exaone Deep-32B: флагманская модель с 32 миллиардами параметров и 64 слоев, оптимизированная для максимальной производительности рассуждения.
- Exaone Deep-7.8b: легкая версия с 7,8 млрд. Параметров и 32 уровня, которая предлагает 95% производительности модели 32B в 24% от размера.
- Exaone Deep-2,4b: модель на устройстве с параметрами 2,4 миллиарда и 30 слоев, что, несмотря на ее небольшой размер (7,5% от модели 32B), по-прежнему достигает 86% производительности.
Все модели имеют максимальный объем контекста 32 768 токенов, что является значительным улучшением по сравнению с предыдущими моделями. Модели были в основном обучены, специзированным на рассуждениях данных, которые учитывают давние продуманные процессы, что позволяет им понимать более сложные отношения и делать логические выводы.
Подходит для:
- Ошибки бизнес -мышления: обманчивое свечение английских веб -сайтов, используя пример Южной Кореи - требуется больше, чем просто глобальный контент
Функции производительности и контрольные результаты
Математические рассуждения и решение научных проблем
Exaone Deep показывает особенно впечатляющие результаты в математических и научных рассуждениях. Модель 32B набрала 94,5 балла в вступительном тесте Южнокорейского университета (CSAT) в математической части и на американском экзамене по математике пригласительной математики (AIME) 2024 90,0 баллов, что превосходит конкурирующие модели.
С Math-500, индексом для оценки математических навыков решения проблем, он достиг 95,7 баллов. Особенно примечательно, что модель достигает этих услуг только примерно в 5% от некоторых моделей «гигантов», таких как DeepSeek-R1 (671 миллиард параметров).
В области научных рассуждений модель 32B в тесте GPQA Diamond, в которой оценивали навыки решения проблем на уровне доктора физики, химии и биологии, набрала 66,1 балла. Эти результаты подчеркивают способность модели понимать и применять сложные научные концепции.
Навыки кодирования и общее понимание языка
Exaone Deep также доказывает свою силу в области кодирования и решения проблем. В тесте LiveCodeBench, который оценивает навыки кодирования, модель 32B достигла значения 59,5. Это подчеркивает его потенциал для приложений в разработке программного обеспечения, автоматизации и других технических областях, которые требуют высокой степени вычислений.
В общем понимании языка модель обеспечила самый высокий балл MMLU (массовое многозадачное понимание языка) в соответствии с корейскими моделями с 83,0 баллами. Это показывает, что Exaone Deep не только эффективен в специализированных задачах рассуждения, но и в общем понимании языка.
Эффективность производительности более мелких моделей
Производительность меньших вариантов модели особенно заслуживает внимания. Модель 7,8B набрала 94,8 балла по математике-500 и 59,6 балла в AIME 2025, в то время как модель 2,4B на математике-500 92,3 балла и 47,9 балла за AIME 2024. Эти результаты позиционируют меньшие версии Exaone глубоко на вершине их соответствующих категорий во всех важных критериях.
Сообщество особенно удивлено эффективностью модели 2.4B. В вкладе Reddit отмечается, что эта небольшая модель даже превышает значительно большую модель GEMMA3 27B в определенных критериях. Один пользователь писал: «Я имею в виду, что вы говорите себе, что модель 2.4B (46.6) превышает Gemma3 27b (29.7) в тесте кода живого кода?»
Потенциал применения и значение на рынке ИИ
Области применения в промышленности, исследованиях и образовании
LG AI Research ожидает, что Exaone Deep будет использоваться в различных областях. В пресс -релизе говорится: «Exaone Deep будет использоваться не только в профессиональных областях, которые будут необходимы для отраслей в будущем, но и в области научных исследований и образования, таких как физика и химия, путем демонстрации высоких показателей оценки специализированных областей, таких как математика, наука и кодирование».
Особое внимание уделяется модели на устройстве (2.4b), которая может быть использована из-за ее небольшого размера на таких устройствах, как смартфоны, в автомобилях и в робототехнике. Поскольку данные могут быть безопасно обработаны на устройстве без необходимого соединения с внешними серверами, эта модель предлагает преимущества для безопасности данных и защиту персональных данных.
Позиционирование в глобальном конкурсе ИИ
С публикацией Exaone Deep LG позиционирует себя на все более конкурентном мировом рынке ИИ. Таким образом, южнокорейская технологическая компания конкурирует в прямой конкуренции с крупными технологическими компаниями, такими как Openaai, Google DeepMind и китайские разработчики ИИ, такие как DeepSeek.
Представитель LG AI Research сказал: «Мы объявили Exaone в глубине месяца после участия в национальном совещании по диагностике и инспекции в области конкуренции с искусственным интеллектом, которое состоялось в феврале в Национальном комитете по искусственному интеллекту в феврале, и публикация с открытым исходным кодом в модели Deepseek R1 является проведением просмотра». Представитель добавил: «Ядро технологии LGS KI - это поддержание производительности, в то время как значительное сокращение размера модели».
В то время, когда экономичные модели получают большое внимание после роста Chinas Deepseek в области рассуждений, LGS подход к разработке более мелких, но мощных моделей может быть стратегическим преимуществом.
Значение рассуждений-ки и «агентского искусственного интеллекта»
От знаний SKI до DADENING-KI
С Exaone Deep, LG AI Research переходит от «знаний Ki» к «Dasing-ki». В то время как традиционные модели ИИ в основном ориентированы на информационные вызовы и предоставление, Daseing-KIS, такие как Exaone Deep, могут самостоятельно создавать гипотезы, проверять их и принимать автономные решения, основанные на них.
Эта способность отмечает вход в эпоху «Агентного ИИ» - активного ИИ, который способен «думать» и действовать независимо. LG AI Research объясняет: «Агент ИИ относится к активному ИИ, который способен принимать автономные решения, независимо от формулировки гипотез и делая выводы для их проверки».
Стратегия с открытым исходным кодом
Важным аспектом публикации Exaone Deep является решение предоставить модель как открытый исходный код. За этим следует стратегия, которая началась с Exaone 3.0, первой модели ИИ с открытым исходным кодом в Южной Корее.
Стратегия с открытым исходным кодом позволяет разработчикам использовать и разрабатывать модель для исследовательских целей без ограничений. Это может привести к более широкому применению и дальнейшему разработке технологий и усилить позицию LG в глобальной экосистеме ИИ.
Kyung-Hoon Bae, президент LG AI Research, сказал: «Мы планируем предоставить эту очень универсальную и легкую модель в качестве открытого исходного кода, чтобы университеты и исследовательские институты могли использовать новейшую генеративную технологию ИИ, которая способствует экосистеме Исследования ИИ и еще больше улучшает способность ИИ».
Подходит для:
Будущие перспективы и текущие события
Chatexaone: новый стандарт для производительности на основе искусственного интеллекта в компании
LG планирует работать с дочерними компаниями LG во второй половине года, чтобы интегрировать Exaone глубоко в различные продукты и услуги. В зависимости от приложения, Exaons будут доступны в разных размерах модели, от модели Ultra-Light-Weight для услуг On-Device-KI до высокопроизводительной модели для специализированных приложений.
Конкретным примером практического применения технологии Exaone является Chatexaone, агент KI, основанный на Exaone 3.0 для компаний, которые уже доступны в качестве открытой бета -версии для сотрудников LG Group. Chatexaone предлагает различные функции для повышения производительности труда, включая системы вопросов-ответов на основе ВЕБ в реальном времени, системы ответа на вопросы на основе документов и изображения, поддержку кодирования и управление базами данных.
Дальнейшее развитие опыта ИИ в группе LG
Разработка Exaone Deep является частью более крупной стратегии ИИ в группе LG. LG уже создала внутреннюю аспирантуру ИИ, чтобы продвигать инженеров с адаптацией со степенью магистра девятимесячной степени и 18-месячной докторской программы.
Сотрудники, которые проходят эти курсы, работают над проектами, которые трудно разрабатывать для отдельных дочерних компаний. В рамках пилотного проекта LG Display разработала технологию проектирования для размещения большего количества пикселей на том же экране, в то время как LG Electronics и LG Innotek Methods для точного прогноза спроса с ИИ, что значительно снизит затраты на хранение.
Почему меньшие модели ИИ могут быть лучшим выбором-взглянуть на Exaone Deep
С введением Exaone Deep, LG AI Research получило важную веху в разработке ИИ. Как первая в Южной Корее модель ИИ, основанную на модели фонда, LG помещает ее в ряд ведущих мировых технологических компаний, которые разрабатывают эту передовую технологию ИИ. Впечатляющая производительность в математических, научных и кодирующих критериях с эффективным размером модели подчеркивает потенциал этой модели для различных областей применения.
Подход LG особенно заслуживает внимания для разработки высокопроизводительных моделей искусственного интеллекта с относительно небольшим размером. В то время как многие компании ИИ полагаются на все более крупные модели, Exaone Deep показывает, что с интеллектуальной оптимизацией и специализированным обучением, небольшие модели могут достичь максимальной производительности. Это может не только предложить экономические преимущества, но и позволить использовать мощные модели ИИ на устройствах Edge.
С публикацией с открытым исходным кодом Deep, LG AI Research способствует глобальной исследовательской экосистеме ИИ и в то же время усиливает позицию Южной Кореи в Международном конкурсе ИИ. Еще неизвестно, как эта технология реализована в различных продуктах и услугах LG Group и какие инновации она позволит ей в различных отраслях.
Подходит для:
Ваш глобальный партнер по маркетингу и развитию бизнеса
☑️ Наш деловой язык — английский или немецкий.
☑️ НОВИНКА: Переписка на вашем национальном языке!
Я был бы рад служить вам и моей команде в качестве личного консультанта.
Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein ∂ xpert.digital
Я с нетерпением жду нашего совместного проекта.