Вибір голосу 📢


Штучний інтелект з Exaone Deep: LG AI Research представляє новий міркування AI-агентський AI з Південної Кореї

Опубліковано: 24 березня 2025 р. / Оновлення з: 24 березня 2025 р. - Автор: Конрад Вольфенштейн

Штучний інтелект з Exaone Deep: LG AI Research представляє нові міркування AI-агентські AI з Південної Кореї

Штучний інтелект з Exaone Deep: LG AI Research представляє новий міркування AI-агентський AI з Південної Кореї: Xpert.digital

Наступ AI Південної Кореї: Exaone Deep встановлює глобальні стандарти

LG представляє Exaone Deep: Революційний агент AI на основі з відкритим кодом

З Exaone Deep, LG AI Research опублікував подальшу модель AI AI як відкритий код, який приносить південнокорейську зусилля AI на глобальну стадію. Модель, представлена ​​в березні 2025 року, в той час як конференція розробників NVIDIA GTC характеризується його здатністю формулювати, перевіряти та приймати автономні рішення на основі цього. Це інноваційне рішення AI відзначає перехід до епохи "агента AI" та позиціонує LG серед небагатьох глобальних компаній, які рухають цю технологію вперед. З вражаючими досягненнями в математичних, наукових та кодувальних орієнтирах з ефективним розміром моделі, Exaone Deep є значним прогресом у розвитку ШІ.

Сім'я моделі Exaone та їх розвиток

Від початку до ексаоне глибоко

Основа для Exaone Deep була закладена в грудні 2020 року з фундаментом дослідження LG AI. Під керівництвом голови LG Corp Koo Kwang-MO, департамент досліджень був запущений з метою забезпечення довгострокового майбутнього LG за допомогою технології AI. На засіданні керівництва Коу підкреслив: "Ми повинні розвивати ШІ з передбаченням для підтримки двигунів зростання на 2030 -ті роки".

Розвиток родини моделей Exaone розпочався з Exaone 1.0 у грудні 2021 року, моделі «супергіантного AI» з близько 300 мільярдів параметрів. Після цього в липні 2023 року Exaone 2.0 та Exaone 3.0 у серпні 2024 року останній як перша модель AI з відкритим кодом Південної Кореї була важливою віхою. Наприкінці 2024 року Exaone 3.5 слідкував за вдосконаленим дотриманням інструкцій та розумінням більш тривалих контекстів. Exaone Deep ґрунтується на цьому розвитку і зосереджується спеціально на навичках міркувань.

Варіанти технічної архітектури та моделі

Exaone Deep заснований на архітектурі трансформаторів декодера-он і доступний у трьох варіантах розмірів:

  1. EXAONE DEEP-32B: Флагманська модель з 32 мільярдами параметрів та 64 шарів, оптимізована для максимальної продуктивності міркувань.
  2. Exaone Deep-7.8b: Легка версія з 7,8 мільярда параметрів та 32 шарами, яка пропонує 95% продуктивності моделі 32B лише 24% від розміру.
  3. Exaone Deep-2.4b: модель пристрою з 2,4 мільярда параметрів і 30 шарів, яка, незважаючи на невеликий розмір (7,5% моделі 32B), все ще досягає 86% продуктивності.

Усі моделі мають максимальний контекстний обсяг 32 768 жетонів, що є значним поліпшенням порівняно з попередніми моделями. Моделі в основному навчалися на репетиційних записах даних, які враховують тривалі процеси мислення, що дозволяє їм зрозуміти більш складні відносини та робити логічні висновки.

Підходить для цього:

Особливості продуктивності та результати орієнтиру

Математичні міркування та наукове вирішення проблем

Exaone Deep показує особливо вражаючі результати у математичних та наукових завданнях міркувань. Модель 32B набрала 94,5 балів на вступному тесті Південнокорейського університету (CSAT) у частині математики та на американській іспиті з математики Invitational (AIME) 2024 90,0 балів, що перевершує конкурентоспроможні моделі.

За допомогою Math-500, індекс для оцінки математичних навичок вирішення проблем, він досяг 95,7 балів. Особливо примітно, що модель досягає цих послуг лише близько 5% від розміру деяких моделей «гігантів», таких як DeepSeek-R1 (671 мільярд параметрів).

У галузі наукових міркувань модель 32B в тесті на алмазний тест GPQA, яка оцінювала навички вирішення проблем на докторантурі з фізики, хімії та біології, набрала 66,1 балів. Ці результати підкреслюють здатність моделі розуміти та застосовувати складні наукові концепції.

Навички кодування та загальне розуміння мови

Exaone Deep також доводить свою силу в області кодування та вирішення проблем. У тесті LiveCodeBench, який оцінює навички кодування, модель 32B досягла значення 59,5. Це підкреслює його потенціал для додатків у розробці програмного забезпечення, автоматизації та інших технічних областях, які потребують високого ступеня обчислення.

У загальному розумінні мови модель забезпечила найвищий показник MMLU (масове розуміння мови багатозадачності) за корейськими моделями з 83,0 балами. Це свідчить про те, що Exaone Deep є не лише ефективним у спеціалізованих завданнях міркувань, але й у загальному розумінні мови.

Ефективність продуктивності менших моделей

Ефективність менших варіантів моделі особливо заслуговує уваги. Модель 7,8b набрала 94,8 балів на математиці-500 та 59,6 балів в AIME 2025, тоді як модель 2,4В в математиці-500 92,3 балів та 47,9 балів для AIME 2024. Ці результати позиціонують менші версії Exaone глибоко у верхній частині своїх відповідних категорій у всіх важливих орієнтирах.

Громада особливо здивована виконанням моделі 2.4B. У внеску Reddit відзначається, що ця невелика модель навіть перевищує значно більшу модель GEMMA3 27B у певних орієнтирах. Один користувач писав: "Я маю на увазі, ти скажеш собі, що модель 2,4В (46.6) перевищує GEMMA3 27B (29.7) у орієнтирі коду в прямому ефірі?"

Потенціал застосування та значення на ринку ШІ

Сфери застосування в галузі, дослідженні та освіті

Дослідження LG AI очікують, що Exaone глибоко буде використаний у різних областях. У прес -релізі зазначається: "Exaone Deep буде використовуватися не лише у професійних галузях, які потрібні галузями в майбутньому, але й у наукових дослідницьких та навчальних сферах, таких як фізика та хімія, демонструючи високу продуктивність в показниках оцінювання спеціалізованих сфер, таких як математика, наука та кодування".

Особлива увага приділяється моделі на пристрої (2,4b), яка може бути використана завдяки її невеликому розміру на пристроях, таких як смартфони, в автомобілях та в робототехніці. Оскільки дані можуть безпечно обробляти на пристрої без необхідного підключення до зовнішніх серверів, ця модель пропонує переваги для безпеки даних та захисту персональних даних.

Позиціонування у глобальному конкурсі AI

З публікацією Exaone Deep, LG позиціонує себе на все більш конкурентоспроможному глобальному ринку ШІ. Таким чином, південнокорейська технологічна компанія конкурує з прямою конкуренцією з великими технологічними компаніями, такими як OpenAai, Google Deepmind та китайськими розробниками AI, такими як DeepSeek.

Представник LG AI Research зазначив: "Ми оголосили Exaone глибоко приблизно через місяць після участі у внутрішніх зборах та зборах інспекції промисловості AI, яка відбулася в лютому в Національному комітеті з питань штучного інтелекту в лютому та публікації з відкритим кодом Deepseek R1-рівня". Представник додав: "Ядро технології LGS KI - це підтримка продуктивності, тоді як значне зменшення розміру моделі".

У той час, коли економічно ефективні моделі приділяють велику увагу після зростання Chinas DeepSeek у галузі можливостей міркувань, підхід LGS до розробки менших, але потужних моделей може бути стратегічною перевагою.

Значення міркувань-кі та "агента АІ"

Від знань до міркувань-кі

З Exaone Deep, LG AI Research переходить від "знань KI" до "міркування-кі". Незважаючи на те, що традиційні моделі AI в основному орієнтовані на інформаційні дзвінки та забезпечення, міркування, такі як Exaone Deep, можуть створити гіпотези незалежно, перевірити їх та приймати автономні рішення на основі них.

Ця здатність відзначає вступ до епохи "Агентського ШІ" - Active AI, який здатний "думати" і діяти самостійно. LG AI Research пояснює: "Агентний АІ посилається на активний ШІ, який здатний приймати автономні рішення, формулюючи гіпотези незалежно та здійснюючи висновки, щоб перевірити їх".

Стратегія з відкритим кодом

Важливим аспектом глибокої публікації Exaone є рішення надати модель як відкритий код. Після цього йдеться про стратегію, яка розпочалася з Exaone 3.0, першої моделі AI з відкритим кодом у Південній Кореї.

Стратегія з відкритим кодом дозволяє розробникам використовувати та розробляти модель для дослідницьких цілей без обмежень. Це може призвести до більш широкого застосування та подальшого розвитку технології та зміцнення позиції LG у глобальній екосистемі AI.

Kyung-Hoon Bae, президент LG AI Research, сказав: "Ми плануємо надати цю високо універсальну та легку модель як відкритий код, щоб університети та науково-дослідні установи могли використовувати останню генеративну технологію AI, яка сприяє дослідницькій екосистемі AI та ще більше покращує конкурентну здатність AI".

Підходить для цього:

Майбутні перспективи та постійні події

Chatexaone: Новий стандарт продуктивності на основі AI в компанії

LG планує співпрацювати з дочірніми компаніями LG у другій половині року, щоб інтегрувати Exaone глибоко в різні продукти та послуги. Залежно від програми, EXAONS буде доступний у різних розмірах моделі, від моделі Ultra-Light Weight для послуг на Device-Ki до високоефективної моделі для спеціалізованих програм.

Конкретним прикладом практичного застосування технології Exaone є Chatexaone, агент KI, заснований на Exaone 3.0 для компаній, які вже доступні як відкрита бета -версія для працівників групи LG. ChatexaOne пропонує різні функції для підвищення продуктивності праці, включаючи системи відповідей на основі ВЕБ на основі WEB, системи відповідей на основі питань, що базуються на зображенні, кодування підтримки та управління базами даних.

Подальший розвиток досвіду AI в групі LG

Розвиток Exaone Deep є частиною більшої стратегії AI у групі LG. LG вже створив внутрішню аспірантуру AI з метою сприяння індивідуальним інженерам з дев'ятимісячним магістром та 18-місячною докторською програмою.

Співробітники, які проходять ці курси, працюють над проектами, які важко розробити для окремих дочірніх підприємств. У рамках пілотного проекту LG Display розробив технологію дизайну для розміщення більшої кількості пікселів на одному екрані, тоді як LG Electronics та методи LG Innotek для точного прогнозу попиту з AI, що значно зменшить витрати на зберігання.

Чому менші моделі AI можуть бути кращим вибором-подивитися на Exaone Deep

З впровадженням Exaone Deep, дослідження LG AI досягли важливої ​​віхи в розвитку ШІ. Як перша модель AI в Південній Кореї на основі моделі фундаменту, LG розміщує її в ряді провідних глобальних технологічних компаній, які розробляють цю вдосконалену технологію AI. Вражаюча продуктивність у математичних, наукових та кодувальних орієнтирах з ефективним розміром моделі підкреслює потенціал цієї моделі для різних областей застосування.

Підхід LG особливо заслуговує на розробку високопродуктивних моделей AI з відносно невеликим розміром. Незважаючи на те, що багато компаній AI покладаються на все більші моделі, Exaone Deep показує, що з інтелектуальною оптимізацією та спеціалізованою підготовкою, менші моделі можуть досягти найвищих показників. Це могло не тільки запропонувати економічні переваги, але й забезпечити використання потужних моделей AI на Edge Devices.

Завдяки публікації з відкритим кодом Exaone Deep, LG AI Research сприяє глобальній дослідницькій екосистемі AI і в той же час зміцнює позицію Південної Кореї на міжнародній конкуренції ШІ. Залишається побачити, як ця технологія реалізована в різних продуктах та послугах групи LG та які інновації вона дозволить її в різних галузях.

Підходить для цього:

 

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑ Наша ділова мова - англійська чи німецька

☑ Нове: листування на вашій національній мові!

 

Цифровий піонер - Конрад Вольфенштейн

Конрад Вольфенштейн

Я радий бути доступним вам та моїй команді як особистого консультанта.

Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн xpert.digital

Я з нетерпінням чекаю нашого спільного проекту.

 

 

☑ Підтримка МСП у стратегії, порадах, плануванні та впровадженні

☑ Створення або перестановка цифрової стратегії та оцифрування

☑ Розширення та оптимізація міжнародних процесів продажів

☑ Глобальні та цифрові торгові платформи B2B

☑ Піонерський розвиток бізнесу / маркетинг / PR / Мір


Штучний інтелект (AI) -AI-блог, гаряча точка та контент-центрЦифровий інтелектxpaper