Опубліковано: 24 березня 2025 р. / Оновлення з: 24 березня 2025 р. - Автор: Конрад Вольфенштейн
Ant Group (Alibaba) досягає прориву AI: дешевші моделі за допомогою інноваційного комбінації чіпів: xpert.digital
Китайський технологічний прорив: моделі AI на 20 % більш економічно ефективні
Торговельний конфлікт сприяє технологічному прогресу в AI чіпах
Група Ant, дочірня компанія китайського технологічного гіганта Alibaba, оголосила про значний прорив у розробці моделей AI. З інноваційним поєднанням напівпровідників з китайського та американського виробництва, компанія вдається навчити свої моделі AI на 20 відсотків дешевше. Цей розвиток може мати далекосяжні наслідки для глобального ринку чіпів AI та зміцнення позиції Китаю у конкурсі технологій. Особливо примітно, що група ANT покладається на більш слабкі, але ефективні альтернативи високошвидкам мікросхем Nvidia, не приймаючи значної якості. На тлі це відбувається між США та Китаєм і є важливим кроком до більшої технологічної незалежності.
Підходить для цього:
Інноваційна стратегія чіпів Ant Group
Рішення, розроблене Ant Group, засноване на розумній суміші різних напівпровідникових типів. Замість того, щоб покладатися виключно на потужні, але дорогі чіпси NVIDIA H800, компанія зараз все частіше використовує більш економічні альтернативи від AMD та китайських виробників, таких як сама Alibaba та Huawei. Розробка цієї альтернативної стратегії чіпів була значно прискорена обмеженнями експорту США для високопродуктивних мікросхем до Китаю.
Для своїх навчальних моделей AI, група ANT використовує підхід «суміш експертів» (MOE), техніку, яка дозволяє великим мовним моделям більш ефективно тренуватися. За допомогою цього методу завдання поділяються на менші записи даних, щоб більш ефективно обробити їх - «подібно до використання команди експертів, яка зосереджена на певній частині проблеми з метою підвищення загальної ефективності». Цей підхід вже зарекомендував себе в інших компаніях, таких як Google та китайський стартап DeepSeek.
Технічні показники та порівняння з NVIDIA
Незважаючи на перехід на нібито слабкіші мікросхеми, група ANT стверджує, що досягає результатів, порівнянних з результатами апаратного забезпечення NVIDIA. Згідно з власними заявами, компанія змогла знизити витрати на навчання з трильйонного жетону з 6,35 мільйонів юанів (близько 810 000 євро) до 5,1 мільйона юанів. Це неабияке зниження витрат з такими ж продуктивністю може підвищити тиск на Nvidia, як домінуючий постачальник чіпів AI.
Нещодавно група ANT опублікувала дослідницьку роботу, в якій стверджує, що її моделі в певних орієнтирах можуть навіть перевищувати продуктивність моделей інших великих технологічних компаній, таких як META. Особливо в області китайських орієнтирів, власні мови моделі Ling-Lite та Ling-Plus призначені краще, ніж порівнянні моделі Deepseek.
Економічні ефекти та оптимізація витрат
Оптимізація витрат за допомогою альтернативних стратегій чіпів стає все більш важливою в галузі ШІ. Незважаючи на те, що ціни на обслуговування кінцевих клієнтів, такі як чатгпт, залишаються відносно стабільними, витрати в діапазоні B2B постійно зменшуються. Сама Alibaba вже знизила ціни на різні моделі AI минулого року, включаючи зниження цін на 85 відсотків за її зору тривалості QWEN-VL.
Ці витрати є частиною більшої тенденції в галузі ШІ, яка працює на різних факторах:
- Висока конкуренція між різними постачальниками, як у Китаї (Alibaba, Tencent, Baidu, JD, Huawei та Bytedance), а також Global
- Розробка менших, більш економічних моделей, які стають все більш потужними
- Нові методи, такі як дистиляція моделі, в яких знання великої моделі переносять у меншу
- Тиск витрат через численні з відкритим кодом або вільно доступні моделі, такі як сім'я Metas Llama
Зростаюче значення економічно ефективних моделей AI
Прорив, оголошений групою Ant, настає в той час, коли ефективність моделей AI все частіше зосереджується. У січні китайський стартап DeepSeek спричинив перемішування, коли він представив модель AI, яка пройшла навчання зі значно нижчими ресурсами, ніж попередні моделі. Цей розвиток навіть призвів до різкого зниження ціни акцій NVIDIA.
Однак генеральний директор NVIDIA Дженсен Хуан стверджує, що фактична потреба в арифметичній здатності створюється не під час навчання, а скоріше при створенні відповідей. Тим не менш, підхід Ant Group показує, що значна економія витрат також можлива в галузі навчання ШІ.
Підходить для цього:
Геополітичний сенс та технологічний суверенітет
Розвиток групи ANT має значний геополітичний вимір. Суворі обмеження експорту США на високопродуктивних мікросхемах все більше спонукали китайські компанії шукати альтернативи американській технології. У грудні 2023 року міністр США торгівлі Джина Раймондо дав зрозуміти, що чіпси AI не повинні доставляти до Китаю в сучасному стані мистецтва і що китайській промисловості не слід дозволити її виробляти сам.
У цьому контексті стратегія чіпів Ant Group є важливим кроком до більшої технологічної незалежності. Роберт Леа, старший аналітик компанії Bloomberg Intelligence, зазначив, що, якщо це підтвердило, оволодів експортним контролем на мікросхем Nvidia ».
Вплив на глобальну технологічну конкуренцію
Китай не тільки докладає великих зусиль у сфері електромобілів, але і в ШІ, щоб дістатися до лідера світового ринку. Інноваційний підхід групи ANT може слугувати моделлю для інших китайських компаній, які повинні діяти у все більш складному геополітичному середовищі. Можливість доступу до різних технологій гнучко може виявитися вирішальною конкурентною перевагою.
Нещодавні розробки показують, що Китай досяг значного прогресу в районі ШІ, незважаючи на обмеження США. Подібно до групи ANT, DeepSeek також довів свою модель R1, що ви можете досягти подібних послуг, таких як OpenAis Chat зі старим обладнанням та лише часткою бюджету.
Більш широкі наслідки для світового ринку ШІ
Прорив, оголошений групою Ant Group, може мати далекосяжний вплив на глобальний ринок ШІ. Цінова війна постачальників AI триває в Китаї місяцями. Тригер стала публікація "V2", попередника поточного AI "V3" Deepseek. У відповідь на це Alibaba та інші технологічні групи, такі як Baidu та Tencent, знизили ціни на використання відповідних програм AI до 97 відсотків.
Ціновий тиск та оптимізація в глобальному контексті
Ціновий тиск у районі ШІ не обмежується Китаєм. Західні компанії, як Google, також почали оптимізувати свої моделі AI та знижувати ціни. Наприклад, Google знизив ціни на свої Gemini 1,5 на модель для вхідних та виведених жетонів більш ніж на 50 відсотків у вересні 2024 року.
Розробки в групі ANT та інших китайських компаній можуть збільшити цю глобальну тенденцію. Особливо цікаво, що дешевші моделі не обов'язково повинні бути менш ефективними. Google повідомляє, наприклад, про значну продуктивність збільшується в його оптимізованих моделях, особливо в сферах математики (20 -відсоткове вдосконалення), тривалий контекст та бачення.
Ще один перелом у розвитку AI з Китаю?
Прорив, оголошений групою ANT, може відзначити важливий перелом у розвитку ШІ. Здатність тренувати ефективні моделі AI з більш рентабельними мікросхемами може кинути виклик домінуванням NVIDIA на ринку чіпів AI та сприяти демократизації технологій AI.
Цей розвиток також показує, як компанії можуть зміцнити свої позиції в динамічному та складному ринковому середовищі за допомогою інноваційних підходів та стратегічних партнерств. Використання диверсифікованої основи мікросхеми може бути способом освоїти проблеми глобальних ланцюгів поставок і в той же час зменшити витрати на розробку.
На майбутнє залишається зрозуміти, чи будуть інші компанії дотримуватися прикладу групи ANT та розробляти подібні стратегії. Здатність тренувати моделі AI може бути вирішальною конкурентною перевагою на все більш конкурентоспроможному ринку і в кінцевому рахунку забезпечити доступ до технологій AI для більш широкого кола організацій та додатків.
Підходить для цього:
Ваш глобальний партнер з маркетингу та розвитку бізнесу
☑ Наша ділова мова - англійська чи німецька
☑ Нове: листування на вашій національній мові!
Я радий бути доступним вам та моїй команді як особистого консультанта.
Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн ∂ xpert.digital
Я з нетерпінням чекаю нашого спільного проекту.