
Baidu атакує зі своїми новими моделями штучного інтелекту Ernie 4.5 та Ernie X1: порівнянні з Deepseek, але за половину ціни – Зображення: Xpert.Digital
Ernie 4.5 та X1: Нові моделі штучного інтелекту від Baidu встановлюють нові стандарти
Нові моделі штучного інтелекту Baidu Ernie 4.5 та X1: потужні за половину ціни
16 березня 2025 року Baidu представила дві нові моделі штучного інтелекту, які можуть сколихнути жорстко конкурентний китайський та світовий ринок штучного інтелекту. З моделлю початкового рівня Ernie 4.5 та орієнтованою на логіку Ernie X1 китайський технологічний гігант проводить агресивну цінову стратегію, обіцяючи водночас високу продуктивність. Особливої уваги заслуговує твердження, що Ernie X1 пропонуватиме таку ж продуктивність, як і успішний DeepSeek R1, за вдвічі меншою ціною. Крім того, Baidu планує випустити свої моделі як рішення з відкритим кодом пізніше цього року, що може ще більше загострити конкуренцію.
Підходить для цього:
Нове покоління Ernie: Технічні характеристики та можливості
Ernie 4.5: Мультимодальний флагман
За даними Baidu, Ernie 4.5 — це перша «нативна мультимодальна» мовна модель компанії, спеціально розроблена для обробки та розуміння різних типів даних, таких як текст, зображення, аудіо та відео. Ця можливість мультимодальної інтеграції є значним прогресом у розробці штучного інтелекту та відкриває нові можливості застосування.
Кажуть, що модель має «відмінні можливості мультимодального розуміння», а також покращені функції мови, генерації, логіки та пам’яті. Особливістю є її високий «емоційний коефіцієнт» (EQ), який покликаний дозволити їй розуміти меми та сатиричний контент – здатність, яку раніше приписували переважно західним моделям штучного інтелекту, таким як ChatGPT.
Згідно з Baidu, вражаючі можливості Ernie 4.5 забезпечені п'ятьма технологічними інноваціями: динамічне маскування уваги «FlashMask» для ефективнішої обробки даних, гетерогенна мультимодальна суміш експертів для спеціалізованої обробки різних типів контенту, просторово-часове стиснення представлень для оптимізації просторової та часової інформації, побудова навчальних даних, орієнтована на знання, та покращений самозворотний зв'язок після навчання.
Ерні X1: Спеціалізований мислитель
Ernie X1 розроблена як «модель глибокого мислення з мультимодальними можливостями» та спеціалізується на логічному мисленні. Вона характеризується «кращим розумінням, плануванням, рефлексією та еволюційними здібностями». Як перша «модель мислення» Baidu, Ernie X1 підтримує комплексний набір інструментів, що розширюють її функціональність.
Технічні основи Ernie X1 базуються на кількох передових технологіях, включаючи метод прогресивного навчання з підкріпленням та підхід до наскрізного навчання. Цей структурований підхід до навчання розроблений, щоб допомогти моделі поступово вдосконалюватися та постійно підвищувати свою продуктивність.
Порівняно з конкуренцією: прагнення та реальність
Ernie X1 проти DeepSeek R1
Baidu агресивно позиціонує Ernie X1 проти DeepSeek R1, однієї з найуспішніших моделей штучного інтелекту в Китаї. За словами Baidu, Ernie X1 пропонує «таку ж продуктивність», як і DeepSeek R1, але за «вдвічі меншу вартість». Це чудове твердження, враховуючи репутацію DeepSeek R1 за його потужність у складних завданнях.
DeepSeek R1 у минулому досяг вражаючих результатів у різних бенчмарках і безпосередньо конкурує з моделями OpenAI o1. У математичних бенчмарках, таких як AIME 2024, DeepSeek R1 досяг 79,8%, трохи випередивши OpenAI o1-1217 з 79,2%. У MATH-500 він навіть набрав 97,3%, трохи вище OpenAI o1-1217 з 96,4%. DeepSeek R1 також демонструє високу продуктивність у завданнях програмування та тестах на загальні знання.
Чи справді Ernie X1 може досягти цих рівнів продуктивності, поки що неможливо незалежно перевірити. Baidu ще не опублікував жодних результатів бенчмарків для своєї нової моделі мислення.
Ерні 4.5 проти GPT-4.5
Baidu йде ще далі з Ernie 4.5, стверджуючи, що модель перевершує GPT-4.5 та DeepSeek V3 у кількох бенчмарках. Кажуть, що вона особливо добре працює в мультимодальних завданнях та логічних міркуваннях. Однак незалежних тестів та порівнянь, які могли б підтвердити ці твердження, бракує.
Агресивна цінова стратегія: детальний огляд переваги у вартості
З огляду на жорстку конкуренцію в Китаї, Baidu проводить агресивну цінову стратегію, спрямовану як на приватних користувачів, так і на бізнес.
Безкоштовно для приватного використання
Обидві моделі доступні приватним користувачам безкоштовно. Доступ здійснюється через офіційного бота ERNIE, і навіть раніше, ніж планувалося спочатку. Ця стратегія спрямована на швидке розширення бази користувачів та наздоганяння конкурентів, таких як ByteDance та DeepSeek.
Неперевершені ціни для бізнес-клієнтів
Baidu пропонує свої моделі корпоративним клієнтам за надзвичайно конкурентними цінами:
- Ерні 4.5: $0.55 за мільйон токенів на вхід, $2.20 на вихід
- Ernie X1: $0,28 за мільйон токенів на вхід, $1,10 на вихід
Для порівняння: DeepSeek R1 коштує $0,55 за купівлю та $2,19 за випуск за мільйон токенів. Таким чином, Ernie X1 фактично приблизно вдвічі дорожчий за DeepSeek R1, принаймні з точки зору вартості випуску.
Ще більш разючою є різниця в ціні порівняно з GPT-4.5, який, за повідомленнями, коштує 75 доларів за мільйон вхідних токенів і 150 доларів за мільйон вихідних токенів. Таким чином, Ernie 4.5 лише приблизно на 1% дорожчий за GPT-4.5. Ця величезна різниця в ціні може становити значну конкурентну перевагу за умови виконання обіцянок щодо продуктивності.
Підходить для цього:
- Зараз Німеччина є провідною технологічною країною чи ні? Спроба пояснити особливо використання штучного інтелекту (AI)
Стратегія та доступність відкритого коду
Ранній початок та широка доступність
Baidu зробив свої нові моделі доступними раніше, ніж планувалося. Спочатку анонсовані на квітень, вони вже доступні через бота ERNIE. Для бізнесу Ernie 4.5 та X1 доступні через API на платформі MaaS від Baidu AI Cloud, Qianfan.
Плани щодо відкритого коду на червень 2025 року
У рамках стратегічного зрушення Baidu планує випустити свою серію Ernie 4.5 як рішення з відкритим кодом, починаючи з 30 червня 2025 року. Генеральний директор Робін Лі, який давно виступає за власницькі моделі, виправдовує цей крок тим, що відкритий код прискорює впровадження технології. Чи стосується це також серії X1, наразі неясно, але це виглядає ймовірним, враховуючи, що DeepSeek R1 також доступний як модель з відкритим кодом.
Повернення Baidu у змагання зі штучного інтелекту
Складна позиція на ринку
Baidu була першою китайською технологічною компанією, яка запустила модель великої мови програмування (LLM) у березні 2023 року. Незважаючи на такий ранній старт, Baidu відстає від таких конкурентів, як Alibaba, ByteDance, і особливо від несподіваного успіху DeepSeek.
Кількість користувачів говорить сама за себе: чат-бот ByteDance Doubao має найбільшу кількість щомісячно активних користувачів у Китаї – 78,6 мільйона, за ним йде DeepSeek з 33,7 мільйонами, тоді як Ernie Bot від Baidu значно відстає з 13 мільйонами.
Стратегічне значення та глобальний вплив
Запуск нових моделей є частиною стратегії наздоганяння. Завдяки своїй агресивній ціновій стратегії та запланованим випускам програмного забезпечення з відкритим кодом, Baidu може не лише повернути собі позиції на китайському ринку, але й посилити тиск на західні лабораторії штучного інтелекту.
Так званий «момент глибокого пошуку» — демонстрація того, що китайська лабораторія штучного інтелекту може досягти аналогічної продуктивності, як і західні постачальники, маючи менші ресурси, — вже викликала занепокоєння в галузі. Про це свідчать нещодавні листи лабораторій штучного інтелекту Anthropic та OpenAI до уряду США, в яких вони закликають до регулювання штучного інтелекту з боку Китаю.
Потенційні та відкриті питання
Нові моделі штучного інтелекту від Baidu можуть суттєво змінити динаміку світового ринку штучного інтелекту, зокрема завдяки поєднанню обіцянок високої продуктивності, агресивного ціноутворення та запланованої доступності програмного забезпечення з відкритим вихідним кодом. Однак, чи зможе Ernie X1 справді конкурувати з DeepSeek R1, і чи перевершить Ernie 4.5 навіть GPT-4.5, ще належить з'ясувати, і це має бути підтверджено незалежним тестуванням.
Це оголошення підкреслює зростаючу конкуренцію між китайськими та західними постачальниками штучного інтелекту та може призвести до ширшої доступності та зниження цін на передові технології штучного інтелекту. Водночас, підхід Baidu до відкритого коду може докорінно змінити світовий ландшафт штучного інтелекту та ще більше пришвидшити темпи інновацій.
Для користувачів і бізнесу нові моделі потенційно пропонують економічно ефективну альтернативу усталеним сервісам, хоча їхня фактична ефективність на практиці ще належить з'ясувати. Найближчі місяці покажуть, чи зможе Baidu справді повторити успіх DeepSeek за допомогою своєї нової технології та повернути втрачену частку ринку.
Підходить для цього:
Ваш глобальний партнер з маркетингу та розвитку бізнесу
☑ Наша ділова мова - англійська чи німецька
☑ Нове: листування на вашій національній мові!
Я радий бути доступним вам та моїй команді як особистого консультанта.
Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн ∂ xpert.digital
Я з нетерпінням чекаю нашого спільного проекту.

