
A Baidu új mesterséges intelligencia alapú modelljeivel, az Ernie 4.5-tel és az Ernie X1-gyel támad: a Deepseekhez hasonlóak, de féláron – Kép: Xpert.Digital
Ernie 4.5 és X1: A Baidu új mesterséges intelligencia modelljei új mércét állítanak fel
A Baidu új AI-modelljei, az Ernie 4.5 és az X1: Erősek, féláron
2025. március 16-án a Baidu két új MI-modellt mutatott be, amelyek felforgathatják a kiélezett kínai és globális MI-piacot. A belépő szintű Ernie 4.5 modellel és a logikai fókuszú Ernie X1-gyel a kínai technológiai óriás agresszív árképzési stratégiát folytat, miközben nagy teljesítményt ígér. Különösen figyelemre méltó az az állítás, hogy az Ernie X1 ugyanazt a teljesítményt nyújtja majd, mint a sikeres DeepSeek R1, fele áron. Továbbá a Baidu azt tervezi, hogy még idén nyílt forráskódú megoldásként is kiadja modelljeit, ami tovább fokozhatja a versenyt.
Alkalmas:
- A DeepSeek mesterséges intelligencia integrálása a Tencent Weixin/WeChat és a Baidu kínai keresőmotorjába
Az új Ernie generáció: Műszaki jellemzők és képességek
Ernie 4.5: A multimodális zászlóshajó
A Baidu szerint az Ernie 4.5 a vállalat első „natívan multimodális” nyelvi modellje, amelyet kifejezetten különféle adattípusok, például szöveg, kép, hang és videó feldolgozására és megértésére terveztek. Ez a multimodális integrációs képesség jelentős előrelépést jelent a mesterséges intelligencia fejlesztésében, és új alkalmazási lehetőségeket nyit meg.
A modell állítólag „kiváló multimodális megértési képességekkel”, valamint továbbfejlesztett nyelvi, generálási, logikai és memória funkciókkal rendelkezik. Különleges jellemzője a magas „érzelmi kvóciense” (EQ), amelynek célja, hogy lehetővé tegye a mémek és a szatirikus tartalmak megértését – ezt a képességet korábban elsősorban a nyugati mesterséges intelligencia modelleknek, például a ChatGPT-nek tulajdonították.
A Baidu szerint öt technológiai újítás áll az Ernie 4.5 lenyűgöző képességeinek hátterében: a „FlashMask” dinamikus figyelemmaszkolás a hatékonyabb adatfeldolgozásért, a heterogén multimodális szakértői keverék a különböző tartalomtípusok speciális feldolgozásáért, a térbeli és időbeli reprezentáció tömörítése a térbeli és időbeli információk optimalizálásáért, a tudásközpontú betanítási adatkonstrukció, valamint az önvisszacsatolással továbbfejlesztett utólagos betanítás.
Ernie X1: A specializált gondolkodó
Az Ernie X1-et „multimodális képességekkel rendelkező mély gondolkodású modellként” tervezték, és a logikus gondolkodásra specializálódott. Jellemzői az „erősebb megértés, tervezés, reflexió és evolúciós képességek”. A Baidu első „gondolkodási modelljeként” az Ernie X1 egy átfogó eszközkészletet támogat, amely kiterjeszti a funkcionalitását.
Az Ernie X1 technikai alapjai számos fejlett technológián alapulnak, beleértve a progresszív megerősítéses tanulási módszert és az end-to-end képzési megközelítést. Ez a strukturált tanulási megközelítés úgy lett kialakítva, hogy segítse a modell fokozatos fejlődését és teljesítményének folyamatos növelését.
A versenytársakhoz képest: vágy és valóság
Ernie X1 vs. DeepSeek R1
A Baidu agresszíven pozicionálja az Ernie X1-et a DeepSeek R1-gyel, Kína egyik legsikeresebb mesterséges intelligencia modelljével szemben. A Baidu szerint az Ernie X1 „ugyanolyan teljesítményt” nyújt, mint a DeepSeek R1, de „fele annyiért”. Ez egy figyelemre méltó állítás, tekintve a DeepSeek R1 hírnevét az összetett feladatokban való erősségéről.
A DeepSeek R1 a múltban lenyűgöző eredményeket ért el számos benchmarkban, és közvetlenül versenyez az OpenAI o1 modelljeivel. Az olyan matematikai benchmarkokban, mint az AIME 2024, a DeepSeek R1 79,8%-ot ért el, közvetlenül megelőzve az OpenAI o1-1217 79,2%-át. A MATH-500-on még 97,3%-ot is elért, ami kissé meghaladja az OpenAI o1-1217 96,4%-át. A DeepSeek R1 a programozási feladatokban és az általános tudásteszteken is erős teljesítményt mutat.
Azt, hogy az Ernie X1 valóban képes-e elérni ezeket a teljesítményszinteket, egyelőre nem lehet függetlenül ellenőrizni. A Baidu még nem tett közzé benchmark eredményeket az új gondolkodásmódjára vonatkozóan.
Ernie 4.5 vs. GPT-4.5
A Baidu még tovább megy az Ernie 4.5-tel, azt állítva, hogy a modell számos benchmarkban felülmúlja a GPT-4.5-öt és a DeepSeek V3-at. Állítólag különösen a multimodális feladatokban és a logikai gondolkodásban jeleskedik. Azonban hiányoznak azok a független tesztek és összehasonlítások, amelyek megerősíthetnék ezeket az állításokat.
Agresszív árképzési stratégia: A költségelőny részletesen
A kínai verseny erőssége miatt a Baidu agresszív árképzési stratégiát folytat, amely mind a magánfelhasználókat, mind a vállalkozásokat célozza meg.
Ingyenes magánhasználatra
Mindkét modell ingyenesen elérhető a magánfelhasználók számára. A hozzáférés a hivatalos ERNIE boton keresztül történik, és még korábban is, mint eredetileg tervezték. Ez a stratégia a felhasználói bázis gyors bővítését és a versenytársak, például a ByteDance és a DeepSeek utolérését célozza.
Verhetetlen árak üzleti ügyfelek számára
A Baidu rendkívül versenyképes áron kínálja modelljeit vállalati ügyfeleinek:
- Ernie 4.5: 0,55 dollár millió tokenenként a bemenetért, 2,20 dollár a kimenetért
- Ernie X1: 0,28 dollár millió tokenenként a bemenetért, 1,10 dollár a kimenetért
Összehasonlításképpen: a DeepSeek R1 megvásárlása 0,55 dollárba, kibocsátása pedig 2,19 dollárba kerül millió tokenenként. Az Ernie X1 tehát valójában körülbelül feleannyiba kerül, mint a DeepSeek R1, legalábbis a kibocsátási költségek tekintetében.
Még drámaibb az árkülönbség a GPT-4.5-höz képest, amely állítólag 75 dollárba kerül millió bemeneti tokenenként és 150 dollárba millió kimeneti tokenenként. Az Ernie 4.5 tehát csak körülbelül 1%-kal drágább, mint a GPT-4.5. Ez a szélsőséges árkülönbség jelentős versenyelőnyt jelenthet, feltéve, hogy a teljesítményígéretek teljesülnek.
Alkalmas:
- Németország most vezető technológiai ország vagy sem? Magyarázati kísérlet, különösen a mesterséges intelligencia (AI) példáján keresztül
Nyílt forráskódú stratégia és elérhetőség
Korai kezdés és széles körű hozzáférhetőség
A Baidu a tervezettnél korábban tette elérhetővé új modelljeit. Az eredetileg áprilisra bejelentett modellek már elérhetők az ERNIE Boton keresztül. A vállalkozások számára az Ernie 4.5 és az X1 API-kon keresztül érhető el a Baidu AI Cloud MaaS platformján, a Qianfanon.
Nyílt forráskódú tervek 2025 júniusára
Stratégiai váltásként a Baidu azt tervezi, hogy 2025. június 30-tól nyílt forráskódú megoldásként kiadja az Ernie 4.5 sorozatát. Robin Li vezérigazgató, aki régóta a saját fejlesztésű modellek mellett áll, ezt a lépést azzal indokolja, hogy a nyílt forráskód felgyorsítja a technológia elterjedését. Jelenleg nem világos, hogy ez az X1 sorozatra is vonatkozik-e, de valószínűnek tűnik, tekintve, hogy a DeepSeek R1 szintén elérhető nyílt forráskódú modellként.
A Baidu visszatér a mesterséges intelligencia versenyébe
Kihívásokkal teli piaci pozíció
A Baidu volt az első kínai technológiai vállalat, amely 2023 márciusában elindított egy nagyszabású nyelvi modellt (LLM). E korai kezdés ellenére a Baidu lemaradt olyan versenytársak mögött, mint az Alibaba, a ByteDance, és különösen a DeepSeek meglepetéssikerének köszönhetően.
A felhasználói számok magukért beszélnek: a ByteDance chatbotja, a Doubao rendelkezik a legtöbb havi aktív felhasználóval Kínában 78,6 millióval, ezt követi a DeepSeek 33,7 millióval, míg a Baidu Ernie Botja messze lemarad 13 millióval.
Stratégiai jelentőség és globális hatás
Az új modellek bevezetése egy felzárkózó stratégia része. Agresszív árképzési stratégiájával és tervezett nyílt forráskódú kiadásaival a Baidu nemcsak visszanyerheti a pozícióját a kínai piacon, hanem növelheti a nyugati mesterséges intelligencia laboratóriumokra nehezedő nyomást is.
Az úgynevezett „mélykeresési pillanat” – annak bizonyítéka, hogy egy kínai MI-laboratórium kevesebb erőforrással is képes elérni a nyugati szolgáltatókéhoz hasonló teljesítményt – máris nyugtalanságot keltett az iparágban. Ezt bizonyítják az Anthropic és az OpenAI MI-laboratóriumok amerikai kormányhoz intézett, a közelmúltban írt levelei, amelyekben a kínai MI szabályozását szorgalmazzák.
Lehetséges és nyitott kérdések
A Baidu új MI-modelljei jelentősen megváltoztathatják a globális MI-piac dinamikáját, különösen az erős teljesítményígéret, az agresszív árazás és a tervezett nyílt forráskódú elérhetőség kombinációján keresztül. Azonban az, hogy az Ernie X1 valóban versenyre kelhet-e a DeepSeek R1-gyel, és hogy az Ernie 4.5 egyáltalán felülmúlja-e a GPT-4.5-öt, még várat magára, és független tesztelésnek kell megerősítenie.
A bejelentés rávilágít a kínai és nyugati mesterséges intelligencia szolgáltatók közötti fokozódó versenyre, és a fejlett mesterséges intelligencia technológiák szélesebb körű elérhetőségéhez és alacsonyabb árakhoz vezethet. Ugyanakkor a Baidu nyílt forráskódú megközelítése alapvetően megváltoztathatja a globális mesterséges intelligencia környezetet, és tovább felgyorsíthatja az innováció ütemét.
A felhasználók és a vállalkozások számára az új modellek potenciálisan költséghatékony alternatívát kínálhatnak a már meglévő szolgáltatásokkal szemben, bár a gyakorlati teljesítményük még várat magára. Az elkövetkező hónapok fogják megmutatni, hogy a Baidu valóban képes-e megismételni a DeepSeek sikerét az új technológiájával, és visszaszerezni az elvesztett piaci részesedését.
Alkalmas:
Az Ön globális marketing- és üzletfejlesztési partnere
☑️ Üzleti nyelvünk angol vagy német
☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!
Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.
Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein ∂ xpert.digital
Nagyon várom a közös projektünket.

