Ikona webové stránky Xpert.Digital

AMI – Pokročilá strojová inteligence – Konec škálování: Proč Yann LeCun už nevěří v LLM

AMI - Pokročilá strojová inteligence – Konec škálování: Proč Yann LeCun už nevěří v LLM

AMI – Pokročilá strojová inteligence – Konec škálování: Proč Yann LeCun už nevěří v LLM – Obrázek: Xpert.Digital

Slepá ulička místo superinteligence: Proč hlavní vizionář Mety nyní končí

600 miliard za chybný přístup? „Kmotr umělé inteligence“ sází proti LLaMA, ChatGPT a spol.

Toto oznámení přišlo technologickým průmyslem v listopadu 2025 jako blesk. Yann LeCun, jeden ze tří zakladatelů hlubokého učení a hlavní vědecký pracovník společnosti Meta, oznámil svůj odchod po dvanácti letech ve společnosti, aby založil vlastní startup. Toto rozhodnutí je mnohem víc než jen osobní kariérní volbou jednoho vědce. Znamená zásadní zlom v globálním průmyslu umělé inteligence a odhaluje rostoucí propast mezi krátkodobými tržními zájmy a dlouhodobou vědeckou vizí.

LeCun, který v roce 2018 získal Turingovu cenu spolu s Geoffreyem Hintonem a Yoshuou Bengiem, je považován za architekta konvolučních neuronových sítí, které dnes tvoří základ moderních systémů pro zpracování obrazu. Jeho odchod přichází v době, kdy celé odvětví investuje stovky miliard dolarů do velkých jazykových modelů, což je technologie, kterou LeCun již léta označuje za zásadní slepou uličku. Ve své nové společnosti hodlá nyní 65letý vědec sledovat to, co nazývá Advanced Machine Intelligence (Pokročilá strojová inteligence), radikálně odlišný přístup založený na světových modelech a vycházející z fyzického vnímání, nikoli z textu.

Ekonomické důsledky tohoto vývoje jsou obrovské. Samotná společnost Meta investovala v posledních třech letech do infrastruktury umělé inteligence přes 600 miliard dolarů. OpenAI dosáhla hodnoty půl bilionu dolarů, a to i přes roční tržby pouhých deseti miliard dolarů. Celé odvětví se vydalo směrem, který jeden z jeho nejvýznamnějších průkopníků nyní veřejně označil za slepou uličku. Abychom pochopili ekonomické důsledky tohoto posunu, je třeba se hlouběji ponořit do technických, organizačních a finančních struktur současné revoluce umělé inteligence.

Vhodné pro:

Architektura bubliny

Architektura Transformer, kterou v roce 2017 představili výzkumníci z Googlu, transformovala prostředí umělé inteligence nebývalým tempem. Tento přístup poprvé umožnil efektivně zpracovávat obrovské množství textu a trénovat jazykové modely s dříve nedosažitelnými možnostmi. OpenAI na tomto základě stavěla svou řadou GPT, která v listopadu 2022 s ChatGPT poprvé demonstrovala širokému publiku, čeho tyto technologie dokážou. Reakce byla explozivní. Během několika měsíců do tohoto sektoru proudily desítky miliard dolarů.

Od konce roku 2024 se však objevuje stále více známek, že tento exponenciální vývoj dosahuje svých limitů. OpenAI vyvíjí nástupce GPT-4, interně označovaného jako Orion nebo GPT-5, již více než 18 měsíců. Společnost údajně provedla nejméně dva velké tréninkové běhy, z nichž každý stál přibližně 500 milionů dolarů. Výsledky byly znepokojivé. Zatímco GPT-4 představoval masivní výkonnostní skok oproti GPT-3, vylepšení Orionu oproti GPT-4 jsou marginální. V některých oblastech, zejména v programování, model nevykazuje prakticky žádný pokrok.

Tento vývoj zásadně odporuje zákonům škálování, empirickým principům, které donedávna řídily celé odvětví. Základní myšlenka byla jednoduchá: pokud zvětšíte model, použijete více dat pro trénování a investujete více výpočetního výkonu, zvýšení výkonu se řídí předvídatelnou mocninnou funkcí. Zdálo se, že tento princip platí univerzálně a ospravedlňuje astronomické investice posledních let. Nyní se ukazuje, že se tyto křivky zplošťují. Další zdvojnásobení investic již nepřináší očekávané zdvojnásobení výkonu.

Důvodů je mnoho a jsou technicky složité. Klíčovým problémem je datová zeď. GPT-4 byl trénován s přibližně 13 biliony tokenů, což v podstatě představuje celý veřejně dostupný internet. Pro GPT-5 jednoduše není dostatek nových, vysoce kvalitních dat. OpenAI reagovala najmutím softwarových vývojářů, matematiků a teoretických fyziků, aby generovali nová data psaním kódu a řešením matematických problémů. I kdyby však 1 000 lidí denně produkovalo 5 000 slov, trvalo by měsíce vygenerovat pouhou miliardu tokenů. Škálování pomocí dat generovaných člověkem jednoduše nefunguje.

Alternativně se firmy stále více spoléhají na syntetická data – tedy data generovaná jinými modely umělé inteligence. Zde však číhá nové nebezpečí: kolaps modelu. Když jsou modely rekurzivně trénovány na datech generovaných jinými modely, malé chyby se v průběhu generací násobí. Výsledkem jsou modely, které se stále více oddělují od reality a v nichž menšinové skupiny v datech neúměrně mizí. Studie publikovaná v Nature v roce 2024 ukázala, že tento proces probíhá překvapivě rychle. Syntetická data proto nejsou všelékem, ale spíše nesou značná rizika.

Energetická transformace a limity růstu

Kromě datové bariéry existuje druhá, ještě zásadnější bariéra: energetická bariéra. Trénink GPT-3 spotřeboval přibližně 1 300 megawatthodin elektřiny, což odpovídá roční spotřebě 130 amerických domácností. GPT-4 vyžadoval odhadem 50krát více, tedy 65 000 megawatthodin. Výpočetní výkon potřebný k trénování velkých modelů umělé inteligence se zdvojnásobuje zhruba každých 100 dní. Tato exponenciální křivka rychle vede k fyzickým omezením.

Datová centra, která tyto modely školí a provozují, již spotřebovávají tolik elektřiny jako malá města. Mezinárodní energetická agentura předpovídá, že spotřeba elektřiny v datových centrech se do roku 2026 zvýší o 80 procent, z 20 terawatthodin v roce 2022 na 36 terawatthodin v roce 2026. Hlavním motorem tohoto růstu je umělá inteligence. Pro srovnání, jeden dotaz ChatGPT spotřebuje asi desetkrát více energie než vyhledávání na Googlu. S miliardami dotazů denně se to sčítá do obrovských množství.

Tento vývoj nutí technologické společnosti k drastickým opatřením. Microsoft již podepsal smlouvy s dodavateli jaderné energie. Meta, Amazon a Google v nadcházejících letech investují dohromady přes 1,3 bilionu dolarů do vybudování nezbytné infrastruktury. Tyto investice však narážejí na fyzické a politické limity. USA jednoduše nemají dostatek energetické infrastruktury k napájení plánovaných datových center umělé inteligence. Analytici odhadují, že projekty v hodnotě 750 miliard dolarů by se mohly do roku 2030 zpozdit kvůli úzkým hrdlům energetické infrastruktury.

K tomu se přidává geopolitický rozměr. Energetická náročnost odvětví umělé inteligence zostřuje konkurenci o zdroje a zvyšuje závislost na fosilních palivech. Zatímco tvůrci politik požadují klimatickou neutralitu, odvětví umělé inteligence zvyšuje spotřebu energie. Toto napětí se v nadcházejících letech zhorší a může vést k regulačním zásahům, které omezí růst odvětví.

Architektonická zeď a LeCunova alternativa

Třetí bariéra je možná tou nejzásadnější: architektonická zeď. Yann LeCun již léta tvrdí, že architektura Transformeru má inherentní omezení, která nelze překonat pouhým škálováním. Jeho kritika se zaměřuje na základní způsob fungování modelů velkých jazyků (Large Language Models). Tyto systémy jsou trénovány k předpovídání dalšího slova v sekvenci. Učí se statistické vzorce v masivních textových korpusech, ale nerozvíjejí skutečné pochopení kauzality, fyzikálních zákonů ani dlouhodobého plánování.

LeCun rád ilustruje problém srovnáním: Čtyřleté dítě vstřebalo prostřednictvím vizuálního vnímání více informací o světě než ty nejlepší jazykové modely prostřednictvím textu. Dítě intuitivně chápe, že předměty jen tak nezmizí, že těžké věci padají a že činy mají následky. Vyvinulo si model světa, vnitřní reprezentaci fyzické reality, kterou používá k vytváření předpovědí a plánování akcí. LLM postrádá tuto základní schopnost. Dokážou generovat působivě souvislý text, ale světu nerozumí.

Toto omezení se v praktických aplikacích opakovaně projevuje. Pokud požádáte GPT-4, aby si vizualizoval rotující krychli, selže v úkolu, který zvládne snadno každé dítě. U složitých úkolů vyžadujících vícekrokové plánování modely pravidelně selhávají. Nemohou se spolehlivě učit z chyb, protože každá chyba v predikci tokenů se potenciálně hromadí a zesiluje. Autoregresní modely mají zásadní křehkost: chyba na začátku sekvence může zničit celý výsledek.

LeCunovou alternativou jsou modely světa založené na architektuře Joint Embedding Predictive Architecture. Základní myšlenkou je, že systémy umělé inteligence by se neměly učit prostřednictvím predikce textu, ale spíše predikcí abstraktních reprezentací budoucích stavů. Místo generování pixel po pixelu nebo token po tokenu se systém učí komprimovanou, strukturovanou reprezentaci světa a může ji použít k mentální simulaci různých scénářů předtím, než začne jednat.

Pod LeCunovým vedením již společnost Meta vyvinula několik implementací tohoto přístupu. I-JEPA pro obrázky a V-JEPA pro videa vykazují slibné výsledky. Tyto modely se učí komponenty objektů na vysoké úrovni a jejich prostorové vztahy, aniž by se spoléhaly na intenzivní sběr dat. Jejich trénování je také výrazně energeticky efektivnější než konvenční modely. Vizí je zkombinovat tyto přístupy do hierarchických systémů, které mohou fungovat na různých úrovních abstrakce a časových měřítcích.

Zásadní rozdíl spočívá v povaze procesu učení. Zatímco LLM v podstatě provádí porovnávání vzorů na steroidech, světové modely se snaží pochopit strukturu a kauzalitu reality. Systém s robustním světovým modelem by mohl předvídat důsledky svých akcí, aniž by je musel skutečně provádět. Mohl by se učit z několika příkladů, protože chápe základní principy, nejen povrchní korelace.

Organizační dysfunkce a Metova existenční krize

LeCunův odchod však není pouze vědeckým rozhodnutím, ale také výsledkem organizační dysfunkce ve společnosti Meta. V červnu 2025 generální ředitel Mark Zuckerberg oznámil masivní restrukturalizaci divizí umělé inteligence. Založil Meta Superintelligence Labs, novou jednotku s deklarovaným cílem vyvíjet obecnou umělou inteligenci. V jejím čele stál Alexandr Wang, 28letý bývalý generální ředitel společnosti Scale AI, která se zabývá přípravou dat. Meta investovala do Scale AI 14,3 miliardy dolarů a najala přes 50 inženýrů a výzkumníků od konkurence.

Toto rozhodnutí obrátilo stávající strukturu vzhůru nohama. LeCunův tým pro základní výzkum umělé inteligence, který strávil roky vývojem PyTorch a prvních modelů Llama, byl marginalizován. FAIR se zaměřoval na základní výzkum s pětiletým až desetiletým časovým horizontem, zatímco nové laboratoře superinteligence se zaměřovaly na krátkodobý vývoj produktů. Zdroje uvádějí rostoucí chaos v odděleních umělé inteligence společnosti Meta. Nově najatí špičkoví talenti vyjádřili frustraci z byrokracie velké korporace, zatímco zavedené týmy zaznamenaly slábnoucí vliv.

Situace se zhoršila kvůli několika restrukturalizacím během pouhých šesti měsíců. V srpnu 2025 byly Superintelligence Labs znovu reorganizovány, tentokrát do čtyř podjednotek: tajemné TBD Lab pro nové modely, produktového týmu, týmu pro infrastrukturu a FAIR. V říjnu následovala další vlna propouštění, kdy přibližně 600 zaměstnanců dostalo odstupné. Uvedeným důvodem bylo snížení organizační složitosti a urychlení vývoje umělé inteligence.

Tyto neustálé restrukturalizace jsou v ostrém kontrastu s relativní stabilitou konkurentů, jako jsou OpenAI, Google a Anthropic. Poukazují na zásadní nejistotu společnosti Meta ohledně správného strategického směru. Zuckerberg si uvědomil, že Meta v závodě o dominanci v oblasti umělé inteligence zaostává. Llama 4, spuštěná v dubnu 2025, byla zklamáním. Zatímco model Maverick prokázal dobrou efektivitu, v dlouhodobějších kontextech dramaticky selhal. Objevila se tvrzení, že Meta optimalizovala pro benchmarky tím, že modely cíleně trénovala na běžných testových otázkách, čímž uměle nafukovala výkon.

Pro LeCuna se situace stala neudržitelnou. Jeho vize dlouhodobého základního výzkumu se střetávala s tlakem na dosažení krátkodobých produktových úspěchů. K jeho rozhodnutí pravděpodobně přispěla i skutečnost, že byl fakticky podřízen podstatně mladšímu Wangovi. Ve svém rozlučkovém memorandu LeCun zdůrazňuje, že Meta zůstane partnerem v jeho nové společnosti, ale sdělení je jasné: nezávislý výzkum, který považuje za nezbytný, již v rámci podnikových struktur není možný.

 

Nový rozměr digitální transformace s „řízenou AI“ (umělou inteligencí) – platforma a řešení B2B | Xpert Consulting

Nový rozměr digitální transformace s „řízenou AI“ (umělou inteligencí) – platforma a řešení B2B | Xpert Consulting - Obrázek: Xpert.Digital

Zde se dozvíte, jak může vaše společnost rychle, bezpečně a bez vysokých vstupních bariér implementovat řešení umělé inteligence na míru.

Spravovaná platforma umělé inteligence (AI) je vaším komplexním a bezstarostným balíčkem pro umělou inteligenci. Místo řešení složitých technologií, drahé infrastruktury a zdlouhavých vývojových procesů získáte od specializovaného partnera řešení na klíč šité na míru vašim potřebám – často během několika dnů.

Klíčové výhody na první pohled:

⚡ Rychlá implementace: Od nápadu k provozní aplikaci během dnů, nikoli měsíců. Dodáváme praktická řešení, která vytvářejí okamžitou hodnotu.

🔒 Maximální zabezpečení dat: Vaše citlivá data zůstávají u vás. Garantujeme bezpečné a kompatibilní zpracování bez sdílení dat s třetími stranami.

💸 Žádné finanční riziko: Platíte pouze za výsledky. Vysoké počáteční investice do hardwaru, softwaru nebo personálu jsou zcela eliminovány.

🎯 Zaměřte se na své hlavní podnikání: Soustřeďte se na to, co děláte nejlépe. My se postaráme o kompletní technickou implementaci, provoz a údržbu vašeho řešení s umělou inteligencí.

📈 Připraveno na budoucnost a škálovatelné: Vaše umělá inteligence roste s vámi. Zajišťujeme průběžnou optimalizaci a škálovatelnost a flexibilně přizpůsobujeme modely novým požadavkům.

Více o tom zde:

 

Od humbuku k realitě: Blíží se přehodnocení odvětví umělé inteligence

Ekonomická anatomie tvorby puchýřů

Vývoj ve společnosti Meta je příznakem širší ekonomické dynamiky v odvětví umělé inteligence. Od průlomu ChatGPT na konci roku 2022 došlo k nebývalému investičnímu boomu. Jen v prvním čtvrtletí roku 2025 nateklo do startupů v oblasti umělé inteligence 73,1 miliardy dolarů, což představuje 58 procent všech investic rizikového kapitálu. OpenAI dosáhla hodnoty 500 miliard dolarů, čímž se stala první soukromou společností, která tuto hranici překročila, aniž by kdy byla zisková.

Ocenění je v naprosto nepoměrném poměru ke skutečným příjmům. OpenAI v roce 2025 vygenerovala roční tržby ve výši 10 miliard dolarů s oceněním 500 miliard dolarů, což vedlo k poměru ceny k tržbám 50. Pro srovnání, i na vrcholu internetové bubliny jen málo společností dosáhlo takových násobků. Anthropic je oceněna na 170 miliard dolarů s tržbami 2,2 miliardy dolarů, což je poměr ceny k zisku přibližně 77. Tato čísla naznačují masivní nadhodnocení.

Obzvláště problematická je zavedená kruhová struktura financování. Nvidia investuje 100 miliard dolarů do OpenAI, která je zase povinna nakoupit čipy Nvidie v hodnotě desítek miliard dolarů. OpenAI uzavřela podobné dohody s AMD v hodnotě desítek miliard dolarů. Microsoft investoval do OpenAI přes 13 miliard dolarů a hostuje svou infrastrukturu na Azure. Amazon investoval 8 miliard dolarů do Anthropic, která na oplátku používá AWS jako svou primární cloudovou platformu a využívá vlastní čipy Amazonu pro umělou inteligenci.

Tato ujednání zlověstně připomínají kruhové financování z konce 90. let, kdy si technologické společnosti navzájem prodávaly zařízení a účtovaly transakce jako příjmy, aniž by generovaly jakoukoli skutečnou ekonomickou hodnotu. Analytici hovoří o stále složitější a neprůhlednější síti obchodních vztahů, která pohání biliónový boom. Paralely s internetovou bublinou a finanční krizí z roku 2008 jsou nezaměnitelné: neprůhledné a nekonvenční finanční mechanismy, které investoři jen těžko chápou a hodnotí.

K tomu se přidává koncentrace kapitálu. Sedm největších amerických technologických společností, tzv. Magnificent Seven, zvýšilo v roce 2023 svou spotřebu energie o 19 procent, zatímco medián spotřeby společností z indexu S&P 500 stagnoval. Přibližně 80 procent zisků na akciovém trhu v USA v roce 2025 bylo připsáno společnostem souvisejícím s umělou inteligencí. Samotná Nvidia se stala nejprodávanější akcií mezi drobnými investory, kteří do výrobce čipů v roce 2024 investovali téměř 30 miliard dolarů.

Tato extrémní koncentrace s sebou nese systémová rizika. Pokud se očekávání výnosů ukážou jako nerealistická, mohl by mít krach trhu dalekosáhlé důsledky. JPMorgan odhaduje, že samotné emise dluhopisů investičního stupně souvisejících s umělou inteligencí by mohly do roku 2030 dosáhnout 1,5 bilionu dolarů. Velká část tohoto dluhu je založena na předpokladu, že systémy umělé inteligence vygenerují masivní nárůst produktivity. Pokud se toto očekávání nenaplní, hrozí úvěrová krize.

Vhodné pro:

Válka talentů a společenské otřesy

Ekonomické napětí se projevuje i na trhu práce. Poměr volných pozic v oblasti umělé inteligence k kvalifikovaným kandidátům je 3,2 ku 1. Volných pozic je 1,6 milionu, ale kvalifikovaných uchazečů je pouze 518 000. Tento extrémní nedostatek žene platy do astronomických výšin. Specialisté na umělou inteligenci si mohou ročně přidat desítky tisíc dolarů získáním dovedností v Pythonu, TensorFlow nebo specializovaných frameworkech pro umělou inteligenci.

Konkurence je brutální. Velké technologické společnosti, dobře financované startupy a dokonce i vlády soupeří o stejnou malou skupinu expertů. OpenAI v posledních měsících zažívá exodus manažerů, včetně spoluzakladatele Ilji Sutskevera a technické ředitelky Miry Murati. Mnoho z těchto talentovaných jedinců zakládá vlastní startupy nebo přechází ke konkurenci. Meta agresivně hledá nové zaměstnance z OpenAI, Anthropic a Googlu. Anthropic hledá nové zaměstnance z Mety a OpenAI.

Tato dynamika má několik důsledků. Zaprvé fragmentuje výzkumnou krajinu. Místo toho, aby malé týmy v různých organizacích pracovaly na společných cílech, soutěží o stejné průlomové objevy. Zadruhé zvyšuje náklady. Obrovské platy specialistů na umělou inteligenci jsou udržitelné pouze pro dobře kapitalizované společnosti, což vylučuje menší hráče z trhu. Zatřetí zpožďuje projekty. Společnosti hlásí, že volná místa zůstávají neobsazena celé měsíce, což narušuje vývojové harmonogramy.

Společenské důsledky sahají daleko za rámec technologického sektoru. Pokud umělá inteligence skutečně představuje další průmyslovou revoluci, pak je na spadnutí masivní otřes na trhu práce. Na rozdíl od první průmyslové revoluce, která primárně postihla fyzickou práci, se umělá inteligence zaměřuje na kognitivní úkoly. Ohroženo není jen jednoduché zadávání dat a zákaznický servis, ale potenciálně i vysoce kvalifikované profese, jako jsou programátoři, designéři, právníci a novináři.

Studie odvětví investičního managementu předpovídá pětiprocentní pokles podílu příjmů z práce v důsledku umělé inteligence a velkých dat. To je srovnatelné s posuny během průmyslové revoluce, která způsobila pokles o pět až patnáct procent. Zásadní rozdíl je, že současná transformace probíhá po dobu let, nikoli desetiletí. Společnosti mají málo času na adaptaci.

Výpočetní technika za testovacího času a posun paradigmatu

Zatímco zákony škálování pro předtrénování dosahují svých limitů, objevilo se nové paradigma: škálování výpočtů za testovací doby. Modely o1 od OpenAI ukázaly, že investováním většího výpočetního výkonu během inference je možné výrazně zvýšit výkon. Namísto pouhého zvětšení velikosti modelu tyto systémy umožňují modelu déle přemýšlet o dotazu, používat více přístupů k jeho řešení a sám ověřovat své odpovědi.

Výzkum však ukazuje, že toto paradigma má i svá omezení. Sekvenční škálování, při kterém model několikrát iteruje nad stejným problémem, nevede k neustálému zlepšování. Studie modelů jako Deepseeks R1 a QwQ ukazují, že delší myšlenkové procesy automaticky nepřinášejí lepší výsledky. Model často opravuje správné odpovědi na nesprávné, spíše než naopak. Schopnost autoevaluace nezbytná pro efektivní sekvenční škálování není dostatečně rozvinutá.

Paralelní škálování, kdy se generuje více řešení současně a vybere se to nejlepší, vykazuje lepší výsledky. I zde však marginální přínos klesá s každým zdvojnásobením investovaného výpočetního výkonu. Nákladová efektivita rapidně klesá. Pro komerční aplikace, které potřebují odpovídat na miliony dotazů denně, jsou náklady neúnosné.

Skutečný průlom by mohl spočívat v kombinaci různých přístupů. Hybridní architektury, které kombinují transformátory se stavovými modely, slibují sjednocení silných stránek obou. Stavové modely, jako je Mamba, nabízejí lineární škálování v inferenci, zatímco transformátory vynikají v zachycování dlouhodobých závislostí. Takové hybridní systémy by mohly znovu vyvážit rovnici ceny a kvality.

Alternativní architektury a budoucnost po Transformers

Vedle světových modelů se objevuje řada alternativních architektur, které by mohly zpochybnit dominanci Transformerů. Stavové modely v posledních letech dosáhly významného pokroku. S4, Mamba a Hyena ukazují, že je možné efektivní dlouhodobé uvažování s lineární složitostí. Zatímco Transformery se škálují kvadraticky s délkou sekvence, SSM dosahují lineárního škálování jak v trénování, tak v inferenci.

Toto zvýšení efektivity by mohlo být klíčové při nasazení systémů umělé inteligence v produkčním prostředí. Náklady na inferenci bývají často podceňovány. Školení je jednorázová investice, ale inference probíhá nepřetržitě. ChatGPT nikdy není offline. S miliardami denních dotazů se i malá zlepšení efektivity sčítají a vedou k masivním úsporám nákladů. Model, který vyžaduje poloviční výpočetní výkon pro stejnou kvalitu, má obrovskou konkurenční výhodu.

Výzva spočívá ve vyzrálosti těchto technologií. Transformers mají náskok téměř osm let a rozsáhlý ekosystém nástrojů, knihoven a odborných znalostí. Alternativní architektury musí být nejen technicky nadřazené, ale také prakticky použitelné. Historie technologií je plná technicky nadřazených řešení, která na trhu selhala, protože chyběl ekosystém.

Je zajímavé, že i čínská konkurence se spoléhá na alternativní přístupy. DeepSeek V3, open-source model s 671 miliardami parametrů, využívá architekturu se směsí expertů, v níž je na jeden token aktivováno pouze 37 miliard parametrů. Model dosahuje v benchmarkech srovnatelného výkonu se západní konkurencí, ale byl trénován za zlomek nákladů. Doba trénování byla pouze 2,788 milionu hodin na GPU H800, což je výrazně méně než u srovnatelných modelů.

Tento vývoj ukazuje, že technologické vedení nemusí nutně patřit finančně nejmocnějším hráčům. Chytrá architektonická rozhodnutí a optimalizace mohou kompenzovat výhody v oblasti zdrojů. Pro globální prostředí umělé inteligence to znamená rostoucí multipolaritu. Čína, Evropa a další regiony si vyvíjejí vlastní přístupy, které nejsou pouhými kopiemi západních modelů.

Přehodnocení a nevyhnutelná kocovina

Souběh všech těchto faktorů naznačuje hrozící přehodnocení odvětví umělé inteligence. Současná ocenění jsou založena na předpokladu neustálého exponenciálního růstu, a to jak ve výkonu modelů, tak v komerčním přijetí. Oba předpoklady jsou stále více zpochybňovány. Výkon modelů stagnuje, zatímco náklady nadále prudce rostou. Přestože komerční přijetí roste, monetizace zůstává výzvou.

OpenAI s oceněním půl bilionu dolarů by musela v nadcházejících letech dosáhnout ročních tržeb alespoň 100 miliard dolarů a stát se ziskovou, aby ospravedlnila své ocenění. To by znamenalo desetinásobný nárůst během pouhých několika let. Pro srovnání, Googlu trvalo více než deset let, než vzrostly tržby z 10 miliard dolarů na 100 miliard dolarů. Očekávání od společností zabývajících se umělou inteligencí jsou nerealisticky vysoká.

Analytici varují před možným prasknutím bubliny umělé inteligence. Paralely s bublinou internetových společností jsou zřejmé. Tehdy, stejně jako nyní, existovala revoluční technologie s obrovským potenciálem. Tehdy, stejně jako nyní, existují iracionálně nafouknuté ocenění a kruhové struktury financování. Tehdy, stejně jako nyní, investoři ospravedlňují absurdní ocenění argumentem, že technologie všechno změní a že tradiční metriky oceňování již nejsou použitelné.

Zásadní rozdíl: Na rozdíl od mnoha internetových společností mají dnešní firmy zabývající se umělou inteligencí skutečně funkční produkty se skutečnou hodnotou. ChatGPT není výmysl, ale technologie, kterou denně používají miliony lidí. Otázkou není, zda je umělá inteligence hodnotná, ale zda je dostatečně hodnotná, aby ospravedlnila současné ocenění. Odpověď s největší pravděpodobností zní ne.

Až k přehodnocení dojde, bude to bolestivé. Fondy rizikového kapitálu investovaly 70 procent svého kapitálu do umělé inteligence. Penzijní fondy a institucionální investoři jsou masivně vystaveni riziku. Výrazný pokles ocenění umělé inteligence by měl dalekosáhlé finanční důsledky. Společnosti, které se spoléhají na levné financování, by se náhle potýkaly s obtížemi při získávání kapitálu. Projekty by byly zastaveny a zaměstnanci by byli propuštěni.

Dlouhodobá perspektiva a cesta vpřed

Navzdory těmto bezútěšným krátkodobým vyhlídkám zůstává dlouhodobý potenciál umělé inteligence obrovský. Současný humbuk kolem ní nemění zásadní význam této technologie. Otázkou není, zda, ale jak a kdy umělá inteligence splní svůj slib. LeCunův posun od krátkodobého vývoje produktů k dlouhodobému základnímu výzkumu ukazuje cestu.

Příští generace systémů umělé inteligence se bude pravděpodobně lišit od dnešních LLM. Bude kombinovat prvky světových modelů, alternativních architektur a nových trénovacích paradigmat. Bude se méně spoléhat na škálování hrubou silou a více na efektivní, strukturované reprezentace. Bude se učit z fyzického světa, nejen z textu. A bude chápat kauzalitu, nejen korelace.

Tato vize však vyžaduje čas, trpělivost a svobodu provádět základní výzkum. Právě tyto podmínky je v současném tržním prostředí těžké najít. Tlak na dosažení rychlého komerčního úspěchu je obrovský. Čtvrtletní zprávy a kola hodnocení dominují programu. Dlouhodobé výzkumné programy, jejichž výsledky mohou přinést až po letech, je obtížné zdůvodnit.

LeCunovo rozhodnutí založit startup v 65 letech je pozoruhodným prohlášením. Mohl odejít do důchodu se všemi poctami a zaručeným místem v historii. Místo toho si zvolil kamenitou cestu, kterou vede vize, kterou mainstream v oboru odmítá. Meta zůstane partnerem, což znamená, že jeho společnost bude mít alespoň zpočátku dostatek zdrojů. Její skutečný úspěch však bude záviset na tom, zda v nadcházejících letech dokáže, že pokročilá strojová inteligence je skutečně lepší.

Transformace bude trvat roky. I když má LeCun pravdu a světové modely jsou v zásadě lepší, stále je třeba je vyvíjet, optimalizovat a industrializovat. Je třeba vybudovat ekosystém. Vývojáři se musí naučit používat nové nástroje. Firmy musí migrovat z LLM na nové systémy. Tyto přechodné fáze byly historicky vždy bolestivé.

Od humbuku k realitě: Dlouhodobý postup v oblasti umělé inteligence

Odchod Yanna LeCuna z Mety znamená více než jen personální změnu. Symbolizuje zásadní napětí mezi vědeckou vizí a komerčním pragmatismem, mezi dlouhodobými inovacemi a krátkodobými požadavky trhu. Současná revoluce umělé inteligence se nachází v bodě zlomu. Snadné úspěchy škálování byly vyčerpány. Další kroky budou obtížnější, dražší a nejistější.

Pro investory to znamená, že je třeba kriticky přezkoumat přemrštěné ocenění současných šampionů v oblasti umělé inteligence. Pro firmy to znamená, že naděje na rychlé zázraky produktivity prostřednictvím umělé inteligence mohou být zklamány. Pro společnost to znamená, že transformace bude pomalejší a nerovnoměrnější, než naznačuje vlna humbuku.

Zároveň však základy zůstávají pevné. Umělá inteligence není pomíjivým módním výstřelkem, ale základní technologií, která v dlouhodobém horizontu transformuje prakticky všechna odvětví ekonomiky. Paralely s průmyslovou revolucí jsou výstižné. Stejně jako tehdy budou vítězové a poražení, excesy a korekce, otřesy a úpravy. Otázkou není, zda transformační architektura dosáhla konce svých možností, ale jak bude vypadat další fáze a kdo ji bude formovat.

LeCunova sázka na pokročilou strojovou inteligenci a modely světa je odvážná, ale mohla by se ukázat jako prozíravá. Za pět let budeme vědět, zda bylo odtržení se od hlavního proudu správným rozhodnutím, nebo zda odvětví zůstalo na zvolené cestě. Nadcházející roky budou klíčové pro dlouhodobý rozvoj umělé inteligence a v důsledku toho i pro ekonomickou a společenskou budoucnost.

 

Naše odborné znalosti v USA v oblasti rozvoje obchodu, prodeje a marketingu

Naše odborné znalosti v USA v oblasti rozvoje obchodu, prodeje a marketingu - Obrázek: Xpert.Digital

Zaměření na odvětví: B2B, digitalizace (od AI po XR), strojírenství, logistika, obnovitelné zdroje energie a průmysl

Více o tom zde:

Tematické centrum s poznatky a odbornými znalostmi:

  • Znalostní platforma o globální a regionální ekonomice, inovacích a trendech specifických pro dané odvětví
  • Sběr analýz, impulsů a podkladových informací z našich oblastí zájmu
  • Místo pro odborné znalosti a informace o aktuálním vývoji v oblasti podnikání a technologií
  • Tematické centrum pro firmy, které se chtějí dozvědět více o trzích, digitalizaci a inovacích v oboru

 

Váš globální partner pro marketing a rozvoj podnikání

☑️ Naším obchodním jazykem je angličtina nebo němčina

☑️ NOVINKA: Korespondence ve vašem národním jazyce!

 

Konrad Wolfenstein

Rád vám a mému týmu posloužím jako osobní poradce.

Kontaktovat mě můžete vyplněním kontaktního formuláře nebo mi jednoduše zavolejte na číslo +49 89 89 674 804 (Mnichov) . Moje e-mailová adresa je: wolfenstein xpert.digital

Těším se na náš společný projekt.

 

 

☑️ Podpora MSP ve strategii, poradenství, plánování a implementaci

☑️ Vytvoření nebo přeladění digitální strategie a digitalizace

☑️ Rozšíření a optimalizace mezinárodních prodejních procesů

☑️ Globální a digitální obchodní platformy B2B

☑️ Pioneer Business Development / Marketing / PR / Veletrhy

 

🎯🎯🎯 Využijte rozsáhlé pětinásobné odborné znalosti společnosti Xpert.Digital v komplexním balíčku služeb | BD, výzkum a vývoj, XR, PR a optimalizace digitální viditelnosti

Využijte rozsáhlé pětinásobné odborné znalosti společnosti Xpert.Digital v komplexním balíčku služeb | Výzkum a vývoj, XR, PR a optimalizace digitální viditelnosti - Obrázek: Xpert.Digital

Xpert.Digital má hluboké znalosti z různých odvětví. To nám umožňuje vyvíjet strategie šité na míru, které jsou přesně přizpůsobeny požadavkům a výzvám vašeho konkrétního segmentu trhu. Neustálou analýzou tržních trendů a sledováním vývoje v oboru můžeme jednat s prozíravostí a nabízet inovativní řešení. Kombinací zkušeností a znalostí vytváříme přidanou hodnotu a poskytujeme našim zákazníkům rozhodující konkurenční výhodu.

Více o tom zde:

Ukončete mobilní verzi