AMI – Inteligență Artificială Avansată – Sfârșitul Scalării: De ce Yann LeCun nu mai crede în LLM-uri
Pre-lansare Xpert
Selectarea limbii 📢
Publicat pe: 23 noiembrie 2025 / Actualizat pe: 23 noiembrie 2025 – Autor: Konrad Wolfenstein

AMI – Inteligență Artificială Avansată – Sfârșitul Scalării: De ce Yann LeCun nu mai crede în LLM-uri – Imagine: Xpert.Digital
Un punct mort în loc de superinteligență: De ce principalul vizionar al lui Meta demisionează acum
600 de miliarde pentru o abordare greșită? „Nașul IA” pariază împotriva LLaMA, ChatGPT și a companiilor.
Anunțul a venit ca un trăsnet prin industria tehnologiei în noiembrie 2025. Yann LeCun, unul dintre cei trei părinți fondatori ai învățării profunde și director științific la Meta, și-a anunțat plecarea după doisprezece ani în cadrul companiei pentru a-și înființa propriul startup. Această decizie este mult mai mult decât o alegere personală de carieră a unui singur om de știință. Marchează un punct de cotitură fundamental în industria globală a inteligenței artificiale și dezvăluie decalajul tot mai mare dintre interesele de piață pe termen scurt și viziunea științifică pe termen lung.
LeCun, care a primit Premiul Turing în 2018 alături de Geoffrey Hinton și Yoshua Bengio, este considerat arhitectul rețelelor neuronale convoluționale, care astăzi stau la baza sistemelor moderne de procesare a imaginilor. Plecarea sa vine într-un moment în care întreaga industrie investește sute de miliarde de dolari în modele lingvistice mari, o tehnologie pe care LeCun a descris-o ani de zile ca fiind un impas fundamental. Cu noua sa companie, omul de știință, acum în vârstă de 65 de ani, intenționează să urmeze ceea ce el numește Inteligență Artificială Avansată, o abordare radical diferită bazată pe modele ale lumii și care pornește de la percepția fizică, nu de la text.
Implicațiile economice ale acestei dezvoltări sunt imense. Meta însăși a investit peste 600 de miliarde de dolari în infrastructura IA în ultimii trei ani. OpenAI a atins o evaluare de o jumătate de trilion de dolari, în ciuda veniturilor anuale de doar zece miliarde de dolari. Întreaga industrie s-a îndreptat într-o direcție pe care unul dintre cei mai importanți pionieri ai săi a descris-o acum public ca fiind un impas. Pentru a înțelege consecințele economice ale acestei schimbări, trebuie să aprofundăm structurile tehnice, organizaționale și financiare ale actualei revoluții IA.
Legat de asta:
- Meta va investi 600 de miliarde de dolari americani pentru a construi infrastructură de inteligență artificială în SUA
Arhitectura unei bule
Arhitectura Transformer, introdusă de cercetătorii de la Google în 2017, a transformat peisajul inteligenței artificiale într-un ritm fără precedent. Această abordare a făcut posibilă pentru prima dată procesarea eficientă a unor cantități masive de text și antrenarea modelelor lingvistice cu capacități anterior imposibil de atins. OpenAI a construit pe această bază cu seria sa GPT, care, odată cu ChatGPT în noiembrie 2022, a demonstrat pentru prima dată unui public larg ce pot realiza aceste tehnologii. Răspunsul a fost exploziv. În câteva luni, zeci de miliarde de dolari au intrat în acest sector.
Cu toate acestea, de la sfârșitul anului 2024, au existat tot mai multe semne că această dezvoltare exponențială își atinge limitele. OpenAI dezvoltă succesorul lui GPT-4, denumit intern Orion sau GPT-5, de peste 18 luni. Compania a efectuat, se pare, cel puțin două cicluri mari de antrenament, fiecare costând aproximativ 500 de milioane de dolari. Rezultatele au fost îngrijorătoare. Deși GPT-4 a reprezentat un salt masiv de performanță față de GPT-3, îmbunătățirile aduse de Orion față de GPT-4 sunt marginale. În unele domenii, în special în ceea ce privește programarea, modelul nu prezintă practic niciun progres.
Această evoluție contrazice fundamental legile de scalare, acele principii empirice care până de curând ghidau întreaga industrie. Ideea de bază era simplă: dacă faci un model mai mare, folosești mai multe date pentru antrenament și investești mai multă putere de calcul, creșterea performanței urmează o funcție de putere previzibilă. Acest principiu părea a fi valabil universal și a justificat investițiile astronomice din ultimii ani. Acum se dovedește că aceste curbe se aplatizează. Următoarea dublare a investiției nu mai produce dublarea așteptată a performanței.
Motivele pentru aceasta sunt numeroase și complexe din punct de vedere tehnic. O problemă cheie este data wall-ul. GPT-4 a fost antrenat cu aproximativ 13 trilioane de token-uri, ceea ce reprezintă practic întregul internet disponibil publicului. Pentru GPT-5, pur și simplu nu există suficiente date noi, de înaltă calitate. OpenAI a răspuns angajând dezvoltatori de software, matematicieni și fizicieni teoreticieni pentru a genera date noi prin scrierea de cod și rezolvarea problemelor matematice. Cu toate acestea, chiar dacă 1.000 de persoane ar produce 5.000 de cuvinte pe zi, ar dura luni de zile pentru a genera doar un miliard de token-uri. Scalarea folosind date generate de oameni pur și simplu nu funcționează.
Ca alternativă, companiile se bazează din ce în ce mai mult pe date sintetice - adică date generate de alte modele de inteligență artificială. Însă aici pândește un nou pericol: colapsul modelului. Atunci când modelele sunt antrenate recursiv pe baza datelor generate de alte modele, micile erori se amplifică de-a lungul generațiilor. Rezultatul este reprezentat de modele care devin din ce în ce mai detașate de realitate și în care grupurile minoritare din date dispar în mod disproporționat. Un studiu publicat în Nature în 2024 a arătat că acest proces are loc surprinzător de rapid. Prin urmare, datele sintetice nu sunt un panaceu, ci mai degrabă prezintă riscuri semnificative.
Tranziția energetică și limitele creșterii
Pe lângă bariera legată de date, există o a doua barieră, și mai fundamentală: bariera energetică. Antrenarea GPT-3 a consumat aproximativ 1.300 de megawați-oră de electricitate, echivalentul consumului anual a 130 de gospodării americane. GPT-4 a necesitat aproximativ de 50 de ori această cantitate, sau 65.000 de megawați-oră. Puterea de calcul necesară pentru antrenarea modelelor mari de inteligență artificială se dublează aproximativ la fiecare 100 de zile. Această curbă exponențială duce rapid la limitări fizice.
Centrele de date care antrenează și operează aceste modele consumă deja la fel de multă energie electrică ca orașele mici. Agenția Internațională pentru Energie preconizează că consumul de energie electrică al centrelor de date va crește cu 80% până în 2026, de la 20 de terawați-oră în 2022 la 36 de terawați-oră în 2026. Inteligența artificială este principalul motor al acestei creșteri. Pentru comparație, o singură interogare ChatGPT consumă de aproximativ zece ori mai multă energie decât o căutare pe Google. Cu miliarde de interogări pe zi, aceasta se ridică la sume enorme.
Această evoluție obligă companiile de tehnologie să ia măsuri drastice. Microsoft a semnat deja contracte cu furnizori de energie nucleară. Meta, Amazon și Google investesc un total combinat de peste 1,3 trilioane de dolari în următorii ani pentru a construi infrastructura necesară. Dar aceste investiții se confruntă cu limite fizice și politice. SUA pur și simplu nu are suficientă infrastructură energetică pentru a alimenta centrele de date cu inteligență artificială planificate. Analiștii estimează că proiecte în valoare de 750 de miliarde de dolari ar putea fi amânate până în 2030 din cauza blocajelor la nivelul infrastructurii energetice.
La aceasta se adaugă dimensiunea geopolitică. Cererea energetică a industriei IA intensifică concurența pentru resurse și crește dependența de combustibilii fosili. În timp ce factorii de decizie politică cer neutralitate climatică, industria IA duce la creșterea consumului de energie. Această tensiune se va agrava în următorii ani și ar putea duce la intervenții de reglementare care limitează creșterea industriei.
Zidul arhitectural și alternativa lui LeCun
A treia barieră este probabil cea mai fundamentală: zidul arhitectural. Yann LeCun susține de ani de zile că arhitectura Transformer are limitări inerente care nu pot fi depășite pur și simplu prin scalare. Critica sa se concentrează pe modul fundamental în care funcționează Modelele Limbajului Mare. Aceste sisteme sunt antrenate să prezică următorul cuvânt dintr-o secvență. Ele învață modele statistice în corpusuri de text masive, dar nu dezvoltă o înțelegere reală a cauzalității, a legilor fizice sau a planificării pe termen lung.
Lui LeCun îi place să ilustreze problema printr-o comparație: un copil de patru ani a absorbit mai multe informații despre lume prin percepția vizuală decât cele mai performante modele lingvistice prin text. Un copil înțelege intuitiv că obiectele nu dispar pur și simplu, că lucrurile grele cad și că acțiunile au consecințe. El și-a dezvoltat un model al lumii, o reprezentare internă a realității fizice, pe care o folosește pentru a face predicții și a planifica acțiuni. Licențiaților în limbaj le lipsește această abilitate fundamentală. Pot genera un text impresionant de coerent, dar nu înțeleg lumea.
Această limitare devine evidentă în mod repetat în aplicațiile practice. Dacă îi ceri lui GPT-4 să vizualizeze un cub în rotație, acesta eșuează la o sarcină pe care orice copil o poate îndeplini cu ușurință. În cazul sarcinilor complexe care necesită planificare în mai mulți pași, modelele eșuează în mod regulat. Nu pot învăța în mod fiabil din erori, deoarece fiecare eroare de predicție a jetonului se poate multiplica și amplifica. Modelele autoregresive au o fragilitate fundamentală: o eroare la începutul secvenței poate ruina întregul rezultat.
Alternativa lui LeCun o reprezintă modelele lumii bazate pe Joint Embedding Predictive Architecture. Ideea de bază este că sistemele de inteligență artificială nu ar trebui să învețe prin predicție textuală, ci mai degrabă prin prezicerea reprezentărilor abstracte ale stărilor viitoare. În loc să genereze pixel cu pixel sau token cu token, sistemul învață o reprezentare comprimată și structurată a lumii și o poate folosi pentru a simula mental diferite scenarii înainte de a acționa.
Sub conducerea lui LeCun, Meta a dezvoltat deja mai multe implementări ale acestei abordări. I-JEPA pentru imagini și V-JEPA pentru videoclipuri arată rezultate promițătoare. Aceste modele învață componente ale obiectelor la nivel înalt și relațiile lor spațiale fără a se baza pe achiziții intensive de date. De asemenea, antrenarea lor este semnificativ mai eficientă din punct de vedere energetic decât modelele convenționale. Viziunea este de a combina aceste abordări în sisteme ierarhice care pot opera la diferite niveluri de abstractizare și intervale de timp.
Diferența crucială constă în natura procesului de învățare. În timp ce modelele de învățare în cunoștință de cauză efectuează, în esență, potrivirea tiparelor pe bază de steroizi, modelele lumii își propun să înțeleagă structura și cauzalitatea realității. Un sistem cu un model robust al lumii ar putea anticipa consecințele acțiunilor sale fără a fi nevoit să le îndeplinească. Ar putea învăța din câteva exemple, deoarece înțelege principiile de bază, nu doar corelațiile superficiale.
Disfuncția organizațională și criza existențială a lui Meta
Plecarea lui LeCun, însă, nu este doar o decizie științifică, ci și rezultatul disfuncțiilor organizaționale de la Meta. În iunie 2025, CEO-ul Mark Zuckerberg a anunțat o restructurare masivă a diviziilor de inteligență artificială. El a fondat Meta Superintelligence Labs, o nouă unitate cu scopul declarat de a dezvolta Inteligența Artificială Generală. Aceasta era condusă de Alexandr Wang, fostul CEO în vârstă de 28 de ani al Scale AI, o companie de pregătire a datelor. Meta a investit 14,3 miliarde de dolari în Scale AI și a recrutat peste 50 de ingineri și cercetători de la concurență.
Această decizie a dat peste cap structura existentă. Echipa de cercetare fundamentală în inteligență artificială a LeCun, care petrecuse ani de zile dezvoltând PyTorch și primele modele Llama, a fost marginalizată. FAIR a fost orientat către cercetarea fundamentală cu un orizont de timp de cinci până la zece ani, în timp ce noile laboratoare de superinteligență s-au concentrat pe dezvoltarea de produse pe termen scurt. Sursele raportează un haos tot mai mare în departamentele de inteligență artificială ale Meta. Talentele de top nou angajate și-au exprimat frustrarea față de birocrația unei mari corporații, în timp ce echipele consacrate și-au văzut influența scăzând.
Situația s-a înrăutățit din cauza mai multor restructurări în doar șase luni. În august 2025, Superintelligence Labs a fost reorganizată din nou, de data aceasta în patru subunități: un misterios laborator TBD pentru modele noi, o echipă de produs, o echipă de infrastructură și FAIR. Un alt val de concedieri a urmat în octombrie, aproximativ 600 de angajați fiind plătiți cu plăți compensatorii. Motivul declarat: reducerea complexității organizaționale și accelerarea dezvoltării inteligenței artificiale.
Aceste restructurări constante contrastează puternic cu stabilitatea relativă a competitorilor precum OpenAI, Google și Anthropic. Ele indică o incertitudine fundamentală la Meta în ceea ce privește direcția strategică corectă. Zuckerberg a recunoscut că Meta rămâne în urmă în cursa pentru dominația IA. Llama 4, lansat în aprilie 2025, a fost o dezamăgire. Deși modelul Maverick a demonstrat o bună eficiență, acesta a eșuat dramatic în contexte mai lungi. Au apărut acuzații conform cărora Meta a optimizat pentru teste de performanță prin antrenarea specifică a modelelor pe baza unor întrebări comune de testare, umflând artificial performanța.
Pentru LeCun, situația a devenit insuportabilă. Viziunea sa asupra cercetării fundamentale pe termen lung s-a ciocnit cu presiunea de a obține succese pe termen scurt în materie de produse. Faptul că era practic subordonat mult mai tânărului Wang a contribuit probabil la decizia sa. În memoriul său de adio, LeCun subliniază că Meta va rămâne partener în noua sa companie, dar mesajul este clar: cercetarea independentă pe care o consideră esențială nu mai este posibilă în cadrul structurilor corporative.
O nouă dimensiune a transformării digitale cu „IA gestionată” (Inteligență Artificială) - Platformă și soluție B2B | Xpert Consulting

O nouă dimensiune a transformării digitale cu „IA gestionată” (Inteligență Artificială) – Platformă și soluție B2B | Xpert Consulting - Imagine: Xpert.Digital
Aici veți afla cum poate compania dumneavoastră să implementeze soluții personalizate de inteligență artificială rapid, în siguranță și fără bariere mari de intrare.
O platformă de inteligență artificială gestionată este soluția completă și fără griji pentru inteligența artificială. În loc să vă confruntați cu tehnologii complexe, infrastructură costisitoare și procese de dezvoltare îndelungate, primiți o soluție gata pregătită, adaptată nevoilor dumneavoastră, de la un partener specializat – adesea în doar câteva zile.
Principalele avantaje, pe scurt:
⚡ Implementare rapidă: De la idee la aplicație gata de utilizare în zile, nu luni. Oferim soluții practice care creează valoare adăugată imediată.
🔒 Securitate maximă a datelor: Datele dumneavoastră sensibile rămân la dumneavoastră. Garantăm procesare sigură și conformă, fără a partaja date cu terțe părți.
💸 Fără risc financiar: Plătești doar pentru rezultate. Investițiile inițiale mari în hardware, software sau personal sunt complet eliminate.
🎯 Concentrează-te pe afacerea ta principală: Concentrează-te pe ceea ce faci cel mai bine. Noi ne ocupăm de întreaga implementare tehnică, operare și mentenanță a soluției tale de inteligență artificială.
📈 Pregătit pentru viitor și scalabil: Inteligența artificială crește odată cu tine. Asigurăm optimizare și scalabilitate continuă și adaptăm flexibil modelele la noile cerințe.
Mai multe informații aici:
De la hype la realitate: Reevaluarea iminentă a industriei IA
Anatomia economică a formării veziculelor
Evoluțiile de la Meta sunt simptomatice ale unei dinamici economice mai ample în industria inteligenței artificiale. De la descoperirea ChatGPT la sfârșitul anului 2022, s-a desfășurat un boom investițional fără precedent. Numai în primul trimestru al anului 2025, 73,1 miliarde de dolari au fost investite în startup-uri din domeniul inteligenței artificiale, reprezentând 58% din totalul investițiilor de capital de risc. OpenAI a atins o evaluare de 500 de miliarde de dolari, devenind prima companie privată care a depășit acest prag fără a fi fost vreodată profitabilă.
Evaluările sunt extrem de disproporționate față de veniturile reale. OpenAI a generat venituri anuale de 10 miliarde de dolari în 2025, cu o evaluare de 500 de miliarde de dolari, rezultând un raport preț-vânzări de 50. Pentru comparație, chiar și în apogeul bulei dot-com, puține companii au atins astfel de multipli. Anthropic este evaluată la 170 de miliarde de dolari, cu venituri de 2,2 miliarde de dolari, un raport P/E de aproximativ 77. Aceste cifre indică o supraevaluare masivă.
Deosebit de problematică este structura de finanțare circulară care s-a dezvoltat. Nvidia investește 100 de miliarde de dolari în OpenAI, care, la rândul său, este obligată să achiziționeze cipuri Nvidia în valoare de zeci de miliarde de dolari. OpenAI a încheiat acorduri similare cu AMD în valoare de zeci de miliarde de dolari. Microsoft a investit peste 13 miliarde de dolari în OpenAI și își găzduiește infrastructura pe Azure. Amazon a investit 8 miliarde de dolari în Anthropic, care, în schimb, folosește AWS ca platformă cloud principală și utilizează propriile cipuri AI ale Amazon.
Aceste aranjamente amintesc în mod straniu de finanțarea circulară de la sfârșitul anilor 1990, când companiile de tehnologie își vindeau echipamente între ele și înregistrau tranzacțiile ca venituri fără a genera nicio valoare economică reală. Analiștii vorbesc despre o rețea de relații de afaceri din ce în ce mai complexă și opacă, care alimentează un boom de trilioane de dolari. Paralelele cu bula dot-com și criza financiară din 2008 sunt inconfundabile: mecanisme de finanțare opace și neconvenționale, dificil de înțeles și evaluat de către investitori.
La aceasta se adaugă concentrarea capitalului. Cele șapte mari companii de tehnologie din SUA, cele mai mari șapte, și-au crescut consumul de energie cu 19% în 2023, în timp ce consumul mediu al companiilor din S&P 500 a stagnat. Aproximativ 80% din câștigurile de pe piața bursieră din SUA în 2025 au fost atribuibile companiilor legate de inteligența artificială. Nvidia a devenit singură acțiunea cea mai cumpărată de investitorii individuali, care au investit aproape 30 de miliarde de dolari în producătorul de cipuri în 2024.
Această concentrare extremă comportă riscuri sistemice. Dacă așteptările privind randamentul se dovedesc nerealiste, o prăbușire a pieței ar putea avea consecințe de amploare. JPMorgan estimează că emisiunile de obligațiuni de grad investițional legate de inteligența artificială ar putea ajunge la 1,5 trilioane de dolari până în 2030. O mare parte din această datorie se bazează pe presupunerea că sistemele de inteligență artificială vor genera câștiguri masive de productivitate. Dacă această așteptare nu se materializează, se profilează o criză a creditului.
Legat de asta:
- Meta pariază totul pe superinteligență: miliarde de investiții, mega centre de date și o cursă riscantă pentru inteligența artificială
Războiul talentelor și tulburările sociale
Tensiunile economice se manifestă și pe piața muncii. Raportul dintre posturile vacante în domeniul inteligenței artificiale și candidații calificați este de 3,2 la 1. Există 1,6 milioane de posturi vacante, dar doar 518.000 de aplicanți calificați. Această lipsă extremă duce salariile la cote astronomice. Specialiștii în inteligență artificială își pot mări venitul anual cu zeci de mii de dolari dobândind competențe în Python, TensorFlow sau framework-uri specializate în inteligență artificială.
Concurența este acerbă. Marile companii de tehnologie, startup-urile bine finanțate și chiar guvernele se luptă pentru același grup mic de experți. OpenAI a cunoscut un exod de directori în ultimele luni, inclusiv co-fondatorul Ilya Sutskever și directorul tehnic Mira Murati. Mulți dintre acești indivizi talentați își lansează propriile startup-uri sau trec la concurență. Meta recrutează agresiv de la OpenAI, Anthropic și Google. Anthropic recrutează de la Meta și OpenAI.
Această dinamică are mai multe consecințe. În primul rând, fragmentează peisajul cercetării. În loc să lucreze pentru atingerea unor obiective comune, echipe mici din diferite organizații concurează pentru aceleași descoperiri. În al doilea rând, crește costurile. Salariile enorme ale specialiștilor în inteligență artificială sunt sustenabile doar pentru companiile bine capitalizate, ceea ce exclude jucătorii mai mici de pe piață. În al treilea rând, întârzie proiectele. Companiile raportează că pozițiile deschise rămân neocupate luni de zile, perturbând termenele de dezvoltare.
Implicațiile societale se extind mult dincolo de sectorul tehnologic. Dacă IA reprezintă cu adevărat următoarea revoluție industrială, atunci o răsturnare masivă a pieței muncii este iminentă. Spre deosebire de prima revoluție industrială, care a afectat în principal munca fizică, IA vizează sarcinile cognitive. Nu numai introducerea simplă de date și serviciul clienți sunt amenințate, ci și profesii înalt calificate, cum ar fi programatorii, designerii, avocații și jurnaliștii.
Un studiu privind industria administrării investițiilor prezice o scădere cu cinci procente a ponderii veniturilor din muncă din cauza inteligenței artificiale și a big data. Această situație este comparabilă cu schimbările din timpul revoluției industriale, care au cauzat o scădere de cinci până la 15 procente. Diferența crucială: transformarea actuală are loc pe parcursul a ani, nu a deceniilor. Societățile au puțin timp de adaptare.
Calculul în timp de testare și schimbarea de paradigmă
În timp ce legile de scalare pentru pre-antrenament își ating limitele, a apărut o nouă paradigmă: scalarea în timpul testării. Modelele o1 ale OpenAI au demonstrat că sunt posibile câștiguri semnificative de performanță prin investirea unei puteri de calcul sporite în timpul inferenței. În loc să crească pur și simplu dimensiunea modelului, aceste sisteme permit modelului să se gândească la o interogare mai mult timp, să urmărească mai multe abordări pentru a o rezolva și să își auto-verifice răspunsurile.
Cu toate acestea, cercetările arată că această paradigmă are și limite. Scalarea secvențială, în care un model iterează asupra aceleiași probleme de mai multe ori, nu duce la îmbunătățiri continue. Studiile asupra modelelor precum Deepseeks R1 și QwQ demonstrează că procesele de gândire mai lungi nu produc automat rezultate mai bune. Adesea, modelul corectează răspunsurile corecte cu cele incorecte, și nu invers. Capacitatea de autorevizuire necesară pentru o scalare secvențială eficientă este insuficient dezvoltată.
Scalarea paralelă, unde sunt generate simultan mai multe soluții și se selectează cea mai bună, prezintă rezultate mai bune. Cu toate acestea, și aici, beneficiul marginal scade odată cu fiecare dublare a puterii de calcul investite. Eficiența costurilor scade rapid. Pentru aplicațiile comerciale care trebuie să răspundă la milioane de interogări pe zi, costurile sunt prohibitive.
Adevărata descoperire ar putea consta în combinarea diferitelor abordări. Arhitecturile hibride care combină Transformatoarele cu Modelele Spațiale de Stări promit să unească punctele forte ale ambelor. Modelele Spațiale de Stări, precum Mamba, oferă un comportament de scalare liniară în inferență, în timp ce Transformatoarele excelează la captarea dependențelor pe termen lung. Astfel de sisteme hibride ar putea reechilibra ecuația cost-calitate.
Arhitecturi alternative și viitorul după Transformers
Pe lângă modelele mondiale, apar o serie de arhitecturi alternative care ar putea contesta dominația Transformers. Modelele de spațiu de stări au înregistrat progrese semnificative în ultimii ani. S4, Mamba și Hyena demonstrează că este posibil un raționament eficient în context lung cu complexitate liniară. În timp ce Transformers se scalează pătratic cu lungimea secvenței, SSM-urile realizează scalare liniară atât în antrenament, cât și în inferență.
Aceste câștiguri de eficiență ar putea fi cruciale atunci când sistemele de inteligență artificială sunt implementate în medii de producție. Costul inferenței a fost adesea subestimat. Antrenarea este o investiție unică, dar inferența rulează continuu. ChatGPT nu este niciodată offline. Cu miliarde de interogări zilnice, chiar și mici îmbunătățiri ale eficienței duc la economii masive de costuri. Un model care necesită jumătate din puterea de calcul pentru aceeași calitate are un avantaj competitiv extraordinar.
Provocarea constă în maturizarea acestor tehnologii. Transformers au un avans de aproape opt ani și un vast ecosistem de instrumente, biblioteci și expertiză. Arhitecturile alternative trebuie să fie nu doar superioare din punct de vedere tehnic, ci și utilizabile din punct de vedere practic. Istoria tehnologiei este plină de soluții superioare din punct de vedere tehnic care au eșuat pe piață din cauza deficiențelor ecosistemului.
Interesant este că și concurența chineză se bazează pe abordări alternative. DeepSeek V3, un model open-source cu 671 de miliarde de parametri, folosește o arhitectură mixtă de experți în care doar 37 de miliarde de parametri sunt activați per token. Modelul atinge performanțe comparabile cu cele ale concurenților occidentali în testele de performanță, dar a fost antrenat la o fracțiune din cost. Timpul de antrenament a fost de doar 2,788 milioane de ore GPU H800, semnificativ mai puțin decât modelele comparabile.
Această evoluție arată că liderii tehnologici nu aparțin neapărat celor mai puternici jucători financiar. Deciziile arhitecturale inteligente și optimizările pot compensa avantajele în materie de resurse. Pentru peisajul global al inteligenței artificiale, aceasta înseamnă o multipolaritate crescândă. China, Europa și alte regiuni își dezvoltă propriile abordări care nu sunt simple copii ale modelelor occidentale.
Reevaluarea și inevitabila mahmureală
Convergența tuturor acestor factori sugerează o reevaluare iminentă a industriei IA. Evaluările actuale se bazează pe ipoteza unei creșteri exponențiale continue, atât în ceea ce privește performanța modelelor, cât și adoptarea comercială. Ambele ipoteze devin din ce în ce mai discutabile. Performanța modelelor stagnează, în timp ce costurile continuă să crească vertiginos. Deși adoptarea comercială este în creștere, monetizarea rămâne o provocare.
OpenAI, cu o evaluare de jumătate de trilion de dolari, ar trebui să crească la cel puțin 100 de miliarde de dolari în venituri anuale și să devină profitabilă în următorii ani pentru a-și justifica evaluarea. Aceasta ar însemna o creștere de zece ori în doar câțiva ani. Prin comparație, Google a avut nevoie de peste un deceniu pentru a crește veniturile de la 10 miliarde de dolari la 100 de miliarde de dolari. Așteptările pentru companiile de inteligență artificială sunt nerealiste de mari.
Analiștii avertizează asupra unei potențiale spargeri a bulei inteligenței artificiale. Paralelele cu bula dot-com sunt evidente. Atunci, ca și acum, există tehnologie revoluționară cu un potențial enorm. Apoi, ca și acum, există evaluări umflate irațional și structuri de finanțare circulare. Atunci, ca și acum, investitorii justifică evaluările absurde argumentând că tehnologia va schimba totul și că metricile tradiționale de evaluare nu mai sunt aplicabile.
Diferența crucială: Spre deosebire de multe companii dot-com, firmele de inteligență artificială de astăzi au de fapt produse funcționale cu valoare reală. ChatGPT nu este un vaporware, ci o tehnologie utilizată zilnic de milioane de oameni. Întrebarea nu este dacă inteligența artificială este valoroasă, ci dacă este suficient de valoroasă pentru a justifica evaluările actuale. Răspunsul este, cel mai probabil, nu.
Când va veni reevaluarea, va fi dureroasă. Fondurile de capital de risc au investit 70% din capitalul lor în inteligență artificială. Fondurile de pensii și investitorii instituționali sunt expuși masiv. O scădere semnificativă a evaluărilor inteligenței artificiale ar avea consecințe financiare de amploare. Companiile care se bazează pe finanțare ieftină s-ar confrunta brusc cu dificultăți în a strânge capital. Proiectele ar fi oprite, iar personalul ar fi concediat.
Perspectiva pe termen lung și calea de urmat
În ciuda acestor perspective sumbre pe termen scurt, potențialul pe termen lung al inteligenței artificiale rămâne imens. Explozia actuală nu schimbă importanța fundamentală a tehnologiei. Întrebarea nu este dacă, ci cum și când își va îndeplini promisiunea inteligența artificială. Trecerea lui LeCun de la dezvoltarea de produse pe termen scurt la cercetarea fundamentală pe termen lung indică direcția.
Următoarea generație de sisteme de inteligență artificială va arăta probabil diferit față de modelele de învățare în cunoștințe de cauză (LLM) de astăzi. Va combina elemente ale modelelor mondiale, arhitecturi alternative și noi paradigme de antrenament. Se va baza mai puțin pe scalarea prin forță brută și mai mult pe reprezentări eficiente și structurate. Va învăța din lumea fizică, nu doar din text. Și va înțelege cauzalitatea, nu doar corelațiile.
Această viziune necesită însă timp, răbdare și libertatea de a efectua cercetări fundamentale. Tocmai aceste condiții sunt greu de găsit în mediul actual de piață. Presiunea de a obține un succes comercial rapid este imensă. Rapoartele trimestriale și rundele de evaluare domină agenda. Programele de cercetare pe termen lung, care pot dura ani pentru a produce rezultate, sunt greu de justificat.
Decizia lui LeCun de a fonda un startup la 65 de ani este o declarație remarcabilă. Ar fi putut să se pensioneze cu toate onorurile și cu un loc garantat în istorie. În schimb, a ales calea dificilă de a urmări o viziune respinsă de mainstream-ul industriei. Meta va rămâne partener, ceea ce înseamnă că firma sa va avea resurse, cel puțin inițial. Dar succesul său real va depinde de posibilitatea sa de a demonstra în anii următori că Inteligența Artificială Avansată este într-adevăr superioară.
Transformarea va dura ani de zile. Chiar dacă LeCun are dreptate și modelele mondiale sunt fundamental superioare, acestea trebuie totuși dezvoltate, optimizate și industrializate. Ecosistemul trebuie construit. Dezvoltatorii trebuie să învețe cum să utilizeze noile instrumente. Companiile trebuie să migreze de la LLM-uri la noile sisteme. Aceste faze de tranziție au fost întotdeauna dureroase din punct de vedere istoric.
De la exagerări la realitate: Cursul de acțiune pe termen lung în domeniul inteligenței artificiale
Plecarea lui Yann LeCun de la Meta marchează mai mult decât o simplă schimbare de personal. Simbolizează tensiunea fundamentală dintre viziunea științifică și pragmatismul comercial, dintre inovația pe termen lung și cerințele pieței pe termen scurt. Actuala revoluție a inteligenței artificiale se află într-un punct de cotitură. Succesele ușoare ale scalării au fost epuizate. Următorii pași vor fi mai dificili, mai costisitori și mai incerti.
Pentru investitori, aceasta înseamnă că evaluările exorbitante ale actualilor campioni ai inteligenței artificiale trebuie examinate critic. Pentru companii, aceasta înseamnă că speranța unor miracole rapide ale productivității prin intermediul inteligenței artificiale ar putea fi dezamăgită. Pentru societate, aceasta înseamnă că transformarea va fi mai lentă și mai inegală decât sugerează valul de exagerări.
În același timp, fundația rămâne robustă. IA nu este o modă trecătoare, ci o tehnologie fundamentală care va transforma practic toate sectoarele economiei pe termen lung. Paralelele cu revoluția industrială sunt pertinente. Ca și atunci, vor exista câștigători și perdanți, excese și corecții, răsturnări și ajustări. Întrebarea nu este dacă arhitectura transformatorului a ajuns la capătul capacităților sale, ci cum va arăta următoarea fază și cine o va modela.
Pariul lui LeCun pe inteligența artificială avansată și pe modelele lumii este îndrăzneț, dar s-ar putea dovedi a fi unul viziv. În cinci ani, vom ști dacă ruperea cu curentul dominant a fost decizia corectă sau dacă industria a rămas pe drumul cel bun. Anii următori vor fi cruciali pentru dezvoltarea pe termen lung a inteligenței artificiale și, în consecință, pentru viitorul economic și societal.
Expertiza noastră americană în dezvoltarea afacerilor, vânzări și marketing

Expertiza noastră americană în dezvoltarea afacerilor, vânzări și marketing - Imagine: Xpert.Digital
Domenii de interes industrial: B2B, digitalizare (de la IA la XR), inginerie mecanică, logistică, energii regenerabile și industrie
Mai multe informații aici:
Un centru tematic care oferă perspective și expertiză:
- Platformă de cunoștințe care acoperă economiile globale și regionale, inovația și tendințele specifice industriei
- O colecție de analize, perspective și informații generale din principalele noastre domenii de interes
- Un loc pentru expertiză și informații despre evoluțiile actuale din afaceri și tehnologie
- Un hub pentru companiile care caută informații despre piețe, digitalizare și inovații industriale
Partenerul dumneavoastră global de marketing și dezvoltare a afacerilor
☑️ Limba noastră de afaceri este engleza sau germana
☑️ NOU: Corespondență în limba ta maternă!
Eu și echipa mea suntem bucuroși să vă fim la dispoziție în calitate de consilier personal.
Mă puteți contacta completând formularul de contact de aici sau pur și simplu sunându-mă la +49 89 89 674 804 ( München) . Adresa mea de e-mail este: wolfenstein@xpert.digital
Aștept cu nerăbdare proiectul nostru comun.
☑️ Suport pentru IMM-uri în strategie, consultanță, planificare și implementare
☑️ Crearea sau realinierea strategiei digitale și a digitalizării
☑️ Extinderea și optimizarea proceselor de vânzări internaționale
☑️ Platforme de tranzacționare B2B globale și digitale
☑️ Dezvoltare Afaceri Pioneer / Marketing / PR / Târguri Comerciale
🎯🎯🎯 Beneficiați de expertiza extinsă, în cinci domenii, a Xpert.Digital într-un pachet complet de servicii | BD, R&D, XR, PR și optimizare a vizibilității digitale

Beneficiați de expertiza extinsă, în cinci domenii, a Xpert.Digital într-un pachet complet de servicii | Cercetare și dezvoltare, XR, PR și optimizare a vizibilității digitale - Imagine: Xpert.Digital
Xpert.Digital deține cunoștințe aprofundate în diverse industrii. Acest lucru ne permite să dezvoltăm strategii personalizate, aliniate cu precizie cerințelor și provocărilor segmentului dumneavoastră specific de piață. Prin analiza continuă a tendințelor pieței și monitorizarea evoluțiilor din industrie, putem acționa proactiv și oferi soluții inovatoare. Combinația dintre experiență și expertiză generează valoare adăugată și oferă clienților noștri un avantaj competitiv decisiv.
Mai multe informații aici:





















