Veebisaidi ikoon Xpert.digital

AMI – täiustatud masinintellekt – skaleerimise lõpp: miks Yann LeCun enam õigusteaduse magistriõppesse ei usu

AMI - Täiustatud masinintellekt – skaleerimise lõpp: miks Yann LeCun enam õigusteaduse magistriõppesse ei usu

AMI – Täiustatud masinintellekt – Skaleerimise lõpp: miks Yann LeCun enam õigusteadustesse ei usu – Pilt: Xpert.Digital

Umpikuine superintelligentsi asemel: miks Meta peamine visionäär nüüd tagasi astub

600 miljardit eksliku lähenemise eest? "Tehisintellekti ristiisa" panustab LLaMA, ChatGPT ja teiste vastu.

Teadaanne tabas tehnoloogiatööstust nagu välgulöök 2025. aasta novembris. Yann LeCun, üks kolmest süvaõppe asutajast ja Meta peateadlane, teatas oma lahkumisest pärast kahtteist aastat ettevõttes, et asutada oma idufirma. See otsus on palju enamat kui ühe teadlase isiklik karjäärivalik. See tähistab põhimõttelist pöördepunkti ülemaailmses tehisintellekti tööstuses ja näitab kasvavat lõhet lühiajaliste turuhuvide ja pikaajalise teadusliku visiooni vahel.

LeCuni, kes sai 2018. aastal koos Geoffrey Hintoni ja Yoshua Bengioga Turingi auhinna, peetakse konvolutsiooniliste närvivõrkude arhitektiks, mis moodustavad tänapäeval moodsate pilditöötlussüsteemide aluse. Tema lahkumine toimub ajal, mil kogu tööstusharu investeerib sadu miljardeid dollareid suurtesse keelemudelitesse – tehnoloogiasse, mida LeCun on aastaid kirjeldanud kui põhimõttelist ummikteed. Oma uue ettevõttega kavatseb nüüdseks 65-aastane teadlane järgida seda, mida ta nimetab täiustatud masinintellektiks – radikaalselt erinevat lähenemisviisi, mis põhineb maailmamudelitel ja alustab füüsilisest tajust, mitte tekstist.

Selle arengu majanduslikud tagajärjed on tohutud. Meta ise on viimase kolme aasta jooksul investeerinud tehisintellekti taristusse üle 600 miljardi dollari. OpenAI väärtus on jõudnud poole triljoni dollarini, hoolimata sellest, et aastakäive on vaid kümme miljardit dollarit. Kogu tööstusharu on liikunud suunas, mida üks selle olulisemaid teerajajaid on nüüd avalikult ummikteeks nimetanud. Selle nihke majanduslike tagajärgede mõistmiseks tuleb süveneda praeguse tehisintellekti revolutsiooni tehnilistesse, organisatsioonilistesse ja finantsstruktuuridesse.

Sobib selleks:

Mulli arhitektuur

Google'i teadlaste poolt 2017. aastal kasutusele võetud Transformeri arhitektuur on muutnud tehisintellekti maastikku enneolematu kiirusega. See lähenemisviis võimaldas esmakordselt tõhusalt töödelda tohutul hulgal teksti ja treenida keelemudeleid varem kättesaamatute võimalustega. OpenAI ehitas sellele alusele oma GPT-seeriaga, mis koos ChatGPT-ga 2022. aasta novembris demonstreeris esmakordselt laiale publikule, mida need tehnoloogiad suudavad saavutada. Vastukaja oli plahvatuslik. Mõne kuuga voolas sektorisse kümneid miljardeid dollareid.

Alates 2024. aasta lõpust on aga üha rohkem märke sellest, et see eksponentsiaalne areng on oma piirini jõudmas. OpenAI on GPT-4 järeltulijat, mida sisemiselt nimetatakse Orioniks või GPT-5-ks, arendanud juba üle 18 kuu. Ettevõte on väidetavalt läbi viinud vähemalt kaks suurt treeningtsüklit, millest igaüks maksis umbes 500 miljonit dollarit. Tulemused on olnud kainestavad. Kuigi GPT-4 kujutas endast tohutut jõudlushüpet võrreldes GPT-3-ga, on Orioni edusammud GPT-4-ga võrreldes marginaalsed. Mõnes valdkonnas, eriti programmeerimises, ei näita mudel praktiliselt mingit edasiminekut.

See areng on põhimõtteliselt vastuolus skaleerimisseadustega – nende empiiriliste põhimõtetega, mis kuni viimase ajani juhtisid kogu tööstusharu. Põhiidee oli lihtne: kui mudelit suurendada, treenimiseks kasutada rohkem andmeid ja investeerida rohkem arvutusvõimsust, siis jõudluse kasv järgib ennustatavat astmefunktsiooni. See põhimõte näis kehtivat kõikjal ja õigustas viimaste aastate astronoomilisi investeeringuid. Nüüd selgub, et need kõverad lamenevad. Järgmine investeeringu kahekordistamine ei anna enam oodatavat jõudluse kahekordistumist.

Sellel on arvukalt ja tehniliselt keerulisi põhjuseid. Peamine probleem on andmemüür. GPT-4 treeniti ligikaudu 13 triljoni žetooniga, mis on sisuliselt kogu avalikult kättesaadav internet. GPT-5 jaoks lihtsalt pole piisavalt uusi ja kvaliteetseid andmeid. OpenAI on reageerinud tarkvaraarendajate, matemaatikute ja teoreetiliste füüsikute palkamisega, et genereerida uusi andmeid koodi kirjutamise ja matemaatiliste probleemide lahendamise teel. Isegi kui 1000 inimest toodaksid päevas 5000 sõna, kuluks vaid miljardi žetooni genereerimiseks kuid. Inimeste loodud andmete abil skaleerimine lihtsalt ei toimi.

Alternatiivina toetuvad ettevõtted üha enam sünteetilistele andmetele – see tähendab teiste tehisintellekti mudelite loodud andmetele. Kuid siin varitseb uus oht: mudeli kokkuvarisemine. Kui mudeleid treenitakse rekursiivselt teiste mudelite loodud andmete põhjal, võimenduvad väikesed vead põlvkondade jooksul. Tulemuseks on mudelid, mis kaovad reaalsusest üha enam ja kus andmetes esinevad vähemusrühmad kaovad ebaproportsionaalselt. 2024. aastal ajakirjas Nature avaldatud uuring näitas, et see protsess toimub üllatavalt kiiresti. Sünteetilised andmed ei ole seega imerohi, vaid pigem kaasnevad märkimisväärsete riskidega.

Energiaüleminek ja kasvu piirid

Lisaks andmebarjäärile on olemas teine, veelgi olulisem barjäär: energiabarjäär. GPT-3 treenimine tarbis ligikaudu 1300 megavatt-tundi elektrit, mis on samaväärne 130 Ameerika leibkonna aastatarbimisega. GPT-4 vajas hinnanguliselt 50 korda rohkem ehk 65 000 megavatt-tundi. Suurte tehisintellekti mudelite treenimiseks vajalik arvutusvõimsus kahekordistub umbes iga 100 päeva järel. See eksponentsiaalne kõver viib kiiresti füüsiliste piiranguteni.

Andmekeskused, mis neid mudeleid treenivad ja käitavad, tarbivad juba sama palju elektrit kui väikelinnad. Rahvusvaheline Energiaagentuur ennustab, et andmekeskuste elektritarbimine suureneb 2026. aastaks 80 protsenti, 20 teravatt-tunnilt 2022. aastal 36 teravatt-tunnini 2026. aastal. Tehisintellekt on selle kasvu peamine edasiviija. Võrdluseks, üks ChatGPT päring tarbib umbes kümme korda rohkem energiat kui Google'i otsing. Arvestades miljardeid päringuid päevas, teeb see kokku tohutu summa.

See areng sunnib tehnoloogiaettevõtteid võtma drastilisi meetmeid. Microsoft on juba sõlminud lepingud tuumaenergia pakkujatega. Meta, Amazon ja Google investeerivad lähiaastatel vajaliku infrastruktuuri ehitamiseks kokku üle 1,3 triljoni dollari. Kuid need investeeringud on füüsiliste ja poliitiliste piiride ees. USA-l lihtsalt pole piisavalt energiainfrastruktuuri kavandatud tehisintellekti andmekeskuste toiteks. Analüütikute hinnangul võivad 750 miljardi dollari väärtuses projektid energiainfrastruktuuri kitsaskohtade tõttu 2030. aastaks edasi lükkuda.

Sellele lisandub geopoliitiline mõõde. Tehisintellekti tööstuse energiavajadus süvendab konkurentsi ressursside pärast ja suurendab sõltuvust fossiilkütustest. Samal ajal kui poliitikakujundajad nõuavad kliimaneutraalsust, suurendab tehisintellekti tööstus energiatarbimist. See pinge süveneb lähiaastatel ja võib viia regulatiivsete sekkumisteni, mis piiravad tööstuse kasvu.

Arhitektuuriline sein ja LeCuni alternatiiv

Kolmas barjäär on ehk kõige fundamentaalsem: arhitektuurne sein. Yann LeCun on aastaid väitnud, et Transformeri arhitektuuril on loomupärased piirangud, mida ei saa lihtsalt skaleerimisega ületada. Tema kriitika keskendub suurte keelemudelite (Large Language Models) põhilisele toimimisviisile. Need süsteemid on treenitud ennustama järgmist sõna järjestuses. Nad õpivad statistilisi mustreid massiivsetes tekstikorpustes, kuid nad ei arenda tõelist arusaama põhjuslikkusest, füüsikaseadustest ega pikaajalisest planeerimisest.

LeCun illustreerib probleemi hea meelega võrdlusega: nelja-aastane laps on visuaalse taju kaudu omastanud maailma kohta rohkem teavet kui parimad keelemudelid teksti kaudu. Laps saab intuitiivselt aru, et objektid ei kao lihtsalt ära, et rasked asjad kukuvad ja et tegudel on tagajärjed. Nad on välja töötanud maailmamudeli, füüsilise reaalsuse sisemise kujutuse, mida nad kasutavad ennustuste tegemiseks ja tegevuste planeerimiseks. Õigusteaduse magistrantidel see põhivõime puudub. Nad suudavad genereerida muljetavaldavalt sidusat teksti, kuid nad ei mõista maailma.

See piirang ilmneb praktilistes rakendustes ikka ja jälle. Kui paluda GPT-4-l visualiseerida pöörlevat kuupi, siis see ebaõnnestub ülesandes, mida iga laps saab hõlpsasti täita. Keeruliste ülesannete puhul, mis nõuavad mitmeastmelist planeerimist, ebaõnnestuvad mudelid regulaarselt. Nad ei saa vigadest usaldusväärselt õppida, sest iga märgi ennustusviga potentsiaalselt kaskaadib ja võimendub. Autoregressiivsetel mudelitel on põhimõtteline haprus: viga järjestuse alguses võib kogu tulemuse rikkuda.

LeCuni alternatiiviks on maailmamudelid, mis põhinevad ühise manustamise ennustaval arhitektuuril (Joint Embedding Predictive Architecture). Põhiidee on see, et tehisintellekti süsteemid ei peaks õppima tekstiennustuse, vaid pigem tulevaste olekute abstraktsete esituste ennustamise kaudu. Pikslite või märkide kaupa genereerimise asemel õpib süsteem maailma tihendatud ja struktureeritud esituse ning saab seda kasutada erinevate stsenaariumide vaimseks simuleerimiseks enne tegutsemist.

LeCuni juhtimisel on Meta juba välja töötanud mitu selle lähenemisviisi rakendust. I-JEPA piltide ja V-JEPA videote jaoks näitavad paljulubavaid tulemusi. Need mudelid õpivad kõrgetasemelisi objektikomponente ja nende ruumilisi seoseid ilma intensiivse andmehõiveta. Samuti on nende treenimine oluliselt energiatõhusam kui tavapäraste mudelite puhul. Visiooniks on ühendada need lähenemisviisid hierarhilisteks süsteemideks, mis suudavad töötada erinevatel abstraktsioonitasanditel ja ajakavadel.

Oluline erinevus seisneb õppeprotsessi olemuses. Kui õigusteaduse magistrid (LLM-id) tegelevad mustrite sobitamisega steroididel, siis maailmamudelite eesmärk on haarata reaalsuse struktuuri ja põhjuslikkust. Tugeva maailmamudeliga süsteem suudaks oma tegevuste tagajärgi ette näha ilma neid tegelikult ellu viimata. See suudaks õppida mõnest näitest, sest see mõistab aluspõhimõtteid, mitte ainult pealiskaudseid seoseid.

Organisatsiooniline düsfunktsioon ja Meta eksistentsiaalne kriis

LeCuni lahkumine ei ole aga üksnes teaduslik otsus, vaid ka Meta organisatsioonilise düsfunktsiooni tagajärg. 2025. aasta juunis teatas tegevjuht Mark Zuckerberg tehisintellekti osakondade ulatuslikust ümberkorraldamisest. Ta asutas Meta Superintelligence Labsi, uue üksuse, mille eesmärk on arendada tehisintellekti üldisi ülesandeid. Seda juhtis Alexandr Wang, 28-aastane andmete ettevalmistamisega tegeleva ettevõtte Scale AI endine tegevjuht. Meta investeeris Scale AI-sse 14,3 miljardit dollarit ja värbas konkurentide seast üle 50 inseneri ja teadlase.

See otsus pööras olemasoleva struktuuri pea peale. LeCuni tehisintellekti fundamentaaluuringute meeskond, mis oli aastaid PyTorchi ja esimeste Llama mudelite arendamisega tegelenud, jäi kõrvale. FAIR oli suunatud viie- kuni kümneaastasele fundamentaaluuringule, samas kui uued superintelligentsuse laborid keskendusid lühiajalisele tootearendusele. Allikate sõnul valitseb Meta tehisintellekti osakondades üha suurem kaos. Äsja palgatud tipptalendid väljendasid pettumust suurkorporatsiooni bürokraatia üle, samas kui väljakujunenud meeskonnad nägid oma mõjuvõimu vähenemas.

Olukord halvenes mitmete ümberkorralduste tõttu kõigest kuue kuu jooksul. 2025. aasta augustis reorganiseeriti Superintelligence Labs uuesti, seekord neljaks allüksuseks: salapärane TBD labor uute mudelite jaoks, tootemeeskond, infrastruktuurimeeskond ja FAIR. Oktoobris järgnes järjekordne koondamislaine, mille käigus saadeti lahkumishüvitist umbes 600 töötajale. Põhjuseks oli organisatsioonilise keerukuse vähendamine ja tehisintellekti arendamise kiirendamine.

Need pidevad ümberkorraldused on teravas vastuolus konkurentide, nagu OpenAI, Google'i ja Anthropicu, suhtelise stabiilsusega. Need viitavad Meta põhimõttelisele ebakindlusele õige strateegilise suuna osas. Zuckerberg on tunnistanud, et Meta jääb tehisintellekti domineerimise võidujooksus maha. 2025. aasta aprillis turule lastud Llama 4 oli pettumus. Kuigi Mavericku mudel näitas head efektiivsust, kukkus see pikemas perspektiivis dramaatiliselt läbi. Ilmusid väited, et Meta optimeeris võrdlusaluste jaoks mudeleid spetsiaalselt tavaliste testküsimuste põhjal, suurendades seeläbi kunstlikult jõudlust.

LeCuni jaoks muutus olukord talumatuks. Tema nägemus pikaajalisest fundamentaaluuringust oli vastuolus survega saavutada lühiajalisi tooteedu. Tõenäoliselt aitas tema otsusele kaasa asjaolu, et ta allus sisuliselt märkimisväärselt nooremale Wangile. Oma hüvastijätukirjas rõhutab LeCun, et Meta jääb tema uues ettevõttes partneriks, kuid sõnum on selge: sõltumatu uurimistöö, mida ta peab oluliseks, pole ettevõtte struktuuride raames enam võimalik.

 

Digitaalse transformatsiooni uus dimensioon hallatud tehisintellekti (AI) abil - platvorm ja B2B-lahendus | Xpert Consulting

Digitaalse transformatsiooni uus dimensioon hallatud tehisintellekti (AI) abil – platvorm ja B2B-lahendus | Xpert Consulting - pilt: Xpert.Digital

Siit saate teada, kuidas teie ettevõte saab kiiresti, turvaliselt ja ilma kõrgete sisenemisbarjäärideta rakendada kohandatud tehisintellekti lahendusi.

Hallatud tehisintellekti platvorm on teie igakülgne ja muretu tehisintellekti pakett. Keerulise tehnoloogia, kalli infrastruktuuri ja pikkade arendusprotsesside asemel saate spetsialiseerunud partnerilt teie vajadustele vastava võtmed kätte lahenduse – sageli juba mõne päeva jooksul.

Peamised eelised lühidalt:

⚡ Kiire teostus: Ideest rakenduseni päevade, mitte kuude jooksul. Pakume praktilisi lahendusi, mis loovad kohest väärtust.

🔒 Maksimaalne andmeturve: Teie tundlikud andmed jäävad teie kätte. Garanteerime turvalise ja nõuetele vastava töötlemise ilma andmeid kolmandate osapooltega jagamata.

💸 Finantsriski pole: maksate ainult tulemuste eest. Suured esialgsed investeeringud riist- ja tarkvarasse või personali jäävad täielikult ära.

🎯 Keskendu oma põhitegevusele: Keskendu sellele, mida sa kõige paremini oskad. Meie tegeleme sinu tehisintellekti lahenduse kogu tehnilise juurutamise, käitamise ja hooldusega.

📈 Tulevikukindel ja skaleeritav: teie tehisintellekt kasvab koos teiega. Tagame pideva optimeerimise ja skaleeritavuse ning kohandame mudeleid paindlikult uutele nõuetele.

Lisateavet selle kohta siin:

 

Hüpest reaalsuseni: tehisintellekti tööstuse peatselt toimuv ümberhindamine

Villide moodustumise majanduslik anatoomia

Meta arengud on iseloomulikud tehisintellekti tööstuse laiemale majandusdünaamikale. Pärast ChatGPT läbimurret 2022. aasta lõpus on alanud enneolematu investeerimisbuum. Ainuüksi 2025. aasta esimeses kvartalis voolas tehisintellekti idufirmadesse 73,1 miljardit dollarit, mis moodustas 58 protsenti kõigist riskikapitaliinvesteeringutest. OpenAI väärtus ulatus 500 miljardi dollarini, mis tegi sellest esimese eraettevõtte, mis ületas selle läve ilma kunagi kasumlikkust teenimata.

Hinnangud on tegelike tuludega võrreldes metsikult ebaproportsionaalsed. OpenAI teenis 2025. aastal 10 miljardit dollarit aastatulu, mille väärtus oli 500 miljardit dollarit, mille tulemuseks oli hinna ja müügitulu suhe 50. Võrdluseks, isegi dot-com-mulli haripunktis saavutasid vähesed ettevõtted selliseid kordseid. Anthropicu väärtus on 170 miljardit dollarit, tulu 2,2 miljardit dollarit ja P/E suhe ligikaudu 77. Need arvud viitavad tohutule ülehindamisele.

Eriti problemaatiline on väljakujunenud ringfinantseerimisstruktuur. Nvidia investeerib OpenAI-sse 100 miljardit dollarit, mis omakorda on kohustatud ostma kümnete miljardite dollarite väärtuses Nvidia kiipe. OpenAI sõlmis AMD-ga sarnaseid tehinguid kümnete miljardite dollarite väärtuses. Microsoft on investeerinud OpenAI-sse üle 13 miljardi dollari ja majutab oma infrastruktuuri Azure'is. Amazon investeeris 8 miljardit dollarit Anthropicusse, mis vastutasuks kasutab oma peamise pilveplatvormina AWS-i ja Amazoni enda tehisintellekti kiipe.

Need korraldused meenutavad kõhedusttekitavalt 1990. aastate lõpu ringfinantseerimist, kui tehnoloogiaettevõtted müüsid üksteisele seadmeid ja kajastasid tehinguid tuluna ilma reaalset majanduslikku väärtust genereerimata. Analüütikud räägivad üha keerukamast ja läbipaistmatumast ärisuhete võrgustikust, mis õhutab triljoni dollari suurust buumi. Paralleelid dot-com-mulli ja 2008. aasta finantskriisiga on ilmsed: läbipaistmatud ja ebatraditsioonilised rahastamismehhanismid, mida investoritel on raske mõista ja hinnata.

Lisaks sellele on kapitali kontsentratsioon. Seitse suurimat USA tehnoloogiaettevõtet, Magnificent Seven, suurendasid oma energiatarbimist 2023. aastal 19 protsenti, samal ajal kui S&P 500 ettevõtete mediaantarbimine seisis. Ligikaudu 80 protsenti USA aktsiaturu kasvust 2025. aastal oli omistatav tehisintellektiga seotud ettevõtetele. Ainuüksi Nvidiast sai jaeinvestorite seas enim ostetud aktsia, investeerides kiibitootjasse 2024. aastal ligi 30 miljardit dollarit.

See äärmuslik kontsentratsioon kannab endas süsteemseid riske. Kui tootlusootused osutuvad ebareaalseteks, võib turukrahhil olla kaugeleulatuvad tagajärjed. JPMorgani hinnangul võib ainuüksi tehisintellektiga seotud investeerimisjärgu võlakirjade emissioonide maht 2030. aastaks ulatuda 1,5 triljoni dollarini. Suur osa sellest võlast põhineb eeldusel, et tehisintellekti süsteemid genereerivad tohutut tootlikkuse kasvu. Kui see ootus ei realiseeru, on oodata krediidikriisi.

Sobib selleks:

Talendisõda ja sotsiaalsed murrangud

Majanduslikud pinged avalduvad ka tööturul. Avatud tehisintellekti ametikohtade ja kvalifitseeritud kandidaatide suhe on 3,2:1. Avatud ametikohti on 1,6 miljonit, kuid kvalifitseeritud kandidaate on ainult 518 000. See äärmine puudus ajab palgad astronoomilistesse kõrgustesse. Tehisintellekti spetsialistid saavad oma aastasissetulekule lisada kümneid tuhandeid dollareid, omandades oskusi Pythonis, TensorFlow's või spetsiaalsetes tehisintellekti raamistikes.

Konkurents on jõhker. Suured tehnoloogiaettevõtted, hästi rahastatud idufirmad ja isegi valitsused võistlevad sama väikese ekspertide rühma pärast. OpenAI-st on viimastel kuudel lahkunud juhid, sealhulgas kaasasutaja Ilja Sutskever ja tehnoloogiajuht Mira Murati. Paljud neist andekatest inimestest käivitavad oma idufirmasid või liiguvad konkurentide juurde. Meta värbab agressiivselt OpenAI-st, Anthropicust ja Google'ist. Anthropic värbab Metast ja OpenAI-st.

Sellel dünaamikal on mitu tagajärge. Esiteks killustab see teadusmaastikku. Ühiste eesmärkide nimel töötamise asemel konkureerivad eri organisatsioonide väikesed meeskonnad samade läbimurrete nimel. Teiseks suurendab see kulusid. Tehisintellekti spetsialistide tohutud palgad on jätkusuutlikud ainult hästi kapitaliseeritud ettevõtetele, mis välistab turult väiksemad tegijad. Kolmandaks lükkab see projekte edasi. Ettevõtted teatavad, et vabad ametikohad jäävad kuude kaupa täitmata, mis häirib arendusgraafikuid.

Ühiskondlikud tagajärjed ulatuvad tehnoloogiasektorist kaugemale. Kui tehisintellekt esindab tõeliselt järgmist tööstusrevolutsiooni, siis on tööturul ees tohutu murrang. Erinevalt esimesest tööstusrevolutsioonist, mis mõjutas peamiselt füüsilist tööd, on tehisintellekt suunatud kognitiivsetele ülesannetele. Ohustatud pole mitte ainult lihtne andmesisestus ja klienditeenindus, vaid potentsiaalselt ka kõrgelt kvalifitseeritud ametid, nagu programmeerijad, disainerid, juristid ja ajakirjanikud.

Investeerimishalduse valdkonna uuring ennustab tehisintellekti ja suurandmete tõttu tööjõupõhise sissetuleku osakaalu viieprotsendilist langust. See on võrreldav tööstusrevolutsiooni ajal toimunud muutustega, mis põhjustasid viie kuni viieteistkümneprotsendilise languse. Oluline erinevus: praegune muutus toimub aastate, mitte aastakümnete jooksul. Ühiskondadel on kohanemiseks vähe aega.

Testiaegne arvutus ja paradigma muutus

Kuigi eelkoolituse skaleerimisreeglid on jõudmas oma piirini, on tekkinud uus paradigma: test-time computation skaleerimine. OpenAI o1 mudelid näitasid, et järelduste tegemise ajal suurema arvutusvõimsuse investeerimisega on võimalik saavutada märkimisväärset jõudluse kasvu. Mudeli suuruse suurendamise asemel võimaldavad need süsteemid mudelil päringu üle kauem mõelda, selle lahendamiseks mitut lähenemisviisi kasutada ja vastuseid ise kontrollida.

Uuringud näitavad aga, et sellel paradigmal on ka piirangud. Järjestikune skaleerimine, mille puhul mudel itereerib sama probleemi mitu korda, ei vii pidevate täiustusteni. Selliste mudelite nagu Deepseeks R1 ja QwQ uuringud näitavad, et pikemad mõtteprotsessid ei anna automaatselt paremaid tulemusi. Sageli parandab mudel õiged vastused valedele, mitte vastupidi. Tõhusaks järjestikuseks skaleerimiseks vajalik eneserevideerimise võime ei ole piisavalt arenenud.

Paremaid tulemusi annab paralleelne skaleerimine, kus samaaegselt genereeritakse mitu lahendust ja valitakse neist parim. Kuid ka siin väheneb piirkasu iga investeeritud arvutusvõimsuse kahekordistumisega. Kulutõhusus langeb kiiresti. Kommertsrakenduste puhul, mis peavad päevas vastama miljonitele päringutele, on kulud liiga suured.

Tõeline läbimurre võiks seisneda erinevate lähenemisviiside kombineerimises. Hübriidsed arhitektuurid, mis ühendavad transformaatoreid olekumudelitega, lubavad ühendada mõlema tugevused. Olekumudelid, nagu Mamba, pakuvad järeldustes lineaarset skaleerimiskäitumist, samas kui transformaatorid paistavad silma pikaajaliste sõltuvuste tabamisel. Sellised hübriidsüsteemid võiksid tasakaalustada kulu ja kvaliteedi võrrandit.

Alternatiivsed arhitektuurid ja tulevik pärast Transformereid

Lisaks maailmamudelitele on tekkimas mitmeid alternatiivseid arhitektuure, mis võivad vaidlustada Transformerite domineerimise. Olekuruumi mudelid on viimastel aastatel teinud märkimisväärseid edusamme. S4, Mamba ja Hyena näitavad, et efektiivne pika kontekstiga arutluskäik lineaarse keerukusega on võimalik. Samal ajal kui Transformerid skaleeruvad ruutkeskselt järjestuse pikkusega, saavutavad SSMid lineaarse skaleerimise nii treenimisel kui ka järeldamisel.

Need efektiivsuse kasvud võivad olla üliolulised tehisintellekti süsteemide juurutamisel tootmiskeskkondades. Järelduste tegemise kulusid on sageli alahinnatud. Koolitus on ühekordne investeering, kuid järeldused töötavad pidevalt. ChatGPT pole kunagi võrguühenduseta. Miljardite igapäevaste päringute korral annavad isegi väikesed efektiivsuse parandused tohutu kulude kokkuhoiu. Mudelil, mis nõuab sama kvaliteedi saavutamiseks poolt arvutusvõimsust, on tohutu konkurentsieelis.

Väljakutse seisneb nende tehnoloogiate küpsemises. Transformeritel on peaaegu kaheksa-aastane edumaa ning tohutu tööriistade, teekide ja oskusteabe ökosüsteem. Alternatiivsed arhitektuurid peavad olema mitte ainult tehniliselt paremad, vaid ka praktiliselt kasutatavad. Tehnoloogia ajalugu on täis tehniliselt paremaid lahendusi, mis turul läbi kukkusid ökosüsteemi puudumise tõttu.

Huvitaval kombel tugineb ka Hiina konkurents alternatiivsetele lähenemisviisidele. DeepSeek V3, avatud lähtekoodiga mudel, millel on 671 miljardit parameetrit, kasutab ekspertide segu arhitektuuri, kus iga tokeni kohta aktiveeritakse ainult 37 miljardit parameetrit. Mudel saavutab võrdlustestides lääne konkurentidega võrreldava jõudluse, kuid selle treenimine oli murdosa kuludega. Treeninguaeg oli vaid 2,788 miljonit H800 GPU tundi, mis on oluliselt vähem kui võrreldavatel mudelitel.

See areng näitab, et tehnoloogiline juhtpositsioon ei pruugi tingimata peituda rahaliselt kõige võimsamate tegijate käes. Nutikad arhitektuurilised otsused ja optimeerimised võivad kompenseerida ressursieelise. Globaalse tehisintellekti maastiku jaoks tähendab see multipolaarsuse suurenemist. Hiina, Euroopa ja teised piirkonnad arendavad oma lähenemisviise, mis ei ole lihtsalt lääne mudelite koopiad.

Ümberhindamine ja paratamatu pohmell

Kõigi nende tegurite kokkulangemine viitab tehisintellekti tööstuse peatsele ümberhindamisele. Praegused hinnangud põhinevad pideva eksponentsiaalse kasvu eeldusel nii mudeli toimivuse kui ka kommertskasutuse osas. Mõlemad eeldused muutuvad üha küsitavamaks. Mudeli toimivus seisab paigal, samas kui kulud jätkavad hüppelist kasvu. Kuigi kommertskasutus kasvab, on monetiseerimine endiselt keeruline.

Poole triljoni dollari suuruse väärtusega OpenAI peaks oma väärtuse õigustamiseks kasvama vähemalt 100 miljardi dollari suuruse aastakäibeni ja muutuma lähiaastatel kasumlikuks. See tähendaks kümnekordset kasvu vaid mõne aastaga. Võrdluseks, Google'il kulus tulude kasvatamiseks 10 miljardilt dollarilt 100 miljardi dollarini üle kümne aasta. Ootused tehisintellekti ettevõtetele on ebareaalselt kõrged.

Analüütikud hoiatavad tehisintellekti mulli võimaliku lõhkemise eest. Paralleelid dot-com mulliga on ilmsed. Nii nagu praegu, on olemas revolutsiooniline tehnoloogia tohutu potentsiaaliga. Nii nagu praegu, on olemas irratsionaalselt paisutatud väärtused ja ringfinantseerimisstruktuurid. Nii nagu praegu, õigustavad investorid absurdseid väärtuseid väitega, et tehnoloogia muudab kõike ja traditsioonilised hindamisnäitajad ei ole enam rakendatavad.

Oluline erinevus: erinevalt paljudest dot-com ettevõtetest on tänapäeva tehisintellekti firmadel tegelikult toimivad tooted, millel on reaalne väärtus. ChatGPT ei ole vaporware, vaid tehnoloogia, mida miljonid inimesed iga päev kasutavad. Küsimus ei ole selles, kas tehisintellekt on väärtuslik, vaid selles, kas see on piisavalt väärtuslik, et õigustada praeguseid hinnanguid. Vastus on tõenäoliselt eitav.

Kui ümberhindamine toimub, on see valus. Riskikapitalifondid on investeerinud 70 protsenti oma kapitalist tehisintellekti. Pensionifondid ja institutsionaalsed investorid on tohutult ohustatud. Tehisintellekti väärtuste olulisel langusel oleksid kaugeleulatuvad finantstagajärjed. Odavale rahastamisele tuginevatel ettevõtetel oleks ootamatult raskusi kapitali kaasamisega. Projektid peatataks ja töötajad koondataks.

Pikaajaline perspektiiv ja edasine tee

Vaatamata neile süngetele lühiajalistele väljavaadetele on tehisintellekti pikaajaline potentsiaal tohutu. Praegune hüpe ei muuda tehnoloogia fundamentaalset tähtsust. Küsimus ei ole mitte selles, kas tehisintellekt oma lubaduse täidab, vaid selles, kuidas ja millal see täidab. LeCuni nihe lühiajaliselt tootearenduselt pikaajalisele fundamentaaluuringule näitab teed.

Järgmise põlvkonna tehisintellekti süsteemid näevad tõenäoliselt välja erinevad tänapäeva õigusteaduse magistrantidest. Need ühendavad maailmamudelite elemente, alternatiivseid arhitektuure ja uusi treeningparadigmasid. Need toetuvad vähem jõuga skaleerimisele ja rohkem tõhusatele ja struktureeritud esitustele. Need õpivad füüsilisest maailmast, mitte ainult tekstist. Ja need mõistavad põhjuslikku seost, mitte ainult korrelatsioone.

See visioon nõuab aga aega, kannatlikkust ja vabadust teha fundamentaalseid uuringuid. Just neid tingimusi on praeguses turukeskkonnas raske leida. Surve kiire äriedu saavutamiseks on tohutu. Päevakorras domineerivad kvartaliaruanded ja hindamisvoorud. Pikaajalisi uurimisprogramme, mille tulemuste saavutamiseks võib kuluda aastaid, on raske õigustada.

LeCuni otsus asutada idufirma 65-aastaselt on tähelepanuväärne avaldus. Ta oleks võinud pensionile jääda kõigi auavalduste ja garanteeritud kohaga ajaloos. Selle asemel on ta valinud keerulise tee, järgides visiooni, mille valdkonna peavool tagasi lükkas. Meta jääb partneriks, mis tähendab, et tema ettevõttel on ressursse, vähemalt esialgu. Kuid selle tegelik edu sõltub sellest, kas ta suudab lähiaastatel tõestada, et täiustatud masinintellekt on tõepoolest parem.

Ümberkujundamine võtab aastaid. Isegi kui LeCunil on õigus ja maailmamudelid on põhimõtteliselt paremad, tuleb neid ikkagi arendada, optimeerida ja industrialiseerida. Ökosüsteem tuleb üles ehitada. Arendajad peavad õppima uusi tööriistu kasutama. Ettevõtted peavad üle minema õigusteaduse programmidest uutele süsteemidele. Need üleminekufaasid on ajalooliselt alati olnud valusad.

Hüpest reaalsuseni: tehisintellekti pikaajaline tegutsemisviis

Yann LeCuni lahkumine Metast tähistab enamat kui lihtsalt personalivahetust. See sümboliseerib põhimõttelist pinget teadusliku visiooni ja ärilise pragmatismi, pikaajalise innovatsiooni ja lühiajaliste turunõudluste vahel. Praegune tehisintellekti revolutsioon on pöördepunktis. Skaleerimise lihtsad edulood on ammendunud. Järgmised sammud on raskemad, kallimad ja ebakindlamad.

Investorite jaoks tähendab see, et praeguste tehisintellekti liidrite ülemäära kõrgeid hinnanguid tuleb kriitiliselt analüüsida. Ettevõtete jaoks tähendab see, et lootus tehisintellekti abil kiiretele tootlikkuse imedele võib pettuda. Ühiskonna jaoks tähendab see aga seda, et üleminek on aeglasem ja ebaühtlasem, kui hype-laine arvab.

Samal ajal jääb vundament tugevaks. Tehisintellekt ei ole mööduv moehullus, vaid fundamentaalne tehnoloogia, mis muudab pikas perspektiivis praktiliselt kõiki majandussektoreid. Paralleelid tööstusrevolutsiooniga on tabavad. Nagu siis, on ka siis võitjaid ja kaotajaid, liialdusi ja korrektsioone, murranguid ja kohandusi. Küsimus ei ole selles, kas transformaatorarhitektuur on oma võimete piirini jõudnud, vaid selles, milline näeb välja järgmine etapp ja kes seda kujundab.

LeCuni panus täiustatud masinintellektile ja maailmamudelitele on julge, kuid see võib osutuda ettenägelikuks. Viie aasta pärast saame teada, kas peavoolust lahkulöömine oli õige otsus või on tööstusharu jäänud oma kursile. Lähiaastad on tehisintellekti pikaajalise arengu ja sellest tulenevalt ka majandusliku ja ühiskondliku tuleviku jaoks üliolulised.

 

Meie USA-sisene äriarenduse, müügi ja turunduse ekspertiis

Meie USA-s asuv äriarenduse, müügi ja turunduse ekspertiis - pilt: Xpert.Digital

Tööstusharu fookus: B2B, digitaliseerimine (tehisintellektist XR-ini), masinaehitus, logistika, taastuvenergia ja tööstus

Lisateavet selle kohta siin:

Teemakeskus koos teadmiste ja ekspertiisiga:

  • Teadmisplatvorm globaalse ja regionaalse majanduse, innovatsiooni ja tööstusharude suundumuste kohta
  • Analüüside, impulsside ja taustteabe kogumine meie fookusvaldkondadest
  • Koht ekspertiisi ja teabe saamiseks äri- ja tehnoloogiavaldkonna praeguste arengute kohta
  • Teemakeskus ettevõtetele, kes soovivad õppida turgude, digitaliseerimise ja valdkonna uuenduste kohta

 

Teie ülemaailmne turundus- ja äriarenduspartner

☑️ Meie ärikeel on inglise või sakslane

☑️ Uus: kirjavahetus teie riigikeeles!

 

Konrad Wolfenstein

Mul on hea meel, et olete teile ja minu meeskonnale isikliku konsultandina kättesaadav.

Võite minuga ühendust võtta, täites siin kontaktvormi või helistage mulle lihtsalt telefonil +49 89 674 804 (München) . Minu e -posti aadress on: Wolfenstein xpert.digital

Ootan meie ühist projekti.

 

 

☑️ VKE tugi strateegia, nõuannete, planeerimise ja rakendamise alal

☑️ digitaalse strateegia loomine või ümberpaigutamine ja digiteerimine

☑️ Rahvusvaheliste müügiprotsesside laiendamine ja optimeerimine

☑️ Globaalsed ja digitaalsed B2B kauplemisplatvormid

☑️ teerajajate äriarendus / turundus / PR / mõõde

 

🎯🎯🎯 Saa kasu Xpert.Digitali ulatuslikust, viiest astmest koosnevast asjatundlikkusest terviklikus teenustepaketis | BD, R&D, XR, PR ja digitaalse nähtavuse optimeerimine

Saage kasu Xpert.Digitali ulatuslikust, viiekordsest asjatundlikkusest terviklikus teenustepaketis | Teadus- ja arendustegevus, XR, PR ja digitaalse nähtavuse optimeerimine - Pilt: Xpert.Digital

Xpert.digital on sügavad teadmised erinevates tööstusharudes. See võimaldab meil välja töötada kohandatud strateegiad, mis on kohandatud teie konkreetse turusegmendi nõuetele ja väljakutsetele. Analüüsides pidevalt turusuundumusi ja jätkates tööstuse arengut, saame tegutseda ettenägelikkusega ja pakkuda uuenduslikke lahendusi. Kogemuste ja teadmiste kombinatsiooni abil genereerime lisaväärtust ja anname klientidele otsustava konkurentsieelise.

Lisateavet selle kohta siin:

Jäta mobiilversioon