Tehisintellekti revolutsioon ristteel: tehisintellekti buum peegeldub dot-com mullis – hüpe ja kulude strateegiline analüüs

Konrad Wolfenstein

8 kuud tagasi

Tehisintellekti revolutsioon ristteel: tehisintellekti buum peegeldub dot-com mullis – hüpe ja kulude strateegiline analüüs – Pilt: Xpert.Digital

Jätkusuutliku väärtusloome otsingud tehisintellekti hüpe keskel: üllatavad vead ja piirangud, mis tänapäeva tehisintellekti süsteemidel tegelikult on (Lugemisaeg: 36 min / Reklaami pole / Tasumüüri pole)

Räpane tõde tehisintellekti kohta: miks tehnoloogia põletab miljardeid, kuid ei too kasumit

Tehnoloogiamaastik on teelahkmel, mida iseloomustab tehisintellekti (AI) kiire tõus. Generatiivse tehisintellekti edusammudest õhutatud optimismilaine on vallandanud investeerimishulluse, mis oma intensiivsuse ja ulatuse poolest meenutab 1990. aastate lõpu dot-com-mulli. Sajad miljardid dollarid voolavad ühte tehnoloogiasse, mida õhutab kindel usk, et maailm on ajaloolise ulatusega majandusrevolutsiooni äärel. Astronoomilised hinnangud ettevõtetele, millel sageli puuduvad kasumlikud ärimudelid, on tavalised ning kullapalaviku mentaliteet on haaranud nii väljakujunenud tehnoloogiahiiglasi kui ka lugematuid idufirmasid. Turuväärtuse koondumine väheste ettevõtete, nn „Suurepärase seitsme“, kätte peegeldab Nasdaqi lemmikute domineerimist minevikus ja õhutab muret ülekuumenenud turudünaamika pärast.

Selle aruande keskne tees on aga see, et vaatamata turumeeleolu pealiskaudsetele sarnasustele on aluseks olevates majanduslikes ja tehnoloogilistes struktuurides suuri erinevusi. Need erinevused toovad kaasa ainulaadse hulga võimalusi ja süsteemseid riske, mis vajavad nüansirikast analüüsi. Kuigi dot-com-hüpe ehitati üles tärkava interneti lubadusele, on tänapäeva tehisintellekti tehnoloogia juba sisse ehitatud paljudesse äriprotsessidesse ja tarbekaupadesse. Investeeritud kapitali iseloom, tehnoloogia küpsus ja turu struktuur loovad põhimõtteliselt erineva lähtepunkti.

Sellega seotud:

Kas 2000. aasta dot-com-mull kordub? Praeguse tehisintellekti buumi kriitiline analüüs

Paralleelid dot-com-ajastuga

Praegust turudebatti iseloomustavad sarnasused, mis tekitavad paljudes investorites déjà vu tunde, on vaieldamatud. Esiteks ja kõige tähtsamaks on äärmuslikud hinnangud. 1990. aastate lõpus sai Nasdaqi aktsiate puhul normiks hinna ja kasumi suhe (P/E suhtarv) 50, 70 või isegi 100. Tänapäeval ulatub S&P 500 tsükliliselt korrigeeritud väärtus 38 korda viimase kümnendi kasumini – tase, mis on hiljutises majandusajaloos ületatud vaid dot-com-mulli haripunktis. Need hinnangud põhinevad vähem praegusel kasumil kui ootustel tulevase monopoolse tootluse kohta muutunud turul.

Teine levinud tunnus on usk tehnoloogia muutvasse jõusse, mis ulatub tehnoloogiasektorist kaugemale. Sarnaselt internetiga lubab tehisintellekt põhjalikult ümber kujundada iga tööstusharu – alates tootmisest ja tervishoiust kuni loomemajanduseni. See ulatusliku revolutsiooni narratiiv õigustab paljude investorite silmis erakordset kapitali sissevoolu ja lühiajaliste kahjude aktsepteerimist pikaajalise turul domineerimise kasuks. See kullapalaviku mentaliteet ei mõjuta mitte ainult investoreid, vaid ka ettevõtteid, kellele avaldatakse survet tehisintellekti rakendada, et vältida mahajäämist, mis omakorda õhutab nõudlust ja sellest tulenevalt ka väärtusi.

Peamised erinevused ja nende mõju

Vaatamata neile paralleelidele on erinevused dot-com-ajastuga praeguse turuolukorra ja selle potentsiaalse arengu mõistmiseks üliolulised. Võib-olla kõige olulisem erinevus seisneb kapitali allikas. Dot-com-mulli rahastasid suures osas väikeinvestorid, kes sageli spekuleerisid krediidiga, ning ülekuumenenud esmase avaliku pakkumise (IPO) turg. See lõi äärmiselt hapra ja turupõhise tsükli. Tänapäeva tehisintellekti buumi seevastu ei rahasta peamiselt spekulatiivsed erainvestorid, vaid pigem maailma kõige tulusamate korporatsioonide ületäitunud kassad. Sellised hiiglased nagu Microsoft, Meta, Google ja Amazon investeerivad strateegiliselt oma väljakujunenud ärivaldkondade tohutut kasumit järgmise tehnoloogiaplatvormi loomisse.

Sellel kapitalistruktuuri nihkel on sügavad tagajärjed. Praegune buum on lühiajaliste turumeeleolude suhtes palju vastupidavam. See pole niivõrd puhtspekulatiivne hullus ja pigem strateegiline pikaajaline võitlus tehnoloogilise ülemvõimu nimel. Need investeeringud on strateegiliselt vajalikud, et „Suurepärane Seitsmik“ järgmises platvormisõjas ellu jääks. See tähendab, et buumi saab säilitada isegi siis, kui tehisintellekti rakendused jäävad pikemaks ajaks kahjumlikuks. Seega ei avalduks potentsiaalne mulli lõhkemine tõenäoliselt mitte väiksemate ettevõtete laiaulatusliku turu kokkuvarisemisena, vaid strateegiliste allahindluste ja suurte tegijate seas toimuva massiivse konsolideerumislainena.

Teine oluline erinevus seisneb tehnoloogilises küpsuses. Umbes aastatuhande vahetuse paiku oli internet noor, mitte veel täielikult väljaarendatud infrastruktuur piiratud ribalaiuse ja madala levikuga. Paljud tolleaegsed ärimudelid kukkusid läbi tehnoloogiliste ja logistiliste probleemide tõttu. Seevastu tänapäeva tehisintellekt, eriti suurte keelemudelite (LLM) kujul, on juba kindlalt integreeritud igapäevasesse äritegevusse ja laialdaselt kasutatavatesse tarkvaratoodetesse. Tehnoloogia ei ole lihtsalt lubadus, vaid juba kasutatav tööriist, mis muudab selle sidususe majandusega oluliselt kindlamaks.

Miks tehisintellekti hüpe ei ole dot-com-mulli koopia – ja võib siiski olla ohtlik

Miks tehisintellekti hüpe ei ole dot-com-mulli koopia – ja võib siiski olla ohtlik – Pilt: Xpert.Digital

Kuigi mõlemat faasi iseloomustab suur optimism, erinevad nad põhijoonte poolest: kui dot-com-mulli umbes 2000. aasta paiku iseloomustasid äärmiselt kõrged P/E suhtarvud (50–100+) ja tugev keskendumine „silmamunadele“ ja kasvule, siis tehisintellekti buum umbes 2025. aasta paiku näitab S&P 500 tsükliliselt korrigeeritud P/E suhtarvu umbes 38 ja fookuse nihkumist eeldatavatele tulevastele monopolidele. Ka rahastamisallikad erinevad: tol ajal domineerisid börsileminekud, võla abil finantseeritavad jaeinvestorid ja riskikapital; tänapäeval tuleb rahastamine peamiselt tehnoloogiahiiglaste kasumist ja strateegilistest investeeringutest. Tehnoloogiline küpsus on samuti oluliselt erinev – internet oli aastatuhande vahetusel veel arendamisel ja piiratud ribalaiusega, samas kui tehisintellekt on nüüd integreeritud ettevõtte tarkvarasse ja lõpptoodetesse. Lõpuks ilmneb turu erinev struktuuriline iseloom: dot-com-faasi iseloomustas suur hulk spekulatiivseid idufirmasid ja Nasdaqi arenevaid aktsiaid, samas kui praegust tehisintellekti buumi iseloomustab äärmuslik koondumine vähestele „Suurepärase Seitsme“ ettevõtetele; Samal ajal on lõppkasutajate omaksvõtt tänapäeval palju suurem, kusjuures juhtivatel tehisintellekti rakendustel on sadu miljoneid kasutajaid.

Keskne küsimus

See analüüs viib selle aruande keskse küsimuseni: kas oleme jätkusuutliku tehnoloogilise ümberkujundamise alguses, mis määratleb uuesti tootlikkuse ja õitsengu? Või on tööstusharu ehitamas kolossaalset, kapitalimahukat masinat ilma kasumliku eesmärgita, luues seeläbi täiesti teistsuguse mulli – kontsentreerituma, strateegilisema ja potentsiaalselt ohtlikuma? Järgmistes peatükkides uuritakse seda küsimust majanduslikust, tehnilisest, eetilisest ja turustrateegilisest vaatenurgast, et maalida terviklik pilt tehisintellekti revolutsioonist selle otsustaval teelahkmel.

Majanduslik reaalsus: jätkusuutmatute ärimudelite analüüs

800 miljardi dollari suurune vahe

Tehisintellekti tööstuse majanduslike väljakutsete keskmes on tohutu struktuuriline ebakõla plahvatuslikult kasvavate kulude ja ebapiisavate tulude vahel. Konsultatsioonifirma Bain & Company murettekitav uuring kvantifitseerib seda probleemi, ennustades 2030. aastaks 800 miljardi dollari suurust rahastamispuudujääki. Uuringu kohaselt peaks tööstusharu selleks ajaks genereerima umbes 2 triljoni dollari suurust aastas tulu, et katta arvutusvõimsuse, infrastruktuuri ja energia kasvavaid kulusid. Prognoosid näitavad aga, et see eesmärk jääb märkimisväärselt saavutamata, mis tekitab põhimõttelisi küsimusi praeguste ärimudelite jätkusuutlikkuse ja astronoomiliste väärtuste õigustatuse kohta.

See lõhe ei ole abstraktne tulevikustsenaarium, vaid põhimõttelise majandusliku valearvestuse tulemus. Eeldus, et sotsiaalmeedia ajastul väljakujunenud lai kasutajaskond viib automaatselt kasumlikkuseni, osutub tehisintellekti kontekstis petlikuks. Erinevalt platvormidest nagu Facebook või Google, kus täiendava kasutaja või interaktsiooni piirkulu on nullilähedane, tekitab tehisintellekti mudelite puhul iga päring – iga genereeritud märk – reaalseid ja mittetriviaalseid arvutuskulusid. See „maksa-mõtte-eest“ mudel õõnestab tarkvaratööstuse traditsioonilist skaleerimisloogikat. Seega muutub suur kasutajate arv potentsiaalsest kasumitegurist kasvavaks kuluteguriks, kui monetiseerimine ei ületa jooksvaid tegevuskulusid.

OpenAI juhtumiuuring: populaarsuse ja kasumlikkuse paradoks

Ükski ettevõte ei illustreeri seda paradoksi paremini kui OpenAI, generatiivse tehisintellekti revolutsiooni lipulaev. Vaatamata muljetavaldavale 300 miljardi dollari suurusele väärtusele ja 700 miljonile iganädalasele kasutajaskonnale kannab ettevõte suuri kahjumeid. Need kahjumid ulatusid 2024. aastal ligikaudu 5 miljardi dollarini ja prognooside kohaselt ulatuvad need 2025. aastaks 9 miljardi dollarini. Probleemi tuum seisneb madalas konversioonimääras: sadadest miljonitest kasutajatest on vaid viis miljonit maksvad kliendid.

Veelgi murettekitavam on arusaam, et isegi kõige kallimad tellimusmudelid ei ole kasumlikud. Aruanded näitavad, et isegi premium-tellimus "ChatGPT Pro", mille hind on 200 dollarit kuus, töötab kahjumiga. Võimsad kasutajad, kes mudeli võimalusi intensiivselt kasutavad, tarbivad rohkem arvutusressursse, kui nende tellimustasu katab. Tegevjuht Sam Altman ise kirjeldas seda kuluolukorda kui "hullumeelsust", rõhutades monetiseerimise põhilist väljakutset. OpenAI kogemus näitab, et klassikaline SaaS-mudel (tarkvara teenusena) jõuab oma piirini, kui kasutajate poolt teenusest saadav väärtus ületab selle pakkumise kulud. Seetõttu peab tööstusharu välja töötama täiesti uue ärimudeli, mis läheb kaugemale lihtsatest tellimustest või reklaamist ja hindab asjakohaselt "intelligentsuse kui teenuse" väärtust – ülesannet, millele praegu pole väljakujunenud lahendust.

Investeerimishullus ilma igasuguse tootluse väljavaateta

Ebapiisava kasumlikkuse probleem ei piirdu ainult OpenAI-ga, vaid läbib kogu tööstusharu. Suured tehnoloogiaettevõtted on haaratud tõelisest investeerimishullusest. Microsoft, Meta ja Google plaanivad 2025. aastaks tehisintellekti projektidesse kokku kulutada 215 miljardit dollarit, samas kui Amazon kavatseb investeerida veel 100 miljardit dollarit. See kulutus, mis on pärast ChatGPT kasutuselevõttu enam kui kahekordistunud, suunatakse peamiselt andmekeskuste laiendamisse ja uute tehisintellekti mudelite väljatöötamisse.

See tohutu kapitaliinvesteering on aga teravas vastuolus seni saavutatud tuludega. Massachusettsi Tehnoloogiainstituudi (MIT) uuring näitas, et 95% küsitletud ettevõtetest ei saavuta vaatamata märkimisväärsetele investeeringutele oma tehisintellekti algatustest mõõdetavat investeeringutasuvust (ROI). Selle peamiseks põhjuseks on nn õppimislünk: enamik tehisintellekti süsteeme ei suuda tagasisidest õppida, konkreetse ärikontekstiga kohaneda ega aja jooksul täiustuda. Nende kasu piirdub sageli töötajate individuaalse tootlikkuse suurendamisega, ilma et see avaldaks ettevõtte kasumiaruandele nähtavat mõju.

See dünaamika paljastab praeguse tehisintellekti buumi sügavama tõe: see on suures osas suletud majandussüsteem. Tehnoloogiahiiglaste investeeritud sajad miljardid ei ole suunatud peamiselt kasumlike lõpptarbijatoodete loomisele. Selle asemel voolavad need otse riistvaratootjatele, eelkõige Nvidiale, ja tagasi ettevõtete enda pilveteenuste osakondadesse (Azure, Google Cloud Platform, AWS). Samal ajal kui tehisintellekti tarkvaraosakonnad kannavad miljardite suurust kahjumit, kogevad pilve- ja riistvarasektorid plahvatuslikku tulude kasvu. Tehnoloogiahiiglased kannavad kapitali oma kasumlikest põhitegevustest tehisintellekti osakondadesse, kes seejärel kulutavad selle raha riistvarale ja pilveteenustele, suurendades seeläbi ettevõtte teiste osade või selle partnerite tulusid. Selles ulatusliku infrastruktuuri ehitamise faasis on lõppkasutaja sageli vaid teisejärguline kaalutlus. Kasumlikkus koondub tehnoloogiakihi alumisse ossa (kiibid, pilveteenuste infrastruktuur), samas kui rakenduste kiht toimib tohutu kahjumi tekitajana.

Altpoolt tulevate häirete oht

Väljakujunenud pakkujate kulukaid ja ressursimahukaid ärimudeleid õõnestab veelgi kasvav oht altpoolt. Turule sisenevad kiiresti uued, odavad konkurendid, eriti Hiinast. Näiteks Hiina mudel Deepseek R1 on oma kiire turuletoomisega näidanud, kui volatiilne on tehisintellekti turg ja kui kiiresti võivad väljakujunenud pakkujad, kellel on kõrge hinnaga mudelid, surve alla sattuda.

See areng on osa laiemast trendist, kus avatud lähtekoodiga mudelid pakuvad paljude kasutusjuhtude jaoks "piisavalt head" jõudlust murdosa hinnaga. Ettevõtted leiavad üha enam, et nad ei vaja kõige kallimaid ja võimsamaid mudeleid selliste rutiinsete ülesannete jaoks nagu lihtsad klassifikatsioonid või tekstikokkuvõtted. Väiksemad, spetsialiseeritud mudelid on sageli mitte ainult odavamad, vaid ka kiiremad ja lihtsamini rakendatavad. See tehisintellekti tehnoloogia "demokratiseerimine" kujutab endast eksistentsiaalset ohtu ärimudelitele, mis põhinevad tipptasemel jõudluse turustamisel premium-hindadega. Kui odavamad alternatiivid pakuvad 90% jõudlusest 1% hinnaga, muutub suurtel müüjatel üha raskemaks oma suuri investeeringuid õigustada ja rahaks teha.

Digitaalse transformatsiooni uus dimensioon hallatud tehisintellekti (AI) abil - platvormi- ja B2B-lahendus | Xpert Consulting

Digitaalse transformatsiooni uus dimensioon hallatud tehisintellekti (AI) abil – platvormi ja B2B lahendus | Xpert Consulting - pilt: Xpert.Digital

Siit saate teada, kuidas teie ettevõte saab kiiresti, turvaliselt ja ilma kõrgete sisenemisbarjäärideta rakendada kohandatud tehisintellekti lahendusi.

Hallatud tehisintellekti platvorm on teie kõikehõlmav ja muretu tehisintellekti lahendus. Keerulise tehnoloogia, kalli infrastruktuuri ja pikkade arendusprotsessidega tegelemise asemel saate spetsialiseerunud partnerilt teie vajadustele vastava valmislahenduse – sageli vaid mõne päeva jooksul.

Peamised eelised lühidalt:

⚡ Kiire teostus: Ideest kasutusvalmis rakenduseni päevade, mitte kuude jooksul. Pakume praktilisi lahendusi, mis loovad kohest lisaväärtust.

🔒 Maksimaalne andmeturve: Teie tundlikud andmed jäävad teie kätte. Garanteerime turvalise ja nõuetele vastava töötlemise ilma andmeid kolmandate osapooltega jagamata.

💸 Finantsriski pole: maksate ainult tulemuste eest. Suured esialgsed investeeringud riist- ja tarkvarasse või personali jäävad täielikult ära.

🎯 Keskendu oma põhitegevusele: Keskendu sellele, mida sa kõige paremini oskad. Meie hoolitseme sinu tehisintellekti lahenduse kogu tehnilise juurutamise, käitamise ja hoolduse eest.

📈 Tulevikukindel ja skaleeritav: teie tehisintellekt kasvab koos teiega. Tagame pideva optimeerimise ja skaleeritavuse ning kohandame mudeleid paindlikult uutele nõuetele.

Lisateavet leiate siit:

Hallatud tehisintellekti lahendus - tööstuslikud tehisintellekti teenused: konkurentsivõime võti teenuste, tööstuse ja masinaehituse sektoris

Tehisintellekti tegelikud kulud – taristu, energia ja investeerimistõkked

Intellekti maksumus: infrastruktuur, energia ja tehisintellekti kulutuste tegelikud ajendid

Koolituskulud vs. järelduskulud: kaheosaline väljakutse

Tehisintellekti kulud saab jagada kahte põhikategooriasse: mudelite treenimise kulud ja nende käitamise kulud ehk järeldused. Suure keelemudeli treenimine on ühekordne, kuid äärmiselt kulukas protsess. See nõuab tohutuid andmekogumeid ja nädalaid või kuid arvutusaega tuhandetel spetsialiseeritud protsessoritel. Tuntud mudelite treenimise kulud illustreerivad nende investeeringute ulatust: GPT-3 maksis umbes 4,6 miljonit dollarit, GPT-4 treenimine on juba üle 100 miljoni dollari ja Google'i Gemini Ultra treenimiskulud on hinnanguliselt 191 miljonit dollarit. Need summad kujutavad endast olulist sisenemisbarjääri ja kinnistavad rahaliselt võimsate tehnoloogiaettevõtete domineerimist.

Kuigi koolituskulud domineerivad pealkirjades, kujutab järeldamine endast palju suuremat ja pikaajalisemat majanduslikku väljakutset. Järeldamine viitab protsessile, kus eelkoolitatud mudelit kasutatakse päringutele vastamiseks ja sisu loomiseks. Iga kasutajapäringuga kaasnevad arvutuskulud, mis akumuleeruvad kasutamisega. Hinnangute kohaselt võivad järeldamiskulud moodustada 85–95% mudeli kogukuludest kogu selle elutsükli jooksul. Need käimasolevad tegevuskulud on peamine põhjus, miks eelmises peatükis kirjeldatud ärimudeleid on nii raske rahaks teha. Kasutajaskonna laiendamine toob otseselt kaasa tegevuskulude suurendamise, pöörates traditsioonilise tarkvaraökonoomika pea peale.

Riistvaralõks: NVIDIA kuldne puur

Hinnaplahvatuse keskmes on kogu tööstusharu kriitiline sõltuvus ühest riistvaratüübist: kõrgelt spetsialiseerunud graafikaprotsessoritest (GPU-dest), mida toodab peaaegu eranditult üks ettevõte, Nvidia. H100 mudelid ja uuemad B200 ja H200 põlvkonnad on saanud tehisintellekti mudelite treenimise ja käitamise de facto standardiks. See turul domineerimine on võimaldanud Nvidial oma toodete eest küsida ülikõrgeid hindu. Ühe H100 GPU ostuhind jääb vahemikku 25 000–40 000 dollarit.

Sellega seotud:

Veider USA buum: šokeeriv tõde paljastab, mis tegelikult juhtuks ilma tehisintellekti hüpeta

Enamiku ettevõtete jaoks pole selle riistvara ostmine võimalik, mis sunnib neid pilves arvutusvõimsust rentima. Kuid isegi siin on kulud tohutud. Ühe tipptasemel GPU rendihinnad jäävad vahemikku 1,50–4,50 dollarit tunnis. Kaasaegsete tehisintellekti mudelite keerukus süvendab seda probleemi. Suur keelemudel ei mahu sageli ühe GPU mällu. Ühe keeruka päringu töötlemiseks tuleb mudel jaotada 8, 16 või enama paralleelselt töötava GPU klastri vahel. See tähendab, et ühe kasutaja seansi maksumus võib spetsiaalse riistvara kasutamisel kiiresti tõusta 50–100 dollarini tunnis. See äärmuslik sõltuvus kallist ja nappist riistvarast loob tehisintellekti tööstusele „kuldse puuri“: see on sunnitud suure osa oma investeeringust edasi andma ühele tarnijale, mis vähendab marginaale ja suurendab kulusid.

Rahuldamatu isu: energia- ja ressursitarbimine

Tohutud riistvaranõuded toovad kaasa teise, sageli alahinnatud kuluteguri, millel on globaalsed tagajärjed: tohutu energia- ja ressursitarbimine. Kümnete tuhandete graafikaprotsessorite käitamine suurtes andmekeskustes tekitab tohutul hulgal jääksoojust, mida tuleb hajutada keerukate jahutussüsteemide abil. Selle tulemuseks on eksponentsiaalselt kasvav nõudlus elektri ja vee järele. Prognoosid maalivad murettekitava pildi: andmekeskuste ülemaailmne elektritarbimine peaks 2030. aastaks enam kui kahekordistuma, ulatudes üle 1000 teravatt-tunnini (TWh), mis on võrdne kogu Jaapani praeguse elektritarbimisega.

Tehisintellekti osakaal selles energiatarbimises kasvab ebaproportsionaalselt. Aastatel 2023–2030 peaks elektrienergia tarbimine ainuüksi tehisintellekti rakenduste tõttu suurenema üheteistkümnekordselt. Paralleelselt neljakordistub andmekeskuste jahutamiseks kuluv veetarbimine 2030. aastaks 664 miljardi liitrini. Videote tootmine on eriti energiamahukas. Siin skaleeruvad kulud ja energiatarbimine ruudukujuliselt video eraldusvõime ja pikkusega, mis tähendab, et kuuesekundilise klipi tegemine nõuab peaaegu neli korda rohkem energiat kui kolmesekundilise klipi tegemine.

Sellel arengul on kaugeleulatuvad tagajärjed. Google'i endine tegevjuht Eric Schmidt väitis hiljuti, et tehisintellekti loomulik piir ei ole ränikiipide, vaid pigem elektri kättesaadavus. Tehisintellekti skaleerimisseadused, mis väidavad, et suuremad mudelid toimivad paremini, on otseses vastuolus energiatootmise füüsikaliste seadustega ja globaalsete kliimaeesmärkidega. Praegune tee „suurem on parem” ei ole ei füüsiliselt ega ökoloogiliselt jätkusuutlik. Seetõttu peavad tulevased läbimurded paratamatult tulema efektiivsuse parandamisest ja algoritmilistest uuendustest, mitte puhtast toore jõuga skaleerimisest. See avab tohutu turuvõimaluse ettevõtetele, mis on võimelised pakkuma suurt jõudlust radikaalselt väiksema energiatarbimisega. Puhta skaleerimise ajastu on lõppemas; efektiivsuse ajastu on algamas.

Nähtamatud kulud: lisaks riistvarale ja elektrile

Lisaks ilmselgetele riistvara- ja energiakuludele on mitmeid „nähtamatuid“ kulusid, mis suurendavad oluliselt tehisintellekti süsteemi kogukulu. Nende hulgas on peamised personalikulud. Kõrgelt kvalifitseeritud tehisintellekti uurijaid ja insenere on vähe ja nad on kallid. Väikese meeskonna palgad võivad kõigest kuue kuu jooksul kiiresti ulatuda 500 000 dollarini.

Teine oluline kulutegur on andmete hankimine ja ettevalmistamine. Kvaliteetsed, puhastatud ja koolitusvalmis andmekogumid on iga suure jõudlusega tehisintellekti mudeli aluseks. Selliste andmekogumite litsentsimine või ostmine võib maksta üle 100 000 dollari. Sellele lisanduvad andmete ettevalmistamise kulud, mis nõuavad nii arvutusressursse kui ka inimteadmisi. Lõpuks ei tohi tähelepanuta jätta pidevaid hoolduskulusid, olemasolevate süsteemidega integreerimist, juhtimist ja regulatiivse vastavuse tagamist. Neid tegevuskulusid on sageli raske kvantifitseerida, kuid need moodustavad olulise osa kogukuludest (TCO) ja neid alahinnatakse eelarve koostamisel sageli.

Tehisintellekti "nähtamatud" kulud

See detailne kulude jaotus näitab, et tehisintellekti majanduslik külg on palju keerulisem, kui esmapilgul paistab. Suured muutuvad järelduskulud takistavad laialdast kasutuselevõttu hinnatundlikes äriprotsessides, kuna need kulud on ettearvamatud ja võivad kasutamisega dramaatiliselt suureneda. Ettevõtted kõhklevad tehisintellekti integreerimisel suuremahulistesse põhiprotsessidesse, kuni järelduskulud oluliselt vähenevad või tekivad uued, prognoositavad hinnamudelid. Seetõttu leidub kõige edukamaid varaseid rakendusi pigem suure väärtusega ja väikesemahulistes valdkondades, nagu ravimite avastamine või keerukas inseneritöö, kui massituru tootlikkuse tööriistades.

Tehisintellekti „nähtamatud” kulud – pilt: Xpert.Digital

Tehisintellekti „nähtamatud” kulud hõlmavad mitut valdkonda: riistvara (eriti graafikaprotsessorite) kulud sõltuvad peamiselt mudeli suurusest ja kasutajate arvust – tüüpilised kulud jäävad vahemikku 1,50–4,50 dollarit ja rohkem GPU kohta tunnis rentimise korral, samas kui graafikaprotsessori ostmine võib maksta 25 000–40 000 dollarit ja rohkem. Energia ja jahutus sõltuvad arvutusintensiivsusest ja riistvara tõhususest; prognooside kohaselt kahekordistub andmekeskuste energiatarbimine üle 1000 TWh aastaks 2030. Tarkvara ja API kulud põhinevad päringute (tokenite) arvul ja mudeli tüübil; hinnad jäävad vahemikku umbes 0,25 dollarit (Mistral 7B) kuni 30 dollarit (GPT-4) miljoni tokeni kohta. Andmete puhul – olenevalt kvaliteedist, mahust ja litsentsimisest – võivad andmekogumite hankimise kulud kergesti ületada 100 000 dollarit. Personalikulud, mida mõjutavad oskuste puudus ja spetsialiseerumise vajadus, võivad väikese meeskonna puhul kuue kuu jooksul ületada 500 000 dollarit. Lõpuks, hooldus ja juhtimine, mida juhivad süsteemi keerukus ja regulatiivsed nõuded, toovad kaasa pidevaid tegevuskulusid, mida on raske täpselt kvantifitseerida.

Hüpe ja reaalsuse vahel: tehnilised puudujäägid ja praeguste tehisintellekti süsteemide piirid

Google Gemini juhtumiuuring: kui fassaad laguneb

Vaatamata tohutule hüpele ja miljarditesse ulatuvatele investeeringutele on isegi juhtivatel tehnoloogiaettevõtetel märkimisväärsed tehnilised probleemid usaldusväärsete tehisintellekti toodete pakkumisel. Google'i raskused oma tehisintellekti süsteemidega Gemini ja Imagen on ilmekas näide kogu tööstusharu hõlmavatest väljakutsetest. Nädalaid on kasutajad teatanud olulistest tõrgetest, mis ulatuvad kaugemale väiksematest programmeerimisvigadest. Näiteks ei suuda Imageni piltide genereerimise tehnoloogia sageli luua pilte kasutaja soovitud vormingutes, näiteks tavalises 16:9 kuvasuhtes, ja toodab selle asemel ainult ruudukujulisi pilte. Tõsisematel juhtudel pildid küll genereeritakse, kuid neid ei saa üldse kuvada, mistõttu funktsioon on praktiliselt kasutuskõlbmatu.

Need praegused probleemid on osa korduvast mustrist. 2024. aasta veebruaris pidi Google Gemini tähtkujus inimeste kuvamise täielikult keelama, kuna süsteem genereeris ajalooliselt absurdseid ja ebatäpseid pilte, näiteks Aasia näojoontega Saksa sõdureid. Teksti genereerimise kvaliteeti kritiseeritakse samuti regulaarselt: kasutajad kurdavad ebajärjekindlate vastuste, isegi kahjutute päringute liigse tsenseerimise ja äärmuslikel juhtudel isegi vihkamist õhutavate sõnumite väljastamise üle. Need juhtumid näitavad, et vaatamata muljetavaldavale potentsiaalile on tehnoloogia endiselt kaugel usaldusväärsusest, mida on vaja kriitilistes rakendustes laialdaseks kasutamiseks.

Struktuurilised põhjused: dilemma „Tee kiiresti ja lõhu asju”

Nende tehniliste puuduste juured peituvad sageli arendusprotsesside struktuurilistes probleemides. Tohutu konkurentsisurve, mida eriti ajendas OpenAI edu, on viinud Google'i ja teiste ettevõtete kiirustatud tootearenduseni. Sotsiaalmeedia ajastu algusest pärit mentaliteet „tegutse kiiresti ja lõhu asju” on osutunud tehisintellekti süsteemide jaoks äärmiselt problemaatiliseks. Kuigi traditsioonilise rakenduse viga võib mõjutada ainult ühte funktsiooni, võivad tehisintellekti mudeli vead viia ettearvamatute, kahjulike või piinlike tulemusteni, mis õõnestavad otseselt kasutajate usaldust.

Teine probleem on sisemise koordineerimise puudumine. Näiteks kuigi Google Photos rakendus saab uusi tehisintellektil põhinevaid pilditöötlusfunktsioone, ei tööta Gemini põhiline piltide genereerimine korralikult. See viitab ebapiisavale koordineerimisele eri osakondade vahel. Lisaks on teateid alltöövõtjate halbadest töötingimustest, kes vastutavad tehisintellekti "nähtamatute" kulude eest, näiteks sisu modereerimise ja süsteemi täiustuste eest. Ajaline surve ja madalad palgad nendes valdkondades võivad veelgi kahjustada käsitsi süsteemi optimeerimise kvaliteeti.

Google'i nende vigade käsitlemine on eriti problemaatiline. Probleemide ennetava edastamise asemel pannakse kasutajatele sageli mulje, et süsteem toimib laitmatult. See läbipaistvuse puudumine koos agressiivse turundusega uute, sageli sama vigaste funktsioonide jaoks põhjustab märkimisväärset kasutajate frustratsiooni ja püsivat usalduse kaotust. Need kogemused annavad turule olulise õppetunni: usaldusväärsus ja prognoositavus on ettevõtetele väärtuslikumad kui juhuslik tippjõudlus. Veidi vähem võimas, kuid 99,99% usaldusväärne mudel on ärikriitiliste rakenduste jaoks palju kasulikum kui tipptasemel mudel, mis tekitab ohtlikke hallutsinatsioone 1% juhtudest.

Kujutise loojate loomingulised piirid

Lisaks funktsionaalsetele vigadele on ka praeguste tehisintellektil põhinevate pildigeneraatorite loomingulised võimed selgelt piirides. Vaatamata paljude loodud piltide muljetavaldavale kvaliteedile puudub süsteemidel tegeliku maailma tegelik arusaam. See avaldub mitmes valdkonnas. Kasutajatel on lõpptulemuse üle sageli vaid piiratud kontroll. Isegi väga detailsed ja täpsed juhised (ülesanded) ei vii alati soovitud pildini, kuna mudel tõlgendab juhiseid viisil, mis ei ole täielikult etteaimatav.

Puudused ilmnevad eriti selgelt keerukate stseenide renderdamisel, kus on mitu omavahel suhtlevat inimest või objekti. Mudelil on raskusi elementide vaheliste ruumiliste ja loogiliste seoste täpse esitamisega. Kurikuulus probleem on suutmatus tähti ja teksti õigesti renderdada. Tehisintellekti loodud piltidel on sõnad sageli loetamatu märkide segu, mis nõuab käsitsi järeltöötlust. Piirangud ilmnevad ka piltide stiliseerimisel. Niipea kui soovitud stiil kaldub liiga palju kõrvale anatoomilisest reaalsusest, millel mudel treeniti, muutuvad tulemused üha moonutatumaks ja kasutuskõlbmatuks. Need loomingulised piirangud näitavad, et kuigi mudelid on võimelised oma treeningandmetest mustreid rekombineerima, puudub neil sügav kontseptuaalne arusaam.

Lõhe ettevõtlusmaailmas

Nende tehniliste puudujääkide ja loominguliste piirangute summa kandub otseselt kaasa pettumust valmistavatesse äritulemustesse, mida käsitletakse 2. peatükis. Asjaolu, et 95% ettevõtetest ei suuda oma tehisintellekti investeeringutelt mõõdetavat investeeringutasuvust saavutada, on otsene tagajärg praeguste süsteemide ebausaldusväärsusele ja paindumatule töövoogudele. Tehisintellekti süsteemi, mis annab ebajärjekindlaid tulemusi, aeg-ajalt jookseb kokku või tekitab ettearvamatuid vigu, ei saa integreerida ärikriitilistesse protsessidesse.

Levinud probleem on lahknevus tehnilise lahenduse ja tegelike ärivajaduste vahel. Tehisintellekti projektid ebaõnnestuvad sageli seetõttu, et need on optimeeritud valede mõõdikute jaoks. Näiteks võib logistikaettevõte välja töötada tehisintellekti mudeli, mis optimeerib marsruute lühima koguvahemaa jaoks, samas kui tegelik tegevuseesmärk on minimeerida hilinenud tarneid – eesmärk, mis arvestab selliste teguritega nagu liiklusmustrid ja tarneajad, mida mudel ignoreerib.

Need kogemused annavad olulise ülevaate tehisintellekti süsteemide vigade olemusest. Traditsioonilises tarkvaras saab vea isoleerida ja parandada sihipärase koodimuudatusega. Tehisintellekti mudeli „viga” – näiteks väärinfo või kallutatud sisu genereerimine – ei ole aga üksik vigane koodirida, vaid miljonite parameetrite ja terabaitidega treeningandmete tulemusel tekkiv omadus. Sellise süsteemse vea parandamine nõuab lisaks probleemsete andmete tuvastamisele ja parandamisele sageli ka mudeli täielikku, mitme miljoni dollari suurust ümberõpetamist. See uut tüüpi „tehniline võlg” kujutab endast tohutut, sageli alahinnatud ja jätkuvat vastutust organisatsioonidele, mis kasutavad tehisintellekti süsteeme. Üks viiruslik viga võib põhjustada katastroofilisi kulusid ja mainekahju, tuues omamise kogukulud esialgsetest hinnangutest tunduvalt suuremaks.

Eetilised ja ühiskondlikud mõõtmed: tehisintellekti ajastu varjatud riskid

Süsteemsed eelarvamused: ühiskonna peegel

Üks sügavamaid ja raskemaid tehisintellekti ees seisvaid väljakutseid on selle kalduvus mitte ainult taastoota ühiskondlikke eelarvamusi ja stereotüüpe, vaid sageli ka neid võimendada. Tehisintellekti mudelid õpivad, tuvastades mustreid tohutul hulgal inimeste loodud andmetes. Kuna need andmed hõlmavad kogu inimkultuuri, ajalugu ja suhtlust, peegeldavad need paratamatult oma loomupäraseid eelarvamusi.

Tagajärjed on kaugeleulatuvad ja nähtavad paljudes rakendustes. Kui tehisintellekti pildigeneraatoritelt palutakse kujutada „edukat inimest“, loovad nad valdavalt pilte noortest valgetest meestest ärirõivastes, edastades kitsa ja stereotüüpse arusaama edust. Konkreetsete ametite esindajate kuvamise taotlused viivad äärmuslikult stereotüüpse kujutamiseni: tarkvaraarendajaid kujutatakse peaaegu eranditult meestena, stjuardesse peaaegu eranditult naistena, mis moonutab tõsiselt nende ametite reaalsust. Keelemudelid võivad ebaproportsionaalselt seostada negatiivseid omadusi teatud etniliste rühmadega või tugevdada soolisi stereotüüpe professionaalsetes kontekstides.

Arendajate katsed neid eelarvamusi lihtsate reeglitega „parandada“ on sageli täielikult läbi kukkunud. Katse kunstlikult luua suuremat mitmekesisust on viinud ajalooliselt absurdsete kujutluspiltideni, näiteks etniliselt mitmekesistest natsisõduritest, mis rõhutab probleemi keerukust. Need juhtumid paljastavad põhimõttelise tõe: „eelarvamus“ ei ole tehniline viga, mida saab kergesti parandada, vaid inimandmetel treenitud süsteemide loomupärane omadus. Seega on ühtse, universaalselt „erapooletu“ tehisintellekti mudeli otsimine tõenäoliselt eksiarvamus. Lahendus ei peitu eelarvamuste võimatus kõrvaldamises, vaid läbipaistvuses ja kontrollis. Tulevased süsteemid peavad võimaldama kasutajatel mõista mudeli loomupäraseid kalduvusi ja kohandada selle käitumist konkreetsete kontekstidega. See loob püsiva vajaduse inimese järelevalve ja kontrolli järele („inimene kaasas“), mis on vastuolus täieliku automatiseerimise visiooniga.

Andmekaitse ja privaatsus: uus esirinnas

Suurte keelemudelite väljatöötamine on avanud andmekaitseriskide uue dimensiooni. Neid mudeleid treenitakse kujuteldamatult suurte internetist pärit andmemahtude põhjal, mida sageli kogutakse ilma autorite või andmesubjektide selgesõnalise nõusolekuta. See hõlmab isiklikke ajaveebipostitusi, foorumipanuseid, privaatset kirjavahetust ja muud tundlikku teavet. Sellest praktikast tulenevad kaks peamist privaatsusohtu.

Esimene oht on „andmete meeldejätmine“. Kuigi mudelid on loodud üldiste mustrite õppimiseks, võivad nad tahtmatult meelde jätta oma treeningandmetest pärinevat konkreetset ja unikaalset teavet ning seda nõudmisel taasesitada. See võib viia treeningandmestikku lisatud isikuandmete (nt nimed, aadressid, telefoninumbrid või konfidentsiaalsed ärisaladused) tahtmatu avalikustamiseni.

Teine, peenem oht on nn liikmelisuse järeldamise rünnakud (MIA-d). Nende rünnakute puhul püüavad ründajad kindlaks teha, kas konkreetse isiku andmed olid osa mudeli treeningandmestikust. Edukas rünnak võib näiteks paljastada, et inimene on kirjutanud konkreetsest haigusest meditsiinifoorumis, isegi kui täpset teksti ei kuvata. See kujutab endast olulist privaatsuse rikkumist ja õõnestab usaldust tehisintellekti süsteemide turvalisuse vastu.

Desinformatsioonimasin

Üks generatiivse tehisintellekti ilmsemaid ja vahetumaid ohte on selle potentsiaal genereerida ja levitada desinformatsiooni enneolematus ulatuses. Suured keelemudelid suudavad nupuvajutusega toota usutavalt kõlavaid, kuid täielikult väljamõeldud tekste, nn hallutsinatsioone. Kuigi see võib kahjutute päringute korral viia kurioossete tulemusteni, muutub see pahatahtlikul kasutamisel võimsaks relvaks.

See tehnoloogia võimaldab ulatuslikult luua võltsitud uudiseid, propagandatekste, väljamõeldud tootearvustusi ja isikupärastatud andmepüügikirju, mis on praktiliselt eristamatud inimese kirjutatud sisust. Koos tehisintellekti loodud piltide ja videotega (süvavõltsingud) loob see tööriistade arsenali, mis on võimeline manipuleerima avaliku arvamusega, õõnestama usaldust institutsioonide vastu ja ohustama demokraatlikke protsesse. Desinformatsiooni genereerimise võime ei ole tehnoloogia talitlushäire, vaid pigem üks selle põhivõimetest, mistõttu on reguleerimine ja kontroll ühiskondlikult pakiline kohustus.

Autoriõigus ja intellektuaalomand: juriidiline miiniväli

Tehisintellekti mudelite treenimise viis on vallandanud autoriõigustega seotud kohtuvaidluste laine. Kuna mudeleid treenitakse internetist pärit andmete põhjal, hõlmab see paratamatult autoriõigustega kaitstud teoseid, nagu raamatud, artiklid, pildid ja kood, sageli ilma õiguste valdajate loata. Selle tulemusel on autorid, kunstnikud ja kirjastajad esitanud arvukalt kohtuasju. Keskne õiguslik küsimus, kas tehisintellekti mudelite treenimine kuulub "õiglase kasutamise" doktriini alla, on endiselt lahendamata ja hoiab kohtuid tõenäoliselt veel aastaid hõivatuna.

Samal ajal on tehisintellekti loodud sisu enda õiguslik staatus ebaselge. Kes on tehisintellekti loodud pildi või teksti autor? Kasutaja, kes sisestas käsureale? Ettevõte, mis mudeli välja töötas? Või kas autor saab olla isegi mitte-inimsüsteem? See ebakindlus loob õigusliku vaakumi ja kujutab endast märkimisväärset riski ettevõtetele, kes soovivad tehisintellekti loodud sisu äriliselt kasutada. Autoriõiguste rikkumise kohtuasjad on reaalne võimalus, kui loodud teos reprodutseerib tahtmatult treeningandmete elemente.

Need juriidilised ja andmekaitsega seotud riskid kujutavad endast kogu tehisintellekti tööstuse jaoks omamoodi „uinunud kohustust“. Juhtivate tehisintellekti ettevõtete praegused väärtused kajastavad seda süsteemset riski vaevu. Märkimisväärne kohtuotsus suure tehisintellekti ettevõtte vastu – olgu see siis ulatusliku autoriõiguste rikkumise või tõsise andmetega seotud lekke eest – võiks luua pretsedendi. Selline otsus võiks sundida ettevõtteid oma mudeleid nullist ümber õpetama litsentseeritud „puhaste“ andmetega, kandes sellega astronoomilisi kulusid ja devalveerides oma kõige väärtuslikumat vara. Teise võimalusena võidakse andmekaitseseaduste, näiteks isikuandmete kaitse üldmääruse alusel määrata suuri trahve. See kvantifitseerimata õiguslik ebakindlus kujutab endast olulist ohtu tööstuse pikaajalisele kasumlikkusele ja stabiilsusele.

🎯🎯🎯 Saa kasu Xpert.Digitali ulatuslikust, viiest valdkonna asjatundlikkusest ühes terviklikus teenusepaketis | BD, R&D, XR, PR ja digitaalse nähtavuse optimeerimine

Saage kasu Xpert.Digitali ulatuslikust, viiest astmest koosnevast asjatundlikkusest terviklikus teenustepaketis | Teadus- ja arendustegevus, XR, PR ja digitaalse nähtavuse optimeerimine - Pilt: Xpert.Digital

Xpert.Digitalil on põhjalikud teadmised erinevates tööstusharudes. See võimaldab meil välja töötada kohandatud strateegiaid, mis on täpselt kooskõlas teie konkreetse turusegmendi nõuete ja väljakutsetega. Turusuundumuste pideva analüüsimise ja valdkonna arengute jälgimise abil saame tegutseda ennetavalt ja pakkuda uuenduslikke lahendusi. Kogemuste ja oskusteabe kombinatsioon loob lisaväärtust ja annab meie klientidele otsustava konkurentsieelise.

Lisateavet leiate siit:

Kasuta Xpert.Digitali viit ekspertiisivaldkonda ühes paketis – alates kõigest 500 eurost kuus

Kiire optimeerimine, vahemällu salvestamine, kvantiseerimine: praktilised tööriistad taskukohasema tehisintellekti jaoks – vähendage tehisintellekti kulusid kuni 90%

Optimeerimisstrateegiad: teed tõhusamate ja kulutõhusamate tehisintellekti mudelite poole

Kulude optimeerimise põhitõed rakenduse tasandil

Arvestades tehisintellekti süsteemide tohutuid tegevus- ja arenduskulusid, on optimeerimisest saanud majandusliku elujõulisuse seisukohalt ülioluline valdkond. Õnneks on olemas mitmeid rakendustasandi strateegiaid, mida ettevõtted saavad rakendada kulude märkimisväärseks vähendamiseks ilma jõudlust oluliselt kahjustamata.

Üks lihtsamaid ja tõhusamaid meetodeid on kiire optimeerimine. Kuna paljude tehisintellekti teenuste maksumus sõltub otseselt töödeldud sisend- ja väljundtokenide arvust, võib lühemate ja täpsemate juhiste sõnastamine kaasa tuua märkimisväärse kokkuhoiu. Mittevajalike täitesõnade eemaldamise ja päringute selge struktureerimise abil saab sisendtokeneid ja seega ka kulusid vähendada kuni 35%.

Teine oluline strateegia on õige mudeli valimine käsiloleva ülesande jaoks. Mitte iga rakendus ei vaja kõige võimsamat ja kallimat saadaolevat mudelit. Lihtsate ülesannete, näiteks teksti klassifitseerimise, andmete ekstraheerimise või standardsete küsimuste ja vastuste süsteemide jaoks on väiksemad, spetsialiseeritud mudelid sageli täiesti piisavad ja palju kulutõhusamad. Kulude erinevus võib olla dramaatiline: kui premium-mudel nagu GPT-4 maksab umbes 30 dollarit miljoni väljundtokeni kohta, siis väiksem avatud lähtekoodiga mudel nagu Mistral 7B maksab vaid 0,25 dollarit miljoni tokeni kohta. Nutikate, ülesandepõhiste mudelivalikute abil saavad organisatsioonid saavutada tohutut kulude kokkuhoidu, sageli ilma lõppkasutaja jaoks märgatava jõudluse erinevuseta.

Kolmas võimas tehnika on semantiline vahemälu. Selle asemel, et iga päringu jaoks tehisintellekti mudelist uus vastus genereerida, salvestab vahemälusüsteem vastused korduma kippuvatele või semantiliselt sarnastele küsimustele. Uuringud näitavad, et kuni 31% LLM-päringutest on korduva sisuga. Semantilise vahemälu rakendamisega saavad ettevõtted vähendada kallite API-kõnede arvu kuni 70%, mis vähendab kulusid ja suurendab vastamise kiirust.

Sellega seotud:

Kas tehisintellekti koolituse lõpp? Tehisintellekti strateegiad üleminekuperioodil: andmemägede asemel „Blueprint”-lähenemine – tehisintellekti tulevik ettevõtetes

Tehniline süvaanalüüs: mudeli kvantiseerimine

Ettevõtete jaoks, kes haldavad või kohandavad oma mudeleid, pakuvad täiustatud tehnilised meetodid veelgi suuremat optimeerimispotentsiaali. Üks tõhusamaid tehnikaid on mudeli kvantiseerimine. See on tihendusprotsess, mis vähendab närvivõrku moodustavate numbriliste kaalude täpsust. Tavaliselt teisendatakse kaalud suure täpsusega 32-bitisest ujukomaarvu vormingust (FP32) madalama täpsusega 8-bitisesse täisarvu vormingusse (INT8).

Sellel andmemahu vähendamisel on kaks olulist eelist. Esiteks vähendab see drastiliselt mudeli mäluvajadust, sageli neljakordselt. See võimaldab suurematel mudelitel töötada odavamal riistvaral, kus on vähem mälu. Teiseks kiirendab kvantiseerimine järeldust – aega, mis mudelil kulub vastuse saavutamiseks – kaks kuni kolm korda. See on tingitud asjaolust, et täisarvudega arvutusi saab tänapäevasel riistvaral teha palju tõhusamalt kui ujukomaarvudega. Kvantimise kompromiss on potentsiaalne, kuid sageli minimaalne täpsuse kadu, mida tuntakse kui "kvantimisviga". Täpsuse säilitamiseks on olemas mitmesuguseid meetodeid, näiteks treeningjärgne kvantiseerimine (PTQ), mida rakendatakse eelnevalt treenitud mudelile, ja kvantiseerimisteadlik treenimine (QAT), mis simuleerib kvantiseerimist treeningprotsessi ajal.

Tehniline süvaanalüüs: teadmiste destilleerimine

Teine täiustatud optimeerimistehnika on teadmiste destilleerimine. See meetod põhineb „õpetaja-õpilase“ paradigmal. Väga suurt, keerukat ja kallist „õpetaja mudelit“ (nt GPT-4) kasutatakse palju väiksema ja tõhusama „õpilase mudeli“ treenimiseks. Peamine on see, et õpilase mudel ei õpi lihtsalt õpetaja lõplikke vastuseid („rasked eesmärgid“) jäljendama. Selle asemel treenitakse seda õpetaja mudeli sisemisi mõtteprotsesse ja tõenäosusjaotusi („pehmed eesmärgid“) jäljendama.

Õppides, kuidas õpetaja mudel oma järeldusteni jõuab, saab õpilase mudel saavutada konkreetsete ülesannete puhul võrreldava jõudluse, kuid murdosa arvutusressursside ja -kuludega. See tehnika on eriti kasulik võimsate, kuid ressursimahukate üldotstarbeliste mudelite kohandamiseks konkreetsetele kasutusjuhtudele ja nende optimeerimiseks odavama riistvara või reaalajas rakenduste jaoks.

Edasijõudnumad arhitektuurid ja tehnikad

Lisaks kvantiseerimisele ja teadmiste destilleerimisele on mitmeid teisi paljulubavaid lähenemisviise efektiivsuse suurendamiseks:

Otsinguga laiendatud genereerimine (RAG): teadmiste otse mudelisse salvestamise asemel, mis nõuab kulukat koolitust, pääseb mudel vastavalt vajadusele juurde välistele teadmiste andmebaasidele. See parandab vastuste ajakohasust ja täpsust ning vähendab vajadust pideva ümberõppe järele.
Madala astme kohandamine (LoRA): parameetrite seisukohast tõhus peenhäälestusmeetod, mis kohandab ainult väikest alamhulka mudeli parameetritest, mitte kõiki miljoneid parameetreid. See võib vähendada peenhäälestamise kulusid 70–90%.
Ekspertide kärpimine ja segamine (MoE): kärpimine hõlmab treenitud mudelist üleliigsete või ebaoluliste parameetrite eemaldamist, et vähendada selle suurust. MoE arhitektuurid jagavad mudeli spetsiaalseteks "ekspertmooduliteks" ja aktiveerivad iga päringuga ainult asjakohased osad, vähendades oluliselt arvutuskoormust.

Nende optimeerimisstrateegiate levik annab märku tehisintellekti tööstuse olulisest küpsemisprotsessist. Tähelepanu keskmes on nihkumine lihtsalt tipptulemuste tagaajamisest võrdlusalustes majandusliku tasuvuse saavutamisele. Konkurentsieelis ei seisne enam ainult suurimas mudelis, vaid üha enam antud ülesande jaoks kõige tõhusamas mudelis. See võib avada ukse uutele tegijatele, kes on spetsialiseerunud "tehisintellekti tõhususele", esitades turule väljakutse mitte toore jõu, vaid parema hinna ja kvaliteedi suhte kaudu.

Samal ajal loovad need optimeerimisstrateegiad aga uut tüüpi sõltuvuse. Sellised meetodid nagu teadmiste destilleerimine ja peenhäälestamine muudavad väiksemate ja tõhusamate mudelite ökosüsteemi põhimõtteliselt sõltuvaks mõne ülikalli „õpetajamudeli“ olemasolust OpenAI-lt, Google'ilt ja Anthropicult. Detsentraliseeritud turu edendamise asemel võiks see kinnistada feodaalstruktuuri, kus vähesed „isandad“ kontrollivad intelligentsuse allikat, samas kui suur hulk „vasalle“ maksab juurdepääsu eest ja arendab sellel põhinevaid sõltuvaid teenuseid.

Tehisintellekti operatsioonide optimeerimise strateegiad

Tehisintellekti operatsioonide optimeerimise strateegiad – pilt: Xpert.Digital

Tehisintellekti peamiste operatiivse optimeerimise strateegiate hulka kuulub kiire optimeerimine, mis hõlmab lühemate ja täpsemate juhiste formuleerimist järelduskulude vähendamiseks – see võib viia kuni 35% kulude vähenemiseni ja on suhteliselt madala keerukusega. Mudeli valik tugineb väiksemate ja odavamate mudelite kasutamisele lihtsate ülesannete jaoks järelduse ajal, saavutades potentsiaalselt üle 90% kokkuhoiu sarnaselt madala rakendusliku keerukusega. Semantiline vahemällu salvestamine võimaldab sarnaste päringute vastuste taaskasutamist, vähendab API-kõnesid kuni umbes 70% ja nõuab mõõdukat pingutust. Kvantimine vähendab mudeli kaalude numbrilist täpsust, parandades järelduskiirust ja mälukasutust 2–4 korda, kuid sellega kaasneb suur tehniline keerukus. Teadmiste destilleerimine kirjeldab väikese mudeli treenimist suure "õpetaja" mudeli abil, mis vähendab oluliselt mudeli suurust, säilitades samal ajal võrreldava jõudluse – see lähenemisviis on väga keeruline. RAG (Retrieval-Augmented Generation) kasutab käitusajal väliseid teadmiste andmebaase, väldib kallist ümberõpetamist ja on keskmise kuni kõrge keerukusega. Lõpuks pakub LoRA (madala astme adapterid) parameetrite abil efektiivset peenhäälestust treeningu ajal ja võib vähendada treeningukulusid 70–90%, kuid on seotud ka suure keerukusega.

Turudünaamika ja väljavaated: konsolideerumine, konkurents ja tehisintellekti tulevik

Riskikapitali uputus: konsolideerumise kiirendaja

Tehisintellekti tööstus kogeb praegu enneolematut riskikapitali sissevoolu, millel on püsiv mõju turudünaamikale. Ainuüksi 2025. aasta esimesel poolel voolas genereerivasse tehisintellekti kogu maailmas 49,2 miljardit dollarit riskikapitali, mis ületab juba kogu 2024. aasta kogumahtu. Silicon Valleys, tehnoloogilise innovatsiooni epitsentris, on 93% kõigist investeeringutest kasvufirmadesse nüüd tehisintellekti sektoris.

See kapitali sissevool ei too aga kaasa laialdast turu mitmekesistamist. Vastupidi, raha koondub üha enam vähestesse juba väljakujunenud ettevõtetesse megafinantseerimisvoorude vormis. Maastikku domineerivad tehingud nagu 40 miljardi dollari suurune voor OpenAI-le, 14,3 miljardi dollari suurune investeering Scale AI-sse või 10 miljardi dollari suurune voor xAI-le. Kuigi hilise etapi tehingute keskmine suurus on kolmekordistunud, on varajase etapi idufirmade rahastamine vähenenud. Sellel arengul on kaugeleulatuvad tagajärjed: detsentraliseeritud innovatsiooni mootorina toimimise asemel kiirendab riskikapital tehisintellekti sektoris võimu ja ressursside tsentraliseerimist väljakujunenud tehnoloogiahiiglaste ja nende lähimate partnerite vahel.

Tehisintellekti arendamise tohutu kulustruktuur süvendab seda suundumust. Alates esimesest päevast sõltuvad idufirmad suurte tehnoloogiaettevõtete, nagu Amazon (AWS), Google (GCP), Microsoft (Azure) ja Nvidia, kallist pilveinfrastruktuurist ja riistvarast. Märkimisväärne osa selliste ettevõtete nagu OpenAI või Anthropic kaasatud massiivsetest rahastamisvoorudest voolab otse tagasi nende endi investoritele arvutusvõimsuse eest tasumise vormis. Seega ei loo riskikapital iseseisvaid konkurente, vaid rahastab tehnoloogiahiiglaste kliente, tugevdades veelgi nende ökosüsteemi ja turupositsiooni. Edukaimad idufirmad omandavad sageli lõpuks suured tegijad, mis kiirendab veelgi turu kontsentreerumist. Tehisintellekti idufirmade ökosüsteem areneb seega de facto uurimis-, arendus- ja talentide värbamiskanaliks "Suurepärasele seitsmele". Lõppeesmärk ei näi olevat elav turg paljude osalejatega, vaid pigem konsolideeritud oligopol, kus mõned ettevõtted kontrollivad tehisintellekti põhiinfrastruktuuri.

Ühinemis- ja omandamislaine ning hiiglaste lahing

Paralleelselt riskikapitali koondumisega käib turul läbi tohutu ühinemiste ja omandamiste (M&A) laine. Ülemaailmne ühinemiste ja omandamistehingute maht on 2025. aastaks tõusnud 2,6 triljoni dollarini, mida ajendas tehisintellekti oskusteabe strateegiline omandamine. „Seitse suurt“ on selle arengu keskmes. Nad kasutavad oma tohutuid finantsreserve, et strateegiliselt omandada paljulubavaid idufirmasid, tehnoloogiaid ja talentide baase.

Nende korporatsioonide jaoks ei ole tehisintellekti valdkonnas domineerimine valik, vaid strateegiline vajadus. Nende traditsioonilised ja väga kasumlikud ärimudelid – nagu Microsoft Office'i tarkvarapakett, Google'i otsing või Meta sotsiaalmeedia platvormid – on oma elutsükli lõpus või kasvus stagneerumas. Tehisintellekti peetakse järgmiseks suureks platvormiks ja igaüks neist hiiglastest püüdleb selles uues paradigmas globaalse monopoli poole, et kindlustada oma turuväärtus ja tulevane olulisus. See hiiglaste lahing viib agressiivse omandamisturuni, mis raskendab sõltumatute ettevõtete ellujäämist ja laienemist.

Majandusprognoosid: tootlikkuse ime ja pettumuse vahel

Tehisintellekti mõju pikaajalised majandusprognoosid on sügavalt ambivalentsed. Ühelt poolt on olemas optimistlikke ennustusi, mis lubavad uut tootlikkuse kasvu ajastut. Hinnangute kohaselt võiks tehisintellekt suurendada SKPd 2035. aastaks 1,5% ja märkimisväärselt edendada ülemaailmset majanduskasvu, eriti 2030. aastate alguses. Mõned analüüsid ennustavad isegi, et tehisintellekti tehnoloogiad võivad 2030. aastaks genereerida üle 15 triljoni dollari lisatulu kogu maailmas.

Teisest küljest on olemas kainestav reaalsus. Nagu varem analüüsitud, ei näe 95% ettevõtetest oma tehisintellekti investeeringutelt mõõdetavat investeeringutasuvust. Gartneri hüpetsüklis, mis on mõjukas uute tehnoloogiate hindamise mudel, on generatiivne tehisintellekt juba jõudnud "pettumuse küngasse". Selles faasis asendub esialgne eufooria arusaamaga, et rakendamine on keeruline, eelised sageli ebaselged ja väljakutsed on oodatust suuremad. See lahknevus pikaajalise potentsiaali ja lühiajaliste raskuste vahel kujundab majandusarengut lähiaastatel.

Sellega seotud:

Tehisintellekti tõhusus ilma tehisintellekti strateegiata eeltingimusena? Miks ettevõtted ei tohiks pimesi tehisintellektile lootma jääda?

Mull ja monopol: tehisintellekti revolutsiooni kahekordne nägu

Tehisintellekti buumi erinevate dimensioonide analüüs paljastab keerulise ja vastuolulise üldpildi. Tehisintellekt on otsustaval teelahkmel. Praegune puhta skaleerimise tee – üha suuremad mudelid, mis tarbivad üha rohkem andmeid ja energiat – osutub mitte majanduslikult ega ökoloogiliselt jätkusuutlikuks. Tulevik kuulub neile ettevõtetele, kes valdavad õhukese piiri reklaami ja reaalsuse vahel ning keskenduvad käegakatsutava äriväärtuse loomisele tõhusate, usaldusväärsete ja eetiliselt vastutustundlike tehisintellekti süsteemide kaudu.

Konsolideerumisdünaamikal on ka geopoliitiline mõõde. USA domineerimist tehisintellekti sektoris kinnistab kapitali ja talentide koondumine. 39-st ülemaailmselt tunnustatud tehisintellekti ükssarvikust 29 asub USA-s, mis moodustab kaks kolmandikku selle sektori ülemaailmsetest riskikapitaliinvesteeringutest. Euroopal ja teistel piirkondadel on üha raskem sammu pidada alusmudelite arendamisega. See loob uusi tehnoloogilisi ja majanduslikke sõltuvusi ning muudab tehisintellekti üle kontrolli peamiseks geopoliitiliseks võimuteguriks, mis on võrreldav kontrolliga energia- või finantssüsteemide üle.

Aruanne lõpeb keskse paradoksi äratundmisega: tehisintellekti tööstus on samaaegselt spekulatiivne mull rakenduste tasandil, kus enamik ettevõtteid tegutseb kahjumiga, ja revolutsiooniline, monopolistlik platvormimuutus infrastruktuuri tasandil, kus vähesed ettevõtted lõikavad tohutut kasumit. Äri- ja poliitikaotsutajate peamine strateegiline väljakutse lähiaastatel on tehisintellekti revolutsiooni selle kahetise olemuse mõistmine ja haldamine. Küsimus ei ole enam ainult uue tehnoloogia omaksvõtmises, vaid pigem tehisintellekti ajastu majanduslike, sotsiaalsete ja geopoliitiliste mängureeglite ümberdefineerimises.

Teie globaalne turundus- ja äriarenduspartner

☑️ Meie ärikeel on inglise või saksa keel

☑️ UUS: Kirjavahetus teie emakeeles!

Konrad Wolfenstein

Mina ja minu meeskond oleme hea meelega teie käsutuses teie isikliku nõustajana.

Võite minuga ühendust võtta, täites siinse kontaktvormi wolfenstein@xpert.digital:või helistades mulle numbril +49 7348 4088 965. Minu e-posti aadress on

Ootan põnevusega meie ühist projekti.

☑️ VKEde tugi strateegia, konsultatsioonide, planeerimise ja rakendamise alal

☑️ Digitaalse strateegia loomine või ümberkorraldamine ja digitaliseerimine

☑️ Rahvusvaheliste müügiprotsesside laiendamine ja optimeerimine

☑️ Globaalsed ja digitaalsed B2B kauplemisplatvormid

☑️ Pioneer Äriarendus / Turundus / PR / Messid

Meie globaalne tööstus- ja majandusalane ekspertiis äriarenduses, müügis ja turunduses

Meie globaalne tööstus- ja majandusalane ekspertiis äriarenduses, müügis ja turunduses - pilt: Xpert.Digital

Tööstusharude fookusvaldkonnad: B2B, digitaliseerimine (tehisintellektist XR-ini), masinaehitus, logistika, taastuvenergia ja tööstus

Lisateavet leiate siit:

Ekspertide ärikeskus

Temaatiline keskus, mis pakub teadmisi ja oskusteavet:

Teadmisplatvorm, mis hõlmab globaalset ja piirkondlikku majandust, innovatsiooni ja valdkonnapõhiseid trende
Analüüside, arusaamade ja taustainfo kogum meie peamistest fookusvaldkondadest
Koht ekspertiisi ja teabe saamiseks äri- ja tehnoloogiavaldkonna praeguste arengute kohta
Keskus ettevõtetele, kes otsivad teavet turgude, digitaliseerimise ja valdkonna uuenduste kohta

Jätkusuutliku väärtusloome otsingud tehisintellekti hüpe keskel: üllatavad vead ja piirangud, mis tänapäeva tehisintellekti süsteemidel tegelikult on (Lugemisaeg: 36 min / Reklaami pole / Tasumüüri pole)

Räpane tõde tehisintellekti kohta: miks tehnoloogia põletab miljardeid, kuid ei too kasumit

Paralleelid dot-com-ajastuga

Peamised erinevused ja nende mõju

Miks tehisintellekti hüpe ei ole dot-com-mulli koopia – ja võib siiski olla ohtlik

Keskne küsimus

Majanduslik reaalsus: jätkusuutmatute ärimudelite analüüs

800 miljardi dollari suurune vahe

OpenAI juhtumiuuring: populaarsuse ja kasumlikkuse paradoks

Investeerimishullus ilma igasuguse tootluse väljavaateta

Altpoolt tulevate häirete oht

Digitaalse transformatsiooni uus dimensioon hallatud tehisintellekti (AI) abil - platvormi- ja B2B-lahendus | Xpert Consulting

Tehisintellekti tegelikud kulud – taristu, energia ja investeerimistõkked

Intellekti maksumus: infrastruktuur, energia ja tehisintellekti kulutuste tegelikud ajendid

Koolituskulud vs. järelduskulud: kaheosaline väljakutse

Riistvaralõks: NVIDIA kuldne puur

Rahuldamatu isu: energia- ja ressursitarbimine

Nähtamatud kulud: lisaks riistvarale ja elektrile

Tehisintellekti "nähtamatud" kulud

Hüpe ja reaalsuse vahel: tehnilised puudujäägid ja praeguste tehisintellekti süsteemide piirid

Google Gemini juhtumiuuring: kui fassaad laguneb

Struktuurilised põhjused: dilemma „Tee kiiresti ja lõhu asju”

Kujutise loojate loomingulised piirid

Lõhe ettevõtlusmaailmas

Eetilised ja ühiskondlikud mõõtmed: tehisintellekti ajastu varjatud riskid

Süsteemsed eelarvamused: ühiskonna peegel

Andmekaitse ja privaatsus: uus esirinnas

Desinformatsioonimasin

Autoriõigus ja intellektuaalomand: juriidiline miiniväli

🎯🎯🎯 Saa kasu Xpert.Digitali ulatuslikust, viiest valdkonna asjatundlikkusest ühes terviklikus teenusepaketis | BD, R&D, XR, PR ja digitaalse nähtavuse optimeerimine

Kiire optimeerimine, vahemällu salvestamine, kvantiseerimine: praktilised tööriistad taskukohasema tehisintellekti jaoks – vähendage tehisintellekti kulusid kuni 90%

Optimeerimisstrateegiad: teed tõhusamate ja kulutõhusamate tehisintellekti mudelite poole

Kulude optimeerimise põhitõed rakenduse tasandil

Tehniline süvaanalüüs: mudeli kvantiseerimine

Tehniline süvaanalüüs: teadmiste destilleerimine

Edasijõudnumad arhitektuurid ja tehnikad

Tehisintellekti operatsioonide optimeerimise strateegiad

Turudünaamika ja väljavaated: konsolideerumine, konkurents ja tehisintellekti tulevik

Riskikapitali uputus: konsolideerumise kiirendaja

Ühinemis- ja omandamislaine ning hiiglaste lahing

Majandusprognoosid: tootlikkuse ime ja pettumuse vahel

Mull ja monopol: tehisintellekti revolutsiooni kahekordne nägu

Teie globaalne turundus- ja äriarenduspartner

☑️ Meie ärikeel on inglise või saksa keel

☑️ UUS: Kirjavahetus teie emakeeles!

☑️ VKEde tugi strateegia, konsultatsioonide, planeerimise ja rakendamise alal

☑️ Digitaalse strateegia loomine või ümberkorraldamine ja digitaliseerimine

☑️ Rahvusvaheliste müügiprotsesside laiendamine ja optimeerimine

☑️ Globaalsed ja digitaalsed B2B kauplemisplatvormid

☑️ Pioneer Äriarendus / Turundus / PR / Messid

Meie globaalne tööstus- ja majandusalane ekspertiis äriarenduses, müügis ja turunduses

Muud teemad