Katse selgitada AI: Kuidas tehisintellekt töötab ja töötab - kuidas seda koolitatakse?
Häälevalik 📢
Avaldatud: 8. september 2024 / UPDATE: 9. september 2024 - Autor: Konrad Wolfenstein
📊 Andmesisestusest mudeli prognoosi: AI protsess
Kuidas tehisintellekt (AI) töötab? 🤖
Tehisintellekti (AI) funktsionaalsuse võib jagada mitmeks selgelt määratletud etapiks. Kõik need sammud on üliolulised lõpptulemuse jaoks, mida AI tarnib. Protsess algab andmete sisestamisel ja lõpeb mudeli prognoosi ning kogu tagasiside või muude treeningvoorudega. Need faasid kirjeldavad protsessi, mille peaaegu kõik AI -mudelid läbi käivad, sõltumata sellest, kas tegemist on lihtsad määrused või väga keerulised närvivõrgud.
1. andmete sisestamine 📊
Iga tehisintellekti alus on andmed, millega see töötab. Need andmed võivad olla saadaval erinevates vormides, näiteks piltide, tekstide, helifailide või videotena. AI kasutab neid lähteandmeid mustrite äratundmiseks ja otsuste tegemiseks. Andmete kvaliteet ja kvantiteet mängivad siin keskset rolli, sest need mõjutavad märkimisväärselt seda, kui hästi või halb mudel hiljem töötab.
Mida ulatuslikum ja täpsem on andmed, seda parem AI saab õppida. Näiteks kui AI -d on väljaõppinud pilditöötluseks, vajab see erinevate objektide õigesti tuvastamiseks suures koguses pildiandmeid. Häälmudelite abil aitavad AI -l tekstiandmed inimkeelt mõista ja genereerida. Andmesisestus on esimene ja üks olulisemaid samme, kuna ennustuste kvaliteet võib olla ainult sama hea kui aluseks olevad andmed. Kuulus arvutiteaduse põhimõte kirjeldab seda ütlusega "prügi sisse, prügi välja" - kehvad andmed põhjustavad halbu tulemusi.
2. andmete esialgne töötlemine 🧹
Niipea kui andmed on sisestatud, tuleb need enne tegelikku mudelisse toita. Seda protsessi nimetatakse andmete esialgseks töötlemiseks. See seisneb andmete panemises vormi, mida mudel saab optimaalselt töödelda.
Esialgse töötlemise tavaline samm on andmete normaliseerimine. See tähendab, et andmed tuuakse ühtlasesse väärtuse piirkonda, nii et mudel koheldaks neid ühtlaselt. Üks näide oleks skaleerimine kõigi pildi piksliväärtuste skaleerimine alale 0 kuni 1, mitte 0–255.
Esialgse töötlemise teine oluline osa on niinimetatud funktsioonide ekstraheerimine. Teatud funktsioonid (funktsioonid) töötatakse välja mudeli jaoks eriti asjakohaste lähteandmete põhjal. Kujutise töötlemise korral võib see olla näiteks servad või teatud värvimustrid, samas kui tekstidega asjakohased märksõnad või lauseekraanid ekstraheeritakse. Esialgne töötlemine on ülioluline muuta AI õppimisprotsess tõhusamaks ja täpsemaks.
3. mudel 🧩
Mudel on iga tehisintellekti süda. Siin analüüsitakse ja töödeldakse andmeid algoritmide ja matemaatiliste arvutuste põhjal. Mudel võib eksisteerida erinevates vormides. Üks kõige tuntumaid mudeleid on närvivõrk, mis põhineb inimese aju toimimisel.
Neuronaalsed võrgud koosnevad mitmest kunstlike neuronite kihtidest, mis töötlevad ja edastavad teavet. Iga kiht võtab eelmise kihi kulud ja töötleb selle veelgi. Neuronaalse võrgu õppimisprotsess on nende neuronite vaheliste ühenduste raskuste kohandamine nii, et võrk saaks teha üha täpsemaid ennustusi või teha klassifikatsioone. See kohandamine toimub koolituse teel, kus võrk pääseb suures koguses proovide andmete ja selle sisemiste parameetrite (kaalu) iteratiivselt.
Lisaks neuronaalsetele võrkudele on AI mudelites ka palju muid algoritme. See hõlmab otsustuspuid, juhuslikke metsi, tugivektori masinaid ja palju muud. Milline algoritm kasutatakse, sõltub konkreetsest ülesandest ja saadaolevatest andmetest.
4. mudeli prognoos 🔍
Pärast seda, kui mudel on andmetega koolitatud, on see võimeline tegema ennustusi. Seda sammu nimetatakse mudeliprognoosiks. AI saab sisendi ja annab tagasi probleemi, mis põhineb seni õpitud mustritel, see tähendab ennustus või otsus.
See ennustus võib esineda erinevaid vorme. Näiteks pildi klassifitseerimise mudelis võib AI ennustada, millist objekti pildil näha võib. Keelemudelis võiks ta ennustada, milline sõna tuleb järgmisena ühe lausega. Finantsprognooside korral võiks AI ennustada, kuidas aktsiaturg areneb.
Oluline on rõhutada, et ennustuste täpsus sõltub suuresti treeninguandmete kvaliteedist ja mudeli arhitektuurist. Ebapiisavate või moonutatud andmete koolitatud mudel teeb tõenäoliselt valesid ennustusi.
5. Rattumine ja koolitus (valikuline) ♻️
Veel üks oluline osa AI tööst on tagasisidemehhanism. Mudelit kontrollitakse regulaarselt ja optimeeritakse veelgi. See protsess toimub kas treenimise ajal või mudeliprognoosi kohaselt.
Kui mudel teeb valesid ennustusi, saab ta õppida neid vigu tagasiside abil ära tundma ja vastavalt oma sisemisi parameetreid kohandama. Seda tehakse mudeli prognooside võrdlemisel tegelike tulemustega (nt teadaolevate andmete kohta, mille jaoks õiged vastused on juba saadaval). Tüüpiline protsess selles kontekstis on SO -nimeline jälgitav õppimine, kus AI õpib proovide andmete põhjal, mis on juba õiged vastused.
Tavaline tagasiside meetod on selja leviku algoritm, mida kasutatakse närvivõrkudes. Mudeli tehtud vead levitatakse võrgu kaudu tahapoole, et kohandada neuronühendite kaalu. Sel moel õpib mudel oma vigadest ja muutub oma ennustustes üha täpsemaks.
Treeningu roll 🏋️♂️
AI koolitamine on iteratiivne protsess. Mida rohkem andmeid mudel näeb ja mida sagedamini seda nende andmete põhjal koolitatakse, seda täpsemad selle ennustused. Siiski on ka piirid: liiga koolitatud mudel võib saada niinimetatud "ületamisprobleeme". See tähendab, et see õpib koolitusandmeid nii hästi, et annab uute tundmatute andmete kohta halvemaid tulemusi. Seetõttu on oluline mudelit koolitada nii, et see üldistaks, st ka uute andmete jaoks häid ennustusi.
Lisaks regulaarsele koolitusele on olemas ka sellised protseduurid nagu ülekandeõpe. Siin kasutatakse uue, sarnase ülesande jaoks juba palju andmeid, mida on juba koolitatud. See säästab aega ja arvutusvõimsust, kuna mudelit ei pea täielikult välja koolitama.
Kasutage tugevusi optimaalselt 🚀
Tehisintellekti töö põhineb erinevate etappide keerulisel interaktsioonil. Alates andmesisestusest kuni esialgse töötlemise ja mudeli koolituseni kuni ennustamise ja tagasisideni on palju tegureid, mis mõjutavad AI täpsust ja tõhusust. Hästi treenitud AI võib pakkuda paljudes eluvaldkondades tohutuid eeliseid - alates lihtsate ülesannete automatiseerimisest kuni keerukate probleemide lahendamiseni. Kuid sama oluline on mõista AI piire ja võimalikke lõkse, et olla võimeline nende tugevusi optimaalselt kasutama.
🤖📚 lihtsalt selgitas: kuidas AI koolitatakse?
🤖📊 AI õppeprotsess: jäädvustamine, link ja salvestamine
Lihtne näide AI neuronaalse võrguskeemi kohta individuaalse termini „stuttgart” -pildil: xpert.digital
🌟 Koguge ja koostage andmeid
AI õppeprotsessi esimene samm on andmete kogumine ja ettevalmistamine. Need andmed võivad pärineda erinevatest allikatest, nt. andmebaasidest, anduritest, tekstidest või piltidest.
🌟 seostage andmeid (närvivõrk)
Kogutud andmed on närvivõrgus üksteisega seotud. Iga andmepaketti kuvatakse ühenduste abil neuronite võrgus (sõlm). Lihtne näide Stuttgarti linnaga võiks välja näha järgmine:
a) Stuttgart on linn Baden-Württembergi linnas
b) Baden-württemberg on föderaalne osariik Saksamaal
c) Stuttgart on linn Saksamaal
d) Stuttgarti elanikkond on 633 484
F) Bad Bad Cannansi
linnaosa, mis on , mis oli Cannad Cannated, mis oli Canctud Bad Cannstatt Canctud.
Sõltuvalt andmemahu suurusest luuakse potentsiaalsete väljaannete parameetrid sellest kasutatud AI mudeli kaudu. Näitena: GPT-3-l on umbes 175 miljardit parameetrit!
🌟 Salvestus ja kohanemine (õppimine)
Andmed tarnitakse närvivõrku. Nad läbivad AI mudeli ja töödeldakse ühenduste kaudu (sarnaselt sünapsidega). Kaal (parameetrid) on mudeli koolitamiseks või ülesande täitmiseks kohandatud neuronite vahel.
Vastupidiselt tavapärastele mäluvormidele nagu otsene juurdepääs, näidustatud juurdepääs, järjestikused või virna salvestusruumid, salvestavad närvivõrgud andmeid tavatul viisil. Andmeid salvestatakse neuronite vaheliste ühenduste kaaludes ja eelarvamustes.
Neuronaalses võrgus sisalduva teabe tegelik "ladustamine" toimub neuronite vahelise ühenduse kaalu kohandamisel. AI -mudel “õpib”, kohandades pidevalt neid raskusi ja eelarvamusi sisendandmetel ja määratletud õppimisalgoritmil. See on pidev protsess, kus mudel saab korduvate kohanduste tõttu täpseid ennustusi teha.
AI -mudelit võib pidada omamoodi programmeerimiseks, kuna see tuleneb määratletud algoritmidest ja matemaatilistest arvutustest ning selle parameetrite (kaalu) kohandamine on pidevalt paranenud, et täpseid ennustusi teha. See on pidev protsess.
Eelarvamused on täiendavad parameetrid neuronaalsetes võrkudes, mis lisatakse neuroni kaalutud sisendväärtustele. Need võimaldavad parameetreid kaalule (olulised, vähem, olulised, muu hulgas), mis muudab AI paindlikumaks ja täpsemaks.
Neuronaalsed võrgud ei saa mitte ainult salvestada üksikuid fakte, vaid ka ära tunda andmete vahelised ühendused mustrituvastuse järgi. Stuttgarti näide illustreerib, kuidas teadmisi saab närvivõrku tuua, kuid närvivõrgud ei õpi selgesõnaliste teadmiste kaudu (nagu selles lihtsas näites), vaid andmemustrite analüüsides. Neuronaalsed võrgud saavad seetõttu mitte ainult üksikuid fakte salvestada, vaid ka sisendandmete vahel kaal ja suhted õppida.
See protsess annab arusaadava sissejuhatuse AI ja eriti närvivõrkude toimimisse, ilma et nad liiga sügavalt tehnilisse üksikasjadesse sukelduks. See näitab, et neuronaalsetes võrkudes teabe säilitamine ei toimu nagu tavalistes andmebaasides, vaid võrgus olevate ühendite (raskuste) kohandamisega.
🤖📚 Üksikasjalikum: kuidas AI koolitatakse?
🏋️♂️ AI, eriti mehaanilise õppe mudeli treenimine toimub mitmes etapis. AI treenimine põhineb mudeli parameetrite pideval optimeerimisel tagasiside ja kohanemise kaudu, kuni mudel näitab esitatud andmete parimat jõudlust. Siin on üksikasjalik seletus selle protsessi toimimise kohta:
1. 📊 Koguge ja koostage andmeid
Andmed on AI koolituse alus. Tavaliselt koosnevad need süsteemi analüüsimiseks tuhandetest või miljonitest näidetest. Näited on pildid, tekstid või aegridade andmed.
Andmeid tuleb kohandada ja normaliseerida, et vältida tarbetuid veaallikaid. Andmed teisendatakse sageli funktsioonideks (funktsioonideks), mis sisaldavad asjakohast teavet.
2. 🔍 määratlege mudel
Mudel on matemaatiline funktsioon, mis kirjeldab andmetes olevaid suhteid. Neuronaalsetes võrkudes, mida kasutatakse sageli AI jaoks, koosneb mudel mitmest üksteisega ühendatud neuronite kihtidest.
Iga neuron viib läbi matemaatilise toimingu sisendandmete töötlemiseks ja seejärel signaali edastamiseks järgmisele neuronile.
3. 🔄 🔄 Initsialiseerige kaalu
Neuronite vahelistel ühendustel on raskused, mis on algselt juhuslikult seatud. Need kaalud määravad, kui tugevalt neuron reageerib signaalile.
Treeningu eesmärk on kohandada neid kaalu nii, et mudel annab paremaid ennustusi.
4. ➡️ Edasi jooks (edasi levitamine)
Edaspidise käitamise korral juhib sisendandmeid ennustuse saamiseks mudel.
Iga kiht töötleb andmeid ja edastab need järgmisele kihile, kuni viimane kiht tulemuse annab.
5. ⚖️ Arvutage kaotusfunktsioon
Kaotusfunktsioon mõõdab, kui head mudeli ennustusi võrreldakse tegelike väärtustega (sildid). Ühine meede on viga ennustatud ja tegeliku vastuse vahel.
Mida suurem on kaotus, seda halvem on mudeli ennustamine.
6.
Tagasi käigul omistatakse tõrge mudeli väljundist eelmistele kihtidele.
Viga jaotatakse ühenduste kaalule ja mudel reguleerib raskusi nii, et vead muutuksid väiksemaks.
See juhtub gradiendi laskumise abil: arvutatakse gradientvektor, mis näitab, kuidas vea minimeerimiseks tuleks kaalu muuta.
7. 🔧 Värskendus kaalu
Pärast vea arvutamist värskendatakse ühenduste kaalu väikese kohandamisega, mis põhineb õppimiskiirusel.
Õppimismäär määrab, kui palju raskusi igal sammul muudetakse. Liiga suured muudatused võivad muuta mudeli ebastabiilseks ja liiga väikesed muutused põhjustavad aeglase õppimisprotsessi.
8. 🔁 kordus (ajastud)
See edasiliikumise, vea arvutamise ja kaalu värskendamise protsess korratakse, sageli mitme ajajärgu jooksul (kulgeb läbi kogu andmekogumi), kuni mudel saavutab vastuvõetava täpsuse.
Iga ajastuga õpib mudel natuke rohkem ja kohandab oma raskusi veelgi.
9. 📉 valideerimine ja testimine
Pärast mudeli koolitamist testitakse seda kinnitatud andmekirjas, et kontrollida, kui hästi see üldistab. See tagab, et see mitte ainult ei mäleta koolitusandmeid, vaid annab ka tundmatute andmete kohta häid ennustusi.
Testi andmed aitavad mõõta mudeli lõplikku jõudlust enne selle praktikas kasutamist.
10. 🚀 optimeerimine
Mudeli parendamise täiendavate sammude hulka kuuluvad hüperparameetri häälestamine (nt õppimiskiiruse või võrgustruktuuri kohandamine), reguleerimist (ületamisega vältimiseks) või ** andmete kogust suurendavad.
📊🔙 Kunstlik intelligentsus: AI must kast koos seletatava AI (XAI), kuumakaartide, asendusmudeli või muude lahendustega muudavad selle arusaadavaks, arusaadavaks ja seletatavaks
Tehisintellekt: AI must kast koos seletatava AI (XAI), kuumade, asendusmudeli või muude lahendustega arusaadava, arusaadava ja seletatava-kujundiga: xpert.digital
Tehisintellekti (AI) nn must kast on oluline ja ajakohane probleem. Isegi eksperdid seisavad sageli silmitsi väljakutsega, et nad ei saa täielikult aru, kuidas AI -süsteemid oma otsuseid teha saavad. See mitteülekanne võib põhjustada olulisi probleeme, eriti kriitilistes valdkondades nagu äri, poliitika või meditsiin. Arst või arst, kes tugineb diagnoosimise ja teraapia soovituse ajal AI -süsteemile, peab olema tehtud otsuste suhtes. Kui aga AI otsuse tegemine ei ole piisavalt läbipaistev, tekivad ebakindlus ja võib -olla ka usalduse puudumine - ja see olukordades, kus inimelu võiks kaalul olla.
Lisateavet selle kohta siin:
Oleme teie jaoks olemas - nõuanne - planeerimine - rakendamine - projektijuhtimine
☑️ VKE tugi strateegia, nõuannete, planeerimise ja rakendamise alal
☑️ digitaalse strateegia loomine või ümberpaigutamine ja digiteerimine
☑️ Rahvusvaheliste müügiprotsesside laiendamine ja optimeerimine
☑️ Globaalsed ja digitaalsed B2B kauplemisplatvormid
☑️ teerajaja ettevõtluse arendamine
Aitan teid hea meelega isikliku konsultandina.
Võite minuga ühendust võtta, täites alloleva kontaktvormi või helistage mulle lihtsalt telefonil +49 89 674 804 (München) .
Ootan meie ühist projekti.
Xpert.digital - Konrad Wolfenstein
Xpert.digital on tööstuse keskus, mille fookus, digiteerimine, masinaehitus, logistika/intralogistics ja fotogalvaanilised ained.
Oma 360 ° ettevõtluse arendamise lahendusega toetame hästi tuntud ettevõtteid uuest äritegevusest pärast müüki.
Turuluure, hammastamine, turunduse automatiseerimine, sisu arendamine, PR, postkampaaniad, isikupärastatud sotsiaalmeedia ja plii turgutamine on osa meie digitaalsetest tööriistadest.
Lisateavet leiate aadressilt: www.xpert.digital - www.xpert.solar - www.xpert.plus