Avaldatud: 20. märts 2025 / UPDATE FROM: 20. märts 2025 - autor: Konrad Wolfenstein
Google Gemini 2.0, Kunstlik intelligentsus ja robootika: Kaksikute robootika ja Gemini robootika-looming: Xpert.digital
DeepMind esitleb Kaksikud: algab järgmine robootika ajastu
Kaksikute robootika: Google'i tehisintellekti ja robootika muutmine
12. märtsil 2025 esitas Google DeepMind oma uusima projekti Gemini robootika - muljetavaldava tehnoloogia, mis ühendab võimsa Kaksikute 2.0 keelemudeli edasijõudnute robootikaga. See uuendus tähistab olulist verstaposti intelligentsete robotite süsteemide väljatöötamisel, mis mõistavad looduslikku keelt ja täidavad keerulisi füüsilisi ülesandeid.
Google DeepMind on juhtiv tehisintellekti (AI) uurimisettevõte, mis asutati 2010. aastal ja võttis Google'i 2014. aastal üle. See keskendub arenenud AI-tehnoloogiate arendamisele, mida iseloomustavad lühiajalise salvestusruumi ja tehismäluga närvivõrgud. DeepMind on saavutanud olulise läbimurde, sealhulgas kaitstes inimmängijaid mängus „Go” ja Alphafoldi arendamine, mis on valkude struktuuride ennustamise süsteem. DeepMindi tehnoloogiaid kasutatakse sellistes valdkondades nagu robootika, meditsiin, energiatõhusus ja keele töötlemine.
Kaksikute robootika tehnoloogilised alused
Kaksikute robootika oli kavandatud mudeli (VLA) mudeli progresseeruva nägemise pikkuseks, mis tugineb niigi võimsale Gemini 2.0. Keskne uuendus on see, et süsteem ei saa mitte ainult töödelda digitaalseid andmeid nagu tekstid, pildid või videod, vaid võib ka esimest korda reaalses maailmas füüsilisi toiminguid teostada.
See tehnoloogia kasutab Kaksikute 2.0 multimodaalset mõistmist ja laiendab seda otsustava uue modaalsusega: füüsilised toimingud. See võimaldab robotitel ületada digitaalset ja füüsilist maailma viisil, mis polnud veel võimalik.
Sobib selleks:
- Google'i Kaksikute platvorm koos Google AI stuudioga, Google Deep Research koos Gemini Advanced ja Google DeepMind
Funktsionaalsus ja tajumisoskus
Kaksikute robootika tehnoloogiline läbimurre seisneb selle võimes tajuda ümbrust kaamerate kaudu, ära tunda objekte ja jäädvustada nende ruumilisi mõõtmeid. Seejärel teisendatakse see teave 3D -maailmaks, millel on täpsed tehnilised koordinaadid.
Süsteem saab ka:
- Mõista loodusliku keele käskusid ja rakendage seda füüsilistes toimingutes
- Mõista objektide keerulisi ruumilisi seoseid
- Kohaneda uute tundmatute olukordadega
- Genereerida erinevate robotitüüpide üle
Kaks täiendavat mudelit: Kaksikute robootika ja Kaksikute robootika-er
Google DeepMind pole mitte ainult seda esitanud, vaid ka kaks spetsialiseerunud mudelit, mis käsitlevad robootika erinevaid aspekte.
Kaksikute robootika
Peamine mudeli Kaksikute robootika ühendab Kaksikud 2.0 keele töötlemise oskused füüsilise kontrolliga. See võimaldab robotitel reageerida looduslikult keelekäskudele, mõista keerulisi keskkondi ja viia läbi adaptiivseid toiminguid.
Kaksikute robootika
Teine mudel, Kaksikute robootika-er (mille abil ta tähistab “kehastatud mõttekäiku” või “modifitseeritud loogikat”) keskendub paremale ruumilisele mõtlemisele. See võime on ülioluline robotite jaoks, mis peavad toimima dünaamilises, kolmemõõtmelises keskkonnas.
Näiteks Kaksikute robootika-er saab intuitiivselt ära tunda, kuidas objekti saab kõige paremini kasutada. Kui mudelile kuvatakse kohvitass, saab see iseseisvalt valida sobiva kahe sõrme käepideme, et tass käepidemele tõsta ja turvalise liikumise arvutada.
Demonstreeritud oskused ja praktilised rakendused
Muljetavaldavates demonstratsioonivideotes näitab Google DeepMind uute AI mudelite praktilisi oskusi. Robotisüsteemid saavad täita mitmesuguseid keerulisi ülesandeid, sealhulgas:
- Origami ja paberi voldid
- Objektide sortimine ja korraldamine suuliste juhiste põhjal
- Täpsed haaravad ja liikuvad habras objektid
- Prillide hoolikas sisestamine Etui
- Täringuid ja manipuleerige väikeste objektidega
- Tõmbluku sulgemine
- Kõrvaklappide pakkimine
- Täpsusülesannete, näiteks korvpallivormi täitmine
Eriti tähelepanuväärne on see, et robotid täidavad neid ülesandeid autonoomselt pärast seda, kui nad on saanud ainult juhised. Süsteem tuvastab iseseisvalt objektid, identifitseerib need, tuletab vajalikud individuaalsed sammud ja kontrollib vastavalt roboti relvadele.
Strateegilised partnerlused edasiseks arenguks
Selle tehnoloogia täieliku potentsiaali avamiseks töötab Google DeepMind koos robootikatööstuse juhtivate ettevõtetega:
- Apptronik, Texani idufirma, mis on välja töötanud humanoidroboti “Apollo”, mis on mõeldud logistika ja tootmisülesannete jaoks nagu kastide tõstmine, liigutamine ja virnastamine
- Boston Dynamics, tuntud robootikaettevõte, mille Google irooniliselt ostis ja hiljem uuesti müüs
- Agility robootika ja agiilsed robotid kui teised Kaksikute robootika-er väljatöötamise ja testide partneritena
See koostöö näitab Google'i strateegiat rakendada ja testida tehnoloogia erinevatel robotplatvormidel, et tagada nende lai rakendus.
Sobib selleks:
Tähendus robootika tuleviku jaoks
DeepMindi robootika direktor Kanishka Rao ütles, et pressikonverentsil koosneb robootika üks suurimaid väljakutseid, et robotid töötavad tavaliselt teadaolevate stsenaariumide korral, kuid ebaõnnestuvad tundmatutes olukordades. Kaksikute robootika peaks selle probleemi täpselt lahendama.
Sobib selleks:
- Humanoidide seistes kontroll: õppige üles astuma "host" humanoididega-läbimurre robotitele igapäevaelus
Suurte keelemudelite (LLM -ide) integreerimine robotiks on osa kasvavast suundumusest ja Kaksikute lähenemine võiks olla selle üks muljetavaldavamaid näiteid. Stanfordi ülikooli biotehnika professor ja OpenMind asutaja Jan Liphardt rõhutab, et see on „üks esimesi näiteid generatiivsete AI ja suurte keelemudelite kasutamisest arenenud robotitel” ning “tõesti võti robotiabiliste ja robotikaaslaste arendamiseks”.
Nvidia tegevjuht Jensen Huang läheb veelgi kaugemale ja näitab, et generatiivse AI kasutamine robotite pakkumiseks võib olla suures mahus mitme triljoni USA dollari turupotentsiaal.
Kaksikud ja robootika: pöördepunkt intelligentsete süsteemide jaoks?
Vaatamata muljetavaldavatele edusammudele on veel väljakutseid. Berkeley California ülikooli robootikaprofessor Ken Goldberg kirjeldab AI-süsteeme kui „põnevat arengut robootika valdkonnas”, kuid juhib tähelepanu sellele, et “enne, kui universaalsed robotid on igapäevaelus kasutamiseks valmis” on veel palju teha.
Google kavatseb anda täiendava ülevaate selle tehnoloogia võimalustest eelseisva Google'i I/O konverentsil. Oma paljude aastatehuvilise robootika vastu ja nüüd sobiva tarkvarakomponendina Kaksikute vastu võiks Google avada uue peatüki intelligentsete robotite arendamisel.
Keelest tegevusse: Google seab robootika uued standardid
Kaksikute robootika abil on Google DeepMind astunud olulise sammu AI ja robootika sulandumise suunas. Võimalus mõista looduslikku keelt, tajuda keerulisi keskkondi ja teha füüsilisi toiminguid võib revolutsiooniks robotite kasutamise viisi tulevikus.
See tehnoloogia tähistab üleminekut puhtalt digitaalsetest AI -rakendustest süsteemidele, millel võib olla otsene mõju füüsilisele maailmale. Ehkki see võib põhjustada muret mõne AI -skeptikuga, on Google DeepMindi põhirõhk adaptiivsete ja kasulike robotite süsteemide väljatöötamisel, mis suudavad hallata keerulisi ülesandeid vähem väljaõppega.
Järgmised aastad näitavad, kuidas see tehnoloogia areneb ja milliseid praktilisi rakendusi erinevates valdkondades leiate, alates tööstusest kuni igapäevaelust.
Sobib selleks:
Teie ülemaailmne turundus- ja äriarenduspartner
☑️ Meie ärikeel on inglise või sakslane
☑️ Uus: kirjavahetus teie riigikeeles!
Mul on hea meel, et olete teile ja minu meeskonnale isikliku konsultandina kättesaadav.
Võite minuga ühendust võtta, täites siin kontaktvormi või helistage mulle lihtsalt telefonil +49 89 674 804 (München) . Minu e -posti aadress on: Wolfenstein ∂ xpert.digital
Ootan meie ühist projekti.