Häälevalik 📢


Google Gemini 2.0, tehisintellekt ja robootika: Gemini Robotics ja Gemini Robotics-ER

Avaldatud: 20. märts 2025 / Uuendatud: 20. märts 2025 – Autor: Konrad Wolfenstein

Google Gemini 2.0, tehisintellekt ja robootika: Gemini Robotics ja Gemini Robotics-ER

Google Gemini 2.0, tehisintellekt ja robootika: Gemini Robotics ja Gemini Robotics-ER – Loominguline pilt: Xpert.Digital

DeepMind esitleb Gemini: Robootika järgmise ajastu algus

Gemini Robotics: Google'i murranguline tehisintellekti ja robootika ühendamine

12. märtsil 2025 avalikustas Google DeepMind oma uusima projekti Gemini Robotics, mis on muljetavaldav tehnoloogia, mis ühendab võimsa Gemini 2.0 keelemudeli täiustatud robootikaga. See innovatsioon tähistab olulist verstaposti intelligentsete robotsüsteemide arendamisel, mis on võimelised mõistma loomulikku keelt ja täitma keerulisi füüsikalisi ülesandeid.

Google DeepMind on juhtiv tehisintellekti (AI) uurimisettevõte, mis asutati 2010. aastal ja mille Google omandas 2014. aastal. See keskendub täiustatud tehisintellekti tehnoloogiate arendamisele, mida iseloomustavad lühiajalise salvestuse ja tehismäluga närvivõrgud. DeepMind on saavutanud märkimisväärseid läbimurdeid, sealhulgas alistanud inimmängijaid Go mängus ja arendanud AlphaFoldi, süsteemi valgu struktuuride ennustamiseks. DeepMindi tehnoloogiaid rakendatakse sellistes valdkondades nagu robootika, meditsiin, energiatõhusus ja loomuliku keele töötlemine.

Gemini Roboticsi tehnoloogilised alused

Gemini Robotics loodi täiustatud nägemise-keele-tegevuse (VLA) mudelina, tuginedes juba niigi võimsale Gemini 2.0-le. Peamine uuendus seisneb selles, et süsteem suudab lisaks digitaalsete andmete, näiteks teksti, piltide või videote töötlemisele esmakordselt ka füüsilisi toiminguid reaalses maailmas teha.

See tehnoloogia kasutab ära Gemini 2.0 multimodaalse mõistmise võimekust ja laiendab seda, et hõlmata uut olulist moodust: füüsilisi tegevusi. See võimaldab robotitel ühendada digitaalset ja füüsilist maailma viisil, mis varem oli võimatu.

Sobib selleks:

Toimimis- ja tajuvõimed

Gemini Roboticsi tehnoloogiline läbimurre seisneb võimes tajuda kaamerate abil keskkonda, ära tunda objekte ja jäädvustada nende ruumilisi mõõtmeid. Seejärel teisendatakse see teave täpsete tehniliste koordinaatidega 3D-maailmaks.

Süsteem saab ka:

  • Looduskeele käskude mõistmine ja nende tõlkimine füüsilisteks tegevusteks
  • Objektide vaheliste keerukate ruumiliste suhete mõistmine
  • Uute, harjumatute olukordadega kohanemine
  • üldistamine erinevate robotitüüpide vahel

Kaks teineteist täiendavat mudelit: Gemini Robotics ja Gemini Robotics-ER

Google DeepMind on avalikustanud mitte ühe, vaid kaks spetsialiseeritud mudelit, mis käsitlevad robootika tehisintellekti erinevaid aspekte.

Gemini Robootika

Gemini Roboticsi peamine mudel ühendab Gemini 2.0 kõnetöötlusvõimalused füüsilise juhtimisega. See võimaldab robotitel reageerida loomuliku keele käsklustele, mõista keerulisi keskkondi ja sooritada adaptiivseid toiminguid.

Gemini Robootika-ER

Teine mudel, Gemini Robotics-ER (kus ER tähistab „kehastunud arutluskäiku“), keskendub ruumilise mõtlemise täiustamisele. See võime on ülioluline robotite jaoks, mis peavad töötama dünaamilistes kolmemõõtmelistes keskkondades.

Näiteks Gemini Robotics-ER suudab intuitiivselt tuvastada parima viisi objekti haaramiseks. Kui mudelile näidatakse kohvitassi, saab see iseseisvalt valida sobiva kahe sõrmega haarde, et tassi käepidemest tõsta, ja arvutada välja ohutu liikumisjärjestuse.

Tõestatud oskused ja praktilised rakendused

Muljetavaldavates demonstratsioonivideotes demonstreerib Google DeepMind oma uute tehisintellekti mudelite praktilisi võimalusi. Robootikasüsteemid suudavad täita mitmesuguseid keerulisi ülesandeid, sealhulgas:

  • Origami ja paberi kokkupandav
  • Objektide sorteerimine ja korraldamine suuliste juhiste põhjal
  • Õrnade esemete täpne haaramine ja liigutamine
  • Prillide ettevaatlik asetamine karpi
  • Täringute veeretamine ja väikeste esemetega manipuleerimine
  • Tõmbluku koos sulgemine
  • Kõrvaklappide kaablite kerimine
  • Täppisülesannete, näiteks korvpalli pealtpanekute sooritamine

Eriti tähelepanuväärne on see, et robotid täidavad neid ülesandeid autonoomselt vaid üheainsa käsu saamise järel. Süsteem tunneb iseseisvalt ära objektid, tuvastab need, tuletab vajalikud üksikud sammud ja juhib vastavalt roboti käsi.

Strateegilised partnerlused edasiseks arenguks

Selle tehnoloogia täieliku potentsiaali vallandamiseks teeb Google DeepMind koostööd robootikatööstuse juhtivate ettevõtetega:

  • Apptronik, Texases asuv idufirma, mis töötas välja humanoidroboti „Apollo“, mis on loodud logistika- ja tootmisülesannete jaoks, nagu kastide tõstmine, teisaldamine ja virnastamine
  • Boston Dynamics, tuntud robootikaettevõte, mille Google iroonilisel kombel kunagi ostis ja hiljem uuesti maha müüs
  • Agility Robotics ja Agile Robots täiendavate partneritena Gemini Robotics-ER arendamisel ja testimisel

See koostöö näitab Google'i strateegiat tehnoloogia rakendamiseks ja testimiseks erinevatel robotiplatvormidel, et tagada selle laialdane rakendatavus.

Sobib selleks:

Robootika tuleviku tähtsus

DeepMindi robootikadirektor Kanishka Rao selgitas pressikonverentsil, et üks suurimaid väljakutseid robootikas on see, et robotid toimivad tavaliselt hästi teadaolevates olukordades, kuid ebaõnnestuvad tundmatutes olukordades. Gemini Robotics püüab just seda probleemi lahendada.

Sobib selleks:

Suurte keelemudelite (LLM) integreerimine robootikasse on osa kasvavast trendist ja Gemini lähenemisviis võiks olla selle üks muljetavaldavamaid näiteid. Jan Liphardt, Stanfordi ülikooli bioinseneri professor ja OpenMindi asutaja, rõhutab, et see on "üks esimesi näiteid generatiivse tehisintellekti ja suurte keelemudelite rakendamisest täiustatud robotitele" ning see võib "tõeliselt olla võti robotiõpetajate, robotiabiliste ja robotikaaslaste avamiseks".

Nvidia tegevjuht Jensen Huang läheb veelgi kaugemale, väites, et generatiivse tehisintellekti kasutamine robotite laiaulatuslikuks juurutamiseks võiks kujutada endast mitme triljoni USA dollari suurust turupotentsiaali.

Kaksikud ja robootika: pöördepunkt intelligentsete süsteemide jaoks?

Vaatamata muljetavaldavale edusammule on väljakutseid endiselt. Ken Goldberg, California Ülikooli Berkeley robootikaprofessor, kirjeldab tehisintellekti süsteeme kui „põnevat arengut robootika valdkonnas“, kuid hoiatab, et „enne kui üldotstarbelised robotid on igapäevaseks kasutamiseks valmis, on veel palju tööd teha“.

Google plaanib pakkuda selle tehnoloogia võimaluste kohta lisateavet eelseisva Google I/O konverentsi ajal. Oma pikaajalise huviga robootika vastu ja nüüd ka sobiva tarkvarakomponendina Gemini abil võiks Google avada uue peatüki intelligentsete robotite arendamisel.

Kõnest tegudeni: Google seab robootikas uued standardid

Google DeepMind on Gemini Roboticsiga astunud olulise sammu tehisintellekti ja robootika ühendamise suunas. Selle võime mõista loomulikku keelt, tajuda keerulisi keskkondi ja sooritada füüsilisi toiminguid võib tulevikus robotite kasutamist revolutsiooniliselt muuta.

See tehnoloogia tähistab üleminekut puhtalt digitaalsetelt tehisintellekti rakendustelt süsteemidele, millel on otsene mõju füüsilisele maailmale. Kuigi see võib mõnede tehisintellekti skeptikute seas muret tekitada, on Google DeepMindi peamine eesmärk arendada adaptiivseid ja kasulikke robotsüsteeme, mis suudavad keerukate ülesannetega toime tulla väiksema väljaõppega.

Lähiaastad näitavad, kuidas see tehnoloogia areneb ja milliseid praktilisi rakendusi see leiab erinevates valdkondades, alates tööstusest kuni igapäevaeluni.

Sobib selleks:

 

Teie ülemaailmne turundus- ja äriarenduspartner

☑️ Meie ärikeel on inglise või sakslane

☑️ Uus: kirjavahetus teie riigikeeles!

 

Digitaalne teerajaja - Konrad Wolfenstein

Konrad Wolfenstein

Mul on hea meel, et olete teile ja minu meeskonnale isikliku konsultandina kättesaadav.

Võite minuga ühendust võtta, täites siin kontaktvormi või helistage mulle lihtsalt telefonil +49 89 674 804 (München) . Minu e -posti aadress on: Wolfenstein xpert.digital

Ootan meie ühist projekti.

 

 

☑️ VKE tugi strateegia, nõuannete, planeerimise ja rakendamise alal

☑️ digitaalse strateegia loomine või ümberpaigutamine ja digiteerimine

☑️ Rahvusvaheliste müügiprotsesside laiendamine ja optimeerimine

☑️ Globaalsed ja digitaalsed B2B kauplemisplatvormid

☑️ teerajajate äriarendus / turundus / PR / mõõde


⭐️ Tehisintellekt (AI) – AI ajaveeb, leviala ja sisukeskus ⭐️ Robootika ⭐️ XPaper