Megjelent: 2025. március 20. / Frissítés: 2025. március 20. - Szerző: Konrad Wolfenstein

Google Gemini 2.0, A mesterséges intelligencia és a robotika: Ikrek robotika és Ikrek robotika-ER-Kreative Image: Xpert.Digital
DeepMind bemutatja az Ikrét: Megkezdődik a robotika következő korszaka
Ikrek Robotika: A Google a mesterséges intelligencia és a robotika átalakító egyesülése
2025. március 12 -én a Google DeepMind bemutatta legújabb Gemini Robotics projektjét, egy lenyűgöző technológiát, amely ötvözi az erőteljes Gemini 2.0 nyelvi modellt a fejlett robotikával. Ez az innováció fontos mérföldkövet jelent az intelligens robotrendszerek fejlesztésében, amelyek megértik a természetes nyelvet és komplex fizikai feladatokat végeznek.
A Google Deepmind a mesterséges intelligencia (AI) vezető kutatóvállalata, amelyet 2010 -ben alapítottak és 2014 -ben vették át. A fejlett AI technológiák fejlesztésére összpontosít, amelyeket rövid távú tárolással és mesterséges memóriával rendelkező ideghálózatok jellemeznek. A DeepMind jelentős áttöréseket ért el, ideértve az emberi játékosok védelmét a „GO” játékban és az Alphafold fejlesztését, amely a fehérjeszerkezetek előrejelzésének rendszere. A DeepMind technológiáit olyan területeken használják, mint a robotika, az orvostudomány, az energiahatékonyság és a nyelvfeldolgozás.
A Gemini Robotics technológiai alapjai
A Gemini Robotics -t a modell (VLA) modell progresszív látási hosszaként tervezték, amely a már erőteljes Gemini 2.0 -ra épül. A központi innováció az, hogy a rendszer nemcsak a digitális adatokat, például szövegeket, képeket vagy videókat tud feldolgozni, hanem a való világban is fizikai tevékenységeket is végezhet.
A technológia a Gemini 2.0 multimodális megértését használja, és egy meghatározó új módszerrel bővíti azt: a fizikai tevékenységeket. Ez lehetővé teszi a robotok számára, hogy áthidalják a digitális és a fizikai világot oly módon, hogy még nem volt lehetséges.
Alkalmas:
- A Google Gemini platformja a Google AI Stúdióval, a Google Deep Research a Gemini Advanceddel és a Google DeepMind
Funkcionális és érzékelési készségek
A Gemini robotika technológiai áttörése abban rejlik, hogy képesek érzékelni a környezetet kamerákon keresztül, felismerni a tárgyakat és megragadni a térbeli dimenzióikat. Ezt az információt ezután 3D -s világsá alakítják, pontos műszaki koordinátákkal.
A rendszer is:
- Értse meg a természetes nyelvi parancsokat, és hajtsa végre azt a fizikai tevékenységekben
- Értse meg az objektumok közötti komplex térbeli összefüggéseket
- Alkalmazkodni az új, ismeretlen helyzetekhez
- Generáljon különböző robottípusokat
A két kiegészítő modell: Ikrek robotika és Ikrek robotika-er
A Google DeepMind nemcsak egy, hanem két speciális modellt mutatott be, amelyek a robotika AI különféle aspektusait foglalkoznak.
Ikrek robotika
A Fő Gemini Robotics fő modell egyesíti a Gemini 2.0 nyelvfeldolgozási képességeit a fizikai ellenőrzéssel. Ez lehetővé teszi a robotok számára, hogy reagáljanak a természetes nyelvi parancsokra, megértsék az összetett környezetet és hajtsák végre az adaptív műveleteket.
Ikrek robotika
A második modell, a Gemini Robotics-er (amelynek során a „megtestesített érvelés” vagy a „módosított logika”) a jobb térbeli gondolkodásra összpontosít. Ez a képesség elengedhetetlen a robotok számára, amelyeknek dinamikus, háromdimenziós környezetben kell viselkedniük.
Például a Gemini Robotics-er intuitív módon felismerheti, hogyan lehet az objektumot a legjobban használni. Ha egy kávéscsésze megjelenik a modellnek, akkor önállóan választhat egy megfelelő két ujjkezelő fogantyút, hogy a csésze a fogantyúra emelje és kiszámítsa a biztonságos mozgást.
Bizonyított készségek és gyakorlati alkalmazások
Lenyűgöző demonstrációs videókban a Google DeepMind megmutatja az új AI modellek gyakorlati képességeit. A robotrendszerek különféle összetett feladatokat végezhetnek, beleértve:
- Origami és papír redők
- Objektumok válogatása és szervezése verbális utasítások alapján
- Pontos megragadó és mozgó törékeny tárgyak
- A szemüveg gondos beillesztése Etui -ban
- Kocka és manipulálja a kis tárgyakat
- A cipzár együtt történő bezárása
- Fejhallgató -kábelek csomagolása
- Precíziós feladatok, például kosárlabda dunking végrehajtása
Különösen figyelemre méltó, hogy a robotok ezeket a feladatokat önállóan hajtják végre, miután csak utasítást kaptak. A rendszer függetlenül érzékeli az objektumokat, azonosítja azokat, levezeti a szükséges egyes lépéseket és ennek megfelelően vezérli a robot karját.
Stratégiai partnerségek a továbbfejlesztéshez
A technológia teljes potenciáljának megnyitásához a Google DeepMind együttműködik a robotikai ipar vezető vállalataival:
- Az Apptronik, a texasi induló vállalkozás, amely kifejlesztette az „Apollo” humanoid robotot, amelyet olyan logisztikai és gyártási feladatokhoz terveztek, mint például a dobozok emelése, mozgatása és rakása
- A Boston Dynamics, egy jól ismert robotikai cég, amelyet a Google ironikusan vásárolt, és később újra eladta
- Agilitási robotika és agilis robotok, mint más partnerek a Gemini Robotics-ER fejlesztésében és tesztelésében
Ez az együttműködés megmutatja a Google stratégiáját, hogy a technológiát különféle robotplatformokon valósítsák meg és teszteljék a széles körű alkalmazhatóságuk biztosítása érdekében.
Alkalmas:
Jelentése a robotika jövőjének
A Kanishka Rao, a Deepmind robotika igazgatója egy sajtótájékoztatón elmondta, hogy a robotika egyik legnagyobb kihívása azt jelenti, hogy a robotok jellemzően jól működnek az ismert forgatókönyvekben, de ismeretlen helyzetekben kudarcot vallnak. Az Ikrek robotikájának pontosan meg kell oldani ezt a problémát.
Alkalmas:
- Humanoid állványvezérlés: Tanuljon meg, hogy felkeljen a „gazda” humanoidokkal-a robotok áttörése a mindennapi életben
A nagy nyelvi modellek (LLMS) a robotba történő integrálása a növekvő tendencia része, és Gemini megközelítése lehet az egyik leglátványosabb példa erre. Jan Liphardt, a Stanfordi Egyetem biomérnöki professzora és az OpenMind alapítója hangsúlyozza, hogy ez „ez az egyik első példa a generatív AI és a nagy nyelvi modellek használatára a fejlett robotokon” és „valóban a robot segítők és robottársainak fejlesztésének kulcsa”.
Az NVIDIA vezérigazgatója, Jensen Huang még tovább megy, és azt jelzi, hogy a generatív AI robotok biztosításához történő felhasználása több billió dollár piaci potenciál lehet nagymértékben.
Ikrek és robotika: fordulópont az intelligens rendszerek számára?
A lenyűgöző haladás ellenére továbbra is vannak kihívások. Ken Goldberg, a Berkeley-i Kaliforniai Egyetem robotika professzora, az AI rendszereket „izgalmas fejleményként írja le a robotika területén”, de rámutat arra, hogy „még sok tennivaló van, mielőtt az összes célú robotok készen állnak a mindennapi életben való felhasználásra”.
A Google azt tervezi, hogy további betekintést nyújt a technológia lehetőségeibe a közelgő Google I/O konferencia körül. A robotika iránti sok éves érdeklődéssel és a Gemini -vel, mint megfelelő szoftverkomponenssel, a Google új fejezetet nyithat az intelligens robotok fejlesztésében.
Nyelve a cselekvésig: A Google új szabványokat állít be a robotikában
A Gemini Robotics segítségével a Google DeepMind fontos lépést tett az AI és a robotika fúziója felé. A természetes nyelv megértésének, a komplex környezetek érzékelésének és a fizikai tevékenységek végrehajtásának képessége forradalmasíthatja a robotok jövőben történő felhasználásának módját.
Ez a technológia jelzi a tisztán digitális AI alkalmazásokról olyan rendszerekre való átmenetet, amelyek közvetlen hatással lehetnek a fizikai világra. Noha ez aggodalmakat válthat ki néhány AI szkeptikussal kapcsolatban, a Google Deepmind fő hangsúlya az adaptív és hasznos robotrendszerek fejlesztésére irányul, amelyek kevesebb képzéssel képesek kezelni az összetett feladatokat.
Az elkövetkező évek megmutatják, hogyan fejlődik ez a technológia, és milyen gyakorlati alkalmazásokat talál a különböző területeken, az ipartól a mindennapi életig.
Alkalmas:
Az Ön globális marketing- és üzletfejlesztési partnere
☑️ Üzleti nyelvünk angol vagy német
☑️ ÚJ: Levelezés az Ön nemzeti nyelvén!
Szívesen szolgálok Önt és csapatomat személyes tanácsadóként.
Felveheti velem a kapcsolatot az itt található kapcsolatfelvételi űrlap kitöltésével , vagy egyszerűen hívjon a +49 89 89 674 804 (München) . Az e-mail címem: wolfenstein ∂ xpert.digital
Nagyon várom a közös projektünket.