⭐️ Mesterséges intelligencia (AI) -i blog, hotspot és tartalmi hub ⭐️ robotika/robotika ⭐️ Xpaper

Hangválasztás 📢

Google Gemini 2.0, A mesterséges intelligencia és a robotika: Ikrek robotika és Gemini Robotics-er

Megjelent: 2025. március 20. / Frissítés: 2025. március 20. - Szerző: Konrad Wolfenstein

Google Gemini 2.0, A mesterséges intelligencia és a robotika: Ikrek robotika és Ikrek robotika-ER-Kreative Image: Xpert.Digital

DeepMind bemutatja az Ikrét: Megkezdődik a robotika következő korszaka

Ikrek Robotika: A Google a mesterséges intelligencia és a robotika átalakító egyesülése

2025. március 12 -én a Google DeepMind bemutatta legújabb Gemini Robotics projektjét, egy lenyűgöző technológiát, amely ötvözi az erőteljes Gemini 2.0 nyelvi modellt a fejlett robotikával. Ez az innováció fontos mérföldkövet jelent az intelligens robotrendszerek fejlesztésében, amelyek megértik a természetes nyelvet és komplex fizikai feladatokat végeznek.

A Google Deepmind a mesterséges intelligencia (AI) vezető kutatóvállalata, amelyet 2010 -ben alapítottak és 2014 -ben vették át. A fejlett AI technológiák fejlesztésére összpontosít, amelyeket rövid távú tárolással és mesterséges memóriával rendelkező ideghálózatok jellemeznek. A DeepMind jelentős áttöréseket ért el, ideértve az emberi játékosok védelmét a „GO” játékban és az Alphafold fejlesztését, amely a fehérjeszerkezetek előrejelzésének rendszere. A DeepMind technológiáit olyan területeken használják, mint a robotika, az orvostudomány, az energiahatékonyság és a nyelvfeldolgozás.

A Gemini Robotics technológiai alapjai

A Gemini Robotics -t a modell (VLA) modell progresszív látási hosszaként tervezték, amely a már erőteljes Gemini 2.0 -ra épül. A központi innováció az, hogy a rendszer nemcsak a digitális adatokat, például szövegeket, képeket vagy videókat tud feldolgozni, hanem a való világban is fizikai tevékenységeket is végezhet.

A technológia a Gemini 2.0 multimodális megértését használja, és egy meghatározó új módszerrel bővíti azt: a fizikai tevékenységeket. Ez lehetővé teszi a robotok számára, hogy áthidalják a digitális és a fizikai világot oly módon, hogy még nem volt lehetséges.

Alkalmas:

A Google Gemini platformja a Google AI Stúdióval, a Google Deep Research a Gemini Advanceddel és a Google DeepMind

Funkcionális és érzékelési készségek

A Gemini robotika technológiai áttörése abban rejlik, hogy képesek érzékelni a környezetet kamerákon keresztül, felismerni a tárgyakat és megragadni a térbeli dimenzióikat. Ezt az információt ezután 3D -s világsá alakítják, pontos műszaki koordinátákkal.

A rendszer is:

Értse meg a természetes nyelvi parancsokat, és hajtsa végre azt a fizikai tevékenységekben
Értse meg az objektumok közötti komplex térbeli összefüggéseket
Alkalmazkodni az új, ismeretlen helyzetekhez
Generáljon különböző robottípusokat

A két kiegészítő modell: Ikrek robotika és Ikrek robotika-er

A Google DeepMind nemcsak egy, hanem két speciális modellt mutatott be, amelyek a robotika AI különféle aspektusait foglalkoznak.

Ikrek robotika

A Fő Gemini Robotics fő modell egyesíti a Gemini 2.0 nyelvfeldolgozási képességeit a fizikai ellenőrzéssel. Ez lehetővé teszi a robotok számára, hogy reagáljanak a természetes nyelvi parancsokra, megértsék az összetett környezetet és hajtsák végre az adaptív műveleteket.

Ikrek robotika

A második modell, a Gemini Robotics-er (amelynek során a „megtestesített érvelés” vagy a „módosított logika”) a jobb térbeli gondolkodásra összpontosít. Ez a képesség elengedhetetlen a robotok számára, amelyeknek dinamikus, háromdimenziós környezetben kell viselkedniük.

Például a Gemini Robotics-er intuitív módon felismerheti, hogyan lehet az objektumot a legjobban használni. Ha egy kávéscsésze megjelenik a modellnek, akkor önállóan választhat egy megfelelő két ujjkezelő fogantyút, hogy a csésze a fogantyúra emelje és kiszámítsa a biztonságos mozgást.

Bizonyított készségek és gyakorlati alkalmazások

Lenyűgöző demonstrációs videókban a Google DeepMind megmutatja az új AI modellek gyakorlati képességeit. A robotrendszerek különféle összetett feladatokat végezhetnek, beleértve:

Origami és papír redők
Objektumok válogatása és szervezése verbális utasítások alapján
Pontos megragadó és mozgó törékeny tárgyak
A szemüveg gondos beillesztése Etui -ban
Kocka és manipulálja a kis tárgyakat
A cipzár együtt történő bezárása
Fejhallgató -kábelek csomagolása
Precíziós feladatok, például kosárlabda dunking végrehajtása

Különösen figyelemre méltó, hogy a robotok ezeket a feladatokat önállóan hajtják végre, miután csak utasítást kaptak. A rendszer függetlenül érzékeli az objektumokat, azonosítja azokat, levezeti a szükséges egyes lépéseket és ennek megfelelően vezérli a robot karját.

Stratégiai partnerségek a továbbfejlesztéshez

A technológia teljes potenciáljának megnyitásához a Google DeepMind együttműködik a robotikai ipar vezető vállalataival:

Az Apptronik, a texasi induló vállalkozás, amely kifejlesztette az „Apollo” humanoid robotot, amelyet olyan logisztikai és gyártási feladatokhoz terveztek, mint például a dobozok emelése, mozgatása és rakása
A Boston Dynamics, egy jól ismert robotikai cég, amelyet a Google ironikusan vásárolt, és később újra eladta
Agilitási robotika és agilis robotok, mint más partnerek a Gemini Robotics-ER fejlesztésében és tesztelésében

Ez az együttműködés megmutatja a Google stratégiáját, hogy a technológiát különféle robotplatformokon valósítsák meg és teszteljék a széles körű alkalmazhatóságuk biztosítása érdekében.

Alkalmas:

Google Deep Research a Gemini 2.0 -val - A fejlett kutatási funkciók átfogó elemzése

Jelentése a robotika jövőjének

A Kanishka Rao, a Deepmind robotika igazgatója egy sajtótájékoztatón elmondta, hogy a robotika egyik legnagyobb kihívása azt jelenti, hogy a robotok jellemzően jól működnek az ismert forgatókönyvekben, de ismeretlen helyzetekben kudarcot vallnak. Az Ikrek robotikájának pontosan meg kell oldani ezt a problémát.

Alkalmas:

Humanoid állványvezérlés: Tanuljon meg, hogy felkeljen a „gazda” humanoidokkal-a robotok áttörése a mindennapi életben

A nagy nyelvi modellek (LLMS) a robotba történő integrálása a növekvő tendencia része, és Gemini megközelítése lehet az egyik leglátványosabb példa erre. Jan Liphardt, a Stanfordi Egyetem biomérnöki professzora és az OpenMind alapítója hangsúlyozza, hogy ez „ez az egyik első példa a generatív AI és a nagy nyelvi modellek használatára a fejlett robotokon” és „valóban a robot segítők és robottársainak fejlesztésének kulcsa”.

Az NVIDIA vezérigazgatója, Jensen Huang még tovább megy, és azt jelzi, hogy a generatív AI robotok biztosításához történő felhasználása több billió dollár piaci potenciál lehet nagymértékben.

Ikrek és robotika: fordulópont az intelligens rendszerek számára?

A lenyűgöző haladás ellenére továbbra is vannak kihívások. Ken Goldberg, a Berkeley-i Kaliforniai Egyetem robotika professzora, az AI rendszereket „izgalmas fejleményként írja le a robotika területén”, de rámutat arra, hogy „még sok tennivaló van, mielőtt az összes célú robotok készen állnak a mindennapi életben való felhasználásra”.

A Google azt tervezi, hogy további betekintést nyújt a technológia lehetőségeibe a közelgő Google I/O konferencia körül. A robotika iránti sok éves érdeklődéssel és a Gemini -vel, mint megfelelő szoftverkomponenssel, a Google új fejezetet nyithat az intelligens robotok fejlesztésében.

Nyelve a cselekvésig: A Google új szabványokat állít be a robotikában

A Gemini Robotics segítségével a Google DeepMind fontos lépést tett az AI és a robotika fúziója felé. A természetes nyelv megértésének, a komplex környezetek érzékelésének és a fizikai tevékenységek végrehajtásának képessége forradalmasíthatja a robotok jövőben történő felhasználásának módját.

Ez a technológia jelzi a tisztán digitális AI alkalmazásokról olyan rendszerekre való átmenetet, amelyek közvetlen hatással lehetnek a fizikai világra. Noha ez aggodalmakat válthat ki néhány AI szkeptikussal kapcsolatban, a Google Deepmind fő hangsúlya az adaptív és hasznos robotrendszerek fejlesztésére irányul, amelyek kevesebb képzéssel képesek kezelni az összetett feladatokat.

Az elkövetkező évek megmutatják, hogyan fejlődik ez a technológia, és milyen gyakorlati alkalmazásokat talál a különböző területeken, az ipartól a mindennapi életig.

Alkalmas: