Röstval 📢


Google Gemini 2.0, artificiell intelligens och robotik: Gemini Robotics och Gemini Robotics-ER

Publicerad den: 20 mars 2025 / Uppdaterad den: 20 mars 2025 – Författare: Konrad Wolfenstein

Google Gemini 2.0, artificiell intelligens och robotik: Gemini Robotics och Gemini Robotics-ER

Google Gemini 2.0, artificiell intelligens och robotik: Gemini Robotics och Gemini Robotics-ER – Kreativ bild: Xpert.Digital

DeepMind presenterar Gemini: Nästa era av robotik börjar

Gemini Robotics: Googles transformerande fusion av artificiell intelligens och robotik

Den 12 mars 2025 presenterade Google DeepMind sitt senaste projekt, Gemini Robotics, en imponerande teknik som kombinerar den kraftfulla språkmodellen Gemini 2.0 med avancerad robotteknik. Denna innovation markerar en viktig milstolpe i utvecklingen av intelligenta robotsystem som kan förstå naturligt språk och utföra komplexa fysiska uppgifter.

Google DeepMind är ett ledande forskningsföretag inom artificiell intelligens (AI), grundat 2010 och förvärvat av Google 2014. Företaget fokuserar på att utveckla avancerade AI-tekniker som kännetecknas av neurala nätverk med korttidslagring och artificiellt minne. DeepMind har uppnått betydande genombrott, inklusive att besegra mänskliga spelare i spelet Go och utveckla AlphaFold, ett system för att förutsäga proteinstrukturer. DeepMinds tekniker tillämpas inom områden som robotik, medicin, energieffektivitet och naturlig språkbehandling.

De tekniska grunderna för Gemini Robotics

Gemini Robotics designades som en avancerad Vision-Language-Action (VLA)-modell, byggd på den redan kraftfulla Gemini 2.0. Den viktigaste innovationen är att systemet inte bara kan bearbeta digital data som text, bilder eller videor, utan för första gången även utföra fysiska handlingar i den verkliga världen.

Tekniken utnyttjar Gemini 2.0:s multimodala förståelsekapacitet och utökar den till att omfatta en avgörande ny modalitet: fysiska handlingar. Detta gör det möjligt för robotarna att överbrygga den digitala och fysiska världen på ett sätt som tidigare var omöjligt.

Lämplig för detta:

Funktions- och perceptionsförmåga

Gemini Robotics tekniska genombrott ligger i dess förmåga att uppfatta sin omgivning via kameror, känna igen objekt och fånga deras rumsliga dimensioner. Denna information omvandlas sedan till en 3D-värld med exakta tekniska koordinater.

Systemet kan också:

  • Förstå kommandon i naturligt språk och översätta dem till fysiska handlingar
  • Att förstå komplexa rumsliga relationer mellan objekt
  • Att anpassa sig till nya, okända situationer
  • generalisering över olika robottyper

De två kompletterande modellerna: Gemini Robotics och Gemini Robotics-ER

Google DeepMind har presenterat inte en, utan två specialiserade modeller som tar upp olika aspekter av robotisk AI.

Gemini Robotics

Gemini Robotics huvudmodell kombinerar Gemini 2.0:s talbehandlingsfunktioner med fysisk kontroll. Den gör det möjligt för robotar att svara på kommandon från naturligt språk, förstå komplexa miljöer och utföra anpassningsbara åtgärder.

Gemini Robotics-ER

Den andra modellen, Gemini Robotics-ER (där ER står för ”embodied reasoning”), fokuserar på förbättrat spatial resonemang. Denna förmåga är avgörande för robotar som måste arbeta i dynamiska, tredimensionella miljöer.

Gemini Robotics-ER kan till exempel intuitivt känna igen det bästa sättet att greppa ett föremål. Om modellen visas en kaffekopp kan den självständigt välja ett lämpligt tvåfingersgrepp för att lyfta koppen i handtaget och beräkna en säker rörelsesekvens.

Bevisade färdigheter och praktiska tillämpningar

I imponerande demonstrationsvideor visar Google DeepMind upp de praktiska funktionerna hos sina nya AI-modeller. Robotsystemen kan utföra en mängd olika komplexa uppgifter, inklusive:

  • Vikbar origami och papper
  • Sortera och organisera föremål baserat på muntliga instruktioner
  • Precis greppning och förflyttning av ömtåliga föremål
  • Placera glasögonen försiktigt i ett fodral
  • Att slå tärningar och manipulera små föremål
  • Stänga en dragkedja tillsammans
  • Lindande hörlurskablar
  • Utföra precisionsuppgifter som basketdunkar

Det som är särskilt anmärkningsvärt är att robotarna utför dessa uppgifter autonomt efter att ha mottagit endast en enda instruktion. Systemet känner självständigt igen objekt, identifierar dem, härleder de nödvändiga individuella stegen och styr robotarmarna därefter.

Strategiska partnerskap för vidareutveckling

För att frigöra den fulla potentialen hos denna teknik samarbetar Google DeepMind med ledande företag inom robotindustrin:

  • Apptronik, en Texas-baserad startup som utvecklade den humanoida roboten ”Apollo”, designad för logistik- och tillverkningsuppgifter som att lyfta, flytta och stapla lådor
  • Boston Dynamics, ett välkänt robotföretag som ironiskt nog en gång köptes av Google och senare såldes igen
  • Agility Robotics och Agile Robots som ytterligare partners för utveckling och testning av Gemini Robotics-ER

Detta samarbete visar Googles strategi att implementera och testa tekniken på olika robotplattformar för att säkerställa dess breda tillämpbarhet.

Lämplig för detta:

Betydelse för robotikens framtid

DeepMinds robotchef, Kanishka Rao, förklarade under en presskonferens att en av de största utmaningarna inom robotik är att robotar vanligtvis presterar bra i kända scenarier men misslyckas i okända situationer. Gemini Robotics siktar på att lösa just detta problem.

Lämplig för detta:

Integreringen av stora språkmodeller (LLM) i robotik är en del av en växande trend, och Geminis tillvägagångssätt kan vara ett av de mest imponerande exemplen på detta. Jan Liphardt, professor i bioteknik vid Stanford University och grundare av OpenMind, betonar att detta är "ett av de första exemplen på tillämpning av generativ AI och stora språkmodeller på avancerade robotar" och "verkligen kan vara nyckeln till att låsa upp robotlärare, robothjälpare och robotkamrater".

Nvidias VD Jensen Huang går ännu längre och föreslår att användningen av generativ AI för att driftsätta robotar i stor skala skulle kunna representera en marknadspotential på flera biljoner amerikanska dollar.

Gemini och robotik: En vändpunkt för intelligenta system?

Trots de imponerande framstegen kvarstår utmaningar. Ken Goldberg, professor i robotik vid University of California, Berkeley, beskriver AI-system som ”en spännande utveckling inom robotikområdet”, men varnar för att ”mycket arbete återstår innan universalrobotar är redo för vardagsbruk”.

Google planerar att ge ytterligare insikter i möjligheterna med denna teknik runt tiden för den kommande Google I/O-konferensen. Med sitt långvariga intresse för robotik och nu med Gemini som en lämplig mjukvarukomponent skulle Google kunna öppna ett nytt kapitel i utvecklingen av intelligenta robotar.

Från tal till handling: Google sätter nya standarder inom robotteknik

Med Gemini Robotics har Google DeepMind tagit ett betydande steg mot en sammanslagning av AI och robotik. Dess förmåga att förstå naturligt språk, uppfatta komplexa miljöer och utföra fysiska handlingar kan revolutionera hur robotar används i framtiden.

Denna teknik markerar övergången från rent digitala AI-applikationer till system som kan ha en direkt inverkan på den fysiska världen. Även om detta kan väcka oro bland vissa AI-skeptiker, ligger Google DeepMinds primära fokus på att utveckla adaptiva och användbara robotsystem som kan hantera komplexa uppgifter med mindre träning.

De kommande åren kommer att visa hur denna teknik utvecklas och vilka praktiska tillämpningar den kommer att finna inom olika områden, från industri till vardagsliv.

Lämplig för detta:

 

Din globala marknadsförings- och affärsutvecklingspartner

☑ Vårt affärsspråk är engelska eller tyska

☑ Nytt: korrespondens på ditt nationella språk!

 

Digital pionjär - Konrad Wolfenstein

Konrad Wolfenstein

Jag är glad att vara tillgänglig för dig och mitt team som personlig konsult.

Du kan kontakta mig genom att fylla i kontaktformuläret eller helt enkelt ringa mig på +49 89 674 804 (München) . Min e -postadress är: Wolfenstein xpert.digital

Jag ser fram emot vårt gemensamma projekt.

 

 

☑ SME -stöd i strategi, rådgivning, planering och implementering

☑ skapande eller omjustering av den digitala strategin och digitaliseringen

☑ Expansion och optimering av de internationella försäljningsprocesserna

☑ Globala och digitala B2B -handelsplattformar

☑ Pioneer Business Development / Marketing / PR / Measure


⭐️ Artificiell intelligens (AI) - AI-blogg, hotspot och innehållsnav ⭐️ Robotik ⭐️ XPaper