⭐️ Artificial Intelligence (AI) -AI Blog, hotspot en content hub ⭐️ Robotica/robotica ⭐️ XPaper

Spraakselectie 📢

Google Gemini 2.0, The Artificial Intelligence and Robotics: Gemini Robotics and Gemini Robotics-ER

Gepubliceerd op: 20 maart 2025 / UPDATE VAN: 20 maart 2025 - Auteur: Konrad Wolfenstein

Google Gemini 2.0, The Artificial Intelligence and Robotics: Gemini Robotics and Gemini Robotics-Er-Creative Image: Xpert.Digital

DeepMind presenteert Gemini: het volgende tijdperk van robotica begint

Gemini Robotics: Google's transformatieve fusie van kunstmatige intelligentie en robotica

Op 12 maart 2025 presenteerde Google DeepMind zijn nieuwste project Gemini Robotics, een indrukwekkende technologie die het krachtige Gemini 2.0 -taalmodel combineert met geavanceerde robotica. Deze innovatie markeert een belangrijke mijlpaal bij de ontwikkeling van intelligente robotsystemen die de natuurlijke taal kunnen begrijpen en complexe fysieke taken kunnen uitvoeren.

Google DeepMind is een toonaangevend onderzoeksbureau voor Artificial Intelligence (AI), dat in 2010 werd opgericht en in 2014 door Google werd overgenomen. Het richt zich op de ontwikkeling van geavanceerde AI-technologieën, die worden gekenmerkt door neurale netwerken met kortetermijnopslag en kunstmatig geheugen. DeepMind heeft aanzienlijke doorbraken bereikt, waaronder het verdedigen van menselijke spelers in het spel "Go" en de ontwikkeling van Alphafold, een systeem voor het voorspellen van eiwitstructuren. De DeepMind's technologieën worden gebruikt in gebieden zoals robotica, geneeskunde, energie -efficiëntie en taalverwerking.

De technologische grondslagen van Gemini -robotica

Gemini Robotics is ontworpen als een progressieve visuele lengte van het model (VLA) -model, dat voortbouwt op de al krachtige Gemini 2.0. De centrale innovatie is dat het systeem niet alleen digitale gegevens kan verwerken, zoals teksten, afbeeldingen of video's, maar ook voor het eerst fysieke acties in de echte wereld kan uitvoeren.

De technologie maakt gebruik van het multimodale begrip van Gemini 2.0 en breidt het uit met een beslissende nieuwe modaliteit: fysieke acties. Dit stelt de robots in staat om de digitale en fysieke wereld te overbruggen op een manier die nog niet mogelijk was.

Geschikt hiervoor:

Het Gemini -platform van Google met Google AI Studio, Google Deep Research met Gemini Advanced en Google DeepMind

Functionaliteit en perceptievaardigheden

De technologische doorbraak van Gemini -robotica ligt in zijn vermogen om de omgeving door camera's waar te nemen, objecten te herkennen en hun ruimtelijke dimensies vast te leggen. Deze informatie wordt vervolgens omgezet in een 3D -wereld met precieze technische coördinaten.

Het systeem kan ook:

Begrijp natuurlijke taalopdrachten en implementeer deze in fysieke acties
Begrijp complexe ruimtelijke relaties tussen objecten
Zich aanpassen aan nieuwe, onbekende situaties
Genereer over verschillende robottypen

De twee complementaire modellen: Gemini Robotics en Gemini Robotics-er

Google DeepMind heeft niet alleen één gepresenteerd, maar twee gespecialiseerde modellen die verschillende aspecten van de Robotics AI aanpakken.

Gemini -robotica

De hoofdmodel Gemini Robotics combineert de taalverwerkingsvaardigheden van Gemini 2.0 met fysieke controle. Hiermee kunnen robots reageren op natuurlijk taalopdrachten, complexe omgevingen begrijpen en adaptieve acties uitvoeren.

Gemini -robotica

Het tweede model, Gemini Robotics-ER (waarbij hij staat voor "belichaamde redeneren" of "gemodificeerde logica"), richt zich op verbeterd ruimtelijk denken. Dit vermogen is cruciaal voor robots die moeten werken in dynamische, drie -dimensionale omgevingen.

Gemini Robotics-er kan bijvoorbeeld intuïtief herkennen hoe een object het beste kan worden gebruikt. Als een koffiekopje aan het model wordt getoond, kan deze onafhankelijk een geschikte handgreep met twee vakken kiezen om de beker op het handvat op te tillen en een veilige beweging te berekenen.

Aantoonbare vaardigheden en praktische toepassingen

In indrukwekkende demonstratievideo's toont Google DeepMind de praktische vaardigheden van de nieuwe AI -modellen. De robotsystemen kunnen verschillende complexe taken uitvoeren, waaronder:

Plooien van origami en papier
Het sorteren en organiseren van objecten op basis van verbale instructies
Nauwkeurige aangrijpende en bewegende fragiele objecten
Zorgvuldige invoeging van bril in een ETUI
Dobbelstenen en manipuleren kleine objecten
Een ritssluiting samen sluiten
Hoofdtelefoonkabels inpakken
Uitvoering van precisietaken zoals basketbaldunnen

Het is vooral opmerkelijk dat de robots deze taken autonoom uitvoeren nadat ze alleen een instructie hebben ontvangen. Het systeem detecteert onafhankelijk objecten, identificeert ze, ontleent de nodige individuele stappen en regelt de robotarmen dienovereenkomstig.

Strategische partnerschappen voor verdere ontwikkeling

Om het volledige potentieel van deze technologie te openen, werkt Google Deepmind samen met toonaangevende bedrijven uit de robotica -industrie:

Apptronik, een Texaanse start-up die de humanoïde robot "Apollo" heeft ontwikkeld, die is ontworpen voor logistiek en productietaken zoals tillen, verplaatsen en stapelen van dozen
Boston Dynamics, een bekend robotisch bedrijf dat ironisch genoeg werd gekocht door Google en later opnieuw werd verkocht
Agility Robotics en Agile Robots als andere partners voor de ontwikkeling en test van Gemini Robotics-er

Deze samenwerking toont de strategie van Google om de technologie op verschillende robotplatforms te implementeren en te testen om hun brede toepasbaarheid te waarborgen.

Geschikt hiervoor:

Google Deep Research met Gemini 2.0 - Een uitgebreide analyse van geavanceerde onderzoeksfuncties

Betekenis voor de toekomst van robotica

De directeur van robotica bij DeepMind, Kanishka Rao, zei dat tijdens een persconferentie een van de grootste uitdagingen in robotica bestaat dat robots meestal goed werken in bekende scenario's, maar falen in onbekende situaties. Gemini -robotica zou dit probleem precies moeten oplossen.

Geschikt hiervoor:

Humanoid Stand-Up Control: Leer op te staan met "Host" Humanoids-de doorbraak voor robots in het dagelijks leven

De integratie van grote taalmodellen (LLM's) in het robotachtige is onderdeel van een groeiende trend, en de aanpak van Gemini zou een van de meest indrukwekkende voorbeelden hiervan kunnen zijn. Jan Liphardt, hoogleraar Bio Engineering aan de Stanford University en oprichter van OpenMind, benadrukt dat dit "een van de eerste voorbeelden is van het gebruik van generatieve AI en grote taalmodellen op geavanceerde robots" en "echt de sleutel tot de ontwikkeling van robothulpmachines en robotgenoten" zou kunnen zijn.

NVIDIA CEO Jensen Huang gaat nog verder en geeft aan dat het gebruik van generatieve AI om robots te leveren een marktpotentieel kan zijn van meerdere biljoen Amerikaanse dollars op grote schaal.

Gemini en Robotics: een keerpunt voor intelligente systemen?

Ondanks de indrukwekkende vooruitgang zijn er nog steeds uitdagingen. Ken Goldberg, hoogleraar robotica aan de Universiteit van Californië in Berkeley, beschrijft de AI-systemen als "een opwindende ontwikkeling op het gebied van robotica", maar wijst erop dat "er nog veel te doen is voordat robots voor alle doeleinden klaar zijn voor gebruik in het dagelijks leven".

Google is van plan om verdere inzichten te geven in de mogelijkheden van deze technologie rond de komende Google I/O -conferentie. Met zijn vele jaren interesse in robotica en nu met Gemini als een geschikte softwarecomponent, zou Google een nieuw hoofdstuk kunnen openen bij de ontwikkeling van intelligente robots.

Van taal tot actie: Google stelt nieuwe normen vast in robotica

Met Gemini -robotica heeft Google DeepMind een belangrijke stap gezet in de richting van de fusie van AI en robotica. Het vermogen om natuurlijke taal te begrijpen, complexe omgevingen waar te nemen en fysieke acties uit te voeren, kan een revolutie teweegbrengen in de manier waarop robots in de toekomst zullen worden gebruikt.

Deze technologie markeert de overgang van puur digitale AI -toepassingen naar systemen die een directe invloed kunnen hebben op de fysieke wereld. Hoewel dit de bezorgdheid over sommige AI -sceptici kan veroorzaken, ligt de belangrijkste focus van Google Deepmind op het ontwikkelen van adaptieve en nuttige robotsystemen die complexe taken met minder training kunnen beheren.

De komende jaren zullen laten zien hoe deze technologie zich ontwikkelt en welke praktische toepassingen u op verschillende gebieden zult vinden, van industrie tot dagelijks leven.

Geschikt hiervoor: