Gepubliceerd op: 20 maart 2025 / UPDATE VAN: 20 maart 2025 - Auteur: Konrad Wolfenstein
Google Gemini 2.0, The Artificial Intelligence and Robotics: Gemini Robotics and Gemini Robotics-Er-Creative Image: Xpert.Digital
DeepMind presenteert Gemini: het volgende tijdperk van robotica begint
Gemini Robotics: Google's transformatieve fusie van kunstmatige intelligentie en robotica
Op 12 maart 2025 presenteerde Google DeepMind zijn nieuwste project Gemini Robotics, een indrukwekkende technologie die het krachtige Gemini 2.0 -taalmodel combineert met geavanceerde robotica. Deze innovatie markeert een belangrijke mijlpaal bij de ontwikkeling van intelligente robotsystemen die de natuurlijke taal kunnen begrijpen en complexe fysieke taken kunnen uitvoeren.
Google DeepMind is een toonaangevend onderzoeksbureau voor Artificial Intelligence (AI), dat in 2010 werd opgericht en in 2014 door Google werd overgenomen. Het richt zich op de ontwikkeling van geavanceerde AI-technologieën, die worden gekenmerkt door neurale netwerken met kortetermijnopslag en kunstmatig geheugen. DeepMind heeft aanzienlijke doorbraken bereikt, waaronder het verdedigen van menselijke spelers in het spel "Go" en de ontwikkeling van Alphafold, een systeem voor het voorspellen van eiwitstructuren. De DeepMind's technologieën worden gebruikt in gebieden zoals robotica, geneeskunde, energie -efficiëntie en taalverwerking.
De technologische grondslagen van Gemini -robotica
Gemini Robotics is ontworpen als een progressieve visuele lengte van het model (VLA) -model, dat voortbouwt op de al krachtige Gemini 2.0. De centrale innovatie is dat het systeem niet alleen digitale gegevens kan verwerken, zoals teksten, afbeeldingen of video's, maar ook voor het eerst fysieke acties in de echte wereld kan uitvoeren.
De technologie maakt gebruik van het multimodale begrip van Gemini 2.0 en breidt het uit met een beslissende nieuwe modaliteit: fysieke acties. Dit stelt de robots in staat om de digitale en fysieke wereld te overbruggen op een manier die nog niet mogelijk was.
Geschikt hiervoor:
- Het Gemini -platform van Google met Google AI Studio, Google Deep Research met Gemini Advanced en Google DeepMind
Functionaliteit en perceptievaardigheden
De technologische doorbraak van Gemini -robotica ligt in zijn vermogen om de omgeving door camera's waar te nemen, objecten te herkennen en hun ruimtelijke dimensies vast te leggen. Deze informatie wordt vervolgens omgezet in een 3D -wereld met precieze technische coördinaten.
Het systeem kan ook:
- Begrijp natuurlijke taalopdrachten en implementeer deze in fysieke acties
- Begrijp complexe ruimtelijke relaties tussen objecten
- Zich aanpassen aan nieuwe, onbekende situaties
- Genereer over verschillende robottypen
De twee complementaire modellen: Gemini Robotics en Gemini Robotics-er
Google DeepMind heeft niet alleen één gepresenteerd, maar twee gespecialiseerde modellen die verschillende aspecten van de Robotics AI aanpakken.
Gemini -robotica
De hoofdmodel Gemini Robotics combineert de taalverwerkingsvaardigheden van Gemini 2.0 met fysieke controle. Hiermee kunnen robots reageren op natuurlijk taalopdrachten, complexe omgevingen begrijpen en adaptieve acties uitvoeren.
Gemini -robotica
Het tweede model, Gemini Robotics-ER (waarbij hij staat voor "belichaamde redeneren" of "gemodificeerde logica"), richt zich op verbeterd ruimtelijk denken. Dit vermogen is cruciaal voor robots die moeten werken in dynamische, drie -dimensionale omgevingen.
Gemini Robotics-er kan bijvoorbeeld intuïtief herkennen hoe een object het beste kan worden gebruikt. Als een koffiekopje aan het model wordt getoond, kan deze onafhankelijk een geschikte handgreep met twee vakken kiezen om de beker op het handvat op te tillen en een veilige beweging te berekenen.
Aantoonbare vaardigheden en praktische toepassingen
In indrukwekkende demonstratievideo's toont Google DeepMind de praktische vaardigheden van de nieuwe AI -modellen. De robotsystemen kunnen verschillende complexe taken uitvoeren, waaronder:
- Plooien van origami en papier
- Het sorteren en organiseren van objecten op basis van verbale instructies
- Nauwkeurige aangrijpende en bewegende fragiele objecten
- Zorgvuldige invoeging van bril in een ETUI
- Dobbelstenen en manipuleren kleine objecten
- Een ritssluiting samen sluiten
- Hoofdtelefoonkabels inpakken
- Uitvoering van precisietaken zoals basketbaldunnen
Het is vooral opmerkelijk dat de robots deze taken autonoom uitvoeren nadat ze alleen een instructie hebben ontvangen. Het systeem detecteert onafhankelijk objecten, identificeert ze, ontleent de nodige individuele stappen en regelt de robotarmen dienovereenkomstig.
Strategische partnerschappen voor verdere ontwikkeling
Om het volledige potentieel van deze technologie te openen, werkt Google Deepmind samen met toonaangevende bedrijven uit de robotica -industrie:
- Apptronik, een Texaanse start-up die de humanoïde robot "Apollo" heeft ontwikkeld, die is ontworpen voor logistiek en productietaken zoals tillen, verplaatsen en stapelen van dozen
- Boston Dynamics, een bekend robotisch bedrijf dat ironisch genoeg werd gekocht door Google en later opnieuw werd verkocht
- Agility Robotics en Agile Robots als andere partners voor de ontwikkeling en test van Gemini Robotics-er
Deze samenwerking toont de strategie van Google om de technologie op verschillende robotplatforms te implementeren en te testen om hun brede toepasbaarheid te waarborgen.
Geschikt hiervoor:
Betekenis voor de toekomst van robotica
De directeur van robotica bij DeepMind, Kanishka Rao, zei dat tijdens een persconferentie een van de grootste uitdagingen in robotica bestaat dat robots meestal goed werken in bekende scenario's, maar falen in onbekende situaties. Gemini -robotica zou dit probleem precies moeten oplossen.
Geschikt hiervoor:
- Humanoid Stand-Up Control: Leer op te staan met "Host" Humanoids-de doorbraak voor robots in het dagelijks leven
De integratie van grote taalmodellen (LLM's) in het robotachtige is onderdeel van een groeiende trend, en de aanpak van Gemini zou een van de meest indrukwekkende voorbeelden hiervan kunnen zijn. Jan Liphardt, hoogleraar Bio Engineering aan de Stanford University en oprichter van OpenMind, benadrukt dat dit "een van de eerste voorbeelden is van het gebruik van generatieve AI en grote taalmodellen op geavanceerde robots" en "echt de sleutel tot de ontwikkeling van robothulpmachines en robotgenoten" zou kunnen zijn.
NVIDIA CEO Jensen Huang gaat nog verder en geeft aan dat het gebruik van generatieve AI om robots te leveren een marktpotentieel kan zijn van meerdere biljoen Amerikaanse dollars op grote schaal.
Gemini en Robotics: een keerpunt voor intelligente systemen?
Ondanks de indrukwekkende vooruitgang zijn er nog steeds uitdagingen. Ken Goldberg, hoogleraar robotica aan de Universiteit van Californië in Berkeley, beschrijft de AI-systemen als "een opwindende ontwikkeling op het gebied van robotica", maar wijst erop dat "er nog veel te doen is voordat robots voor alle doeleinden klaar zijn voor gebruik in het dagelijks leven".
Google is van plan om verdere inzichten te geven in de mogelijkheden van deze technologie rond de komende Google I/O -conferentie. Met zijn vele jaren interesse in robotica en nu met Gemini als een geschikte softwarecomponent, zou Google een nieuw hoofdstuk kunnen openen bij de ontwikkeling van intelligente robots.
Van taal tot actie: Google stelt nieuwe normen vast in robotica
Met Gemini -robotica heeft Google DeepMind een belangrijke stap gezet in de richting van de fusie van AI en robotica. Het vermogen om natuurlijke taal te begrijpen, complexe omgevingen waar te nemen en fysieke acties uit te voeren, kan een revolutie teweegbrengen in de manier waarop robots in de toekomst zullen worden gebruikt.
Deze technologie markeert de overgang van puur digitale AI -toepassingen naar systemen die een directe invloed kunnen hebben op de fysieke wereld. Hoewel dit de bezorgdheid over sommige AI -sceptici kan veroorzaken, ligt de belangrijkste focus van Google Deepmind op het ontwikkelen van adaptieve en nuttige robotsystemen die complexe taken met minder training kunnen beheren.
De komende jaren zullen laten zien hoe deze technologie zich ontwikkelt en welke praktische toepassingen u op verschillende gebieden zult vinden, van industrie tot dagelijks leven.
Geschikt hiervoor:
Uw wereldwijde partner voor marketing en bedrijfsontwikkeling
☑️ onze zakelijke taal is Engels of Duits
☑️ Nieuw: correspondentie in uw nationale taal!
Ik ben blij dat ik beschikbaar ben voor jou en mijn team als een persoonlijk consultant.
U kunt contact met mij opnemen door het contactformulier hier in te vullen of u gewoon te bellen op +49 89 674 804 (München) . Mijn e -mailadres is: Wolfenstein ∂ Xpert.Digital
Ik kijk uit naar ons gezamenlijke project.