Wybór głosu 📢

Google Gemini 2.0, The Artificial Intelligence and Robotics: Gemini Robotics and Gemini Robotics-er

Opublikowano: 20 marca 2025 / Aktualizacja od: 20 marca 2025 r. - Autor: Konrad Wolfenstein

Google Gemini 2.0, The Artificial Intelligence and Robotics: Gemini Robotics and Gemini Robotics-er Creative Image: xpert.digital

DeepMind przedstawia Bliźnięta: rozpoczyna się następna era robotyki

Gemini Robotics: Transformatywne połączenie Google sztucznej inteligencji i robotyki

12 marca 2025 r. Google Deepmind przedstawił swój najnowszy projekt Gemini Robotics, imponującą technologię, która łączy potężny model językowy Gemini 2.0 z zaawansowaną robotyką. Ta innowacja stanowi ważny kamień milowy w rozwoju inteligentnych systemów robotów, które mogą zrozumieć język naturalny i wykonywać złożone zadania fizyczne.

Google Deepmind jest wiodącą firmą badawczą Artific Intelligence (AI), która została założona w 2010 roku i przejęta przez Google w 2014 roku. Koncentruje się na rozwoju zaawansowanych technologii AI, które charakteryzują się sieciami neuronowymi z krótkoterminowym przechowywaniem i sztuczną pamięcią. DeepMind osiągnął znaczące przełom, w tym obronę ludzkich graczy w grze „Go” i rozwój Alphafold, systemu przewidywania struktur białkowych. Technologie DeepMind są stosowane w takich obszarach, jak robotyka, medycyna, efektywność energetyczna i przetwarzanie języka.

Podstawy technologiczne robotyki Gemini

Gemini Robotics został zaprojektowany jako progresywna długość widzenia modelu modelu (VLA), który opiera się na już potężnym Bliźnięta 2.0. Centralną innowacją jest to, że system może nie tylko przetwarzać dane cyfrowe, takie jak teksty, obrazy lub filmy, ale może również po raz pierwszy wykonywać działania fizyczne w prawdziwym świecie.

Technologia wykorzystuje multimodalne zrozumienie Gemini 2.0 i rozszerza ją o decydującą nową modalność: działania fizyczne. Umożliwia to robotom wypełnienie świata cyfrowego i fizycznego w sposób, który nie był jeszcze możliwy.

Nadaje się do:

Platforma Google Gemini z Google AI Studio, Google Deep Research z Gemini Advanced i Google DeepMind

Umiejętności funkcjonalności i percepcji

Technologiczny przełom robotyki Gemini polega na jego zdolności do postrzegania otoczenia przez kamery, rozpoznawania przedmiotów i wychwytywania ich wymiarów przestrzennych. Informacje te są następnie przekształcane w świat 3D z precyzyjnymi współrzędnymi technicznymi.

System może również:

Zrozum polecenia języka naturalnego i wdrożyć go w działaniach fizycznych
Zrozum złożone relacje przestrzenne między przedmiotami
Dostosować się do nowych, nieznanych sytuacji
Generuj różne typy robotów

Dwa uzupełniające się modele: Robotyka Gemini i Gemini Robotics-er

Google Deepmind przedstawił nie tylko jeden, ale dwa wyspecjalizowane modele, które dotyczą różnych aspektów AI robotyki.

Gemini Robotics

Główny model Gemini Robotics łączy umiejętności przetwarzania języka Gemini 2.0 z kontrolą fizyczną. Umożliwia robotom reagowanie na polecenie języka naturalnie, rozumieć złożone środowiska i przeprowadzać działania adaptacyjne.

Gemini Robotics

Drugi model, Gemini Robotics-Er (przy czym oznacza „wcielone rozumowanie” lub „modyfikowaną logikę”), koncentruje się na lepszym myśleniu przestrzennym. Ta zdolność ma kluczowe znaczenie dla robotów, które muszą działać w dynamicznych, trzech wymiarach.

Na przykład Gemini Robotics-Er może intuicyjnie rozpoznać, w jaki sposób można najlepiej użyć obiektu. Jeśli w modelu pokazano filiżankę kawy, może niezależnie wybrać odpowiedni uchwyt z dwoma palcami, aby podnieść kubek na uchwycie i obliczyć bezpieczny ruch.

Wykazane umiejętności i praktyczne zastosowania

W imponujących filmach demonstracyjnych Google DeepMind pokazuje praktyczne umiejętności nowych modeli AI. Systemy robotów mogą wykonywać różne złożone zadania, w tym:

Fałdy origami i papieru
Sortowanie i organizowanie obiektów na podstawie instrukcji werbalnych
Precyzyjne chwytanie i poruszające się kruche obiekty
Staranne wstawienie okularów w ETUI
Kostka i manipuluj małymi przedmiotami
Zamknięcie razem zamka
Owijanie kabli słuchawkowych
Wykonanie precyzyjnych zadań, takich jak zanurzenie w koszykówkę

Warto zauważyć, że roboty wykonują te zadania autonomicznie po otrzymaniu tylko instrukcji. System niezależnie wykrywa obiekty, identyfikuje je, wyprowadza niezbędne indywidualne kroki i odpowiednio kontroluje ramiona robota.

Strategiczne partnerstwa do dalszego rozwoju

Aby otworzyć pełny potencjał tej technologii, Google DeepMind współpracuje z wiodącymi firmami z branży robotyki:

Apptronik, texan start-up, który opracował robot humanoidalny „Apollo”, który jest przeznaczony do logistyki i zadań produkcyjnych, takich jak podnoszenie, ruch i układanie pudełek
Boston Dynamics, znana firma robotyka, która została ironicznie kupiona przez Google i sprzedana ponownie później
Agility Robotics i Agile Robots jako innych partnerów do rozwoju i testu Gemini Robotics-er

Ta współpraca pokazuje strategię Google polegającą na wdrażaniu i testowaniu technologii na różnych platformach robotów w celu zapewnienia ich szerokiego zastosowania.

Nadaje się do:

Google Deep Research z Gemini 2.0 - Kompleksowa analiza zaawansowanych funkcji badawczych

Znaczenie dla przyszłości robotyki

Dyrektor robotyki w Deepmind, Kanishka Rao, powiedział podczas konferencji prasowej, jedno z największych wyzwań w robotyce składają się, że roboty zazwyczaj działają dobrze w znanych scenariuszach, ale zawodzą w nieznanych sytuacjach. Robotyka Gemini powinna dokładnie rozwiązać ten problem.

Nadaje się do:

Humanoidalne Stojąc Kontrola: Naucz się wstawać z „gospodarzem” humanoidów-przełom dla robotów w życiu codziennym

Integracja dużych modeli językowych (LLM) z robotycznym jest częścią rosnącego trendu, a podejście Gemini może być jednym z najbardziej imponujących przykładów tego. Jan Liphardt, profesor inżynierii biologicznej na Uniwersytecie Stanforda i założyciel OpenMind, podkreśla, że jest to „jeden z pierwszych przykładów użycia generatywnych modeli AI i dużych języków w zaawansowanych robotach” i „naprawdę kluczem do rozwoju pomocy robotów i towarzyszy robotów” może być.

Dyrektor generalny NVIDIA, Jensen Huang, idzie jeszcze dalej i wskazuje, że stosowanie generatywnej sztucznej inteligencji do dostarczania robotów może być potencjałem rynkowym wynoszącym kilka bilionów dolarów na dużą skalę.

Bliźnięta i robotyka: punkt zwrotny dla inteligentnych systemów?

Pomimo imponującego postępu nadal istnieją wyzwania. Ken Goldberg, profesor robotyki na University of California w Berkeley, opisuje systemy AI jako „ekscytujący rozwój w dziedzinie robotyki”, ale wskazuje, że „wciąż jest wiele do zrobienia, zanim roboty wszechstronne będą gotowe do użytku w życiu codziennym”.

Google planuje dać dalszy wgląd w możliwości tej technologii wokół nadchodzącej konferencji Google I/O. Dzięki wieloletniemu zainteresowaniu robotyką, a teraz Bliźnięta jako odpowiedniego komponentu oprogramowania, Google może otworzyć nowy rozdział w opracowywaniu inteligentnych robotów.

Od języka do akcji: Google ustanawia nowe standardy w robotyce

Dzięki Gemini Robotics Google Deepmind zrobił ważny krok w kierunku połączenia sztucznej inteligencji i robotyki. Zdolność do zrozumienia języka naturalnego, postrzegania złożonych środowisk i wykonywania działań fizycznych może zrewolucjonizować sposób, w jaki roboty będą używane w przyszłości.

Ta technologia oznacza przejście z czysto cyfrowych aplikacji AI do systemów, które mogą mieć bezpośredni wpływ na świat fizyczny. Chociaż może to wywoływać obawy niektórych sceptyków AI, główny nacisk Google Deepmind polega na opracowaniu adaptacyjnych i przydatnych systemów robotów, które mogą zarządzać złożonymi zadaniami przy mniejszym szkoleniu.

Nadchodzące lata pokażą, jak rozwija się ta technologia i jakie praktyczne zastosowania znajdziesz w różnych obszarach, od przemysłu po codzienne życie.

Nadaje się do:

Twój globalny partner w zakresie marketingu i rozwoju biznesu

☑️Naszym językiem biznesowym jest angielski lub niemiecki

☑️ NOWOŚĆ: Korespondencja w Twoim języku narodowym!

Konrada Wolfensteina

Chętnie będę służyć Tobie i mojemu zespołowi jako osobisty doradca.

Możesz się ze mną skontaktować wypełniając formularz kontaktowy lub po prostu dzwoniąc pod numer +49 89 89 674 804 (Monachium) . Mój adres e-mail to: wolfenstein ∂ xpert.digital

Google Gemini 2.0, The Artificial Intelligence and Robotics: Gemini Robotics and Gemini Robotics-er

DeepMind przedstawia Bliźnięta: rozpoczyna się następna era robotyki

Gemini Robotics: Transformatywne połączenie Google sztucznej inteligencji i robotyki

Podstawy technologiczne robotyki Gemini

Umiejętności funkcjonalności i percepcji

Dwa uzupełniające się modele: Robotyka Gemini i Gemini Robotics-er

Gemini Robotics

Gemini Robotics

Wykazane umiejętności i praktyczne zastosowania

Strategiczne partnerstwa do dalszego rozwoju

Znaczenie dla przyszłości robotyki

Bliźnięta i robotyka: punkt zwrotny dla inteligentnych systemów?

Od języka do akcji: Google ustanawia nowe standardy w robotyce

Twój globalny partner w zakresie marketingu i rozwoju biznesu

☑️Naszym językiem biznesowym jest angielski lub niemiecki

☑️ NOWOŚĆ: Korespondencja w Twoim języku narodowym!

☑️ Wsparcie MŚP w zakresie strategii, doradztwa, planowania i wdrażania

☑️ Stworzenie lub dostosowanie strategii cyfrowej i cyfryzacji

☑️Rozbudowa i optymalizacja procesów sprzedaży międzynarodowej

☑️ Globalne i cyfrowe platformy handlowe B2B

☑️ Pionierski rozwój biznesu / marketing / PR / targi