Вибір голосу 📢


Google Gemini 2.0, Штучний інтелект та робототехніка: Робототехніка та робототехніка Близнюків

Опубліковано: 20 березня 2025 р. / Оновлення з: 20 березня 2025 р. - Автор: Конрад Вольфенштейн

Google Gemini 2.0, Штучний інтелект та робототехніка: Робототехніка та робототехніка Близнюків

Google Gemini 2.0, Штучний інтелект та робототехніка: Робототехніка та робототехніка Близнюків та реативний образ: Xpert.digital

Deepmind представляє Близнюки: Наступна епоха робототехніки починається

Робототехніка Gemini: Трансформаційне злиття Google штучного інтелекту та робототехніки

12 березня 2025 року Google Deepmind представив свою останню проект Robotics, вражаючу технологію, яка поєднує в собі потужну мову мови Gemini 2.0 з вдосконаленою робототехнікою. Ця інновація знаменує важливу віху в розробці інтелектуальних систем роботів, які можуть зрозуміти природну мову та виконувати складні фізичні завдання.

Google DeepMind-провідна дослідницька компанія штучного інтелекту (AI), яка була заснована в 2010 році та взята Google у 2014 році. Він зосереджується на розробці передових технологій AI, які характеризуються нейронними мережами з короткочасним зберіганням та штучною пам’яттю. DeepMind досяг значних проривів, включаючи захист гравців людини в грі «Go» та розвиток Альфафольда, системи прогнозування білкових структур. Технології DeepMind використовуються в таких сферах, як робототехніка, медицина, енергоефективність та обробка мови.

Технологічні основи робототехніки Близнюків

Robotics Gemini була розроблена як прогресивна модель зору моделі (VLA), яка ґрунтується на вже потужній Gemini 2.0. Центральна інновація полягає в тому, що система може не лише обробляти цифрові дані, такі як тексти, зображення чи відео, але також може вперше виконувати фізичні дії в реальному світі.

Технологія використовує мультимодальне розуміння Gemini 2.0 і розширює її рішучою новою модальністю: фізичними діями. Це дозволяє роботам подолати цифровий та фізичний світ таким чином, що ще не було можливо.

Підходить для цього:

Навички функціональності та сприйняття

Технологічний прорив робототехніки Близнюків полягає в її здатності сприймати оточення через камери, розпізнавати предмети та захоплювати їх просторові виміри. Потім ця інформація перетворюється на 3D -світ з точними технічними координатами.

Система також може:

  • Зрозумійте командування природними мовами та впроваджуйте їх у фізичних діях
  • Зрозумійте складні просторові взаємозв'язки між об'єктами
  • Адаптуйте до нових, невідомих ситуацій
  • Генерувати різні типи роботів

Дві додаткові моделі: робототехніка Близнюків та робототехніка Близнюків

Google Deepmind не лише представив одну, але й дві спеціалізовані моделі, які стосуються різних аспектів AI робототехніки.

Робототехніка Близнюків

Основна модель Robotics поєднує навички обробки мови Gemini 2.0 з фізичним контролем. Це дозволяє роботам реагувати на природні мовні команди, розуміти складні середовища та здійснювати адаптивні дії.

Робототехніка Близнюків

Друга модель, Robotics-er (завдяки чому він означає "втілений міркування" або "модифікована логіка"), зосереджується на поліпшеному просторовому мисленні. Ця здатність має вирішальне значення для роботів, які повинні діяти в динамічних, тривимірних середовищах.

Наприклад, Gemini Robotics-ER може інтуїтивно розпізнати, як найкраще використовувати об'єкт. Якщо для моделі відображається чашка кави, вона може самостійно вибрати відповідну рукоятку з двома пальцями, щоб підняти чашку на ручку та обчислити безпечний рух.

Продемонстровані навички та практичні програми

У вражаючих демонстраційних відеороликах Google Deepmind показує практичні навички нових моделей AI. Системи роботів можуть виконувати різноманітні складні завдання, включаючи:

  • Складки орігамі та паперу
  • Сортування та організація об'єктів на основі словесних інструкцій
  • Точні захоплення та переміщення тендітних предметів
  • Ретельне введення окулярів у etui
  • Кістки та маніпулювати дрібними предметами
  • Закриття блискавки разом
  • Обгортати кабелі для навушників
  • Виконання точних завдань, таких як баскетбольне занурення

Особливо примітно, що роботи виконують ці завдання автономно після того, як вони отримали інструкцію. Система незалежно виявляє об'єкти, їх визначає, отримує необхідні окремі кроки та контролює рукоятки роботи відповідно.

Стратегічні партнерства для подальшого розвитку

Для того, щоб відкрити весь потенціал цієї технології, Google DeepMind працює з провідними компаніями з індустрії робототехніки:

  • Apptronik, техаський стартап, який розробив гуманоїдного робота "Apollo", який розроблений для логістики та виробничих завдань, таких як підйом, переміщення та укладання короб
  • Бостонська динаміка, відома компанія з робототехніки, яку іронічно купували Google і знову продали пізніше
  • Алегантність робототехніки та спритні роботи як інші партнери для розвитку та тестування робототехніки Близнюків

Ця співпраця показує стратегію Google щодо впровадження та перевірки технології на різних платформах роботи, щоб забезпечити їх широку застосовність.

Підходить для цього:

Значення майбутнього робототехніки

Директор робототехніки в Deepmind, Канішка Рао, заявив під час прес -конференції, одна з найбільших проблем робототехніки полягає у тому, що роботи, як правило, добре працюють у відомих сценаріях, але провалюються в невідомих ситуаціях. Робототехніка Близнюків повинна вирішити саме цю проблему.

Підходить для цього:

Інтеграція великих мовних моделей (LLM) в робототехніку є частиною зростаючої тенденції, і підхід Близнюків може бути одним із найбільш вражаючих прикладів цього. Ян Ліпхардт, професор біотехніки Стенфордського університету та засновник OpenMind, підкреслює, що це "один з перших прикладів використання генеративних ШІ та великих мовних моделей на передових роботах" та "дійсно ключовим фактором для розробки службовців роботів та супутників роботів".

Генеральний директор NVIDIA Дженсен Хуанг йде ще далі і вказує на те, що використання генеративного ШІ для забезпечення роботів може бути ринковим потенціалом у розмірі кількох трильйонів доларів США у великих масштабах.

Близнюки та робототехніка: переломний момент для інтелектуальних систем?

Незважаючи на вражаючий прогрес, все ще є проблеми. Кен Голдберг, професор робототехніки в Каліфорнійському університеті в Берклі, описує системи AI як "захоплюючу розробку в галузі робототехніки", але вказує, що "ще багато чого зробити, перш ніж Роботи всебічного призначення будуть готові до використання у повсякденному житті".

Google планує надати подальше уявлення про можливості цієї технології на майбутній конференції Google вводу/виводу. Маючи багаторічний інтерес до робототехніки, а тепер, коли Близнюки як відповідний компонент програмного забезпечення, Google може відкрити нову главу в розробці інтелектуальних роботів.

Від мови до дії: Google встановлює нові стандарти в робототехніці

З робототехнікою Gemini, Google Deepmind зробив важливий крок до злиття ШІ та робототехніки. Здатність розуміти природну мову, сприймати складні умови та здійснювати фізичні дії, може революціонізувати спосіб використання роботів у майбутньому.

Ця технологія позначає перехід від суто цифрових програм AI до систем, які можуть мати прямий вплив на фізичний світ. Незважаючи на те, що це може викликати занепокоєння з деякими скептиками AI, основна увага Google DeepMind - на розробку адаптивних та корисних систем роботи, які можуть керувати складними завданнями з меншим навчанням.

Наступні роки покажуть, як розвивається ця технологія та які практичні програми ви знайдете в різних сферах, від промисловості до повсякденного життя.

Підходить для цього:

 

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑ Наша ділова мова - англійська чи німецька

☑ Нове: листування на вашій національній мові!

 

Цифровий піонер - Конрад Вольфенштейн

Конрад Вольфенштейн

Я радий бути доступним вам та моїй команді як особистого консультанта.

Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн xpert.digital

Я з нетерпінням чекаю нашого спільного проекту.

 

 

☑ Підтримка МСП у стратегії, порадах, плануванні та впровадженні

☑ Створення або перестановка цифрової стратегії та оцифрування

☑ Розширення та оптимізація міжнародних процесів продажів

☑ Глобальні та цифрові торгові платформи B2B

☑ Піонерський розвиток бізнесу / маркетинг / PR / Мір


Штучний інтелект (AI) -AI-блог, гаряча точка та контент-центрробототехніка/робототехнікаxpaper