Выбор голоса 📢


Google Gemini 2.0, Искусственный интеллект и робототехника: робототехника Gemini и Gemini Robotics-Er

Опубликовано: 20 марта 2025 г. / Обновление с: 20 марта 2025 г. - Автор: Конрад Вольфенштейн

Google Gemini 2.0, Искусственный интеллект и робототехника: робототехника Gemini и Gemini Robotics-Er

Google Gemini 2.0, Искусственный интеллект и робототехника: робототехника Gemini и робототехника Gemini-Er-Creative: Xpert.Digital

DeepMind представляет Близнецы: начинается следующая эра робототехники

Робототехника Близнецов: преобразующее слияние искусственного интеллекта и робототехники Google

12 марта 2025 года Google DeepMind представила свой последний проект Gemini Robotics, впечатляющую технологию, которая объединяет мощную языковую модель Gemini 2.0 с Advanced Robotics. Это инновация знаменует собой важную веху в разработке интеллектуальных систем роботов, которые могут понимать естественный язык и выполнять сложные физические задачи.

Google DeepMind является ведущей исследовательской компанией для искусственного интеллекта (ИИ), которая была основана в 2010 году и перенесла Google в 2014 году. Он фокусируется на разработке передовых технологий ИИ, которые характеризуются нейронными сетями с кратковременным хранением и искусственной памятью. DeepMind достиг значительных прорывов, в том числе защиты людей -игроков в игре «Go» и развитие Alphafold, системы для прогнозирования структур белков. Технологии DeepMind используются в таких областях, как робототехника, медицина, энергоэффективность и языковая обработка.

Технологические основы робототехники Близнецов

Gemini Robotics была спроектирована как прогрессивная продолжительность зрения модели модели (VLA), которая основана на и без того мощных Gemini 2.0. Центральное инновация заключается в том, что система может не только обрабатывать цифровые данные, такие как тексты, изображения или видео, но также может впервые выполнять физические действия в реальном мире.

Технология использует мультимодальное понимание Gemini 2.0 и расширяет его решающим новым модальностью: физические действия. Это позволяет роботам соединить цифровой и физический мир таким образом, чтобы это еще не было возможно.

Подходит для:

Навыки функциональности и восприятия

Технологический прорыв робототехники Близнецов заключается в ее способности воспринимать окружающую среду через камеры, распознавать объекты и захватить их пространственные измерения. Эта информация затем преобразуется в трехмерный мир с точными техническими координатами.

Система также может:

  • Понять команды естественного языка и реализовать их физическими действиями
  • Понять сложные пространственные отношения между объектами
  • Адаптироваться к новым, неизвестным ситуациям
  • Генерировать различные типы роботов

Две дополнительные модели: робототехника Gemini и Robotics-Eer Gemini

Google DeepMind представила не только одну, но и две специализированные модели, которые посвящены различным аспектам ИИ робототехники.

Близнечные робототехники

Основная модель Robotics Gemini сочетает в себе навыки обработки языка Gemini 2.0 с физическим контролем. Это позволяет роботам реагировать на естественные языковые команды, понимать сложные среды и осуществлять адаптивные действия.

Близнечные робототехники

Вторая модель, Gemini Robotics-Er (с помощью которого он выступает за «воплощенные рассуждения» или «модифицированную логику»), фокусируется на улучшении пространственного мышления. Эта способность имеет решающее значение для роботов, которые должны действовать в динамичной, трехмерной среде.

Например, Gemini Robotics-Er может интуитивно распознать, как лучше всего использовать объект. Если для модели показана кофейная чашка, она может независимо выбрать подходящую ручку с двумя пальцами, чтобы поднять чашку на ручку и рассчитать безопасное движение.

Продемонстрированные навыки и практические применения

В впечатляющих демонстрационных видео Google DeepMind показывает практические навыки новых моделей искусственного интеллекта. Системы роботов могут выполнять различные сложные задачи, в том числе:

  • Складки оригами и бумаги
  • Сортировка и организация объектов на основе устных инструкций
  • Точные захватывающие и движущиеся хрупкие предметы
  • Тщательная вставка очков в ETUI
  • Кости и манипулируйте небольшими предметами
  • Сокрытие молнии вместе
  • Обертывание кабелей для наушников
  • Выполнение точности, таких как баскетбольный дюнкинг

Особенно примечательно, что роботы выполняют эти задачи автономно после того, как они получили инструкцию. Система независимо обнаруживает объекты, идентифицирует их, выводит необходимые отдельные шаги и соответственно контролирует руки робота.

Стратегическое партнерство для дальнейшего развития

Чтобы открыть весь потенциал этой технологии, Google DeepMind работает с ведущими компаниями из индустрии робототехники:

  • Apptronik, техасский стартап, который разработал гуманоидный робот «Аполлон», который предназначен для логистики и производственных задач, таких как подъем, перемещение и укладку коробок
  • Boston Dynamics, известная робототехника, которая была иронично куплена Google и снова продана позже
  • Робототехника и гибкие роботы в качестве других партнеров для разработки и теста Gemini Robotics-Er

Это сотрудничество показывает стратегию Google по реализации и тестированию технологии на различных платформах роботов, чтобы обеспечить их широкую применимость.

Подходит для:

Значение для будущего робототехники

Директор по робототехнике в Deepmind, Канишка Рао, сказал на пресс -конференции, одна из величайших проблем в робототехнике состоит в том, что роботы обычно хорошо работают в известных сценариях, но терпят неудачу в неизвестных ситуациях. Робототехника Близнецов должна решить именно эту проблему.

Подходит для:

Интеграция больших языковых моделей (LLMS) в роботизированность является частью растущей тенденции, и подход Близнецов может быть одним из самых впечатляющих примеров этого. Ян Липхардт, профессор биоинженерии в Стэнфордском университете и основатель OpenMind, подчеркивает, что это «один из первых примеров использования генеративных моделей ИИ и крупных языков на продвинутых роботах» и «действительно ключ к разработке помощников -роботов и компаньонов -роботов».

Генеральный директор NVIDIA Дженсен Хуан идет еще дальше и указывает на то, что использование генеративного ИИ для предоставления роботов может быть рыночным потенциалом в несколько триллионов долларов США в больших масштабах.

Близнецы и робототехника: поворотный момент для интеллектуальных систем?

Несмотря на впечатляющий прогресс, все еще есть проблемы. Кен Голдберг, профессор робототехники в Калифорнийском университете в Беркли, описывает системы ИИ как «захватывающее развитие в области робототехники», но указывает, что «есть еще многое, прежде чем универсальные роботы будут готовы к использованию в повседневной жизни».

Google планирует дать дальнейшее представление о возможностях этой технологии вокруг предстоящей конференции Google I/O. С его многолетним интересом к робототехнике, а теперь с Близнецами в качестве подходящего программного компонента, Google может открыть новую главу в разработке интеллектуальных роботов.

От языка к действию: Google устанавливает новые стандарты в робототехнике

С робототехникой Gemini Google DeepMind сделал важный шаг к слиянию ИИ и робототехники. Способность понимать естественный язык, воспринимать сложную среду и осуществлять физические действия может революционизировать способ использования роботов в будущем.

Эта технология знаменует собой переход от чисто цифровых приложений искусственного интеллекта к системам, которые могут оказать прямое влияние на физический мир. Несмотря на то, что это может вызвать проблемы с некоторыми скептиками ИИ, основное внимание Google DeepMind уделяется разработке адаптивных и полезных систем роботов, которые могут управлять сложными задачами с меньшим обучением.

В ближайшие годы покажут, как развивается эта технология и какие практические приложения вы найдете в разных областях, от промышленности до повседневной жизни.

Подходит для:

 

Ваш глобальный партнер по маркетингу и развитию бизнеса

☑️ Наш деловой язык — английский или немецкий.

☑️ НОВИНКА: Переписка на вашем национальном языке!

 

Цифровой пионер — Конрад Вольфенштейн

Конрад Вольфенштейн

Я был бы рад служить вам и моей команде в качестве личного консультанта.

Вы можете связаться со мной, заполнив контактную форму или просто позвоните мне по телефону +49 89 89 674 804 (Мюнхен) . Мой адрес электронной почты: wolfenstein xpert.digital

Я с нетерпением жду нашего совместного проекта.

 

 

☑️ Поддержка МСП в разработке стратегии, консультировании, планировании и реализации.

☑️ Создание или корректировка цифровой стратегии и цифровизации.

☑️ Расширение и оптимизация процессов международных продаж.

☑️ Глобальные и цифровые торговые платформы B2B

☑️ Пионерское развитие бизнеса/маркетинг/PR/выставки.


⭐️ Искусственный интеллект (ИИ) — блог об искусственном интеллекте, точка доступа и центр контента ⭐️ Робототехника/Робототехника ⭐️ XPaper