게시 : 2025 년 3 월 20 일 / 업데이트 : 2025 년 3 월 20 일 - 저자 : Konrad Wolfenstein
Google Gemini 2.0, 인공 지능 및 로봇 공학 : Gemini Robotics and Gemini Robotics-er-er-er-er-er-er-er-er-er-er-er-er-er-er-er-er-er-er-digital
Deepmind는 Gemini를 선물합니다 : 다음 로봇의 시대가 시작됩니다
Gemini Robotics : Google의 인공 지능 및 로봇 공학의 혁신적인 합병
2025 년 3 월 12 일, Google Deepmind는 강력한 Gemini 2.0 언어 모델과 고급 로봇 공학을 결합한 인상적인 기술인 최신 프로젝트 Gemini Robotics를 발표했습니다. 이 혁신은 자연어를 이해하고 복잡한 물리적 작업을 수행 할 수있는 지능형 로봇 시스템 개발에서 중요한 이정표가됩니다.
Google DeepMind는 2010 년에 설립되어 2014 년에 Google이 인수 한 인공 지능 (AI)의 주요 연구 회사입니다. 단기 저장 및 인공 메모리를 갖춘 신경망이 특징 인 고급 AI 기술의 개발에 중점을 둡니다. DeepMind는 게임“GO”에서 인간 플레이어를 방어하는 등의 상당한 돌파구와 단백질 구조를 예측하는 시스템 인 Alphafold의 개발을 포함하여 상당한 돌파구를 달성했습니다. DeepMind의 기술은 로봇 공학, 의학, 에너지 효율 및 언어 처리와 같은 영역에서 사용됩니다.
Gemini Robotics의 기술 기반
Gemini Robotics는 이미 강력한 Gemini 2.0을 기반으로 한 모델의 진보적 인 비전 길이 (VLA) 모델로 설계되었습니다. 중심 혁신은 시스템이 텍스트, 이미지 또는 비디오와 같은 디지털 데이터를 처리 할 수있을뿐만 아니라 실제 세계에서 처음으로 물리적 행동을 수행 할 수 있다는 것입니다.
이 기술은 Gemini 2.0의 멀티 모달 이해를 사용하여 결정적인 새로운 양식 인 물리적 행동으로 확장합니다. 이를 통해 로봇은 아직 불가능한 방식으로 디지털 및 물리적 세계를 연결할 수 있습니다.
적합:
- Google AI Studio가 포함된 Google의 Gemini 플랫폼, Gemini Advanced가 포함된 Google Deep Research 및 Google DeepMind
기능 및 인식 기술
Gemini Robotics의 기술 혁신은 카메라를 통해 주변 환경을 인식하고, 물체를 인식하고, 공간 차원을 포착하는 능력에 있습니다. 그런 다음이 정보는 정확한 기술 좌표로 3D 세계로 변환됩니다.
시스템도 다음과 같습니다.
- 자연어 명령을 이해하고 신체 행동으로 구현하십시오.
- 물체 사이의 복잡한 공간 관계를 이해합니다
- 새롭고 알려지지 않은 상황에 적응합니다
- 다른 로봇 유형을 통해 생성하십시오
두 가지 보완 모델 : Gemini Robotics와 Gemini Robotics-er
Google DeepMind는 로봇 공학 AI의 다른 측면을 다루는 두 가지 특수 모델을 제시했습니다.
쌍둥이 자리 로봇
주요 모델 Gemini Robotics는 Gemini 2.0의 언어 처리 기술과 물리적 제어 기능을 결합합니다. 로봇은 자연스럽게 언어 명령에 반응하고 복잡한 환경을 이해하며 적응 적 행동을 수행 할 수 있습니다.
쌍둥이 자리 로봇
두 번째 모델 인 Gemini Robotics-er (여기서 "구체화 된 추론"또는 "수정 된 논리")는 개선 된 공간 사고에 중점을 둡니다. 이 능력은 역동적 인 3 차원 환경에서 행동 해야하는 로봇에게 중요합니다.
예를 들어, Gemini Robotics-er는 객체의 사용 방법을 직관적으로 인식 할 수 있습니다. 커피 컵이 모델에 표시되면 독립적으로 컵을 들어 올리기 위해 적절한 2 손잡이 손잡이를 선택하고 안전한 움직임을 계산할 수 있습니다.
시연 된 기술과 실용적인 응용
인상적인 데모 비디오에서 Google Deepmind는 새로운 AI 모델의 실용적인 기술을 보여줍니다. 로봇 시스템은 다음을 포함하여 다양한 복잡한 작업을 수행 할 수 있습니다.
- 종이 접기 및 종이의 접이
- 구두 지침을 기반으로 객체를 정렬하고 구성합니다
- 정확한 그립과 움직이는 깨지기 쉬운 물체
- Etui에 안경을주의 깊게 삽입합니다
- 작은 물체를 주사하고 조작합니다
- 지퍼를 함께 닫습니다
- 포장 헤드폰 케이블
- 농구 덩크와 같은 정밀 작업의 실행
특히 로봇이 지시를받은 후에도 이러한 작업을 자율적으로 수행한다는 것이 특히 주목할 만합니다. 시스템은 독립적으로 객체를 감지하고,이를 식별하고, 필요한 개별 단계를 도출하고 그에 따라 로봇 암을 제어합니다.
추가 개발을위한 전략적 파트너십
이 기술의 잠재력을 최대한 발휘하기 위해 Google Deepmind는 로봇 산업의 주요 회사와 협력합니다.
- 상자의 리프팅, 이동 및 쌓는 것과 같은 물류 및 제조 작업을 위해 설계된 Humanoid Robot "Apollo"를 개발 한 Texan 스타트 업 Apptronik
- Google에서 아이러니하게 구매하고 나중에 다시 판매 한 유명한 로봇 회사 인 Boston Dynamics
- Gemini Robotics-ER의 개발 및 테스트를위한 다른 파트너로서 민첩성 로봇 및 민첩한 로봇
이 협력은 다양한 로봇 플랫폼에서 기술을 구현하고 테스트하여 광범위한 적용 가능성을 보장하는 Google의 전략을 보여줍니다.
적합:
로봇 공학의 미래에 대한 의미
Kanishka Rao의 DeepMind의 로봇 공학 책임자는 기자 회견에서 로봇 공학의 가장 큰 과제 중 하나는 로봇이 일반적으로 알려진 시나리오에서 잘 작동하지만 알려지지 않은 상황에서는 실패한다고 위협했다고 말했다. Gemini Robotics는이 문제를 정확하게 해결해야합니다.
적합:
LLM (Large Language Model)을 로봇으로 통합하는 것은 점점 더 많은 추세의 일부이며, Gemini의 접근 방식은 이것의 가장 인상적인 예 중 하나 일 수 있습니다. Stanford University의 바이오 엔지니어링 교수이자 OpenMind의 창립자 인 Jan Liphardt는 이것이“고급 로봇에서 생성 AI 및 대형 언어 모델 사용의 첫 번째 예 중 하나”이며“실제로 로봇 도우미 및 로봇 동반자 개발의 열쇠”가 될 수 있다고 강조합니다.
NVIDIA CEO Jensen Huang은 더 나아가서 로봇을 제공하기 위해 생성 AI를 사용하는 것이 대규모 미국 달러의 시장 잠재력이 될 수 있음을 나타냅니다.
Gemini 및 Robotics : 지능형 시스템의 전환점?
인상적인 진보에도 불구하고 여전히 도전이 있습니다. 버클리 캘리포니아 대학교의 로봇 공학 교수 인 켄 골드버그 (Ken Goldberg)는 AI 시스템을“로봇 공학 분야의 흥미 진진한 발전”이라고 묘사하지만“일상 생활에서 사용할 준비가되기 전에는 여전히 할 일이 여전히 많다”고 지적했다.
Google은 다가오는 Google I/O 컨퍼런스와 관련 하여이 기술의 가능성에 대한 추가 통찰력을 제공 할 계획입니다. 로봇 공학에 대한 수년간의 관심과 현재 Gemini와 함께 적절한 소프트웨어 구성 요소로 Google은 지능형 로봇 개발에 새로운 장을 열 수있었습니다.
언어에서 행동으로 : Google은 로봇 공학의 새로운 표준을 설정합니다.
Gemini Robotics를 통해 Google Deepmind는 AI와 Robotics의 융합을 향한 중요한 단계를 밟았습니다. 자연 언어를 이해하고, 복잡한 환경을 인식하고, 신체적 행동을 수행하는 능력은 로봇이 미래에 사용될 방식에 혁명을 일으킬 수 있습니다.
이 기술은 순수한 디지털 AI 애플리케이션에서 물리적 세계에 직접적인 영향을 줄 수있는 시스템으로의 전환을 나타냅니다. 이는 일부 AI 회의론자와의 우려를 유발할 수 있지만 Google DeepMind의 주요 초점은 교육이 적은 복잡한 작업을 관리 할 수있는 적응적이고 유용한 로봇 시스템을 개발하는 데 있습니다.
앞으로 몇 년 동안이 기술이 어떻게 개발되고 있는지, 그리고 산업에서 일상 생활에 이르기까지 다양한 분야에서 어떤 실제 응용을 찾을 것인지를 보여줄 것입니다.
적합:
귀하의 글로벌 마케팅 및 비즈니스 개발 파트너
✔️ 우리의 비즈니스 언어는 영어 또는 독일어입니다.
✔️ 새로운 기능: 자국어로 된 통신!
나는 귀하와 우리 팀에 개인 고문으로 봉사하게 되어 기쁘게 생각합니다.
문의 양식을 작성하여 연락하시거나 +49 89 89 674 804 (뮌헨) 로 전화해 주세요 . 내 이메일 주소는: Wolfenstein ∂ xpert.digital
나는 우리의 공동 프로젝트를 기대하고 있습니다.