게시일: 2025년 3월 20일 / 업데이트일: 2025년 3월 20일 – 저자: Konrad Wolfenstein
DeepMind가 Gemini를 발표합니다: 차세대 로봇 공학의 시작
제미니 로보틱스: 구글의 인공지능과 로봇공학의 혁신적인 융합
2025년 3월 12일, 구글 딥마인드는 최신 프로젝트인 제미니 로보틱스를 공개했습니다. 이는 강력한 제미니 2.0 언어 모델과 첨단 로봇 기술을 결합한 놀라운 기술입니다. 이 혁신은 자연어를 이해하고 복잡한 물리적 작업을 수행할 수 있는 지능형 로봇 시스템 개발에 있어 중요한 이정표가 될 것입니다.
구글 딥마인드는 2010년에 설립되어 2014년에 구글에 인수된 인공지능(AI) 연구 분야의 선두 기업입니다. 단기 저장 장치와 인공 메모리를 갖춘 신경망을 특징으로 하는 첨단 AI 기술 개발에 주력하고 있습니다. 딥마인드는 바둑에서 인간을 이기는 성과를 거두고 단백질 구조를 예측하는 시스템인 알파폴드를 개발하는 등 주목할 만한 성과를 달성했습니다. 딥마인드의 기술은 로봇공학, 의학, 에너지 효율, 자연어 처리 등 다양한 분야에 적용되고 있습니다.
제미니 로보틱스의 기술적 기반
제미니 로보틱스는 이미 강력한 제미니 2.0을 기반으로 더욱 발전된 비전-언어-행동(VLA) 모델로 설계되었습니다. 핵심 혁신은 이 시스템이 텍스트, 이미지, 비디오와 같은 디지털 데이터를 처리할 뿐만 아니라, 최초로 현실 세계에서 물리적인 동작을 수행할 수 있다는 점입니다.
이 기술은 제미니 2.0의 다중 모드 이해 기능을 활용하여 물리적 동작이라는 중요한 새로운 모드를 포함하도록 확장합니다. 이를 통해 로봇은 이전에는 불가능했던 방식으로 디지털 세계와 물리적 세계를 연결할 수 있습니다.
적합:
기능 및 지각 능력
제미니 로보틱스의 기술적 혁신은 카메라를 통해 주변 환경을 인지하고, 사물을 인식하며, 공간적 차원을 파악하는 능력에 있습니다. 이렇게 얻은 정보는 정확한 기술 좌표를 가진 3D 세계로 변환됩니다.
이 시스템은 다음과 같은 기능도 수행할 수 있습니다
- 자연어 명령을 이해하고 이를 신체적 동작으로 변환합니다
- 사물 간의 복잡한 공간적 관계를 이해하기
- 새롭고 낯선 상황에 적응하기
- 다양한 로봇 유형에 걸쳐 일반화하기
상호 보완적인 두 모델: 제미니 로보틱스와 제미니 로보틱스-ER
구글 딥마인드는 로봇공학 AI의 서로 다른 측면을 다루는 두 가지 특화 모델을 공개했습니다.
제미니 로보틱스
제미니 로보틱스의 주력 모델은 제미니 2.0의 음성 처리 기능과 물리적 제어 기능을 결합한 것입니다. 이를 통해 로봇은 자연어 명령에 응답하고, 복잡한 환경을 이해하며, 적응형 행동을 수행할 수 있습니다.
제미니 로보틱스-ER
두 번째 모델인 제미니 로보틱스-ER(ER은 "체화된 추론"을 의미)은 향상된 공간 추론 능력에 중점을 둡니다. 이 능력은 역동적인 3차원 환경에서 작동해야 하는 로봇에게 매우 중요합니다.
예를 들어, 제미니 로보틱스-ER은 물체를 잡는 최적의 방법을 직관적으로 인식할 수 있습니다. 모델에 커피잔을 보여주면, 손잡이를 잡고 컵을 들어 올리는 데 적합한 두 손가락 그립을 스스로 선택하고 안전한 동작 순서를 계산할 수 있습니다.
입증된 기술 및 실제 적용 사례
구글 딥마인드는 인상적인 데모 영상을 통해 새로운 AI 모델의 실질적인 성능을 선보였습니다. 이 로봇 시스템은 다음과 같은 다양한 복잡한 작업을 수행할 수 있습니다
- 종이접기와
- 구두 지시에 따라 물건을 분류하고 정리하기
- 깨지기 쉬운 물체를 정확하게 잡고 이동시키기
- 안경을 조심스럽게 케이스에 넣는다
- 주사위를 굴리고 작은 물체를 조작하기
- 지퍼를 닫는 것
- 헤드폰 케이블 감기
- 농구 덩크슛과 같은 정밀한 동작 수행
특히 주목할 만한 점은 로봇이 단 하나의 지시만 받고도 이러한 작업을 자율적으로 수행한다는 것입니다. 시스템은 스스로 물체를 인식하고 식별하며, 필요한 개별 단계를 도출하고 그에 따라 로봇 팔을 제어합니다.
추가 발전을 위한 전략적 파트너십
이 기술의 잠재력을 최대한 발휘하기 위해 구글 딥마인드는 로봇 산업의 선도 기업들과 협력하고 있습니다
- 텍사스에 본사를 둔 스타트업 앱트로닉은 상자를 들어 올리고, 옮기고, 쌓는 등의 물류 및 제조 작업을 위해 설계된 휴머노이드 로봇 "아폴로"를 개발했습니다
- 보스턴 다이내믹스는 유명한 로봇 회사로, 아이러니하게도 한때 구글에 인수되었다가 나중에 다시 매각되었습니다
- Agility Robotics와 Agile Robots가 Gemini Robotics-ER의 개발 및 테스트를 위한 추가 파트너로 선정되었습니다
이번 협력은 구글이 기술의 광범위한 적용 가능성을 보장하기 위해 다양한 로봇 플랫폼에 해당 기술을 구현하고 테스트하는 전략을 보여줍니다.
적합:
로봇공학의 미래에 미치는 중요성
딥마인드의 로봇 공학 부문 책임자인 카니슈카 라오는 기자 회견에서 로봇 공학의 가장 큰 과제 중 하나는 로봇이 일반적으로 잘 알려진 시나리오에서는 뛰어난 성능을 보이지만 알려지지 않은 상황에서는 실패한다는 점이라고 설명했습니다. 제미니 로보틱스는 바로 이 문제를 해결하는 것을 목표로 합니다.
적합:
대규모 언어 모델(LLM)을 로봇 공학에 통합하는 것은 점점 더 증가하는 추세이며, 제미니의 접근 방식은 이러한 추세의 가장 인상적인 사례 중 하나일 수 있습니다. 스탠포드 대학교 생명공학과 교수이자 오픈마인드의 설립자인 얀 리프하르트는 이것이 "생성형 인공지능과 대규모 언어 모델을 첨단 로봇에 적용한 최초의 사례 중 하나"이며 "로봇 교사, 로봇 도우미, 로봇 친구의 가능성을 여는 진정한 열쇠가 될 수 있다"고 강조합니다.
엔비디아 CEO 젠슨 황은 한 걸음 더 나아가 생성형 AI를 활용해 로봇을 대규모로 배치하는 것이 수조 달러 규모의 시장 잠재력을 가질 수 있다고 주장했습니다.
쌍둥이자리와 로봇공학: 지능형 시스템의 전환점일까?
놀라운 발전에도 불구하고 여전히 해결해야 할 과제들이 남아 있습니다. 캘리포니아 대학교 버클리 캠퍼스의 로봇공학 교수인 켄 골드버그는 AI 시스템을 "로봇공학 분야의 흥미로운 발전"이라고 평가하면서도 "범용 로봇이 일상생활에 사용될 수 있을 만큼 발전하기까지는 아직 많은 연구가 필요하다"고 경고합니다.
구글은 다가오는 구글 I/O 컨퍼런스에서 이 기술의 가능성에 대한 더 자세한 정보를 공개할 예정입니다. 로봇 공학에 대한 오랜 관심과 이제 적합한 소프트웨어 구성 요소인 제미니를 통해 구글은 지능형 로봇 개발에 새로운 장을 열 수 있을 것입니다.
말에서 행동으로: 구글, 로봇공학에 새로운 기준을 제시하다
구글 딥마인드는 제미니 로보틱스를 통해 인공지능과 로봇공학의 융합을 향해 중요한 발걸음을 내디뎠습니다. 자연어를 이해하고, 복잡한 환경을 인지하며, 물리적 동작을 수행하는 이 로봇은 미래 로봇 활용 방식에 혁명을 일으킬 가능성이 있습니다.
이 기술은 순수 디지털 AI 애플리케이션에서 물리적 세계에 직접적인 영향을 미칠 수 있는 시스템으로의 전환을 의미합니다. 이는 일부 AI 회의론자들에게 우려를 불러일으킬 수 있지만, 구글 딥마인드의 주요 목표는 적은 훈련으로도 복잡한 작업을 처리할 수 있는 적응력 있고 유용한 로봇 시스템을 개발하는 것입니다.
향후 몇 년 동안 이 기술이 어떻게 발전하고 산업에서부터 일상생활에 이르기까지 다양한 분야에서 어떤 실질적인 응용 분야를 찾을 수 있을지가 드러날 것입니다.
적합:
귀하의 글로벌 마케팅 및 비즈니스 개발 파트너
✔️ 우리의 비즈니스 언어는 영어 또는 독일어입니다.
✔️ 새로운 기능: 자국어로 된 통신!
나는 귀하와 우리 팀에 개인 고문으로 봉사하게 되어 기쁘게 생각합니다.
문의 양식을 작성하여 연락하시거나 +49 89 89 674 804 (뮌헨) 로 전화해 주세요 . 내 이메일 주소는: Wolfenstein ∂ xpert.digital
나는 우리의 공동 프로젝트를 기대하고 있습니다.















