구글, 스스로 판단하는 '피지컬 AI' 로봇 공개…로봇 산업 혁신 가속
구글 딥마인드가 공개한 제미나이 로봇 (출처: Google DeepMind)
구글 딥마인드가 스스로 상황을 판단하고 움직일 수 있는 '피지컬 AI' 기반 로봇을 공개하며 로봇 기술 혁신에 한 발 더 나아갔다. 이번에 발표된 '제미나이 로보틱스(Gemini Robotics)'는 명령 한마디로 로봇이 주어진 환경을 인식하고, 적절한 행동을 스스로 수행하는 AI 시스템이다.
딥마인드는 12일(현지시간) 제미나이 2.0 기반의 '제미나이 로보틱스'와 고도화된 모델 '제미나이 로보틱스-ER'을 공개했다. 이번 AI 모델은 복잡한 현실 환경에서도 자연어 명령을 이해하고 즉각적인 행동으로 이어지는 능력을 갖췄다. 딥마인드는 "이전 모델보다 더 광범위한 명령을 이해하고, 주변 환경 변화를 감지해 동작을 조정할 수 있다"고 밝혔다.
실제 공개된 시연 영상에서는 놀라운 장면이 펼쳐졌다. 시연자가 책상 위에 여러 과일을 쏟은 뒤 "바나나를 빈 통에 넣어달라"고 말하자, 로봇은 바나나를 집어 들어 빈 통을 찾아 정확하게 담았다. 시연자가 통의 위치를 이리저리 옮겼지만, 로봇은 이를 즉각 인지해 바나나를 통에 정확히 넣었다. 또, 장난감 농구대 앞에서는 "농구공을 집어서 덩크슛을 해"라는 지시에 바로 덩크를 성공시켰다. 카니슈카 라오 구글 딥마인드 엔지니어는 "이 로봇은 농구를 본 적도, 덩크라는 개념을 배운 적도 없지만, AI 모델을 통해 골대의 형태와 덩크슛 개념을 스스로 학습하고 행동에 옮긴 것"이라고 설명했다.
로봇은 종이접기와 같은 세밀한 작업도 성공적으로 수행했다. 한 시연에서는 로봇이 "나는 주황색 사각형 종이로 오리가미 여우를 접을 수 있다"고 말한 후, 실제로 종이를 접으며 "오리가미는 일본어로 '접다'는 의미의 '오리(おり)'와 '종이'를 뜻하는 '가미(がみ)'의 합성어"라고 설명하기도 했다. 이 외에도 로봇은 콘센트에 전기 플러그를 꽂고, 지퍼백을 닫는 등 복잡한 작업을 능숙하게 수행했다.
딥마인드는 제미나이 로보틱스가 ▲다양한 상황에 적응하는 '범용성' ▲지시와 환경 변화에 빠르게 대응하는 '상호작용성' ▲사람의 손과 손가락처럼 섬세한 동작을 수행하는 '숙련도'에서 모두 진보를 이뤘다고 강조했다. 특히 오픈AI의 GPT-4o, 앤스로픽의 클로드 3.5소넷 등 최신 VLA(시각-언어-행동) 모델과 비교한 성능 테스트에서도 제미나이 로보틱스가 대부분의 지표에서 앞섰다고 덧붙였다.
이번 발표는 로봇이 스스로 상황을 판단하고 움직일 수 있는 '피지컬 AI' 시대의 본격적인 도래를 알리는 신호탄으로 평가된다. 엔비디아는 지난 1월 CES 2025에서 피지컬 AI 개발 플랫폼 '코스모스(Cosmos)'를 공개하며 "로봇을 위한 '챗GPT 모먼트'가 다가오고 있다"고 선언한 바 있다. 마이크로소프트(MS)도 VLA 모델 '마그마(Magma)'를 발표하며 경쟁에 뛰어들었다.
중국 역시 '피지컬 AI' 개발에 박차를 가하고 있다. 최근 중국 연례 최대 정치행사인 양회에서는 피지컬 AI를 의미하는 '구신지능(具身智能)'이라는 용어가 공식 업무 보고에 처음으로 등장했다. 베이징시는 '2025-2027 구신지능 기술혁신과 산업육성 발전계획'을 마련하고, 빠르게 기술 개발에 나섰다. 베이징시 휴머노이드 로봇 혁신 센터는 양회 직후, 세계 최초의 범용 체화지능형 오픈 플랫폼을 발표했다. 유비테크는 딥시크 R1 모델을 탑재한 로봇을 개발해 전기차 기업 지커의 생산 라인에 투입한 상태다.
전문가들은 '피지컬 AI'가 상용화되면 산업 현장은 물론 사무실과 가정에서도 인간의 작업을 대체할 수 있을 것으로 전망한다. 김기응 카이스트 김재철AI대학원 교수는 "피지컬 AI 기술의 발전으로 기존 로봇공학의 한계를 뛰어넘고 있다"며 "마지막으로 남은 안정성 문제만 해결되면 상용화가 충분히 가능할 것"이라고 전망했다.