GIST, "사람 마음 읽는" 세계 최고 AI 로봇 파지 모델 개발


사람과 협업이 가능한 세계 최고 성능의 AI로봇 파지 모델이 개발됐다.
광주과학기술원(GIST, 총장 임기철)은 AI융합학과 이규빈 교수 연구팀이 단순한 자동화를 넘어, 작업자와의 협업을 고려한 세계 최고 성능의 혁신적인 로봇 파지 모델(GraspSAM)을 개발했다고 29일 밝혔다.
이 모델은 점, 박스, 텍스트 등 다양한 형태의 프롬프트 입력을 지원한다. 한 번의 추론만으로 물체의 파지점을 정확히 예측할 수 있다.
기존 딥러닝 기반 파지 모델들은 환경과 상황에 따라 별도의 AI모델을 학습해야 하는 한계가 있었다.

연구팀은 이를 해결하기 위해 페이스북 모회사 메타(Meta)가 개발한 범용 이미지 분할 모델인 'SAM(Segment Anything Model)'을 최초로 로봇 파지 출력이 가능하도록 도입했다.
최소한의 미세 조정만으로 물체의 파지점을 예측하기 위해 어댑터(Adapter) 기법과 학습 가능한 토큰 기법을 적용했다.
'SAM'은 Meta AI(구 페이스북)에서 개발한 범용 이미지 분할 모델이다. 이름 그대로 어떤 것이라도 분할할 수 있다.
연구진은 "산업 현장에서의 적용 범위를 획기적으로 확장했다"며 "파지 벤치마크 데이터세트(Grasp-anything, Jacquard)에서 최고 수준(SOTA) 성능을 달성했다"고 말했다.
'SOTA'는 벤치마크 데이터셋에서 최고 성능을 기록하거나 특정 과제에서 가장 효율적이고 정확한 결과를 제공하는 모델을 의미한다.
연구진은 "실험 결과 복잡한 실제 환경에서도 로봇이 안정적으로 파지 작업을 수행할 수 있다는 것을 확인했다"고 부연설명했다.
연구진은 또 "눈동자 추적 기술과 결합해 작업자의 시선에 맞춰 파지 작업을 수행하는 기능까지 성공적으로 구현, 산업 현장은 물론 다양한 분야에서 폭넓은 활용 가능할 것"으로 내다봤다.

이규빈 교수는 “로봇과 사용자의 직관적인 상호작용이 가능하다"며 "산업 현장뿐만 아니라 가정용 로봇, 서비스 로봇 등 다양한 분야에 폭넓게 활용될 것으로 기대한다”고 밝혔다.
연구는 AI 융합학과 이규빈 교수가 지도하고, 노상준 연구생(박사과정)이 제1논문 저자로 진행했다.
산업통상자원부와 과학기술정보통신부의 지원을 받았다.
연구 결과는 로봇 분야 국제 학회인 IEEE ICRA(International Conference on Robotics and Automation)에서 다음 달 발표 예정이다.