엔비디아 리서치에서 20일(현지 시간) 인공지능으로 로봇 훈련을 기존보다 개선했다고 발표했다.
연구진이 개발한 인공지능 이름은 유레카(Eureka)다. 로봇에 동작을 학습시키는 교육자다. 다른 대규모 언어모델 기반 인공지능(LLM)을 활용해 강화학습 프로그램을 생성한다. 유레카는 LLM이 설계한 훈련 프로그램을 실험하고 수집된 정보를 분석해 더 개선된 결과물을 출력하도록 감독한다. 또한 작업 일부를 다른 AI 챗봇에 맡겼기 때문에 더 효율적으로 작동할 수 있다.
연구진은 유레카로 시뮬레이션 로봇 손이 다양한 동작을 배우도록 훈련했다. 유레카는 챗GPT-4로 시행착오를 반복하는 방식의 강화학습을 진행했다. 유레카는 공 던지기, 블록 밀기, 버튼 누르기, 펜 돌리기 등 약 30가지 동작을 로봇손에 교육했다. 린시 짐 판 엔비디아 수석연구원은 유레카가 "LLM과 GPU 가속 시뮬레이션 프로그래밍의 독특한 조합"이라고 설명했다.
연구진이 최근 공개한 논문에 따르면 유레카가 설계한 학습 프로그램은 80%의 동작에서 사람이 제작한 교육 프로그램보다 효과적이었다. 시뮬레이션에서 학습 절차를 적용한 결과 인간이 제작한 프로그램보다 평균 50% 이상 성능이 향상되었다.
아니마 아난드쿠마르 엔비디아 연구 수석 연구원은 "유레카는 어려운 작업을 해결하기 위해 생성형 인공지능 학습과 강화학습 방법을 통합하는 새로운 알고리즘을 개발하기 위한 첫걸음이다"고 주장했다.
※이 기사는 popsci.com 원문을 바탕으로 작성됐으며, 번역은 파퓰러사이언스코리아 소속 기자가 도왔습니다.
/ 글 Andrew Paul 기자 & 육지훈 기자