News

AI 언어 모델과 스마트 로봇 융합 현실로...구글의 야심만만 시나리오 | 비맥스테크놀로지

작성자
비맥스테크놀로지
작성일
2023-07-31 09:26
조회
251

안녕하세요!

Digital 시대를 만들어가는 Embedded System IPCDisplay Solution 기업 비맥스테크놀로지입니다!

 

483180_450781_523.jpg

 

구글이 거대 언어 모델(LLM) 생성 AI 기술을 스마트 로봇에도 적용하는데 속도를 내고 있습니다.

뉴욕타임스 보도에 따르면 구글은 지난 몇년 간 로봇에 인공 지능을 제공하기 위해 LLM을 연결하는 테스트를 진행했고 최근 RT-2(Robotics Transformer 2) 로보틱스 모델을 공개했습니다.

구글 프로젝트는 로봇을 보다 영리하게 만들고 문제 해결 및 상황을 이해할 수 있도록 하는데 초점이 맞춰져 있습니다.

구글 경영진들은 RT-2에 대해 로봇이 구축되고 포로그래밍되는 방법과 관련한 거대한 진전이 될 것으로 보고 있다고 뉴욕타임스는 전했습니다.

구글 산하 AI 연구 조직인 딥마인드의 로보틱스 총괄인 빈센트 반호크(Vincent Vanhoucke)는 "전체 연구 프로그램을 재검토해야 했습니다. 전에 작업했던 많은 것들이 완전히 틀렸음이 입증됐다"고 말했습니다.

로봇은 여전히 인간 수준 재주를 갖추지 못했습니다. 기본적인 일들을 하지 못하는 경우도 많습니다.

이와 관련해 구글은 AI 언어 모델을 사용해 로봇에게 추론과 즉흥적으로 할 수 있는(improvisation) 능력을 제공하려는 모습입니다. UC 버클리의 켄 골드버그 로보틱스 분야 교수는 구글의 행보에 대해 "유망한 돌파구"라며 "의미론(semantics)을 로봇과 연결하는 방식이 매우 인상적입니다. 로보틱스 측면에서 매우 흥미롭다"고 말했습니다.

LLM과 로봇을 연결하려는 구글 행보가 갖는 의미를 구체적으로 이해하려면 로봇이 지금까지 어떻게 개발됐는지를 살펴볼 필요가 있습니다.

뉴욕타임스에 따르면 구글과 다른 회사들 엔지니어가 로봇이 기계적인 작업을 하도록 훈련시킨 방식은 특정 지시 목록을 갖고 프로그래밍하는 것이었습니다. 이후 로봇은 작업을 반복해서 수행한다. 이 과정에서 엔지니어들은 로봇이 잘할 때까지 지시를 수정합니다.

이같은 접근은 특정 분야, 제한된 용도로는 먹혀들었습니다. 그러나 이런 방식으로 로봇을 훈련시키는 것은 느릴 뿐더러 노동 집약적입니다. 실전 테스트 데이터도 많이 모아야 합니다. 여기에다 로봇에서 새로운 일을 시키려면 엔지니어들은 처음부터 다시 프로그래밍을 해야 했다고 뉴욕타임스는 전했습니다.

이같은 문제를 해결하기 위해 구글 연구원들은 최근 몇년 간 특정 작업을 하나씩 하도록 로봇을 프로그래밍하는 것이 아니라 로봇이 AI 언어 모델로 새로운 능력을 스스로 배우도록 하는 아이디어를 검토해왔고 2년전 께부터 직접 행동에 옮기기 시작했습니다.

캐롤 하우스먼 구글 리서치 과학자는 "LLM은 많은 지식이 있다는 것을 알게 됐다. 그래서 이를 로봇에 연결하기 시작했다"고 말했습니다.

로봇과 LLM을 연결하는 구글의 첫 시도는 지난해 공개된 연구 프로젝트 팜-세이캔(PaLM-SayCan)이었다. 나름 주목을 받았지만 이미지를 해석하는 능력이 부족해 유용성은 제한적이었습니다.

하지만 RT-2는 구글 표현으로 '비전 언어 행동'(vision-language-action) 모델을 갖춰 실제 세계를 보고 분석할 뿐만 아니라 로봇에게 어떻게 움직여야할 지 알려줄 수 있다는게 구글 설명입니다.

뉴욕타임스에 따르면 구글 오피스 키친에서 진행된 한 시간 가량 시연에서 RT-2는 많은 인상적인 작업들을 수행했습니다. 폭스바겐을 독일 국기로 옮겨라 같은 복잡한 지시도 성공적으로 따랐습니다. RT-2는 모형 폭스바겐 버스를 찾아 몇 피트 떨어진 미니어처 독일 국기 위에 내려놨다고 뉴욕타임스는 전했습니다.

물론 완벽한 것은 아니었습니다. RT-2는 테이블에 놓인 라크루아 캔의 맛을 잘못 식별하기도 했습니다.

구글은 RT-2 로봇 판매나 광범위하게 선보이는 것과 관련해선 아직 구체적인 계획이 없습니다. 하지만 구글 연구원들은 LLM을 장착한 장비들이 유용하게 쓰일 것으로 보고 있습니다. LLM 기반 로봇은 창고과 의료 분야에서 사용되고 가정용 비서로서도 배치될 수 있을 것으로 구글 연구원들은 보고 있다고 뉴욕타임스는 전했습니다.


출처 : 디지털투데이 (DigitalToday)(http://www.digitaltoday.co.kr)











비맥스테크놀로지는 원하시는 사양으로 완성 후 철저한 검사를 통해 최적의 pc를 고객님들께 제공해드리고 있습니다.

*넓은 온도 범위 및 견고한 임베디드 팬리스 컴퓨터

*다중 GigE / PoE 포트가 있는 머신 비전 플랫폼

*GPU 엣지 AI Computing(컴퓨팅) 차내 팬리스 PC

*초소형 팬리스 컨트롤러

*감시 / 비디오 분석 컴퓨터 시스템

혹시나 더 궁금하신 점이나 문의사항이 있으시면 비맥스테크놀로지로 문의해 주세요!









메뉴 닫기