"오픈AI·앤트로픽 겨냥"…아마존, 신형 AI 모델 '노바 액트' 출시

News

"오픈AI·앤트로픽 겨냥"…아마존, 신형 AI 모델 '노바 액트' 출시

[지디넷코리아]

아마존이 에이전트 인공지능(AI) 시장에 뛰어들며 웹 기반 자동화 기술 고도화에 나섰다. 기존 거대언어모델(LLM)이 대화 응답에 머물렀던 한계를 넘어서 사람을 대신해 실제 작업을 수행하는 범용 에이전트 구현에 속도를 내는 행보다.

오픈AI, 앤트로픽, 마누스 등 주요 기업들이 각축전을 벌이는 가운데 아마존도 차세대 AI 주도권을 겨냥해 본격 경쟁에 가세한 모습이다.

2일 테크크런치 등 외신에 따르면 아마존은 신형 AI 모델 '노바 액트(Nova Act)'를 연구용 프리뷰 형태로 공개했다.

아마존

해당 모델은 웹 브라우저 내에서 사용자 대신 클릭, 입력, 전환 등 복잡한 작업을 자동으로 수행할 수 있는 기능을 갖췄으며 개발자용 소프트웨어 개발 키트(SDK)는 아마존 노바 공식 홈페이지를 통해 제공된다.

'노바 액트'는 기존 LLM 기반 시스템과 달리 화면의 버튼, 드롭다운, 달력 등의 유저인터페이스(UI) 요소를 실제로 식별하고 조작할 수 있다. 이를 통해 애플리케이션 프로그램 인터페이스(API) 연동이 어려운 환경에서도 사람처럼 브라우저를 탐색하고 양식을 제출하거나 예약을 완료하는 식의 멀티스텝 작업이 가능해진다.

아마존은 이 모델이 내부 기준 벤치마크에서 경쟁 제품 대비 높은 정확도를 기록했다고 밝혔다. 실제로 '스크린스팟 웹 텍스트', '스크린스팟 웹 아이콘', '그라운드 UI 웹' 테스트에서 각각 0.939, 0.879, 0.805의 점수를 기록한 것으로 알려졌다. 이는 오픈AI와 앤트로픽 기반 모델보다 높은 수치다.

개발자는 SDK를 활용해 "보험 추가는 하지 마세요"처럼 아주 구체적인 지시를 단계별로 입력할 수 있다. 브라우저를 실제로 조작하는 자동화 도구인 플레이라이트도 함께 사용할 수 있고 파이썬 코드를 이용해 여러 작업을 동시에 처리하거나 중간 점검을 넣는 것도 가능하다. 아마존은 앞으로 '노바 액트'를 보다 똑똑하게 만들기 위해 다양한 환경에서 스스로 학습하는 방식인 강화학습을 점차 확대해 나갈 계획이다.

이 모델은 추후 음성 비서 '알렉사+'에도 통합돼 "내일 휴가 내줘" 같은 음성 명령만으로 사내 포털 로그인부터 양식 작성, 일정 등록까지 자동화할 수 있도록 한다는 구상이다. 이미 '매주 화요일 저녁 샐러드 자동 주문'과 같은 반복 작업을 에이전트가 수행하는 사례도 내부 프로토타입에서 구현된 바 있다.

아마존이 에이전트 인공지능(AI) 시장에 뛰어들며 웹 기반 자동화 기술 고도화에 나섰다. (사진=아마존 유튜브 캡처)

다만 현장 반응은 엇갈린다. 미국 직장인 커뮤니티 블라인드에서는 한 아마존 직원이 "노바 모델로 시작한 '알렉사+'는 정확도가 20%에 불과했고 기본적인 일조차 제대로 못 했다"고 밝혔다. 또 다른 아마존 직원은 "우리는 너무 뒤처져 있고 이렇게 돈만 쓰는 게 민망하다"고 평가했다.

반대로 "텍스트 생성은 충분히 괜찮고 이미지 생성은 매우 우수하다"는 긍정적인 의견도 올라왔다. 또다른 직원은 "어차피 반복하면서 개선하면 된다"며 개선 가능성에 무게를 뒀다.

아마존은 공식 발표문에서 "복잡한 다단계 작업을 똑똑하고 신뢰성 있게 수행하려면 에이전트는 다양한 유용한 환경에서 강화학습을 통해 훈련돼야 한다고 믿는다"며 "이 여정에 함께할 개발자들과 빠르게 피드백을 주고받을 것"이라고 말했다.

0 Comments
제목
Category
접속자 통계
  • 현재 접속자 70 명
  • 오늘 방문자 912 명
  • 어제 방문자 668 명
  • 전체 방문자 238,440 명
  • 전체 게시물 5,709 개
  • 전체 댓글수 674 개
  • 전체 회원수 57 명
Facebook Twitter GooglePlus KakaoStory KakaoTalk NaverBand