▶ 중급 모델인데도 일부 지표 최상위 모델 능가… ‘사스포칼립스’ 우려 심화할듯
인공지능(AI) 챗봇 '클로드' 운영사 앤트로픽이 최상위 모델 '오퍼스'에 이어 중급 주력 모델인 '소네트'의 업그레이드도 발표했다.
앤트로픽은 신규 AI 모델 '클로드 소네트 4.6'을 출시했다고 17일 밝혔다. 지난 5일 '오퍼스 4.6'을 내놓은 지 약 2주 만이다.
앤트로픽은 소네트 4.6에서 전작과 견줘 코딩, 컴퓨터 활용, 추론, 에이전트 등 전반적인 AI 역량을 높였다고 설명했다.
성능지표(벤치마크) 평가에서 소네트 4.6은 대부분 오퍼스 4.6에 버금가는 성능을 보였으나, 일부 지표는 오히려 더 높은 점수를 받기도 했다.
코딩 능력을 보여주는 'SWE-벤치 베리파이드' 점수는 오퍼스 4.6의 80.8%에 근접한 79.6%를 기록했고, 컴퓨터 제어 AI 에이전트 능력을 측정하는 'OS월드-베리파이드' 점수도 오퍼스4.6(72.7%)에 근접한 72.5%를 받았다.
재무 분석 능력을 재는 '파이낸셜 에이전트 v1.1' 지표는 60.1%를 받은 오퍼스 4.6을 능가하는 63.3%였고, 사무업무 능력 지표인 'GDPval-AA Elo'도 오퍼스 4.6의 1606점보다 높은 1633점을 기록했다.
앤트로픽은 소네트 4.6이 한 번에 처리할 수 있는 정보의 양을 100만 토큰으로 확장해, 방대한 데이터를 입력하는 기업 고객의 편의성을 높였다.
토큰은 생성 AI가 처리하는 데이터의 단위로, 일반적으로 영어에서 1토큰은 단어 1개 정도의 크기다.
그러면서 소네트 4.6의 기업 고객용 단가는 100만 토큰당 3∼15달러로 동일하게 유지했다.
앤트로픽이 최근 내놓은 '클로드 코워크' 등 도구는 최근 AI 발 '소프트웨어 서비스'(SaaS) 위기론인 '사스포칼립스'를 촉발하기도 했다.
기존에 오퍼스급 모델로만 할 수 있었던 업무가 좀 더 저렴한 소네트 모델에서도 가능해지면서 이와 같은 우려가 더욱 심화할 것으로 전망된다.
<연합뉴스>
댓글 안에 당신의 성숙함도 담아 주세요.
'오늘의 한마디'는 기사에 대하여 자신의 생각을 말하고 남의 생각을 들으며 서로 다양한 의견을 나누는 공간입니다. 그러나 간혹 불건전한 내용을 올리시는 분들이 계셔서 건전한 인터넷문화 정착을 위해 아래와 같은 운영원칙을 적용합니다.
자체 모니터링을 통해 아래에 해당하는 내용이 포함된 댓글이 발견되면 예고없이 삭제 조치를 하겠습니다.
불건전한 댓글을 올리거나, 이름에 비속어 및 상대방의 불쾌감을 주는 단어를 사용, 유명인 또는 특정 일반인을 사칭하는 경우 이용에 대한 차단 제재를 받을 수 있습니다. 차단될 경우, 일주일간 댓글을 달수 없게 됩니다.
명예훼손, 개인정보 유출, 욕설 등 법률에 위반되는 댓글은 관계 법령에 의거 민형사상 처벌을 받을 수 있으니 이용에 주의를 부탁드립니다.
Close
x