클로드 챗봇을 개발한 앤스로픽이 최고 성능 인공지능(AI) 모델의 새 버전을 내놓으며 프로그래밍과 에이전트 영역에서 경쟁사들을 앞섰다고 밝혔다.
앤스로픽은 24일(현지시간) 최상위 등급 모델인 클로드 오퍼스의 개선판 '4.5버전'을 시장에 선보였다. 앤스로픽은 현재 성능과 용도에 따라 오퍼스, 소넷, 하이쿠라는 세 계열의 AI를 운영 중이며, 이 가운데 오퍼스는 고난도 분석과 전문가급 업무 처리에 특화된 최상급 제품군에 속한다. 나머지 두 모델은 상대적으로 가볍게 설계된 버전들이다.
앤스로픽 측은 이번에 출시한 오퍼스4.5가 AI의 자율적인 코드 작성 역량을 측정하는 SWE벤치마크 평가에서 80.9%의 정확도를 달성해 타사 제품들보다 우수한 결과를 냈다고 강조했다.
비교 대상으로는 오픈AI가 엔지니어링 업무에 맞춰 개발한 GPT-5.1코덱스맥스가 동일 테스트에서 77.9%를, 구글이 일주일 전 발표한 제미나이3프로가 76.2%를 각각 기록했다. 학습 과정에서 접하지 않은 새로운 문제 해결 능력을 평가하는 ARC-AGI-2시험에서도 오퍼스4.5는 37.6%의 성적을 거뒀는데, 이는 제미나이3프로의 31.1%와 GPT-5.1의 17.6%를 상회하는 수준이다.
앤스로픽은 실제 고객사들의 사전 테스트 경험을 인용하며, 불과 수주 전까지 소넷4.5모델이 해결하지 못했던 복잡한 작업들을 신규 오퍼스 버전이 성공적으로 수행할 수 있게 됐다고 전했다. 새 모델은 출시 당일부터 클로드 애플리케이션 및 API를 통해 접근 가능하며, 아마존웹서비스, 마이크로소프트 애저, 구글 클라우드 등 주요 클라우드 서비스 플랫폼 세 곳에서도 동시에 제공된다.
특히 주목할 만한 점은 API 사용 비용의 대폭 조정이다. 앤스로픽은 오퍼스4.5 런칭과 동시에 100만토큰 기준 입력 비용을 5달러(약 7400원)로, 출력 비용을 25달러(약 3만6900원)로 책정했다. 이전 요금 체계에서 입력 15달러, 출력 75달러였던 것과 비교하면 3분의1 수준으로 떨어진 셈이다. 토큰은 AI가 텍스트를 처리하기 위해 분할하는 기본 단위로, 하나의 단어가 한 토큰이 될 수도 있고 여러 개로 쪼개질 수도 있다.
앤스로픽은 오픈AI 출신 연구진들이 2021년 설립한 AI 전문 기업으로, 일반 소비자용 챗봇 시장보다는 API 및 클라우드 인프라를 기반으로 한 기업 고객 확보에 전략적 역량을 집중하고 있는 것으로 알려져 있다.
