앤트로픽이 글로벌 빅테크 및 주요 금융기관과 손잡고 해킹 방어 체계 고도화를 목적으로 자사의 최신 AI 모델을 우선 지원하기로 결정했다.
7일(현지시간) 앤트로픽 발표에 따르면 사이버 방어 연합체인 '프로젝트 글래스윙'을 발족함과 동시에 아직 정식 출시 전인 최상위 모델 '미토스(Mythos)'의 미리보기(프리뷰) 버전을 협력사들에 선제적으로 개방한다.
연합체 명칭은 투명한 날개로 포식자를 피하는 유리날개나비(Glasswing)에서 영감을 얻었으며, 겉으로 드러나지 않는 시스템상의 맹점을 발굴해 보완하겠다는 의미를 담고 있다.
초기 협력사 명단에는 아마존웹서비스(AWS)·애플·브로드컴·시스코·구글·리눅스재단·마이크로소프트·엔비디아·팔로알토 등 세계적인 IT 및 보안 업체들이 대거 포함됐으며, JP모건체이스를 비롯한 대형 금융사도 동참했다. 아울러 핵심 소프트웨어 인프라를 운영 중인 40곳 이상의 기관에도 미토스 활용 권한이 주어진다.
앤트로픽은 미토스의 시스템 결함 탐지 역량이 상위 1%의 보안 전문가를 제외한 대다수 인간의 수준을 넘어섰다고 강조했다. 실제로 보안 결함 재현 능력을 측정하는 벤치마크인 '사이버짐' 테스트에서 미토스 미리보기판은 83.1%를 기록, 종전 자사 최고 모델이었던 '오퍼스 4.6'(66.6%)을 큰 차이로 앞질렀다.
코딩·논리적 추론·데이터 검색 능력을 가늠하는 각종 테스트에서도 오퍼스 4.6의 기록을 경신했다. 특히 각 학문 분야의 박사급 지식을 요구하는 '인류의 마지막 시험(HLE)' 평가(도구 미사용 조건)에서 56.8%를 획득해, AI 사상 처음으로 정답률 50%를 넘어서는 성과를 냈다. 기존 오퍼스 4.6의 해당 지표 성적은 40%에 불과했으며, 이전까지 1위를 지키던 구글 '제미나이3 딥싱크'의 기록도 48.4%에 그쳤다.
회사 측은 이처럼 고도화된 기술을 방어자들에게 우선 배포하는 이유에 대해, 해당 기술이 대중화될 경우 사이버 범죄자들에게 악용될 소지가 크므로 방어 진영이 선제적인 대응력을 갖추도록 지원하기 위함이라고 설명했다.
다리오 아모데이 앤트로픽 최고경영자(CEO)는 자신의 사회관계망서비스(SNS) 엑스(X·옛 트위터) 계정에 "AI의 오남용에 따른 위협은 분명히 존재하지만, 이를 적절히 통제하고 활용한다면 AI 기반 해킹 기술이 태동하기 이전보다 온라인 생태계와 현실 세계를 훨씬 더 안전하게 만들 수 있는 기회를 맞이하게 될 것"이라고 썼다.
이러한 비전의 일환으로 앤트로픽은 동맹에 합류한 파트너사들을 대상으로 최대 1억달러(약 1460억원)에 달하는 모델 이용 크레딧을 지급할 예정이며, 이와 별개로 개방형(오픈소스) 보안 커뮤니티에 400만달러(약 58억원)의 후원금을 전달하기로 했다.
일반 이용자를 대상으로 한 미토스 미리보기판의 공개 출시는 당분간 계획하지 않고 있으나, 장기적으로는 이 수준의 성능을 지닌 모델들을 위험 요소 없이 광범위하게 보급할 수 있는 체계를 확립하는 것이 최종 목표라고 회사 측은 전했다.
앤트로픽은 또 미토스의 해킹 방어 및 탐지 능력을 놓고 미 정부 관계자들과 지속적인 협의를 거쳐왔다는 사실도 공개했다. 회사 측은 "이러한 수준의 사이버 기술력 도래는 미국 및 우방국들이 글로벌 AI 패권 경쟁에서 주도권을 쥐어야 하는 명백한 근거"라며 "이를 뒷받침하기 위해 지방·주(州)·연방 정부 차원의 전방위적 공조에 나설 준비가 됐다"고 밝혔다.
