본문 바로가기

FINANCE SCOPE

구독하기
미국증시

OpenAI, 차세대 AI 모델 GPT-5.4 공개..추론·코딩 기능 통합

서윤석 기자

입력 2026.03.06 08:26

숏컷

X
사진 = 오픈AI 유튜브채널


OpenAI가 추론 기반 지식 업무와 코딩 기능을 통합한 차세대 인공지능(AI) 모델 GPT-5.4를 공개했다. 

기존에 기능별로 분리됐던 모델을 하나로 묶어 AI 에이전트 활용성을 크게 강화한 것이 특징이다.

오픈AI는 5일(현지시간) 최상위 AI 모델의 개선판인 GPT-5.4와 GPT-5.4 프로(Pro)를 발표했다고 밝혔다.

이번 모델은 기존에 영역별로 나뉘어 있던 GPT-5.2 사고(Thinking)와 코딩 특화 모델 GPT-5.3 코덱스(Codex) 계열을 통합한 형태다. 이를 통해 지식 기반 추론 작업과 소프트웨어 개발 작업을 하나의 모델에서 동시에 수행할 수 있도록 했다.

GPT-5.4에는 사용자의 컴퓨터를 직접 조작해 여러 애플리케이션을 넘나들며 작업을 수행하는 컴퓨터 제어 에이전트 기능이 오픈AI 범용 모델 가운데 처음으로 탑재됐다.

또 한 번에 처리할 수 있는 데이터량(컨텍스트 창)도 최대 100만 토큰으로 확대됐다. 이는 AI가 더 긴 문맥을 이해하고 복잡한 계획을 세워 실행하는 데 도움을 줄 것으로 회사 측은 설명했다.

성능 벤치마크에서도 이전 모델 대비 개선된 결과를 기록했다.

GPT-5.4 프로는 44개 직종의 지식 업무 수행 능력을 평가하는 GDPval 지표에서 82%를 기록해 전작의 약 70% 수준을 크게 넘어섰다.

정보 검색 능력을 평가하는 브라우즈컴프(BrowseComp)에서는 89.3%를 기록해 구글의 제미나이 3.1 프로(85.9%), 앤트로픽의 클로드 오퍼스 4.6(84%) 보다 높은 점수를 얻었다. 

코딩 능력을 평가하는 SWE-벤치 프로 퍼블릭에서도 GPT-5.4는 57.7%를 기록해 제미나이 3.1 프로(54.2%)를 앞섰다.

다만 오픈AI는 기존 코딩 평가 기준이었던 SWE-벤치 베리파이드 점수는 공개하지 않았다. 

해당 지표가 AI 훈련 데이터 등에 노출돼 결과가 왜곡될 가능성이 있다고 판단했기 때문이라고 설명했다. 이 지표에서는 지금까지 클로드 오퍼스 4.6이 가장 높은 점수를 유지해왔다.

GPT-5.4 모델은 이날부터 챗봇 서비스 ChatGPT 유료 구독자에게 즉시 제공된다.

기존 모델인 GPT-5.2 사고는 약 3개월간 유지된 뒤 오는 6월 5일 서비스가 종료될 예정이다. 

오픈AI는 이번 통합 모델을 통해 AI 에이전트 기반 업무 자동화 기능을 한층 강화한다는 전략이다.

서윤석 기자 yoonseok.suh@finance-scope.com

섹터 VIEW