
네이버가 30일 추론능력을 강화한 생성형 AI 'HyperCLOVA X THINK(하이퍼클로바X 씽크)' 개발을 완료하고 테크니컬 리포트를 발표했다. 이 모델은 한국어 통사론·의미론·화용론 등 전문가 레벨 평가에서 국내외 주요 모델을 앞섰으며, 시각 정보 기반 추론 기술도 동시에 확보했다.
한국어 언어 능력 최고 수준 달성..시각 추론 기술로 확장HyperCLOVA X THINK는 서울대 언어학과에서 개발한 'KoBALT-700' 벤치마크 평가에서 유사 규모 국내 추론모델 및 글로벌 최고 수준 오픈소스 모델보다 높은 점수를 기록했다. 해당 벤치마크는 AI의 대화 격률 파악 능력, 문장 논항 구조 분석 등을 평가하는 전문가 수준의 문항들로 구성돼 있다.
또 다른 대표적인 한국어 성능 평가 지표인 'HAERAE-Bench'에서도 국내외 주요 오픈소스 모델보다 높은 점수를 기록했다.
네이버는 HyperCLOVA X THINK를 통해 언어뿐만 아니라 시각 정보를 바탕으로 한 추론 기술도 확보했다. 테크니컬 리포트에 따르면, HyperCLOVA X THINK는 'STEM(Science, Technology, Engineering, Mathematics)' 문제를 이미지 형식으로 입력했을 때 이를 인식하고 추론하는 과정을 통해 정답을 맞히는 모습을 보였다.
모델은 대학수학능력시험 생명과학 문제에서 그림으로 제시된 '생태계 천이 과정'과 '특정 식물 군집의 시간에 따른 총생산량 및 호흡량 그래프'를 인식·분석하고, 이를 양수림·혼합림·지의류 등에 대한 지식과 결합해 정답을 도출하는 모습을 보였다.
유강민 네이버클라우드 리더는 "이번 추론모델은 멀티모달 추론을 겨냥해 만든 것이 아님에도 시각 추론 영역에서 의미 있는 결과가 도출됐다"며 "향후 보다 강력한 멀티모달 추론 능력을 갖춘 모델로 고도화해나갈 것"이라고 말했다.
오픈소스 공개로 생태계 활성화 기대네이버는 추론모델을 오픈소스로도 공개할 계획이다. 네이버가 지난 4월 공개한 오픈소스 경량모델 'HyperCLOVA X SEED'는 한 달여 만에 50만 다운로드를 넘어서며 국내 오픈소스 AI 생태계 발전에 기여한 바 있다.
성낙호 네이버클라우드 하이퍼스케일 AI 기술 총괄은 "하이퍼클로바X를 '지능의 향상'과 '감각의 확장'의 2가지 축으로 고도화하고 있으며, 이번 HyperCLOVA X THINK를 통해 지능 측면에서 상당한 발전이 이뤄졌다"고 말했다. 그는 "사용자에게 실질적 가치를 제공할 수 있는 방법을 함께 찾아나갈 것"이라고 덧붙였다.
한편, 네이버는 추론모델 개발에 독자적 AI 기술을 활용했다. 모델 설계에 적용된 'Peri-LN(Peripheral Layer Normalization)' 기법은 'ICML(International Conference on Machine Learning) 2025'에 채택됐다.