카카오가 국가 인공지능(AI) 경쟁력의 핵심인 대규모 GPU 컴퓨팅 자원을 당초 계획보다 빠르게 확보하며 국내 연구 생태계 지원을 위한 가동 준비를 마쳤다.
카카오는 정부 주도 '그래픽 처리 장치(GPU) 확보 사업'의 일환으로 최신 GPU 인프라 구축을 성공적으로 진행 중이라고 29일 밝혔다. 카카오는 현재 전체 할당량의 약 84%에 해당하는 255노드(GPU 2040장)의 구축을 완료했다. 이는 당초 연내 목표였던 64노드 대비 4배를 상회하는 규모다.
조기 구축의 중심에는 '카카오 데이터센터 안산'의 인프라 역량이 있다. 카카오는 고집적 서버 운영에 필요한 전력 및 냉각 시스템을 선제적으로 마련했다. 특히 고성능 GPU 서버의 열 관리를 위해 '열복도 밀폐시스템(Hot Aisle Containment System)'을 도입했다. 이 시스템은 뜨거운 공기를 격리해 냉각 효율을 극대화한다.
카카오는 인프라와 함께 AI 모델 개발에 최적화된 소프트웨어 환경도 지원한다. 이용자는 카카오클라우드의 AI 플랫폼인 '쿠브플로우(Kubeflow)'를 사용할 수 있다. 쿠브플로우는 머신러닝 워크플로우의 개발부터 배포까지 전 과정을 자동화하도록 돕는다. 국가 AI 컴퓨팅 자원 지원 포털과 연동되어 이용자의 접근성도 높였다.
이번 사업은 정부가 AI 3대 강국 도약을 위해 GPU를 민간에 지원하는 국책사업이다. 카카오는 8월 최종 사업자로 선정됐다. 회사는 향후 5년간 총 2424장의 GPU를 위탁 운영하며 국내 AI 연구 환경을 지원할 계획이다.
현재 카카오는 구축된 255노드에 대해 네트워크 및 성능 테스트를 진행하고 있다. 테스트가 완료되면 내년 1월 2일부터 베타서비스를 시작한다. 지원 대상은 과학기술정보통신부와 정보통신산업진흥원이 공모를 통해 선정한 산·학·연 과제들이다.
김세웅 카카오 AI시너지 성과리더는 "대규모 GPU 인프라를 안정적으로 구축하고 운영하는 것은 AI 경쟁력의 핵심"이라며 "카카오의 데이터센터 및 클라우드 역량을 바탕으로 효율적인 AI 개발 환경을 제공해 국내 AI 생태계 발전에 기여하겠다"고 말했다.
