카카오는 정부 주도 ‘GPU 확보 사업’에서 최종 사업자로 선정되어, 총 2424장의 엔비디아 B200 GPU 중 240장을 경기도 안산시에 위치한 ‘카카오 데이터센터 안산’에 구축했다. 이는 당초 제출한 연내 목표치인 64노드보다 4배를 상회한 규모로, 전체 할당량의 84%에 해당한다.
카카오는 공급사와의 긴밀한 협력을 통해 핵심 장비를 조기에 확보하고, 사전 기술 검증PoC을 통해 실제 가동 단계에서 발생할 수 있는 리스크를 사전에 점검하고 최소화했다. 이 과정을 통해 구축 일정을 앞당겼다.
데이터센터 안산에는 고성능 GPU 서버에서 발생하는 열을 효과적으로 관리하기 위해 뜨거운 공기를 격리해 냉각 장치로 바로 순환시키는 ‘열복도 밀폐시스템’을 적용했다. 이는 고집적 서버 운영에 필수적인 안정적인 전력 공급과 냉각 시스템을 선제적으로 마련한 결과다.
카카오는 국가 AI 컴퓨팅 자원 지원 포털과 연동된 통합 플랫폼을 통해 이용자가 카카오클라우드의 쿠브플로우 AI 플랫폼으로 손쉽게 진입할 수 있도록 했다. 쿠브플로우는 클라우드 네이티브 환경에서 머신러닝 워크플로우를 구축하고 실행할 수 있도록 지원하며, 모델 개발, 학습, 배포 및 추론 전 과정을 쿠버네티스 환경에서 지원한다.
카카오는 내년 1월 2일부터 과학기술정보통신부와 정보통신산업진흥원이 베타서비스 공모를 통해 선정한 산·학·연 과제에 최신 컴퓨팅 자원을 제공할 예정이다.
김세웅 카카오 AI시너지 성과리더는 “대규모 GPU 인프라를 안정적으로 구축하고 운영하는 것은 AI 경쟁력의 핵심”이라며 “카카오의 데이터센터 및 클라우드 역량을 바탕으로 안정적이고 효율적인 AI 개발 환경을 제공해 국내 AI 생태계 발전에 기여해 나가겠다”고 말했다.
@Meerae AI 빅데이터 연구소 meerae.info@gmail.com