thebell

전체기사

엔비디아 H100 심은 NHN클라우드 '국가 AI 데이터센터' [르포] 세계 10위권 연산능력, 107PB 저장능력…K반도체 실증사업 예정

광주=김도현 기자공개 2024-03-26 08:26:23

이 기사는 2024년 03월 25일 14:38 thebell 에 표출된 기사입니다.

지난해 기점으로 진정한 인공지능(AI) 시대가 열리면서 주요국 간 패권 다툼을 펼치고 있다. 우리나라 역시 정부와 기업 차원에서 AI 생태계 조성에 여념이 없다. 2023년 10월 개소한 '국가 AI 데이터센터'도 같은 맥락에서 마련됐다.

해당 데이터센터는 과학기술정보통신부와 광주광역시가 추진하는 'AI 중심 산업융합 집적단지 조성 사업' 내 클라우드 인프라 구축 및 운영사업자로 참여한 NHN클라우드가 운영 중이다. 반년도 지나지 않아 470여곳 업체와 기관이 이용할 정도로 반응이 뜨겁다. 중장기적으로 국내 AI 산업에서 중추적인 역할을 할 것으로 예상된다.

◇엔비디아·그래프코어·사피온 칩 탑재 '멀티 AI GPU 팜' 구축

이달 21일 찾은 국가 AI 데이터센터는 철저한 보안 속에서 활기차게 돌아가고 있었다. 방문객인 기자단은 물론 상주 직원들까지 쉽게 드나들 수 없도록 했다. 지문과 출입카드, AI를 활용한 안면인식 등을 거쳐야 입장이 가능했다.

△비상발전기실 △수배전실 △MMR(Meet Me Room) △종합운영실 △전산실 △비상전원공급장치(UPS)실 △배터리실 △옥상 공조장치(공랭식 프리쿨링 냉동기) 등이 있는 본관으로 진입하기 위해서는 또 한 번의 인식 절차를 통과해야 한다.

국가 AI 데이터센터 외관 / 출처 : NHN클라우드

국가 AI 데이터센터는 하나의 큰 슈퍼 컴퓨터로 표현할 수 있다. 국내 최대 규모이며 연산능력은 세계 10위권인 88.5페타플롭스(PF)다. 1초에 8.85경번 연산할 수 있다는 뜻으로 일반 노트북 약 50만대가 1초에 수행할 수 있는 양이다. 저장능력은 107페타바이트(PB)로 1테라바이트(TB) 하드디스크 10만7000개의 용량이다.

핵심은 전산실이다. 이곳은 아파트 3층 또는 2층 버스 2대 높이를 자랑한다. 전산실1과 전산실2로 나뉘며 각각 랙(Rack)을 120개, 140개 배치했다. 두 실에는 엔비디아 'H100'을 비롯한 최신형 그래픽처리장치(GPU) 등으로 구성된 고성능 컴퓨팅(HPC) 환경이 조성됐다.

H100은 현존하는 GPU 중 최고 성능을 자랑한다. AI 서버 확산으로 가격이 폭등하면서 개당 4만달러(약 5300만원)까지 치솟은 것으로 전해진다. 높은 가격에도 품귀 현상이 나타날 정도다.

NHN클라우드는 정부 지원을 받아 선제적으로 H100을 대량 주문했고 국가 AI 데이터센터와 판교 데이터센터(NCC1) 등에 1000개 이상을 확보한 상태다. 더불어 그래프코어(11.2PF), 사피온(11PF) 등 제품까지 더해 총 99.5PF에 달하는 AI GPU 팜을 구축해놓았다.

엔비디아 'H100'이 투입된 전산실 / 출처 : NHN클라우드

올해 8월부터 국가 AI 데이터센터에서 K반도체 실증사업도 진행된다. SK그룹의 AI 반도체 회사 사피온과 함께 협력한다. 사피온의 기존 칩인 X220에서 하반기 양산 예정인 X330으로 교체되면서 10PB 규모를 갖추게 된다. 우리나라 AI 반도체 기업들이 다양한 칩을 개발 및 설계하는데 충분하다는 평가다.

윤용수 NHN클라우드 기술리더(이사)는 "(국가 AI 데이터센터는) 랙당 전력밀도가 15킬로와트(kW)다. 국내 데이터센터 평균(4.8kW)은 물론 올해와 내년 오픈하는 데이터센터(10kW)와 비교해서 압도적"이라며 "전기, 건축, 공조, 설비 등 노하우를 모두 반영했고 서버 내 냉기를 보관하도록 고용량 펜과 냉각 시스템을 운용 중"이라고 설명했다.

NHN클라우드 인터넷 연동망을 통해 국내 주요 통신사업자와 글로벌 통신사업자의 인터넷 서비스 환경을 제공하는 것도 특징이다. 특정 인터넷 서비스 제공자(ISP)에 국한되지 않고 사용자가 인터넷 회선 사업자를 자유롭게 선택 가능한 망중립 인터넷 데이터센터(IDC)라는 뜻이다. ISP를 선택하는 공간이 MMR이다.

이러한 환경을 구현하기 위해 200기가비피에스(Gbps) 이상 높은 대역폭의 고속 전용망 DWDM(Dense Wavelength Division Multiplexing)을 설치했다. 이에 판교와 광주 IDC 간 고객 자원의 손쉬운 확장이 가능해졌다. 인입 관로를 이원화해 한쪽의 통신 회전이 단절됐을 시 예비 회선으로 즉각 전환케 대비하기도 했다.

국가 AI 데이터센터 옥상에 위치한 '공랭식 프리쿨링 냉동기' / 출처 : NHN클라우드

◇'전기 먹는 하마' 오명, 친환경 기술로 벗는다

데이터센터 특성상 상당한 양의 전기 사용이 불가피하다. 국가 AI 데이터센터의 경우 다수의 H100 등이 들어간 만큼 관련 이슈가 더 크다. NHN클라우드는 이 부분을 최소화하고자 건설 초기부터 고민했다는 후문이다.

대표적인 결과물이 옥상에 마련된 공랭식 프리쿨링 냉동기다. 외기 온도가 5도 이하일 때는 100% 프리쿨링으로 가동돼 일반 쿨링장비 대비 약 20% 에너지 절감이 가능하다. 물의 증발잠열을 이용해 냉방을 돕는 기술을 접목해 프리쿨링 효과를 극대화하기도 했다. 궁극적으로 물과 에너지를 절약할 수 있다.

차폐환경도 이목을 끈다. 냉방에 사용되는 에너지를 감축하기 위해 차가운 공기와 더운 공기가 섞이지 않게 했다. 고효율 냉방의 비결이다.

윤 이사는 "보유 GPU를 풀가동하더라도 가장 좋은 에너지 효율을 보일 수 있도록 설계했다"면서 "냉기를 공급해 GPU를 냉각하는 방식도 도입했다. 여러 데이터센터에서 확대 적용할 수 있을 것"이라고 강조했다.

국가 AI 데이터센터 배터리실 내부 / 출처 : NHN클라우드

유사시를 대비한 배터리실과 UPS실도 주요 공간 중 하나다. 배터리실에는 대량의 전력을 제공할 수 있는 배터리가 구비됐다. 무정전 시 즉각 대응하기 위함이다. 또한 완전 무정전 실현을 위해 비상발전기실 외 UPS실까지 별도 운영 중이다. 찰나의 순간에도 데이터센터가 멈추지 않도록 하겠다는 의지다.

윤 이사는 "다른 데이터센터보다 정밀하게 배터리룸을 관리하고 있다"며 "배터리 등으로 인한 화재 측면도 민감하게 생각해 소방서도 설치했고 모든 공간을 CCTV로 온도와 연기 등을 감지하도록 했다. 근처 소방서와 협약을 맺고 직통 핫라인을 구성하는 등 만반의 준비를 했다"고 이야기했다.
< 저작권자 ⓒ 자본시장 미디어 'thebell', 무단 전재, 재배포 및 AI학습 이용 금지 >
주)더벨 주소서울시 종로구 청계천로 41 영풍빌딩 5층, 6층대표/발행인성화용 편집인이진우 등록번호서울아00483
등록년월일2007.12.27 / 제호 : 더벨(thebell) 발행년월일2007.12.30청소년보호관리책임자김용관
문의TEL : 02-724-4100 / FAX : 02-724-4109서비스 문의 및 PC 초기화TEL : 02-724-4102기술 및 장애문의TEL : 02-724-4159

더벨의 모든 기사(콘텐트)는 저작권법의 보호를 받으며, 무단 전재 및 복사와 배포 등을 금지합니다.

copyright ⓒ thebell all rights reserved.