수백억 투자한 기상슈퍼컴퓨터, 어떻게 쓰이나
기상청의 슈퍼컴퓨터 5호기는 국가가 보유한 재산 중 가장 비싼 물품으로 꼽힌다. 지난 2021년 레노버 SD650 시스템 기반으로 구축했으며, 당시 구입가는 628억 원이며, 운영비는 연 60억 원에 달한다. 평균 5년마다 한 번씩 전체 시스템을 교체하며 비판을 받기도 했다. 그럼에도 2000년 1호기를 시작으로 5호기까지 안정적으로 발전을 지속하며 기상관측을 지원하고 있다. 지디넷 코리아는 충북 청주시 국가기상슈퍼컴퓨터센터에 방문해 실제 기상용 슈퍼컴퓨터가 어떤 구조이고, 무슨 업무를 담당하고 있는지 살펴봤다. ■ 3층 건물 전체가 슈퍼컴퓨터 국가기상슈퍼컴퓨터센터의 슈퍼컴퓨터 5호기는 3층 높이 건물 하나가 전체 시스템이다. 현재 슈퍼컴퓨터는 보안시설로 지정되어 내부 촬영은 금지되어 있다. 외부 침입을 막기 위해 입장도 사무동 2층을 통해서만 가능하다. 건물 안에 들어서면 초기분인 두루와 최종분인 마루와 그루로 구성된 스타일러스 크기의 랙이 한 층을 가득 채우고 있었다. 슈퍼컴퓨터 5호기의 전체적인 모습은 데이터센터와 비슷하다. 하지만 안정성과 특화된 성능에 집중한 구조가 특징이다. 두루는 2019년 12월 도입되어 2020년 2월에 서비스를 시작했으며, 2020년 4월부터 한국형수치예보모델을 운영하고 있다. 마루와 그루는 2021년 6월 도입 완료해 8월부터 서비스를 시작했다. 두루의 최대 성능은 1.9페타플롭스(PFlops), 메모리 용량은 327테라바이트(TB)다. 인텔 캐스케이드 레이크 프로세서 기반의 계산시스템으로 스타일러스 크기의 랙 6개와 전후처리서버 20대, 로그인 서버 6대의 부대장비로 이뤄져 있다. 각 56개의 랙으로 이뤄진 두루와 마루는 같은 성능을 가진 시스템으로 인텔 아이스 레이크 프로세서 기반에 총 51 PFlops, 2천 TB를 지원한다. 더불어 전후처리서버와 120대, 로그인서버 12대와 연결돼 있다. 국가기상슈퍼컴퓨팅센터 장민수 사무관은 각 슈퍼컴퓨터에 전후처리서버와 로그인 서버를 연결한 이유에 대해 슈퍼컴퓨터가 순수하게 계산만 담당해 최대한의 성능을 유지할 수 있는 환경을 마련하기 위함이라고 설명했다. 국가기상슈퍼컴퓨터센터는 하드웨어 인프라 구축과 운영 및 관리만을 담당한다. 실제 날씨 관측을 위한 소프트웨어(SW)나 앱을 개발하거나 기상관측 등은 차세대 수치예보모델 개발사업단, 수치모델링센터, 국립기상과학원, 예보국, 기후과학국 등 개발 15개 부서와 응용 23개 부서에서 담당한다. 연구용 슈퍼컴퓨터와 달리 기상슈퍼컴퓨터센터 5호기는 메인시스템인 최종분을 마루와 그루 2개의 시스템으로 나눠 운영한다. 어느 한쪽에 이상이 발생하더라도 멈추지 않고 날씨를 분석할 수 있는 무중단 환경을 구축하기 위함이다. 평상시에는 마루가 실제 일기예보를 위한 데이터처리에 집중하며, 그루는 기후변화 시나리오 등 보다 장기적인 계산이 필요한 업무에 활용되고 있다. 이 밖에도 열을 효율적으로 식혀 성능을 유지하기 위한 수랭식 시스템과 냉각탑과 2만2천900볼트의 대규모 전력을 유지하기 위한 배전 설비가 마련됐다. 또한 정전 시 안정적인 전원 공급을 위한 UPS, 리튬이온 배터리, 비상발전기 등 기반 시설이 갖춰져 있다. ■ 국민의 생명과 재산 보호 위한 기상슈퍼컴퓨터 기상청은 기상 예보와 예보 정확도 향상을 위해 2000년 기상업무 전용 슈퍼컴퓨터 1호기로 일본 NEC의 SX-5 시스템을 도입했다. 기상수퍼컴퓨터 도입은 1998년 발생한 지리산 폭우가 계기가 됐다. 예고 없이 내린 폭우는 산악 지역에 집중됐고, 100여 명에 가까운 사상자가 발생했다. 이는 그동안 경험하지 못했던 기상현상으로 기존 사례를 기반으로 예보하던 예보관으로서는 이를 예측할 수 없었다. 이러한 사고를 반복하지 않기 위한 방안으로 국가기상슈퍼컴퓨터가 제안됐다. 지역별 관측소, 위성, 항공 등 전 세계에서 수집한 관측 자료를 수치예보모델에 적용시켜 기록에 없던 기상현상도 사전에 예측하기 위함이다. 수치예보모델은 날씨를 예측할 수 있도록 사전에 대기의 상태와 운동 방향을 계산하는 프로그래밍 도구다. 지구를 바둑판처럼 격자 단위로 나눠 계산하며 격자 거리가 좁을수록 보다 정교하게 날씨를 측정할 수 있다. 전지구, 초단기, 폭풍해일, 황사·연무 등 목적에 따라 다양한 수치예보모델이 존재한다. 또한 수치예보모델은 일기예보에 수백 억 원에 달하는 고성능 컴퓨팅 파워가 필요한 이유 중 하나다. 하루 평균 약 4천만 개, 용량으로 62테라바이트(TB)에 달하는 대규모 관측 데이터를 시간과 공간으로 편미분하는 복잡한 수치예보모델 계산을 정해진 시간 내에 처리해야 하기 때문이다. 슈퍼컴퓨터 도입 후 태풍, 장마, 해일, 가뭄, 지진 등 국민의 생명과 생업, 국방과 관련된 기상재난의 예측 정확도를 높여 피해를 상당히 경감할 수 있었다. 장민수 사무관은 “기상에 민감한 해군이나 공군 등과는 실시간으로 소통하고 있으며, 무역과 농업에 종사하시는 분들의 연락을 종종 받기도 한다”며 “우리는 인프라를 관리하는 조직이기 때문에 예보 관련해서 답을 드리긴 어렵지만, 가장 우선시하는 것은 국민의 안전이기 때문에 상대적으로 보수적인 전망이 포함될 가능성이 있다고 생각한다”고 의견을 밝혔다. 국가기상슈퍼컴퓨터센터는 20년간 5번에 걸쳐 슈퍼컴퓨터를 교체하며 25만 배의 성능 향상을 이뤘다. 성능의 발전에 따라 지원하는 기능을 추가하며 국민 편의성도 향상시켰다. 1호기는 객관적 기상예보 체계 구축했으며, 2005년 도입된 2호기는 스마트폰과 네비게이션 출시에 맞춰 5km 범위의 초단기 수치예보모델을 적용한 동네예보를 추가했다. 이를 통해 지역별 날씨 예보지원이 시작됐다. 동네예보 도입 초기 6시간마다 이뤄지던 일기예보 갱신 시간도 3시간, 1시간으로 점차 단축됐다. 3호기는 전지구모델 해상도를 기존 55Km에서 25Km로 줄이며 수치 예측 값의 정확도를 높였으며, 4호기는 폭염, 폭설, 한파 등 규모가 작고 수명이 짧아 정확한 예보가 어려운 위험기상 관련 데이터도 분석할 수 있게 됐다. 기상슈퍼컴퓨터에서 생산되는 데이터는 환경, 국방, 산업, 교육, 항공, 선박 등 국내외 다양한 분야에서 활용되고 있다. 지금도 API 형태로 제공되는 데이터를 개인용 앱에 적용하거나 플랫폼 등에 사용할 수 있다. 장 사무관은 “일부에서는 슈퍼컴퓨터에 투자되는 비용이 과도한 것이 아니냐는 의견이 있을 수 있지만, 국민의 안전이나 산업의 발전 등으로 기대할 수 있는 비용을 계산하면 10배 이상의 가치는 충분히 넘어선다”며 “그래서 미국을 비롯해 일본이나 중국 등 주변국가는 우리나라보다 수십 배 이상 슈퍼컴퓨터에 투자하고 있다”고 설명했다. 이어서 “다들 알다시피 지금은 IT기술력과 인프라 경쟁력이 국가의 핵심 경쟁력으로 주목받고 있다”며 “슈퍼컴퓨터는 강력한 컴퓨팅 파워로 기술혁신을 일으킬 수 있는 인프라인 만큼 글로벌 기술 경쟁에 중요한 요소라고 할 수 있다”고 말했다. ■ 현재 평균 사용량 60%, 2년 내 모든 리소스 사용 5호기는 전 세계 9번째 자체 수치예보 모델인 한국형수치예보모델(KIM)을 독자 개발해 사용하고 있다. 한국형수치예보모델은 기상청 수치모델링센터에서 개발했다. 산이 많고, 서울 등 특정 지역의 인구 밀도가 높은 우리나라의 지형적 특성과 최근 자주 발생하는 이상기온 현상 데이터를 반영하며 정확성을 높이고 있다. 종합적인 성능은 글로벌 1위로 꼽히는 유럽연합(EU)의 ECMWF모델 등에 비해 아직 부족하지만 상당부분 따라왔으며, 특정 부분에서는 오히려 높은 성능을 보여주기도 했다. 대표적으로 경로가 독특해 예측이 어려웠던 지난 달 8월 태풍 카논의 경우 우리나라의 수치예보모델 모델 만이 사전 예측에 성공하기도 했다. 기상청은 보다 정확하고 만족도 높은 기상 예보를 위해 수치예보모델의 격자 해상도를 조밀하게 개선할 계획이다. 현재 전지구모델의 해상도는 12km로 약 여의도에서 김포공항까지의 직선거리에 해당한다. 이를 5호기 내에서 최대 8km까지 단축하는 것을 목표로 하고 있다. 해상도가 높아질수록 더욱 세밀하게 데이터를 관측·분석하고 이를 기반으로 더욱 자세한 시뮬레이션 정보를 제공받아 예보의 정확도를 높일 수 있다. 장민수 사무관은 “저해상도와 고해상도의 모델에서 태풍의 모습 비교하면 저 해상도에서는 태풍 주변의 구름이 불분명하게 보인다”며 “반면, 고해상도에서는 태풍 모양에 따라서 구름이 소용돌이 치는 모습도 자세히 볼 수 있어 그만큼 기상현상을 정확하게 관측하고 정확도 높은 예보가 가능해진다”고 설명했다. 하지만 격자를 줄이기 위해선 가로와 세로를 비롯해 높이와 함께 예측시간까지 나눠야 하는 만큼 줄어드는 비율에 따라 계산량이 기하급수적으로 늘어나며 그만큼 많은 컴퓨팅 파워를 요구한다. 올해로 3년차에 접어든 마루의 평균 사용량은 약 60% 수준이며, 개발 및 연구 팀에서 업무를 진행할 경우 80%까지 올라간다. 한국형수치예보모델 업그레이드와 다양한 기상 분석관련 기능 추가로 내년에서 내후년경 슈퍼컴퓨터의 모든 자원을 사용할 전망이다. 이후 더욱 발전된 수치예보모델 운영을 위해 6차 슈퍼컴퓨터를 2026년 12월에 구축하는 것을 목표로 하고 있다. 6차 슈퍼컴퓨터는 해상도를 3km에서 1km 수준을 목표로 하고 있으며, 과도한 부하를 줄이기 위해 필요한 지역만 해상도를 높이는 가변 격자 모델 기능을 도입하는 것도 고려 중이다. 이를 위해 해당 부서에서 관련 기술을 연구개발 중이다. 더불어 기후환경 분야 연구 및 인력양성을 위한 기술 및 인프라 지원도 실시한다. 기후 환경 전문 학과에서 연구를 위해 한국형수치예보모델을 사용할 수 있도록 지원하며, 초고성능컴퓨팅 전문 인력 양성 프로그램을 운영한다.