• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
AI페스타
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'엔터프라이즈 데이터 센터'통합검색 결과 입니다. (9건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'AI 고속도로' 주역된 네이버·카카오·NHN…민관 GPU 1.3만장 가동

정부가 1조4천600억원을 투입해 첨단 그래픽처리장치(GPU) 1만3천장을 확보하는 초대형 인공지능(AI) 인프라 사업을 본격 추진한다. 이번 사업은 국내 AI 컴퓨팅 자원의 부족 문제를 해소하고 소버린 AI 생태계 구축을 본격화하는 첫 단추로 평가된다. 과학기술정보통신부는 'AI 컴퓨팅자원 활용기반 강화사업'의 일환으로 추진한 'GPU 확보·운용지원' 사업의 최종 사업자로 네이버클라우드·NHN클라우드·카카오 등 3개사를 선정했다. 총 4개 기업이 신청서를 제출했지만 쿠팡은 최종 탈락했다. 최종 사업자로 선정돼 클라우드 3사는 대규모 GPU 클러스터를 구축하고 연내부터 산학연과 스타트업 등에 순차적으로 지원에 나선다. 이번 사업은 정부가 지난 5월 국회에서 확보한 1조4590억원 규모의 1차 추경 예산을 바탕으로 기획됐다. 엔비디아의 최신 GPU를 신속히 확보해 국내 AI 스타트업, 학계, 연구기관 등이 사용할 수 있도록 지원하는 것이 핵심이다. 당초 정부는 '국가AI컴퓨팅센터' 구축 사업과 연계해 이 사업을 진행하려 했으나, 해당 사업이 두 차례 유찰되면서 별도로 추진됐다. 그 결과 GPU 구매·운영 경험과 인프라 역량을 모두 갖춘 클라우드 3사가 낙점됐다. "실행력과 경험이 갈랐다"…클라우드 3사, 평가 앞선 이유는 정부는 사업자 선정에 있어 단순한 GPU 구매 가격만이 아니라, 실행 역량과 기술 내재화를 중점적으로 평가한 것으로 알려졌다. 평가 항목은 크게 ▲사업 이해도 및 추진역량 ▲구축계획의 우수성 ▲운영역량 및 사업관리 ▲AI 생태계 기여 계획 등이다. 가장 많은 점수를 차지한 것은 '구축계획의 우수성'이었다. 대규모 클러스터를 직접 구성할 수 있는 기술 내재화, 최신 GPU 확보 속도, 연내 서비스 가능성 등이 주요 관건으로 작용했다. 최종 선정된 클라우드 3사는 이미 자체 데이터센터를 보유하고 있으며 GPU 클러스터링 운영 경험도 충분해 안정적인 인프라 운용 능력을 인정받았다. 특히 서비스형 GPU(GPUaaS) 상용 서비스 경험이 있어 정부가 요구하는 빠른 실행력과 기술력 확보에서 앞섰다는 평가다. 네이버클라우드는 '각 춘천'과 '각 세종' 등 자체 데이터센터뿐만 아니라 올 초부터 LG CNS 죽전 데이터센터, LG유플러스 가산 데이터센터 등 외부 데이터센터 임차를 진행 중이다. NHN클라우드는 '광주 AI 데이터센터'를 운용해 왔으며 이번 사업에는 영등포 양평 데이터센터와 일산 삼송 데이터센터를 제시한 것으로 알려졌다. 카카오 역시 자체 데이터센터인 '카카오 데이터센터 안산'을 지난해부터 운영 중이다. 반면 쿠팡은 싱가포르계 엠피리온 디지털 데이터센터를 임차해 사업에 참여할 계획이었으나 클라우드 인프라 자체 운영 경험이 사업에 선정된 3사 대비 부족하다는 점에서 낮은 평가를 받은 것으로 알려졌다. 업계 한 관계자는 "이번 사업은 단순히 장비를 들여오는 것이 아니라 그것을 어떻게 안정적으로 운영하고 서비스로 전환하느냐에 방점이 찍힌 평가였다"며 "데이터센터 기반부터 클러스터링 운용 능력, GPUaaS 사업 경험까지 총체적 실행 역량을 검증한 것"이라고 설명했다. 엔비디아 B200·H200 1.3만장 확보…대형 클러스터 본격 가동 이번 사업으로 정부와 민간이 확보하는 GPU는 총 1만3천장으로, 엔비디아 B200 1만80장과 H200 3천56장을 확보할 계획이다. 이 중 정부가 직접 활용하는 GPU는 B200 8160장, H200 2296장 규모다. 구축될 GPU는 대규모 AI 워크로드에 대응할 수 있도록 클러스터 형태로 구성된다. 대표적으로 정부는 ▲B200 510노드(4천80장) ▲255노드 2세트(2천40장) ▲H200 255노드(2천40장)를 각각 클러스터링해 초대형 AI 연산 작업에 활용할 계획이다. 세 사업자가 확보한 GPU 물량을 살펴보면 먼저 NHN클라우드는 B200 총 7천656장 확보하며 가장 많은 물량을 담당할 예정이다. 이 중 6천120장은 정부 활용분이며 510노드·255노드 형태로 구성해 고밀도 수냉식 클러스터로 운용할 계획이다. 네이버클라우드는 H200 총 3천56장을 확보한다. 이 중 2천296장이 정부 활용분이다. H200 기반 255노드와 32노드 클러스터를 구성해 연내부터 본격 가동할 계획이다. 카카오는 B200 총 2천424장을 확보하고 정부 활용분인 2천40장은 255노드 단일 클러스터로 구성될 예정이다. GPU 활용은 어떻게? '통합지원 플랫폼'으로 접근성↑ 정부와 사업자들은 연내부터 확보한 GPU 자원을 필요로 하는 산학연과 스타트업 등에 순차적으로 배분한다. 이를 위해 온라인 기반의 'GPU 통합지원 플랫폼(가칭)'도 함께 구축하기로 합의했다. 해당 플랫폼이 구축되면 사용자는 GPU 자원을 자유롭게 신청하고 평가를 거쳐 적정 자원을 배정받게 된다. 유휴 자원이 발생할 경우 대기 수요자에게 자동으로 재분배하는 체계도 마련될 전망이다. 이번 사업의 운영 기간은 2030년까지로, 향후 국가AI컴퓨팅센터나 독자 AI 파운데이션 모델 프로젝트 등 국가 단위 AI 사업과도 연계될 가능성이 크다. 업계 관계자는 "지금까지는 GPU가 있어도 정작 필요한 곳에 닿지 못해 활용률이 낮은 경우가 많았다"며 "GPU 통합지원 플랫폼이 제대로 작동하면 컴퓨팅 자원이 특정 기업이나 연구기관에 편중되지 않고 스타트업이나 대학도 실질적으로 활용할 수 있는 생태계가 마련될 수 있을 것"이라고 말했다. 배경훈 장관 "AI 고속도로 바탕으로 소버린 생태계 본격 확장" 이번 GPU 확보 사업은 고성능 AI 연산 자원이 부족한 국내 현실에서 커다란 전환점을 마련했다는 게 업계 평가다. 그동안 AI 스타트업이나 대학, 중소기업은 대규모 모델 학습이나 추론 환경을 제대로 갖추지 못한 채 글로벌 클라우드 서비스에 의존한 사례가 많았다. 이제 정부 주도의 대규모 GPU 클러스터가 공공 형태로 공급되면 ▲초거대 AI 모델 학습 ▲멀티모달 AI 개발 ▲AI 응용 서비스 고도화 등이 보다 넓은 생태계 안에서 가능해질 전망이다. 업계 관계자는 "GPU 1만장 이상을 정부와 민간이 공동으로 확보하고 오픈된 구조로 운영하는 모델은 긍정적인 방향"이라며 "한국형 AI 생태계를 본격적으로 시작할 수 있는 자산이 될 것"이라고 강조했다. 이번 사업으로 정부는 다음 달 초부터 사업자 협약 체결과 GPU 발주를 본격화한다. 4분기부터는 베타 서비스를 시작하고 빠르면 연내 정식 서비스로 전환할 방침이다. 배경훈 과기정통부 장관은 "이번 첨단 GPU 확보는 대한민국이 AI 강국으로 도약하는 출발점"이라며 "AI 고속도로를 바탕으로 소버린 AI 생태계를 본격 확장해 나가겠다"고 밝혔다.

2025.07.29 11:01한정호

[유미's 픽] "AWS·MS도 벅찬데 中·쿠팡까지?"…토종 클라우드 긴장감 '고조'

"한국은 디지털 인프라 수준이 매우 높고 클라우드 도입률도 앞서 있는 국가입니다. 이러한 고도화된 수요 환경은 우리가 아시아-태평양 시장에서 검증 받을 수 있는 중요한 테스트 베드이자 성장 거점이 될 것입니다." 지난 달부터 국내에 제2데이터센터 가동을 시작한 알리바바와 텐센트 등 중국 클라우드 기업들이 한국 시장 공략에 본격 나서면서 토종 기업들의 긴장감이 높아지고 있다. 이미 아마존웹서비스(AWS), 마이크로소프트(MS) 애저, 구글 클라우드 등 미국 빅테크 기업들이 민간 시장에 이어 국내 공공 시장까지 파고 든 데다 최근 '유통 공룡' 쿠팡까지 도전장을 내민 상황에서 각 기업들은 생존 전략을 짜는데 고심하는 분위기다. 14일 업계에 따르면 알리바바, 텐센트 등 중국 클라우드 기업들은 최근 한국을 전략적 시장으로 분류하고 투자에 속도를 높이고 있다. 그간 국내에서 주력해왔던 게임 분야에 이어 커머스·인터넷 등으로 영역을 확대하기 위해 인력·인프라 충원에도 적극 나섰다. 특히 알리바바 클라우드는 지난 달 말부터 서울에 제2 데이터센터를 공식 가동하기 시작하며 국내 고객사 확보에 대한 강한 의지를 보였다. 두 번째 데이터센터는 3년 만의 추가 투자로, 이를 통해 알리바바 클라우드는 리테일·인터넷 비즈니스·게임 등 산업군에 집중할 것이란 계획도 드러냈다. 텐센트 클라우드도 지난 2일 국내서 공식 행사를 열고 사업 확대를 위해 향후 인력과 투자를 확대할 예정이라고 밝혔다. 지난 2018년 한국에 진출한 후 서울에서 가용 영역 2곳을 기반으로 서비스를 운영 중인 이곳은 그간 쌓아왔던 엔터테인먼트 분야 노하우를 토대로 올해부터 고객사 확보에 본격 나선다는 방침이다. 이처럼 중국 업체들이 한국 시장에 집중하게 된 것은 최근 고성능 인공지능(AI) 및 클라우드 네이티브 솔루션에 대한 국내 기업들의 수요가 높아졌다고 판단해서다. 또 이들의 주요 타깃이었던 중국, 동남아 시장이 포화 상태에 달한 것도 요인으로 지목됐다. 업계 관계자는 "동남아, 중국에 이어 이들이 시장 확장 가능성이 가장 높아 보이는 곳으로 주목하는 곳이 한국"이라며 "지리적 요점과 중국 진출을 원하는 기업들의 수요, 마켓 순위상으로 봤을 때 인근 국가 중 공략하기 가장 쉽다고 판단한 듯 하다"고 밝혔다. 이에 중국 클라우드 기업들은 자체 AI 모델 경쟁력과 상대적으로 저렴한 비용, 한국 기업들의 중국 진출 지원 등을 앞세워 공격적으로 이들을 공략하고 나섰다. 특히 알리바바 클라우드는 자체 거대언어모델(LLM) '큐원'과 이미지·비디오 생성 AI 모델 '완(WAN)' 등을 손쉽게 활용할 수 있는 플랫폼 환경을 강점으로 내세우고 있다. 윤용준 알리바바 클라우드 인텔리전스 한국 총괄 지사장은 "한국에선 생성형 AI 도입에 따른 인프라 수요가 급증하고 있어 이런 수요에 선제 대응할 것"이라며 "신규 데이터센터를 통해 클라우드 네이티브, 빅데이터, 데이터베이스 등 AI 애플리케이션에 최적화된 제품을 더 다양하게 제공할 것"이라고 강조했다. 하지만 업계에선 중국 클라우드 기업들의 이 같은 움직임이 국내 기업들에게 크게 위협이 되지 않을 것으로 봤다. 이미 미국계와 토종 클라우드들이 선점하고 있는 상황인 만큼 중화권 진출을 노린 게임, 커머스, 엔터테인먼트 등 일부 기업을 제외하면 큰 관심을 보이지 않을 것으로 판단해서다. 업계 관계자는 "중국계 클라우드는 미국계와 달리 국내 공공 시장을 타겟으로 삼기에도 한계가 있을 듯 하다"며 "민간 시장에서도 AWS, MS 등 미국계가 선점한 상황에서 저가 정책을 펼쳐 일부 기업이 윈백하는 사례가 생길 수 있겠지만 큰 영향력을 끼치지는 못할 것"이라고 예상했다. 그러면서 "AI 측면에선 국내 서비스를 타깃으로 하기엔 데이터, 보안 문제로 한계가 있을 것"이라며 "오히려 중국 내부에 필요한 그래픽처리장치(GPU) 서비스 공급을 위한 목적이 더 클 것으로 판단된다"고 덧붙였다. 또 다른 관계자는 "국내 클라우드 시장은 이미 AWS를 중심으로 MS, 구글 등이 점유하고 있다"며 "중국 클라우드 기업들이 단기간에 경쟁하기는 쉽지 않을 것으로 보인다"고 강조했다. 실제 과학기술정보통신부의 '2023년 부가통신사업 실태조사'에 따르면 국내 기업의 클라우드 이용률은 AWS가 60.2%로 압도적 1위였다. 이어 마이크로소프트 애저(24.0%), 구글 클라우드(GCP·19.9%) 순으로 집계됐다. 네이버 클라우드가 20.5%로 구글을 근소하게 앞섰지만 KT(8.2%), NHN(7.0%), 삼성SDS(1.2%) 등 다른 국내 사업자는 모두 한 자릿수 점유율에 그쳤다. 중국 클라우드는 1%도 안되는 미미한 수준에 불과했다. 업계 관계자는 "중국계 클라우드는 중국, 동남아를 중심으로 활동해오며 이제 국내 기업들과 기술력에서 큰 차이를 갖고 있지 않다"며 "여기에 가격 경쟁력은 더 높아 다소 우려스러운 부분이 있긴 하다"고 말했다. 그러면서도 "중국계 클라우드 기업들이 국내 시장에서 영역 확대를 하는데 가장 큰 걸림돌이 되는 것은 보안"이라며 "이 탓에 중국에서 투자를 받거나, 중국 진출을 원하는 기업이 아닌 이상 이들을 선택하려는 기업들은 아직 많지 않을 듯 하다"고 덧붙였다. 이에 중국 기업들은 보안에 대한 우려를 불식시키기 위해 적극 나서고 있다. 특히 알리바바 클라우드는 지난 2023년 12월 국내 데이터센터 인프라에 대해 국내에서 가장 공신력 있는 정보보호 인증인 ISMS(정보보호 관리체계) 인증을 받았다는 점을 강조하기도 했다. 윤 지사장은 "중국 클라우드 업체란 이유로 우리를 향한 확인되지 않은 선입견이 많은 것 같다"며 "고객들이 컴플라이언스 관리 체계를 잘 갖출 수 있도록 보안을 가장 우선 순위에 두고 많은 리소스를 투자해 온 만큼 안전하게 이용할 수 있을 것"이라고 강조했다. 너키 팡 텐센트 클라우드 제너럴 매니저 역시 "우리는 고객 데이터를 최고 수준의 보안으로 보호하고 개인정보 보호와 데이터 보안을 최우선으로 삼고 있다"며 "암호화 도구, 접근 로그, 감사 추적 기능 등을 통해 고객 데이터에 대한 무단 접근을 철저히 제한하고 모든 접근 기록을 투명하게 관리하고 있다"고 설명했다. 일각에선 중국 기업보다 최근 AI 클라우드 서비스 시장에 본격 진출을 선언한 쿠팡이 더 위협적이라고 봤다. 쿠팡은 지난 2일 기존 AI 클라우드 컴퓨팅 서비스를 '쿠팡 인텔리전트 클라우드(CIC)'로 리브랜딩하고 본격적인 고객사 확보에 나섰다. 이곳은 그동안 쿠팡 내부 서비스와 외부 연구기관, 스타트업 등에만 클라우드 서비스를 제공해왔다. 그러나 최근 정부가 추진하는 '인공지능(AI) 컴퓨팅 자원 활용 기반 강화 사업(GPU 확보·구축·운용지원)' 사업자 선정에 지원하며 클라우드 서비스 사업자(CSP) 시장에서 존재감을 드러내기 시작했다. 업계 관계자는 "약 1조5천억원이 투입되는 정부 사업에 네이버, 카카오, NHN 등 국내 주요 CSP 기업들이 신청서를 낸 상황에서 대규모 CSP를 운영한 경험이 없는 쿠팡이 약점을 극복하기 위한 일환으로 리브랜딩 작업을 벌인 듯 하다"며 "중국 클라우드 기업보다 대규모 자금력을 앞세운 쿠팡의 움직임이 더 위협적"이라고 말했다. 다만 쿠팡 지주사가 미국이란 점에서 쿠팡 CIC가 외국계인지, 국내 기업인지에 대한 국적 논란은 다소 있는 상태다. 현재로선 쿠팡이 CSAP(클라우드 보안 인증 프로그램) 등급을 신청하지 않아, 이를 관장하는 과학기술정보통신부 산하 한국인터넷진흥원(KISA)도 국적에 대해 판단을 하지 못하고 있다. 국내서 사업을 펼치고 있는 쿠팡은 미국 본사인 쿠팡 Inc.가 지분 100%를 보유한 한국 법인으로, 지배구조상 미국 기업으로 분류될 수 있다. 만약 정부가 쿠팡을 미국 본사 소속이라고 판단하면 AWS, MS, 구글 클라우드 처럼 외산 CSP로 분류돼 공공 클라우드 시장 진입이 다소 제한될 수 있다. 하지만 국내 업체로 분류되면 상황이 다르다. 현재 상·중 등급에 해당하는 민감정보가 포함된 공공 클라우드 전환 사업의 경우 KT, NHN, 네이버, 카카오 등 토종 클라우드 업체들이 맡고 있다. 업계 관계자는 "쿠팡은 10년 전부터 자금력을 동원해 6개월여 만에 컨테이너 등 클라우드 네이티브 핵심 기술을 빠르게 도입했던 저력이 있다"며 "최근 쿠팡이 AI 클라우드 사업 강화를 위해 파격적인 연봉을 제시하며 인재를 끌어 들이고 있다는 점에서 국내 업체들이 위기감을 상당히 느낀 것으로 안다"고 밝혔다. 이에 맞서 토종 업체들은 멀티 클라우드 전략을 강화하는 동시에 글로벌 CSP에 준하는 기술력을 확보하며 대응에 나선다는 방침이다. 한 업체 관계자는 "글로벌 기업들과의 협업 및 기술 내재화를 통해 기술력을 끌어올려 서비스 고도화로 연결해 나갈 것"이라며 "GPU 확보 및 그간 쌓아온 AI 데이터센터 운영 경험을 발휘해 공공 및 AI 인프라 시장에 역량을 집중함으로써 국내에서 화두로 떠오른 AI 클라우드 시장에서 경쟁력을 이어나갈 것"이라고 강조했다.

2025.07.14 17:21장유미

[유미's 픽] "수량보다 성능"…쿠팡 뛰어든 정부 GPU 사업 심사 앞두고 기싸움 '치열'

올해 안에 국내 도입하는 첨단 그래픽처리장치(GPU) 1만 장을 구동할 클라우드 사업자 선정을 두고 정부 심사가 임박한 가운데 도전장을 던진 각 업체들의 견제가 과열 되고 있다. 1조4천500억원가량 투입되는 대규모 사업인 탓에 정부가 외부 전문가를 끌어 들여 공정한 심사에 나설 것이라고 예고한 만큼, 이번 일로 각 기업별 자금력과 GPU 구축·운영 역량이 여실히 드러날 것으로 예상된다. 1일 업계에 따르면 과학기술정보통신부는 조만간 외부 전문가 심사위원 구성을 마무리하고 이르면 이번 주, 늦어도 다음 주 초께 '인공지능(AI) 컴퓨팅 자원 활용 기반 강화 사업(GPU 확보·구축·운용지원)'에 지원한 4개 업체에 대한 심사를 진행한다. 지난 달 23일 마감된 사업자 공모에는 네이버클라우드와 NHN클라우드, 카카오엔터프라이즈, 쿠팡 등 4개 기업이 신청서(사업계획서)를 제출했다. 이 사업은 첨단 GPU 인프라를 신속 제공하기 위해 기획된 것으로, 정부가 추경으로 확보한 1조4천590억원 가량을 투입한다. 사업자로 선정된 곳은 GPU 1만 장을 구매해 이를 필요로 하는 기업·연구자 등에 서비스를 지원하게 된다. 과기정통부는 각 업체가 제출한 사업계획서에 대한 평가를 통해 이달 중 1개 또는 복수 사업자를 선정할 예정이다. 이번 심사에선 최신 GPU를 얼마나 확보해 전력 효율성을 높여 빠른 시일 내 운영할 수 있느냐가 중요 판단 기준이 될 예정으로, 사업자들의 수익성과 직결되는 GPU의 자체 활용 비중도 심사에 상당한 영향을 줄 것으로 평가됐다. 과기정통부 관계자는 "GPU 수량이 많다고 해서 성능이 좋다고 볼 수 없어 이것만 판단 기준으로 삼기에는 애매하다"며 "GPU를 잘 묶어 활용할 수 있는 역량이 있는 지가 중요한 만큼, 외부 전문가로 이뤄진 심사위원들이 이를 잘 평가할 것"이라고 말했다. 업계 관계자는 "NIPA, 과기정통부가 최소 기준으로 제안한 것은 256노드로, GPU 서버 256대를 하나의 클러스터에 구성한다는 의미"라며 "만약 기업들이 512노드 등으로 더 규모를 크게 키워 제시한다면, 이는 기술력을 입증하는 것으로 사업자로 선정되는데 유리할 수 있다"고 밝혔다. 현재 각 기업들이 제출한 GPU 확보 계획에선 네이버클라우드가 1만4천 장 규모로 가장 많이 제시했다. 그러나 GPU 구성은 엔비디아 HGX H200과 DGX B200을 혼합한 형태로, 발열이 많은 B200 운영 방안을 공랭식 냉각 방식으로 제안한 것으로 알려졌다. OEM 서버인 HGX는 엔비디아 공식 서버 제품인 DGX 대비 가격이 저렴한 데다 엔비디아의 기술 지원을 받지 못한다는 점에서 다소 아쉬운 요소로 지목된다. 반면 다른 기업들은 대부분 H200보다 성능이 더 앞선 DGX B200으로 제안한 상태로, 전력 낭비를 줄이기 위해 수랭식 도입을 경쟁 요소로 내세운 것으로 전해졌다. 수랭식 냉각은 공랭식에 비해 전기료를 10% 이상 절감할 수 있는 것으로 추산됐다. 업계 관계자는 "만약 A업체가 1조4천억원을 GPU 구입 비용으로 제안했지만, B업체가 2천억원의 GPU 구입 비용으로 좀 더 높은 페타플롭스(PF·1초당 1천조 번 연산 능력)를 제안한다면 심사에서 이를 더 높게 평가할 것"이라며 "GPU 수량을 심사 판단 근거로 삼지 않고, 높은 성능의 GPU를 얼마나 효율적으로 운용할지를 두고 정부에서도 판단할 것"이라고 밝혔다. 최신 GPU를 중심으로 대규모 클러스터링이 가능한 데이터센터 상면 공간도 충분한 지도 중요 기준으로 꼽힌다. 이에 네이버클라우드는 올 초부터 LG CNS 죽전 데이터센터, LG유플러스 가산 데이터센터 등 외부 데이터센터 임차를 진행 중이다. NHN클라우드는 영국계 사모펀드 액티스의 영등포 데이터센터와 LG CNS 일산 데이터센터 상면 일부를 가계약해 제안한 것으로 알려졌다. 쿠팡은 싱가포르 데이터센터 기업 엠피리온디지털이 소유한 서울 양재동 데이터센터 임차 계약을 추진 중이며, 카카오엔터프라이즈는 카카오 안산 데이터센터를 활용할 것으로 예상된다. 업계 관계자는 "이번 사업 기준에 충족하려면 수십 메가와트(MW) 규모의 데이터센터 상면 공간을 확보해야 하는데, 국내에선 쉽지 않은 상황"이라며 "KT클라우드가 이번 사업에 참여하지 않은 것도 이 때문인 것으로 안다"고 말했다. 이어 "비용은 민간 사업자가 먼저 집행한 후 정부에 지출 증빙해야 보전 받을 수 있는 구조여서 연내 대규모 자금을 즉시 가용할 수 있는 능력이 있는지도 선정 기준에서 고려될 사항"이라며 "이 비용을 보전하기 위해 GPU 자체 활용 비중을 각 기업이 얼마나 제시할 지도 등락을 좌우할 것"이라고 덧붙였다. 일각에선 기존 CSP가 아닌 쿠팡이 이번에 다크호스로 급부상할 지 주목하고 있다. 쿠팡이 서울 등에서 자사 및 협력사, 일부 대학 물량만 운영해봤기 때문에 실력이 검증되지 않았다는 지적이 있지만, 대규모 자금력을 바탕으로 최신 GPU를 공급할 것이라고 내세운 점이 매력 요소가 될 수도 있어서다. 다만 장애가 났을 때 빠른 복구가 가능한 경험과 역량을 갖췄는지에 대한 의구심과 기술력이 대외적으로 입증되지 않았다는 점에서 사업자로 선정되기 힘들 수 있다는 전망도 나온다. 업계 관계자는 "쿠팡이 GPU 구축·운영 사업보다 조만간 재공고 될 국가 AI 컴퓨팅 센터를 노리고 레퍼런스를 쌓기 위해 나온 것이란 얘기들이 많다"며 "이를 위해 당초 기준이 CSP로 국한돼 카카오엔터프라이즈와 함께 GPU 구축·운영 사업에 참여하려고 했지만, 지난 달 요건이 '국내에 주 사업장을 두고 GPUaaS 사업을 영위 중인 사업자'라고 변경되면서 쿠팡도 기준에 부합해 두 기업이 따로 나온 것으로 안다"고 설명했다. 업계에선 네이버 전체 IT 인프라를 운영하며 고정 수익으로 자금 안정성을 갖추고 있는 네이버클라우드나 NHN클라우드를 유력 후보로 주목 하고 있다. NHN클라우드는 전량 최신 GPU(B200)를 공급 기한인 내년 1분기께 구축한다는 계획을 내세우고 있다. 또 지난해 준공이 완료된 데이터센터 상면을 확보하고 있다는 점도 유리한 요소로 꼽힌다. 업계 관계자는 "GPU 수량보다 평가 지표인 투입 가격 대비 연산 성능을 심사 기준에서 가장 중요하게 생각해야 할 것"이라며 "이 점을 고려하면 심사 위원들이 최신 GPU를 100% 구축하는 업체가 가장 우수한 제안을 한다고 여길 수 있다"고 예측했다. 또 다른 관계자는 "정부 자금이 투입되는 이번 사업을 기점으로 그간 투자나 글로벌 진출에 소극적인 태도를 갖고 있던 기업들이 각성하는 기회가 되길 바란다"며 "우리나라 CSP들도 쿠팡이 등장했다고 해서 견제만 할 것이 아니라 위기감을 가지고 아마존웹서비스(AWS), 마이크로소프트(MS), 구글처럼 국내외 시장을 활성화하기 위해 노력하고 체력을 키우는 모습을 좀 더 보였으면 좋겠다"고 일침했다.

2025.07.01 12:35장유미

[유미's 픽] 이재명까지 지원 사격…韓 투자 속도 높이는 해외 CSP, 토종기업 설 자리 잃나

최근 아마존웹서비스(AWS)·마이크로소프트(MS)·구글 등 미국 빅테크에 이어 알리바바 클라우드 등 중국 기업까지 국내 클라우드 시장 공략에 적극 나서면서 토종 기업들의 설자리가 점차 좁아지고 있다. 기술력과 가격 경쟁력을 앞세워 외국 기업들이 민간 영역을 장악한 데 이어 공공 시장까지 침투하고 있는 만큼, 국내 기업들도 대응책 마련에 고심하는 분위기다. 19일 업계에 따르면 글로벌 클라우드 서비스 제공 기업(CSP) 1위인 AWS는 SK그룹과 손잡고 울산 미포 국가산업단지 부지에 초대형 인공지능(AI) 데이터센터를 구축한다. 그래픽처리장치(GPU) 6만 장이 투입되는 국내 최대 규모의 AI 전용 데이터센터로, 양사는 오는 20일 울산에서 출범식을 개최할 예정이다. 이번 투자 소식은 지난 13일 이재명 대통령과 5대 그룹 총수 간담회 이후 발표된 첫 대규모 국내 투자 소식이란 점에서 더 주목받고 있다. 이 대통령은 'AI 100조 투자'를 그간 공약으로 내세웠던 만큼, 이번 SK-AWS AI 데이터센터 출범식에 직접 참석해 AI 전략에 대한 명확한 메시지를 전할 것으로 알려졌다. AWS와 SK그룹은 울산 AI 데이터센터를 향후 1GW(기가와트) 규모로 확장해 동북아시아 최대 AI 데이터센터 허브로 만들겠다는 청사진을 그리고 있다. 이를 위해 SK그룹은 AI 데이터센터 사업을 맡고 있는 SK텔레콤과 SK브로드밴드를 통해 2028년까지 AI에 3조4천억원을 투자할 계획이다. AWS는 40억 달러(약 5조4천712억원)를 투자키로 한 것으로 알려졌다. AWS는 현재 서울에 데이터센터를 보유하고 있고, 인천 서구에도 수조원을 투자해 지난해 말부터 데이터센터를 짓고 있다. 마이크로소프트(MS)는 KT와 손잡고 국내 시장 공략에 속도를 높이고 있다. 양사는 5년간 2조4천억원을 공동 투자해 AI 분야에서 협업키로 협약을 체결한 데 이어 한국형 AI 모델과 시큐어 퍼블릭 클라우드(SPC)를 공동 개발해 올해 2분기께 국내서 출시할 것이란 계획을 공개하기도 했다. 중국 기업인 알리바바 클라우드도 내년에 한국 진출 10주년을 앞두고 이달부터 서울에서 제2 데이터센터 가동을 시작했다. 중국 시장을 겨냥한 국내 기업들의 수요가 높다고 보고 이들을 공략하기 위해 좀 더 공격적인 투자 움직임에 나선 것이다. 제2 데이터센터는 앞서 알리바바 그룹이 향후 3년간 AI·클라우드 인프라에 최소 약 76조원(3천800억 위안)을 투자한다고 밝힌 구상의 일환이다. 알리바바 그룹은 지난 2016년 한국에 사무소를 설립한 후 2022년 3월 국내에 첫 데이터센터를 구축하며 CSP 시장 경쟁에 뛰어 들었다. 다만 중국계 기업들이 한국 데이터를 외부로 반출한다는 우려가 많이 제기되면서 미국 기업들에 비해 존재감은 그간 크게 드러내지 못했다. 실제 과학기술정보통신부가 지난해 발표한 '2023년 부가통신사업 실태조사'에 따르면 국내 부가통신사업자(복수응답 가능) 중 60.2%는 AWS 클라우드를 사용했다. 2위인 MS 애저와 3위인 네이버 클라우드 사용률은 각각 24%, 20.5%로 집계됐다. 그 뒤는 구글 클라우드 플랫폼(19.9%), KT클라우드(8.2%)·오라클(8.2%), NHN클라우드(7.0%) 등이 이었다. 알리바바 클라우드는 의미 있는 점유율을 기록하지 못해 순위에 포함되지 못했다. 이에 알리바바 클라우드는 다수 보안 인증을 획득했다는 점을 앞세워 우려를 불식시키는 데 적극 나섰다. 임종진 알리바바 클라우드 인텔리전스 수석 솔루션 아키텍트는 "중국의 데이터 보호법에 대해 구체적으로 말하긴 어렵지만, 글로벌 컴플라이언스 기준 150개 이상을 만족시키고 있다"며 "잠재 고객도 안전하게 운영할 수 있을 것이라고 자신 있게 말할 수 있다"고 강조했다. 그러면서 "2023년 12월 획득한 국내 정보보호 관리체계 인증(ISMS) 정책에도 한국 데이터를 외부로 반출하지 않는다는 게 필수"라며 "한국 데이터는 해외로 유출되지 않는다"고 덧붙였다. 이 같은 상황 속에 글로벌 클라우드 서비스 기업(CSP)들은 최근 클라우드 보안인증(CSAP) '하' 등급을 취득하며 공공 클라우드 시장 진출에 속속 진입하기 시작해 토종 업체들의 입지를 더욱 좁히고 있다. 현재 이 시장은 NHN클라우드, 네이버클라우드, KT클라우드 등 세 회사가 80% 이상 과점하고 있는 상태로, 규모는 1조4천억원(2023년 기준) 수준이다. 과학기술정보통신부 산하 한국인터넷진흥원(KISA)이 관장하는 CSAP는 정부·공공 기관에 민간 클라우드 서비스를 공급하기 위해 획득해야 하는 인증이다. 공공 대상 서비스인 만큼 당초 엄격한 물리적 망분리 요건이 있었지만, 2023년 정부가 CSAP를 상·중·하 등급제로 개편하면서 하등급에 한해서는 논리적 망분리가 허용됐다. 이를 토대로 최근 AWS·마이크로소프트·구글 등 미국 대표 CSP 모두가 최근 '하' 등급 인증을 획득해 공공시장 진입을 노리고 있다. CSAP '하' 등급은 개인정보가 없는 공개 데이터를 운영하는 공공 시스템을 대상으로 하지만 '중' 등급의 경우 민감 데이터와 비공개 업무자료까지 포함하는 시스템을 다룬다. 다만 알리바바 클라우드는 CSAP 문턱을 아직 넘지 못했다. 윤용준 알리바바 클라우드 인텔리전스 한국 총괄 지사장은 "CSAP 등급과 (공공 분야 진출 계획과) 관련해선 아직 공유할 상황이 아니다"고 밝혔다. 또 그는 "이번 제2 데이터센터 출범은 한국 시장에 대한 우리의 지속적인 투자 의지와 국내 기업의 AI 전환을 꾸준히 지원하기 위한 것"이라며 "국내에서 제품 및 서비스를 더욱 다각화하려는 우리의 노력에 있어 중요한 이정표가 될 전망"이라고 덧붙였다. 이처럼 외국 CSP 기업들이 투자 속도를 높이며 국내 시장에서 사업 영역 확대에 적극 나서자 토종 CSP들의 시름도 점차 깊어지고 있다. 경쟁사들이 늘어나면서 가격 경쟁이 심화될 뿐 아니라 이에 따른 기술 경쟁력도 자연스럽게 약화되면서 국내 CSP들이 자칫 해외 기업 협력사로 전락하는 것 아니냐는 우려의 목소리도 나오고 있다. 이미 7조4천억원 수준인 국내 민간 클라우드 시장에선 AWS, MS 애저, 구글이 점유율 80%를 차지하고 있는 상황이다. 업계 관계자는 "알리바바 클라우드 같은 중국에 거점을 둔 글로벌 기업의 진출은 가격 경쟁력이 높아 국내 기업으로선 굉장한 챌린지가 될 것으로 예상된다"며 "가격 경쟁이 심화되면 자연스레 국내 시장을 기반으로 하는 국내 기업들은 기술 개발이 어려워지는 악순환의 고리가 만들어질 가능성이 높다"고 밝혔다. 일각에선 데이터 주권과 규제 역차별, 불공정 경쟁 유발 문제 등이 우려된다고 짚었다. 글로벌 기업들이 국내 규제 밖에 있는 경우가 많은 만큼 데이터 레지던시를 제대로 지키지 않을 가능성이 크기 때문이다. 데이터 레지던시는 개인정보, 금융정보, 기업 데이터 등 민감한 정보를 특정 국가 안에서 저장·처리해야 한다는 것을 의미한다. 업계 관계자는 "국내 사업자의 데이터센터는 다양한 관련 법 규제로 인해 충분히 감시와 점검을 받고 있지만, 해외 기업은 본사가 국외에 있다는 점을 들어 여러 경로로 규제, 법률 등에 불응하는 경우가 많다"며 "이는 데이터 주권을 넘어 기술 주권에 대한 묵시적 부동의로 비춰질 수 있다"고 분석했다. 이어 "규모의 경제를 달성한 글로벌 기업들은 교묘한 방식으로 복합 상품, 해외 상품 연계 등 국내 사업자들이 제공하기 어려운 조건들로 생태계와 시장을 교란하고 있다"며 "현 분위기에선 신자유주의적 시장 논리로는 국내 기술 및 시장을 지키지 못하고 의존성을 높이는 계기가 되지 않을까 우려된다"고 짚었다. 그러면서 "국내 기업들은 온프레미스-클라우드, 해외 기업-국내 기업 등 하이브리드 및 멀티 클라우드 전략을 더 활성화 하는 방식으로 대응력을 키워야 할 것"이라며 "국내 기업 중심으로 연합하려는 움직임도 필요해 보인다"고 덧붙였다.

2025.06.19 16:14장유미

[유미's 픽] "엔비디아 H100 특별 할인"...삼성SDS가 광고 나선 이유는

"구독형 그래픽처리장치(GPUaaS) 고민, 삼성SDS가 모두 해결해드립니다." 삼성SDS는 지난 7일 고객사들을 대상으로 '엔비디아 H100 특별 할인'이라는 제목으로 광고 메일을 발송했다. 해당 메일에는 삼성SDS GPUaaS가 좋은 이유 3가지와 함께 ▲최초 사용 후 6개월 간 특별 할인 혜택 제공 ▲최적의 상품 구성 및 견적 제안 등 프로모션 정보가 함께 기재돼 눈길을 끌었다. 삼성SDS가 이처럼 GPUaaS 프로모션 안내 메일을 발송한 것은 최근 관련 시장이 빠르게 성장하며 경쟁이 치열해졌기 때문이다. 인공지능(AI) 기술 개발에 필수인 엔비디아의 그래픽처리장치(GPU)가 고가인 탓에 부담을 느낀 기업들이 자체 구축을 하지 않고 빌려 쓰는 것으로 방향을 틀면서 수요도 폭발적으로 증가하는 분위기다. 9일 시장조사기관 포춘 비즈니스 인사이트에 따르면 글로벌 GPUaaS 시장 규모는 2023년 32억3천만 달러(약 4조7천억원), 지난해 43억1천만 달러(약 5조7천400억원)에서 매년 35.8%씩 성장해 2032년에 498억4천만 달러(약 72조936억원) 규모로 성장할 전망이다. GPUaaS는 AI 인프라를 갖춘 기업들이 클라우드를 통해 가상 환경에서 GPU를 사용자의 주문에 맞춰 할당하고 빌려주는 서비스다. 저렴한 가격으로 인터넷 연결을 통해 필요한 만큼 고성능 GPU에 접근이 가능하다는 점에서 비용 부담을 줄이려는 중견·중소기업들에게 대안으로 떠오르고 있다. 업계 관계자는 "GPUaaS는 AI 모델 학습과 추론 과정에서 GPU를 필요한 시간에만 사용할 수 있어서 기업들이 GPU를 구매하거나 고정적으로 할당받아야 하는 비용 부담을 크게 줄일 수 있다는 것이 장점"이라며 "필요할 때만 유연하게 사용할 수 있도록 해 GPUaaS를 제공하는 기업들은 AI 스타트업 등 타겟 고객들에게 AI 개발의 경제성과 효율성을 부여할 수 있다"고 설명했다. 현재 국내에서 GPUaaS 사업을 전개하는 곳은 아직까지 많지 않다. 최신 GPU를 확보한 데이터센터를 구축하고 있어야 가능한 사업인 만큼, 투자 비용이 많이 들어서다. 업계 관계자는 "GPUaaS 사업은 일종의 AI 인프라 사업으로, 시설이 갖춰져야 서비스를 만들어 운영할 수 있는 것"이라며 "초반에 엄청 투자해놓고 장기적으로 고객을 확보해 수익을 쌓아가는 장치성 산업인 만큼 일반 IT 서비스 기업들이 접근하기는 쉽지 않다"고 말했다. 이에 국내에선 데이터센터를 갖추고 있는 일부 클라우드 기업들과 AI 사업에 투자 속도를 높이고 있는 통신사들을 중심으로 GPUaaS 시장 경쟁에 불을 지피고 있다. 국내에서 서울 상암·수원·구미·춘천·동탄 등 5곳에 데이터센터를 운영 중인 삼성SDS는 지난해부터 GPUaaS 사업을 시작해 생성형 AI를 활용하고자 하는 행정·공공기관에 최적화된 클라우드 서비스를 제공하고 있다. 이곳은 삼성 클라우드 플랫폼(SCP)을 기반으로 GPUaaS 사업을 펼치고 있는 상태로, 엔비디아 호퍼 아키텍처 기반 GPU인 'H100'을 약 1천 장가량 확보하고 있는 것으로 알려졌다. 공식적으로 'H100' 약 1천 장을 확보했다고 밝힌 NHN클라우드도 지난해 오픈한 광주 AI 데이터센터를 기반으로 GPUaaS 사업 확대에 나섰다. 광주 AI데이터센터는 연산량 기준 88.5PF(페타플롭스), 저장 용량 107PB(페타바이트) 등 최고사양 GPU 인프라를 갖춘 AI 데이터센터다. NHN클라우드 측은 정부의 AI 투자 확대 기조 움직임에 따라 광주 AI 데이터센터의 활용도가 더욱 높아질 것으로 예상하고 있다. 업계에선 향후 수년간 시장에 공급 가능한 'PPP 형태'의 AI 데이터센터로서 공공부문 AI 대전환을 위한 정부향 GPU 공급 시 대응에 가장 적합하다는 평가를 내놓기도 했다. NHN클라우드 관계자는 "이에 기반해 올해부터 광주 AICA(인공지능산업융합사업단)와의 GPU 공급 계약 매출 인식을 본격화하고 오는 2029년까지 안정적 매출로 이어갈 계획"이라며 "광주 AI 데이터센터를 기반으로 AI 강국 도약을 위한 '마중물' 역할을 수행할 것"이라고 포부를 밝혔다. KT클라우드는 양보다 질로 승부하는 전략을 택했다. 'H100'을 앞세운 경쟁사들과 달리 연산 처리 능력과 전력 효율성이 더 개선된 엔비디아 호퍼 아키텍처 기반의 'H200'을 AI 인프라에 적용하며 GPUaaS 사업 경쟁력을 끌어올렸다. KT클라우드는 GPU뿐만 아니라 신경망 처리 장치(NPU) 기반 AI 인프라도 확장하고 있다. 리벨리온과 협력해 'AI 서브 NPU' 서비스를 운영 중이며 오는 5월 출시될 리벨리온의 '아톰 맥스'를 적용해 소형언어모델(sLM) 성능을 검증할 계획이다. 또 미국 반도체 설계업체 암페어와도 AI 반도체 협력을 논의하며 기술 역량을 강화하고 있다. KT클라우드 관계자는 "현재 AI 인프라가 필요한 국내 다수의 공공기관과 AI 스타트업을 대상으로 사용량 기반의 탄력적인 GPU 자원 이용이 가능한 GPUaaS를 제공 중"이라며 "앞으로 AI 인프라뿐만 아니라 AI운영(AIOps) 등 포트폴리오를 확대해 AI 기술 경쟁력을 강화하고 고객의 다양한 니즈에 대응해 나가겠다"고 밝혔다. 카카오클라우드도 올해 전사 매출을 견인할 핵심 사업으로 GPUaaS를 점찍고 관련 기술 고도화 및 가격 경쟁력 확보에 나섰다. 이곳은 현재 엔비디아 A100, V100, T4 등 다양한 고성능 GPU 인스턴스를 지원하고 있는 상태로, 엔지니어링 최적화를 통해 GPU의 성능을 극대화했다는 점을 차별화 포인트로 내세우고 있다. 특히 가상머신(VM)과 GPU를 같은 가상 네트워크 환경에 위치시켜 데이터 전송 속도를 기존 대비 50배 더 높였다. 여러 개의 GPU를 연결한 'GPU 클러스터'의 데이터 전송 속도를 높이기 위해 설계된 네트워크 기술인 전용 인피니밴드 구성으로 최대 4배 확장된 대역폭과 저지연 환경도 지원 중이다. 카카오엔터프라이즈는 올해 AI, 금융, 모빌리티 등 분야의 다양한 고객사례 확보를 지속하며 AI 모델 개발 및 학습, 서비스 제공을 위한 핵심 인프라로 GPUaaS 사업 가속화할 계획이다. 또 LG CNS, 베스핀글로벌 등 대형 클라우드 관리(MSP) 업체들과의 전략적 파트너십을 강화해 중소·중견기업(SMB) 및 스타트업 지원, 지역 거점 중심 공공 클라우드 확산 등에 집중할 방침이다. 네이버클라우드는 지난해 데이터 관리 업체 데이터얼라이언스와 손잡고 GPUaaS 사업을 진행 중이다. 데이터얼라이언스가 선보인 GPU 공유 플랫폼인 '지큐브'를 통해 유휴 GPU를 공급하는 식이다. 통신사 중에선 SK텔레콤이 가장 적극적이다. 지난해부터 GPUaaS 사업에 뛰어든 이곳은 자회사 SK브로드밴드의 가산 데이터센터에 GPU를 탑재한 후 'SKT GPUaaS'를 출시하며 고객 확보에 집중하고 있다. 이를 위해 엔비디아로부터 GPU를 직접 공급받는 GPU 구독 서비스 기업 람다와 협력 체계를 구축한 상태로, 3년 안에 최소 1천 대 이상의 GPU를 확보한다는 계획이다. 현재 엔비디아 'H100'을 배치했으며 'H200'도 올해 1분기 안에 도입할 예정이다. 업계 관계자는 "GPUaaS 공급 기업들은 기존에 제공하고 있던 구독형 인프라 서비스(IaaS)에 GPU를 추가한 형태로 보다 더 높은 부가가치를 창출할 수 있다는 점에서 해당 사업에 매력을 느끼고 있다"며 "AI 기업들은 고성능 컴퓨팅 자원이 필요하지만 자체적으로 해결하기에 비용 부담이 크다는 점에서 GPUaaS에 많은 관심을 보이고 있다"고 밝혔다. 이어 "GPUaaS 공급 기업들은 사업 경쟁력을 높이고자 최신 GPU 확보를 위해 점차 글로벌 기업들과의 협업에도 적극 나서는 분위기"라고 덧붙였다.

2025.03.09 08:59장유미

HPE, 100% 팬리스 직접 수냉 시스템 아키텍처 공개…"AI 효율성 극대화"

HPE가 대규모 인공지능(AI) 활용시 데이터센터의 에너지 및 비용 효율성을 극대화할 수 있는 수냉 시스템 아키텍처를 발표했다. HPE는 'AI 데이(AI Day)' 행사에서 100% 팬리스 직접 수냉 방식 시스템 아키텍처를 공개했다고 29일 밝혔다. 100% 팬리스 직접 수냉 방식(Fanless DLC) 아키텍처는 하이브리드 직접 수냉 방식만을 사용할 때보다 서버 블레이드당 냉각 전력 소비를 37% 절감하는 특별한 이점을 제공한다. 이를 통해 전력 비용, 탄소 배출량, 데이터센터의 팬 소음을 줄일 수 있으며, 해당 아키텍처를 사용하는 시스템은 서버 캐비닛의 집적도를 높여, 바닥 면적을 절반으로 줄일 수 있다. HPE의 노하우로 설계된 100% 팬리스 DLC 아키텍처는 이미 대규모 생성형 AI를 구축하는 조직들이 누리고 있는 비용 및 에너지 효율성의 이점을 더 많은 조직들이 누릴 수 있도록 지원한다. 안토니오 네리 HPE 회장 겸 CEO는 “조직들이 생성형 AI의 가능성을 받아들이는 동시에, 지속가능성 목표를 달성하고, 증가하는 전력 수요에 대응하며 운영 비용을 절감해야 한다"며 " 공개한 아키텍처는 오로지 수냉 방식을 적용해, 시중의 대체 솔루션보다 에너지 및 비용 절감 측면에서 큰 이점을 제공한다. 실제로, 해당 DLC 아키텍처는 기존 공랭식 시스템에 비해 냉각 전력 소비를 90%까지 절감할 수 있다"고 설명했다. 한편 AI 데이 행사에서 안토니오 네리 HPE 회장 겸 CEO, 피델마 루소 HPE 하이브리드 클라우드 부사장 겸 총괄 매니저 및 CTO, 그리고 닐 맥도날드 HPE 서버 사업부 부사장 겸 총괄 매니저는 HPE의 포트폴리오가 네트워킹, 하이브리드 클라우드 및 AI의 비전을 실현하는 데 필요한 핵심 요소들을 어떻게 제공하는지에 대해 논의했다.

2024.10.29 17:36남혁우

[기고] 액체 냉각, AI를 위한 최적의 냉각 방식

인공지능(AI)은 현재 가장 많은 컴퓨팅 자원을 소모하는 워크로드 중 하나로, 사용량 증가에 따라 AI 시스템의 전력 소비와 에너지 비용이 급격히 증가하고 있다. 국제에너지기구(IEA)에 따르면 전 세계 데이터센터는 2022년에 전체 전력의 2%를 사용했으며 2026년까지 이 비율이 두 배 이상 증가할 것으로 예측된다. 차세대 가속기에서 효율성이 개선됐지만, AI 도입이 늘어나면서 전력 소비는 더욱 증가할 예정이다. 현재의 데이터센터들은 증가하는 프로세서 전력을 지원하기 위한 냉각 수요를 맞추지 못하고 있다. 이에 따라 이 시설들은 AI 워크로드를 보다 효율적으로 운영해야 한다. 그러한 가운데 이러한 문제를 해결하기 위한 액체 냉각이 필수적인 기술로 떠오르고 있다. HPE는 수십 년간의 혁신을 통해 컴퓨팅 집약적인 고성능 컴퓨팅(HPC) 워크로드를 실행하는 대규모 시스템을 효율적으로 냉각하는 액체 냉각 시스템을 전 세계적으로 제공해 왔다. 냉각팬을 사용하는 전통적인 공기 냉각 방식과 달리, 직접 액체 냉각(DLC)은 냉각제를 서버에 직접 주입하여 프로세서에서 발생하는 열을 흡수한 후 이를 데이터센터 외부의 열교환 시스템으로 전달한다. 최신 가속기를 사용하는 미래의 AI 인프라는 전력효율성, 지속가능성 및 AI 워크로드의 안정성을 유지하기 위한 시스템 복원력 문제를 해결하기 위해 이러한 액체 냉각 혁신이 필요할 것이다. AI 데이터센터에서 액체 냉각이 왜 이상적인 솔루션인지, 그 네 가지 주요 이유를 살펴보자. 더 작은 공간에 더 높은 성능을 담도록 설계된 새로운 칩들의 경우, 모든 중요한 구성 요소를 효과적으로 냉각하기 어려울 수 있다. 칩을 충분히 빠르게 냉각하지 못하면 데이터센터는 과열 문제에 직면하게 되고, 이로 인해 시스템 장애 및 AI 작업의 예기치 않은 중단이 발생할 수 있다. 물은 공기보다 열용량이 세 배 더 높기 때문에 액체 냉각을 이용하면 칩을 더 빠르고 효율적으로 냉각할 수 있다. 이를 통해 가속기와 CPU, 메모리 및 네트워킹 스위치와 같은 다른 구성 요소에서 발생하는 열을 더 효과적으로 흡수할 수 있다. 차세대 가속기의 효율적인 냉각 방식은 시스템의 안정성을 확보하는 데에도 필수적이지만, 환경을 위한 지속가능성의 측면에서도 더욱 중요해지고 있다. 액체 냉각은 차세대 가속기에 대해 뛰어난 지속가능성 및 비용 절감 효과를 제공한다. 1만개의 서버를 갖춘 HPC 데이터센터를 예로 들면 모든 서버가 공기 냉각 방식을 사용할 경우 8천700톤 이상의 이산화탄소(CO2)를 배출한다. 반면 액체 냉각 서버를 사용할 경우 CO2는 1천200톤으로 줄어든다. 이는 에너지 소비를 87% 절감하고 매년 약 1천780만 파운드의 CO2 배출을 막는 효과를 가져온다. 이러한 대규모 전력 절감은 비용 절감 효과로도 이어진다. 1만 개의 액체 냉각 서버를 가진 데이터센터는 서버당 연간 45.99달러(약 6만2천원)의 비용이 들지만, 공기 냉각 서버는 서버당 연간 254.70달러(약 34만2천원)의 비용이 든다. 이를 비교하면 운영 비용에서 연간 약 210만 달러(약 28억1천300만원)를 절감할 수 있다는 것을 알 수 있다. 액체 냉각 시스템은 열을 포착한 후 열을 데이터센터 외부의 열교환 시스템으로 전달한다. 이때 가열된 물은 다른 건물이나 시설에 에너지원으로 재활용할 수 있다. 세계적인 재생 에너지 중심지 중 하나인 미국 에너지부의 국립재생에너지연구소(NREL)는 수년 동안 이 방법을 성공적으로 활용해 왔다. HPE 크레이 액체 냉각 슈퍼컴퓨터인 페레그린 시스템의 경우 열을 포착해 가열된 물의 90%를 자원으로 재활용해 에너지시스템통합시설(ESIF) 사무실 및 실험실 공간의 주요 열원으로 사용했다. 데이터센터에서 미래의 AI 인프라 도입을 계획할 때 밀도는 중요한 요소로 작용한다. 이는 고성능 AI 솔루션을 위한 공간을 확보하는 데 큰 영향을 미치기 때문이다. 액체 냉각은 공기 냉각에서 요구되는 팬 및 이에 따른 장비들이 필요 없기 때문에 데이터센터에서 서버 랙을 더 적고 밀집되게 배치해 공간을 최대한 활용하거나 필요에 따라 확장할 수 있다. 예를 들어 1만 개의 서버를 갖춘 데이터센터에서 액체 냉각 서버를 사용한다면 필요한 공간을 77.5% 줄일 수 있다. 또 5년 동안 액체 냉각 솔루션은 섀시 전력을 14.9% 덜 사용하며 공기 냉각 솔루션에 비해 kW당 성능이 20.7% 더 높다. HPE는 50년 이상의 경험과 300개 이상의 액체 냉각 관련 특허를 보유하고 있다. 지난 2년 동안 세계에서 가장 빠른 10대 시스템 중 4대를 공급했다. 이는 HPE 크레이 EX 액체 냉각 슈퍼컴퓨터다. 이 중 하나인 프론티어는 미국 에너지부의 오크리지국립연구소를 위해 구축된 세계 1위 슈퍼컴퓨터로, 엑사스케일 속도 장벽을 돌파하며 수만 개의 가속기를 무결점으로 실행하는 엔지니어링 성과를 달성했다. 이처럼 막대한 성능 규모에도 불구하고 프론티어는 여전히 세계에서 가장 에너지 효율적인 슈퍼컴퓨터로 인정받고 있다. 이처럼 HPE는 컴퓨팅 집약적인 시스템을 구축하고 효율적으로 운영하는 데 필요한 노하우를 갖추고 있다. 오랫동안 AI를 준비해온 HPE는 정교한 냉각 솔루션으로 고객의 AI 여정을 지속적으로 지원할 준비가 돼 있다.

2024.09.20 16:33제이슨 제일러

삼성·SK하이닉스, AI 성장세에 '서버용 SSD' 기술 경쟁 맞불

인공지능(AI) 시장의 급격한 성장에 따라 고대역폭메모리(HBM)에 이어 기업 서버용(엔터프라이즈) 솔리드 스테이트 드라이브(SSD) 경쟁이 치열해지고 있다. 서버용 SSD 수요는 올해를 기점으로 크게 증가하면서 공급부족 현상까지 일어났다. 향후 서버용 SSD 수요가 지속될 것으로 전망됨에 따라 삼성전자와 SK하이닉스는 차세대 낸드플래시와 서버용 SSD를 잇달아 내놓으며 시장 주도권을 확보한다는 목표다. ■ 삼성, QLC 290단 9세대 낸드 양산…SK하이닉스, 238단 4D 낸드 기반 서버용 SSD 개발 삼성전자는 이달 중순 서버용 SSD를 위한 '1Tb(테라비트) QLC(쿼드 레벨 셀) 9세대 V낸드'를 업계 최초로 양산했다. 이는 삼성전자가 지난 4월 290단 'TLC(트리플 레벨 셀) 9세대 V낸드'를 최초 양산한지 4개월 만의 성과다. 삼성 9세대 V낸드는 '채널 홀 에칭' 기술을 활용해 더블 스택 구조로 업계 최고 단수를 구현해냈다는 점에서 주목된다. 낸드플래시는 데이터 저장 단위인 셀을 몇 비트로 저장하는지에 따라 1개 셀에 1비트를 담으면 SLC(싱글레벨셀), 2비트를 담으면 MLC(멀티레벨셀), 3비트를 저장하면 TLC, 4비트는 QLC이다. QLC는 1개의 셀에 더 많은 정보를 저장하는 만큼 같은 면적에서도 더 큰 용량을 지원한다. 삼성 9세대 V낸드는 '디자인드 몰드' 기술로 전작 대비 데이터 보존 성능을 20% 높였고, 이전 세대 제품 대비 쓰기 성능은 100%, 데이터 입출력 속도는 60% 개선됐다. 데이터 읽기, 쓰기 소비 전력도 각각 약 30%, 50% 감소했다. 업계에 따르면 삼성전자는 내년 하반기 430단 10세대 V낸드를 양산하면서 400단대에 진입할 예정이다. SK하이닉스 역시 서버 시장 경쟁력 확보를 위해 낸드 기술 개발에 주력하고 있다. SK하이닉스는 지난해 상반기 238단 TLC 낸드를 양산한데 이어 같은해 8월 '플래시 메모리 서밋(FMS) 2023'에서 세계 최고층 321단 TLC 4D 낸드 샘플을 공개했다. 아울러 SK하이닉스는 이달 중순 238단 4D 낸드 기반의 서버용 SSD 'PEB110 E1.S'(이하 PEB110)'를 개발했다고 밝혔다. 현재 글로벌 데이터센터 고객사와 진행 중인 PEB110 인증이 마무리되면, 내년 2분기부터 제품 양산을 시작해 시장에 공급할 계획이다. PEB110는 PCIe 5세대가 적용돼 데이터 전송 속도를 32GTs(초당 기가트랜스퍼)에 달하고, 이전 세대 대비 성능이 2배 향상됐고, 전력 효율도 30% 이상 개선됐다. SK하이닉스는 내년 상반기 300단 이상의 낸드를 양산하고, 내년 하반기 400단 낸드 양산을 통해 AI 서버용 제품군을 확대한다는 계획이다. ■ 클라우드 업계, 서버용 SSD 수요 지속…삼성·SK, 연매출 4배 증가 전망 클라우드 업체들이 AI 스토리지 인프라에 적극적으로 투자하면서 서버용 SSD 수요는 상반기에 이어 하반기에도 지속될 전망이다. 19일 시장조사업체 트렌드포스에 따르면 서버용(엔터프라이즈) SSD 주문이 급증하고, 공급 부족이 일어나면서 올해 2분기 평균 서버용 SSD 가격이 전분기 대비 25% 이상 상승했고, SSD 공급업체의 매출이 50% 이상 증가했다. 3분기에도 서버용 SSD 공급 부족이 이어지면서 계약가격이 전분기 대비 15% 상승하고, 공급업체 수익은 약 20% 증가할 것으로 예상된다. 특히 하반기 엔비디아 신규 AI용 GPU 블랙웰 시리즈가 출시를 앞두면서 CSP(클라우드 서비스 제공사) 업체들이 서버용 SSD 구매를 계속 늘리고 있다. 트렌드포스는 삼성전자는 PCIe 5.0 SSD 제품이 점진적으로 고객 검증을 통과하고 볼륨이 늘어나면서 3분기 SSD 매출이 전분기 보다 20% 이상 증가할 것으로 전망했다. SK하이닉스도 하반기 솔리다임의 용량 확장과 고용량 SSD 주문 증가로 매출 성장이 예상된다. SK하이닉스는 지난 7월 말 2분기 컨퍼런스콜에서 "엔터프라이즈(서버용) SSD의 수요 성장과 함께 당사의 2분기 엔터프라이즈 SSD 매출액은 전 분기 대비 50% 가량 증가했고, 연간 엔터프라이즈 SSD 매출액은 작년에 비해 약 4배 가까이 성장할 것으로 기대하고 있다"고 말했다. 삼성전자도 7월 말 2분기 컨콜에서 "당사 서버용 SSD 매출은 평균판매가격(ASP) 개선과 출하량 증가, 프리미엄 제품 비중 확대에 힘입어 하반기에도 가파른 실적 개선이 이어지면서 전년 동기 대비 4배를 넘어서는 성장이 가능할 것으로 전망된다"고 밝혔다. 2분기 서버용 SSD 시장에서 삼성전자는 43.2% 점유율로 1위, SK하이닉스·솔리다임은 31.8% 점유율로 2위를 차지했다.

2024.09.19 13:23이나리

효성인포, 고성능 AMD 기반 하이브리드 클라우드 솔루션 제공

효성인포메이션시스템(대표 양정규)은 하이퍼컨버지드인프라(HCI) 솔루션인 UCP 제품군에 새로운 고성능 AMD 4세대 EPYC 프로세서 기반 하이브리드 클라우드 솔루션을 제공한다고 25일 밝혔다. 데이터센터의 관리 및 운영이 복잡해지면서 기업은 비용 효율적이고 지속가능성 목표에 부합하는 고성능 하이브리드 클라우드 및 데이터 솔루션을 제공하는 파트너를 필요로 하고 있다. 효성인포메이션시스템은 HCI 솔루션 'UCP' 제품군을 통해SDDC부터 프라이빗 클라우드 구현과 하이브리드 클라우드 확장을 위한 설계·구축·컨설팅·수행까지 고객들의 유연한 클라우드 환경 구현 및 운영을 총괄적으로 지원하며 클라우드 사업을 강화하고 있다. UCP 제품군은 최근 AMD 4세대 EPYC 프로세서를 새롭게 탑재, 업계 표준을 재정의하는 고성능 컴퓨팅과 100% 데이터 가용성을 보장한다. 4세대 AMD EPYC 프로세서는 데이터센터와 엔터프라이즈 워크로드용 고성능 서버 프로세서다. 높은 코어 수, 향상된 메모리, 보안 기능, 에너지 효율성 등 강력한 성능을 제공한다. AMD EPYC 프로세서로 구동되는 UCP 제품군은 클라우드, 엔터프라이즈, 엣지 컴퓨팅 워크로드에 더 적은 코어로 획기적인 성능뿐 아니라 고밀도·고대역폭 인프라를 제공하여 여러 엔터프라이즈 워크로드를 통합하고 총 소유 비용을 절감해 준다. 프로세서당 최대 128 코어를 지원하여 기존 프로세서 2개를 대체할 수 있다. 메모리 용량 또한 최대6TB로 향상돼 전체 서버 수를 줄이며, 저전력 사용으로 클라우드 환경의 에너지 효율성을 높인다. 효성인포메이션시스템 양정규 대표이사는 “복잡해지는 IT 환경에서 기업들은 인프라 최적화와 비용 절감 과제를 해결하기 위해 노력하고 있다”며 “효성인포메이션시스템은 UCP 제품군을 통해 데이터센터 운영을 간소화하고, 지속가능성 목표에 부합하는 고성능, 에너지 효율적인 하이브리드 클라우드 환경을 제공하며 고객 비즈니스 혁신을 위해 앞장서겠다”고 밝혔다.

2024.07.25 11:34김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

과기정통부, AI 중심 조직 개편 '가속'…정책 컨트롤타워 본격화

"국정자원 화재 초래 서버-배터리 간격 규제해야"

미 연방정부 셧다운에 사이버보안도 '셧다운' 위기

오픈AI 영향력 이 정도?…AI에 진심인 이재명, 43년 묵은 금산분리 '완화' 추진

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.