[유미's 픽] 2조 GPU 사업 '승자의 저주' 되나…네이버·삼성·엘리스 3파전 압축
정부의 2조원대 그래픽처리장치(GPU) 확충 사업이 막판 검증 국면에 들어갔다. 대규모 물량 확보보다 이를 한데 묶어 안정적으로 돌릴 수 있는 클러스터 운영 능력과 수익성이 최종 변수로 떠오르면서 사업자별 희비도 엇갈리고 있다. 14일 업계에 따르면 과학기술정보통신부와 정보통신산업진흥원(NIPA)은 현재 추진 중인 '2026년 AI컴퓨팅자원 활용기반 강화사업'의 발표 평가를 최근 마치고 지난 11일부터 차례대로 데이터센터 현장실사 단계에 들어갔다. 현장실사 대상에는 네이버클라우드, 삼성SDS, 엘리스그룹이 오른 것으로 파악됐다. 당초 제안서를 낸 쿠팡과 KT클라우드는 발표평가 단계에서 제외된 것으로 알려졌다. 이번 사업은 총 2조805억원을 투입해 최신 GPU와 관련 부대장비를 국내 데이터센터에 구축하고 연내 서비스 개시까지 추진하는 프로젝트다. 정부는 단순한 GPU 수량 확보를 넘어 대규모 클러스터링, 직접 구축·운용 역량, 최신 장비 도입, 연내 서비스 개시 등을 핵심 평가 요소로 제시했다. 또 동일 데이터센터 내 집적 구축과 전력·냉각·네트워크 설계 역량까지 요구되면서 사업 난도도 높아졌다. 정부는 지난해에도 약 1조4000억원을 투입해 GPU 1만3000여 장 확보를 추진했다. 당시 네이버클라우드와 NHN클라우드, 카카오가 최종 선정됐다. 업계 관계자는 "이번 사업은 제안 물량을 크게 쓰는 것만으로는 통과하기 어려운 구조"라며 "연내 구축 가능성, 동일 데이터센터 내 집적 구축, 전력·냉각 여건을 실제로 입증할 수 있느냐가 발표평가를 가른 것으로 보인다"고 말했다. GPU 물량 경쟁 속 클러스터 역량 부상 업계에선 네이버클라우드가 이번 사업에서 GPU 9000장 안팎을, 삼성SDS는 4000장 안팎을 제안한 것으로 보고 있다. 엘리스그룹은 2000장 수준의 물량을 배정받을 가능성이 거론되고 있다. 정부는 공모 과정에서 정부 활용분 최소 1개 클러스터를 256서버 이상으로 구성하도록 요구한 것으로 알려졌다. 통상 AI 서버 1대에 GPU 8장이 탑재되는 점을 감안하면 최소 2048장 규모의 클러스터를 구성해야 하는 셈이다. 이처럼 수천 장의 GPU를 하나의 클러스터로 묶어 성능을 내려면 단순 물량 확보를 넘어 서버 간 통신 지연을 줄일 네트워크 대역폭, 스토리지 성능, 전력·냉각 설계가 함께 뒷받침돼야 한다. 업계 관계자는 "이번 사업은 GPU 물량보다 이를 단일 클러스터로 안정적으로 묶어 운용할 수 있는지가 중요하다"며 "전력과 냉각, 네트워크 설계가 뒷받침되지 않으면 대규모 물량을 확보해도 효율을 내기 어렵다"고 말했다. 네이버 대규모 물량 유력…삼성SDS·엘리스도 추격 네이버클라우드는 공모 참여 기업 중 상면 확보에 가장 적극적으로 나서며 사업자 선정 의지를 드러내고 있다. 이를 위해 최근에는 LG CNS 삼송 데이터센터를 임차한 데 이어 내년 개소 예정인 KT클라우드 부천 데이터센터도 임차 계약을 맺은 것으로 알려졌다. 또 네이버클라우드가 지난해 1차 GPU 사업을 통해 H200 3056장을 직접 구축·운영한 경험이 있다는 점도 강점으로 꼽힌다. 정부가 대규모 클러스터링과 직접 구축·운용 역량을 핵심 평가 요소로 제시한 데다 외부 데이터센터 상면까지 추가로 확보하면서 이번에 대규모 물량을 배정받을 가능성이 높은 것으로 점쳐진다. 삼성SDS도 주요 후보로 꼽힌다. 삼성SDS는 삼성 클라우드 플랫폼(SCP)을 기반으로 공공·기업 AI 인프라 사업을 확대하고 있다. 국가AI컴퓨팅센터 구축 사업에서 컨소시엄 주관기관으로 참여한 바 있고, NIPA 고성능컴퓨팅(HPC) 지원 사업을 통해 최신 GPU 자원을 공급한 이력도 있다. 동탄 AI 전용 데이터센터 운영 경험과 기업 고객 기반도 강점으로 거론된다. 업계 관계자는 "삼성SDS는 제안 물량은 네이버클라우드보다 적지만 그룹 내 AI·클라우드 수요와 기업 고객 기반을 갖춘 점이 강점"이라며 "공공 공급 비중이 높은 사업 구조상 자체 활용과 외부 수요를 어떻게 결합하느냐가 수익성에 영향을 줄 것"이라고 말했다. 엘리스그룹은 이동형 모듈러 데이터센터(PMDC)를 앞세워 차별화한 제안을 낸 것으로 알려졌다. 엘리스그룹은 이미 베라 루빈을 지원하는 PMDC 개발을 완료한 상태로, 엔비디아 B300 기준 최대 1만368장 규모의 GPU 클러스터링이 가능하다는 입장이다. 다만 실제 배정 물량은 2000장 안팎이 거론된다. 정부가 최소 1개 클러스터를 256서버, GPU 기준 2048장 이상 규모로 구축하도록 요구한 만큼, 엘리스그룹이 이 기준을 충족할 수 있을지가 관건이다. 모듈러 방식은 부지 조성, 모듈 제작, IT 장비 설치를 병행할 수 있어 구축 기간을 줄일 수 있지만, 대규모 GPU 클러스터를 안정적으로 운영하려면 전력 인입과 냉각, 네트워크 설계가 함께 뒷받침돼야 한다. 업계 관계자는 "엘리스그룹은 2000장 수준의 물량을 배정받을 가능성이 있지만 전력 확보 여부가 관건이 될 것"이라며 "PMDC가 상면 확보에는 유리할 수 있어도 대규모 GPU 클러스터 운영에는 전력과 냉각 안정성이 중요하다"고 말했다. 쿠팡 재도전 불발…KT클라우드도 고배 쿠팡은 지난해 1차 사업에서 탈락한 뒤 올해 재도전에 나섰지만, 발표평가 이후 현장실사 대상에는 포함되지 않은 것으로 알려졌다. 쿠팡은 싱가포르 데이터센터 전문기업 엠피리온디지털의 서울 양재동 데이터센터를 활용해 GPU 인프라를 구축·운영하는 방안을 제안한 것으로 알려졌다. 양재 데이터센터는 서울 도심 입지와 액체냉각 설비를 갖춘 점에서 주목받았다. 일부 층에는 고밀도 랙을 지원하는 액체냉각 방식이 도입된 것으로 알려졌다. 서울 도심 입지 특성상 엔지니어 수급과 지연시간 측면의 장점도 거론됐다. 그러나 정부 사업은 상면 확보뿐 아니라 정부 활용분 클러스터 구성, 서비스형 GPU(GPUaaS) 운영 실적, 연내 서비스 개시, 공공 공급 안정성 등을 종합적으로 따진다. 쿠팡의 도심형 상면과 AI 인프라 투자 계획이 주목받았지만, 발표 평가는 통과하지 못한 것으로 보인다. KT클라우드 역시 발표평가 단계에서 제외된 것으로 알려졌다. KT클라우드는 그간 공공 클라우드 운영 경험과 다수 데이터센터 인프라를 보유한 사업자로 꼽혀 왔다. 또 가산 AI 데이터센터와 부천 삼정 데이터센터 등 AI 인프라 확장 계획도 추진해 왔다. 다만 이번 제안에서는 GPU 물량을 1000장 단위로 여러 상면에 나눠 배치하는 방안을 제시한 것으로 알려졌다. 여기에 최근 대표 교체와 조직 재정비, 대형 투자 의사결정 지연 등이 맞물리며 이번 수주전에서 성과를 내지 못한 것 아니냐는 분석도 나오고 있다. KT클라우드는 수주 불발 관측 이후 내부 분위기도 좋지 않은 것으로 알려졌다.업계 관계자는 "최신 GPU 서버는 무게와 전력 밀도, 냉각 요건이 까다로워 2000장급 클러스터를 한 곳에서 안정적으로 수용할 수 있는지가 중요하다"며 "1000장씩 분산 배치하는 방식은 동일 데이터센터 내 대규모 클러스터링을 요구한 이번 평가에서 불리하게 작용했을 가능성이 있다"고 말했다. 또 다른 관계자는 "KT클라우드가 독립 클라우드 사업자로서 AI 인프라 경쟁력을 보여줄 기회를 이번에 놓친 듯 하다"며 "향후 KT그룹 내에서 KT클라우드의 역할과 투자 방향에도 영향을 줄 수 있다"고 관측했다. GPU값 1억원대에 인피니밴드 수급난 우려…수익성 부담 클 듯 일각에선 이번 사업이 '승자의 저주'가 될 수 있다고 우려했다. GPU 가격이 1년 사이 크게 오른 데다 서버, 네트워크 장비, 전력 설비, 냉각 장치, 데이터센터 보강 비용까지 함께 부담해야 하기 때문이다. 또 중동전쟁 여파로 GPU 클러스터 구성에 필요한 네트워크 장비 수급난도 고민거리로 떠올랐다. 대규모 GPU를 하나의 클러스터로 묶으려면 데이터센터 내 서버 간 고속 통신을 담당하는 인피니밴드 장비가 필수적인데, 관련 장비 상당 부분을 이스라엘에서 공급받아야 해 조달 일정을 맞추기가 쉽지 않아졌기 때문이다. 이에 GPU를 확보하더라도 네트워크 장비와 전력·냉각 인프라가 제때 갖춰지지 않으면 연내 서비스 개시에 차질이 생길 수 있다. 정부 사업 구조도 변수다. 이번 사업은 정부 예산으로 GPU를 구매해 소유권이 NIPA에 귀속되는 방식이다. 사업자는 공공 공급 물량을 제외한 일부 자원을 자체 서비스나 고객 수요에 활용할 수 있지만, 공공 공급 비중을 높일수록 자체 활용 여지는 줄어든다. 지난해 사업에서도 참여사들은 평가 점수를 고려해 자체 활용 비중을 낮게 설정한 것으로 알려졌다. 올해는 GPU 가격과 부대장비 비용 부담까지 커진 만큼, 최종 협상에서 자체 활용 비중을 두고 사업자들의 셈법이 더 복잡해질 전망이다. 지난해 약 8000장 규모 GPU 물량을 확보한 NHN클라우드가 올해 공모에 참여하지 않은 것도 비용 부담과 수익성 등을 고려한 선택으로 풀이된다. 업계 관계자는 "지난해 GPU 가격은 1대당 6000만~7000만원 수준이었지만 올해는 1억원 수준으로 오른 것으로 안다"며 "네트워크 장비와 전력·냉각 비용까지 감안하면 이번 사업은 수익성 확보가 쉽지 않을 수 있다"고 말했다. 베라 루빈, 가점에도 연내 도입 난항…최종 물량 협상 변수 이번 사업에서는 대규모 클러스터링뿐 아니라 엔비디아의 차세대 GPU 플랫폼인 '베라 루빈' 구축 여부도 승부수로 떠오르고 있다. 정부가 베라 루빈 도입을 제안하는 사업자에게 평가상 우대 방침을 밝히면서, 현장실사 대상에 오른 사업자들도 관련 도입 계획을 제안서에 포함한 것으로 알려졌다. 그러나 업계에선 베라 루빈의 연내 국내 도입이 쉽지 않을 것으로 보고 있다. 초기 공급 물량이 제한적인 데다 고전력·고밀도 랙을 수용할 데이터센터 인프라도 갖춰야 하기 때문이다. 업계 관계자는 "베라 루빈은 올해 들어오기 어려울 것으로 보인다"며 "다만 내년 3월까지 들여오기만 하면 정부가 우대해주는 구조로 알고 있다"고 말했다. 현장실사 이후에도 최종 배정 물량은 유동적이다. 사업비 심의·조정과 협약 체결 과정에서 GPU 구매 기종과 수량, 클러스터 규모, 자체 활용 허용 비중, 베라 루빈 반입 시점 등이 조정될 수 있기 때문이다. 정부는 현장실사와 후속 검토를 거쳐 이달 중 최종 수행기관을 선정한다는 목표다. 이후 선정 사업자는 GPU 발주와 데이터센터 구축, 장비 설치 및 성능 검증 등에 착수하게 된다. 업계에서는 선정 시점이 늦어질수록 GPU 가격 상승 부담과 공급 불확실성이 커질 수 있다고 보고 있다. 업계 관계자는 "최종 협상에서는 도입 물량과 자체 활용 비중, 베라 루빈 반입 시점 등이 핵심 쟁점이 될 것"이라며 "수익성과 구축 안정성을 함께 따져야 하는 만큼 사업자별 물량은 조정될 가능성이 있다"고 말했다.