• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX-A100 GPU'통합검색 결과 입니다. (438건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

메모리 가격상승에 기업 내 PC 교체 지연...더 미뤄도 될까

글로벌 빅테크의 인공지능(AI) 투자 확대와 메모리 제조사의 HBM 중심 생산으로 PC 가격 상승 압박이 커지고 있다. 시장조사업체 트렌드포스는 지난 3월 "올 1분기 노트북 전체 부품 원가에서 메모리 비중이 30%까지 상승했으며 올해 노트북 시장이 비용 상승 압박에 직면할 것"이라고 전망하기도 했다. 기업 내 IT 부서 역시 AI PC 도입 시기를 두고 고민중이다. 교체를 미루면 단기 비용 부담은 줄일 수 있지만 향후 더 높은 비용을 지불할 가능성이 커지기 때문이다. 그러나 글로벌 PC 제조사들은 "단순한 초기 구매 비용보다 총소유비용(TCO) 관점에서 AI PC 도입 효과를 검토해야 한다"고 지적한다. 생산성과 운영 효율 개선 효과를 고려해야 한다는 것이다. IDC "AI PC, 하루 2시간 업무 절감 효과" 시장조사업체 IDC가 작년 10월 아태지역 임직원 500명 이상 기업의 IT 결정권자 720명을 대상으로 한 설문조사에 따르면, AI PC 사용자는 하루 평균 2.17시간의 업무 시간을 절약하는 것으로 나타났다. 이는 기존 PC 환경에서 AI 기능을 활용할 때의 평균 절감 시간인 1.67시간보다 약 30% 높은 수준이다. 기업 규모가 커질수록 생산성 효과는 확대될 수 있다. 예를 들어 직원 500명 규모 기업에서 직원 1인당 하루 0.5시간의 추가 업무 절감이 발생할 경우, 연간 약 12만 5000시간 이상의 업무 시간을 확보할 수 있다는 계산이 나온다. AI PC, 클라우드 의존 줄이고 이용료 절감 AI PC의 장점으로는 클라우드 비용 절감 효과도 거론된다. 클라우드 기반 AI 서비스를 활용하기 위해서 월간 구독료를 지불해야 하지만 AI PC는 CPU와 GPU, NPU를 활용해 일부 기능을 인터넷 접속 없이 기기 내에서 직접 처리할 수 있다. 29일 오리온 델테크놀로지스 클라이언트솔루션그룹(CSG) 전무는 "AI PC는 실제로 가격 차이를 상쇄할 만큼의 상당한 가치를 제공한다"고 설명했다. 그는 "기업 AI는 적합한 워크로드를 적합한 컴퓨팅 자원에 배치하는 방향으로 나아가고 있다"며 "클라우드가 모델 학습 등 고도화된 작업을 담당한다면, AI PC는 그 엔드포인트에서 실시간 번역, 회의 기록, 콘텐츠 생성부터 에이전트 구동까지 일상 업무의 생산성을 높이는 작업을 로컬로 처리한다"고 덧붙였다. IDC 설문조사 결과에서도 IT 의사결정권자 중 84%가 'AI PC가 에이전틱 AI 추론 비용 절감에 도움이 될 것'으로 전망했다. 또 77%는 '온디바이스 AI 처리의 비용 효율성이 충분히 설득력 있다'고 답했다. 오리온 전무는 "이러한 하이브리드 구조에서 AI PC는 토큰 비용을 최적화하는 동시에, 데이터를 로컬 환경에서 비공개로 처리한다는 보안상의 이점까지 제공할 것"이라고 말했다. AI 연산 NPU에 분산해 성능 저하 완화 가능 AI PC의 잘 알려지지 않은 장점 중 하나로 기기 수명 연장을 들 수 있다. 기존 PC에서 일어나는 AI 연산은 CPU와 GPU를 집중적으로 활용한다. 반면 AI PC는 이런 연산 중 일부를 NPU로 분산해 처리할 수 있다. 업계에서는 이를 통해 발열과 전력 소비를 줄이고 장기적인 성능 저하를 완화할 수 있다고 보고 있다. 오리온 전무는 "AI 연산을 NPU로 분담하면 CPU와 GPU의 부하를 덜면 발열과 냉각팬 등 마모/소모가 감소한다. 균형 잡힌 워크로드 관리는 PC의 최대 성능을 더 오래 유지하는 데 도움이 된다"고 설명했다. "국내 기업, AI PC 도입 늦지만 관심은 높은 편" IDC에 따르면 2025년 10월 현재 국내 기업의 AI PC 도입률은 약 37%로 아태지역 평균(48%)에는 못 미쳤다. 그러나 AI PC 도입이 지연될 경우 핵심 인력 이탈(33%), 운영 비효율 증가(33%), 시장 주도권 상실(32%) 등에 대한 우려도 컸다. 응답자 중 69%는 PC 구매시 AI 기능을 가장 중요하거나 반드시 필요한 기능으로 여긴다고 답했다. 이는 아태지역 평균(56%)보다 높은 최고 수준이다. 업계는 운영 효율 저하와 AI 인프라 경쟁력 약화를 우려하며, 기업들의 AI PC 전환 수요가 점차 확대될 것으로 보고 있다. 다만 업계에서는 업무 환경별 AI 활용도와 초기 투자비 검증이 함께 필요하다는 지적도 나온다. 오리온 델테크놀로지스 전무는 이같은 지적에 대해 "에너지 효율적인 AI 처리, 스마트 냉각 및 최적화된 하드웨어와 결합된 AI PC는 장기적인 신뢰성, 일관된 성능, 실제 비용 가치를 제공하기 때문 장기적인 투자에 적합하다"고 반론했다.

2026.05.29 16:17권봉석 기자

AI 데이터센터 성능·효율성 좌우하는 나노초 정밀 동기화

생성 AI 확산으로 데이터센터와 클라우드 인프라 투자가 빠르게 늘면서, AI 인프라 경쟁력의 핵심 요소도 크게 변화하고 있다. 과거에는 GPU를 얼마나 많이, 빠르게 확보하느냐가 중요했다면 최근에는 대규모 병렬 처리 환경에서 데이터 정확도를 유지하고 오차 시간을 최소화하는 역량의 중요성이 커지고 있다. 특히 대규모 데이터가 여러 노드를 거치는 AI 데이터센터는 수 많은 서버와 네트워크 장비가 동시에 움직이는 구조인 만큼, 데이터 흐름의 오차와 지연을 최소화하는 '정밀 타이밍 기술'이 핵심 인프라 요소로 주목받고 있다. 주요 시장조사업체에 따르면 오차 시간을 최소화하는 글로벌 타이밍 디바이스 시장 규모는 2023년 58억 달러(약 8조 7226억원)에서 2030년 96억 달러(약 14조 4374억원)까지 성장할 것으로 전망된다. 데이터 전송 시점·시스템 동기화 돕는 정밀 타이밍 솔루션 대규모 CPU·GPU가 동원된 AI 데이터센터에서는 서버·네트워크 간 동기화 정밀도가 AI 연산 효율과 전력 효율에도 영향을 미친다. 미국 국립표준기술연구소(NIST)와 IEEE 등은 초저지연 네트워크 환경에서 나노초(ns) 단위의 시간 동기화 중요성을 강조하고 있다. 정밀 타이밍 솔루션은 특수 소자인 크리스탈(Crystal)과 오실레이터(Oscillator) 기반으로 데이터 전송 시점을 정교하게 맞추고 시스템 간 동기화를 유지하며, 고도화된 AI 인프라의 안정성과 효율을 뒷받침하는 기반 기술로 평가된다. 최근에는 AI 데이터센터와 5G 통신 인프라 확산에 따라 초정밀 오실레이터(OCXO)와 고안정성 클럭 디바이스 수요도 증가하는 추세다. 이에 따라 글로벌 주파수 제어 및 타이밍 디바이스 시장을 선점하기 위한 주요 기술 기업들의 기술 경쟁도 한층 치열해질 것으로 예상된다. 엡손 "쿼츠 기반 타이밍 기술 산업계에 공급" 29일 엡손 관계자는 “AI 인프라 내 정밀 타이밍 솔루션 수요가 확대되는 가운데, 엡손이 오랜 기간 축적한 마이크로디바이스 기술이 다양한 산업 영역에서 활용되고 있다”고 설명했다. 엡손은 석영 기반 수정 진동자를 이용해 정밀하게 시간을 제어하는 쿼츠(Quartz) 기반 초정밀 타이밍 제어 기술을 보유하고 있다. 현재 글로벌 주파수 제어·타이밍 디바이스 시장에서 전통적인 쿼츠 기반 타이밍 제어 기술은 반도체 대비 여전히 주류 시장을 형성하고 있다. 엡손 관계자는 "엡손의 쿼츠 기반 기술은 현재 실시간클록(RTC) 모듈, 크리스탈(Crystal Unit) 및 오실레이터, 고정밀 센서 등을 아우르는 마이크로디바이스 사업으로 확대되고 있다"고 설명했다. "원천 소재 '합성 쿼츠'부터 직접 생산" 엡손은 통신 장비와 컴퓨터, 디지털 카메라, 자동차, 이동통신 기지국 등 다양한 전자·네트워크 인프라 분야에 관련 디바이스를 공급하고 있다. 핵심 소재인 '합성 쿼츠(Synthetic Quartz)'까지 자체적으로 육성·생산하며, 소재 단계부터 정밀 제어 기술을 내재화한 수직 통합형 생산 체계를 구축해왔다는 점도 특징이다. 이 같은 핵심 소재 및 공정의 내재화 방식은 지정학적 리스크와 전 세계적인 부품 공급망 불안정성 속에서 안정적인 고품질 제품 공급을 보장하는 전략적 기반이 된다. 동기화 오차 제어, HPC·AI 클러스터 효율 좌우 엡손 관계자는 “엡손의 사업 영역은 단순 전자부품 사업을 넘어 시스템 전체의 정확도와 안정성을 지원하는 방향으로 확대돼 왔다”고 설명했다. 이어 “물리적인 쿼츠 가공 기술과 미세전자기계시스템(MEMS) 기술을 결합해 다양한 산업 환경에서 요구되는 안정성과 정밀도를 구현해왔다”고 덧붙였다. 업계에서는 AI 데이터센터 고도화와 함께 관련 생태계 내에서 정밀 타이밍 기술과 마이크로디바이스 분야의 중요성도 점차 커질 것으로 예상한다. 이 같은 시장 변화에 발맞춰 글로벌 하드웨어 기업들 역시 B2C에서 고부가가치 B2B 인프라 영역으로 대대적인 체질 개선에 나서고 있다. 엡손 관계자는 "엡손은 전통적으로 프린터 중심의 B2C 이미지가 강했지만, 최근에는 통신·네트워크·산업·자동차 등 B2B 수요 기반 영역까지 사업 포트폴리오를 확대하고 있다"고 밝혔다. 이어 "최근 발표한 'ENGINEERED FUTURE 2035' 비전을 통해 80년 이상 축적해 온 '고효율·초소형·초정밀' 기술과 엔지니어링 역량을 기반으로 산업 및 사회 인프라 영역에서 사업 경쟁력을 강화하겠다는 전환 뱡항을 제시했다"고 덧붙였다.

2026.05.29 13:30권봉석 기자

[AI는 지금] "탈 엔비디아 노린다"…'프랑스 AI' 미스트랄, 오픈AI 맞서 '독자 칩' 검토

프랑스 인공지능(AI) 스타트업 미스트랄 AI(Mistral AI)가 자체 반도체 칩 설계 기술 검토에 착수했다. 오픈AI, 앤트로픽 등 거대 자본을 앞세운 미국 빅테크 기업들과의 전면전에서 살아남기 위해 인프라 주도권을 직접 확보하기 위한 승부수로 풀이된다. 아서 멘슈 미스트랄 AI 최고경영자(CEO)는 28일(현지시간) CNBC와의 인터뷰에서 자체 칩 설계 및 개발 가능성을 묻는 질문에 "당연히 흥미로운 영역"이라며 "자체 반도체 개발 가능성을 배제하지 않고 있다"고 처음으로 공식 언급했다. 이처럼 미스트랄 AI가 반도체 내재화 카드를 만지작거리는 이유는 천문학적으로 치솟는 AI 구동 비용 때문으로 풀이된다. 고성능 AI 모델을 유지하고 고도화하는 과정에서 발생하는 컴퓨팅 인프라 비용 부담을 줄이지 못하면 장기적인 수익성 확보가 불가능하다는 판단에서다. 멘슈 CEO는 "맞춤형 칩을 활용하면 AI 모델이 데이터를 처리하는 단위인 '토큰(Token)'의 배포 비용을 유의미한 수준으로 크게 낮출 수 있다"고 설명했다. 현재 약 120억 유로(한화 약 18조원)의 기업 가치를 평가받는 미스트랄 AI는 그동안 엔비디아와의 파트너십을 중심으로 인프라를 확장해왔다. 그러나 구글, 아마존, 메타 등 미국 하이퍼스케일러들이 자체 주문형 반도체(ASIC)를 개발하며 하드웨어와 소프트웨어 통합 최적화에 나서자 고유 칩 확보의 필요성을 절감한 것으로 보인다. 칩 독립 선언과 함께 인프라 대형화 전략도 속도를 낸다. 미스트랄 AI는 프랑스와 스웨덴 데이터 센터에 총 40억 유로(약 6조원)를 투입, AI 모델 구동 및 서비스에 특화된 '추론(Inferencing) 전용 데이터 센터'를 프랑스 내에 신규 구축한다고 발표했다. 미국에 뒤처진 유럽의 AI 컴퓨팅 역량을 끌어올려 시장 지배력을 확보하겠다는 취지다. 미스트랄 AI는 시장 경쟁력을 높이기 위한 비즈니스 모델 다각화도 본격화하고 있다. 최근에는 미국 빅테크들이 사활을 걸고 있는 '에이전틱 AI(Agentic AI)' 시장을 겨냥해 기업용 신규 에이전트 플랫폼 '바이브(Vibe)'를 출시했다. 단 한 번의 지시로 문서 작성부터 코딩, 테스트, 배포까지 자율 수행하는 이 솔루션을 앞세워 올해 매출 목표를 전년(2억 유로) 대비 5배 성장한 10억 유로(약 1조 5000억원)로 끌어올린다는 구상이다. 다만 연간 반복 매출(ARR)이 수백억 달러에 달하는 오픈AI나 앤트로픽과의 체급 차이를 단기간에 극복하기는 쉽지 않을 것이라는 관측도 나온다. 인프라와 칩 개발에 드는 막대한 자본 조달 역시 과제로 꼽힌다. 미스트랄 AI의 이번 인프라 투자 확대는 미국 빅테크 기업들과의 컴퓨팅 자원 격차를 좁히기 위한 조치로도 풀이된다. 현재 유럽 연합(EU) 내에서는 독자적인 인프라 공급망을 확보하지 못할 경우 발생할 거시경제적 타격에 대한 우려가 확산되는 추세다.멘슈 CEO는 인프라 격차와 관련해 "유럽은 현재 AI를 과거 천연가스와 같은 국가 전략적 자산으로 바라보기 시작했다"며 "이 기술 경쟁에서 계속해서 경쟁력을 유지하려면 1조 달러에 달하는 상업적 적자가 발생하는 상황을 감당할 수 없다는 점을 모두가 직시해야 한다"고 강조했다.

2026.05.29 11:08장유미 기자

GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개

오케스트로가 생성형 인공지능(AI) 서비스 확산으로 급증하는 추론 수요에 대응하기 위한 AI 인프라 운영 플랫폼을 공개했다. 단순 그래픽처리장치(GPU) 확보 경쟁을 넘어 보유 자원을 얼마나 효율적으로 활용하느냐가 기업 AI 경쟁력으로 떠오르면서, 추론 최적화와 운영 자동화 시장 공략에 나선 모습이다. 오케스트로는 AI 추론 운영 플랫폼 '콘체르토 AI(CONCERTO A.I.)'를 출시했다고 29일 밝혔다. 콘체르토 AI는 기업이 보유한 GPU 인프라 활용 효율을 높여 생성형 AI 서비스 운영 과정에서 발생하는 추론 병목과 응답 지연 문제를 줄이는 데 초점을 맞췄다. 최근 기업 시장에선 AI 챗봇과 업무 자동화 에이전트, 검색증강생성(RAG) 기반 서비스 도입이 확대되면서 추론 연산 수요가 빠르게 증가하고 있다. 특히 에이전트형 AI 환경에선 하나의 요청이 여러 모델 호출과 반복 연산으로 이어지면서 GPU 자원 부담이 커지고 있다. 이에 업계에선 GPU 증설보다 기존 인프라 활용 효율을 높이는 운영 기술 중요성이 커지는 추세다. 콘체르토 AI는 대규모 추론 요청을 분산 처리하고 GPU와 신경망처리장치(NPU) 등 가속기 자원을 작업 특성에 맞게 배분하도록 설계됐다. 질문 분석과 답변 생성 작업을 분리해 각각 최적의 자원에 할당하는 분산 서빙 방식을 적용해 병목 현상을 줄이고 응답 성능을 높인다. 여기에 키-값 캐시(KV Cache) 최적화와 메모리 재사용 기술을 적용해 초기 응답 시간과 토큰 처리 속도를 개선했다. 실시간 대기열과 자원 상태를 반영한 지능형 라우팅 기능도 탑재해 고부하 환경에서도 안정적인 응답 성능을 유지할 수 있도록 지원한다. 오케스트로에 따르면 자체 온프레미스 AI 인프라 환경에서 진행한 벤치마크 결과, 동시 요청이 집중되는 고부하 환경에서 콘체르토 AI의 분산 서빙 방식은 기존 단일 처리 방식 대비 토큰 출력 속도를 2.2배 향상시켰다. 회사는 이를 통해 동일한 하드웨어 환경에서도 응답 지연을 줄이고 추론 처리 안정성을 높일 수 있다고 설명했다. 운영 자동화 기능도 강화했다. 콘체르토 AI는 AI 모델 배포부터 추론 요청 처리, 자원 배분, 성능 모니터링까지 거대언어모델 운영관리(LLMOps) 전 과정을 단일 플랫폼에서 지원한다. 표준화된 모델 패키징 기술을 기반으로 쿠버네티스 환경에서 배포 과정을 자동화하고 초기 응답 시간과 토큰 처리 속도, 자원 사용량 등 주요 운영 지표를 통합 관리할 수 있도록 돕는다. 특히 국내 유일 이기종 AI 가속기 지원 구조도 차별점으로 내세웠다. 엔비디아 GPU뿐 아니라 리벨리온과 퓨리오사AI 등 국산 NPU 환경까지 지원해 기업과 기관이 프라이빗 AI와 소버린 AI 환경에서 특정 하드웨어 벤더 의존도를 낮추고 인프라를 유연하게 구성할 수 있도록 지원한다. 최근 AI 인프라 시장 경쟁축은 학습 중심에서 추론 중심으로 이동하는 분위기다. 생성형 AI 서비스가 실제 업무 환경에 본격 적용되면서 GPU 확보 경쟁을 넘어 운영 효율과 자원 활용 최적화, LLM옵스 역량이 새로운 경쟁력으로 부상하고 있다. 오케스트로 역시 콘체르토 AI를 통해 기업 AI 인프라 운영 효율을 높이고 프라이빗 AI 시장 공략을 강화한다는 전략이다. 김범재 오케스트로 대표는 "생성형 AI가 실제 업무로 확산되고 에이전트형 AI 서비스가 늘어나면서 기업 AI 인프라 과제는 더 많은 GPU를 확보하는 것에서 보유 자원을 얼마나 효율적으로 운영하느냐로 옮겨가고 있다"며 "콘체르토 AI를 기반으로 기업이 보유한 AI 인프라 활용 효율을 높이고 프라이빗 AI 환경에서도 안정적인 AI 서비스 운영을 지원하겠다"고 말했다.

2026.05.29 10:48한정호 기자

[AI 고속도로] 델, AI 서버 호황에 '어닝 서프라이즈'…시간외 주가 38%↑

델 테크놀로지스가 인공지능(AI) 서버 수요 급증에 힘입어 재상장 이후 최대 매출 성장률을 기록하며 시장 기대치를 크게 웃도는 실적을 발표했다. AI 서버 주문과 데이터센터 인프라 사업이 폭발적으로 성장한 가운데 연간 실적 전망까지 상향 조정하면서 주가는 시간외 거래에서 약 38% 급등했다. 델은 28일(현지시간) 2027 회계연도 1분기 실적 발표를 통해 매출 438억 4000만 달러와 조정 주당순이익(EPS) 4.86달러를 기록했다고 밝혔다. 이는 시장조사업체 LSEG가 집계한 시장 전망치인 매출 354억 3000만 달러, 조정 EPS 2.94달러를 크게 웃도는 수준이다. 특히 매출은 전년 동기 대비 88% 증가했다. 델이 지난 2018년 재상장한 이후 가장 높은 성장률이다. AI 인프라 수요 확대가 실적 급증을 이끈 것으로 풀이된다. 델은 해당 분기 AI 서버 매출이 전년 동기 대비 757% 증가한 161억 달러를 기록했다고 밝혔다. 회사는 올해 전체 AI 서버 매출 전망도 기존 500억 달러에서 600억 달러로 상향 조정했다. 이는 전년 대비 144% 성장한 규모다. 델은 현재 엔비디아 그래픽처리장치(GPU) 기반 AI 서버를 중심으로 기업·네오클라우드·소버린 AI 고객 등 5000곳 이상의 AI 서버 고객을 확보했다고 설명했다. AI 서버 수요 확대와 함께 기존 서버·네트워크 장비 사업도 동반 성장한 것으로 나타났다. 서버와 데이터센터 장비를 담당하는 인프라솔루션그룹(ISG) 매출은 전년 동기 대비 181% 증가한 290억 달러를 기록했다. 전통 서버 및 네트워킹 매출은 85억 달러로 92% 늘었고 스토리지 매출도 43억 달러로 8% 증가했다. PC·노트북·액세서리 사업을 담당하는 클라이언트솔루션그룹(CSG) 매출은 146억 달러로 전년 동기 대비 17% 증가했다. 기업용 PC 수요 확대 영향으로 상업용 클라이언트 매출은 18% 늘어난 130억 달러를 기록했다. 델은 회계연도 2분기 매출 전망도 440억~450억달러로 제시했다. 시장 전망치인 349억 7000만 달러를 크게 웃도는 수준이다. 연간 매출 역시 기존보다 상향한 1650억~1690억 달러로 전망했다. 다만 델은 AI 인프라 수요 급증에 따른 공급망 부담도 커지고 있다고 밝혔다. 회사는 메모리·중앙처리장치(CPU)·하드디스크(HDD) 등 주요 부품 공급 부족이 이어질 것으로 내다봤다. 제프 클라크 델 부회장 겸 최고운영책임자(COO)는 "AI 인프라 수요 확대 흐름이 지속되면서 기업·소버린 AI 고객 주문이 빠르게 증가하고 있다"며 "추론·에이전틱 AI 워크로드 확대가 우리의 새로운 성장 동력이 되고 있다"고 말했다.

2026.05.29 10:48한정호 기자

[AI는 지금] "추론판 AWS 되겠다"…엔비디아가 베팅한 바세텐, 몸값 110억 달러 논의

인공지능(AI) 반도체 공룡 엔비디아가 투자한 미국 AI 추론 인프라 스타트업 '바세텐(Baseten)'이 110억 달러(약 15조원)의 기업가치로 대규모 투자 유치에 나섰다. 지난 1월 50억 달러의 가치를 평가받은 지 불과 3개월 만으로, 글로벌 AI 시장의 투자 중심축이 거대 모델 '학습'에서 비용 효율화를 위한 '추론(실제 서비스 구동)' 인프라로 급격히 이동한 분위기다. 29일 IT 전문매체 디인포메이션에 따르면 바세텐은 최근 투자자들과 10억 달러 규모 신규 투자 유치를 논의했다. 이번 투자 조건은 투자 후 기업가치 110억 달러를 전제로 한다. 성사될 경우 바세텐의 기업가치는 올해 초 인정받은 50억 달러에서 2배 이상 높아진다. 바세텐은 지난 2019년 미국 샌프란시스코에서 설립된 AI 추론 인프라 기업으로, 고객들이 오픈소스 모델과 자체 조정 모델을 서비스에 배포·운영할 수 있도록 모델 서빙, GPU 자원 관리, 지연시간 최적화, 비용 관리 기능을 제공한다. 주요 고객사로는 AI 코드 편집기 '커서(Cursor)'와 업무 협업 툴 '노션(Notion)' 등이 거론된다. 또 바세텐은 AI 모델 실행 인프라 시장에서 AWS와 같은 플랫폼 지위를 목표로 하고 있다. 클라우드 시장에서 AWS가 기업 컴퓨팅 인프라를 제공하며 성장한 것처럼 바세텐은 AI 시대의 추론 인프라를 겨냥하고 있다. 추론 인프라 수요가 커지면서 바세텐에는 대형 투자자 자금도 몰리고 있다. 바세텐은 올해 1월 50억 달러 평가액으로 3억 달러 투자 유치에 성공했다. 당시 라운드는 벤처캐피털 IVP와 알파벳 계열 독립 성장펀드 캐피털G가 공동 주도했으며 엔비디아도 참여했다. 엔비디아는 해당 거래의 일환으로 바세텐에 1억5000만 달러를 투자하기로 한 것으로 전해졌다. 바세텐은 최근 1년 사이 3차례 투자 유치에 나섰다. 누적 투자 유치액은 5억8500만 달러 수준으로 늘었다. 110억 달러 기업가치가 인정되면 올해 초 투자 라운드 이후 3개월 만에 평가액이 2배 이상 오르게 된다. 엔비디아의 투자는 추론 인프라 시장 확대와 맞물려 있다. 생성형 AI 도입이 확산되면서 기업들은 모델 학습용 GPU뿐 아니라 학습된 모델을 수많은 이용자 요청에 맞춰 빠르게 구동하는 추론 인프라 확보에 나서고 있다. 엔비디아는 GPU 수요를 키우는 추론 플랫폼 기업에 투자하며 하드웨어와 소프트웨어 생태계를 넓히고 있다. AI 업계에선 추론 시장의 성장성이 학습 시장보다 더 클 수 있다는 관측도 나온다. 모델 학습은 대규모 자본과 데이터센터 역량을 갖춘 소수 기업 중심으로 이뤄진다. 반면 추론은 AI 기능을 서비스에 붙이는 모든 기업에서 반복적으로 발생한다. 이용자가 AI 애플리케이션을 호출할 때마다 GPU 연산이 필요하기 때문이다. 오픈소스 AI 모델 확산도 바세텐의 성장 요인으로 꼽힌다. 라마, 딥시크, 미스트랄, 젬마 등 공개 모델을 업무와 서비스에 적용하는 기업이 늘면서 최근 모델 배포와 운영 수요가 증가하고 있다. 이 과정에서 파인튜닝, 모니터링, 비용 관리 등을 통합 지원하는 추론 인프라 플랫폼의 필요성은 커지고 있다. 추론 인프라 시장을 둘러싼 투자 경쟁도 거세지고 있다. 개발자들에게 AI 추론 인프라를 제공하는 파이어웍스AI는 지난해 10월 기업가치 40억 달러를 기준으로 2억5000만 달러를 조달했다. 추론 전용 칩을 설계한 세레브라스도 오픈AI와 파트너십을 맺은 뒤 기업가치 220억 달러로 10억 달러 투자 유치를 논의 중인 것으로 알려졌다. 대형 클라우드 사업자들도 추론 시장을 겨냥하고 있다. AWS, 구글 클라우드, 마이크로소프트 애저는 자체 AI 인프라와 모델 운영 서비스를 강화하고 있다. 코어위브, 람다, 토게더AI 등 GPU 인프라 기업들도 AI 스타트업과 기업 고객을 상대로 추론 워크로드 확보 경쟁을 벌이고 있다. 초기 생성형 AI 경쟁은 대규모 모델 개발과 학습 데이터 확보에 집중됐다. 최근에는 기업들이 AI 기능을 실제 서비스에 적용하기 시작하면서 지연시간, 안정성, 보안, 비용 효율성 등 운영 역량이 경쟁 변수로 떠올랐다. 모델 성능뿐 아니라 서비스 환경에서 모델을 얼마나 빠르고 저렴하게 구동할 수 있는지가 기업 AI 도입의 핵심 조건이 되고 있다. 엔비디아는 AI 반도체 공급자 지위를 넘어 오픈AI, AI 인프라 기업, 애플리케이션 기술 기업 등으로 투자 보폭을 넓히고 있다. GPU를 쓰는 기업에 자본을 투입하고, 이들이 다시 엔비디아 기반 인프라를 확장하는 구조다. 바세텐 투자도 엔비디아의 추론 생태계 확대 전략과 연결돼 있다는 분석이 나온다. 업계 관계자는 "AI 시장의 다음 경쟁은 누가 더 큰 모델을 만드느냐보다 그 모델을 실제 서비스에서 얼마나 빠르고 저렴하게 돌리느냐에 달려 있다"며 "바세텐의 투자 논의는 추론 인프라가 AI 생태계의 핵심 인프라로 자리 잡고 있다는 신호"라고 말했다.

2026.05.29 08:51장유미 기자

챗GPT·제미나이·GPU 다 푼다…메가존클라우드, 정부 AI 대회 2년 연속 운영

메가존클라우드가 정부 주도 인공지능(AI) 인재 육성 사업 운영을 2년 연속 맡으며 국내 AI 개발 생태계 지원 확대에 나선다. 대규모 AI 경진대회 운영 경험과 컴퓨팅 인프라 지원 역량을 기반으로 생태계 활성화에 속도를 낸다는 목표다. 메가존클라우드는 정보통신산업진흥원(NIPA)과 한국정보통신기술협회(TTA)가 공동 주관하는 '2026 AI 챔피언 대회' 운영사업자로 선정됐다고 28일 밝혔다. 지난해에 이어 2년 연속 선정이다. AI 챔피언 대회는 과학기술정보통신부가 추진하는 '2026 전국민 AI 경진대회' 주요 트랙 가운데 하나다. 생성형 AI 활용 경험과 개발 역량을 보유한 참가자들을 대상으로 우수 AI 서비스와 시스템 개발팀을 선정하는 행사다. 전문가·개발자 중심 'AI 챔피언' 부문과 대학생 개발자 중심 'AI 루키' 부문으로 나뉘어 운영된다. 대회는 참가 접수와 예선 심사를 거쳐 각 부문 본선 진출 100개 팀을 선발한 뒤 기술 워크숍과 연구 인프라 지원을 통해 과제를 수행하는 방식으로 진행된다. 이후 본선 심사와 시연 평가, 최종 결선을 거쳐 수상팀을 선정한다. 총 상금 규모는 AI 챔피언 26억원, AI 루키 3억 5000만원 수준이다. 메가존클라우드는 참가팀 대상 그래픽처리장치(GPU) 환경 설계와 AI API 제공, 개발 환경 구축·운영, 기술 지원 등 AI 연구·개발에 필요한 컴퓨팅 인프라 운영 전반을 담당한다. 최근 AI 챔피언 참가팀 대상 기술 워크숍을 진행했으며 다음 달 4일에는 AI 루키 참가팀 대상 워크숍도 열 예정이다. 지원 인프라에는 엔비디아 H100·A100 GPU를 비롯해 클로드·제미나이·챗GPT 등 글로벌 AI API가 포함된다. 여기에 LG AI연구원 엑사원, SK텔레콤 A.X, KT 믿:음, 엔씨 바르코, 업스테이지 솔라 프로 등 국내 AI 모델 API도 함께 제공된다. 최근 국내 AI 산업은 GPU 확보와 실전형 AI 개발 경험 중요성이 동시에 커지는 분위기다. 이론 교육을 넘어 실제 생성형 AI 서비스 개발과 운영 경험을 확보할 수 있는 실무형 경진대회와 인프라 지원 사업도 확대되는 추세다. 정부 역시 AI 반도체와 클라우드 인프라, 데이터, 인재 양성을 연결하는 생태계 구축에 속도를 내고 있다. 메가존클라우드는 다양한 프로젝트 수행 경험과 2000여 명 규모 기술 인력을 기반으로 AI·클라우드 네이티브 사업을 확대 중이다. 최근에는 GPU 기반 AI 인프라 구축과 AI 전환(AX) 사업, AI 에이전트·멀티클라우드 운영 영역까지 사업 범위를 넓히는 모습이다. 서민택 메가존클라우드 부사장은 "대규모 AI 경진대회와 GPU 지원사업 등 다양한 정부 사업 수행 경험을 바탕으로 참가팀별 GPU 사용 환경 설계, 컴퓨팅 자원 제공, 운영 안정화, 기술 지원 역량을 축적해왔다"고 강조했다. 이어 "이번 사업에서도 참가팀들이 안정적인 인프라 환경에서 아이디어를 구현하고 기술 역량을 확장할 수 있도록 지원할 것"이라며 "정부 주도 AI 인재 양성과 국내 AI 생태계 활성화에 기여하겠다"고 덧붙였다.

2026.05.28 16:23한정호 기자

[유미's 픽] 2조 GPU 사업, 네이버·삼성SDS·엘리스가 거머쥘까…정부 "물량 협상 중"

정부의 2조원대 그래픽처리장치(GPU) 확충 사업이 막판 협상 단계에 들어갔다. 네이버클라우드, 삼성SDS, 엘리스그룹 등 3개사 구도에 무게가 실리고 있지만 최종 협약과 정부 내부 절차는 아직 마무리되지 않은 것으로 확인됐다. 현재 사업자별 GPU 물량과 민간 활용 비중이 막판 변수로 남은 상태로, 최종 발표는 다음주 이후로 넘어갈 가능성이 커졌다. 28일 정부와 업계에 따르면 과학기술정보통신부와 정보통신산업진흥원(NIPA)은 '2026년 AI컴퓨팅자원 활용기반 강화사업'의 데이터센터 현장실사를 마무리하고 현재 사업자별 후속 협상을 진행하고 있다. 현장실사 대상에 오른 기업은 네이버클라우드, 삼성SDS, 엘리스그룹으로, 이들이 사실상 최종 사업자로 선정될 가능성이 높다. 다만 정부 공식 발표와 협약 체결은 이뤄지지 않았다. 사업자별 GPU 물량과 민간 활용 비중, 장비 도입 일정 등에 대한 조율이 남아 있어서다. 과기정통부 내부 보고 절차도 아직 끝나지 않은 상태다. 과기정통부 관계자는 "(최종 사업자를) 아직 확정하지 않았고 선정되거나 한 것이 없다"며 "물량 협상도 현재 마무리되지 않았다"고 말했다. 이어 "기업들과 최종 계약을 맺지 않았고 내부적으로 협상안에 대한 보고도 하지 않은 상황"이라고 덧붙였다.최종 발표 시점도 유동적이다. 정부는 이르면 이번 주 발표를 검토했지만 협상과 내부 보고 절차가 남아 있어 일정이 늦어질 가능성이 커졌다. 다음 주 발표 여부도 아직 확정하지 못한 상태다. 과기정통부 관계자는 "협상이 아직 끝나지 않아 이번 주 발표는 쉽지 않을 것으로 보인다"며 "협상 이후 내부 보고 절차도 남아 있어 현재로선 정확한 발표 시점을 특정하기 어렵다"고 밝혔다. 이번 사업은 총 2조805억원을 투입해 최신 GPU와 관련 부대장비를 국내 데이터센터에 구축하고 AI 연구·산업계에 공급하는 대형 프로젝트다. 정부는 GPU 확보뿐 아니라 대규모 클러스터링, 직접 구축·운용 역량, 동일 데이터센터 내 집적 구축, 전력·냉각·네트워크 설계 능력, 최신 장비 도입 가능성 등을 주요 평가 요소로 제시했다. 네이버클라우드, 삼성SDS, 엘리스그룹은 현장실사 대상에 올랐으나, 당초 제안서를 낸 쿠팡과 KT클라우드는 발표평가 단계에서 제외된 것으로 알려졌다. 업계에선 3개사가 사실상 최종 후보군으로 좁혀졌다는 관측이 확산된 상태다. 하지만 정부는 현 단계에서 특정 사업자와 최종 사업자 수를 공식적으로 확인해주지 않고 있다. 현장실사가 끝났더라도 협상 결과에 따라 사업자별 조건과 최종 구성이 달라질 수 있기 때문이다. 최종 사업자 수 역시 사업자별 가용 범위와 협상 결과를 반영해 정해질 전망이다. 남은 핵심 쟁점은 물량과 민간 활용 비중이다. 정부는 당초 최대 1만5000장 안팎의 고성능 GPU 확보를 목표로 제시했지만, 실제 확보 물량은 GPU 기종, 예산 범위, 사업자별 구축 여건에 따라 달라질 수 있다. 과기정통부 관계자는 "협상이 아직 끝나지 않아 1만5000장 확보 여부와 사업자별 배정 물량 모두 확정되지 않았다"며 "현재는 GPU 장수와 민간 활용 비중 등을 놓고 조율하고 있고, 기종도 협상 과정에서 달라질 수 있다"고 말했다. 업계에선 네이버클라우드가 8000~9000장 안팎, 삼성SDS가 5000장 안팎, 엘리스그룹이 2000장 안팎을 가져갈 것으로 예상했다. 이 경우 총 물량은 정부가 목표로 한 1만5000장 안팎에 근접할 수 있다. 다만 최종 장수는 협상 결과에 따라 달라질 수 있고 정부가 사업자별 배정 물량을 공개하지 않을 가능성도 있다.업계에선 올해 구축 물량이 B300 등 엔비디아 블랙웰 계열 GPU 중심으로 구성될 가능성이 큰 것으로 보고 있다. 베라 루빈은 국내 입고 시점이 내년 이후로 넘어갈 가능성이 커 올해 서비스 개시 물량에는 포함되기 쉽지 않다는 관측이 나온다. 또 엔비디아 차세대 GPU 플랫폼인 '베라 루빈' 도입 계획은 이미 평가 단계에서 우대 요소로 반영된 것으로 알려졌다. 이에 현재 협상은 사업자별 GPU 장수와 기종 조합, 민간 활용 비중, 도입 일정 등을 맞추는 절차에 가깝다. 과기정통부 관계자는 "베라 루빈을 몇 퍼센트 도입해야 한다고 정해진 것은 없다"며 "이미 평가는 끝난 상황이기 때문에 무엇이 더 유리하다는 문제가 아니라 정부와 협상이 가능하냐의 문제"라고 설명했다. 여기에 베라 루빈은 차세대 모델인 만큼 올해 국내 입고와 서비스 개시가 쉽지 않을 것으로 보인다. 실제 도입 시점은 사업자별 제안 일정과 글로벌 공급 상황에 따라 최종 협상 과정에서 조율될 전망이다. 과기정통부 관계자는 "공모 단계에서도 베라 루빈의 연내 서비스는 쉽지 않을 것으로 예상했다"며 "정부가 특정 시점을 조건으로 건 것은 아니고, 최종 사업자가 확정되면 사업자별 제안 일정을 바탕으로 세부 도입 일정을 협의할 것"이라고 밝혔다. 민간 활용 비중도 사업성을 가르는 변수로 지목된다. 이번 사업은 정부 예산으로 GPU를 확보한 뒤 공공·연구 분야에 공급하는 구조지만, 사업자는 일부 자원을 자체 서비스나 기업 고객 수요에 활용할 수 있다. 공공 공급 비중이 높아질수록 정책 목적에는 부합하지만 사업자의 수익성 확보 여지는 줄어든다. 이에 사업자 입장에선 실제 배정 물량과 민간 활용 가능 범위가 중요할 것으로 보인다. GPU 가격이 오른 데다 서버, 네트워크 장비, 전력·냉각 설비, 데이터센터 보강 비용까지 고려하면 협상 조건에 따라 사업성이 달라질 수 있어서다. 대규모 장비를 확보하더라도 공공 공급과 민간 활용의 균형을 맞추지 못하면 투자 부담이 커질 수 있다. 네트워크 장비와 발주 일정도 변수로 남아 있다. 대규모 GPU 클러스터를 안정적으로 운영하려면 GPU 서버 간 고속 통신을 담당하는 인피니밴드 등 네트워크 장비가 필요한 상황이다. 하지만 협약 체결이 늦어질수록 GPU와 네트워크 장비 발주 일정에도 영향을 줄 수 있다. 정부는 사업자 선정 전까지 각 사업자가 제안한 일정과 공급 계획을 기준으로 검토하고 있다. 장비 수급 문제가 발생할 경우에는 사업자 선정 이후 정부가 함께 대응하는 방식이 거론된다. 현재까지 특정 장비 수급 문제가 공식화된 단계는 아닌 것으로 파악된다. 과기정통부 관계자는 "사업자 선정 전에는 각 사업자가 제안한 일정에 맞춰 보는 상황"이라며 "선정 이후 장비 수급 문제가 생기면 정부가 같이 참여해서 진행하는 형태가 될 것"이라고 밝혔다. 클라우드 업계에선 최종 협약 조건에 따라 사업자별 셈법이 달라질 수 있다고 분석했다. GPU 가격과 구축 비용 부담이 커진 상황에서 배정 물량과 민간 활용 비중은 수익성을 좌우할 핵심 변수로 꼽힌다. 업계 관계자는 "정부 입장에서는 1만5000장 안팎의 GPU를 맞추는 것이 중요하지만, 사업자 입장에서는 그 물량을 어떤 조건으로 가져가느냐가 더 중요하다"며 "민간 활용 비중과 차세대 장비 도입 일정, 구축 비용 부담에 따라 이번 사업이 성장 기회가 될 수도, 수익에 부담이 될 수도 있다"고 강조했다.

2026.05.28 15:34장유미 기자

'AI 인프라 병목 해결'...프라임마스, 메모리 솔루션 하반기 본격 양산

프라임마스가 글로벌 AI 데이터센터의 가장 큰 고질병으로 꼽히는 값비싼 GPU의 유휴(Idle) 현상을 해결하기 위해 초대형 메모리 확장 솔루션 양산에 나선다. 연산 장치의 발전 속도에 비해 턱없이 부족했던 메모리 용량 한계를 수백 테라바이트(TB) 단위로 확장하는 차세대 인터커넥트 기술이 글로벌 메모리 공급망의 핵심 생태계로 진입할지 주목된다. 프라임마스는 AI 인프라의 최대 병목 구간인 메모리 용량 한계를 극복하기 위해 CXL(컴퓨트 익스프레스 링크) 기반의 메모리 확장 솔루션인 'JBOM(Just a Bunch of Memory)'을 올해 하반기부터 본격 양산 공급한다고 28일 밝혔다. 프라임마스는 미국 실리콘밸리에 본사를 두고 기술 개발을 주도해 왔으며, 최근 글로벌 메모리 기업인 마이크론에 양산 물량 공급을 확정했다. 아울러 삼성전자와는 차세대 CXL 메모리 솔루션 공동 개발에 착수한 바 있다. 현재 AI 데이터센터 아키텍처의 가장 큰 비효율은 GPU의 성능을 메모리가 받쳐주지 못하는 데서 발생한다. 연산 속도에 비해 데이터가 오가는 메모리 용량이 부족하면, 막대한 비용을 들여 도입한 GPU가 연산을 멈추고 대기하는 병목 현상이 발생하기 때문이다. 결국 추가적인 GPU 증설 없이 인프라 효율을 극대화하려면 메모리 용량 확보가 필수적인 상황이다. 이 같은 효율성은 학계 및 산업계 임상 데이터로도 증명되고 있다. 지난해 말 발표된 알리바바의 '벨루가(Beluga)' 연구에 따르면, 8TB급 CXL 메모리 확장 환경을 구축했을 때 대규모 언어모델(LLM) 추론 엔진(vLLM)의 데이터 처리량이 기존 아키텍처 대비 7.35배 향상되는 결과가 확인됐다. 메모리 접근 방식과 용량 확보가 전체 AI 시스템의 생산성을 좌우하는 핵심 변수로 떠오른 이유다. 프라임마스가 선보인 'JBOM'은 차세대 인터커넥트 표준인 CXL을 활용해 다수의 대용량 메모리 카드를 하나의 거대한 풀(Pool)로 묶는 솔루션이다. 일반적으로 2~4TB 수준에 갇혀 있던 가동용 CPU 서버당 D램 용량 한계를 단숨에 수십에서 수백 TB 규모로 확장할 수 있다. 회사 측은 올해 40~120TB급 JBOM 솔루션을 시장에 우선 공급하고, 내년에는 240TB 이상으로 확장 규격을 늘리는 고도화 로드맵을 가동했다. 전덕호 프라임마스 기술전략 담당 상무는 “단순히 GPU 숫자만 늘리는 방식의 인프라 확장은 명확한 한계에 직면했다”며 “향후 AI 성능 경쟁의 전장(戰場)은 메모리 병목을 어떻게 제어하느냐에 달렸으며, 연산 중심 구조에서 메모리 중심 컴퓨팅 구조로 아키텍처의 무게중심이 이동하는 전환점이 될 것”이라고 설명했다. 그러면서 “이번 마이크론 양산 공급과 삼성전자와의 공동 R&D 체제 구축을 발판 삼아 메모리 중심 컴퓨팅 시대를 앞당길 것”이라며 “글로벌 무대에서 검증받은 원천 기술 성과가 궁극적으로 국내 반도체 생태계의 전반적인 고부가가치 경쟁력 강화로 이어지도록 하겠다”고 덧붙였다.

2026.05.28 09:58전화평 기자

[현장] "AI 도입 빠른 한국, 확장은 병목…GPU보다 운영 역량이 승부처"

한국 기업들이 인공지능(AI) 도입과 초기 성과 창출 단계는 빠르게 넘어섰지만, 조직 전반으로 확장하는 과정에선 여전히 구조적 한계에 직면한 것으로 나타났다. 단순 그래픽처리장치(GPU) 확보를 넘어 전문 인력과 운영 역량, 데이터 주권·규제 대응, 전력·네트워크·냉각 등 AI 인프라 전반을 통합적으로 설계하는 능력이 향후 경쟁력을 좌우할 것이란 분석이 나온다. STT GDC 코리아는 27일 서울 여의도 FKI타워 본사에서 'AI 인프라 개발 현황 및 전망' 미디어 세션을 열고 이같은 연구 결과를 발표했다. 이번 연구는 STT GDC 의뢰로 시장조사업체 에코시스템이 수행했다. 한국을 포함해 일본·싱가포르·인도·인도네시아·말레이시아·필리핀·태국·베트남 등 아시아 9개국에서 제조·금융·공공·통신 등 10개 산업군 종사자 644명을 대상으로 진행됐다. 조사에선 ▲전략 ▲조직 준비도 ▲데이터 거버넌스 ▲현재 인프라 수준 ▲미래 확장 전략 등 5개 영역을 기준으로 기업 AI 인프라 성숙도를 평가했다.허철회 STT GDC 코리아 대표는 "AI 확산은 이미 시작됐지만 조직 전반에 실질적으로 확장된 사례는 아직 제한적"이라며 "이 격차는 기술을 넘어 데이터를 어디에서 처리하고 누가 통제권을 갖느냐와 연결된 문제"라고 말했다. 그러면서 "이러한 AI 인프라 역량은 기업 경쟁력과 국가 단위 디지털 주권까지 좌우하는 핵심 요소"라고 덧붙였다. STT GDC는 싱가포르에 본사를 둔 글로벌 데이터센터 전문기업이다. 현재 전 세계 100개 이상 데이터센터를 운영 중이며 글로벌 하이퍼스케일러와 엔터프라이즈 고객을 대상으로 코로케이션(상면 임대) 서비스를 제공하고 있다. 회사는 다음 달 서울 금천구 가산동에 국내 첫 AI 특화 데이터센터 'STT 서울1'을 개소하며 한국 시장 공략에 본격 나설 계획이다. 이날 발표된 보고서에 따르면 한국은 아시아 내 대표적인 AI 선도 시장으로 분류됐다. 국내 응답 기업 가운데 67%는 AI를 실제 운영 환경에 적용하는 '빌더(Builder)' 단계로 나타났으며 조직 전반에 AI를 통합한 '인테그레이터(Integrator)' 단계는 30%를 기록했다. 반면 AI를 핵심 경쟁력으로 완전히 내재화한 '리더(Leader)' 단계는 2%에 그쳤다. 이는 한국이 이미 AI 파일럿과 초기 도입 단계를 넘어 실질적인 투자와 운영 단계로 진입했지만, 시장 리더십 단계로 넘어가기 위한 확장 역량은 아직 제한적인 것으로 풀이된다. 실제 국내 응답자의 75%는 AI 프로젝트가 예상 이상의 투자수익률(ROI) 등 가치를 창출했다고 답했다. 이는 아시아 평균인 34%를 크게 웃도는 수준이다. 이에 대해 허 대표는 "한국은 이미 AI 도입의 가치를 입증하는 단계는 지나왔다"며 "이제 중요한 것은 이미 구축한 AI 환경을 얼마나 빠르고 안정적으로 확장하고 최적화할 수 있느냐"라고 설명했다. 이어 "경쟁력의 중심은 단순 장비 확보에서 운영 전문성과 최적화 역량으로 이동하고 있다"고 강조했다. AI 확산 과정에서 나타나는 핵심 병목으로는 전문 인력 부족과 운영 복잡성이 지목됐다. 국내 응답자의 52%는 복잡한 AI 인프라를 운영·최적화할 내부 전문성이 부족하다고 답했으며 48%는 초기 구축 및 운영 비용 부담을 주요 과제로 꼽았다. 또 52%는 데이터 주권과 규제 준수 이슈를 AI 확장의 제약 요인으로 지적했다. 특히 보고서는 많은 기업이 AI 인프라를 단순 GPU 확보 문제로 접근하고 있지만, 실제로는 스토리지·네트워크·전력·냉각·랙 설계 등 데이터센터 전반의 최적화 역량이 중요해지고 있다고 분석했다. 아시아 전체 응답 기업의 82%는 네트워크 병목이나 지연 문제를 경험하고 있었으며 AI 워크로드를 안정적으로 지원할 수 있는 고성능 저지연 네트워크를 갖춘 조직은 7%에 불과했다. 허 대표는 "GPU만 많다고 바로 AI 경쟁력이 만들어지는 것은 아니다"라며 "워크로드에 맞는 환경과 이를 안정적으로 운영할 수 있는 시스템 설계가 중요하다"고 짚었다. 또 그는 "최근 AI 서버를 담는 랙 하중이 과거보다 두세 배 이상 높아지고 있어 전력과 냉각, 구조 설계까지 모두 달라지고 있다"고 설명했다. STT GDC는 향후 AI 인프라 시장 경쟁력이 단순 구축 규모보다 운영 전략에서 갈릴 것으로 전망했다. 특히 AI 인프라 전문 기업과의 전략적 파트너십 수요가 확대될 것으로 내다봤다. 보고서 역시 AI 성숙도가 높은 조직일수록 인프라를 직접 보유하기보다 전문 사업자와 협력해 운영 효율성과 확장성을 확보하는 경향이 강하다고 분석했다. STT GDC는 이런 흐름에 맞춰 한국 시장에서도 AI 특화 데이터센터와 운영 서비스를 확대한다는 목표다. 회사는 향후 지방을 비롯한 국내 추가 데이터센터 부지 확보와 AI 인프라 운영 서비스 확대를 검토 중이다. 허 대표는 "한국 기업들이 다음 단계로 나아가기 위해선 운영 전문성과 규제 환경을 고려한 인프라 전략, 장기적인 성능과 지속가능성을 반영한 의사결정이 중요해질 것"이라며 "국내 AI 인프라 수요 확대에 맞춰 추가 데이터센터 부지 확보와 운영 확장을 지속 검토할 계획"이라고 밝혔다.

2026.05.27 17:10한정호 기자

"제조업 AX 성패, 암묵지 표준화에 달렸다"

국내 제조업의 인공지능 전환(AX)을 고도화하기 위해 이질적 데이터를 규격화하고, 사후학습을 지원하는 신경망처리장치(NPU) 개발이 시급하다는 지적이 나왔다. 단순한 디지털 전환(DX)을 넘어 인공지능(AI) 중심 완전 자동화를 구현하려면 현장 숙련공의 노하우인 '암묵지'를 데이터화하고, 이를 저비용·고효율로 학습할 수 있는 국산 반도체 생태계가 뒷받침돼야 한다는 내용이다. 차석근 첨단제조표준화포럼 위원장은 27일 서울 양재에서 개최된 '2026 시스템-반도체 포럼'에서 "이제는 DX를 넘어 AX로 나아가야 할 때"라며 "AX 성패는 결국 생산현장에서 다이내믹하게 움직이는 유효 데이터를 어떻게 수집하고 활용하느냐에 달려 있다"고 강조했다. 차 위원장은 "센싱 기술로 현장에 숨어 있는 암묵지 데이터를 끌어올려야 하고, 이를 위해 제각각인 생산현장 데이터를 표준화하는 작업이 선행돼야 한다"고 설명했다. 현재 제조현장의 실제 의사결정은 표준작업지침서(SOP) 같은 형식지보다 오랜 경험을 가진 숙련자 감에 크게 의존하고 있다. 차 위원장은 "베테랑 작업자들은 설비에서 발생하는 미세한 진동음, 제품의 색상 변화, 당일 습도 등 정형화되지 않은 조건을 종합 판단해 공정 변수를 미세 조정한다"고 말했다. 문제는 이러한 판단의 근거가 문서화되지 않아 데이터화하기 까다롭다는 점이다. 불량 예측, 수율 최적화, 이상 탐지 등 AI를 통해 달성하고자 하는 고부가가치 자동화 영역이 바로 이 암묵지에 집중돼 있다는 점이 제조업 AX의 가장 큰 난제다. 차 위원장은 발표자료에서 "기존 형식지만 AI에 학습시킬 경우 현장의 단편적 공정만 자동화될 뿐, 제조업의 핵심 가치를 AI 모델에 담기 어렵다"고 덧붙였다. 업계는 암묵지를 기계가 인식할 수 있는 구조화·표준화된 데이터 형태로 번역하고, 이를 기반으로 생산공정을 100% 자동화하는 데 역량을 집중하고 있다. 제조 데이터의 높은 이질성은 걸림돌이다. 공장 내부에는 여러 벤더의 설비와 서로 다른 세대 장비가 혼재돼 있다. 통신 프로토콜과 단위, 샘플링 주기, 태그 명명 규칙 등이 제각각 얽혀 있다. 이에 따라 일정한 규격에 맞춰 암묵지를 정제하는 표준화 프로세스가 필수다. "피지컬 AI 시대, 학습 가능한 NPU가 핵심" 포럼에서는 '학습 기능'을 내장한 NPU 개발 필요성도 논의됐다. 장성준 한국전자기술연구원(KETI) 센터장은 "현재 시장에 나와 있는 NPU가 주로 추론 기능에 초점이 맞춰져 있는 것은 사실이지만, 미래에는 NPU가 학습 기능까지 수행하는 방향으로 나아가지 않을까 한다"고 전망했다. 장 센터장은 "로봇 파운데이션 모델은 범용 작업에 특화돼 새로운 작업에 직면했을 때는 제대로 대응하지 못할 가능성이 크다"며 "생산현장에서 발생하는 소량 샘플 데이터만으로도 실시간 학습을 수행할 수 있는 능력이 필수이고, 이때 온디바이스 NPU나 그래픽처리장치(GPU)가 경량 학습을 지원할 수 있어야 한다"고 짚었다. 아울러 제조현장 내 온프레미스 환경에서 사후학습과 파인튜닝(미세조정) 역할이 커지고 있다고 덧붙였다. 그는 "중앙 GPU 데이터센터에서 1차로 학습된 거대 모델을 가져와 각 팩토리의 고유 데이터에 맞게 파인튜닝하는 과정이 핵심"이라며 "이 과정에서 NPU가 같이 학습을 담당할 수 있으면 총소유비용(TCO)이 절감될 것"이라고 설명했다. 다만 장 센터장은 "현재 국내 반도체 생태계에는 학습 기능을 지원하는 토종 NPU가 전무한 실정"이라며 "아마존웹서비스(AWS)의 트레이니움이나 구글의 텐서처리장치(TPU)처럼 국내에서도 학습을 지원하는 NPU가 나와야 한다"고 말했다.

2026.05.27 14:09진운용 기자

씨플랫폼, 제약·바이오 AI 전환 나선다…실행형 R&D 체계 전면에

씨플랫폼이 글로벌 인공지능(AI)·고성능컴퓨팅(HPC) 기업들과 손잡고 국내 제약·바이오 업계 AI 전환(AX) 시장 공략에 나선다. 단순 AI 도입을 넘어 실제 연구 성과와 운영 효율로 이어지는 실행 중심 AI 연구개발(R&D) 체계 구축 수요가 커지는 가운데, AI 인프라와 머신러닝·거대언어모델 운영관리(MLOps·LLMOps) 플랫폼을 결합한 통합 전략으로 시장 확대에 속도를 낸다는 목표다. 씨플랫폼은 HPE, 웨이츠&바이어시스(W&B), 노바디엑스와 함께 'AI 기반 제약·바이오·헬스케어 R&D 가속화 전략 세미나'를 개최해 국내 제약·바이오 산업을 위한 AI R&D 전략을 제시했다고 26일 밝혔다. 행사에는 국내 주요 제약·바이오·헬스케어 기업 IT 담당자와 AI 연구원 등 관계자 60여 명이 참석했다. 이번 세미나는 단순 기술 도입이 아닌 실제 연구 성과로 이어지는 실행 중심 AI 연구 체계 구축을 핵심 메시지로 내세웠다. 최근 제약·바이오 업계에선 생성형 AI와 LLM을 활용한 신약 개발과 후보물질 탐색 경쟁이 확대되고 있다. 하지만 실제 현장에선 AI 활용 사례 부족과 투자 대비 성과 불확실성, 데이터 관리 문제 등이 주요 과제로 떠오르고 있다. 실제 현장 설문조사 결과, 참석 기업들은 AI 도입의 가장 큰 걸림돌로 'AI 활용 사례 부족 및 투자 대비 ROI 불확실성(61.8%)'을 꼽았다. 이어 조직 내 AI 역량 부족(35.3%), 데이터 관리 및 실험 재현성 부족(29.4%), ML옵스 어려움(29.4%), 그래픽처리장치(GPU) 인프라 부족(26.5%) 순으로 나타났다. 업계 고민이 단순 인프라 확보 단계를 넘어 실제 업무 프로세스에 AI를 적용하고 운영 체계를 고도화하는 단계로 이동하고 있다는 분석이다. 이에 씨플랫폼은 AI 인프라와 ML옵스 플랫폼을 고객 연구 환경과 운영 목적에 맞춰 유연하게 결합하는 방안을 핵심 대안으로 제시했다. HPE는 대규모 AI 모델 학습과 추론에 최적화된 GPU 기반 고성능 인프라 전략을 소개했으며 데이터 처리부터 모델 학습·추론·운영까지 연결되는 AI 라이프사이클 전반 지원 구조를 강조했다. W&B는 실험 추적과 데이터·모델 버전 관리, 협업 환경 구축 등을 지원하는 ML옵스·LLM옵스 플랫폼을 소개했다. 반복 실험이 많은 AI 연구 환경에서 실험 재현성과 데이터 신뢰성을 확보해 실제 운영 환경 전환 속도를 높일 수 있다는 점을 내세웠다. 노바디엑스는 AI 인프라 설계부터 ML옵스 환경 구성까지 포함한 맞춤형 통합 구축 서비스를 선보였다. 아울러 아이티센클로잇은 멀티 AI 에이전트 관리 플랫폼 '에이전트고 2026'를 통해 연구 데이터 분석과 후보물질 탐색 자동화 전략을 발표했다. 최근 글로벌 제약·바이오 산업은 생성형 AI를 활용한 신약 후보물질 발굴과 임상 데이터 분석 경쟁이 본격화되면서 AI 인프라와 데이터 운영 체계 중요성이 빠르게 커지는 분위기다. 단순 모델 도입을 넘어 데이터 신뢰성과 실험 재현성, 운영 자동화 체계를 얼마나 안정적으로 구축하느냐가 핵심 경쟁력으로 부상하고 있다는 평가다. 김현석 W&B 한국지사장은 "W&B는 전 세계 LLM 개발 조직이 표준처럼 활용하는 플랫폼으로, 한국은 글로벌 사용량 톱3에 드는 핵심 시장"이라며 "앞으로 기업 AI 경쟁력은 모델 성능 자체를 넘어 실험과 데이터를 체계적으로 관리하고 이를 신속하게 운영 환경에 적용할 수 있는 역량에 달려 있다"고 설명했다. 백현범 씨플랫폼 본부장은 "제약·바이오 산업에서 AI는 이제 도입 여부가 아닌 실제 성과로 연결하는 운영 체계가 핵심 경쟁력"이라며 "HPE와 W&B 등 글로벌 파트너 생태계를 기반으로 고객들이 실질적으로 체감할 수 있는 AI R&D 실행 구조를 구축하는 데 앞장서겠다"고 강조했다.

2026.05.26 16:14한정호 기자

[현장] 김동훈 NHN클라우드 "AI 3강 이끌 핵심 인프라 기업 될 것"…글로벌 경쟁 승부수

"그래픽처리장치(GPU) 인프라 구축부터 운영, 인공지능(AI) 서비스 실행까지 아우르는 통합 실행 환경을 기반으로 대한민국 AI 전환을 뒷받침하는 국가대표 AI 인프라 기업으로 도약하겠습니다." 김동훈 NHN클라우드 대표는 26일 서울 중구 더플라자호텔에서 개최한 기자간담회에서 이같이 강조했다. 이날 NHN클라우드는 AI 인프라·플랫폼·서비스를 통합 제공하는 신규 AI 풀스택 브랜드 '팩토리X(FactoryX)'를 공개하고 중장기 AI 사업 전략을 발표했다. GPU 인프라 구축부터 운영 최적화, AI 에이전트 실행 환경까지 하나의 흐름으로 연결해 공공·민간 AI 전환 시장을 선도한다는 목표다. 회사는 최근 3년간 연평균 24% 성장세를 이어온 AI 사업을 기반으로 전체 매출 중 AI 사업 비중을 올해 38% 수준에서 오는 2027년 50%까지 확대하겠다는 목표도 제시했다. 김 대표는 "이제 AI 패권 경쟁 중심은 거대 모델 자체가 아니라 실제 비즈니스 환경에서 안정적으로 운영하고 비용을 최적화할 수 있는 실행 환경으로 이동하고 있다"며 "우리는 지난 7년간 GPU 인프라 시장을 개척하며 축적한 경험을 바탕으로 AI 실행 환경 경쟁력을 강화해왔다"고 말했다. "공랭으론 한계"…수랭식 GPU 데이터센터 승부수 NHN클라우드는 이날 가장 큰 경쟁력으로 대규모 GPU 인프라 구축·운영 경험을 내세웠다. 회사는 광주 국가 AI 데이터센터에서 아시아 최초로 엔비디아 H100 GPU를 도입한 바 있다. 또 지난해 정부 'AI 컴퓨팅자원 활용기반 강화 사업'을 통해 B200 GPU 7656장을 기반으로 국내 최대 규모인 4080장 단일 GPU 클러스터도 구축해 양평 데이터센터를 공식 론칭했다. NHN클라우드는 현재 광주 국가 AI 데이터센터와 양평 데이터센터를 기반으로 총 27.4엑사플롭스(EF) 규모 AI 인프라를 운영 중이다. 회사는 최근 크래프톤 GPU 클러스터 구축 사업도 수주하며 공공을 넘어 민간 AI 인프라 사업 영역도 확대하고 있다. 특히 수랭식 GPU 데이터센터를 자사 핵심 차별점으로 제시했다. 강민수 NHN클라우드 최고인프라책임자(CIO)는 "차세대 GPU 발열은 공랭 방식으로 더 이상 감당하기 어려운 수준"이라며 "수랭을 적용해 GPU 장애율을 약 3배 감소시키고 평균 무고장 시간도 2.6배 향상시켰다"고 설명했다. GPU 라이브·프로젝트X 공개…"AI 실행 환경 통합" 이날 공개한 팩토리X는 인프라·플랫폼·서비스 3개 레이어 구조로 구성된다. 인프라 영역에는 GPU 데이터센터와 서비스형 GPU(GPUaaS)가, 플랫폼 영역에는 GPU 통합 관리 플랫폼 'GPU 라이브'와 AI 개발 플랫폼 'AI 이지메이커'가 포함된다. 서비스 영역에는 AI 에이전트 실행 환경 '프로젝트X'가 배치된다. NHN클라우드는 팩토리X를 중심으로 AI 사업을 미래 핵심 성장축으로 육성할 계획이다. 현재 전체 매출 중 AI 사업 비중은 약 38% 수준이며 오는 2027년에는 기존 클라우드 사업과 AI 사업 비중을 50대 50 수준까지 확대한다는 목표를 제시했다. 김태형 NHN클라우드 최고기술책임자(CTO)는 "GPU를 그저 보유하는 것과 GPU를 잘 활용하는 것은 완전히 다른 문제"라며 GPU 운영 효율화 중요성을 강조했다. 이어 "GPU 활용률이 50% 수준에 머물 경우 대규모 클러스터 운영 기업은 연간 수백억원 규모 비용을 낭비할 수 있다"며 "GPU 라이브는 워크로드 우선순위 조정과 동적 자원 할당, 통합 모니터링 기능을 통해 GPU 활용률을 극대화하는 플랫폼"이라고 덧붙였다. 안성민 NHN엔터프라이즈 대표는 AI 에이전트 플랫폼 프로젝트X를 공개했다. 프로젝트X는 자연어 기반으로 기업 맞춤형 AI 에이전트를 설계하고 사내 시스템과 연결해 업무 자동화를 구현하는 서비스다. 퍼블릭·프라이빗 클라우드 환경을 모두 지원하며 보안과 통제 기능을 강화한 것이 특징이다. 특하 프로젝트X는 내부 시스템과 데이터, 도구를 단일 실행 흐름으로 연결해 24시간 업무 자동화를 지원하고 모델 컨텍스트 프로토콜(MCP) 기반 연동 구조를 통해 다양한 외부 에이전트와도 연결할 수 있도록 설계했다. 안 대표는 "AI 에이전트는 단순 챗봇이 아니라 실제 업무를 자율적으로 수행해야 한다"며 "프로젝트X는 사람·에이전트·도구·사내 시스템을 하나의 실행 흐름으로 연결하는 환경을 구축했다"고 밝혔다. "AWS·MS와도 경쟁 가능"…민간·글로벌 확장 시도 현장에선 정부 GPU 사업과 글로벌 클라우드 경쟁 전략, 일본 시장 확대 계획 등도 언급됐다. 김 대표는 글로벌 하이퍼스케일러와의 경쟁 전략에 대해 "7년간 축적한 운영 노하우를 바탕으로 인프라·플랫폼·서비스를 모두 제공할 수 있다는 점이 차별화 요소"라며 "글로벌 수준의 AI 실행 환경을 제공할 수 있다"고 말했다. 아마존웹서비스(AWS)·마이크로소프트(MS) 애저 등 글로벌 클라우드 선도 기업과의 경쟁에 대해서도 "AI 시장은 결국 속도전"이라며 "우리는 GPU 수급과 구축·운영을 국내에서 가장 빠르게 수행할 수 있는 기업 중 하나"라고 자신감을 드러냈다. 올해 정부 2조원 규모 GPU 확보·구축·운용지원 사업에 참여하지 않은 배경도 설명했다. 김 대표는 "현재 양평 데이터센터 GPU 자원이 대부분 가동 중이고 올해는 기존 사업 안정화에 집중하는 것이 우선이었다"며 "대신 포항 신규 데이터센터 프로젝트를 준비하며 차기 사업을 대비하고 있다"고 밝혔다. 공시를 앞둔 자회사 NHN인재아이엔씨와 이노그리드 합병에 따른 시너지에 대해선 공공·클라우드 운영 역량 통합과 GPU 사업 확대 측면에서 긍정적 효과를 기대한다고 설명했다. 또 일본 사업과 관련해선 NHN 그룹의 일본 사업 경험을 기반으로 AI·클라우드 시장 확장 가능성을 검토 중이라고 소개했다. NHN클라우드는 이날 공개한 팩토리X를 기반으로 공공과 민간의 다양한 고객 수요에 맞춰 프라이빗·퍼블릭 환경을 동시에 지원하는 형태로 발전시켜 나갈 계획이다. 김 대표는 "AI 핵심 기술을 보유한 나라와 그렇지 않은 나라의 산업 경쟁력 차이는 앞으로 훨씬 커질 것"이라며 "대한민국이 AI 3대 강국(G3)으로 도약할 수 있도록 인프라와 실행 생태계 구축의 최전선에서 역할을 하겠다"고 강조했다.

2026.05.26 15:01한정호 기자

[AI 고속도로] "GPU만으론 안 된다"…AI 데이터센터 경쟁력, 전력·냉각에 달려

인공지능(AI) 확산으로 데이터센터 투자 경쟁이 달아오르고 있지만 인프라 전략은 단순 증설보다 불확실성 대응에 초점을 맞춰야 한다는 주장이 제기됐다. 전력 확보, 냉각 방식, 입지 전략, 주권형 AI 구축 방식 등을 둘러싼 기존 통념이 최근 들어 빠르게 흔들리고 있어서다. 26일 가트너가 발표한 'AI 데이터센터에 대한 10가지 오해' 보고서에 따르면 AI는 데이터센터를 하나의 방향으로 바꾸는 것이 아니라 수요 불확실성, 전력 제약, 중앙집중형 학습과 분산형 추론, 표준화와 유연성 사이의 긴장을 동시에 키우고 있는 것으로 나타났다. 가트너는 "오는 2031년에는 AI 인프라 경쟁력의 핵심이 더 정확한 예측이 아닐 것"이라며 "불확실한 예측을 전제로 얼마나 빠르게 대응했는가에서 갈릴 것"이라고 내다봤다. 가트너는 장기 수요 예측에 대한 과신을 가장 먼저 경계했다. AI 모델 구조와 효율화 기술, 업무 부하 패턴이 빠르게 바뀌면서 AI 인프라 수요를 5년 단위로 정밀하게 예측하기 어려워졌다는 판단에서다. 또 AI 워크로드가 학습 중심에서 추론 중심으로 이동하고, 혼합 전문가 모델(MoE)이나 소형 특화 모델이 확산되면 필요한 컴퓨팅 자원 규모도 단기간에 달라질 수 있다고도 지적했다. 이처럼 수요 전망이 흔들리면 인프라 투자 방식도 달라질 수밖에 없다. 고정된 전망에 맞춰 대규모 설비를 한 번에 선투자할 경우 과잉 구축이나 자산 저활용 위험이 커지기 때문이다. 가트너는 "정적인 예측을 시나리오 기반 계획과 선택권 확보 전략으로 대체해야 한다"며 "모듈형 인프라, 단계적 투자, 하이브리드 조달 모델을 통해 수요 변화에 따라 빠르게 확장하거나 축소할 수 있는 역량을 확보해야 한다"고 제언했다. 수요 불확실성은 워크로드 배치 전략에도 영향을 미치고 있다. 기존에는 AI 인프라가 하이퍼스케일 데이터센터에 집중될 것이라는 전망이 많았지만, 가트너는 이를 단순화된 해석으로 봤다. 가트너는 "대규모 학습은 여전히 중앙집중형 클러스터에 적합하지만, 추론은 지연시간과 데이터 주권, 이용자 근접성 때문에 지역 거점과 엣지 인프라로 분산될 가능성이 크다"고 분석했다. 이에 따라 데이터센터 사업자와 클라우드 기업은 단일 초대형 캠퍼스 중심 전략만으로 AI 수요 변화에 대응하기 어려워질 전망이다. 대규모 학습은 고성능 그래픽처리장치(GPU)가 밀집된 대형 클러스터에서 처리하되, 추론은 이용자와 데이터 발생 지점에 가까운 지역 거점으로 분산 배치하는 방식이 요구된다. 워크로드가 분산되면 입지 전략의 기준도 달라지게 될 것으로 보인다. 단순히 네트워크 연결성이 좋은 핵심 권역에 데이터센터를 짓는 것만으로는 충분하지 않아서다. 가트너는 "전력 확보는 더 이상 단순한 조달 문제가 아니라 AI 인프라가 어디에서, 얼마나 빠르게 확장될 수 있는지를 결정하는 전략적 제약"이라며 "입지 선정, 용량 계획, 구축 일정을 전력망 현실에 맞춰 조정해야 한다"고 강조했다. 송전망 접속 지연, 전력망 한계, 인허가 기간도 데이터센터 건설이나 서버 도입 주기보다 길어질 수 있다는 점에서 주목해야 할 부분이다. AI 가속기와 고밀도 랙을 확보해도 전력망 연결이 늦어지면 실제 가동은 지연될 수 있다는 점도 고려해야 한다. 이 때문에 데이터센터 입지 경쟁은 기존 핵심 권역 중심에서 전력 확보 가능성, 건설 속도, 비용, 규제 리스크를 함께 따지는 방식으로 바뀌고 있다. 전력 제약은 냉각 전략 변화로도 이어진다. AI 서버 밀도가 높아질수록 기존 공랭식만으로는 대응하기 어려운 구역이 늘어나기 때문이다. 가트너는 "고밀도 AI 클러스터에는 액체냉각이 필수적이지만, 모든 설비가 액체냉각으로 전환되지는 않을 것"이라며 "일반 기업용 워크로드나 혼합형 데이터센터에서는 공랭식도 여전히 유효하다"고 분석했다. 이에 따라 전면적인 액체냉각 전환보다 혼합 냉각 전략이 현실적인 대안으로 제시된다. 고밀도 AI 구역에는 액체냉각을 적용하고, 기존 업무나 낮은 전력밀도 구역에는 공랭식을 유지하는 방식이다. 이는 기존 데이터센터의 역할 변화와도 연결된다. 가트너는 AI가 전통 데이터센터를 대체할 것이라는 전망도 오해로 분류했다. 기업 애플리케이션, 서비스형 소프트웨어(SaaS), 일반 클라우드 서비스는 앞으로도 상당 부분 기존 환경에서 운영될 가능성이 크다. 다만 AI 확산으로 전력밀도, 냉각, 전기 인프라 재설계 요구가 커지면서 기존 데이터센터를 선별적으로 업그레이드하는 현대화 전략이 중요해지고 있다. 기존 인프라를 어떻게 활용할지는 주권형 AI 전략과도 맞닿아 있다. 가트너는 주권형 AI를 완전한 국내 인프라 스택 구축으로만 해석해서는 안 된다고 봤다. 데이터 통제, 운영 거버넌스, 선택적 인프라 현지화를 조합하고, 민감 데이터나 규제 대상 워크로드는 로컬 인프라에 두되 대규모 연산이나 범용 업무는 글로벌 플랫폼을 활용하는 혼합 접근이 필요하다고 분석했다. 기술 변화 속도가 빠른 만큼 표준화 전략도 고정형 설계에서 벗어나야 할 것으로 보인다. 표준 랙 설계와 참조 아키텍처는 구축 속도와 일관성을 높이지만, AI 하드웨어와 전력밀도, 냉각 요건이 빠르게 바뀌는 환경에서는 오히려 전략적 위험을 키울 수 있어서다. 이에 가트너는 고정 구성 전체가 아니라 모듈과 인터페이스 수준에서 표준화해야 한다고 제안했다. 국내 데이터센터와 클라우드 업계도 같은 과제를 안고 있다. GPU 클러스터 확보만으로는 AI 인프라 경쟁력을 설명하기 어렵다는 점에서다. 이에 전력, 냉각, 입지, 주권형 AI, 기존 설비 현대화까지 묶어 포트폴리오 관점에서 접근해야 한다. 가트너는 "AI는 데이터센터 전략을 알려진 전제에 기반한 최적화에서 불확실성 아래의 의사결정으로 전환시키고 있다"며 "기존 통념에 계속 의존하는 조직은 과잉 구축, 잘못된 용량 배치, 유연하지 않은 설계에 묶일 위험이 있다"고 분석했다. 이어 "선도 조직은 모듈형 아키텍처, 분산형 배치 모델, 하이브리드 에너지 전략, 포트폴리오 기반 입지 결정을 통해 변화에 대응하고 있다"고 덧붙였다.

2026.05.26 10:58장유미 기자

[현장] NHN클라우드, AI 풀스택 '팩토리X' 출사표…"국가대표 인프라 기업 도약"

NHN클라우드가 인공지능(AI) 풀스택 브랜드 '팩토리X(FactoryX)'를 앞세워 국가대표 AI 인프라 기업 도약에 나선다. 그래픽처리장치(GPU) 인프라 구축부터 운영 최적화, AI 에이전트 실행 환경까지 아우르는 통합 구조를 통해 공공·민간 AI 전환(AX) 시장 공략을 이끈다는 목표다. 김동훈 NHN클라우드 대표는 26일 서울 중구 더플라자호텔에서 개최한 기자간담회에서 "GPU 인프라 구축부터 운영, AI 서비스 실행까지 아우르는 통합 실행 환경 팩토리X를 기반으로 대한민국 AI 전환을 뒷받침하는 국가대표 AI 인프라 기업으로 도약하겠다"고 밝혔다. NHN클라우드가 이날 공개한 팩토리X는 AI 인프라·플랫폼·서비스를 통합 제공하는 AI 풀스택 브랜드다. 대규모 AI를 생산하는 공장을 뜻하는 '팩토리(Factory)'와 NHN클라우드의 경험(eXperience), 고객의 AI 전환(AX)을 의미하는 'X'를 결합했다. 회사는 기업 AI 프로젝트가 개념검증(PoC) 단계에 머무르는 문제를 해결하기 위해 GPU 확보부터 운영, AI 에이전트 실행까지 이어지는 3단계 통합 실행 환경을 구현했다고 설명했다. 이를 통해 고객의 AI 전환 전 과정을 지원하는 핵심 파트너 역할을 수행하겠다는 구상이다. 김 대표는 이날 발표에서 "100개 기업 중 GPU를 제대로 활용하는 곳은 7곳뿐"이라며 AI 인프라 운영 효율 중요성을 강조했다. 그는 "과거에는 모델 경쟁이었다면 이제는 인프라 경쟁으로 전환되고 있다"고 진단했다. 먼저 NHN클라우드는 자사 AI 인프라 경쟁력으로 광주 국가 AI 데이터센터와 정부 GPU 사업 경험을 내세웠다. 회사는 광주 국가 AI 데이터센터에서 아시아 최초로 엔비디아 H100 GPU를 도입했고 국내 최초 GPU 전용 데이터센터 구축 경험도 확보했다고 밝혔다. 또 지난해 정부 'AI 컴퓨팅자원 활용기반 강화 사업'을 통해 B200 GPU 7656장을 구축하고 국내 최대 규모인 4080장 단일 GPU 클러스터를 상용화했다. 여기에 수랭식 GPU 냉각 시스템을 적용해 GPU 장애율을 기존 공랭식 대비 약 3배 낮추고 안정성을 높였다. 플랫폼 영역에선 GPU 통합 관리 플랫폼 'GPU 라이브'와 AI 개발 플랫폼 'AI 이지메이커'를 공개했다. GPU 라이브는 학습·추론 워크로드를 자동 분리하고 동적 자원 할당 기능을 통해 GPU 활용률을 높이는 플랫폼이다. AI 이지메이커는 모델 학습부터 배포·운영까지 전 과정을 지원하는 AI 개발 플랫폼이다. 마지막 서비스 영역에선 AI 에이전트 실행 환경 '프로젝트X'도 선보였다. 올해 하반기 출시 예정인 프로젝트X는 비개발자도 자연어 기반으로 기업 맞춤형 AI 에이전트를 설계할 수 있도록 지원하는 서비스다. 사내 시스템과 데이터를 연동해 24시간 업무 자동화를 구현하는 것이 특징이다. NHN클라우드는 팩토리X를 중심으로 AI 사업을 미래 핵심 성장축으로 육성할 계획이다. 최근 3년간 연평균 24% 성장세를 이어온 AI 사업을 바탕으로 전체 매출 중 AI 사업 비중을 50% 이상까지 확대하겠다는 목표도 제시했다. 김 대표는 "국내 기업들이 데이터 주권을 지키며 AI 비즈니스를 영위하기 위해선 독자적인 인프라 생태계가 필수적"이라며 "팩토리X를 통해 기업들이 가장 안정적으로 AI를 실행하고 이를 실제 비즈니스 성장으로 연결할 수 있도록 지원하겠다"고 강조했다.

2026.05.26 10:43한정호 기자

AI 시대 '리타이머' 뜬다…신호 심폐소생술 핵심 부품

인공지능(AI) 반도체 시대 숨은 핵심 부품으로 '리타이머(Retimer)'가 떠오르고 있다. 리타이머는 칩과 칩 사이에서 약해진 신호를 되살려 다시 보내는 부품이다. 중앙처리장치(CPU)와 그래픽처리장치(GPU) 간 통신 속도가 빨라지면서 역할이 커지고 있다. 서버 안에서 CPU와 CPU, CPU와 GPU는 PCIe(Peripheral Component Interconnect Express)로 통신한다. PCIe 세대가 올라갈수록 통신속도가 빨라져 채널 손실 문제가 발생한다. 채널 손실은 신호가 약해지고 파형이 일그러지는 형상이다. 24일 국내 시스템 반도체 업체 한 고위 관계자는 "CPU끼리, 그리고 CPU와 GPU 간 PCIe로 통신을 많이 한다"며 "이 거리가 멀어지고, 속도도 빨라지며, 채널 수가 많아지면서 '리타이머'라는 칩들이 많이 사용되기 시작했다"고 밝혔다. 현재 고성능 서버는 PCIe 5.0을 쓴다. 속도는 32GT/s(초당 기가트랜스퍼)다. 이 속도에서는 초저손실 인쇄회로기판(PCB)을 써도 신호가 온전히 도달하는 거리가 매우 짧다. 리타이머는 이때 죽어가는 신호를 되살려 먼 거리에서도 프로세서 간 고속통신이 가능하도록 지원한다. 과거에는 리드라이버(Redriver)를 썼다. 리드라이버는 약해진 신호를 강화만 하고 신호를 완전히 복원하지는 못한다. 반면 리타이머는 신호를 완벽히 복원한다. 이 차이가 리타이머 수요를 끌어올리는 요인이다. 핵심은 PCIe 세대가 거듭될수록 속도가 빨라져 신호가 온전히 도달하는 거리가 짧아진다는 점이다. 거리가 짧아지면 더 많은 리타이머가 필요하다. 수요가 기하급수적으로 늘 수밖에 없다. 앞선 관계자는 "통신속도가 증가하면서 리타이머가 필요한 수는 지금보다 여러 배 이상 늘어날 것"이라고 내다봤다. 대표적인 리타이머 기업 아스테라 랩스 매출도 늘고 있다. 올해 1분기 매출은 3억 840만 달러로 전년 같은 기간보다 2배 가까이 늘었다.

2026.05.24 08:00진운용 기자

'메모리 월' 부순다…GPU·HBM '광연결' 패키징 부상

인공지능(AI) 반도체 고질적 난제로 꼽히는 '메모리 월(Memory Wall)'을 허물기 위한 해법으로, 그래픽처리장치(GPU)와 고대역폭메모리(HBM)를 떼어내 따로 패키징하는 방안이 국내외 메모리·패키징 업계에서 논의되고 있다. 그동안 GPU 바로 옆에 붙여 온 HBM을 일정 거리 떨어뜨리는 대신, 그 사이를 '빛(옵티컬)'으로 연결해 지금보다 수 배 더 많은 HBM을 탑재하는 것이 뼈대다. 22일 한 국내 대형 메모리 제조사 연구원은 "현재 HBM 대역폭과 용량 확대에 어려움을 겪고 있는데, 이를 광연결로 GPU의 쇼어라인(Shoreline) 한계를 극복하고 HBM을 보다 많이 탑재하는 안을 고객사와 논의하고 있다"고 밝혔다. 쇼어라인은 테두리 길이를 말한다. 현재 AI 컴퓨팅 환경에서 연산효율을 떨어뜨리는 핵심요인은 메모리 반도체의 데이터 전송속도다. 연산장치인 GPU 성능은 세대를 거듭하며 비약적으로 성장하는 반면, 데이터를 저장하고 공급하는 메모리 속도가 이를 따라가지 못하며 구조적 성능 장벽(메모리 월)이 형성됐다. 대규모 데이터 통로를 확보한 HBM 등장으로 급한 불은 껐지만 폭증하는 AI 연산량을 감당하기에는 여전히 대역폭과 전송속도가 부족하다는 지적이 이어지고 있다. 그동안 반도체 업계는 한정된 공간에서 메모리 용량과 대역폭을 늘리기 위해 HBM을 수직으로 높게 쌓는 단수 확대에 집중해 왔다. 그러나 12단, 16단을 넘어 20단 이상으로 적층 수가 늘면서 공정 난도는 기하급수적으로 올라갔다. 제한된 높이 규격을 맞추기 어려워지는 등 물리적 한계에 봉착했다. 국제반도체표준협의기구(JEDEC)가 HBM 높이 규격을 완화할 만큼 수직 적층 기술은 임계점에 도달했다. 더 큰 문제는 단수를 높이지 못할 경우 GPU 주변에 HBM의 수를 수평으로 늘려야 하지만, 이마저도 불가능하다는 점이다. 현재 2.5D 패키징 구조에서는 GPU와 HBM이 하나의 기판 위에 밀착해 탑재된다. 이 구조에서는 GPU 칩 테두리의 한정된 길이, 즉 쇼어라인 영역 내에 배치할 수 있는 HBM 수량이 엄격히 제한될 수밖에 없다. 더 많은 HBM을 탑재하고 싶어도 물리적으로 배치할 공간이 허락되지 않는 구조적 교착상태에 빠진 것이다. 국내외 반도체 업계에서 떠오른 대안이 GPU와 HBM을 분리해 따로 패키징하는 방안이다. 데이터 전송시간을 최소화하기 위해 칩 옆에 밀착해야 한다는 기존 반도체 설계를 뒤집는 발상이다. 두 칩을 분리해 거리를 두는 대신, 압도적으로 빠른 빛 신호를 이용해 연동함으로써 늘어난 물리적 거리를 극복하는 메커니즘이다. HBM을 GPU 보드 내에서 조금 떨어뜨려 배치하면 GPU 쇼어라인 한계에서 자유로워진다. 공간 제약이 사라져 단수를 무리하게 높이지 않고도 HBM을 옆으로 넓게 펼쳐 지금보다 수 배 이상 많은 양을 보드 안에 탑재할 수 있다. 이는 AI 가속기 시스템 전체 메모리 용량과 데이터 대역폭이 지금과 비교할 수 없을 정도로 급격히 확대됨을 의미한다. "HBM, GPU 밑단 배치 논의"…폼팩터 변화할 수도 현재 업계에선 HBM을 GPU 보드 내부 어디에 놓을지를 두고 다양한 아키텍처 설계안이 도출되고 있다. 앞선 메모리 연구원은 "GPU 바로 주변 공간을 넓게 활용하는 방안부터, GPU 보드 밑단으로 격리하는 방안 등이 논의되고 있다"며 "후자(GPU 보드 밑단으로 격리하는 방안)의 경우, 메인보드를 세로로 길게 확장해야 해 전반적인 폼팩터 변형까지 GPU 업체와 논의 중"이라고 말했다. 구체적으로 HBM이 수 센티미터(cm) 떨어진 상태에서 GPU를 둘러싸거나, 보드 중앙에 따로 HBM 영역을 만든다는 설명이다. 그는 "모든 경우의 수를 열어두고 최적 배치를 논의하고 있다"며 "아직 공식 로드맵으로 확정된 것은 아니지만, 차세대 AI 가속기 구현을 위한 선행연구 차원에서 파트너와 얘기를 나누고 있다"고 덧붙였다. 외주반도체패키징테스트(OSAT) 업계도 이 같은 흐름을 예의주시하고 있다. 글로벌 OSAT 업체 한 관계자는 "광연결은 명확한 흐름이다. 다만 문제는 시점"이라며 "랙과 랙, 그리고 서버와 서버가 먼저 빛으로 연결되고 그 다음 보드 안에 있는 칩끼리 빛으로 이어질 것"이라고 전망했다. 이어 "큰 단위부터 빛으로 연결되겠지만, 현재 옵티컬 연구 속도가 매우 빨라 그리 먼 얘기는 아닐 수 있다"고 기대했다. 기술적으로 보면 GPU와 HBM을 잇는 광연결 기술은 데이터센터에서 서버와 서버 사이를 연결하는 기술과 원리 면에서 일맥상통한다. 다만 대형 장비 간 통신에 쓰이던 광전환 기술을 하나의 보드 및 칩셋 내부 미시적 영역으로 축소해야 한다는 점에서 기술 장벽이 높다. 국내 공동패키징광학(CPO) 소자 개발업체 한 관계자는 "HBM 적층 높이가 한계에 다다르면서 이를 옆으로 넓게 펼쳐 물리적 탑재량을 극대화하는 안이 논의되고 있다"며 "원리는 기존 데이터센터 광연결과 같지만 제한된 보드 공간 내에 구동해야 하는 HBM 광연결은 광소자를 훨씬 더 작고 집적도 높게 미세화해야 해 기술 난도가 더 높다"고 설명했다.

2026.05.22 12:27진운용 기자

유용균 국가과학AI센터 단장 "'AI 과학자'로 노벨상급 성과 목표"

"우리 목표는 범용 인공지능(AI)을 연구하는 것이 아닙니다. 과학자가 AI로 이전보다 수백 배 더 많은 성과를 낼 수 있도록 지원하는 것입니다. 연구자 한 명이 AI 과학자 10명, 100명을 활용해 노벨상급 성과를 내는 것이 장기 목표입니다." 유용균 국가과학AI연구센터 운영 단장은 22일 지디넷코리아를 만나 센터 목표를 이같이 밝혔다. 과학자 한 명이 AI 에이전트로 연구 성과를 내는 환경을 구축하고, 장기적으로는 네이처급 논문과 노벨상급 연구 성과를 창출할 수 있는 국가 과학 AI 생태계를 조성하겠다는 구상이다. 센터는 국가과학기술연구회(NST) 산하에 설치돼 정부 출연 연구기관 AX, 과학 AI 연구를 주도한다. 한국원자력연구원 AI응용연구실장이던 유 단장은 알파고 충격 2016년부터 관련 논의를 진행했다. 센터는 내주 공식 출범을 앞뒀다. 유 단장은 과학 특화 AI 연구소가 필요한 이유로 과학계와 최신 AI 기술 간 격차를 꼽았다. 기존 AI 연구기관이 범용 지능이나 컴퓨터과학 중심으로 설계됐지만 생명과학·소재·원자력 등 과학 도메인 연구자들은 AI 모델 최적화와 대규모 그래픽처리장치(GPU) 활용 역량을 충분히 갖추지 못했다는 지적이다. 그는 "출연연과 도메인 연구자들이 실제 활용하는 AI 기술은 IT 업계 최신 수준과 비교해 2년 가량 차이가 있다고 본다"고 말했다. 센터는 올해 'AI 과학자 플랫폼' 베타 서비스 공개를 추진한다. 초기에는 연구자가 공통적으로 수행하는 문헌조사, 기술동향 보고서 작성, 코드 작성, 논문·보고서 초안 구성, 발표자료 제작 등 반복적 업무 자동화에 초점 맞춘다. 이후 고차원적인 연구 판단과 실험 설계를 AI로 추진할 수 있도록 시스템을 강화할 방침이다. 그는 "연구자 일상 업무부터 줄여 실제 활용도를 높일 것"이라며 "이후 AI 적용 범위를 넓히는 게 목표"라고 말했다. 유 단장은 센터가 직접 모든 기술을 자체 개발하지 않는다고 말했다. 그는 "우수한 민간 AI 솔루션을 플랫폼 위에 올려 연구자가 선택적으로 활용할 수 있는 마켓형 구조를 구상하고 있다"며 "연구자에게 바우처를 지급해 여러 AI 서비스를 사용하도록 하고, 실제 활용량에 따라 기업에 비용을 정산하는 방식으로 이뤄질 것"이라고 설명했다. 이어 "센터가 모든 것을 처음부터 만들기보다 민간이 잘하는 영역은 적극적으로 연결해 연구자들이 더 빨리 활용할 수 있게 하겠다"고 말했다. 유 단장은 연구현장에 AI 인프라 정비하는 것을 장기 목표로 제시했다. 연구자가 GPU 종류나 배정 방식을 직접 고민하지 않아도, AI 시스템이 연구 과제 규모·난이도에 따라 적절한 연산 자원을 자동 배분하는 환경을 구축하겠다는 것이다. 그는 "간단한 작업은 작은 GPU에, 대규모 연산이 필요한 작업은 더 큰 자원에 자동으로 할당하는 환경"이라며 "연구자는 결과에만 집중할 수 있게 만드는 것이 목표"라고 말했다. 유 단장은 출연연 특유 보안 제약을 해소하는 것도 핵심 과제라고 봤다. 민감한 연구 데이터와 아이디어를 외부 상용 AI에 입력하기 어려운 게 현실이기 때문이다. 이에 출연연 내부에서만 접근 가능한 온프레미스형 AI 활용 환경을 마련할 계획이다. 그는 "연구자가 보안 우려 없이 데이터와 질문을 올리고 AI를 활용할 수 있는 연구용 샌드박스를 올해 시제품 수준까지 구축할 것"이라고 구상을 밝혔다. "K-과학용 AI 모델 절실…기관 업무 사일로 해소 필요" 유 단장은 한국에 과학 특화용 AI 모델이 필요하다고도 봤다. 이를 위해 기관 간 역할 분담과 협업 체계 정비가 필요하다고 주장했다. 그는 "연구 조직들이 각자 독립적으로 움직이기보다, 국가 차원에서 필요한 기능을 나누고 상호 보완하는 구조를 만들어야 한다"며 "과학 AI 두뇌가 될 연구용 특화 파운데이션 모델은 센터 단독으로 모두 개발하기 어렵다"고 설명했다. 그러면서 "관련 조직이 센터 수요에 맞는 모델을 공급하는 식의 협업이 필요하다"며 "현재 추진 중인 독자 파운데이션 AI 모델 프로젝트와 긴밀한 역할 조정이 필요하다"고 주장했다. 유 단장은 장기적으로 과학 AI가 한국 연구 경쟁력 분수령이 될 것으로 봤다. 미국과 중국이 이미 빠르게 앞서가는 상황에서 인력 규모가 상대적으로 작은 한국은 연구방식 자체를 더 효율적으로 바꾸지 않으면 격차를 좁히기 어렵다고도 짚었다. 그는 "우리는 더 효율적으로 연구해야 한다"며 "과학 AI는 한국 과학기술 경쟁력을 끌어올릴 수 있는 가장 기본적인 토대가 될 것"이라고 강조했다.

2026.05.22 10:03김미정 기자

"AI 승부처는 컴퓨팅"…앤트로픽, 일론 머스크 '스페이스X'에 61조원 베팅

인공지능(AI) 모델 경쟁이 '컴퓨팅 전쟁'으로 번지고 있다. 앤트로픽이 클로드 수요 확대에 대응하기 위해 일론 머스크의 스페이스X와 대규모 컴퓨팅 계약을 맺으며 생성형 AI 시장의 승부처가 데이터센터와 전력 인프라로 빠르게 옮겨가는 모습이다. 20일(현지시간) 블룸버그통신에 따르면 앤트로픽은 향후 3년간 스페이스X에 컴퓨팅 자원 이용료로 약 450억 달러(약 61조 2000억원)를 지급하기로 했다. 이번 계약은 스페이스X가 기업공개(IPO) 관련 증권 신고서에서 공개한 내용이다. 이 계약에 따라 앤트로픽은 2029년 5월까지 매월 12억 5000만 달러를 스페이스X에 지급할 예정이다. 다만 컴퓨팅 용량이 단계적으로 늘어나는 올해 5월과 6월에는 할인된 요금이 적용된다. 양사는 90일 전 통보 시 계약을 종료할 수 있는 조항도 포함했다. 이번 계약은 앤트로픽이 클로드 서비스 확장을 위해 필요한 대규모 연산 자원을 확보하는 데 초점이 맞춰졌다. 생성형 AI 서비스 경쟁이 모델 성능을 넘어 데이터센터, 전력, 그래픽처리장치(GPU) 등 인프라 확보전으로 번지는 가운데 앤트로픽도 장기 계약을 통해 컴퓨팅 병목 해소에 나선 셈이다. 앤트로픽은 이달 초 멤피스에 위치한 스페이스X의 대형 데이터센터 '콜로서스 1'에서 300MW 이상의 컴퓨팅 용량을 이용하는 계약을 체결했다고 밝힌 바 있다. 당시 구체적인 금액은 공개하지 않았다. 이후 앤트로픽은 스페이스X의 두 번째 데이터센터 용량까지 포함하도록 협력 범위를 넓힌 것으로 알려졌다. 이번 거래는 AI 시장 경쟁 구도에서도 주목된다. 스페이스X는 올해 초 머스크의 xAI와 합병한 뒤 AI 인프라 사업 수익화를 확대하고 있다. 앤트로픽과 xAI는 고성능 AI 모델 개발을 놓고 경쟁하는 관계지만, 인프라 수요가 폭증하면서 경쟁사 간 대규모 컴퓨팅 거래가 성사됐다. 스페이스X 입장에선 AI 인프라 임대가 새로운 매출원으로 부상할 가능성이 커졌다. 회사는 신고서에서 다른 기업들과도 유사한 컴퓨팅 파워 계약을 체결할 것으로 예상한다고 밝혔다. 업계에선 이번 계약이 AI 기업들의 비용 구조를 다시 보여주는 사례라고 분석했다. 클로드를 앞세운 앤트로픽이 기업 고객과 개발자 수요를 빠르게 흡수하고 있는 만큼, 안정적인 컴퓨팅 자원 확보가 서비스 경쟁력과 직결된다고도 봤다. 앤트로픽은 이번 계약에 대해 공동창업자이자 최고컴퓨트책임자인 톰 브라운의 게시글을 안내하는 것 외에는 별도 입장을 내지 않았다. 브라운은 "이번 협력은 앤트로픽이 고객 수요 증가에 맞춰 필요한 컴퓨팅 용량을 확보하는 데 중요한 역할을 할 것"이라고 말했다.

2026.05.21 14:21장유미 기자

열 때문에 GPU 성능 반토막…"일부라도 수랭 전환해야"

"공랭식 데이터센터에서 고성능 GPU 서버를 풀가동하면 온도가 80도까지 치솟고, 심하면 100도를 넘기기도 합니다. 결국 장비 과열을 막기 위해 GPU 성능을 강제로 낮출 수밖에 없죠. 전산실 환경 때문에 AI 연산 성능이 반토막 나는 셈입니다." 김종훈 엠키스코어 기업부설 연구소장은 21일 경기도 남양주시에 마련된 '아쿠아엣지(AQUAEdge)' 데모센터에서 이같이 말하며 데이터센터 가동률 저하의 주요 원인으로 공랭식 냉각 구조의 한계를 지목했다. 김 소장은 "대당 14.3kW에 달하는 전력을 소비하는 차세대 GPU 서버는 기존 공랭식 시스템만으로 감당하기 어렵다"며 "초기 투자 비용이나 인프라 개조 부담이 크다면 데이터센터 전체를 새로 구축하기보다 전산실 일부 존(Zone)부터 수랭식 직접 액체 냉각(DLC) 환경으로 전환하는 하이브리드 전략이 가장 현실적인 대안"이라고 강조했다. 집적도 극에 달한 AI 인프라, 수랭 전환은 필연 엔비디아 B200과 같은 AI 특화 GPU는 대규모 언어 모델(LLM) 학습과 추론을 위해 초고속 인터커넥트 기술과 고대역폭 메모리(HBM)를 집적한 것이 특징이다. 여기에 AI 서버는 이러한 GPU를 랙 단위로 고밀도 집적해 운영하기 때문에 막대한 발열이 발생할 수밖에 없다. GPU의 안정적인 운영을 위한 권장 온도는 통상 60도 이하 수준이지만 실제 고부하 환경에서는 80도를 넘어 최대 100도 이상까지 상승하기도 한다. 김 소장은 "반도체 미세공정 발전으로 칩 단위 면적당 트랜지스터 집적도는 급격히 높아졌지만 열을 외부로 방출할 수 있는 표면적은 제한적"이라며 "열이 칩 중심부에 집중되는 현상이 심화되면서 기존 공랭식만으로 대응하기에는 한계에 도달했다"고 설명했다. 또 급증하는 발열을 해소하기 위해 항온항습기(CRAC·CRAH) 등을 대규모로 추가 설치할 경우 장비 설치 공간이 부족해지는 악순환도 발생한다. 기하급수적으로 늘어나는 냉각 전력 비용과 대형 팬이 풀로드로 구동되며 발생하는 극심한 소음 역시 운영 효율성을 저해하는 주요 원인이다. 반면 수랭식 직접 액체 냉각(DLC) 방식은 배관 내 액체로 열을 즉각 흡수해 칩 온도를 60도 이하로 제어한다. 발열 원인을 직접 식히기 때문에 공랭식 대비 냉각 비용을 최대 94%까지 절감할 수 있다는 설명이다. 그는 "수랭식 직접 액체 냉각(DLC)을 도입하면 서버 자체 소비 전력도 약 13% 줄일 수 있어 통상 2~4년 내 초기 투자 비용(CAPEX)을 회수할 수 있는 현실적인 대안으로 평가받는다"며 "공랭식 서버 내부 팬이 풀로드로 구동할 때 발생하는 120~130dB 수준의 소음도 68~90dB 수준까지 크게 낮출 수 있다"고 소개했다. "모형 아닌 실구동"...수랭식 불안감 해소 현재 엠키스코어는 경기도 남양주에 아쿠아엣지 데모센터를 운영 중이다. 국내에서 실제로 구동 중인 직접 액체 냉각(DLC) 서버 시스템을 직접 확인하고 검증할 수 있는 공간이 사실상 전무하기 때문이다. 김 소장은 "일반 전시장에 출품되는 냉각 장비는 대부분 전원이 연결되지 않은 단순 모형에 불과해 많은 기업이 누수나 유지보수 등 수랭식 시스템에 대한 기술적 불안감과 오해를 안고 도입을 주저해 왔다"며 "특히 기존 데이터센터를 어떻게 수랭식으로 전환할 것인지 고민하는 기업들이 직접 볼 수 있는 공간을 제공하고자 했다"고 설명했다. 데모센터에는 기존 공랭식 공간을 수랭식 환경으로 개조한 하이브리드 냉각 시스템이 운영 중이다. 칩 위에 장착된 콜드플레이트 사이로 냉각수가 흐르며 실제 고부하 연산 과정에서 발생하는 열을 제어하는 실구동 인프라다. 김 소장은 "국내에서 실제 운영 중인 DLC 서버를 직접 확인할 수 있는 곳이 거의 없다 보니 수많은 업계 관계자가 방문하고 있다"며 "외기 온도가 38~40도까지 치솟는 극한 환경을 가정한 신뢰성 테스트를 통해 누수 우려 등 수랭식에 대한 편견을 해소하고 기술적 타당성을 검증해 기업들의 도입 리스크를 최소화하고 있다"고 밝혔다. 누수까지 자동 차단...통합 관제 기술로 안정성 확보 데모센터에 마련된 냉각 시스템은 엠키스코어가 자체 개발한 'M-OWL' DLC 대시보드를 통해 통합 관제된다. 냉각수의 온도·유량·압력 상태뿐만 아니라 전체 GPU 상태, 쿠버네티스(K8S) 리소스, 슬럼 워크로드 매니저(Slurm) 스케줄러 등 IT 워크로드 데이터를 실시간 연계 분석해 이상 징후를 조기에 감지한다. 누수가 감지되면 제어부가 해당 랙의 서버를 자동으로 안전 종료하는 보호 메커니즘도 갖췄다. 김 소장은 "문제가 발생했을 때 이를 해결할 수 있는 기술적 역량을 직접 확보하고 있어야 운영 효율을 실질적으로 높일 수 있다"며 "단순히 수치만 모니터링하는 것이 아니라 적정 온도를 데이터화하고 학습시켜 효율 최적화 단계까지 제어하고 있다"고 밝혔다. 이어 "많은 기업이 냉각수 누수를 우려하지만 다중 안전장치와 정밀 압력 제어 기술이 결합된 이중·삼중 보호 메커니즘을 갖추고 있다"며 "아주 미세한 누수 징후라도 감지되면 제어 시스템이 즉각 해당 구역 밸브를 차단하고 IT 자원을 자동으로 안전 종료하기 때문에 대형 장애로 번질 가능성을 최소화한다"고 설명했다. 또 "실제 고객사를 대상으로 냉각 시스템을 구축·운영하는 과정에서 누수로 인한 시스템 사고는 단 한 건도 발생하지 않았다"고 강조했다. 더불어 장비 내부에서 누수가 발생하더라도 일반 물이 아닌 절연 성분이 포함된 특수 냉각수를 사용하기 때문에 누수로 인한 하드웨어 손상이나 데이터 손실 가능성도 크게 낮췄다고 설명했다. 엠키스코어는 국내 주요 대기업과 정보통신산업진흥원(NIPA)이 추진하는 데이터센터 구축 사업에 참여하며 국내 최대 규모 수랭 전환 레퍼런스를 확보하고 있다. 축적한 기술력과 구축 경험을 바탕으로 올해 국내외 시장 확대와 기술 고도화에 나설 계획이다. 김종훈 기업부설 연구소장은 "초기 비용이나 대규모 인프라 개조 부담이 크다면 데이터센터 전체를 한 번에 바꾸기보다 일부 존부터 단계적으로 수랭식으로 전환하는 방식이 가장 효율적"이라며 "아쿠아엣지 솔루션은 차세대 AI 컴퓨팅 환경에 안정적으로 대응할 수 있도록 돕는 현실적인 인프라 전략이 될 것"이라고 강조했다.

2026.05.21 12:50남혁우 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

디지털자산 제도화 "공론화 진전, 법제화는 제자리"…디지털 금융 B-

중국은 3분 배터리 교체 경쟁…현대차가 구독형 택한 이유

'애플 감성' 담은 페라리 첫 전기차, 7월 성적표 주목

메모리 가격상승에 기업 내 PC 교체 지연...더 미뤄도 될까

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.