• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX-A100 GPU'통합검색 결과 입니다. (448건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

인텔 "CPU·GPU·파운드리·맞춤형 반도체 중심 전략 재정비"

[타이베이(대만)=권봉석 기자] "인텔 재정비는 5~10년 단위 장기 전환 프로젝트다. 작년 인텔에 왔을 때 재무 구조 안정화, 글로벌 리더십 재편, 운영 효율화에 집중했다. 현재는 CPU 경쟁력 회복과 데이터센터·PC·파운드리 등 모든 영역에서 성장 엔진을 구축하고 있다." 2일(현지시간) 오후 타이베이 난강전람관에서 진행된 인텔 컴퓨텍스 기조연설 이후 글로벌 기자단과 만난 립부 탄 인텔 CEO가 이렇게 설명했다. 이날 질의응답에는 립부 탄 CEO를 필두로 스리니바산 아이옌가 중앙엔지니어링그룹 수석부사장, 케보크 케치치안 데이터센터그룹 총괄, 알렉스 카투지안 클라이언트 컴퓨팅 및 피지컬AI 그룹 총괄 등 주요 인사들이 참여했다. 립부 탄 CEO는 "AI 에이전트 확산이 반도체 수요 구조 자체를 변화시키고 있으며 추론과 오케스트레이션 중심 AI 환경에서 CPU의 중요성이 다시 커지고 있다”고 강조했다. "에이전틱 AI, CPU 중요성 높일 것... GPU도 지속 투자" 인텔을 포함한 주요 CPU 공급사는 과거 GPU에 편중됐던 AI 인프라가 에이전틱 AI 환경에서는 CPU에 좀 더 균형을 맞추는 형태로 재편될 것으로 전망하고 있다. 립부 탄 CEO도 "AI 에이전트가 동시에 대규모로 실행되는 구조에서는 고밀도 스케줄링과 데이터 관리가 중요하며, 이 과정에서 제온 프로세서가 핵심 역할을 수행한다"고 밝혔다. 인텔은 이날 CPU 뿐만 아니라 PC 게임, 모바일 게임, AI PC를 아우르는 GPU에 지속적으로 투자하겠다고 설명했다. 또 고성능 게이밍 GPU 시장에서도 경쟁을 지속할 계획이며, 초기 제품군이 생태계 안착 단계에 진입했다고 평가했다. 알렉스 카투지안 총괄은 "GPU는 단순한 그래픽 장치를 넘어 AI 기능을 구현하는 핵심 컴퓨팅 자원이며 게임 개발자 및 엔진 생태계와 협력이 빠르게 확대되고 있다"고 밝혔다. "TSMC는 핵심 파트너/경쟁사... 고객사는 비공개" 립부 탄 CEO는 파운드리 부문 경쟁사인 대만 TSMC와 관련해 "TSMC는 핵심 파트너이자 주요 고객이며, 인텔 제품 상당수가 해당 생태계에서 생산된다"고 설명했다. 최근까지 반도체 공급망 소식통을 통해 나온 엔비디아, 애플 등 잠재적 고객사 수주설에 대해 "복수의 잠재 고객과 논의 중이지만 개별 고객은 공개하지 않는 것이 원칙"이라고 즉답을 피했다. 이어 "과거 파운드리 확장 시점은 고객사 확보 여부에 달렸다고 밝힌 바 있다. 인텔 18A 등 공정의 외부 고객사 확보를 파악할 수 있는 가장 좋은 방법은 투자 규모 증가"라고 답변했다. "맞춤형 실리콘 사업, 잠재 고객사 있다... 긴밀히 협력중" 맞춤형 실리콘 사업은 인텔의 또 다른 성장 동력으로 강조됐다. 스리니바산 아이옌가 수석부사장은 "맞춤형 실리콘은 크게 드러나지 않았지만 오래 전부터 계속된 사업 분야이며 새롭다고 할 수도 없다"고 설명했다. 이어 "맞춤형 실리콘 공급 사업은 인텔이 가진 종합반도체기업(IDM) 사업 모델, 그리고 인텔 파운드리의 경쟁력 강화에 큰 몫을 하고 있다. 구글과 IPU(인프라 프로세싱 유닛) 협력, 에릭슨과의 장기 공급 계약 등이 대표적"이라고 덧붙였다. 이날 인텔은 맞춤형 실리콘 분야에서도 잠재 고객사가 있음을 시사했다. 스리니바산 아이옌가 수석부사장은 "현재 공개할 수 없는 추가 고객사가 있지만 매우 밀접한 협력 관계를 유지하고 있다"고 설명했다. "PC용 프로세서, 로드맵 재정비로 경쟁사에 대응" 알렉스 카투지안 클라이언트 컴퓨팅 및 피지컬AI 그룹 총괄은 PC와 게이밍, 워크스테이션 등에서 거세지고 있는 경쟁사와 대응하기 위해 제품 포트폴리오 재정비에 나서겠다고 밝혔다. 그는 "칩렛과 타일 기반 아키텍처, 그리고 새로운 CPU 로드맵을 통해 보급형부터 조립 PC, 고성능 PC 등 모든 구간에서 대응할 것"이라고 설명했다. 전날(1일) 엔비디아가 발표한 블랙웰 GB10 기반 AI PC 'RTX 스파크'에 대해 "엔비디아의 시장 진입은 그만큼 PC가 중요하다는 의미다. 경쟁은 환영할 일이며 PC는 여러 업체의 신규 참가와 시장 확대를 통해 핵심 연산 플랫폼이 될 것"이라고 평가했다. "외부/내부 멀티 파운드리 전략 여전히 유효" 인텔은 2021년 등장한 IDM 2.0 전략을 변함없이 진행한다고 밝혔다. 케보크 케치치안 총괄과 알렉스 카투지안 부사장 모두 "일부 제품은 TSMC 등 외부 파운드리를 활용하고, 핵심 제품은 인텔 18A 등 자체 공정을 활용할 것"이라고 답했다. 글로벌 생태계 전략에서는 아시아, 특히 대만 OEM·ODM 생태계의 중요성이 강조됐다. 립부 탄 인텔 CEO는 "특정 지역이나 단일 파트너에 의존하지 않고 개방형 표준 기반의 협력 네트워크를 확대하는 방향으로 전환 중"이라고 설명했다.

2026.06.02 22:46권봉석 기자

삼성D, 컴퓨텍스서 엔비디아와 'GPUxOLED' 체험존 운영

삼성디스플레이는 2일(현지시간) 대만 타이베이에서 개막한 컴퓨텍스에서 엔비디아와 유기발광다이오드(OLED) 체험존을 운영한다고 밝혔다. 체험존에서 엔비디아 그래픽처리장치(GPU)와 삼성디스플레이 OLED가 제공하는 그래픽을 확인할 수 있다. 대만 에이수스 최신 노트북(ROG Zephyrus G16)과 MSI 최신 모니터(MPG 322UR QD-OLED X24)를 사용했다. 두 제품 모두 삼성디스플레이 OLED를 탑재했다. 엔비디아 GPU '지포스 RTX 5080'의 게이밍 성능을 지원한다. 삼성디스플레이는 "동일한 게임을 OLED와 액정표시장치(LCD) 환경에서 사용해보면 엔비디아 지포스 RTX 50 시리즈 성능을 가장 충실하게 구현하는 디스플레이가 무엇인지 직접 확인할 수 있다"고 밝혔다. 체험 게임은 달 기지가 배경인 캡콤(CAPCOM)의 SF 액션 어드벤처 게임 '프래그마타'(PRAGMATA)다. 금속 표면에 반사되는 빛과 우주 어둠 등 사실적 그래픽이 특징이다. 엔비디아 지포스 RTX 50 시리즈는 화면 내 빛의 움직임까지 계산해 그래픽에 현실감을 높이는 패스 트레이싱과 인공지능(AI) 기반 성능·화질 향상 기술 딥러닝 슈퍼샘플링(DLSS)4.5를 바탕으로 프래그마타의 사실적 그래픽을 생생하게 표현한다. 삼성디스플레이의 중소형 기술인 적녹청(RGB) OLED, 대형 기술인 퀀텀닷(QD)-OLED 등은 고사양 그래픽을 원작자 의도대로 표현하고, 사용자 몰입감을 높인다. RGB OLED와 QD-OLED는 높은 명암비(100만대 1)와 완벽한 블랙 표현으로 어두운 배경에서도 선명한 화질을 구현한다. OLED는 액정 동작에 시간이 필요한 LCD보다 응답속도가 빨라서, 초당 수백 프레임 화면도 잔상 없이 선명하게 표현할 수 있다. 최신 GPU가 구현하는 그래픽을 효과적으로 재현한다. 삼성디스플레이는 "프래그마타에서 주인공이 달 기지 내부를 이동하거나 화면이 빠르게 전환되는 장면에서도 잔상 없이 선명한 화면을 볼 수 있다"며 "우주 공간의 깊은 어둠과 그림자 속 구조물까지 또렷하게 표현하고, 달 기지의 붉은 경고등과 우주 공간의 짙은 푸른빛 등 미세한 색 차이까지 사실감 있게 표현한다"고 설명했다. 김영석 IT영업담당 상무는 "최신 GPU 기반 환경에서는 실시간 광원 반사와 그림자 표현, HDR 효과 등이 더욱 정교해져 디스플레이 성능 차이가 뚜렷하게 나타난다"며 "OLED와 QD-OLED는 GPU 성능을 가장 충실하게 재현하는 디스플레이로, 앞으로도 빅테크와 협력을 확대해 프리미엄 IT 시장에서 가치를 계속 입증하겠다"고 밝혔다.

2026.06.02 12:19이기종 기자

"소나무 수백만 그루 효과"…롯데이노베이트, 데이터센터 '초고효율' 국책과제 참여

롯데이노베이트가 데이터센터 에너지 효율 혁신과 탄소중립 실현을 위한 국가연구개발과제에 본격 착수한다. 이를 통해 차세대 열관리 기술을 선점하고 설계·구축·운영(DBO) 사업 경쟁력을 한층 강화한다는 전략이다. AI 확산에 따라 고성능 GPU 도입이 빠르게 늘어나는 가운데 데이터센터의 전력 효율과 열관리 경쟁력이 사업 성패를 좌우하는 핵심 요소로 떠오르면서다. 롯데이노베이트는 한국산업기술기획평가원(KEIT)이 주관하는 '2026년도 배터리 및 전기전자 분야 신규 연구개발'의 일환인 '데이터센터 탄소중립을 위한 열관리 기술개발' 과제 수행을 위해 아주대학교 산학협력단 주관 컨소시엄에 합류했다고 2일 밝혔다. 최근 AI 산업의 급성장으로 고성능 GPU(그래픽처리장치) 도입이 급증하면서 데이터센터의 랙(Rack)당 전력 밀도가 전례 없이 높아지고 있다. 전력 밀도 상승은 곧바로 탄소 배출량 증가로 이어지기 때문에, 기존 공랭식(가공 공기를 이용한 냉각) 방식의 한계를 극복하고 데이터센터 운영 효율(PUE·전력효율지수)을 개선할 차세대 열관리 기술 도입이 시급한 실정이다. 이번 연구개발과제는 기존 공랭식 데이터센터의 에너지를 획기적으로 절감하고 탄소중립을 달성하는 것을 목표로 한다. 구체적으로는 ▲광센싱 기반 분포형 온도 센서(DTS) 및 AI 열관리 시스템 ▲고효율 인랙(In-Rack) 냉각 시스템 개발 ▲실제 데이터센터 기반의 실증 등 핵심 기술의 조기 확보에 중점을 둔다. 컨소시엄은 멀티스케일 분포센싱과 AI 기술을 결합한 차세대 인랙 냉각 시스템을 통해 기존 냉각 방식의 한계를 뛰어넘겠다는 구상이다. 이번 컨소시엄에는 주관기관인 아주대를 비롯해 롯데이노베이트, 한국기계연구원(KIMM), 중앙대학교, 에스엠인스트루먼트가 참여하며, 향후 약 5년간 공동으로 세부 연구과제를 수행할 예정이다. 롯데이노베이트는 자사가 운영 중인 데이터센터를 기반으로 실증 및 검증을 전담하며, 전력효율지수인 PUE를 1.2 이하로 낮추는 것을 최종 목표로 삼았다. 표준적인 데이터센터의 PUE가 1.5 수준인 것을 감안하면 압도적인 효율이다. 실제로 서울과 용인 등 롯데이노베이트의 자사 데이터센터에 이 기술을 우선 적용해 PUE 1.2를 달성할 경우, 연간 약 2만 2,000톤의 탄소 배출 감축 효과가 기대된다. 나아가 기후에너지환경부 자료에 따른 2025년 국내 데이터센터 연간 전체 전력 소모량(약 8.2TWh)을 기준으로 이를 전국에 확대 적용할 경우 연간 68만 4000톤에 달하는 탄소 배출을 줄일 수 있을 것으로 분석된다. 롯데이노베이트는 이번 과제를 통해 확보한 고효율 열관리 핵심 기술을 자사의 핵심 비즈니스인 DBO 사업 모델에 적극 고도화할 계획이다. 데이터센터의 설계부터 구축, 운영에 이르는 전 과정에 친환경 고효율 솔루션을 빌트인(Built-in) 형태로 결합해 차별화된 수주 경쟁력을 확보하겠다는 전략이다. 롯데이노베이트 관계자는 "AI 시대의 데이터센터는 안정적인 운영을 넘어 에너지 효율과 열관리 기술이 곧 기업의 핵심 경쟁력이 되는 시대"라며 "이번 국가연구개발과제를 통해 확보할 세계 최고 수준의 기술력을 바탕으로 DBO 사업을 고도화하고, 지속가능한 친환경 데이터센터 생태계 구축을 선도해 나가겠다"고 강조했다.

2026.06.02 10:59남혁우 기자

Arm "엔비디아 RTX 스파크, 차세대 에이전틱 PC 이정표"

[타이베이(대만)=권봉석 기자] Arm은 1일(현지시간) 엔비디아가 컴퓨텍스 타이베이 2026 기조연설에서 공개한 Arm 기반 고성능 AI PC 'RTX 스파크'에 대해 "PC 기반 에이전틱 컴퓨팅의 미래에 중요한 의미를 지닌 제품"이라고 강조했다. 엔비디아는 1일 오전 타이베이 뮤직센터에서 진행한 기조연설에서 블랙웰 GB10 기반으로 설계된 윈도용 Arm PC 'RTX 스파크'를 공개했다. RTX 스파크는 고성능 Arm 코어텍스-X925 10코어와 저전력·고성능 Arm 코어텍스-A725 10코어로 구성된 20코어 그레이스 CPU, 블랙웰 RTX GPU와 완전 통합 메모리를 결합했다. 고성능 CPU와 GPU를 활용해 고도화된 AI 워크로드, 콘텐츠 제작, 게임 및 에이전틱 컴퓨팅 경험을 제공하도록 설계됐다. Arm은 "RTX 스파크는 윈도 온 Arm 생태계에 중요한 이정표로, 차세대 에이전틱 PC에 대한 공동 비전을 중심으로 엔비디아, Arm, 마이크로소프트와 주요 PC 제조사의 협력을 이끌어 낼 역할을 할 것"이라고 밝혔다. 이날 크리스 버기 Arm 엣지 AI 사업부문 총괄 수석부사장은 "AI 에이전트가 이용자를 대신해 점점 더 많은 추론, 계획 및 작업 실행을 수행함에 따라 복잡한 AI 워크로드를 조율하는 CPU의 중요성이 더욱 더 커지고 있다"고 밝혔다. 이어 "RTX 스파크는 Arm의 고성능·고효율 컴퓨팅 플랫폼과 엔비디아의 GPU 리더십을 결합해 지능적이고 반응성이 뛰어난 새로운 유형의 에이전틱 PC를 구현했다"고 평가했다.

2026.06.01 18:15권봉석 기자

배경훈 부총리, 피지컬 AI트윈에 방점…"현재 준비중"

배경훈 부총리 겸 과학기술정보통신부 장관이 KAIST AI대학 비전 선포식에서 '피지컬 AI 트읜'의 중요성에 방점을 찍어 "준비중"이라고 밝혀 관심을 끌었다. 배 부총리는 1일 KAIST 학술문화관에서 열린 이 행사에서 기조강연자로 나서 "다양한 현장 환경을 가상 시뮬레이션으로 만들고, 데이터를 확보하는 것이 중요하다"며 피지컬 AI트윈을 강조했다. 배 부총리는 이날 강연에서 "정부가 주도적으로 추진하는 분야가 피지컬 AI"라며 "한국의 강점 도메인(제조 등)에 AI를 결합해 차근차근 준비중"이라고 밝혔다. 그는 또 미래를 변혁할 새로운 AI핵심 기술에 대해 우리나라의 독자적인 투자의 필요성을 강조하며, "현재 주어진 자원 내에서 의미있는 성과를 만들어가고 있다"고 덧붙뎠다. 예도 들었다. 미토스가 10조개 파라미터 정도로 구성돼 있다고 추정되는데, 최소한 이에는 GPU 1만장이 필요할 것으로 내다봤다. 배 부총리는 "그런데 우리는 독파모에 GPU 블랙웰 B 200기준 500장 정도 지원한다"며 "그럼에도 주어진 자원 내에서 목적별로 AI 모델을 잘 만들어가고 있다"고 평가했다. 배 부총리는 또 "2030년까지 GPU 26만장 이상 확보할 것이다. 향후엔 100만장 이상 확보할 것으로 보고 있고, 그에 따른 데이터센터도 많이 지어질 것"으로 내다봤다. AI인재 양성 방향과 관련해서는 교수와 학생들에 다양한 연구와 융합을 고민해달라고 당부했디. 이어 윤국진 KAIST AI대학장이 나서 'KAIST AI대학 비전과 혁신방향'에 대해 발표했다. 골자는 풀스택 AI역량을 가진 인재로 학생들을 육성하는 것과 이를 의해 50개 이상 교과목을 개설하겠다는 것. 윤 학장은 "AI는 더이상 편리한 보조도구가 아니고, 인간이 문제를 정의하고 판단하는 방식 자체에 관여하기 시작했다. AI는 인간의 지적활동이 이루어지는 새로운 생태계가 되고 있다"고 강조했다. 윤 원장은 또 ▲AI코어: 원천기술 ▲AI시스템: 인프라 ▲AI+X: 도메인 융합 ▲AI퓨처: 미래설계를 4가지 KAIST AI교육 비전 축으로 제시했다. 이에 앞서 이광형 총장은 환영사에서 "AI는 이제 특정 분야의 기술을 넘어 과학기술과 산업, 사회 전반의 변화를 이끄는 핵심 동력이 되고 있다”며 “KAIST AI대학이 대한민국 AI 인재 양성과 연구 혁신을 선도하고 세계와 협력하는 열린 플랫폼으로 성장할 수 있도록 적극 지원해 나가겠다”고 말했다. 이어 KAIST AI대학 자문단 위촉식도 개최됐다. 자문위원은 유슈아 벤지오 캐나다 몬트리올대학 교수와 조경현 미국 뉴욕대학교 교수 등 해외에서 2명과 국내에서 11명 등 총 13명으로 구성했다. 또 특별세션으로 KAIST생이 발제하고, 토론하는 AI시대 새로운 교육과 연구문법을 주제로한 세션이 진행됐다.

2026.06.01 16:12박희범 기자

퀄컴, 로봇 개발용 플랫폼 '드래곤윙 IQ10 RDD' 공개

[타이베이(대만)=권봉석 기자] 퀄컴이 1일(현지시간) 로봇 개발과 상용화를 위한 레퍼런스 플랫폼인 '퀄컴 드래곤윙 IQ10 로보틱스 레퍼런스 디자인(RDD)'을 공개했다. 드래곤윙 IQ10 RDD는 퀄컴이 1월 CES 2026에서 공개한 로보틱스용 시스템반도체(SoC)인 '드래곤윙 IQ10' 기반으로 컴퓨팅, 센서 인터페이스, 네트워킹, 실시간 제어, 소프트웨어 스택을 하나의 설계에 통합했다. 드래곤윙 IQ10 SoC는 퀄컴 Arm 호환 오라이언 18코어 CPU와 헥사곤 NPU, 컴퓨터비전(CV) 처리장치와 DSP, 아드레노 GPU로 구성됐다. AI 연산 성능은 최대 700 TOPS(1초당 1조 번 연산)이며 별도 AI 가속기 없이 네트워크와 단절된 환경에서도 인지, 계획, 추론 기능을 수행할 수 있다. 드래곤윙 IQ10을 기반으로 최대 12개의 GMSL2 카메라를 비롯해 LiDAR, ToF(Time of Flight), IMU 등 다양한 센서 데이터 수집 기능을 통합했다. 필요한 경우 PCI 익스프레스, USB, CAN, EtherCAT, CAN-FD 등 다양한 인터페이스로 추가 센서와 기능 모듈을 연결해 기능을 확장할 수 있다. 퀄컴은 하드웨어와 함께 퀄컴 플랫폼에 최적화된 AI 모델을 도입할 수 있는 '퀄컴 AI 허브', 온디바이스 AI 런타임, 센싱·계획·제어를 위한 플랫폼 서비스 등 소프트웨어 스택을 함께 제공한다. 퀄컴은 드래곤윙 IQ10 RRD가 자율이동로봇(AMR), 산업용 로봇, 휴머노이드 로봇 등 다양한 분야에 활용될 것으로 내다봤다. 또 "차세대 로봇 경쟁력은 개별 부품 성능이 아니라 컴퓨팅, 센서, 네트워크, 제어, 소프트웨어를 얼마나 효율적으로 통합하느냐에 달려 있다"며 "드래곤윙 IQ10 RRD는 개발 단계의 시제품을 실제 현장에 배치 가능한 상용 로봇으로 전환하는 과정을 가속화할 수 있는 기반 플랫폼이 될 것"이라고 밝혔다. 드래곤윙 IQ10 RDD는 오는 9월부터 공급 예정이다. 현재 어드밴텍, 에이플럭스, 이노디스크, 넥스컴, 썬더컴 등 주요 제조사가 플랫폼 활용을 검토중이다.

2026.06.01 15:15권봉석 기자

엔비디아, PC 프로세서 시장 진출…인텔·AMD와 정면 승부

엔비디아가 신규 프로세서인 'RTX 스파크(RTX Spark)'를 통해 고성능 PC 시장을 공략한다. 해당 칩을 탑재한 노트북 및 데스크탑은 올 가을 출시될 예정이다. 젠슨 황 엔비디아 CEO는 1일 대만 타이베이에서 열린 '컴퓨텍스 2026' 기조연설에서 회사의 첫 윈도 PC용 프로세서인 RTX 스파크를 공개했다. RTX 스파크는 엔비디아가 마이크로소프트와 협력해 새롭게 선보이는 Arm 아키텍처 기반의 윈도 PC용 프로세서다. 그간 엔비디아는 서버용 프로세서 개발에 집중해 왔으나, 이번 칩 개발로 개인용 PC 시장에도 진출하게 됐다. RTX 스파크는 엔비디아 개인용 AI 워크스테이션 'DGX 스파크'에 적용된 GB10를 노트북 환경에 맞게 성능을 하향 조정했다. 미디어텍과 공동 설계한 Arm 아키텍처 20코어 기반의 그레이스 CPU(N1X)와 블랙웰 RTX GPU 및 128기가바이트(GB) 용량의 메모리를 갖췄다. 이를 통해 RTX 스파크는 1페타플롭스의 AI 처리 성능, 업계 최로 수준의 전력 효율성을 구현했다는 게 엔비디아의 설명이다. 1200억개의 매개변수를 가진 대규모언어모델(LLM)을 실행하고, 1440p 해상도에서 초당 100프레임 이상으로 초고사양 게임을 구동할 수 있다. 젠슨 황 CEO는 "RTX 스파크는 40년만에 PC 제품군 전반에 걸쳐 이뤄진 첫 번째 재발명으로, 데스크탑과 노트북 및 워크스테이션을 아우르는 혁신"이라며 "이들은 윈도 OS와 100% 호환되고, 엔비디아 쿠다(CUDA) 소프트웨어를 100% 지원한다"고 강조했다. 전세계 PC 제조사들은 올 가을 RTX 스파크 기반의 최신 노트북 및 소형 데스크탑을 공개할 예정이다. ASUS와 델, HP, 레노버, 마이크로소프트 서피스, MSI 등이 여기에 해당한다. 에이서와 기가바이트 역시 추후 제품을 출시할 계획이다. 업계는 엔비디아의 이번 발표가 PC용 프로세서 시장에 미칠 영향에 주목한다. 기존 PC용 프로세서는 인텔, AMD가 시장을 주도해왔다. 퀄컴 역시 '스냅드래곤 X' 시리즈를 통해 PC용 프로세서 시장을 공략하고 있다.

2026.06.01 15:09장경윤 기자

젠슨 황 "베라 루빈 본격 양산…삼성·SK·마이크론 HBM4 탑재"

엔비디아가 차세대 AI 가속기인 '베라 루빈(Vera Rubin)'이 본격적인 양산 체제에 돌입했다고 강조했다. 젠슨 황 엔비디아 최고경영자(CEO)는 1일 대만 타이베이에서 열린 '컴퓨텍스 2026' 기조연설에서 "컴퓨팅 수요는 믿을 수 없을 정도로 높다"며 "베라 루빈이 본격적인 양산에 들어갔다(Vera Rubin in Full Production)"고 강조했다. 베라 루빈은 엔비디아가 올 하반기 공식 출시할 예정인 차세대 AI 가속기다. 해당 칩은 엔비디아가 자체 설계한 베라 CPU와 루빈 GPU, NV링크 6 스위치, 블루필드-4 DPU, 그록3 LPU 등 7개 요소로 구성된다. 젠슨 황 CEO는 "베라 루빈을 위한 공급망은 이전 세대인 '그레이스 블랙웰' 대비 2배나 크다"며 "랙 조립 시간도 이전 2시간이 걸렸던 것에 비해, 이제는 5분밖에 걸리지 않는다"고 말했다. 베라 루빈 양산을 위한 파트너사들과의 협력도 강조했다. 젠슨 황 CEO는 연설 도중 재생한 영상을 통해 "베라 루빈은 TSMC의 3나노미터(nm) 공정과 2.5D 패키징을 거친다"며 "마이크론, SK하이닉스, 삼성전자의 7세대 고대역폭메모리(HBM4)가 탑재된다"고 설명했다.

2026.06.01 13:32장경윤 기자

인텔, 추론용 GPU '크레센트 아일랜드' 내년 출시 재확인

[타이베이(대만)=권봉석 기자] AI 가속용 GPU 시장에서 엔비디아와 AMD 등 경쟁사 대비 열세에 있었던 인텔이 반격을 준비한다. 에이전틱 AI 처리에 필요한 추론 연산의 가격 대비 성능을 높인 새 GPU '크레센트 아일랜드'를 내세웠다. 크레센트 아일랜드는 작년 10월 '2025 OCP 글로벌 서밋' 행사에서 처음 공개됐다. 기존 인텔 Xe GPU에서 레이트레이싱 등 그래픽 처리를 제외하고 대규모 연산에 적합하도록 설계한 새 아키텍처 'Xe3P' 기반으로 개발된다. 컴퓨텍스를 앞두고 진행된 사전 브리핑에서 아닐 난두리 인텔 데이터센터그룹 AI 제품 담당 부사장은 "크레센트 아일랜드는 AI 추론과 에이전틱 AI 처리에 최적화된 GPU이며 CPU·GPU·네트워크를 결합한 인텔 데이터센터 플랫폼의 핵심 축이 될 것"이라고 설명했다. 비용 효율 추구하는 기업용 AI 추론 시장 겨냥 아닐 난두리 부사장은 "현재 텍스트와 이미지, 음성과 영상을 만드는 생성 AI 대비 에이전틱 AI는 한층 복잡한 인프라를 요구한다. 데이터가 CPU와 GPU 사이를 여러 차례 오고가고 AI 에이전트도 결과물을 얻기 위해 상호작용을 진행한다"고 설명했다. 특히 그는 기업용 AI 인프라에서 가장 중요한 과제 중 하나로 추론 비용 절감을 들고 "크레센트 아일랜드는 이처럼 가격 대비 성능을 요구하는 기업 시장의 요구사항을 충복하기 위해 개발중"이라고 말했다. 실제로 크레센트 아일랜드는 현재 가격 상승과 공급난 등 이중고를 겪는 고대역폭메모리(HBM) 대신 공급단가가 낮은 LPDDR5X 메모리를 이용한다. LPDDR5X 메모리로 소모전력·단가·냉각 비용 절감 대용량 AI 모델과 에이전트를 GPU 위에서 돌리려면 메모리도 그만큼 커져야 한다. HBM은 속도가 빠르지만 가격과 전력 소모 문제로 무한정 용량을 늘릴 수 없다. 엔비디아 현행 GPU인 GB300은 GPU당 HBM3e를 최대 288GB밖에 탑재하지 못했다. 반면 크레센트 아일랜드는 메모리 탑재량을 최저 160GB에서 최대 480GB까지 탑재할 수 있다. 아닐 난두리 부사장은 "다수의 메모리 채널을 고밀도로 구성해 대용량 AI 모델과 에이전트 워크로드에 필요한 메모리 성능을 확보했다"고 밝혔다. LPDDR5X는 전력 소모를 줄여 발열을 줄이고 냉각 비용을 억제하는 효과를 거둘 수 있다. 실제로 인텔이 제시한 크레센트 아일랜드의 전력 소모는 최대 350W 수준이며 수랭식 대신 냉각팬과 방열판을 이용한 공랭식으로 작동한다. "제온·크레센트 아일랜드 결합해 합리적 추론 제공" 인텔은 앞으로 AI 처리 플랫폼을 서버용 제온 프로세서와 차세대 GPU를 결합한 형태로 제공할 예정이다. 제온 프로세서는 운영체제나 응용프로그램, AI 에이전트 조율과 GPU 등 제어를 수행하고 핵심 연산인 추론을 GPU에 맡기는 형태다. 아닐 난두리 부사장은 "거대언어모델(LLM)이 만든 코드나 결과물을 검증하는 과정에서 CPU와 GPU의 상호작용이 발생한다. 에이전틱 AI 처리시 CPU는 '실행자(Doer)', GPU는 '사고자(Thinker)'로 작동한다"고 밝혔다. 이어 "x86 기반으로 현재까지 개발된 다양한 응용프로그램을 실행하는 제온 프로세서 위에 AI 추론을 전담하는 크레센트 아일랜드를 더해 우수한 성능과 비용 절감 효과를 동시에 거둘 수 있을 것"이라고 전망했다. '재규어 쇼어' GPU, 출시 여부 여전히 '미정' 인텔은 2022년 5월 CPU와 GPU, 메모리를 자유롭게 조합할 수 있는 통합형 GPU '팰콘 쇼어' 개발 계획을 밝혔지만 추후 GPU로만 구성된 제품으로 계획이 변경됐다. 작년 2월에는 팰콘 쇼어 출시 계획을 접고 내부 테스트용으로만 활용한다고 밝혔다. 올해는 서버용 GPU '재규어 쇼어'를 출시할 예정이지만 현재까지 구체적인 진척 상황을 밝히지 못했다. 인텔이 밝힌 로드맵에서도 '재규어 쇼어'는 모습을 드러내지 않았다. 아닐 난두리 부사장은 재규어 쇼어 GPU의 진척 상황에 대한 별도 질의에 "사전 브리핑 당시 공유한 로드맵은 Xe 아키텍처 진화에 초점을 맞춘 것이다. Xe 아키텍처 기반 향후 제품에 대해 적절한 시점에 더 많은 내용을 공유할 것"이라고 답했다.

2026.06.01 12:10권봉석 기자

[AI 고속도로] AI 열풍 탄 '네오클라우드'…인프라 새 전장으로

인공지능(AI) 시대 핵심 자원 그래픽처리장치(GPU)를 전문적으로 공급·운영하는 '네오클라우드'가 글로벌 인프라 시장의 새로운 강자로 떠오르고 있다. AI 경쟁 무게중심이 모델 개발에서 인프라 확보로 이동하는 가운데, 국내 기업들도 차세대 AI 클라우드 시장 선점에 나서는 모습이다. 네오클라우드는 AI 모델 학습과 추론에 필요한 GPU를 서비스형(GPUaaS)으로 제공하는 AI 특화 클라우드 사업자를 뜻한다. 웹서비스와 기업 업무를 폭넓게 처리하는 기존 범용 퍼블릭 클라우드와 달리 AI 연산에 최적화된 구조를 갖춘 것이 특징이다. 네오클라우드가 주목받는 배경에는 폭발적으로 증가한 AI 연산 수요가 있다. 빅테크 기업들의 AI 데이터센터 투자와 소버린 AI 프로젝트 확대로 GPU 수요가 급증했지만 공급은 이를 따라가지 못하고 있다. 동시에 확보한 GPU조차 효율적으로 활용하지 못하는 문제가 나타나면서 AI 전용 인프라 필요성이 커지고 있다. 가격 경쟁력도 강점으로 꼽힌다. 업타임 인스티튜트 분석에 따르면 북미 기준 엔비디아 H100 GPU 온디맨드 사용 비용은 네오클라우드가 시간당 약 34달러로, 하이퍼스케일러 평균인 98달러 대비 크게 저렴한 것으로 나타났다. AI 워크로드에 불필요한 요소를 줄여 비용 효율을 높인 결과다. 글로벌 시장에선 코어위브, 람다랩스, 네비우스 등이 대표 사업자로 부상했다. 특히 코어위브는 오픈AI와 앤트로픽, 구글, 메타, 퍼플렉시티 등 주요 AI 기업에 GPU 인프라를 제공하며 시장을 선도하고 있다. 최근에는 AI 개발 플랫폼 기업 위츠앤바이어스(W&B)를 인수한 데 이어 에이전트 AI 기능까지 출시하며 단순 GPU 임대를 넘어 풀스택 AI 클라우드 기업으로 진화하고 있다. 네비우스 역시 AI 특화 클라우드 기업으로 빠르게 성장 중이다. 러시아 최대 검색엔진 얀덱스에서 분사한 뒤 AI 클라우드 기업으로 전환한 네비우스는 마이크로소프트와 메타, 엔비디아 등과 대형 계약을 체결하며 시장 영향력을 확대하고 있다. 올해 들어 주가가 130% 이상 급등하는 등 투자자들의 관심도 집중되고 있다. 글로벌 자본도 네오클라우드에 몰리는 상황이다. 블랙스톤과 칼라일 등 미국 주요 투자기관들은 코어위브와 람다, 크루소 등 네오클라우드 기업이 보유한 GPU를 담보로 대규모 자금을 공급하고 있다. 시장에선 GPU 자체가 새로운 인프라 자산으로 평가받기 시작했다는 분석도 나온다. 통신사들도 경쟁에 뛰어들고 있다. 일본 소프트뱅크는 엔비디아 GB200 NVL72 기반 네오클라우드 서비스를 올해 정식 출시할 예정이다. 자체 AI 클라우드 운영체제(OS) '인프리니아'를 결합해 학습부터 추론까지 통합 지원하는 구조를 내세우고 있다. 글로벌 통신사들이 AI 인프라 사업자로 영역을 확장하는 흐름이 뚜렷해지는 양상이다. 국내에선 베슬AI와 몬드리안에이아이 등이 대표 주자로 꼽힌다. 베슬AI는 연내 최신 GPU 1만 장 규모 인프라 구축을 추진하며 글로벌 데이터센터 네트워크를 확대하고 있다. 몬드리안에이아이는 AI 플랫폼과 인프라를 결합한 네오클라우드 전략을 내세우며 교육·연구 시장을 공략 중이다. 엘리스그룹 역시 모듈형 데이터센터와 GPU 스팟 요금제를 앞세워 시장 진입에 속도를 내고 있다. 업계에선 네오클라우드가 기존 하이퍼스케일러를 대체하기보다 AI 특화 워크로드를 처리하는 새로운 인프라 축으로 자리 잡을 것으로 보고 있다. 시장조사기관 ABI리서치는 네오클라우드 GPUaaS 시장이 2030년 수백조원 규모로 성장할 것으로 전망했다. 코리 샌더스 코어위브 제품 관리 담당 수석부사장은 최근 미국 IT 전문매체 AI 비즈니스 인터뷰에서 "AI 클라우드는 더 이상 GPU 임대 사업이 아니다"라며 "학습과 추론, 운영을 아우르는 풀스택 플랫폼 경쟁이 시작됐으며 이것이 차세대 AI 인프라 시장의 핵심이 될 것"이라고 강조했다.

2026.05.31 11:00한정호 기자

메모리 가격상승에 기업 내 PC 교체 지연...더 미뤄도 될까

글로벌 빅테크의 인공지능(AI) 투자 확대와 메모리 제조사의 HBM 중심 생산으로 PC 가격 상승 압박이 커지고 있다. 시장조사업체 트렌드포스는 지난 3월 "올 1분기 노트북 전체 부품 원가에서 메모리 비중이 30%까지 상승했으며 올해 노트북 시장이 비용 상승 압박에 직면할 것"이라고 전망하기도 했다. 기업 내 IT 부서 역시 AI PC 도입 시기를 두고 고민중이다. 교체를 미루면 단기 비용 부담은 줄일 수 있지만 향후 더 높은 비용을 지불할 가능성이 커지기 때문이다. 그러나 글로벌 PC 제조사들은 "단순한 초기 구매 비용보다 총소유비용(TCO) 관점에서 AI PC 도입 효과를 검토해야 한다"고 지적한다. 생산성과 운영 효율 개선 효과를 고려해야 한다는 것이다. IDC "AI PC, 하루 2시간 업무 절감 효과" 시장조사업체 IDC가 작년 10월 아태지역 임직원 500명 이상 기업의 IT 결정권자 720명을 대상으로 한 설문조사에 따르면, AI PC 사용자는 하루 평균 2.17시간의 업무 시간을 절약하는 것으로 나타났다. 이는 기존 PC 환경에서 AI 기능을 활용할 때의 평균 절감 시간인 1.67시간보다 약 30% 높은 수준이다. 기업 규모가 커질수록 생산성 효과는 확대될 수 있다. 예를 들어 직원 500명 규모 기업에서 직원 1인당 하루 0.5시간의 추가 업무 절감이 발생할 경우, 연간 약 12만 5000시간 이상의 업무 시간을 확보할 수 있다는 계산이 나온다. AI PC, 클라우드 의존 줄이고 이용료 절감 AI PC의 장점으로는 클라우드 비용 절감 효과도 거론된다. 클라우드 기반 AI 서비스를 활용하기 위해서 월간 구독료를 지불해야 하지만 AI PC는 CPU와 GPU, NPU를 활용해 일부 기능을 인터넷 접속 없이 기기 내에서 직접 처리할 수 있다. 29일 오리온 델테크놀로지스 클라이언트솔루션그룹(CSG) 전무는 "AI PC는 실제로 가격 차이를 상쇄할 만큼의 상당한 가치를 제공한다"고 설명했다. 그는 "기업 AI는 적합한 워크로드를 적합한 컴퓨팅 자원에 배치하는 방향으로 나아가고 있다"며 "클라우드가 모델 학습 등 고도화된 작업을 담당한다면, AI PC는 그 엔드포인트에서 실시간 번역, 회의 기록, 콘텐츠 생성부터 에이전트 구동까지 일상 업무의 생산성을 높이는 작업을 로컬로 처리한다"고 덧붙였다. IDC 설문조사 결과에서도 IT 의사결정권자 중 84%가 'AI PC가 에이전틱 AI 추론 비용 절감에 도움이 될 것'으로 전망했다. 또 77%는 '온디바이스 AI 처리의 비용 효율성이 충분히 설득력 있다'고 답했다. 오리온 전무는 "이러한 하이브리드 구조에서 AI PC는 토큰 비용을 최적화하는 동시에, 데이터를 로컬 환경에서 비공개로 처리한다는 보안상의 이점까지 제공할 것"이라고 말했다. AI 연산 NPU에 분산해 성능 저하 완화 가능 AI PC의 잘 알려지지 않은 장점 중 하나로 기기 수명 연장을 들 수 있다. 기존 PC에서 일어나는 AI 연산은 CPU와 GPU를 집중적으로 활용한다. 반면 AI PC는 이런 연산 중 일부를 NPU로 분산해 처리할 수 있다. 업계에서는 이를 통해 발열과 전력 소비를 줄이고 장기적인 성능 저하를 완화할 수 있다고 보고 있다. 오리온 전무는 "AI 연산을 NPU로 분담하면 CPU와 GPU의 부하를 덜면 발열과 냉각팬 등 마모/소모가 감소한다. 균형 잡힌 워크로드 관리는 PC의 최대 성능을 더 오래 유지하는 데 도움이 된다"고 설명했다. "국내 기업, AI PC 도입 늦지만 관심은 높은 편" IDC에 따르면 2025년 10월 현재 국내 기업의 AI PC 도입률은 약 37%로 아태지역 평균(48%)에는 못 미쳤다. 그러나 AI PC 도입이 지연될 경우 핵심 인력 이탈(33%), 운영 비효율 증가(33%), 시장 주도권 상실(32%) 등에 대한 우려도 컸다. 응답자 중 69%는 PC 구매시 AI 기능을 가장 중요하거나 반드시 필요한 기능으로 여긴다고 답했다. 이는 아태지역 평균(56%)보다 높은 최고 수준이다. 업계는 운영 효율 저하와 AI 인프라 경쟁력 약화를 우려하며, 기업들의 AI PC 전환 수요가 점차 확대될 것으로 보고 있다. 다만 업계에서는 업무 환경별 AI 활용도와 초기 투자비 검증이 함께 필요하다는 지적도 나온다. 오리온 델테크놀로지스 전무는 이같은 지적에 대해 "에너지 효율적인 AI 처리, 스마트 냉각 및 최적화된 하드웨어와 결합된 AI PC는 장기적인 신뢰성, 일관된 성능, 실제 비용 가치를 제공하기 때문 장기적인 투자에 적합하다"고 반론했다.

2026.05.29 16:17권봉석 기자

AI 데이터센터 성능·효율성 좌우하는 나노초 정밀 동기화

생성 AI 확산으로 데이터센터와 클라우드 인프라 투자가 빠르게 늘면서, AI 인프라 경쟁력의 핵심 요소도 크게 변화하고 있다. 과거에는 GPU를 얼마나 많이, 빠르게 확보하느냐가 중요했다면 최근에는 대규모 병렬 처리 환경에서 데이터 정확도를 유지하고 오차 시간을 최소화하는 역량의 중요성이 커지고 있다. 특히 대규모 데이터가 여러 노드를 거치는 AI 데이터센터는 수 많은 서버와 네트워크 장비가 동시에 움직이는 구조인 만큼, 데이터 흐름의 오차와 지연을 최소화하는 '정밀 타이밍 기술'이 핵심 인프라 요소로 주목받고 있다. 주요 시장조사업체에 따르면 오차 시간을 최소화하는 글로벌 타이밍 디바이스 시장 규모는 2023년 58억 달러(약 8조 7226억원)에서 2030년 96억 달러(약 14조 4374억원)까지 성장할 것으로 전망된다. 데이터 전송 시점·시스템 동기화 돕는 정밀 타이밍 솔루션 대규모 CPU·GPU가 동원된 AI 데이터센터에서는 서버·네트워크 간 동기화 정밀도가 AI 연산 효율과 전력 효율에도 영향을 미친다. 미국 국립표준기술연구소(NIST)와 IEEE 등은 초저지연 네트워크 환경에서 나노초(ns) 단위의 시간 동기화 중요성을 강조하고 있다. 정밀 타이밍 솔루션은 특수 소자인 크리스탈(Crystal)과 오실레이터(Oscillator) 기반으로 데이터 전송 시점을 정교하게 맞추고 시스템 간 동기화를 유지하며, 고도화된 AI 인프라의 안정성과 효율을 뒷받침하는 기반 기술로 평가된다. 최근에는 AI 데이터센터와 5G 통신 인프라 확산에 따라 초정밀 오실레이터(OCXO)와 고안정성 클럭 디바이스 수요도 증가하는 추세다. 이에 따라 글로벌 주파수 제어 및 타이밍 디바이스 시장을 선점하기 위한 주요 기술 기업들의 기술 경쟁도 한층 치열해질 것으로 예상된다. 엡손 "쿼츠 기반 타이밍 기술 산업계에 공급" 29일 엡손 관계자는 “AI 인프라 내 정밀 타이밍 솔루션 수요가 확대되는 가운데, 엡손이 오랜 기간 축적한 마이크로디바이스 기술이 다양한 산업 영역에서 활용되고 있다”고 설명했다. 엡손은 석영 기반 수정 진동자를 이용해 정밀하게 시간을 제어하는 쿼츠(Quartz) 기반 초정밀 타이밍 제어 기술을 보유하고 있다. 현재 글로벌 주파수 제어·타이밍 디바이스 시장에서 전통적인 쿼츠 기반 타이밍 제어 기술은 반도체 대비 여전히 주류 시장을 형성하고 있다. 엡손 관계자는 "엡손의 쿼츠 기반 기술은 현재 실시간클록(RTC) 모듈, 크리스탈(Crystal Unit) 및 오실레이터, 고정밀 센서 등을 아우르는 마이크로디바이스 사업으로 확대되고 있다"고 설명했다. "원천 소재 '합성 쿼츠'부터 직접 생산" 엡손은 통신 장비와 컴퓨터, 디지털 카메라, 자동차, 이동통신 기지국 등 다양한 전자·네트워크 인프라 분야에 관련 디바이스를 공급하고 있다. 핵심 소재인 '합성 쿼츠(Synthetic Quartz)'까지 자체적으로 육성·생산하며, 소재 단계부터 정밀 제어 기술을 내재화한 수직 통합형 생산 체계를 구축해왔다는 점도 특징이다. 이 같은 핵심 소재 및 공정의 내재화 방식은 지정학적 리스크와 전 세계적인 부품 공급망 불안정성 속에서 안정적인 고품질 제품 공급을 보장하는 전략적 기반이 된다. 동기화 오차 제어, HPC·AI 클러스터 효율 좌우 엡손 관계자는 “엡손의 사업 영역은 단순 전자부품 사업을 넘어 시스템 전체의 정확도와 안정성을 지원하는 방향으로 확대돼 왔다”고 설명했다. 이어 “물리적인 쿼츠 가공 기술과 미세전자기계시스템(MEMS) 기술을 결합해 다양한 산업 환경에서 요구되는 안정성과 정밀도를 구현해왔다”고 덧붙였다. 업계에서는 AI 데이터센터 고도화와 함께 관련 생태계 내에서 정밀 타이밍 기술과 마이크로디바이스 분야의 중요성도 점차 커질 것으로 예상한다. 이 같은 시장 변화에 발맞춰 글로벌 하드웨어 기업들 역시 B2C에서 고부가가치 B2B 인프라 영역으로 대대적인 체질 개선에 나서고 있다. 엡손 관계자는 "엡손은 전통적으로 프린터 중심의 B2C 이미지가 강했지만, 최근에는 통신·네트워크·산업·자동차 등 B2B 수요 기반 영역까지 사업 포트폴리오를 확대하고 있다"고 밝혔다. 이어 "최근 발표한 'ENGINEERED FUTURE 2035' 비전을 통해 80년 이상 축적해 온 '고효율·초소형·초정밀' 기술과 엔지니어링 역량을 기반으로 산업 및 사회 인프라 영역에서 사업 경쟁력을 강화하겠다는 전환 뱡항을 제시했다"고 덧붙였다.

2026.05.29 13:30권봉석 기자

[AI는 지금] "탈 엔비디아 노린다"…'프랑스 AI' 미스트랄, 오픈AI 맞서 '독자 칩' 검토

프랑스 인공지능(AI) 스타트업 미스트랄 AI(Mistral AI)가 자체 반도체 칩 설계 기술 검토에 착수했다. 오픈AI, 앤트로픽 등 거대 자본을 앞세운 미국 빅테크 기업들과의 전면전에서 살아남기 위해 인프라 주도권을 직접 확보하기 위한 승부수로 풀이된다. 아서 멘슈 미스트랄 AI 최고경영자(CEO)는 28일(현지시간) CNBC와의 인터뷰에서 자체 칩 설계 및 개발 가능성을 묻는 질문에 "당연히 흥미로운 영역"이라며 "자체 반도체 개발 가능성을 배제하지 않고 있다"고 처음으로 공식 언급했다. 이처럼 미스트랄 AI가 반도체 내재화 카드를 만지작거리는 이유는 천문학적으로 치솟는 AI 구동 비용 때문으로 풀이된다. 고성능 AI 모델을 유지하고 고도화하는 과정에서 발생하는 컴퓨팅 인프라 비용 부담을 줄이지 못하면 장기적인 수익성 확보가 불가능하다는 판단에서다. 멘슈 CEO는 "맞춤형 칩을 활용하면 AI 모델이 데이터를 처리하는 단위인 '토큰(Token)'의 배포 비용을 유의미한 수준으로 크게 낮출 수 있다"고 설명했다. 현재 약 120억 유로(한화 약 18조원)의 기업 가치를 평가받는 미스트랄 AI는 그동안 엔비디아와의 파트너십을 중심으로 인프라를 확장해왔다. 그러나 구글, 아마존, 메타 등 미국 하이퍼스케일러들이 자체 주문형 반도체(ASIC)를 개발하며 하드웨어와 소프트웨어 통합 최적화에 나서자 고유 칩 확보의 필요성을 절감한 것으로 보인다. 칩 독립 선언과 함께 인프라 대형화 전략도 속도를 낸다. 미스트랄 AI는 프랑스와 스웨덴 데이터 센터에 총 40억 유로(약 6조원)를 투입, AI 모델 구동 및 서비스에 특화된 '추론(Inferencing) 전용 데이터 센터'를 프랑스 내에 신규 구축한다고 발표했다. 미국에 뒤처진 유럽의 AI 컴퓨팅 역량을 끌어올려 시장 지배력을 확보하겠다는 취지다. 미스트랄 AI는 시장 경쟁력을 높이기 위한 비즈니스 모델 다각화도 본격화하고 있다. 최근에는 미국 빅테크들이 사활을 걸고 있는 '에이전틱 AI(Agentic AI)' 시장을 겨냥해 기업용 신규 에이전트 플랫폼 '바이브(Vibe)'를 출시했다. 단 한 번의 지시로 문서 작성부터 코딩, 테스트, 배포까지 자율 수행하는 이 솔루션을 앞세워 올해 매출 목표를 전년(2억 유로) 대비 5배 성장한 10억 유로(약 1조 5000억원)로 끌어올린다는 구상이다. 다만 연간 반복 매출(ARR)이 수백억 달러에 달하는 오픈AI나 앤트로픽과의 체급 차이를 단기간에 극복하기는 쉽지 않을 것이라는 관측도 나온다. 인프라와 칩 개발에 드는 막대한 자본 조달 역시 과제로 꼽힌다. 미스트랄 AI의 이번 인프라 투자 확대는 미국 빅테크 기업들과의 컴퓨팅 자원 격차를 좁히기 위한 조치로도 풀이된다. 현재 유럽 연합(EU) 내에서는 독자적인 인프라 공급망을 확보하지 못할 경우 발생할 거시경제적 타격에 대한 우려가 확산되는 추세다.멘슈 CEO는 인프라 격차와 관련해 "유럽은 현재 AI를 과거 천연가스와 같은 국가 전략적 자산으로 바라보기 시작했다"며 "이 기술 경쟁에서 계속해서 경쟁력을 유지하려면 1조 달러에 달하는 상업적 적자가 발생하는 상황을 감당할 수 없다는 점을 모두가 직시해야 한다"고 강조했다.

2026.05.29 11:08장유미 기자

GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개

오케스트로가 생성형 인공지능(AI) 서비스 확산으로 급증하는 추론 수요에 대응하기 위한 AI 인프라 운영 플랫폼을 공개했다. 단순 그래픽처리장치(GPU) 확보 경쟁을 넘어 보유 자원을 얼마나 효율적으로 활용하느냐가 기업 AI 경쟁력으로 떠오르면서, 추론 최적화와 운영 자동화 시장 공략에 나선 모습이다. 오케스트로는 AI 추론 운영 플랫폼 '콘체르토 AI(CONCERTO A.I.)'를 출시했다고 29일 밝혔다. 콘체르토 AI는 기업이 보유한 GPU 인프라 활용 효율을 높여 생성형 AI 서비스 운영 과정에서 발생하는 추론 병목과 응답 지연 문제를 줄이는 데 초점을 맞췄다. 최근 기업 시장에선 AI 챗봇과 업무 자동화 에이전트, 검색증강생성(RAG) 기반 서비스 도입이 확대되면서 추론 연산 수요가 빠르게 증가하고 있다. 특히 에이전트형 AI 환경에선 하나의 요청이 여러 모델 호출과 반복 연산으로 이어지면서 GPU 자원 부담이 커지고 있다. 이에 업계에선 GPU 증설보다 기존 인프라 활용 효율을 높이는 운영 기술 중요성이 커지는 추세다. 콘체르토 AI는 대규모 추론 요청을 분산 처리하고 GPU와 신경망처리장치(NPU) 등 가속기 자원을 작업 특성에 맞게 배분하도록 설계됐다. 질문 분석과 답변 생성 작업을 분리해 각각 최적의 자원에 할당하는 분산 서빙 방식을 적용해 병목 현상을 줄이고 응답 성능을 높인다. 여기에 키-값 캐시(KV Cache) 최적화와 메모리 재사용 기술을 적용해 초기 응답 시간과 토큰 처리 속도를 개선했다. 실시간 대기열과 자원 상태를 반영한 지능형 라우팅 기능도 탑재해 고부하 환경에서도 안정적인 응답 성능을 유지할 수 있도록 지원한다. 오케스트로에 따르면 자체 온프레미스 AI 인프라 환경에서 진행한 벤치마크 결과, 동시 요청이 집중되는 고부하 환경에서 콘체르토 AI의 분산 서빙 방식은 기존 단일 처리 방식 대비 토큰 출력 속도를 2.2배 향상시켰다. 회사는 이를 통해 동일한 하드웨어 환경에서도 응답 지연을 줄이고 추론 처리 안정성을 높일 수 있다고 설명했다. 운영 자동화 기능도 강화했다. 콘체르토 AI는 AI 모델 배포부터 추론 요청 처리, 자원 배분, 성능 모니터링까지 거대언어모델 운영관리(LLMOps) 전 과정을 단일 플랫폼에서 지원한다. 표준화된 모델 패키징 기술을 기반으로 쿠버네티스 환경에서 배포 과정을 자동화하고 초기 응답 시간과 토큰 처리 속도, 자원 사용량 등 주요 운영 지표를 통합 관리할 수 있도록 돕는다. 특히 국내 유일 이기종 AI 가속기 지원 구조도 차별점으로 내세웠다. 엔비디아 GPU뿐 아니라 리벨리온과 퓨리오사AI 등 국산 NPU 환경까지 지원해 기업과 기관이 프라이빗 AI와 소버린 AI 환경에서 특정 하드웨어 벤더 의존도를 낮추고 인프라를 유연하게 구성할 수 있도록 지원한다. 최근 AI 인프라 시장 경쟁축은 학습 중심에서 추론 중심으로 이동하는 분위기다. 생성형 AI 서비스가 실제 업무 환경에 본격 적용되면서 GPU 확보 경쟁을 넘어 운영 효율과 자원 활용 최적화, LLM옵스 역량이 새로운 경쟁력으로 부상하고 있다. 오케스트로 역시 콘체르토 AI를 통해 기업 AI 인프라 운영 효율을 높이고 프라이빗 AI 시장 공략을 강화한다는 전략이다. 김범재 오케스트로 대표는 "생성형 AI가 실제 업무로 확산되고 에이전트형 AI 서비스가 늘어나면서 기업 AI 인프라 과제는 더 많은 GPU를 확보하는 것에서 보유 자원을 얼마나 효율적으로 운영하느냐로 옮겨가고 있다"며 "콘체르토 AI를 기반으로 기업이 보유한 AI 인프라 활용 효율을 높이고 프라이빗 AI 환경에서도 안정적인 AI 서비스 운영을 지원하겠다"고 말했다.

2026.05.29 10:48한정호 기자

[AI 고속도로] 델, AI 서버 호황에 '어닝 서프라이즈'…시간외 주가 38%↑

델 테크놀로지스가 인공지능(AI) 서버 수요 급증에 힘입어 재상장 이후 최대 매출 성장률을 기록하며 시장 기대치를 크게 웃도는 실적을 발표했다. AI 서버 주문과 데이터센터 인프라 사업이 폭발적으로 성장한 가운데 연간 실적 전망까지 상향 조정하면서 주가는 시간외 거래에서 약 38% 급등했다. 델은 28일(현지시간) 2027 회계연도 1분기 실적 발표를 통해 매출 438억 4000만 달러와 조정 주당순이익(EPS) 4.86달러를 기록했다고 밝혔다. 이는 시장조사업체 LSEG가 집계한 시장 전망치인 매출 354억 3000만 달러, 조정 EPS 2.94달러를 크게 웃도는 수준이다. 특히 매출은 전년 동기 대비 88% 증가했다. 델이 지난 2018년 재상장한 이후 가장 높은 성장률이다. AI 인프라 수요 확대가 실적 급증을 이끈 것으로 풀이된다. 델은 해당 분기 AI 서버 매출이 전년 동기 대비 757% 증가한 161억 달러를 기록했다고 밝혔다. 회사는 올해 전체 AI 서버 매출 전망도 기존 500억 달러에서 600억 달러로 상향 조정했다. 이는 전년 대비 144% 성장한 규모다. 델은 현재 엔비디아 그래픽처리장치(GPU) 기반 AI 서버를 중심으로 기업·네오클라우드·소버린 AI 고객 등 5000곳 이상의 AI 서버 고객을 확보했다고 설명했다. AI 서버 수요 확대와 함께 기존 서버·네트워크 장비 사업도 동반 성장한 것으로 나타났다. 서버와 데이터센터 장비를 담당하는 인프라솔루션그룹(ISG) 매출은 전년 동기 대비 181% 증가한 290억 달러를 기록했다. 전통 서버 및 네트워킹 매출은 85억 달러로 92% 늘었고 스토리지 매출도 43억 달러로 8% 증가했다. PC·노트북·액세서리 사업을 담당하는 클라이언트솔루션그룹(CSG) 매출은 146억 달러로 전년 동기 대비 17% 증가했다. 기업용 PC 수요 확대 영향으로 상업용 클라이언트 매출은 18% 늘어난 130억 달러를 기록했다. 델은 회계연도 2분기 매출 전망도 440억~450억달러로 제시했다. 시장 전망치인 349억 7000만 달러를 크게 웃도는 수준이다. 연간 매출 역시 기존보다 상향한 1650억~1690억 달러로 전망했다. 다만 델은 AI 인프라 수요 급증에 따른 공급망 부담도 커지고 있다고 밝혔다. 회사는 메모리·중앙처리장치(CPU)·하드디스크(HDD) 등 주요 부품 공급 부족이 이어질 것으로 내다봤다. 제프 클라크 델 부회장 겸 최고운영책임자(COO)는 "AI 인프라 수요 확대 흐름이 지속되면서 기업·소버린 AI 고객 주문이 빠르게 증가하고 있다"며 "추론·에이전틱 AI 워크로드 확대가 우리의 새로운 성장 동력이 되고 있다"고 말했다.

2026.05.29 10:48한정호 기자

[AI는 지금] "추론판 AWS 되겠다"…엔비디아가 베팅한 바세텐, 몸값 110억 달러 논의

인공지능(AI) 반도체 공룡 엔비디아가 투자한 미국 AI 추론 인프라 스타트업 '바세텐(Baseten)'이 110억 달러(약 15조원)의 기업가치로 대규모 투자 유치에 나섰다. 지난 1월 50억 달러의 가치를 평가받은 지 불과 3개월 만으로, 글로벌 AI 시장의 투자 중심축이 거대 모델 '학습'에서 비용 효율화를 위한 '추론(실제 서비스 구동)' 인프라로 급격히 이동한 분위기다. 29일 IT 전문매체 디인포메이션에 따르면 바세텐은 최근 투자자들과 10억 달러 규모 신규 투자 유치를 논의했다. 이번 투자 조건은 투자 후 기업가치 110억 달러를 전제로 한다. 성사될 경우 바세텐의 기업가치는 올해 초 인정받은 50억 달러에서 2배 이상 높아진다. 바세텐은 지난 2019년 미국 샌프란시스코에서 설립된 AI 추론 인프라 기업으로, 고객들이 오픈소스 모델과 자체 조정 모델을 서비스에 배포·운영할 수 있도록 모델 서빙, GPU 자원 관리, 지연시간 최적화, 비용 관리 기능을 제공한다. 주요 고객사로는 AI 코드 편집기 '커서(Cursor)'와 업무 협업 툴 '노션(Notion)' 등이 거론된다. 또 바세텐은 AI 모델 실행 인프라 시장에서 AWS와 같은 플랫폼 지위를 목표로 하고 있다. 클라우드 시장에서 AWS가 기업 컴퓨팅 인프라를 제공하며 성장한 것처럼 바세텐은 AI 시대의 추론 인프라를 겨냥하고 있다. 추론 인프라 수요가 커지면서 바세텐에는 대형 투자자 자금도 몰리고 있다. 바세텐은 올해 1월 50억 달러 평가액으로 3억 달러 투자 유치에 성공했다. 당시 라운드는 벤처캐피털 IVP와 알파벳 계열 독립 성장펀드 캐피털G가 공동 주도했으며 엔비디아도 참여했다. 엔비디아는 해당 거래의 일환으로 바세텐에 1억5000만 달러를 투자하기로 한 것으로 전해졌다. 바세텐은 최근 1년 사이 3차례 투자 유치에 나섰다. 누적 투자 유치액은 5억8500만 달러 수준으로 늘었다. 110억 달러 기업가치가 인정되면 올해 초 투자 라운드 이후 3개월 만에 평가액이 2배 이상 오르게 된다. 엔비디아의 투자는 추론 인프라 시장 확대와 맞물려 있다. 생성형 AI 도입이 확산되면서 기업들은 모델 학습용 GPU뿐 아니라 학습된 모델을 수많은 이용자 요청에 맞춰 빠르게 구동하는 추론 인프라 확보에 나서고 있다. 엔비디아는 GPU 수요를 키우는 추론 플랫폼 기업에 투자하며 하드웨어와 소프트웨어 생태계를 넓히고 있다. AI 업계에선 추론 시장의 성장성이 학습 시장보다 더 클 수 있다는 관측도 나온다. 모델 학습은 대규모 자본과 데이터센터 역량을 갖춘 소수 기업 중심으로 이뤄진다. 반면 추론은 AI 기능을 서비스에 붙이는 모든 기업에서 반복적으로 발생한다. 이용자가 AI 애플리케이션을 호출할 때마다 GPU 연산이 필요하기 때문이다. 오픈소스 AI 모델 확산도 바세텐의 성장 요인으로 꼽힌다. 라마, 딥시크, 미스트랄, 젬마 등 공개 모델을 업무와 서비스에 적용하는 기업이 늘면서 최근 모델 배포와 운영 수요가 증가하고 있다. 이 과정에서 파인튜닝, 모니터링, 비용 관리 등을 통합 지원하는 추론 인프라 플랫폼의 필요성은 커지고 있다. 추론 인프라 시장을 둘러싼 투자 경쟁도 거세지고 있다. 개발자들에게 AI 추론 인프라를 제공하는 파이어웍스AI는 지난해 10월 기업가치 40억 달러를 기준으로 2억5000만 달러를 조달했다. 추론 전용 칩을 설계한 세레브라스도 오픈AI와 파트너십을 맺은 뒤 기업가치 220억 달러로 10억 달러 투자 유치를 논의 중인 것으로 알려졌다. 대형 클라우드 사업자들도 추론 시장을 겨냥하고 있다. AWS, 구글 클라우드, 마이크로소프트 애저는 자체 AI 인프라와 모델 운영 서비스를 강화하고 있다. 코어위브, 람다, 토게더AI 등 GPU 인프라 기업들도 AI 스타트업과 기업 고객을 상대로 추론 워크로드 확보 경쟁을 벌이고 있다. 초기 생성형 AI 경쟁은 대규모 모델 개발과 학습 데이터 확보에 집중됐다. 최근에는 기업들이 AI 기능을 실제 서비스에 적용하기 시작하면서 지연시간, 안정성, 보안, 비용 효율성 등 운영 역량이 경쟁 변수로 떠올랐다. 모델 성능뿐 아니라 서비스 환경에서 모델을 얼마나 빠르고 저렴하게 구동할 수 있는지가 기업 AI 도입의 핵심 조건이 되고 있다. 엔비디아는 AI 반도체 공급자 지위를 넘어 오픈AI, AI 인프라 기업, 애플리케이션 기술 기업 등으로 투자 보폭을 넓히고 있다. GPU를 쓰는 기업에 자본을 투입하고, 이들이 다시 엔비디아 기반 인프라를 확장하는 구조다. 바세텐 투자도 엔비디아의 추론 생태계 확대 전략과 연결돼 있다는 분석이 나온다. 업계 관계자는 "AI 시장의 다음 경쟁은 누가 더 큰 모델을 만드느냐보다 그 모델을 실제 서비스에서 얼마나 빠르고 저렴하게 돌리느냐에 달려 있다"며 "바세텐의 투자 논의는 추론 인프라가 AI 생태계의 핵심 인프라로 자리 잡고 있다는 신호"라고 말했다.

2026.05.29 08:51장유미 기자

챗GPT·제미나이·GPU 다 푼다…메가존클라우드, 정부 AI 대회 2년 연속 운영

메가존클라우드가 정부 주도 인공지능(AI) 인재 육성 사업 운영을 2년 연속 맡으며 국내 AI 개발 생태계 지원 확대에 나선다. 대규모 AI 경진대회 운영 경험과 컴퓨팅 인프라 지원 역량을 기반으로 생태계 활성화에 속도를 낸다는 목표다. 메가존클라우드는 정보통신산업진흥원(NIPA)과 한국정보통신기술협회(TTA)가 공동 주관하는 '2026 AI 챔피언 대회' 운영사업자로 선정됐다고 28일 밝혔다. 지난해에 이어 2년 연속 선정이다. AI 챔피언 대회는 과학기술정보통신부가 추진하는 '2026 전국민 AI 경진대회' 주요 트랙 가운데 하나다. 생성형 AI 활용 경험과 개발 역량을 보유한 참가자들을 대상으로 우수 AI 서비스와 시스템 개발팀을 선정하는 행사다. 전문가·개발자 중심 'AI 챔피언' 부문과 대학생 개발자 중심 'AI 루키' 부문으로 나뉘어 운영된다. 대회는 참가 접수와 예선 심사를 거쳐 각 부문 본선 진출 100개 팀을 선발한 뒤 기술 워크숍과 연구 인프라 지원을 통해 과제를 수행하는 방식으로 진행된다. 이후 본선 심사와 시연 평가, 최종 결선을 거쳐 수상팀을 선정한다. 총 상금 규모는 AI 챔피언 26억원, AI 루키 3억 5000만원 수준이다. 메가존클라우드는 참가팀 대상 그래픽처리장치(GPU) 환경 설계와 AI API 제공, 개발 환경 구축·운영, 기술 지원 등 AI 연구·개발에 필요한 컴퓨팅 인프라 운영 전반을 담당한다. 최근 AI 챔피언 참가팀 대상 기술 워크숍을 진행했으며 다음 달 4일에는 AI 루키 참가팀 대상 워크숍도 열 예정이다. 지원 인프라에는 엔비디아 H100·A100 GPU를 비롯해 클로드·제미나이·챗GPT 등 글로벌 AI API가 포함된다. 여기에 LG AI연구원 엑사원, SK텔레콤 A.X, KT 믿:음, 엔씨 바르코, 업스테이지 솔라 프로 등 국내 AI 모델 API도 함께 제공된다. 최근 국내 AI 산업은 GPU 확보와 실전형 AI 개발 경험 중요성이 동시에 커지는 분위기다. 이론 교육을 넘어 실제 생성형 AI 서비스 개발과 운영 경험을 확보할 수 있는 실무형 경진대회와 인프라 지원 사업도 확대되는 추세다. 정부 역시 AI 반도체와 클라우드 인프라, 데이터, 인재 양성을 연결하는 생태계 구축에 속도를 내고 있다. 메가존클라우드는 다양한 프로젝트 수행 경험과 2000여 명 규모 기술 인력을 기반으로 AI·클라우드 네이티브 사업을 확대 중이다. 최근에는 GPU 기반 AI 인프라 구축과 AI 전환(AX) 사업, AI 에이전트·멀티클라우드 운영 영역까지 사업 범위를 넓히는 모습이다. 서민택 메가존클라우드 부사장은 "대규모 AI 경진대회와 GPU 지원사업 등 다양한 정부 사업 수행 경험을 바탕으로 참가팀별 GPU 사용 환경 설계, 컴퓨팅 자원 제공, 운영 안정화, 기술 지원 역량을 축적해왔다"고 강조했다. 이어 "이번 사업에서도 참가팀들이 안정적인 인프라 환경에서 아이디어를 구현하고 기술 역량을 확장할 수 있도록 지원할 것"이라며 "정부 주도 AI 인재 양성과 국내 AI 생태계 활성화에 기여하겠다"고 덧붙였다.

2026.05.28 16:23한정호 기자

[유미's 픽] 2조 GPU 사업, 네이버·삼성SDS·엘리스가 거머쥘까…정부 "물량 협상 중"

정부의 2조원대 그래픽처리장치(GPU) 확충 사업이 막판 협상 단계에 들어갔다. 네이버클라우드, 삼성SDS, 엘리스그룹 등 3개사 구도에 무게가 실리고 있지만 최종 협약과 정부 내부 절차는 아직 마무리되지 않은 것으로 확인됐다. 현재 사업자별 GPU 물량과 민간 활용 비중이 막판 변수로 남은 상태로, 최종 발표는 다음주 이후로 넘어갈 가능성이 커졌다. 28일 정부와 업계에 따르면 과학기술정보통신부와 정보통신산업진흥원(NIPA)은 '2026년 AI컴퓨팅자원 활용기반 강화사업'의 데이터센터 현장실사를 마무리하고 현재 사업자별 후속 협상을 진행하고 있다. 현장실사 대상에 오른 기업은 네이버클라우드, 삼성SDS, 엘리스그룹으로, 이들이 사실상 최종 사업자로 선정될 가능성이 높다. 다만 정부 공식 발표와 협약 체결은 이뤄지지 않았다. 사업자별 GPU 물량과 민간 활용 비중, 장비 도입 일정 등에 대한 조율이 남아 있어서다. 과기정통부 내부 보고 절차도 아직 끝나지 않은 상태다. 과기정통부 관계자는 "(최종 사업자를) 아직 확정하지 않았고 선정되거나 한 것이 없다"며 "물량 협상도 현재 마무리되지 않았다"고 말했다. 이어 "기업들과 최종 계약을 맺지 않았고 내부적으로 협상안에 대한 보고도 하지 않은 상황"이라고 덧붙였다.최종 발표 시점도 유동적이다. 정부는 이르면 이번 주 발표를 검토했지만 협상과 내부 보고 절차가 남아 있어 일정이 늦어질 가능성이 커졌다. 다음 주 발표 여부도 아직 확정하지 못한 상태다. 과기정통부 관계자는 "협상이 아직 끝나지 않아 이번 주 발표는 쉽지 않을 것으로 보인다"며 "협상 이후 내부 보고 절차도 남아 있어 현재로선 정확한 발표 시점을 특정하기 어렵다"고 밝혔다. 이번 사업은 총 2조805억원을 투입해 최신 GPU와 관련 부대장비를 국내 데이터센터에 구축하고 AI 연구·산업계에 공급하는 대형 프로젝트다. 정부는 GPU 확보뿐 아니라 대규모 클러스터링, 직접 구축·운용 역량, 동일 데이터센터 내 집적 구축, 전력·냉각·네트워크 설계 능력, 최신 장비 도입 가능성 등을 주요 평가 요소로 제시했다. 네이버클라우드, 삼성SDS, 엘리스그룹은 현장실사 대상에 올랐으나, 당초 제안서를 낸 쿠팡과 KT클라우드는 발표평가 단계에서 제외된 것으로 알려졌다. 업계에선 3개사가 사실상 최종 후보군으로 좁혀졌다는 관측이 확산된 상태다. 하지만 정부는 현 단계에서 특정 사업자와 최종 사업자 수를 공식적으로 확인해주지 않고 있다. 현장실사가 끝났더라도 협상 결과에 따라 사업자별 조건과 최종 구성이 달라질 수 있기 때문이다. 최종 사업자 수 역시 사업자별 가용 범위와 협상 결과를 반영해 정해질 전망이다. 남은 핵심 쟁점은 물량과 민간 활용 비중이다. 정부는 당초 최대 1만5000장 안팎의 고성능 GPU 확보를 목표로 제시했지만, 실제 확보 물량은 GPU 기종, 예산 범위, 사업자별 구축 여건에 따라 달라질 수 있다. 과기정통부 관계자는 "협상이 아직 끝나지 않아 1만5000장 확보 여부와 사업자별 배정 물량 모두 확정되지 않았다"며 "현재는 GPU 장수와 민간 활용 비중 등을 놓고 조율하고 있고, 기종도 협상 과정에서 달라질 수 있다"고 말했다. 업계에선 네이버클라우드가 8000~9000장 안팎, 삼성SDS가 5000장 안팎, 엘리스그룹이 2000장 안팎을 가져갈 것으로 예상했다. 이 경우 총 물량은 정부가 목표로 한 1만5000장 안팎에 근접할 수 있다. 다만 최종 장수는 협상 결과에 따라 달라질 수 있고 정부가 사업자별 배정 물량을 공개하지 않을 가능성도 있다.업계에선 올해 구축 물량이 B300 등 엔비디아 블랙웰 계열 GPU 중심으로 구성될 가능성이 큰 것으로 보고 있다. 베라 루빈은 국내 입고 시점이 내년 이후로 넘어갈 가능성이 커 올해 서비스 개시 물량에는 포함되기 쉽지 않다는 관측이 나온다. 또 엔비디아 차세대 GPU 플랫폼인 '베라 루빈' 도입 계획은 이미 평가 단계에서 우대 요소로 반영된 것으로 알려졌다. 이에 현재 협상은 사업자별 GPU 장수와 기종 조합, 민간 활용 비중, 도입 일정 등을 맞추는 절차에 가깝다. 과기정통부 관계자는 "베라 루빈을 몇 퍼센트 도입해야 한다고 정해진 것은 없다"며 "이미 평가는 끝난 상황이기 때문에 무엇이 더 유리하다는 문제가 아니라 정부와 협상이 가능하냐의 문제"라고 설명했다. 여기에 베라 루빈은 차세대 모델인 만큼 올해 국내 입고와 서비스 개시가 쉽지 않을 것으로 보인다. 실제 도입 시점은 사업자별 제안 일정과 글로벌 공급 상황에 따라 최종 협상 과정에서 조율될 전망이다. 과기정통부 관계자는 "공모 단계에서도 베라 루빈의 연내 서비스는 쉽지 않을 것으로 예상했다"며 "정부가 특정 시점을 조건으로 건 것은 아니고, 최종 사업자가 확정되면 사업자별 제안 일정을 바탕으로 세부 도입 일정을 협의할 것"이라고 밝혔다. 민간 활용 비중도 사업성을 가르는 변수로 지목된다. 이번 사업은 정부 예산으로 GPU를 확보한 뒤 공공·연구 분야에 공급하는 구조지만, 사업자는 일부 자원을 자체 서비스나 기업 고객 수요에 활용할 수 있다. 공공 공급 비중이 높아질수록 정책 목적에는 부합하지만 사업자의 수익성 확보 여지는 줄어든다. 이에 사업자 입장에선 실제 배정 물량과 민간 활용 가능 범위가 중요할 것으로 보인다. GPU 가격이 오른 데다 서버, 네트워크 장비, 전력·냉각 설비, 데이터센터 보강 비용까지 고려하면 협상 조건에 따라 사업성이 달라질 수 있어서다. 대규모 장비를 확보하더라도 공공 공급과 민간 활용의 균형을 맞추지 못하면 투자 부담이 커질 수 있다. 네트워크 장비와 발주 일정도 변수로 남아 있다. 대규모 GPU 클러스터를 안정적으로 운영하려면 GPU 서버 간 고속 통신을 담당하는 인피니밴드 등 네트워크 장비가 필요한 상황이다. 하지만 협약 체결이 늦어질수록 GPU와 네트워크 장비 발주 일정에도 영향을 줄 수 있다. 정부는 사업자 선정 전까지 각 사업자가 제안한 일정과 공급 계획을 기준으로 검토하고 있다. 장비 수급 문제가 발생할 경우에는 사업자 선정 이후 정부가 함께 대응하는 방식이 거론된다. 현재까지 특정 장비 수급 문제가 공식화된 단계는 아닌 것으로 파악된다. 과기정통부 관계자는 "사업자 선정 전에는 각 사업자가 제안한 일정에 맞춰 보는 상황"이라며 "선정 이후 장비 수급 문제가 생기면 정부가 같이 참여해서 진행하는 형태가 될 것"이라고 밝혔다. 클라우드 업계에선 최종 협약 조건에 따라 사업자별 셈법이 달라질 수 있다고 분석했다. GPU 가격과 구축 비용 부담이 커진 상황에서 배정 물량과 민간 활용 비중은 수익성을 좌우할 핵심 변수로 꼽힌다. 업계 관계자는 "정부 입장에서는 1만5000장 안팎의 GPU를 맞추는 것이 중요하지만, 사업자 입장에서는 그 물량을 어떤 조건으로 가져가느냐가 더 중요하다"며 "민간 활용 비중과 차세대 장비 도입 일정, 구축 비용 부담에 따라 이번 사업이 성장 기회가 될 수도, 수익에 부담이 될 수도 있다"고 강조했다.

2026.05.28 15:34장유미 기자

'AI 인프라 병목 해결'...프라임마스, 메모리 솔루션 하반기 본격 양산

프라임마스가 글로벌 AI 데이터센터의 가장 큰 고질병으로 꼽히는 값비싼 GPU의 유휴(Idle) 현상을 해결하기 위해 초대형 메모리 확장 솔루션 양산에 나선다. 연산 장치의 발전 속도에 비해 턱없이 부족했던 메모리 용량 한계를 수백 테라바이트(TB) 단위로 확장하는 차세대 인터커넥트 기술이 글로벌 메모리 공급망의 핵심 생태계로 진입할지 주목된다. 프라임마스는 AI 인프라의 최대 병목 구간인 메모리 용량 한계를 극복하기 위해 CXL(컴퓨트 익스프레스 링크) 기반의 메모리 확장 솔루션인 'JBOM(Just a Bunch of Memory)'을 올해 하반기부터 본격 양산 공급한다고 28일 밝혔다. 프라임마스는 미국 실리콘밸리에 본사를 두고 기술 개발을 주도해 왔으며, 최근 글로벌 메모리 기업인 마이크론에 양산 물량 공급을 확정했다. 아울러 삼성전자와는 차세대 CXL 메모리 솔루션 공동 개발에 착수한 바 있다. 현재 AI 데이터센터 아키텍처의 가장 큰 비효율은 GPU의 성능을 메모리가 받쳐주지 못하는 데서 발생한다. 연산 속도에 비해 데이터가 오가는 메모리 용량이 부족하면, 막대한 비용을 들여 도입한 GPU가 연산을 멈추고 대기하는 병목 현상이 발생하기 때문이다. 결국 추가적인 GPU 증설 없이 인프라 효율을 극대화하려면 메모리 용량 확보가 필수적인 상황이다. 이 같은 효율성은 학계 및 산업계 임상 데이터로도 증명되고 있다. 지난해 말 발표된 알리바바의 '벨루가(Beluga)' 연구에 따르면, 8TB급 CXL 메모리 확장 환경을 구축했을 때 대규모 언어모델(LLM) 추론 엔진(vLLM)의 데이터 처리량이 기존 아키텍처 대비 7.35배 향상되는 결과가 확인됐다. 메모리 접근 방식과 용량 확보가 전체 AI 시스템의 생산성을 좌우하는 핵심 변수로 떠오른 이유다. 프라임마스가 선보인 'JBOM'은 차세대 인터커넥트 표준인 CXL을 활용해 다수의 대용량 메모리 카드를 하나의 거대한 풀(Pool)로 묶는 솔루션이다. 일반적으로 2~4TB 수준에 갇혀 있던 가동용 CPU 서버당 D램 용량 한계를 단숨에 수십에서 수백 TB 규모로 확장할 수 있다. 회사 측은 올해 40~120TB급 JBOM 솔루션을 시장에 우선 공급하고, 내년에는 240TB 이상으로 확장 규격을 늘리는 고도화 로드맵을 가동했다. 전덕호 프라임마스 기술전략 담당 상무는 “단순히 GPU 숫자만 늘리는 방식의 인프라 확장은 명확한 한계에 직면했다”며 “향후 AI 성능 경쟁의 전장(戰場)은 메모리 병목을 어떻게 제어하느냐에 달렸으며, 연산 중심 구조에서 메모리 중심 컴퓨팅 구조로 아키텍처의 무게중심이 이동하는 전환점이 될 것”이라고 설명했다. 그러면서 “이번 마이크론 양산 공급과 삼성전자와의 공동 R&D 체제 구축을 발판 삼아 메모리 중심 컴퓨팅 시대를 앞당길 것”이라며 “글로벌 무대에서 검증받은 원천 기술 성과가 궁극적으로 국내 반도체 생태계의 전반적인 고부가가치 경쟁력 강화로 이어지도록 하겠다”고 덧붙였다.

2026.05.28 09:58전화평 기자

[현장] "AI 도입 빠른 한국, 확장은 병목…GPU보다 운영 역량이 승부처"

한국 기업들이 인공지능(AI) 도입과 초기 성과 창출 단계는 빠르게 넘어섰지만, 조직 전반으로 확장하는 과정에선 여전히 구조적 한계에 직면한 것으로 나타났다. 단순 그래픽처리장치(GPU) 확보를 넘어 전문 인력과 운영 역량, 데이터 주권·규제 대응, 전력·네트워크·냉각 등 AI 인프라 전반을 통합적으로 설계하는 능력이 향후 경쟁력을 좌우할 것이란 분석이 나온다. STT GDC 코리아는 27일 서울 여의도 FKI타워 본사에서 'AI 인프라 개발 현황 및 전망' 미디어 세션을 열고 이같은 연구 결과를 발표했다. 이번 연구는 STT GDC 의뢰로 시장조사업체 에코시스템이 수행했다. 한국을 포함해 일본·싱가포르·인도·인도네시아·말레이시아·필리핀·태국·베트남 등 아시아 9개국에서 제조·금융·공공·통신 등 10개 산업군 종사자 644명을 대상으로 진행됐다. 조사에선 ▲전략 ▲조직 준비도 ▲데이터 거버넌스 ▲현재 인프라 수준 ▲미래 확장 전략 등 5개 영역을 기준으로 기업 AI 인프라 성숙도를 평가했다.허철회 STT GDC 코리아 대표는 "AI 확산은 이미 시작됐지만 조직 전반에 실질적으로 확장된 사례는 아직 제한적"이라며 "이 격차는 기술을 넘어 데이터를 어디에서 처리하고 누가 통제권을 갖느냐와 연결된 문제"라고 말했다. 그러면서 "이러한 AI 인프라 역량은 기업 경쟁력과 국가 단위 디지털 주권까지 좌우하는 핵심 요소"라고 덧붙였다. STT GDC는 싱가포르에 본사를 둔 글로벌 데이터센터 전문기업이다. 현재 전 세계 100개 이상 데이터센터를 운영 중이며 글로벌 하이퍼스케일러와 엔터프라이즈 고객을 대상으로 코로케이션(상면 임대) 서비스를 제공하고 있다. 회사는 다음 달 서울 금천구 가산동에 국내 첫 AI 특화 데이터센터 'STT 서울1'을 개소하며 한국 시장 공략에 본격 나설 계획이다. 이날 발표된 보고서에 따르면 한국은 아시아 내 대표적인 AI 선도 시장으로 분류됐다. 국내 응답 기업 가운데 67%는 AI를 실제 운영 환경에 적용하는 '빌더(Builder)' 단계로 나타났으며 조직 전반에 AI를 통합한 '인테그레이터(Integrator)' 단계는 30%를 기록했다. 반면 AI를 핵심 경쟁력으로 완전히 내재화한 '리더(Leader)' 단계는 2%에 그쳤다. 이는 한국이 이미 AI 파일럿과 초기 도입 단계를 넘어 실질적인 투자와 운영 단계로 진입했지만, 시장 리더십 단계로 넘어가기 위한 확장 역량은 아직 제한적인 것으로 풀이된다. 실제 국내 응답자의 75%는 AI 프로젝트가 예상 이상의 투자수익률(ROI) 등 가치를 창출했다고 답했다. 이는 아시아 평균인 34%를 크게 웃도는 수준이다. 이에 대해 허 대표는 "한국은 이미 AI 도입의 가치를 입증하는 단계는 지나왔다"며 "이제 중요한 것은 이미 구축한 AI 환경을 얼마나 빠르고 안정적으로 확장하고 최적화할 수 있느냐"라고 설명했다. 이어 "경쟁력의 중심은 단순 장비 확보에서 운영 전문성과 최적화 역량으로 이동하고 있다"고 강조했다. AI 확산 과정에서 나타나는 핵심 병목으로는 전문 인력 부족과 운영 복잡성이 지목됐다. 국내 응답자의 52%는 복잡한 AI 인프라를 운영·최적화할 내부 전문성이 부족하다고 답했으며 48%는 초기 구축 및 운영 비용 부담을 주요 과제로 꼽았다. 또 52%는 데이터 주권과 규제 준수 이슈를 AI 확장의 제약 요인으로 지적했다. 특히 보고서는 많은 기업이 AI 인프라를 단순 GPU 확보 문제로 접근하고 있지만, 실제로는 스토리지·네트워크·전력·냉각·랙 설계 등 데이터센터 전반의 최적화 역량이 중요해지고 있다고 분석했다. 아시아 전체 응답 기업의 82%는 네트워크 병목이나 지연 문제를 경험하고 있었으며 AI 워크로드를 안정적으로 지원할 수 있는 고성능 저지연 네트워크를 갖춘 조직은 7%에 불과했다. 허 대표는 "GPU만 많다고 바로 AI 경쟁력이 만들어지는 것은 아니다"라며 "워크로드에 맞는 환경과 이를 안정적으로 운영할 수 있는 시스템 설계가 중요하다"고 짚었다. 또 그는 "최근 AI 서버를 담는 랙 하중이 과거보다 두세 배 이상 높아지고 있어 전력과 냉각, 구조 설계까지 모두 달라지고 있다"고 설명했다. STT GDC는 향후 AI 인프라 시장 경쟁력이 단순 구축 규모보다 운영 전략에서 갈릴 것으로 전망했다. 특히 AI 인프라 전문 기업과의 전략적 파트너십 수요가 확대될 것으로 내다봤다. 보고서 역시 AI 성숙도가 높은 조직일수록 인프라를 직접 보유하기보다 전문 사업자와 협력해 운영 효율성과 확장성을 확보하는 경향이 강하다고 분석했다. STT GDC는 이런 흐름에 맞춰 한국 시장에서도 AI 특화 데이터센터와 운영 서비스를 확대한다는 목표다. 회사는 향후 지방을 비롯한 국내 추가 데이터센터 부지 확보와 AI 인프라 운영 서비스 확대를 검토 중이다. 허 대표는 "한국 기업들이 다음 단계로 나아가기 위해선 운영 전문성과 규제 환경을 고려한 인프라 전략, 장기적인 성능과 지속가능성을 반영한 의사결정이 중요해질 것"이라며 "국내 AI 인프라 수요 확대에 맞춰 추가 데이터센터 부지 확보와 운영 확장을 지속 검토할 계획"이라고 밝혔다.

2026.05.27 17:10한정호 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

K-컬처 성장전략 내세웠지만 현장 체감은 아직...문화 B+학점

강 건너 디캠프 불구경 하는 은행연합회의 ‘사소한 침묵’

알고리즘보다 특허…성숙해진 자율주행 시장의 새 경쟁법칙

젠슨 황, SK하이닉스 부스 깜짝 방문…"HBM4E 더 만들어달라"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.