• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI GPU'통합검색 결과 입니다. (359건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[유미's 픽] 작년 경주 빅딜서 빠졌던 LG…구광모, 젠슨 황과 'AI 판' 다시 짜나

젠슨 황 엔비디아 최고경영자(CEO)의 방한을 계기로 LG그룹과 엔비디아의 인공지능(AI) 협력 구도에 관심이 쏠리고 있다. 지난해 정부와 삼성전자, SK그룹, 현대차그룹, 네이버클라우드를 중심으로 짜인 엔비디아의 한국 AI 인프라 협력에서 응용 분야 파트너로 참여했던 LG가 이번 회동을 계기로 그래픽처리장치(GPU) 확보와 피지컬 AI, AI 데이터센터 분야에서 역할을 키울지 주목된다. 5일 재계에 따르면 황 CEO는 이날 저녁 서울 마포구 홍대 인근 식당에서 최태원 SK그룹 회장, 구광모 LG그룹 회장, 이해진 네이버 의장 등과 만찬 회동을 갖는다. 재계에선 황 CEO가 방한 기간 동안 서울 여의도 LG트윈타워와 현대차그룹 양재 사옥을 방문할 가능성도 거론되고 있다. LG 방문이 이뤄질 경우 구 회장을 비롯해 LG전자, LG이노텍, LG유플러스, LG AI연구원 등 주요 계열사 경영진이 배석할 가능성이 제기된다. 피지컬 AI와 AI 데이터센터, 전장·로보틱스, 소버린 AI 등 협력 의제가 계열사별로 걸쳐 있기 때문이다. 업계에선 구 회장과 황 CEO의 만남을 계기로 LG가 엔비디아 생태계 안에서 향후 어떤 역할을 맡을지 주목하고 있다. 앞서 지난해 10월 경주에서 발표된 엔비디아의 한국 AI 인프라 협력은 정부와 삼성전자, SK그룹, 현대차그룹, 네이버클라우드를 중심으로 진행된 바 있다. 당시 정부가 5만 장, 삼성·SK·현대차가 각각 5만 장, 네이버클라우드가 6만 장 등 총 26만 장 규모 GPU 확보 계획이 공개됐다. LG는 당시 대규모 GPU 확보 주체로 전면에 나서지는 않았다. 대신 로보틱스와 의료, 소버린 대형언어모델(LLM), 6G 등 응용 분야 협력 파트너로 이름을 올렸다. LG AI연구원의 초거대 AI 모델 '엑사원'을 활용해 스타트업과 학계의 암 진단 연구 생태계를 지원하고 엔비디아 네모 트론 등을 활용한 소버린 거대언어모델(LLM) 개발에도 참여하는 방식이었다. 이번 황 CEO 방한은 LG가 엔비디아와의 협력 범위를 응용 분야에서 AI 인프라와 산업 현장 적용 영역으로 넓히는 계기가 될 수 있을 것으로 보인다. 엔비디아가 GPU 공급을 넘어 AI 팩토리, 로보틱스, 디지털트윈, 소버린 AI 플랫폼으로 사업 영역을 확장하고 있는 만큼 가전, 제조, 로봇, AI 모델, 데이터센터 역량을 갖춘 LG와 접점이 커질 수 있을 것으로 예상된다. GPU 확보 규모도 시장의 관심사다. 삼성전자, SK그룹, 현대차그룹, 네이버클라우드가 지난해 대규모 GPU 확보 계획을 밝힌 만큼 LG가 이번에 별도 물량을 확보할지, 확보한다면 어느 계열사를 중심으로 활용할지가 관전 포인트다. 업계에선 LG전자의 로봇·스마트팩토리, LG AI연구원의 엑사원, LG CNS의 AI 데이터센터·기업 AX 사업 등을 잠재 수요처로 거론하고 있다. 다만 구체적인 GPU 수량과 도입 방식은 아직 확인되지 않았다. GPU를 직접 구매할지, 클라우드 방식으로 활용할지, 계열사별로 배분할지도 변수다. 엔비디아 최신 GPU 공급이 전 세계적으로 빠듯한 만큼 실제 도입 시점과 물량 배정도 협상 과정에서 주요 쟁점이 될 전망이다. 가장 직접적인 협력 축은 피지컬 AI가 될 것으로 보인다. 피지컬 AI는 로봇, 자율주행차, 스마트팩토리 장비처럼 현실 세계에서 움직이는 기계에 AI를 적용하는 분야다. 엔비디아는 아이작, GR00T, 옴니버스 등 로보틱스·디지털트윈 플랫폼을 앞세워 피지컬 AI 생태계를 넓히고 있다. LG전자도 해당 분야 핵심 계열사로 꼽힌다. LG전자는 가전과 홈 로봇, 스마트홈, 전장, 제조 현장을 보유하고 있다. 엔비디아의 로보틱스 플랫폼과 LG전자의 제품·제조 역량이 결합될 경우 가정용 로봇과 산업용 로봇, 스마트팩토리 분야에서 협력 여지가 커진다. LG이노텍도 협력 후보로 거론된다. LG이노텍은 전장 카메라 모듈과 센싱 부품, 반도체 기판 등 부품 사업을 갖고 있다. 피지컬 AI가 로봇과 자율주행, 스마트팩토리 장비로 확산될수록 센서와 카메라, 고성능 기판 수요가 커질 수 있어 엔비디아 생태계와의 접점이 넓어질 수 있다. LG AI연구원도 핵심 축이다. 엑사원 고도화에는 대규모 AI 컴퓨팅 인프라와 추론 최적화 기술이 필요하다. LG AI연구원이 엑사원을 기반으로 소버린 AI와 산업 특화 모델 개발을 추진하는 만큼 엔비디아 GPU와 소프트웨어 생태계 활용은 모델 경쟁력 강화와 서비스 확장에 중요한 변수로 꼽힌다. LG CNS의 역할도 부각되고 있다. LG CNS는 로봇 하드웨어를 직접 만들지는 않지만 로봇 학습, 관제, 운영, 산업 현장 적용, 스마트팩토리 구축 등 기업용 피지컬 AI 구현 영역과 맞닿아 있다. LG전자가 로봇 제품과 하드웨어, 로봇용 AI 모델 개발을 맡는다면, LG CNS는 이를 제조·물류·산업 현장에 적용하고 운영하는 실행축을 맡을 수 있다. AI 데이터센터 분야도 협력 가능성이 큰 영역이다. AI 가속기 성능이 높아질수록 발열과 전력 소모가 데이터센터 운영의 핵심 변수로 떠오르고 있어서다. LG전자의 고효율 칠러, LG에너지솔루션의 에너지저장장치(ESS), LG CNS의 데이터센터 구축·운영 역량은 엔비디아가 추진하는 AI 팩토리 확산 전략과 맞물릴 수 있다. 이에 GPU 공급을 넘어 냉각·전력·운영까지 묶은 AI 인프라 패키지에서 LG그룹의 역할이 커질 수 있을 것으로 전망된다. LG유플러스도 잠재 협력 축으로 꼽힌다. 통신망과 데이터센터, 클라우드 인프라를 보유한 만큼 엔비디아 GPU 기반 AI 서비스 확산 과정에서 기업용 AI 인프라와 네트워크, 6G 협력 등으로 접점이 생길 수 있다. 지난해 엔비디아의 한국 AI 협력 구도에서도 LG유플러스는 6G와 AI 무선접속망 분야 협력 파트너로 이름을 올렸다. 재계에선 이번 황 CEO 방한을 LG AI 전략의 분기점으로 보고 있다. 이날 저녁 만찬이 국내 주요 그룹 총수들과의 네트워킹 성격이라면, LG트윈타워 방문은 LG전자, LG이노텍, LG유플러스, LG AI연구원, LG CNS 등 계열사별 협력 방향을 구체화하는 자리가 될 수 있어서다. 업계 관계자는 "LG는 로봇과 제조, AI 모델, 데이터센터 역량을 함께 보유한 만큼 엔비디아 입장에서도 피지컬 AI 확산을 위한 협력 파트너로 볼 여지가 있다"며 "이번 만남은 LG가 엔비디아 생태계 안에서 어떤 역할을 맡을지 확인하는 계기가 될 것"이라고 말했다.

2026.06.05 17:39장유미 기자

2조원 정부 GPU 사업, 다음주 초 결론 난다…수행기관 발표 임박

정부가 총 2조 805억원 규모 그래픽처리장치(GPU) 확충 사업의 최종 선정 결과를 다음주 초 발표한다. 네이버클라우드·삼성SDS·엘리스그룹 등이 유력 후보로 거론되는 가운데 국내 최대 규모 AI 인프라 구축 사업 윤곽이 드러날 전망이다. 5일 과학기술정보통신부에 따르면 현재 '2026년 AI컴퓨팅자원 활용기반 강화사업(GPU 확보·구축·운용지원)' 사업자 선정 절차를 마무리하고 있으며 다음주 초 최종 수행기관 선정 결과를 공개할 예정이다. 이번 사업은 최신 GPU와 관련 부대장비를 국내 데이터센터에 구축해 연구·산업계에 AI 컴퓨팅 자원을 공급하기 위해 추진됐다. 총 사업비는 2조 805억원 규모다. 과기정통부와 정보통신산업진흥원(NIPA)은 앞서 제안서 평가와 데이터센터 현장실사를 진행했으며 현재 최종 협상과 내부 절차를 마무리하고 있다. 당초 지난달 중 최종 수행기관을 선정할 계획이었으나 사업자별 GPU 배정 물량과 민간 활용 비중 등을 둘러싼 협상이 이어지면서 발표 일정이 다소 늦어진 것으로 알려졌다. 업계에 따르면 네이버클라우드·삼성SDS·엘리스그룹이 최종 후보군에 오른 것으로 파악된다. 정부는 이번 사업을 통해 최대 1만 5000장에 달하는 최신 GPU를 확보한다는 목표다. 사업자 선정 과정에선 GPU 확보 능력뿐 아니라 대규모 클러스터 구축·운영 역량, 전력·냉각 인프라, 네트워크 설계 능력, 동일 데이터센터 내 집적 구축 여부 등을 종합적으로 평가했다. 특히 엔비디아 차세대 AI 플랫폼인 '베라 루빈' 도입 계획과 연내 서비스 개시 가능성도 주요 평가 요소로 반영했다. 정부는 지난해에도 1조 4600억원의 추가경정예산안을 편성해 GPU 약 1만 3000장을 도입하는 AI 컴퓨팅 인프라 확충 사업을 진행했고 네이버클라우드와 NHN클라우드, 카카오를 수행기관으로 선정했다. 이들 기업은 현재 정부·연구기관·기업 등을 대상으로 GPU 서비스를 제공 중이다. 올해 사업은 규모와 예산이 한층 확대된 후속 프로젝트로 진행되며 연내 서비스 개시를 목표로 하고 있다. 최종 선정된 사업자는 협약 체결 이후 GPU 발주와 데이터센터 구축, 장비 설치 및 성능 검증 절차에 착수하게 된다. 정부는 이를 기반으로 국내 AI 연구개발과 산업 현장에 대규모 AI 컴퓨팅 자원을 공급할 계획이다. 과기정통부 관계자는 "현재 사업자 선정 절차를 마무리하는 단계"라며 "다음주 초 최종 결과를 발표할 예정"이라고 밝혔다.

2026.06.05 15:20한정호 기자

'방한' 젠슨 황 "한국은 AI·로봇공학 뛰어나...R&D 센터 투자에 최적"

젠슨 황 엔비디아 최고경영자(CEO)가 5일 방한했다. 지난해 10월 말 이후 약 7개월 만이다. 황 CEO는 입국 직후 차세대 고대역폭메모리(HBM) 품질 테스트 완료 소식을 전하는 한편, 국내 연구개발(R&D) 센터 설립과 로봇공학 투자계획을 구체화하며 한국 인공지능(AI) 생태계를 아우르는 광폭 행보를 시작했다. 황 CEO는 대만에서 열렸던 연례 AI 콘퍼런스 GTC 타이베이 일정을 모두 소화한 뒤, 이날 오후 1시 24분쯤 전세기로 김포비즈니스항공센터를 통해 입국했다. 그는 "한국을 위해 아주 많은 비즈니스를 가져왔다"며 "한국을 위한 깜짝 선물이 준비돼 있다"고 밝혔다. 구체적인 공개 시점에 대해서는 말을 아꼈다. 황 CEO는 방한 목적이 글로벌 공급망 조율에 있음을 명확히 했다. 특히 반도체 업계 초미의 관심사였던 HBM4 공급사 품질 테스트와 관련해 "삼성전자와 SK하이닉스 등 3사 모두 인증이 완료돼 현재 양산 중"이라며 "모두 차세대 '베라 루빈' 아키텍처 공급을 위해 경쟁하고 있다"고 설명했다. 한국 내 직접 투자 계획도 공식화했다. 황 CEO는 "한국 R&D 센터 설립을 위한 인력 채용을 이미 시작했다"며 "한국은 AI와 로봇공학 전문성이 뛰어나 R&D 투자에 최적의 장소이며, 충분한 인력이 갖춰지면 부지도 마련할 것"이라고 밝혔다. 차세대 투자 분야로는 로봇공학을 꼽았다. 한국이 제조업과 메카트로닉스, AI 기술 융합의 완벽한 조건을 갖춰 로봇 산업을 지원할 거대한 로컬 생태계가 될 것이라고 평가했다. 재계 총수들과 '삼겹살 회동'… 게임·스타트업·문화계 넘나드는 일정 방한 첫날인 이날 저녁, 황 CEO는 홍대입구 일대 삼겹살 전문점에서 국내 주요 대기업 리더들과 만찬을 갖는다. 이 자리에는 최태원 SK그룹 회장, 구광모 LG그룹 회장, 이해진 네이버 글로벌투자책임자(GIO) 등이 참석할 예정이다. 삼겹살에 소주를 곁들이는 이른바 '삼소 회동' 형태로 진행되는 만찬에서는 AI 반도체 공급망 안정화를 비롯해 로보틱스, 피지컬 AI, AI 데이터센터 인프라 등 미래 핵심 산업 관련 협력 방안을 폭넓게 논의할 것으로 전망된다. 만찬에 앞서 황 CEO는 e스포츠 게임단 T1이 운영하는 홍대 인근 PC방을 방문해 '페이커' 이상혁을 포함한 선수단과 만났다. 오는 7일에는 김택진 엔씨소프트 대표와 만나 게임과 AI 분야 협력을 논의한다. 방한 마지막 날로 예상되는 8일 오전에는 서울 여의도 LG 본사 방문이 예정됐다. 오후에는 서울 신라호텔에서 업스테이지, 노타, 에임인텔리전스 등 국내 주요 AI 및 로봇 스타트업 경영진을 초청해 비공개 간담회를 개최한다. 같은 날 서울대 AI연구원과 로보틱스 연구소를 비롯해 주요 대기업 사옥을 차례로 방문하는 일정도 조율 중이다. 비즈니스 일정 외에 대중과 접점도 넓힌다. 황 CEO는 방한 기간 중 tvN의 대표 토크쇼 예능 프로그램 '유 퀴즈 온 더 블럭' 녹화에 참여한다. 주말에는 서울 잠실야구장에서 열리는 두산 베어스 홈경기 시구자로 마운드에 오를 예정이다.

2026.06.05 15:01전화평 기자

[AI 고속도로] "GPU 의존 낮춘다"…AWS 자체 칩 생태계, 핀터레스트 합류로 탄력

아마존웹서비스(AWS)가 자체 개발 칩을 앞세워 인공지능(AI) 인프라 시장에서 존재감을 키우고 있다. 생성형 AI 확산으로 그래픽처리장치(GPU) 수요가 폭증한 가운데 대규모 플랫폼 기업들이 비용 효율과 공급 안정성을 확보하기 위해 클라우드 사업자의 맞춤형 반도체를 선택하는 흐름이 강해지고 있어서다. 5일 AWS 공식 뉴스룸에 따르면 핀터레스트는 오는 2031년까지 AWS 클라우드 서비스에 40억 달러를 투입하는 장기 계약을 맺었다. 핀터레스트 역사상 최대 규모 인프라 계약이다. 양사는 2010년부터 협력 관계를 이어왔으며 이번 계약을 통해 AI 모델 학습·추론과 플랫폼 인프라 전반에서 협력을 확대한다. AWS 자체 칩 활용 확대도 이번 계약의 주요 축이다. 핀터레스트는 AWS 트레이니움으로 개인화 시각 검색과 AI 기반 발견 기능을 구동하는 대규모 언어모델(LLM)과 비전언어모델(VLM)을 운영할 계획이다. AWS 그래비톤 사용도 늘린다. 그래비톤은 이미 핀터레스트 컴퓨팅 인프라의 약 3분의 1을 담당하고 있다. 이처럼 핀터레스트가 AWS 자체 칩 활용을 늘리는 것은 AI 기능 확대에 따른 인프라 부담을 줄이기 위한 행보로 풀이된다. 핀터레스트는 이미지 기반 검색과 추천, 쇼핑, 광고를 핵심 사업으로 한다. 이용자가 이미지를 통해 상품과 아이디어를 찾는 과정에서 추천 정확도와 검색 품질은 체류 시간, 광고 노출, 구매 전환에 영향을 준다. 업계 관계자는 "추천 정확도와 검색 품질을 높이려면 AI 모델 고도화가 필요하지만, 그만큼 연산 비용도 늘어날 수밖에 없다"며 "수억 명 이용자를 대상으로 개인화 검색과 추천 기능을 실시간 제공하려면 학습뿐 아니라 추론 인프라도 대규모로 필요하다"고 짚었다. 이어 "핀터레스트가 이번에 AWS 트레이니움과 그래비톤을 활용하는 것도 AI 서비스 확장과 인프라 비용 효율을 동시에 노리는 움직임으로 보인다"고 덧붙였다. 이 소식에 시장도 즉각 반응했다. 4일(현지시간) 뉴욕증시에서 핀터레스트 주가는 전 거래일보다 4.45% 오른 21.59달러에 거래를 마쳤다. 장중에는 22.12달러까지 올랐다. 이는 투자자들이 이번 계약을 단기 비용 부담보다 AI 검색·광고 경쟁력 강화 신호로 받아들였기 때문이다. AWS도 이번 계약으로 자체 AI 반도체 생태계 확장에 속도를 내게 됐다. 클라우드 시장에서 AWS는 마이크로소프트 애저, 구글 클라우드와 AI 인프라 주도권을 놓고 경쟁하고 있다. AI 반도체 시장은 엔비디아 GPU 중심으로 성장해 왔지만, 최근 빅테크들은 GPU 공급망 의존도를 낮추기 위해 자체 칩과 맞춤형 클라우드 인프라를 병행하는 전략을 펴고 있다. AWS는 트레이니움과 그래비톤을 통해 이 수요를 흡수하고 있다. 트레이니움은 AI 학습과 추론을 겨냥한 AWS 자체 가속기다. 그래비톤은 Arm 기반 중앙처리장치(CPU)로, 범용 워크로드와 AI 서비스 운영에 필요한 효율성을 앞세운다. 또 스노우플레이크, 메타 등도 최근 AWS 자체 칩 사용을 확대하는 계약을 맺은 것으로 알려졌다. 여기에 핀터레스트까지 가세하면서 AWS 자체 칩 생태계가 기업 AI 인프라의 주요 선택지로 부상하는 모습이다. 업계 관계자는 "AI 서비스 확산으로 최근 기업들의 인프라 비용 부담도 커지고 있다"며 "검색, 추천, 광고, 쇼핑처럼 실시간 추론이 많은 서비스는 GPU 성능뿐 아니라 CPU, 네트워크, 데이터센터, 쿠버네티스 운영 효율까지 따져야 한다"고 설명했다. 이어 "핀터레스트가 이번에 AWS 자체 칩을 활용하는 것도 AI 기능 확대에 필요한 인프라를 장기적으로 확보하면서 비용 효율을 높이려는 것"이라고 덧붙였다. 이처럼 AWS의 자체 칩 확산은 클라우드 시장의 고객 확보 경쟁으로도 이어지고 있다. AI 워크로드는 데이터 저장, 모델 학습, 추론, 배포 환경이 함께 움직이는 구조로, 기업이 특정 클라우드 기반으로 AI 서비스를 구축하면 이후 다른 사업자로 옮기는 데 기술적 부담과 비용이 커질 수 있다. 또 클라우드 사업자 입장에선 자체 칩을 앞세운 장기 계약이 대형 고객을 붙잡아두는 수단이 될 수도 있다. 고객사는 GPU 공급 불안과 비용 부담을 줄일 수 있지만, 특정 클라우드 생태계에 대한 의존도가 높아지는 부담도 안게 된다. 국내 플랫폼 기업들도 비슷한 과제를 안고 있다. 네이버, 카카오, 쿠팡, 무신사, 당근 등 이용자 기반이 큰 기업들은 검색, 추천, 광고, 커머스 영역에서 AI 적용을 확대하고 있다. AI 기능이 서비스 전면에 배치될수록 추론 비용과 인프라 효율은 수익성에 직접 영향을 미친다. 이에 따라 AI 인프라 투자 방식도 더 세분화될 전망이다. 모델 학습에는 GPU를 활용하더라도 검색, 추천, 광고처럼 반복적으로 발생하는 추론 업무에는 비용 효율이 높은 칩과 클라우드 인프라를 조합하려는 수요가 커질 수 있다. 이에 자체 데이터센터와 외부 클라우드를 어떤 비중으로 나눠 쓸지도 서비스 안정성과 비용 구조를 좌우하는 변수가 될 것으로 보인다. 업계 관계자는 "기업들이 AI 서비스를 실제 사업에 적용하기 시작하면서 인프라 전략도 비용과 운영 효율 중심으로 바뀌고 있다"며 "핀터레스트 사례는 클라우드 사업자의 자체 칩이 GPU 중심 인프라를 보완하는 선택지이자 장기 고객 확보 수단으로 활용될 수 있다는 점을 보여준다"고 말했다.

2026.06.05 11:36장유미 기자

KT, 클린존·AI GPU 등 금융 AX 전략 소개

KT는 금융 산업에 최적화된 AX 전략을 선보였다고 4일 밝혔다. 이날 KT는 서울 종로구 KT 광화문빌딩 웨스트에서 금융 고객을 대상으로 글로벌 6G 동향과 기술 패러다임 변화를 기반으로 한 네트워크 전략과 한국 금융사의 AX 트렌드, 협력 사례 등을 소개했다. KT는 커뮤니케이션 서비스를 도입한 고객사의 실제 사례 발표가 참석자들의 공감을 이끌어냈다고 설명했다. 먼저 KT 스마트메시지가 제공하는 고객 커뮤니케이션 가치 혁신을 주제로 변화하는 소비자 행태와 커뮤니케이션 트렌드에 대응하는 기업메시징 전략을 설명했다. 이 자리에선 스마트메시지 RCS, 커뮤니즈, 모바일고지 등 주요 라인업이 공개됐다. KT 기업메시징 안정성과 빅데이터 기반 분석 리포트, 아이폰 RCS 자동 전환 등 메시징 플랫폼의 차별화된 경쟁력을 강조하고, 실제 적용 사례를 통해 서비스 도입 효과를 구체적으로 설명했다. KT 대표 보안 플랫폼인 '클린존'을 중심으로 디도스 대응 전략도 공유했다. 클린존은 디도스 공격 발생 시 유해 트래픽을 차단하고 정상 트래픽만을 서버로 전달함으로써 서비스 중단 없이 안정적인 운영을 지원하는 클라우드 기반 보안 솔루션이다. 실제 공격 대응 사례와 운영 방식, 관제 경험, 기술 노하우 등이 소개됐다. KT는 AI기반 금융서비스 안정성과 생산성 혁신 방안으로 'KT 매니지드 AI GPU 서비스'를 통해 AI 인프라 운영 방안도 제안했다. 서비스는 AI 솔루션과 GPU 인프라를 통합 제공하는 구독형 모델로, 인프라 구축 부담 없이 AI 개발에 집중하려는 기업과 연구 기관의 수요를 반영한 것이 특징이다. KT는 AX 전략 소개에 이어, 향후 다양한 산업 분야로 대상을 확대해 AX 전략을 설명하는 자리를 지속적으로 마련할 계획이다. 김원태 KT 공공금융사업본부장은 “KT는 금융사의 디지털 전환을 지원하는 전략적 파트너로서 기술력과 전문성을 지속적으로 축적해왔다”며 “앞으로도 네트워크 경쟁력과 안정적인 서비스 품질을 기반으로 산업별 특화 AX 전략을 지속적으로 제공하며 시장을 확대해 나가겠다”고 말했다.

2026.06.04 16:12홍지후 기자

슈퍼마이크로, 1GW급 'AI 팩토리' 청사진 공개…에이전틱 AI 인프라도 강화

슈퍼마이크로가 차세대 인공지능(AI) 데이터센터와 에이전틱 AI 인프라 시장 공략에 속도를 낸다. 엔비디아 차세대 AI 플랫폼 '베라 루빈' 기반 초대형 데이터센터 구축 청사진을 공개한 데 이어 Arm과 협력한 고효율 랙 스케일 인프라까지 선보이며 AI 인프라 경쟁력을 강화하는 모습이다. 슈퍼마이크로는 엔비디아 베라 루빈 NVL72 및 엔비디아 HGX 루빈 NVL8 플랫폼 기반 '데이터센터 빌딩 블록 솔루션(DCBBS)' 블루프린트를 공개했다고 4일 밝혔다. 이날 회사는 Arm AGI 중앙처리장치(CPU) 기반 엔터프라이즈 에이전틱 AI용 신규 랙 스케일 인프라도 함께 선보였다. 최근 AI 인프라 시장은 단순 그래픽처리장치(GPU) 공급 경쟁을 넘어 데이터센터 전체를 얼마나 빠르고 효율적으로 구축·운영할 수 있는지로 경쟁 축이 이동하고 있다. 특히 초거대 AI 모델 확산과 AI 에이전트 수요 증가로 컴퓨팅 성능뿐 아니라 전력·냉각·네트워크·스토리지·운영 소프트웨어를 통합 제공하는 'AI 팩토리' 구축 역량이 핵심 경쟁력으로 부상 중이다. 이번에 공개된 DCBBS 블루프린트는 5메가와트(MW)급 데이터센터부터 1기가와트(GW)급 초대형 AI 데이터센터까지 구축할 수 있도록 설계됐다. 엔비디아 최신 레퍼런스 아키텍처를 기반으로 1152개 GPU 규모 확장형 유닛을 제공하며 컴퓨팅과 스토리지, 네트워킹, 전력 인프라, 수냉식 냉각 시스템을 통합 지원한다. 이를 통해 슈퍼마이크로는 데이터센터 설계부터 구축, 운영까지 전 과정을 단일 체계로 지원한다는 목표다. 현장 시설 조사와 설계, 냉각 시스템 구성, 전력 인프라 구축, 랙 통합, 시운전, 소프트웨어 설치까지 일괄 제공해 구축 기간을 단축할 수 있다는 점을 강점을 내세우고 있다. 특히 엔비디아 베라 루빈 NVL72 플랫폼은 이전 세대 대비 GPU 메모리 대역폭과 GPU 간 연결 대역폭, 네트워크 성능이 향상돼 초거대 AI 모델 학습과 추론 환경에 최적화됐다. 슈퍼마이크로는 10만 개 이상 GPU가 적용된 대규모 수냉식 AI 데이터센터 구축 경험을 바탕으로 관련 시장 공략을 강화할 계획이다. 에이전틱 AI 시장을 겨냥한 신규 랙 스케일 인프라도 공개했다. Arm과 협력해 선보인 이번 솔루션은 Arm AGI CPU 기반으로 설계됐으며 기업 데이터센터의 AI 에이전트 워크로드 처리 효율을 높이는 데 중점을 뒀다. 신규 플랫폼은 공냉식 서버와 GPU 서버, 수냉식 멀티노드 서버 등으로 구성된다. Arm 네오버스 CSS V3 기반 CPU를 적용해 전력 효율과 컴퓨팅 집적도를 높였으며 단일 공냉식 랙 환경에서 6000개 이상의 CPU 코어를 구성할 수 있도록 설계됐다. 슈퍼마이크로는 Arm AGI CPU가 기존 아키텍처 대비 랙당 2배 이상의 성능을 제공할 수 있으며 AI 데이터센터 용량 1GW 기준 최대 100억 달러 규모 설비투자(CAPEX) 절감 효과를 지원할 수 있다고 설명했다. 이를 통해 에이전틱 AI 확산에 따른 전력과 공간 제약 문제를 해결하는 데 기여한다는 방침이다. 찰스 리앙 슈퍼마이크로 최고경영자(CEO)는 "엔비디아 베라 루빈 NVL72 플랫폼은 AI 팩토리 성능의 새로운 기준을 제시한다"며 "DCBBS 블루프린트는 5MW부터 1GW에 이르는 모든 규모의 환경을 구축할 수 있도록 검증된 엔드투엔드 구축 방식을 제공한다"고 말했다. 이어 "우리는 업계 초기부터 세계 최대 규모 수냉식 AI 팩토리를 구축해왔다"며 "이러한 경험과 노하우를 모든 블루프린트에 반영해 고객이 설계 단계부터 실제 운영 환경 구축까지 더욱 빠르게 전환할 것"이라고 덧붙였다.

2026.06.04 14:35한정호 기자

[AI 고속도로] "GPU보다 뜨겁다"…달아오른 냉각 시장, 엑스너지 몸값에 '깜놀'

AI 데이터센터 투자 열기가 반도체를 넘어 냉각·공조 인프라 시장으로 번지고 있다. 고성능 GPU와 AI 서버 도입이 늘면서 발열과 전력 밀도 문제가 데이터센터 구축의 핵심 변수로 떠오른 가운데 관련 장비 업체들의 몸값도 빠르게 뛰고 있다. 4일 블룸버그통신에 따르면 엑스너지(Xnrgy) 클라이밋 시스템 주요 주주들은 최근 회사 매각 검토에 나섰다. 매각이 성사될 경우 기업가치는 최대 100억 달러(약 15조3000억원)에 이를 수 있는 것으로 알려졌다. 엑스너지는 AI 데이터센터에 쓰이는 냉난방·공조 부품을 제조하는 비상장사다. 2019년 와이스 잘랄리 최고경영자(CEO)가 설립했으며 캐나다 몬트리올과 미국 애리조나에 생산 거점을 두고 있다. 현재 엑스너지 주요 주주로는 블랙록과 테마섹홀딩스의 합작사인 디카보나이제이션 파트너스가 포함돼 있다. 이들은 자문사와 함께 전략적 선택지를 검토 중이며 매각도 이 중 하나로 거론된다. 다만 최종 결정은 내려지지 않았고 기존 주주들이 회사를 계속 보유할 가능성도 있다. 이번 일이 주목받는 이유는 AI 데이터센터 투자 경쟁이 냉각·열관리 설비 업체로 번지고 있기 때문이다. AI 서버는 기존 범용 서버보다 전력 소모와 발열이 커 냉각 설비 확보가 데이터센터 증설의 주요 변수로 꼽힌다. 그래픽처리장치(GPU)와 고대역폭메모리(HBM), 네트워크 장비를 확보해도 전력·냉각 인프라가 뒷받침되지 않으면 대규모 AI 데이터센터 운영에 제약이 생길 수 있다. 이에 글로벌 기업들은 이미 관련 업체 확보에 속도를 내고 있다. 이콜랩은 지난 3월 KKR이 운용하는 펀드로부터 AI 데이터센터 냉각 기술 기업 쿨IT시스템스를 47억5000만 달러에 인수하기로 했다. 같은 달 이튼은 골드만삭스가 지원하는 보이드코퍼레이션으로부터 보이드 써멀 사업을 95억 달러에 인수하는 거래를 마무리했다. AI 데이터센터 투자 경쟁의 초점도 서버와 반도체에서 전력·냉각 인프라로 넓어지고 있다. 고집적 AI 랙 확산으로 액체냉각, 열교환, 공조 최적화 기술 수요가 커지고 있어서다. 이에 클라우드 사업자와 데이터센터 운영사들은 전력 사용 효율과 공간 효율을 동시에 높일 수 있는 설비 확보에 나서고 있다. 국내 데이터센터·전력·공조 업계도 영향을 받을 것으로 보인다. 그동안 국내 AI 데이터센터 경쟁은 GPU, HBM, 서버 확보에 무게가 실렸다. 하지만 글로벌 시장에서는 냉각과 전력 공급, 열관리 설계 역량이 데이터센터 수주 경쟁의 변수로 떠오르고 있다. 삼성전자와 SK하이닉스 등 반도체 기업뿐 아니라 클라우드, 건설, 전력기기, 공조 업체 간 협력 필요성도 커지고 있다. AI 데이터센터는 단일 장비 성능보다 전력 공급, 냉각 효율, 공간 설계, 운영 안정성을 묶은 통합 인프라 역량이 중요해지고 있기 때문이다. 업계 관계자는 "AI 데이터센터 시장은 GPU 확보 경쟁을 넘어 전력과 냉각 인프라를 누가 안정적으로 갖추느냐의 싸움으로 바뀌고 있다"며 "냉각·공조 기술을 가진 기업들의 전략적 가치가 앞으로 더 커질 것"이라고 말했다.

2026.06.04 10:05장유미 기자

인텔 "CPU·GPU·파운드리·맞춤형 반도체 중심 전략 재정비"

[타이베이(대만)=권봉석 기자] "인텔 재정비는 5~10년 단위 장기 전환 프로젝트다. 작년 인텔에 왔을 때 재무 구조 안정화, 글로벌 리더십 재편, 운영 효율화에 집중했다. 현재는 CPU 경쟁력 회복과 데이터센터·PC·파운드리 등 모든 영역에서 성장 엔진을 구축하고 있다." 2일(현지시간) 오후 타이베이 난강전람관에서 진행된 인텔 컴퓨텍스 기조연설 이후 글로벌 기자단과 만난 립부 탄 인텔 CEO가 이렇게 설명했다. 이날 질의응답에는 립부 탄 CEO를 필두로 스리니바산 아이옌가 중앙엔지니어링그룹 수석부사장, 케보크 케치치안 데이터센터그룹 총괄, 알렉스 카투지안 클라이언트 컴퓨팅 및 피지컬AI 그룹 총괄 등 주요 인사들이 참여했다. 립부 탄 CEO는 "AI 에이전트 확산이 반도체 수요 구조 자체를 변화시키고 있으며 추론과 오케스트레이션 중심 AI 환경에서 CPU의 중요성이 다시 커지고 있다”고 강조했다. "에이전틱 AI, CPU 중요성 높일 것... GPU도 지속 투자" 인텔을 포함한 주요 CPU 공급사는 과거 GPU에 편중됐던 AI 인프라가 에이전틱 AI 환경에서는 CPU에 좀 더 균형을 맞추는 형태로 재편될 것으로 전망하고 있다. 립부 탄 CEO도 "AI 에이전트가 동시에 대규모로 실행되는 구조에서는 고밀도 스케줄링과 데이터 관리가 중요하며, 이 과정에서 제온 프로세서가 핵심 역할을 수행한다"고 밝혔다. 인텔은 이날 CPU 뿐만 아니라 PC 게임, 모바일 게임, AI PC를 아우르는 GPU에 지속적으로 투자하겠다고 설명했다. 또 고성능 게이밍 GPU 시장에서도 경쟁을 지속할 계획이며, 초기 제품군이 생태계 안착 단계에 진입했다고 평가했다. 알렉스 카투지안 총괄은 "GPU는 단순한 그래픽 장치를 넘어 AI 기능을 구현하는 핵심 컴퓨팅 자원이며 게임 개발자 및 엔진 생태계와 협력이 빠르게 확대되고 있다"고 밝혔다. "TSMC는 핵심 파트너/경쟁사... 고객사는 비공개" 립부 탄 CEO는 파운드리 부문 경쟁사인 대만 TSMC와 관련해 "TSMC는 핵심 파트너이자 주요 고객이며, 인텔 제품 상당수가 해당 생태계에서 생산된다"고 설명했다. 최근까지 반도체 공급망 소식통을 통해 나온 엔비디아, 애플 등 잠재적 고객사 수주설에 대해 "복수의 잠재 고객과 논의 중이지만 개별 고객은 공개하지 않는 것이 원칙"이라고 즉답을 피했다. 이어 "과거 파운드리 확장 시점은 고객사 확보 여부에 달렸다고 밝힌 바 있다. 인텔 18A 등 공정의 외부 고객사 확보를 파악할 수 있는 가장 좋은 방법은 투자 규모 증가"라고 답변했다. "맞춤형 실리콘 사업, 잠재 고객사 있다... 긴밀히 협력중" 맞춤형 실리콘 사업은 인텔의 또 다른 성장 동력으로 강조됐다. 스리니바산 아이옌가 수석부사장은 "맞춤형 실리콘은 크게 드러나지 않았지만 오래 전부터 계속된 사업 분야이며 새롭다고 할 수도 없다"고 설명했다. 이어 "맞춤형 실리콘 공급 사업은 인텔이 가진 종합반도체기업(IDM) 사업 모델, 그리고 인텔 파운드리의 경쟁력 강화에 큰 몫을 하고 있다. 구글과 IPU(인프라 프로세싱 유닛) 협력, 에릭슨과의 장기 공급 계약 등이 대표적"이라고 덧붙였다. 이날 인텔은 맞춤형 실리콘 분야에서도 잠재 고객사가 있음을 시사했다. 스리니바산 아이옌가 수석부사장은 "현재 공개할 수 없는 추가 고객사가 있지만 매우 밀접한 협력 관계를 유지하고 있다"고 설명했다. "PC용 프로세서, 로드맵 재정비로 경쟁사에 대응" 알렉스 카투지안 클라이언트 컴퓨팅 및 피지컬AI 그룹 총괄은 PC와 게이밍, 워크스테이션 등에서 거세지고 있는 경쟁사와 대응하기 위해 제품 포트폴리오 재정비에 나서겠다고 밝혔다. 그는 "칩렛과 타일 기반 아키텍처, 그리고 새로운 CPU 로드맵을 통해 보급형부터 조립 PC, 고성능 PC 등 모든 구간에서 대응할 것"이라고 설명했다. 전날(1일) 엔비디아가 발표한 블랙웰 GB10 기반 AI PC 'RTX 스파크'에 대해 "엔비디아의 시장 진입은 그만큼 PC가 중요하다는 의미다. 경쟁은 환영할 일이며 PC는 여러 업체의 신규 참가와 시장 확대를 통해 핵심 연산 플랫폼이 될 것"이라고 평가했다. "외부/내부 멀티 파운드리 전략 여전히 유효" 인텔은 2021년 등장한 IDM 2.0 전략을 변함없이 진행한다고 밝혔다. 케보크 케치치안 총괄과 알렉스 카투지안 부사장 모두 "일부 제품은 TSMC 등 외부 파운드리를 활용하고, 핵심 제품은 인텔 18A 등 자체 공정을 활용할 것"이라고 답했다. 글로벌 생태계 전략에서는 아시아, 특히 대만 OEM·ODM 생태계의 중요성이 강조됐다. 립부 탄 인텔 CEO는 "특정 지역이나 단일 파트너에 의존하지 않고 개방형 표준 기반의 협력 네트워크를 확대하는 방향으로 전환 중"이라고 설명했다.

2026.06.02 22:46권봉석 기자

"소나무 수백만 그루 효과"…롯데이노베이트, 데이터센터 '초고효율' 국책과제 참여

롯데이노베이트가 데이터센터 에너지 효율 혁신과 탄소중립 실현을 위한 국가연구개발과제에 본격 착수한다. 이를 통해 차세대 열관리 기술을 선점하고 설계·구축·운영(DBO) 사업 경쟁력을 한층 강화한다는 전략이다. AI 확산에 따라 고성능 GPU 도입이 빠르게 늘어나는 가운데 데이터센터의 전력 효율과 열관리 경쟁력이 사업 성패를 좌우하는 핵심 요소로 떠오르면서다. 롯데이노베이트는 한국산업기술기획평가원(KEIT)이 주관하는 '2026년도 배터리 및 전기전자 분야 신규 연구개발'의 일환인 '데이터센터 탄소중립을 위한 열관리 기술개발' 과제 수행을 위해 아주대학교 산학협력단 주관 컨소시엄에 합류했다고 2일 밝혔다. 최근 AI 산업의 급성장으로 고성능 GPU(그래픽처리장치) 도입이 급증하면서 데이터센터의 랙(Rack)당 전력 밀도가 전례 없이 높아지고 있다. 전력 밀도 상승은 곧바로 탄소 배출량 증가로 이어지기 때문에, 기존 공랭식(가공 공기를 이용한 냉각) 방식의 한계를 극복하고 데이터센터 운영 효율(PUE·전력효율지수)을 개선할 차세대 열관리 기술 도입이 시급한 실정이다. 이번 연구개발과제는 기존 공랭식 데이터센터의 에너지를 획기적으로 절감하고 탄소중립을 달성하는 것을 목표로 한다. 구체적으로는 ▲광센싱 기반 분포형 온도 센서(DTS) 및 AI 열관리 시스템 ▲고효율 인랙(In-Rack) 냉각 시스템 개발 ▲실제 데이터센터 기반의 실증 등 핵심 기술의 조기 확보에 중점을 둔다. 컨소시엄은 멀티스케일 분포센싱과 AI 기술을 결합한 차세대 인랙 냉각 시스템을 통해 기존 냉각 방식의 한계를 뛰어넘겠다는 구상이다. 이번 컨소시엄에는 주관기관인 아주대를 비롯해 롯데이노베이트, 한국기계연구원(KIMM), 중앙대학교, 에스엠인스트루먼트가 참여하며, 향후 약 5년간 공동으로 세부 연구과제를 수행할 예정이다. 롯데이노베이트는 자사가 운영 중인 데이터센터를 기반으로 실증 및 검증을 전담하며, 전력효율지수인 PUE를 1.2 이하로 낮추는 것을 최종 목표로 삼았다. 표준적인 데이터센터의 PUE가 1.5 수준인 것을 감안하면 압도적인 효율이다. 실제로 서울과 용인 등 롯데이노베이트의 자사 데이터센터에 이 기술을 우선 적용해 PUE 1.2를 달성할 경우, 연간 약 2만 2,000톤의 탄소 배출 감축 효과가 기대된다. 나아가 기후에너지환경부 자료에 따른 2025년 국내 데이터센터 연간 전체 전력 소모량(약 8.2TWh)을 기준으로 이를 전국에 확대 적용할 경우 연간 68만 4000톤에 달하는 탄소 배출을 줄일 수 있을 것으로 분석된다. 롯데이노베이트는 이번 과제를 통해 확보한 고효율 열관리 핵심 기술을 자사의 핵심 비즈니스인 DBO 사업 모델에 적극 고도화할 계획이다. 데이터센터의 설계부터 구축, 운영에 이르는 전 과정에 친환경 고효율 솔루션을 빌트인(Built-in) 형태로 결합해 차별화된 수주 경쟁력을 확보하겠다는 전략이다. 롯데이노베이트 관계자는 "AI 시대의 데이터센터는 안정적인 운영을 넘어 에너지 효율과 열관리 기술이 곧 기업의 핵심 경쟁력이 되는 시대"라며 "이번 국가연구개발과제를 통해 확보할 세계 최고 수준의 기술력을 바탕으로 DBO 사업을 고도화하고, 지속가능한 친환경 데이터센터 생태계 구축을 선도해 나가겠다"고 강조했다.

2026.06.02 10:59남혁우 기자

Arm "엔비디아 RTX 스파크, 차세대 에이전틱 PC 이정표"

[타이베이(대만)=권봉석 기자] Arm은 1일(현지시간) 엔비디아가 컴퓨텍스 타이베이 2026 기조연설에서 공개한 Arm 기반 고성능 AI PC 'RTX 스파크'에 대해 "PC 기반 에이전틱 컴퓨팅의 미래에 중요한 의미를 지닌 제품"이라고 강조했다. 엔비디아는 1일 오전 타이베이 뮤직센터에서 진행한 기조연설에서 블랙웰 GB10 기반으로 설계된 윈도용 Arm PC 'RTX 스파크'를 공개했다. RTX 스파크는 고성능 Arm 코어텍스-X925 10코어와 저전력·고효율 Arm 코어텍스-A725 10코어로 구성된 20코어 그레이스 CPU, 블랙웰 RTX GPU와 완전 통합 메모리를 결합했다. 고성능 CPU와 GPU를 활용해 고도화된 AI 워크로드, 콘텐츠 제작, 게임 및 에이전틱 컴퓨팅 경험을 제공하도록 설계됐다. Arm은 "RTX 스파크는 윈도 온 Arm 생태계에 중요한 이정표로, 차세대 에이전틱 PC에 대한 공동 비전을 중심으로 엔비디아, Arm, 마이크로소프트와 주요 PC 제조사의 협력을 이끌어 낼 역할을 할 것"이라고 밝혔다. 이날 크리스 버기 Arm 엣지 AI 사업부문 총괄 수석부사장은 "AI 에이전트가 이용자를 대신해 점점 더 많은 추론, 계획 및 작업 실행을 수행함에 따라 복잡한 AI 워크로드를 조율하는 CPU의 중요성이 더욱 더 커지고 있다"고 밝혔다. 이어 "RTX 스파크는 Arm의 고성능·고효율 컴퓨팅 플랫폼과 엔비디아의 GPU 리더십을 결합해 지능적이고 반응성이 뛰어난 새로운 유형의 에이전틱 PC를 구현했다"고 평가했다.

2026.06.01 18:15권봉석 기자

배경훈 부총리, 피지컬 AI트윈에 방점…"현재 준비중"

배경훈 부총리 겸 과학기술정보통신부 장관이 KAIST AI대학 비전 선포식에서 '피지컬 AI 트읜'의 중요성에 방점을 찍어 "준비중"이라고 밝혀 관심을 끌었다. 배 부총리는 1일 KAIST 학술문화관에서 열린 이 행사에서 기조강연자로 나서 "다양한 현장 환경을 가상 시뮬레이션으로 만들고, 데이터를 확보하는 것이 중요하다"며 피지컬 AI트윈을 강조했다. 배 부총리는 이날 강연에서 "정부가 주도적으로 추진하는 분야가 피지컬 AI"라며 "한국의 강점 도메인(제조 등)에 AI를 결합해 차근차근 준비중"이라고 밝혔다. 그는 또 미래를 변혁할 새로운 AI핵심 기술에 대해 우리나라의 독자적인 투자의 필요성을 강조하며, "현재 주어진 자원 내에서 의미있는 성과를 만들어가고 있다"고 덧붙뎠다. 예도 들었다. 미토스가 10조개 파라미터 정도로 구성돼 있다고 추정되는데, 최소한 이에는 GPU 1만장이 필요할 것으로 내다봤다. 배 부총리는 "그런데 우리는 독파모에 GPU 블랙웰 B 200기준 500장 정도 지원한다"며 "그럼에도 주어진 자원 내에서 목적별로 AI 모델을 잘 만들어가고 있다"고 평가했다. 배 부총리는 또 "2030년까지 GPU 26만장 이상 확보할 것이다. 향후엔 100만장 이상 확보할 것으로 보고 있고, 그에 따른 데이터센터도 많이 지어질 것"으로 내다봤다. AI인재 양성 방향과 관련해서는 교수와 학생들에 다양한 연구와 융합을 고민해달라고 당부했디. 이어 윤국진 KAIST AI대학장이 나서 'KAIST AI대학 비전과 혁신방향'에 대해 발표했다. 골자는 풀스택 AI역량을 가진 인재로 학생들을 육성하는 것과 이를 의해 50개 이상 교과목을 개설하겠다는 것. 윤 학장은 "AI는 더이상 편리한 보조도구가 아니고, 인간이 문제를 정의하고 판단하는 방식 자체에 관여하기 시작했다. AI는 인간의 지적활동이 이루어지는 새로운 생태계가 되고 있다"고 강조했다. 윤 원장은 또 ▲AI코어: 원천기술 ▲AI시스템: 인프라 ▲AI+X: 도메인 융합 ▲AI퓨처: 미래설계를 4가지 KAIST AI교육 비전 축으로 제시했다. 이에 앞서 이광형 총장은 환영사에서 "AI는 이제 특정 분야의 기술을 넘어 과학기술과 산업, 사회 전반의 변화를 이끄는 핵심 동력이 되고 있다”며 “KAIST AI대학이 대한민국 AI 인재 양성과 연구 혁신을 선도하고 세계와 협력하는 열린 플랫폼으로 성장할 수 있도록 적극 지원해 나가겠다”고 말했다. 이어 KAIST AI대학 자문단 위촉식도 개최됐다. 자문위원은 유슈아 벤지오 캐나다 몬트리올대학 교수와 조경현 미국 뉴욕대학교 교수 등 해외에서 2명과 국내에서 11명 등 총 13명으로 구성했다. 또 특별세션으로 KAIST생이 발제하고, 토론하는 AI시대 새로운 교육과 연구문법을 주제로한 세션이 진행됐다.

2026.06.01 16:12박희범 기자

엔비디아, PC 프로세서 시장 진출…인텔·AMD와 정면 승부

엔비디아가 신규 프로세서인 'RTX 스파크(RTX Spark)'를 통해 고성능 PC 시장을 공략한다. 해당 칩을 탑재한 노트북 및 데스크탑은 올 가을 출시될 예정이다. 젠슨 황 엔비디아 CEO는 1일 대만 타이베이에서 열린 '컴퓨텍스 2026' 기조연설에서 회사의 첫 윈도 PC용 프로세서인 RTX 스파크를 공개했다. RTX 스파크는 엔비디아가 마이크로소프트와 협력해 새롭게 선보이는 Arm 아키텍처 기반의 윈도 PC용 프로세서다. 그간 엔비디아는 서버용 프로세서 개발에 집중해 왔으나, 이번 칩 개발로 개인용 PC 시장에도 진출하게 됐다. RTX 스파크는 엔비디아 개인용 AI 워크스테이션 'DGX 스파크'에 적용된 GB10를 노트북 환경에 맞게 성능을 하향 조정했다. 미디어텍과 공동 설계한 Arm 아키텍처 20코어 기반의 그레이스 CPU(N1X)와 블랙웰 RTX GPU 및 128기가바이트(GB) 용량의 메모리를 갖췄다. 이를 통해 RTX 스파크는 1페타플롭스의 AI 처리 성능, 업계 최로 수준의 전력 효율성을 구현했다는 게 엔비디아의 설명이다. 1200억개의 매개변수를 가진 대규모언어모델(LLM)을 실행하고, 1440p 해상도에서 초당 100프레임 이상으로 초고사양 게임을 구동할 수 있다. 젠슨 황 CEO는 "RTX 스파크는 40년만에 PC 제품군 전반에 걸쳐 이뤄진 첫 번째 재발명으로, 데스크탑과 노트북 및 워크스테이션을 아우르는 혁신"이라며 "이들은 윈도 OS와 100% 호환되고, 엔비디아 쿠다(CUDA) 소프트웨어를 100% 지원한다"고 강조했다. 전세계 PC 제조사들은 올 가을 RTX 스파크 기반의 최신 노트북 및 소형 데스크탑을 공개할 예정이다. ASUS와 델, HP, 레노버, 마이크로소프트 서피스, MSI 등이 여기에 해당한다. 에이서와 기가바이트 역시 추후 제품을 출시할 계획이다. 업계는 엔비디아의 이번 발표가 PC용 프로세서 시장에 미칠 영향에 주목한다. 기존 PC용 프로세서는 인텔, AMD가 시장을 주도해왔다. 퀄컴 역시 '스냅드래곤 X' 시리즈를 통해 PC용 프로세서 시장을 공략하고 있다.

2026.06.01 15:09장경윤 기자

젠슨 황 "베라 루빈 본격 양산…삼성·SK·마이크론 HBM4 탑재"

엔비디아가 차세대 AI 가속기인 '베라 루빈(Vera Rubin)'이 본격적인 양산 체제에 돌입했다고 강조했다. 젠슨 황 엔비디아 최고경영자(CEO)는 1일 대만 타이베이에서 열린 '컴퓨텍스 2026' 기조연설에서 "컴퓨팅 수요는 믿을 수 없을 정도로 높다"며 "베라 루빈이 본격적인 양산에 들어갔다(Vera Rubin in Full Production)"고 강조했다. 베라 루빈은 엔비디아가 올 하반기 공식 출시할 예정인 차세대 AI 가속기다. 해당 칩은 엔비디아가 자체 설계한 베라 CPU와 루빈 GPU, NV링크 6 스위치, 블루필드-4 DPU, 그록3 LPU 등 7개 요소로 구성된다. 젠슨 황 CEO는 "베라 루빈을 위한 공급망은 이전 세대인 '그레이스 블랙웰' 대비 2배나 크다"며 "랙 조립 시간도 이전 2시간이 걸렸던 것에 비해, 이제는 5분밖에 걸리지 않는다"고 말했다. 베라 루빈 양산을 위한 파트너사들과의 협력도 강조했다. 젠슨 황 CEO는 연설 도중 재생한 영상을 통해 "베라 루빈은 TSMC의 3나노미터(nm) 공정과 2.5D 패키징을 거친다"며 "마이크론, SK하이닉스, 삼성전자의 7세대 고대역폭메모리(HBM4)가 탑재된다"고 설명했다.

2026.06.01 13:32장경윤 기자

[AI 고속도로] AI 열풍 탄 '네오클라우드'…인프라 새 전장으로

인공지능(AI) 시대 핵심 자원 그래픽처리장치(GPU)를 전문적으로 공급·운영하는 '네오클라우드'가 글로벌 인프라 시장의 새로운 강자로 떠오르고 있다. AI 경쟁 무게중심이 모델 개발에서 인프라 확보로 이동하는 가운데, 국내 기업들도 차세대 AI 클라우드 시장 선점에 나서는 모습이다. 네오클라우드는 AI 모델 학습과 추론에 필요한 GPU를 서비스형(GPUaaS)으로 제공하는 AI 특화 클라우드 사업자를 뜻한다. 웹서비스와 기업 업무를 폭넓게 처리하는 기존 범용 퍼블릭 클라우드와 달리 AI 연산에 최적화된 구조를 갖춘 것이 특징이다. 네오클라우드가 주목받는 배경에는 폭발적으로 증가한 AI 연산 수요가 있다. 빅테크 기업들의 AI 데이터센터 투자와 소버린 AI 프로젝트 확대로 GPU 수요가 급증했지만 공급은 이를 따라가지 못하고 있다. 동시에 확보한 GPU조차 효율적으로 활용하지 못하는 문제가 나타나면서 AI 전용 인프라 필요성이 커지고 있다. 가격 경쟁력도 강점으로 꼽힌다. 업타임 인스티튜트 분석에 따르면 북미 기준 엔비디아 H100 GPU 온디맨드 사용 비용은 네오클라우드가 시간당 약 34달러로, 하이퍼스케일러 평균인 98달러 대비 크게 저렴한 것으로 나타났다. AI 워크로드에 불필요한 요소를 줄여 비용 효율을 높인 결과다. 글로벌 시장에선 코어위브, 람다랩스, 네비우스 등이 대표 사업자로 부상했다. 특히 코어위브는 오픈AI와 앤트로픽, 구글, 메타, 퍼플렉시티 등 주요 AI 기업에 GPU 인프라를 제공하며 시장을 선도하고 있다. 최근에는 AI 개발 플랫폼 기업 위츠앤바이어스(W&B)를 인수한 데 이어 에이전트 AI 기능까지 출시하며 단순 GPU 임대를 넘어 풀스택 AI 클라우드 기업으로 진화하고 있다. 네비우스 역시 AI 특화 클라우드 기업으로 빠르게 성장 중이다. 러시아 최대 검색엔진 얀덱스에서 분사한 뒤 AI 클라우드 기업으로 전환한 네비우스는 마이크로소프트와 메타, 엔비디아 등과 대형 계약을 체결하며 시장 영향력을 확대하고 있다. 올해 들어 주가가 130% 이상 급등하는 등 투자자들의 관심도 집중되고 있다. 글로벌 자본도 네오클라우드에 몰리는 상황이다. 블랙스톤과 칼라일 등 미국 주요 투자기관들은 코어위브와 람다, 크루소 등 네오클라우드 기업이 보유한 GPU를 담보로 대규모 자금을 공급하고 있다. 시장에선 GPU 자체가 새로운 인프라 자산으로 평가받기 시작했다는 분석도 나온다. 통신사들도 경쟁에 뛰어들고 있다. 일본 소프트뱅크는 엔비디아 GB200 NVL72 기반 네오클라우드 서비스를 올해 정식 출시할 예정이다. 자체 AI 클라우드 운영체제(OS) '인프리니아'를 결합해 학습부터 추론까지 통합 지원하는 구조를 내세우고 있다. 글로벌 통신사들이 AI 인프라 사업자로 영역을 확장하는 흐름이 뚜렷해지는 양상이다. 국내에선 베슬AI와 몬드리안에이아이 등이 대표 주자로 꼽힌다. 베슬AI는 연내 최신 GPU 1만 장 규모 인프라 구축을 추진하며 글로벌 데이터센터 네트워크를 확대하고 있다. 몬드리안에이아이는 AI 플랫폼과 인프라를 결합한 네오클라우드 전략을 내세우며 교육·연구 시장을 공략 중이다. 엘리스그룹 역시 모듈형 데이터센터와 GPU 스팟 요금제를 앞세워 시장 진입에 속도를 내고 있다. 업계에선 네오클라우드가 기존 하이퍼스케일러를 대체하기보다 AI 특화 워크로드를 처리하는 새로운 인프라 축으로 자리 잡을 것으로 보고 있다. 시장조사기관 ABI리서치는 네오클라우드 GPUaaS 시장이 2030년 수백조원 규모로 성장할 것으로 전망했다. 코리 샌더스 코어위브 제품 관리 담당 수석부사장은 최근 미국 IT 전문매체 AI 비즈니스 인터뷰에서 "AI 클라우드는 더 이상 GPU 임대 사업이 아니다"라며 "학습과 추론, 운영을 아우르는 풀스택 플랫폼 경쟁이 시작됐으며 이것이 차세대 AI 인프라 시장의 핵심이 될 것"이라고 강조했다.

2026.05.31 11:00한정호 기자

메모리 가격상승에 기업 내 PC 교체 지연...더 미뤄도 될까

글로벌 빅테크의 인공지능(AI) 투자 확대와 메모리 제조사의 HBM 중심 생산으로 PC 가격 상승 압박이 커지고 있다. 시장조사업체 트렌드포스는 지난 3월 "올 1분기 노트북 전체 부품 원가에서 메모리 비중이 30%까지 상승했으며 올해 노트북 시장이 비용 상승 압박에 직면할 것"이라고 전망하기도 했다. 기업 내 IT 부서 역시 AI PC 도입 시기를 두고 고민중이다. 교체를 미루면 단기 비용 부담은 줄일 수 있지만 향후 더 높은 비용을 지불할 가능성이 커지기 때문이다. 그러나 글로벌 PC 제조사들은 "단순한 초기 구매 비용보다 총소유비용(TCO) 관점에서 AI PC 도입 효과를 검토해야 한다"고 지적한다. 생산성과 운영 효율 개선 효과를 고려해야 한다는 것이다. IDC "AI PC, 하루 2시간 업무 절감 효과" 시장조사업체 IDC가 작년 10월 아태지역 임직원 500명 이상 기업의 IT 결정권자 720명을 대상으로 한 설문조사에 따르면, AI PC 사용자는 하루 평균 2.17시간의 업무 시간을 절약하는 것으로 나타났다. 이는 기존 PC 환경에서 AI 기능을 활용할 때의 평균 절감 시간인 1.67시간보다 약 30% 높은 수준이다. 기업 규모가 커질수록 생산성 효과는 확대될 수 있다. 예를 들어 직원 500명 규모 기업에서 직원 1인당 하루 0.5시간의 추가 업무 절감이 발생할 경우, 연간 약 12만 5000시간 이상의 업무 시간을 확보할 수 있다는 계산이 나온다. AI PC, 클라우드 의존 줄이고 이용료 절감 AI PC의 장점으로는 클라우드 비용 절감 효과도 거론된다. 클라우드 기반 AI 서비스를 활용하기 위해서 월간 구독료를 지불해야 하지만 AI PC는 CPU와 GPU, NPU를 활용해 일부 기능을 인터넷 접속 없이 기기 내에서 직접 처리할 수 있다. 29일 오리온 델테크놀로지스 클라이언트솔루션그룹(CSG) 전무는 "AI PC는 실제로 가격 차이를 상쇄할 만큼의 상당한 가치를 제공한다"고 설명했다. 그는 "기업 AI는 적합한 워크로드를 적합한 컴퓨팅 자원에 배치하는 방향으로 나아가고 있다"며 "클라우드가 모델 학습 등 고도화된 작업을 담당한다면, AI PC는 그 엔드포인트에서 실시간 번역, 회의 기록, 콘텐츠 생성부터 에이전트 구동까지 일상 업무의 생산성을 높이는 작업을 로컬로 처리한다"고 덧붙였다. IDC 설문조사 결과에서도 IT 의사결정권자 중 84%가 'AI PC가 에이전틱 AI 추론 비용 절감에 도움이 될 것'으로 전망했다. 또 77%는 '온디바이스 AI 처리의 비용 효율성이 충분히 설득력 있다'고 답했다. 오리온 전무는 "이러한 하이브리드 구조에서 AI PC는 토큰 비용을 최적화하는 동시에, 데이터를 로컬 환경에서 비공개로 처리한다는 보안상의 이점까지 제공할 것"이라고 말했다. AI 연산 NPU에 분산해 성능 저하 완화 가능 AI PC의 잘 알려지지 않은 장점 중 하나로 기기 수명 연장을 들 수 있다. 기존 PC에서 일어나는 AI 연산은 CPU와 GPU를 집중적으로 활용한다. 반면 AI PC는 이런 연산 중 일부를 NPU로 분산해 처리할 수 있다. 업계에서는 이를 통해 발열과 전력 소비를 줄이고 장기적인 성능 저하를 완화할 수 있다고 보고 있다. 오리온 전무는 "AI 연산을 NPU로 분담하면 CPU와 GPU의 부하를 덜면 발열과 냉각팬 등 마모/소모가 감소한다. 균형 잡힌 워크로드 관리는 PC의 최대 성능을 더 오래 유지하는 데 도움이 된다"고 설명했다. "국내 기업, AI PC 도입 늦지만 관심은 높은 편" IDC에 따르면 2025년 10월 현재 국내 기업의 AI PC 도입률은 약 37%로 아태지역 평균(48%)에는 못 미쳤다. 그러나 AI PC 도입이 지연될 경우 핵심 인력 이탈(33%), 운영 비효율 증가(33%), 시장 주도권 상실(32%) 등에 대한 우려도 컸다. 응답자 중 69%는 PC 구매시 AI 기능을 가장 중요하거나 반드시 필요한 기능으로 여긴다고 답했다. 이는 아태지역 평균(56%)보다 높은 최고 수준이다. 업계는 운영 효율 저하와 AI 인프라 경쟁력 약화를 우려하며, 기업들의 AI PC 전환 수요가 점차 확대될 것으로 보고 있다. 다만 업계에서는 업무 환경별 AI 활용도와 초기 투자비 검증이 함께 필요하다는 지적도 나온다. 오리온 델테크놀로지스 전무는 이같은 지적에 대해 "에너지 효율적인 AI 처리, 스마트 냉각 및 최적화된 하드웨어와 결합된 AI PC는 장기적인 신뢰성, 일관된 성능, 실제 비용 가치를 제공하기 때문 장기적인 투자에 적합하다"고 반론했다.

2026.05.29 16:17권봉석 기자

AI 데이터센터 성능·효율성 좌우하는 나노초 정밀 동기화

생성 AI 확산으로 데이터센터와 클라우드 인프라 투자가 빠르게 늘면서, AI 인프라 경쟁력의 핵심 요소도 크게 변화하고 있다. 과거에는 GPU를 얼마나 많이, 빠르게 확보하느냐가 중요했다면 최근에는 대규모 병렬 처리 환경에서 데이터 정확도를 유지하고 오차 시간을 최소화하는 역량의 중요성이 커지고 있다. 특히 대규모 데이터가 여러 노드를 거치는 AI 데이터센터는 수 많은 서버와 네트워크 장비가 동시에 움직이는 구조인 만큼, 데이터 흐름의 오차와 지연을 최소화하는 '정밀 타이밍 기술'이 핵심 인프라 요소로 주목받고 있다. 주요 시장조사업체에 따르면 오차 시간을 최소화하는 글로벌 타이밍 디바이스 시장 규모는 2023년 58억 달러(약 8조 7226억원)에서 2030년 96억 달러(약 14조 4374억원)까지 성장할 것으로 전망된다. 데이터 전송 시점·시스템 동기화 돕는 정밀 타이밍 솔루션 대규모 CPU·GPU가 동원된 AI 데이터센터에서는 서버·네트워크 간 동기화 정밀도가 AI 연산 효율과 전력 효율에도 영향을 미친다. 미국 국립표준기술연구소(NIST)와 IEEE 등은 초저지연 네트워크 환경에서 나노초(ns) 단위의 시간 동기화 중요성을 강조하고 있다. 정밀 타이밍 솔루션은 특수 소자인 크리스탈(Crystal)과 오실레이터(Oscillator) 기반으로 데이터 전송 시점을 정교하게 맞추고 시스템 간 동기화를 유지하며, 고도화된 AI 인프라의 안정성과 효율을 뒷받침하는 기반 기술로 평가된다. 최근에는 AI 데이터센터와 5G 통신 인프라 확산에 따라 초정밀 오실레이터(OCXO)와 고안정성 클럭 디바이스 수요도 증가하는 추세다. 이에 따라 글로벌 주파수 제어 및 타이밍 디바이스 시장을 선점하기 위한 주요 기술 기업들의 기술 경쟁도 한층 치열해질 것으로 예상된다. 엡손 "쿼츠 기반 타이밍 기술 산업계에 공급" 29일 엡손 관계자는 “AI 인프라 내 정밀 타이밍 솔루션 수요가 확대되는 가운데, 엡손이 오랜 기간 축적한 마이크로디바이스 기술이 다양한 산업 영역에서 활용되고 있다”고 설명했다. 엡손은 석영 기반 수정 진동자를 이용해 정밀하게 시간을 제어하는 쿼츠(Quartz) 기반 초정밀 타이밍 제어 기술을 보유하고 있다. 현재 글로벌 주파수 제어·타이밍 디바이스 시장에서 전통적인 쿼츠 기반 타이밍 제어 기술은 반도체 대비 여전히 주류 시장을 형성하고 있다. 엡손 관계자는 "엡손의 쿼츠 기반 기술은 현재 실시간클록(RTC) 모듈, 크리스탈(Crystal Unit) 및 오실레이터, 고정밀 센서 등을 아우르는 마이크로디바이스 사업으로 확대되고 있다"고 설명했다. "원천 소재 '합성 쿼츠'부터 직접 생산" 엡손은 통신 장비와 컴퓨터, 디지털 카메라, 자동차, 이동통신 기지국 등 다양한 전자·네트워크 인프라 분야에 관련 디바이스를 공급하고 있다. 핵심 소재인 '합성 쿼츠(Synthetic Quartz)'까지 자체적으로 육성·생산하며, 소재 단계부터 정밀 제어 기술을 내재화한 수직 통합형 생산 체계를 구축해왔다는 점도 특징이다. 이 같은 핵심 소재 및 공정의 내재화 방식은 지정학적 리스크와 전 세계적인 부품 공급망 불안정성 속에서 안정적인 고품질 제품 공급을 보장하는 전략적 기반이 된다. 동기화 오차 제어, HPC·AI 클러스터 효율 좌우 엡손 관계자는 “엡손의 사업 영역은 단순 전자부품 사업을 넘어 시스템 전체의 정확도와 안정성을 지원하는 방향으로 확대돼 왔다”고 설명했다. 이어 “물리적인 쿼츠 가공 기술과 미세전자기계시스템(MEMS) 기술을 결합해 다양한 산업 환경에서 요구되는 안정성과 정밀도를 구현해왔다”고 덧붙였다. 업계에서는 AI 데이터센터 고도화와 함께 관련 생태계 내에서 정밀 타이밍 기술과 마이크로디바이스 분야의 중요성도 점차 커질 것으로 예상한다. 이 같은 시장 변화에 발맞춰 글로벌 하드웨어 기업들 역시 B2C에서 고부가가치 B2B 인프라 영역으로 대대적인 체질 개선에 나서고 있다. 엡손 관계자는 "엡손은 전통적으로 프린터 중심의 B2C 이미지가 강했지만, 최근에는 통신·네트워크·산업·자동차 등 B2B 수요 기반 영역까지 사업 포트폴리오를 확대하고 있다"고 밝혔다. 이어 "최근 발표한 'ENGINEERED FUTURE 2035' 비전을 통해 80년 이상 축적해 온 '고효율·초소형·초정밀' 기술과 엔지니어링 역량을 기반으로 산업 및 사회 인프라 영역에서 사업 경쟁력을 강화하겠다는 전환 뱡항을 제시했다"고 덧붙였다.

2026.05.29 13:30권봉석 기자

[AI는 지금] "탈 엔비디아 노린다"…'프랑스 AI' 미스트랄, 오픈AI 맞서 '독자 칩' 검토

프랑스 인공지능(AI) 스타트업 미스트랄 AI(Mistral AI)가 자체 반도체 칩 설계 기술 검토에 착수했다. 오픈AI, 앤트로픽 등 거대 자본을 앞세운 미국 빅테크 기업들과의 전면전에서 살아남기 위해 인프라 주도권을 직접 확보하기 위한 승부수로 풀이된다. 아서 멘슈 미스트랄 AI 최고경영자(CEO)는 28일(현지시간) CNBC와의 인터뷰에서 자체 칩 설계 및 개발 가능성을 묻는 질문에 "당연히 흥미로운 영역"이라며 "자체 반도체 개발 가능성을 배제하지 않고 있다"고 처음으로 공식 언급했다. 이처럼 미스트랄 AI가 반도체 내재화 카드를 만지작거리는 이유는 천문학적으로 치솟는 AI 구동 비용 때문으로 풀이된다. 고성능 AI 모델을 유지하고 고도화하는 과정에서 발생하는 컴퓨팅 인프라 비용 부담을 줄이지 못하면 장기적인 수익성 확보가 불가능하다는 판단에서다. 멘슈 CEO는 "맞춤형 칩을 활용하면 AI 모델이 데이터를 처리하는 단위인 '토큰(Token)'의 배포 비용을 유의미한 수준으로 크게 낮출 수 있다"고 설명했다. 현재 약 120억 유로(한화 약 18조원)의 기업 가치를 평가받는 미스트랄 AI는 그동안 엔비디아와의 파트너십을 중심으로 인프라를 확장해왔다. 그러나 구글, 아마존, 메타 등 미국 하이퍼스케일러들이 자체 주문형 반도체(ASIC)를 개발하며 하드웨어와 소프트웨어 통합 최적화에 나서자 고유 칩 확보의 필요성을 절감한 것으로 보인다. 칩 독립 선언과 함께 인프라 대형화 전략도 속도를 낸다. 미스트랄 AI는 프랑스와 스웨덴 데이터 센터에 총 40억 유로(약 6조원)를 투입, AI 모델 구동 및 서비스에 특화된 '추론(Inferencing) 전용 데이터 센터'를 프랑스 내에 신규 구축한다고 발표했다. 미국에 뒤처진 유럽의 AI 컴퓨팅 역량을 끌어올려 시장 지배력을 확보하겠다는 취지다. 미스트랄 AI는 시장 경쟁력을 높이기 위한 비즈니스 모델 다각화도 본격화하고 있다. 최근에는 미국 빅테크들이 사활을 걸고 있는 '에이전틱 AI(Agentic AI)' 시장을 겨냥해 기업용 신규 에이전트 플랫폼 '바이브(Vibe)'를 출시했다. 단 한 번의 지시로 문서 작성부터 코딩, 테스트, 배포까지 자율 수행하는 이 솔루션을 앞세워 올해 매출 목표를 전년(2억 유로) 대비 5배 성장한 10억 유로(약 1조 5000억원)로 끌어올린다는 구상이다. 다만 연간 반복 매출(ARR)이 수백억 달러에 달하는 오픈AI나 앤트로픽과의 체급 차이를 단기간에 극복하기는 쉽지 않을 것이라는 관측도 나온다. 인프라와 칩 개발에 드는 막대한 자본 조달 역시 과제로 꼽힌다. 미스트랄 AI의 이번 인프라 투자 확대는 미국 빅테크 기업들과의 컴퓨팅 자원 격차를 좁히기 위한 조치로도 풀이된다. 현재 유럽 연합(EU) 내에서는 독자적인 인프라 공급망을 확보하지 못할 경우 발생할 거시경제적 타격에 대한 우려가 확산되는 추세다.멘슈 CEO는 인프라 격차와 관련해 "유럽은 현재 AI를 과거 천연가스와 같은 국가 전략적 자산으로 바라보기 시작했다"며 "이 기술 경쟁에서 계속해서 경쟁력을 유지하려면 1조 달러에 달하는 상업적 적자가 발생하는 상황을 감당할 수 없다는 점을 모두가 직시해야 한다"고 강조했다.

2026.05.29 11:08장유미 기자

GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개

오케스트로가 생성형 인공지능(AI) 서비스 확산으로 급증하는 추론 수요에 대응하기 위한 AI 인프라 운영 플랫폼을 공개했다. 단순 그래픽처리장치(GPU) 확보 경쟁을 넘어 보유 자원을 얼마나 효율적으로 활용하느냐가 기업 AI 경쟁력으로 떠오르면서, 추론 최적화와 운영 자동화 시장 공략에 나선 모습이다. 오케스트로는 AI 추론 운영 플랫폼 '콘체르토 AI(CONCERTO A.I.)'를 출시했다고 29일 밝혔다. 콘체르토 AI는 기업이 보유한 GPU 인프라 활용 효율을 높여 생성형 AI 서비스 운영 과정에서 발생하는 추론 병목과 응답 지연 문제를 줄이는 데 초점을 맞췄다. 최근 기업 시장에선 AI 챗봇과 업무 자동화 에이전트, 검색증강생성(RAG) 기반 서비스 도입이 확대되면서 추론 연산 수요가 빠르게 증가하고 있다. 특히 에이전트형 AI 환경에선 하나의 요청이 여러 모델 호출과 반복 연산으로 이어지면서 GPU 자원 부담이 커지고 있다. 이에 업계에선 GPU 증설보다 기존 인프라 활용 효율을 높이는 운영 기술 중요성이 커지는 추세다. 콘체르토 AI는 대규모 추론 요청을 분산 처리하고 GPU와 신경망처리장치(NPU) 등 가속기 자원을 작업 특성에 맞게 배분하도록 설계됐다. 질문 분석과 답변 생성 작업을 분리해 각각 최적의 자원에 할당하는 분산 서빙 방식을 적용해 병목 현상을 줄이고 응답 성능을 높인다. 여기에 키-값 캐시(KV Cache) 최적화와 메모리 재사용 기술을 적용해 초기 응답 시간과 토큰 처리 속도를 개선했다. 실시간 대기열과 자원 상태를 반영한 지능형 라우팅 기능도 탑재해 고부하 환경에서도 안정적인 응답 성능을 유지할 수 있도록 지원한다. 오케스트로에 따르면 자체 온프레미스 AI 인프라 환경에서 진행한 벤치마크 결과, 동시 요청이 집중되는 고부하 환경에서 콘체르토 AI의 분산 서빙 방식은 기존 단일 처리 방식 대비 토큰 출력 속도를 2.2배 향상시켰다. 회사는 이를 통해 동일한 하드웨어 환경에서도 응답 지연을 줄이고 추론 처리 안정성을 높일 수 있다고 설명했다. 운영 자동화 기능도 강화했다. 콘체르토 AI는 AI 모델 배포부터 추론 요청 처리, 자원 배분, 성능 모니터링까지 거대언어모델 운영관리(LLMOps) 전 과정을 단일 플랫폼에서 지원한다. 표준화된 모델 패키징 기술을 기반으로 쿠버네티스 환경에서 배포 과정을 자동화하고 초기 응답 시간과 토큰 처리 속도, 자원 사용량 등 주요 운영 지표를 통합 관리할 수 있도록 돕는다. 특히 국내 유일 이기종 AI 가속기 지원 구조도 차별점으로 내세웠다. 엔비디아 GPU뿐 아니라 리벨리온과 퓨리오사AI 등 국산 NPU 환경까지 지원해 기업과 기관이 프라이빗 AI와 소버린 AI 환경에서 특정 하드웨어 벤더 의존도를 낮추고 인프라를 유연하게 구성할 수 있도록 지원한다. 최근 AI 인프라 시장 경쟁축은 학습 중심에서 추론 중심으로 이동하는 분위기다. 생성형 AI 서비스가 실제 업무 환경에 본격 적용되면서 GPU 확보 경쟁을 넘어 운영 효율과 자원 활용 최적화, LLM옵스 역량이 새로운 경쟁력으로 부상하고 있다. 오케스트로 역시 콘체르토 AI를 통해 기업 AI 인프라 운영 효율을 높이고 프라이빗 AI 시장 공략을 강화한다는 전략이다. 김범재 오케스트로 대표는 "생성형 AI가 실제 업무로 확산되고 에이전트형 AI 서비스가 늘어나면서 기업 AI 인프라 과제는 더 많은 GPU를 확보하는 것에서 보유 자원을 얼마나 효율적으로 운영하느냐로 옮겨가고 있다"며 "콘체르토 AI를 기반으로 기업이 보유한 AI 인프라 활용 효율을 높이고 프라이빗 AI 환경에서도 안정적인 AI 서비스 운영을 지원하겠다"고 말했다.

2026.05.29 10:48한정호 기자

[AI 고속도로] 델, AI 서버 호황에 '어닝 서프라이즈'…시간외 주가 38%↑

델 테크놀로지스가 인공지능(AI) 서버 수요 급증에 힘입어 재상장 이후 최대 매출 성장률을 기록하며 시장 기대치를 크게 웃도는 실적을 발표했다. AI 서버 주문과 데이터센터 인프라 사업이 폭발적으로 성장한 가운데 연간 실적 전망까지 상향 조정하면서 주가는 시간외 거래에서 약 38% 급등했다. 델은 28일(현지시간) 2027 회계연도 1분기 실적 발표를 통해 매출 438억 4000만 달러와 조정 주당순이익(EPS) 4.86달러를 기록했다고 밝혔다. 이는 시장조사업체 LSEG가 집계한 시장 전망치인 매출 354억 3000만 달러, 조정 EPS 2.94달러를 크게 웃도는 수준이다. 특히 매출은 전년 동기 대비 88% 증가했다. 델이 지난 2018년 재상장한 이후 가장 높은 성장률이다. AI 인프라 수요 확대가 실적 급증을 이끈 것으로 풀이된다. 델은 해당 분기 AI 서버 매출이 전년 동기 대비 757% 증가한 161억 달러를 기록했다고 밝혔다. 회사는 올해 전체 AI 서버 매출 전망도 기존 500억 달러에서 600억 달러로 상향 조정했다. 이는 전년 대비 144% 성장한 규모다. 델은 현재 엔비디아 그래픽처리장치(GPU) 기반 AI 서버를 중심으로 기업·네오클라우드·소버린 AI 고객 등 5000곳 이상의 AI 서버 고객을 확보했다고 설명했다. AI 서버 수요 확대와 함께 기존 서버·네트워크 장비 사업도 동반 성장한 것으로 나타났다. 서버와 데이터센터 장비를 담당하는 인프라솔루션그룹(ISG) 매출은 전년 동기 대비 181% 증가한 290억 달러를 기록했다. 전통 서버 및 네트워킹 매출은 85억 달러로 92% 늘었고 스토리지 매출도 43억 달러로 8% 증가했다. PC·노트북·액세서리 사업을 담당하는 클라이언트솔루션그룹(CSG) 매출은 146억 달러로 전년 동기 대비 17% 증가했다. 기업용 PC 수요 확대 영향으로 상업용 클라이언트 매출은 18% 늘어난 130억 달러를 기록했다. 델은 회계연도 2분기 매출 전망도 440억~450억달러로 제시했다. 시장 전망치인 349억 7000만 달러를 크게 웃도는 수준이다. 연간 매출 역시 기존보다 상향한 1650억~1690억 달러로 전망했다. 다만 델은 AI 인프라 수요 급증에 따른 공급망 부담도 커지고 있다고 밝혔다. 회사는 메모리·중앙처리장치(CPU)·하드디스크(HDD) 등 주요 부품 공급 부족이 이어질 것으로 내다봤다. 제프 클라크 델 부회장 겸 최고운영책임자(COO)는 "AI 인프라 수요 확대 흐름이 지속되면서 기업·소버린 AI 고객 주문이 빠르게 증가하고 있다"며 "추론·에이전틱 AI 워크로드 확대가 우리의 새로운 성장 동력이 되고 있다"고 말했다.

2026.05.29 10:48한정호 기자

[AI는 지금] "추론판 AWS 되겠다"…엔비디아가 베팅한 바세텐, 몸값 110억 달러 논의

인공지능(AI) 반도체 공룡 엔비디아가 투자한 미국 AI 추론 인프라 스타트업 '바세텐(Baseten)'이 110억 달러(약 15조원)의 기업가치로 대규모 투자 유치에 나섰다. 지난 1월 50억 달러의 가치를 평가받은 지 불과 3개월 만으로, 글로벌 AI 시장의 투자 중심축이 거대 모델 '학습'에서 비용 효율화를 위한 '추론(실제 서비스 구동)' 인프라로 급격히 이동한 분위기다. 29일 IT 전문매체 디인포메이션에 따르면 바세텐은 최근 투자자들과 10억 달러 규모 신규 투자 유치를 논의했다. 이번 투자 조건은 투자 후 기업가치 110억 달러를 전제로 한다. 성사될 경우 바세텐의 기업가치는 올해 초 인정받은 50억 달러에서 2배 이상 높아진다. 바세텐은 지난 2019년 미국 샌프란시스코에서 설립된 AI 추론 인프라 기업으로, 고객들이 오픈소스 모델과 자체 조정 모델을 서비스에 배포·운영할 수 있도록 모델 서빙, GPU 자원 관리, 지연시간 최적화, 비용 관리 기능을 제공한다. 주요 고객사로는 AI 코드 편집기 '커서(Cursor)'와 업무 협업 툴 '노션(Notion)' 등이 거론된다. 또 바세텐은 AI 모델 실행 인프라 시장에서 AWS와 같은 플랫폼 지위를 목표로 하고 있다. 클라우드 시장에서 AWS가 기업 컴퓨팅 인프라를 제공하며 성장한 것처럼 바세텐은 AI 시대의 추론 인프라를 겨냥하고 있다. 추론 인프라 수요가 커지면서 바세텐에는 대형 투자자 자금도 몰리고 있다. 바세텐은 올해 1월 50억 달러 평가액으로 3억 달러 투자 유치에 성공했다. 당시 라운드는 벤처캐피털 IVP와 알파벳 계열 독립 성장펀드 캐피털G가 공동 주도했으며 엔비디아도 참여했다. 엔비디아는 해당 거래의 일환으로 바세텐에 1억5000만 달러를 투자하기로 한 것으로 전해졌다. 바세텐은 최근 1년 사이 3차례 투자 유치에 나섰다. 누적 투자 유치액은 5억8500만 달러 수준으로 늘었다. 110억 달러 기업가치가 인정되면 올해 초 투자 라운드 이후 3개월 만에 평가액이 2배 이상 오르게 된다. 엔비디아의 투자는 추론 인프라 시장 확대와 맞물려 있다. 생성형 AI 도입이 확산되면서 기업들은 모델 학습용 GPU뿐 아니라 학습된 모델을 수많은 이용자 요청에 맞춰 빠르게 구동하는 추론 인프라 확보에 나서고 있다. 엔비디아는 GPU 수요를 키우는 추론 플랫폼 기업에 투자하며 하드웨어와 소프트웨어 생태계를 넓히고 있다. AI 업계에선 추론 시장의 성장성이 학습 시장보다 더 클 수 있다는 관측도 나온다. 모델 학습은 대규모 자본과 데이터센터 역량을 갖춘 소수 기업 중심으로 이뤄진다. 반면 추론은 AI 기능을 서비스에 붙이는 모든 기업에서 반복적으로 발생한다. 이용자가 AI 애플리케이션을 호출할 때마다 GPU 연산이 필요하기 때문이다. 오픈소스 AI 모델 확산도 바세텐의 성장 요인으로 꼽힌다. 라마, 딥시크, 미스트랄, 젬마 등 공개 모델을 업무와 서비스에 적용하는 기업이 늘면서 최근 모델 배포와 운영 수요가 증가하고 있다. 이 과정에서 파인튜닝, 모니터링, 비용 관리 등을 통합 지원하는 추론 인프라 플랫폼의 필요성은 커지고 있다. 추론 인프라 시장을 둘러싼 투자 경쟁도 거세지고 있다. 개발자들에게 AI 추론 인프라를 제공하는 파이어웍스AI는 지난해 10월 기업가치 40억 달러를 기준으로 2억5000만 달러를 조달했다. 추론 전용 칩을 설계한 세레브라스도 오픈AI와 파트너십을 맺은 뒤 기업가치 220억 달러로 10억 달러 투자 유치를 논의 중인 것으로 알려졌다. 대형 클라우드 사업자들도 추론 시장을 겨냥하고 있다. AWS, 구글 클라우드, 마이크로소프트 애저는 자체 AI 인프라와 모델 운영 서비스를 강화하고 있다. 코어위브, 람다, 토게더AI 등 GPU 인프라 기업들도 AI 스타트업과 기업 고객을 상대로 추론 워크로드 확보 경쟁을 벌이고 있다. 초기 생성형 AI 경쟁은 대규모 모델 개발과 학습 데이터 확보에 집중됐다. 최근에는 기업들이 AI 기능을 실제 서비스에 적용하기 시작하면서 지연시간, 안정성, 보안, 비용 효율성 등 운영 역량이 경쟁 변수로 떠올랐다. 모델 성능뿐 아니라 서비스 환경에서 모델을 얼마나 빠르고 저렴하게 구동할 수 있는지가 기업 AI 도입의 핵심 조건이 되고 있다. 엔비디아는 AI 반도체 공급자 지위를 넘어 오픈AI, AI 인프라 기업, 애플리케이션 기술 기업 등으로 투자 보폭을 넓히고 있다. GPU를 쓰는 기업에 자본을 투입하고, 이들이 다시 엔비디아 기반 인프라를 확장하는 구조다. 바세텐 투자도 엔비디아의 추론 생태계 확대 전략과 연결돼 있다는 분석이 나온다. 업계 관계자는 "AI 시장의 다음 경쟁은 누가 더 큰 모델을 만드느냐보다 그 모델을 실제 서비스에서 얼마나 빠르고 저렴하게 돌리느냐에 달려 있다"며 "바세텐의 투자 논의는 추론 인프라가 AI 생태계의 핵심 인프라로 자리 잡고 있다는 신호"라고 말했다.

2026.05.29 08:51장유미 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

"웨어러블 로봇이 피지컬 AI의 가장 현실적인 핵심 축"

'레이밴 메타' AI 글래스 쓰고 홍콩·마카오 여행 가보니

블록체인 웹3 '차세대 게임 생태계' 어떤 모습일까

SK하이닉스, 25년만에 삼성전자 시총 첫 추월...우선주 제외시

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.