• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'추론'통합검색 결과 입니다. (89건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

노타, 올 상반기 수주 174억원…"AI 추론 최적화 수요 늘어"

노타가 인공지능(AI) 추론 최적화 수요 확대에 힘입어 상반기 수주 성장을 이어간 것으로 나타났다. 노타는 올해 2분기 수주액 약 61억원을 기록했다고 26일 밝혔다. 이는 지난해 2분기 약 28억원보다 184% 증가한 규모다. 이로써 올해 상반기 누적 수주액은 약 174억원이다. 업계에서는 이번 성과가 피지컬 AI와 온디바이스 AI 확산으로 AI 모델 추론 효율성이 중요해진 데 따른 것이란 평가가 이어지고 있다. 최근 피지컬 AI와 온디바이스 AI 확산으로 클라우드에 의존하지 않고 현장에서 AI를 구동하려는 수요가 커지고 있다는 이유에서다. 현재 경량화 기술 활용 범위도 제조·교통·공공안전 전반으로 확대되고 있다. 이에 하드웨어(HW) 환경에 맞춰 AI를 빠르고 안정적으로 실행하려는 최적화 수요가 늘어난 점이 노타 사업 수주 확대에 영향을 줬다는 분석이 이어지고 있다. 넷츠프레소 플랫폼 부문 매출은 올해 전년 동기 대비 184% 올랐다. 노타는 모빌린트와 넷츠프레소 라이선스 계약을 체결하며 삼성전자, 퓨리오사AI, Arm에 이어 반도체와 HW 파트너 대상 공급 레퍼런스를 확대했다. 넷츠프레소는 AI 모델을 반도체와 HW 환경에 맞춰 경량화·최적화하는 플랫폼이다. 제한된 연산 자원에서도 AI가 안정적으로 구동되도록 지원한다. 노타는 온디바이스 AI뿐 아니라 데이터센터향 AI에서도 추론 효율화가 중요해지면서 넷츠프레소 사업 기회가 커지고 있다고 설명했다. 다양한 반도체 환경에서 AI 모델을 최적화하려는 수요가 확대되고 있다는 것이다. 노타 비전 에이전트 솔루션 부문도 성장세를 보였다. 이 부문은 올해 2분기 전년 동기 대비 약 3.2배 성장했다. 노타 비전 에이전트는 제조 현장 산업안전, 건설·플랜트 현장 안전관리, 영상감시, 도시·공공안전, 교통 인프라 등 실제 현장 기반 영역으로 확대되고 있다. 산업 현장과 도시 인프라에서 클라우드 의존도를 낮추고 현장 단말에서 AI를 바로 실행하려는 수요가 커진 영향이다. 도시·공공안전 분야에서는 교통 비전언어모델(VLM) 영상분석과 다중운집 분석 등 레퍼런스를 확보했다. 이를 통해 제조와 산업안전을 넘어 모빌리티, 교통, 공공안전 등 물리적 현장으로 적용 범위를 넓히고 있다. 채명수 노타 대표는 "AI가 다양한 디바이스와 산업 현장으로 확산할수록 제한된 자원 안에서 AI를 빠르고 안정적으로 실행하는 추론 최적화 기술의 중요성은 더욱 커지고 있다"며 "올해 2분기 수주 성과는 넷츠프레소를 중심으로 한 반도체향 사업 확대와 노타 비전 에이전트 기반 경량 AI 솔루션의 현장 적용성이 함께 입증된 결과"라고 말했다.

2026.06.26 14:24김미정 기자

오픈AI도 자체 칩 승부수…'할라페뇨'로 엔비디아 의존 줄인다

오픈AI가 인공지능(AI) 추론 전용 반도체를 직접 설계하며 칩부터 모델, 서비스까지 아우르는 '풀스택' 전략에 본격 시동을 걸었다. 오픈AI는 24일(현지시간) 브로드컴과 공동 개발한 첫 AI 추론 가속기 '할라페뇨'를 공개했다. 올해 말부터 데이터센터에 배치할 예정인 이 칩은 두 회사가 함께 구축하는 다세대 컴퓨팅 플랫폼의 첫 제품이다. 오픈AI는 할라페뇨 초기 테스트에서 와트당 성능이 현존 최고 수준을 크게 웃돌았다고 설명했다. 최종 성능은 측정 중이며 세부 기술 보고서는 수개월 내 공개할 예정이다. 혹 탄 브로드컴 최고경영자(CEO)는 로이터 통신에 "할라페뇨는 엔비디아의 블랙웰 칩이나 구글의 텐서처리장치(TPU)와 대등한 성능을 갖췄다"고 말했다. 할라페뇨는 기존 AI 가속기를 개조한 범용 칩이 아니라 최신 거대언어모델(LLM) 추론을 겨냥해 처음부터 새로 설계됐다. 챗GPT·코덱스·응용 프로그램 인터페이스(API)를 매일 운영하며 쌓은 데이터가 반영됐다. 초기 설계부터 파운드리(반도체 수탁생산) 공장에 넘기는 '테이프아웃' 단계까지는 9개월밖에 걸리지 않았다. 이에 대해 양사는 고성능 첨단 반도체 분야에서 가장 빠른 주문형 반도체(ASIC) 개발 주기라고 강조했다. 할라페뇨는 대만 TSMC가 양산하며 삼성전자와 SK하이닉스가 브로드컴에 메모리 칩을 공급한다. 블룸버그 통신에 따르면 두 회사는 차기 칩을 2028년에 내놓고 이후 매년 새 칩을 선보일 계획이다. 최근 AI 모델 시장을 이끄는 기업들은 자체 칩을 확보해 엔비디아 의존도를 낮추는 전략을 추진하고 있다. TPU를 앞세운 구글에 이어 오픈AI도 할라페뇨를 통해 자체 추론 칩을 선보였고 앤트로픽 역시 자체 칩 개발을 타진하고 있다. 이들 기업이 모두 핵심 연산 인프라의 내재화에 나서면서 엔비디아 중심의 AI 가속기 주도권 경쟁이 새 국면에 접어들었다. 그렉 브록먼 오픈AI 사장은 "세계는 연산 기반 경제로 나아가고 있다"며 "할라페뇨는 연산 자원을 더 풍부하게 만들어 개인과 기업에 빠르고 안정적이며 저렴한 AI를 제공할 것"이라고 말했다.

2026.06.25 09:59이나연 기자

퀄컴·메타, 데이터센터 CPU 분야서 협력 체제 구축

퀄컴과 메타는 24일(현지시간) 데이터센터용 CPU 분야에서 향후 수 년간 여러 세대에 걸쳐 협력하겠다고 밝혔다. 퀄컴이 같은 날 공개한 데이터센터 전용 CPU '드래곤플라이 C1000'이 메타 차세대 서버에 탑재된다. 드래곤플라이 C1000은 퀄컴이 공개한 데이터센터 전용 CPU다. 5GHz 이상으로 동작하는 오라이언 코어 250개 이상을 탑재하며 PCI 익스프레스 7.0, CXL, 2TB/s 이상의 입출력 대역폭을 지원한다. 크리스티아노 아몬 퀄컴 CEO는 "대규모 데이터센터 환경을 위해 코어당 성능과 전력 효율 모두에서 혁신적인 CPU를 설계했다"며 "메타와의 다세대 계약은 이러한 접근 방식이 옳았음을 입증하는 중요한 검증"이라고 밝혔다. 그는 이어 "모바일 기기 분야에서 이어온 메타와의 협력을 데이터센터까지 확대하게 됐다"며 "이번 계약은 시작에 불과하다"고 강조했다. 메타 역시 AI 시대의 인프라 경쟁력을 이번 협력의 핵심 배경으로 제시했다. 마크 저커버그 메타 CEO는 "퀄컴이 설계하는 차세대 CPU 개발 과정에서 협력을 이어가게 돼 기쁘다"며 "전 세계 모든 사람에게 '개인 초지능'을 제공하기 위한 인프라를 빠르게 구축하고 있다"고 덧붙였다. 퀄컴은 AI 추론에 최적화된 CPU와 AI 가속기, 고속 네트워크, 개방형 소프트웨어 플랫폼을 결합한 데이터센터 전략을 추진하고 있다. 메타는 이러한 로드맵에 초기 단계부터 참여함으로써 차세대 AI 데이터센터 아키텍처 구축 과정에서 영향력을 확보할 수 있게 됐다. 드래곤플라이 C1000 CPU는 2028년 하반기부터 양산 예정이다. 메타는 차세대 서버에 이를 탑재해 각종 서비스 등에 활용 예정이다.

2026.06.25 08:25권봉석 기자

퀄컴, AI 스타트업 '모듈러' 39억 달러에 인수

퀄컴이 24일(현지시간) AI 인프라 스타트업 모듈러(Modular)를 39억 달러(약 6조 196억원)에 인수한다고 밝혔다. 토큰 생성·처리 비용을 낮추기 위한 이기종 컴퓨팅 강화 목적이다. 모듈러는 구글 출신 크리스 래트너와 팀 데이비스가 CPU와 GPU 제조사별로 파편화된 소프트웨어 문제를 해결하기 위해 2022년에 만든 스타트업이다. 파이썬 대비 실행 속도가 빠른 새 언어 '모조(mojo)' 등을 개발했다. 특정 가속기마다 별도 코드를 작성해야 하는 기존 방식과 달리 한 번 개발한 AI 모델을 여러 하드웨어 환경에 배포할 수 있는 것이 특징이다. 기업 입장에서는 특정 벤더에 대한 종속성을 줄이고 인프라 구축 비용을 낮출 수 있다. 크리스티아노 아몬 퀄컴 CEO는 24일(현지시간) 미국 뉴욕에서 열린 인베스터 데이 행사에서 "에이전틱 AI 시대에는 데이터센터와 엣지 환경 전반에 걸쳐 AI가 확산될 것이며 여러 공급업체의 기술이 결합된 분산형 아키텍처로 이동하고 있다"고 밝혔다. 그는 "미래는 개발자 친화적이면서 다양한 컴퓨팅 환경에서 동작하는 수평적 플랫폼에 있다"며 "모듈러 인수를 통해 고객이 AI를 어디서 어떻게 배치할지 스스로 선택할 수 있는 개방형 생태계를 가속화할 것"이라고 강조했다. 이번 인수는 퀄컴이 이날 공개한 데이터센터 전략의 핵심 축 가운데 하나다. 퀄컴은 서버용 CPU '드래곤플라이 C1000', AI 추론 가속기 'AI250·AI300', 고속 네트워크 기술과 함께 모듈러를 데이터센터 소프트웨어 계층의 중심으로 활용할 계획이다. 퀄컴이 모듈러를 선택한 이유는 AI 산업이 성능 경쟁에서 효율 경쟁으로 전환되고 있기 때문이다. 대규모 AI 서비스가 확산되면서 단순한 연산 성능보다 전력 효율과 운영 비용이 중요한 요소로 부상하고 있다. 퀄컴은 이러한 환경에서 하드웨어만으로는 한계가 있다고 보고 있다. 서로 다른 CPU와 GPU, AI 가속기를 효율적으로 연결하고 최적화하는 소프트웨어 계층이 필수적이라는 판단이다. 향후 데이터센터에는 인텔과 AMD의 CPU, 엔비디아와 AMD의 GPU, 각종 AI 가속기가 혼재할 것으로 예상되는 만큼 특정 하드웨어가 아닌 다양한 플랫폼을 연결하는 소프트웨어가 중요해질 것이라는 분석이다. 토니 피알리스 퀄컴 데이터센터 부문 총괄은 이를 두고 "다른 기업들이 자사 하드웨어를 보호하기 위한 해자를 구축하는 동안 퀄컴은 업계를 연결하는 다리를 만들고 있다"고 말했다. 크리스 래트너 모듈러 CEO는 "AI에는 다양한 하드웨어와 배포 환경을 아우를 수 있는 개방적이고 효율적인 소프트웨어 기반이 필요하다"며 "퀄컴과 함께 개발자의 접근성을 높이고 하드웨어 간 이식성을 강화해 보다 개방적인 AI 생태계를 구축할 것"이라고 밝혔다.

2026.06.25 08:20권봉석 기자

AI 주권, 모델 넘어 '운영' 경쟁으로 번진다

앤트로픽의 최상위 인공지능(AI) 모델에 대한 미국의 수출 통제를 계기로 AI가 국가 안보 자산으로 취급되고 있다. 기술 보유국의 정책 변화만으로 모델과 서비스 공급망이 흔들릴 수 있다는 우려가 현실화하면서, 자국 모델 기술력과 이를 효율적으로 운영할 역량이 소버린(주권) AI의 핵심 과제로 떠오르고 있다. 22일 업계에 따르면 미국 행정부는 지난 12일(현지시간) 앤트로픽 신규 모델 '클로드 미토스5'와 '클로드 페이블5'에 대한 외국 국적자의 접근을 제한하는 수출 통제 지침을 내렸다. 해외 접속뿐 아니라 미국 내 체류 중인 외국인과 앤트로픽 소속 외국인 직원의 사용까지 제한 대상에 포함되면서 파장이 커졌다. 이번 조치로 글로벌 AI 보안 협의체 '프로젝트 글래스윙'에 합류한 한국도 영향을 받게 됐다. 프로젝트 글래스윙은 앤트로픽이 '클로드 미토스 프리뷰' 공개와 함께 출범한 협의체다. 보안 취약점 탐지에 특화된 미토스의 오남용을 막기 위해 검증된 기업과 기관에 모델을 선제 제공하고 이를 통해 소프트웨어 취약점을 방어하는 방식으로 운영돼 왔다. 앤트로픽은 지난 2일(현지시간) 글래스윙 참여 대상을 15개국 약 150개 기관으로 확대했다. 국내에서는 한국인터넷진흥원(KISA), 삼성전자, SK하이닉스, SK텔레콤 등이 참여했다. 그러나 이후 미토스5와 페이블5에 대한 수출 통제가 내려지면서 국내 참여 기관들은 본격적인 모델 활용에 나서기 전부터 접근 제약에 직면했다. 업계는 이번 사태가 특정 빅테크 모델을 쓰지 못하게 된 문제에 그치지 않는다고 본다. 해외 사업자의 모델과 응용프로그램인터페이스(API), 클라우드에 의존하는 구조에서는 공급국의 정책 변화나 사업자 판단만으로 AI 서비스 운영 자체가 흔들릴 수 있기 때문이다. 프런티어 AI를 외부에서 들여온다는 것은 모델 하나를 사용하는 문제가 아니라 개발·배포·운영 환경 전반을 외부 스택에 의존하는 문제라는 지적이다. 한국은 외산 AI 의존도를 낮추기 위해 독자 AI 파운데이션 모델 개발에 나서고 있다. 지난해부터 과학기술정보통신부가 추진한 '독자 AI 파운데이션 모델(독파모)' 프로젝트는 거대언어모델(LLM)과 멀티모달 등 주요 AI 영역에서 원천 기술력을 확보하는 것을 목표로 한다. 다만 업계에서는 자국 AI 모델 개발만으로는 충분하지 않다는 목소리가 나온다. 국내에서 확보 가능한 컴퓨팅 자원과 인프라 안에서 모델을 안정적으로 학습·추론하고 서비스할 수 있는 운영 역량도 함께 갖춰야 한다는 것이다. 미국과 중국의 대형 사업자처럼 대규모 그래픽처리장치(GPU)와 데이터센터를 단기간에 확보하기 어려운 만큼, 제한된 연산 자원의 활용 효율이 경쟁력으로 꼽힌다. 최신 AI 추론 환경은 기존 데이터센터보다 높은 전력 밀도와 메모리 자원을 요구한다. 이에 따라 인프라 확충과 함께 모델 구조와 서비스 환경에 맞춰 정밀도, 메모리 사용량, 처리 속도를 조정하는 경량화·최적화 기술에도 관심이 쏠린다. 같은 인프라에서 처리할 수 있는 작업량을 늘리고 운영 비용을 낮출 수 있어서다. 이 같은 운영 최적화는 독파모 프로젝트에서도 적용되고 있다. 업스테이지 컨소시엄에 참여 중인 노타는 솔라 계열 모델을 국내 인프라 환경에서 구동하기 위한 압축·최적화 작업을 맡고 있다. 이 회사는 대규모 전문가 혼합(MoE) 모델에서 중요도가 낮은 영역을 선별적으로 압축해 메모리 사용량을 줄이고 성능 저하를 최소화하는 기술을 제공한다. 실제 업스테이지 '솔라 오픈 100B'에 노타의 최적화 기술을 적용한 결과, 메모리 사용량을 약 72.8% 줄이면서 원본 모델과 유사한 성능 지표를 유지한 것으로 나타났다. 업계 관계자는 "앤트로픽 사태가 단발성 사건으로 끝나더라도 AI 인프라 종속의 구조적 위험은 그대로 남을 것"이라며 "독자 개발한 자국 모델을 한정된 자원에서 효율적으로 가동하는 경량화·최적화 기술이 함께 가야 AI 주권이 외부 정책 변수에 흔들리지 않는다"고 말했다.

2026.06.22 11:37이나연 기자

삼성전자, '엑시노스 2600' AI 성능 자신감..."전작 대비 두 배 향상"

삼성전자가 최신형 모바일 어플리케이션 프로세서(AP)인 '엑시노스 2600'의 온디바이스 AI 성능을 자신했다. 최근 진행된 테스트 결과 해당 칩셋은 다양한 AI 모델에서 전작(엑시노스 2500) 대비 2배 이상의 성능을 기록한 것으로 나타났다. 12일 업계에 따르면 삼성전자는 최근 엑시노스 2600에 대한 AI 성능 벤치마크 테스트 결과를 공개했다. 엑시노스 2600은 삼성전자의 최신형 모바일 AP로, 최첨단 파운드리 공정인 2나노미터(nm)를 기반으로 한다. 올해 초 출시된 플래그십 스마트폰 '갤럭시S26' 시리즈의 일반 및 플러스 모델에 채용됐다. 엑시노스 2600은 온디바이스 AI에 초점을 맞춰 설계됐다. 삼성전자 내부 테스트 결과 칩에 탑재된 신경망처리장치(NPU)의 생성형 AI 성능은 전작 대비 113% 향상된 것으로 집계된 바 있다. 실제로 삼성전자가 지난 10일 MLPerf 테스트를 진행한 결과, 엑시노스 2600은 전작 대비 AI 성능이 크게 개선됐다. MLPerf는 하드웨어 및 소프트웨어의 다양한 AI 성능을 평가할 수 있는 공신력 있는 벤치마크다. 세부적으로 모바일용 자연어처리(NLP) 모델인 'Mobile-BERT' 분야에서 1199.57QPS(초당 처리 쿼리 수)를 기록했다. 전작 대비 2.1배 이상 향상된 수준이다. QPS는 시스템이 1초간 얼마나 많은 데이터를 처리할 수 있는지를 나타낸 것으로, AI 모델의 추론 성능을 가늠하는 지표로 활용된다. 이미지를 생성하는 AI 모델 '스테이블 디퓨전(Stable Diffusion)'에서는 0.53QPS를 달성했다. 전작 대비 2.4배 이상 향상됐다. 삼성전자는 "자사의 최신 MLPerf 테스트 결과는 엑시노스의 큰 도약을 입증한 것"이라며 "엑시노스는 반응성이 뛰어난 에이전틱 AI부터 이미지 생성까지 온디바이스 AI 기술을 지속 발전시키고 있다"고 설명했다.

2026.06.12 08:30장경윤 기자

아카마이, 아태지역 매출 10억 달러 돌파…"엣지 AI 시대 연다"

아카마이가 아시아태평양 지역에서 엣지 기반 인공지능(AI) 인프라 사업 확대에 박차를 가한다. 생성형 AI 확산으로 실시간 추론 수요가 늘어나는 가운데, 중앙 집중형 클라우드를 넘어 사용자와 가까운 엣지 환경에서 AI를 구동하는 차세대 인프라 시장 공략에 나서는 모습이다. 아카마이는 지난해 아태지역 매출이 10억 달러(약 1조 5294억원)를 넘어섰다고 11일 밝혔다. 회사는 이번 성과를 바탕으로 AI 추론과 엣지 컴퓨팅을 차세대 성장 동력으로 삼고 관련 사업을 확대할 계획이다. 최근 기업들은 생성형 AI를 실제 서비스에 적용하는 과정에서 지연 시간과 확장성, 안정성 확보를 핵심 과제로 꼽고 있다. 특히 추천 서비스와 실시간 영상 분석, 자율주행, AI 에이전트 등은 수 밀리초(ms) 단위 응답 속도가 요구돼 중앙 데이터센터만으로는 한계가 있다는 지적이 나온다. 아카마이는 이같은 수요에 대응하기 위해 분산형 클라우드 플랫폼 기반 AI 추론 인프라를 강화하고 있다. 그래픽처리장치(GPU) 기반 컴퓨팅 자원을 사용자와 데이터에 가까운 위치에 배치해 실시간 AI 서비스를 지원한다는 전략이다. 이를 통해 중앙 집중형 클라우드 환경만으로 구현하기 어려운 수준의 응답 속도와 확장성을 지원할 방침이다. 업계에선 AI 인프라 무게중심이 대규모 모델 학습 중심에서 추론 중심으로 이동하고 있다는 분석이 나온다. 실제 서비스 단계에선 AI가 얼마나 빠르게 응답하고 안정적으로 운영되느냐가 고객 경험과 운영 효율성에 직접적인 영향을 미치기 때문이다. 아카마이는 아태지역이 이런 변화의 중심에 있다고 짚었다. 일본과 호주 등 성숙 시장에선 고성능·고가용성 인프라 수요가 늘고 있으며 인도와 중국, 동남아시아에선 AI 네이티브 기업이 빠르게 성장하고 있다는 설명이다. 한국 역시 대기업의 레거시 시스템 현대화와 디지털 네이티브 기업의 AI 서비스 확대가 동시에 진행되며 주요 시장으로 부상 중인 상황이다. 회사는 향후 글로벌 네트워크 전반에 GPU 기반 추론 인프라를 확대하고 AI 애플리케이션 보호 기능을 강화해 성능과 보안을 동시에 제공하는 AI 플랫폼 전략을 추진할 계획이다. 아태지역 기업들의 AI 도입과 서비스 운영을 지원하며 성장세를 이어간다는 목표다. 숀 리 아카마이 아태지역 총괄 수석 부사장은 "아태지역은 이제 AI 실험 단계를 넘어 실행 단계로 접어들고 있다"며 "현재 기업들이 직면한 과제는 AI를 원활하게 구동하는 것으로, 지연 시간·확장성·신뢰성이 곧 매출과 고객 경험에 직간접적인 영향을 미친다"고 말했다. 이어 "추론 기술을 엣지로 가져옴으로써 우리는 기업에 중앙 집중식 클라우드만으로는 구현하기 어려운 수준의 즉각적이고 안전하며 대규모로 확장 가능한 인텔리전스 플랫폼을 제공할 것"이라고 덧붙였다.

2026.06.11 16:47한정호 기자

[기고] 아태지역 AI 인프라, '데이터 시스템' 중심 설계해야

대규모 모델을 학습시키고 AI를 실험 단계에서 실제 운영 환경으로 확산시키는 것이 당면 과제였던 시기에는, 이러한 컴퓨팅 중심의 접근이 충분히 합리적인 선택이었다. 그러나 아태지역 전반에서 AI 도입이 성숙 단계에 접어들면서, 컴퓨팅과 데이터 사이의 구조적 격차가 핵심 과제로 부상하고 있다. AI 학습의 중요성은 여전히 크지만, AI의 다음 단계는 조직이 얼마나 많은 컴퓨팅 자원을 확보하느냐만으로 결정되지 않는다. 시간이 흐를수록 AI 시스템이 얼마나 많은 데이터를 소비하고, 생성하고, 보존하며, 다시 활용할 수 있는지가 중요한 경쟁력으로 자리 잡을 것이다. 이러한 차이는 AI가 비즈니스 가치를 창출하기 위해 운영 환경과 추론 단계로 본격 진입할수록 더욱 뚜렷해진다. AI는 데이터를 단순히 사용하는 데 그치지 않는다. 맥락과 메타데이터부터 출력값, 처리 이력, 운영 과정에서 축적되는 부가 데이터에 이르기까지 새로운 데이터를 지속적으로 생성한다. 많은 조직은 이러한 데이터를 거버넌스 준수, 모델 개선, 또는 향후 활용을 위해 장기간 보존하고자 할 것이다. AI 워크로드마다 요구하는 스토리지 계층도 다르다. 데이터 수집과 학습부터 추론, 장기 보존에 이르기까지 각 단계는 성능, 용량, 비용 측면에서 서로 다른 요건을 갖기 때문이다. 추론이 시작되면 이 차이는 더욱 분명해진다. 컴퓨팅 자원은 수요에 따라 단계적으로 확장될 수 있지만, 데이터는 멈추지 않고 계속 축적된다. 시간이 지날수록 AI 운영 환경은 순수한 컴퓨팅 시스템보다 데이터 시스템에 가깝게 작동한다. 축적되는 데이터가 시스템의 확장 방식, 운영 방식, 가치 창출 방식을 규정하기 시작하기 때문이다. 이는 규모, 비용 압박, 에너지 제약, 규제 복잡성이 시장마다 다르게 나타나는 아태지역에서 특히 중요한 의미를 갖는다. 아태지역 AI 성장, 데이터 확장성이 핵심 과제로 부상 아태지역의 성장세는 뚜렷하다. 딜로이트 보고서에 따르면, 아태지역은 2030년까지 약 8000억 달러(약 1219조원) 규모의 데이터센터 투자가 예상되며 세계의 차세대 데이터센터 허브로 부상할 전망이다. 한국도 이러한 흐름에 발맞추고 있다. 지난 5월 '인공지능 데이터센터 산업 진흥에 관한 특별법', 이른바 AIDC 특별법이 국회 본회의를 통과했다. 해당 법은 글로벌 AI 3대 강국 도약이라는 비전을 뒷받침하기 위해 관련 규제 부담을 완화하는 것을 목표로 하며, 2027년 2월 시행될 예정이다. 동시에 아태지역의 AI 인프라 전략은 결코 단순하지 않다. 아태지역에는 빠르게 성장하는 디지털 경제권, 이미 인프라가 고도화된 성숙 시장, 새롭게 부상하는 AI 네이티브 환경이 함께 공존한다. 각 시장이 직면한 우선순위와 제약 조건도 제각각이다. 이에 따라 AI의 실질적인 병목은 순간적인 처리 성능보다 대규모 데이터 관리 역량 쪽으로 이동하고 있다. AI 환경이 확장될수록 조직은 데이터 생애주기 전반에 걸쳐 서로 다른 데이터 계층을 지원해야 한다. 빠른 접근이 필요한 핫 데이터, 간헐적으로 활용되는 웜 데이터, 장기 보존을 위한 콜드 데이터가 대표적이다. 모든 데이터를 하나의 고성능 계층에 저장하는 방식은 소규모 환경에서는 작동할 수 있지만, 데이터 규모가 커질수록 비효율적이며 경제적으로도 지속 가능하지 않다. 실질적으로 아태지역의 AI 성장은 컴퓨팅 자원 배치뿐 아니라, 장기적으로 AI를 책임 있고 경제적으로 지원하기 위한 더 넓은 데이터 아키텍처 전반에 부담을 가중시킬 것이다. 이 때문에 이제 아키텍처 설계는 순수한 처리 속도만큼이나 중요해지고 있다. 확장성의 관점에서 핵심은 가용성, 내구성, 복원력, 그리고 데이터를 장기간 보존하고 관리하는 데 따르는 경제성이다. 결국 데이터 규모가 커지고, 워크로드가 변화하며, 비용 압박이 심화되는 상황에서 기반 아키텍처가 그 속도를 따라갈 수 있는지가 관건이다. AI의 장기 비용을 좌우하는 데이터 관리 AI가 지속적으로 데이터를 생성하는 단계로 접어들면서, AI의 장기 비용은 컴퓨팅 자원뿐 아니라 조직이 데이터를 얼마나 효율적으로 보존하고 관리하느냐에 따라 결정될 것이다. 대규모 환경에서 총소유비용(TCO)은 드라이브, 전력 소비, 냉각 장치, 랙 공간, 그리고 급증하는 데이터 규모를 관리하는 운영 부담이 복합적으로 작용해 형성된다. 이에 따라 지속 가능성은 인프라 설계에서 빼놓을 수 없는 요소가 됐다. 핵심은 컴퓨팅 자원에 전력을 어떻게 공급할 것인가에만 있지 않다. 데이터 수집과 학습부터 추론, 장기 보존에 이르기까지 용량, 에너지, 공간을 효율적으로 활용하는 데이터 시스템으로 AI 인프라를 어떻게 설계할 것인가가 중요하다. 모든 데이터를 동일한 성능 계층에 저장할 필요는 없다. 워크로드 요건에 맞게 스토리지 자원을 배치하면, 조직은 데이터 생애주기 전반에서 용량, 에너지, 냉각, 물리적 공간을 보다 효율적으로 활용할 수 있다. 인프라 리더에게 이는 지속 가능성과 총소유비용을 설계 초기 단계부터 핵심 기준으로 삼아야 한다는 의미다. 데이터 보존, 계층화, 내구성, 가용성에 대한 초기 판단은 시스템이 실제 운영 단계에 들어선 뒤 장기적인 영향을 미친다. 대규모 환경에서 이를 뒤늦게 재검토하고 수정하려면 상당한 비용이 발생할 수 있다. 전체 데이터 생애주기를 염두에 두고 인프라를 설계하는 조직은, 경제적으로 지속 가능하면서도 운영 복원력을 갖춘 방식으로 AI를 확장하는 데 더 유리한 위치에 설 수 있다. AI의 다음 단계, 아키텍처가 좌우한다 업계는 AI 인프라를 칩 성능, 벤치마크 점수, 최고 모델 성능 중심으로 바라보던 단계를 지나고 있다. 다음 단계는 사용 확대 속에서도 시스템이 비용 효율성, 적응력, 지속 가능성을 유지할 수 있는지를 결정하는 아키텍처 선택에 좌우될 것이다. 이는 더 근본적인 질문을 던져야 한다는 의미이기도 하다. 데이터를 얼마나 많이, 얼마 동안 보존해야 하는가. 어떤 워크로드에 프리미엄 성능이 필요하고, 어떤 워크로드에는 그렇지 않은가. 조직은 접근성, 복원력, 거버넌스, 비용 사이에서 어떤 균형을 잡아야 하는가. 이제 이러한 질문들은 부차적인 고려사항이 아니다. AI가 상업적으로 실현 가능하고 운영 측면에서도 지속 가능한 방식으로 확장될 수 있는지를 좌우하는 핵심 요소다. AI의 다음 승자는 단순히 가장 많은 컴퓨팅 자원을 배치한 조직이 아닐 것이다. 시간이 지남에 따라 AI 시스템이 어떻게 작동하는지를 이해하고, AI가 지능을 만들어내는 동시에 데이터를 생성한다는 현실을 바탕으로 인프라를 설계하는 조직이 될 것이다. 대규모 환경에서는 그 데이터 자체가 곧 시스템이 된다.

2026.06.11 11:38스테판 만들 컬럼니스트

리벨리온, 문병준 전 주사우디 대사대리 영입…중동 시장 공략

인공지능(AI) 반도체 스타트업 리벨리온이 중동 외교 전문가를 영입했다. 문병준 전 주사우디아라비아 대사대리를 중동·북아프리카(MENA) 전략 고문으로 위촉했다고 11일 밝혔다. 리벨리온은 "중동 현장을 누빈 전문가와 손잡고 중동 AI 반도체 시장 내 파트너십을 구축할 것"이라고 말했다. 문 고문은 외교부 중동2과장을 비롯해 주이집트 대사관 공사, 주두바이 총영사, 주사우디아라비아 대사대리를 역임했다. 리벨리온은 "문 고문은 올 5월에 중동전쟁 장기화라는 위기 속에서 외교장관 특사 자격으로 중동 지역을 방문해 협력 방안을 논의했다"며 "이번 위촉은 국가 차원으로 축적한 네트워크 역량을 민간에 연결한다는 점에서 의의가 있다"고 설명했다. 리벨리온은 문 고문이 보유한 현지 정부·기관·기업 네트워크를 중동 시장 내 글로벌 파트너십 구축에 활용할 계획이다. 리벨리온은 지난해 사우디아라비아에 현지 법인을 설립했다. 문 고문은 "현재 중동에서는 AI 공급망과 원천 기술 확보가 주요 과제로 떠오르고 있다"며 "추론 특화 AI 반도체는 이러한 고민에 해답을 줄 수 있다. 리벨리온은 이를 앞세워 현지 네트워크를 바탕으로 경쟁력을 증명할 것”이라고 밝혔다.

2026.06.11 09:34진운용 기자

'AI' vs '로스쿨 교수', 법률 추론 대결...승자는

인공지능(AI)이 학생들 질문에 인간 법학 교수보다 더 우수하게 답변할 수 있다는 연구 결과가 나왔다. 심지어 답변이 오해를 불러일으키거나 교육적으로 유해하다고 판단되는 비율 역시 AI가 인간 교수보다 훨씬 낮았다. 이 연구 보고서는 지난달 27일 스탠퍼드 로스쿨 홈페이지에 게재됐으며, 이달 1일 같은 웹사이트 내 뉴스&미디어를 통해 보도됐다. 스탠퍼드 대학교 로스쿨의 법학 교수이자 '법무혁신 프론티어 테크놀로지 랩(LIFT Lab)'을 이끄는 줄리언 냐르코(Julian Nyarko) 교수는 예일대·뉴욕대 등 미국 명문대 동료 연구진과 함께 AI가 학생들의 법률 질문에 얼마나 정교하게 답할 수 있는지를 검증하는 연구를 진행했다. 냐르코 교수 연구팀이 진행한 이번 실험에는 미국 로스쿨에 재직 중인 법학 교수 16명이 참여했다. 교수들은 실제 계약법 강의 중이나 강의 후에 학생들이 던질 수 있는 대표적인 질문 40개를 작성한 뒤, 각 질문에 대한 모범 답안을 직접 기술했다. 연구팀은 AI에게도 동일한 질문을 주고 답변을 생성하게 한 뒤, 평가자가 어떤 답변이 인간 교수의 것이고 어떤 것이 AI의 것인지 알 수 없도록 '블라인드 테스트' 방식으로 평가를 진행했다. 특히 연구팀은 실험의 형평성과 타당성을 확보하기 위해 AI가 생성한 답변의 길이나 구조를 인간 교수가 작성한 답변 스타일에 맞춰 엄격하게 조정했다. 냐르코 교수는 "이번 연구가 가지는 학술적 중요성이 매우 크기 때문에, 실험 설계를 최대한 엄격하고 객관적으로 진행했다"고 강조했다. 기존의 AI 성능 조사는 주로 정답과 오답이 명확히 갈리는 단답형 문제에 초점이 맞춰져 있었다. 하지만 법적 추론의 영역은 대립하는 논거들을 신중하게 분석하고 모호함을 조율하며 타당한 결론을 도출해야 하는 복잡한 과정이다. 냐르코 교수는 "법학에 초점을 맞춘 이유는 단순히 사실을 기억하는 능력을 넘어, 판단력과 섬세한 추론 능력, 그리고 모호함을 극복하는 능력이 복잡하게 요구되는 분야이기 때문"이라고 설명했다. 참여 교수들이 총 2918건의 답변을 교차 평가한 결과, 놀랍게도 교수들은 동료 인간 법학 교수가 작성한 답변보다 AI가 생성한 답변에 현저히 높은 점수를 줬다. AI가 생성한 답변은 인간 교수와의 1대1 비교 평가에서 약 75%의 승률을 기록했다. 가장 주목할 만한 부분은 '교육적으로 해롭거나 잘못된 정보를 담고 있다'고 지적된 답변 비율이었다. 인간 교수가 작성한 답변 중 유해성이나 오류가 지적된 비율은 약 12%에 달했으나, AI가 생성한 답변에서는 그 비율이 불과 3.5%에 그쳐 안정성 면에서도 판정승을 거뒀다. 냐르코 교수는 "실험에 사용된 질문들은 결코 단순한 문답 수준이 아니었다"며 "대부분 복잡한 법리 개념을 통합하고 이를 새로운 가상 상황에 적용해, 학생들이 분석적 기술을 키울 수 있도록 돕는 고난도 질문이었다"고 설명했다. 이어 "이번 연구는 법학 교육에서 AI의 역할에 대해 우리가 가졌던 기존의 부정적 전제들에 강한 의문을 제기한다"고 덧붙였다. 이번 연구 결과는 향후 법학 교육 현장에서 'AI 튜터'의 활용 가능성을 시사한다는 점에서 학계의 큰 관심을 모으고 있다. 현재 미국 로스쿨 환경에서는 AI 도입을 두고 고심하고 있는데, 일각에서는 AI의 환각 현상이나 학생들의 과도한 의존, 비판적 사고력 저하 등을 우려해 도입에 신중한 태도를 보여왔다. LIFT Lab의 연구원인 알레한드로 살리나스(Alejandro Salinas)는 "우리의 연구는 AI를 통한 개별 지도가 법률처럼 고도의 판단을 요하는 전문 분야 학습에 어떻게 기여할 수 있는지를 보여준다"면서 "법학 교육자들의 평가를 통해, AI 튜터가 교실 수업을 보완하는 질 높은 상시 지원(On-demand) 서비스를 제공할 수 있으며, 전문가 지도에 대한 학생들의 접근성을 획기적으로 확대할 잠재력이 있음이 증명됐다"고 평가했다. 이어 그는 "법조인 교육의 본질은 미래의 변호사들이 비판적으로 사고하고, 설득력 있는 논증을 펴며, 윤리적으로 복잡한 문제에 대처할 수 있도록 훈련하는 것"이라며 "AI 튜터의 전면 도입을 성급하게 권장하는 것은 아니지만, 데이터가 보여주듯 AI에 대해 무조건적인 회의론을 고집하는 것 또한 부당하다"고 지적했다. 나아가 살리나스 연구원은 "이제 논의의 초점은 'AI가 과연 정확하고 질 높은 답변을 줄 수 있는가'라는 의구심에서 벗어나, '학생들의 학습 이익을 위해 AI를 어떻게 책임감 있게 교육 과정에 활용할 것인가'로 전환돼야 한다"고 제언했다.

2026.06.07 09:42백봉삼 기자

[AI 고속도로] 국산 클라우드-NPU 연합 생태계 본궤도…정부 육성정책 결실 맺나

국내 클라우드 기업들이 국산 신경망처리장치(NPU)를 서비스 형태로 제공하는 사업에 잇따라 뛰어들면서 정부가 수년간 추진해 온 AI 반도체 육성 정책이 본격적인 상용화 단계에 진입하고 있다. 기술 실증과 연구개발(R&D)을 넘어 실제 클라우드 서비스와 산업 현장으로 확산되며 독자 인프라 생태계 구축에 속도가 붙는 모습이다. 5일 업계에 따르면 KT클라우드와 가비아가 최근 리벨리온 반도체 기반 서비스형 NPU(NPUaaS)를 출시한 데 이어 삼성SDS도 오는 7월 퓨리오사AI NPU를 탑재한 서비스를 선보일 예정이다. 국내 주요 클라우드 사업자들이 국산 AI 반도체를 클라우드 상품으로 제공하며 본격적인 상용화에 나서는 분위기다. 이는 신규 서비스 출시를 넘어 정부 주도 AI 반도체 육성 정책이 실제 시장으로 연결되는 전환점이 될 전망이다. 그동안 국산 NPU는 기술 검증과 실증 사업 중심으로 성장해 왔지만, 최근에는 국내 클라우드를 통해 기업과 공공기관이 손쉽게 활용할 수 있는 서비스 형태로 확산을 앞두고 있다. K-AI 반도체, 실증 넘어 서비스 단계 진입 KT클라우드는 지난 4일 리벨리온의 차세대 NPU '아톰 플러스'를 적용한 공공 전용 NPU 서비스 출시를 발표했다. 국내 NPUaaS 가운데 처음으로 클라우드 보안인증(CSAP)을 획득했으며 공공기관과 지방자치단체가 보안 규제를 충족하면서 국산 AI 반도체를 활용할 수 있도록 설계됐다. 가비아도 지난 4월 리벨리온 '아톰-맥스'를 기반으로 한 NPUaaS를 선보였다. 클라우드 환경에서 NPU를 구독형으로 제공하며 AI 추론 최적화 컨설팅까지 함께 지원할 계획이다. 그래픽처리장치(GPU) 공급 부족과 비용 부담이 커지는 상황에서 추론 중심 AI 서비스 수요를 겨냥한 전략이다. 삼성SDS 역시 다음 달 퓨리오사AI의 2세대 NPU '레니게이드' 기반 NPUaaS를 삼성 클라우드 플랫폼(SCP)에 출시할 예정이다. 엔비디아 GPU 중심 인프라에서 벗어나 고객이 워크로드 특성에 따라 GPU와 NPU를 선택할 수 있는 구조를 구축한다는 목표다. 이 외 다양한 국내 IT서비스 기업들도 국산 NPU 생태계 확대에 동참하고 있다. 롯데이노베이트는 모빌린트와 협력해 휴머노이드와 스마트 인프라 등 피지컬 AI 분야 실증을 추진한다. 포스코DX도 산업용 제어 시스템에 모빌린트 NPU를 적용해 제조 현장 중심의 엣지 AI 구축에 나서고 있다. LG CNS도 국산 NPU 기반 AI 인프라와 서비스 확대를 추진하면서 AI 반도체 활용 범위가 클라우드를 넘어 제조·공공·기업 업무 영역 전반으로 확산되는 상황이다. 최근 AI 인프라 시장이 대규모 학습 중심에서 추론 중심으로 이동하는 것도 이러한 변화 배경으로 꼽힌다. NPU는 추론 작업에서 GPU 대비 전력 효율과 비용 경쟁력이 높아 AI 에이전트와 기업용 생성형 AI 서비스 확산 과정에서 새로운 대안으로 주목받고 있다. 정부 'AI 반도체 팜' 결실 맺기 시작 현재 나타나는 상용화 흐름은 정부가 지난 수년간 추진해 온 AI 반도체 육성 정책과 맞닿아 있다. 대표 사례가 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 추진한 'AI 반도체 팜 구축·실증' 사업이다. 해당 사업은 국산 NPU 기반 고성능 클라우드 인프라를 구축하고 실제 산업 현장에서 성능을 검증하기 위해 2023년부터 3년간 진행됐다. 사업에는 네이버클라우드·KT클라우드·NHN클라우드 등이 참여했으며 리벨리온과 퓨리오사AI가 반도체 공급사로 함께했다. 이들은 총 19.95페타플롭스(PF) 규모 국산 NPU 인프라를 구축하고 의료·번역·챗봇 등 다양한 AI 서비스를 실증했다. 특히 네이버클라우드는 퓨리오사AI와 함께 외국인 근로자를 위한 거대언어모델(LLM) 기반 번역·챗봇 서비스를 실증했으며 KT클라우드와 NHN클라우드는 리벨리온과 협력해 뇌 질환 진단·예측 플랫폼 등을 운영했다. 또 NHN클라우드는 정부 'K-클라우드 프로젝트'를 통해 22PF 이상 규모 국산 NPU 인프라를 구축하며 의료·공공안전 분야 실증을 수행했고 네이버클라우드 역시 국산 NPU 기반 서비스 검증과 운영 경험을 축적하며 상용화 기반 마련에 기여했다. 일부 실증에선 국산 NPU가 외산 GPU 대비 경쟁력 있는 성능을 보인 것으로도 전해졌다. 업계에선 정부 사업이 국산 NPU 성능을 검증하는 데 그치지 않고 클라우드 사업자들이 실제 운영 경험을 축적하는 계기가 됐다고 평가했다. 최근 등장하는 NPUaaS 역시 당시 확보한 운영 노하우와 최적화 경험이 기반이 됐다고 분석했다. 다음 시험대는 공공 AX 수요 창출 다만 국산 클라우드와 NPU 결합 생태계가 본격적으로 성장하기 위해선 안정적인 추가 수요 창출이 필요하다는 지적도 나온다. 현재 정부는 삼성SDS 컨소시엄과 국가AI컴퓨팅센터 구축 사업을 추진하고 있다. 오는 2028년까지 첨단 AI 반도체 1만 5000장 규모 인프라를 구축하는 초대형 프로젝트로, 국산 AI 반도체 연구개발과 실증 환경도 함께 제공할 계획이다. 특히 정부는 센터 내 연구개발 존을 조성해 국산 NPU 시범 운영과 신뢰성 검증을 지원하고 향후 국산 AI 반도체 활용 비중도 확대한다는 방침이다. 공공 AI 전환(AX) 사업 역시 중요한 기반이다. 최근 정부와 지방자치단체가 생성형 AI와 AI 에이전트 도입을 확대하면서 추론 중심 AI 인프라 수요가 빠르게 증가하고 있다. 이같은 공공 사업에서 국산 NPU 활용 사례가 늘어날 경우 클라우드 사업자와 반도체 기업 모두에게 새로운 성장 기회가 될 전망이다. 업계 관계자는 "국산 NPU가 과거보다 성능이 많이 개선된 만큼 이제 기술 검증 단계를 넘어 실제 서비스와 시장 적용 단계에 진입하고 있다"며 "정부와 공공 사업 등에서 의미 있는 수요가 만들어진다면 토종 클라우드와 AI 반도체가 함께 성장할 수 있을 것"이라고 말했다. 배경훈 부총리 겸 과기정통부 장관은 지난 4일 'K-AI 반도체 성장 포럼'에서 "국산 AI반도체는 AI 3대 강국 도약이라는 국정과제 실현과 독자 AI 완성을 위한 핵심 기반"이라며 "본격적인 양산과 상용화를 넘어 실질적인 성과를 낼 수 있도록 정부가 마중물 역할을 수행하며 적극 뒷받침하겠다"고 강조했다.

2026.06.05 14:50한정호 기자

인텔 "에이전틱 AI 시대, CPU 중요성 다시 커진다"

[타이베이(대만)=권봉석 기자] 생성 AI와 AI 모델 훈련에 집중되던 데이터센터와 연산 수요가 에이전틱 AI 워크로드와 자체 개발 AI 모델을 활용한 추론으로 옮겨가고 있다. 인텔이 1일(현지시간) 정식 출시한 서버·데이터센터용 프로세서 '제온6+'는 클라우드·통신사, 에이전틱 AI 등 대규모 코어 작동이 필요한 환경을 겨냥했다. 세 환경 모두 높은 처리량과 연산 밀도가 중요시되는 스케일아웃 환경이라는 공통점을 지녔다. 1일 오전 대만 타이베이 험블하우스 내 행사장에서는 케보크 케치치안 인텔 데이터센터그룹 총괄을 비롯해 주요 업계 관계자들이 참석한 가운데 AI 워크로드 변화 속 제온6+의 방향성에 대한 패널 토론이 진행됐다. AI 처리 과정에서 CPU 역할 확대 가속 다니엘 허우 기가컴퓨팅 CEO, 마그누스 에버브링 에릭슨 아태지역 CTO, GPU 클라우드 서비스 기업인 GMI클라우드의 유징 치엔 엔지니어링 부사장 등은 "AI 처리 과정에서 CPU의 역할이 다시 커지는 등 중요도가 높아졌다"고 입을 모았다. 다양한 AI 에이전트가 데이터를 처리하고, 네트워크·스토리지·메모리를 조율하며, GPU 자원을 효율적으로 활용하기 위해서는 강력한 CPU가 필수적이다. 케보크 케치치안 인텔 총괄은 "AI 시대에도 제온은 여전히 제어판이자 기반 인프라가 될 것"이라고 강조했다. AI 에이전트 훈련 위한 환경 조성에도 CPU 필수 과거 AI 인프라 논의의 중심에는 GPU가 있었다. 그러나 에이전틱 AI 확산은 CPU 수요를 구조적으로 늘리고 있다. 위징치엔 GMI클라우드 부사장은 "최근 대형 AI 기업들은 단순히 데이터를 입력하는 사전학습보다 강화학습 기반 후처리에 더 많은 자원을 투입하고 이 과정에서 실제 인터넷 환경을 본딴 대규모 샌드박스 환경이 필요하다"고 설명했다. 이어 "AI 에이전트가 작동하는 환경을 CPU가 만들고 있으며 에이전트 밀도를 높일 수록 학습 속도와 서비스 효율성이 크게 향상된다"고 덧붙였다. "제온6+, 통신사업자의 전력 효율 향상" 마그누스 에버브링 에릭슨 CTO는 "향후 디지털 생태계는 AI와 클라우드, 모바일 네트워크 삼각축으로 구성되며 이동통신망은 AI 서비스를 전달하는 핵심 플랫폼이 될 것"이라고 설명했다. 문제는 폭증하는 트래픽이다. 에릭슨은 향후 10년 동안 이동통신 트래픽이 10~15배 증가할 것으로 전망한다. 마그누스 에버브링 에릭슨 CTO는 "통신사업자에게 가장 중요한 것은 효율성과 예측 가능성이며 제온6+는 성능 대비 전력 효율을 크게 향상시키면서도 장기적인 네트워크 확장성을 제공한다"고 평가했다. 그는 기지국 인근 엣지 데이터센터부터 지역 거점, 중앙 데이터센터까지 다양한 환경에서 동일한 소프트웨어 아키텍처를 유지할 수 있다는 점도 장점으로 꼽았다. "코어 밀도 향상으로 데이터센터 전력 절감 가능" AI 데이터센터가 끌어다 쓰는 막대한 전력이 향후 확장을 가로막는 가장 큰 문제가 될 것이라는 우려가 커지고 있다. 이날 패널들도 AI 데이터센터의 전력 효율성을 당면 과제로 지적했다. 패널들은 제온6+의 높은 코어 밀도와 랙당 처리량을 핵심 가치로 평가했다. 동일한 전력량 안에서 더 많은 AI 에이전트를 운영하고 더 많은 샌드박스를 생성하는 동시에 절감된 전력을 GPU로 돌릴 수 있기 때문이다. 케보크 케치치안 인텔 총괄은 "이제 업계는 단순 코어 수가 아니라 랙 단위에서 얼마나 많은 AI 에이전트를 처리할 수 있는지를 평가하기 시작했다"며 "에이전트 밀도와 전력 효율이 새로운 평가 기준이 될 것"이라고 설명했다.

2026.06.02 06:56권봉석 기자

[AI 고속도로] AI 열풍 탄 '네오클라우드'…인프라 새 전장으로

인공지능(AI) 시대 핵심 자원 그래픽처리장치(GPU)를 전문적으로 공급·운영하는 '네오클라우드'가 글로벌 인프라 시장의 새로운 강자로 떠오르고 있다. AI 경쟁 무게중심이 모델 개발에서 인프라 확보로 이동하는 가운데, 국내 기업들도 차세대 AI 클라우드 시장 선점에 나서는 모습이다. 네오클라우드는 AI 모델 학습과 추론에 필요한 GPU를 서비스형(GPUaaS)으로 제공하는 AI 특화 클라우드 사업자를 뜻한다. 웹서비스와 기업 업무를 폭넓게 처리하는 기존 범용 퍼블릭 클라우드와 달리 AI 연산에 최적화된 구조를 갖춘 것이 특징이다. 네오클라우드가 주목받는 배경에는 폭발적으로 증가한 AI 연산 수요가 있다. 빅테크 기업들의 AI 데이터센터 투자와 소버린 AI 프로젝트 확대로 GPU 수요가 급증했지만 공급은 이를 따라가지 못하고 있다. 동시에 확보한 GPU조차 효율적으로 활용하지 못하는 문제가 나타나면서 AI 전용 인프라 필요성이 커지고 있다. 가격 경쟁력도 강점으로 꼽힌다. 업타임 인스티튜트 분석에 따르면 북미 기준 엔비디아 H100 GPU 온디맨드 사용 비용은 네오클라우드가 시간당 약 34달러로, 하이퍼스케일러 평균인 98달러 대비 크게 저렴한 것으로 나타났다. AI 워크로드에 불필요한 요소를 줄여 비용 효율을 높인 결과다. 글로벌 시장에선 코어위브, 람다랩스, 네비우스 등이 대표 사업자로 부상했다. 특히 코어위브는 오픈AI와 앤트로픽, 구글, 메타, 퍼플렉시티 등 주요 AI 기업에 GPU 인프라를 제공하며 시장을 선도하고 있다. 최근에는 AI 개발 플랫폼 기업 위츠앤바이어스(W&B)를 인수한 데 이어 에이전트 AI 기능까지 출시하며 단순 GPU 임대를 넘어 풀스택 AI 클라우드 기업으로 진화하고 있다. 네비우스 역시 AI 특화 클라우드 기업으로 빠르게 성장 중이다. 러시아 최대 검색엔진 얀덱스에서 분사한 뒤 AI 클라우드 기업으로 전환한 네비우스는 마이크로소프트와 메타, 엔비디아 등과 대형 계약을 체결하며 시장 영향력을 확대하고 있다. 올해 들어 주가가 130% 이상 급등하는 등 투자자들의 관심도 집중되고 있다. 글로벌 자본도 네오클라우드에 몰리는 상황이다. 블랙스톤과 칼라일 등 미국 주요 투자기관들은 코어위브와 람다, 크루소 등 네오클라우드 기업이 보유한 GPU를 담보로 대규모 자금을 공급하고 있다. 시장에선 GPU 자체가 새로운 인프라 자산으로 평가받기 시작했다는 분석도 나온다. 통신사들도 경쟁에 뛰어들고 있다. 일본 소프트뱅크는 엔비디아 GB200 NVL72 기반 네오클라우드 서비스를 올해 정식 출시할 예정이다. 자체 AI 클라우드 운영체제(OS) '인프리니아'를 결합해 학습부터 추론까지 통합 지원하는 구조를 내세우고 있다. 글로벌 통신사들이 AI 인프라 사업자로 영역을 확장하는 흐름이 뚜렷해지는 양상이다. 국내에선 베슬AI와 몬드리안에이아이 등이 대표 주자로 꼽힌다. 베슬AI는 연내 최신 GPU 1만 장 규모 인프라 구축을 추진하며 글로벌 데이터센터 네트워크를 확대하고 있다. 몬드리안에이아이는 AI 플랫폼과 인프라를 결합한 네오클라우드 전략을 내세우며 교육·연구 시장을 공략 중이다. 엘리스그룹 역시 모듈형 데이터센터와 GPU 스팟 요금제를 앞세워 시장 진입에 속도를 내고 있다. 업계에선 네오클라우드가 기존 하이퍼스케일러를 대체하기보다 AI 특화 워크로드를 처리하는 새로운 인프라 축으로 자리 잡을 것으로 보고 있다. 시장조사기관 ABI리서치는 네오클라우드 GPUaaS 시장이 2030년 수백조원 규모로 성장할 것으로 전망했다. 코리 샌더스 코어위브 제품 관리 담당 수석부사장은 최근 미국 IT 전문매체 AI 비즈니스 인터뷰에서 "AI 클라우드는 더 이상 GPU 임대 사업이 아니다"라며 "학습과 추론, 운영을 아우르는 풀스택 플랫폼 경쟁이 시작됐으며 이것이 차세대 AI 인프라 시장의 핵심이 될 것"이라고 강조했다.

2026.05.31 11:00한정호 기자

GPU 확보보다 활용…오케스트로, 추론 특화 플랫폼 '콘체르토 AI' 공개

오케스트로가 생성형 인공지능(AI) 서비스 확산으로 급증하는 추론 수요에 대응하기 위한 AI 인프라 운영 플랫폼을 공개했다. 단순 그래픽처리장치(GPU) 확보 경쟁을 넘어 보유 자원을 얼마나 효율적으로 활용하느냐가 기업 AI 경쟁력으로 떠오르면서, 추론 최적화와 운영 자동화 시장 공략에 나선 모습이다. 오케스트로는 AI 추론 운영 플랫폼 '콘체르토 AI(CONCERTO A.I.)'를 출시했다고 29일 밝혔다. 콘체르토 AI는 기업이 보유한 GPU 인프라 활용 효율을 높여 생성형 AI 서비스 운영 과정에서 발생하는 추론 병목과 응답 지연 문제를 줄이는 데 초점을 맞췄다. 최근 기업 시장에선 AI 챗봇과 업무 자동화 에이전트, 검색증강생성(RAG) 기반 서비스 도입이 확대되면서 추론 연산 수요가 빠르게 증가하고 있다. 특히 에이전트형 AI 환경에선 하나의 요청이 여러 모델 호출과 반복 연산으로 이어지면서 GPU 자원 부담이 커지고 있다. 이에 업계에선 GPU 증설보다 기존 인프라 활용 효율을 높이는 운영 기술 중요성이 커지는 추세다. 콘체르토 AI는 대규모 추론 요청을 분산 처리하고 GPU와 신경망처리장치(NPU) 등 가속기 자원을 작업 특성에 맞게 배분하도록 설계됐다. 질문 분석과 답변 생성 작업을 분리해 각각 최적의 자원에 할당하는 분산 서빙 방식을 적용해 병목 현상을 줄이고 응답 성능을 높인다. 여기에 키-값 캐시(KV Cache) 최적화와 메모리 재사용 기술을 적용해 초기 응답 시간과 토큰 처리 속도를 개선했다. 실시간 대기열과 자원 상태를 반영한 지능형 라우팅 기능도 탑재해 고부하 환경에서도 안정적인 응답 성능을 유지할 수 있도록 지원한다. 오케스트로에 따르면 자체 온프레미스 AI 인프라 환경에서 진행한 벤치마크 결과, 동시 요청이 집중되는 고부하 환경에서 콘체르토 AI의 분산 서빙 방식은 기존 단일 처리 방식 대비 토큰 출력 속도를 2.2배 향상시켰다. 회사는 이를 통해 동일한 하드웨어 환경에서도 응답 지연을 줄이고 추론 처리 안정성을 높일 수 있다고 설명했다. 운영 자동화 기능도 강화했다. 콘체르토 AI는 AI 모델 배포부터 추론 요청 처리, 자원 배분, 성능 모니터링까지 거대언어모델 운영관리(LLMOps) 전 과정을 단일 플랫폼에서 지원한다. 표준화된 모델 패키징 기술을 기반으로 쿠버네티스 환경에서 배포 과정을 자동화하고 초기 응답 시간과 토큰 처리 속도, 자원 사용량 등 주요 운영 지표를 통합 관리할 수 있도록 돕는다. 특히 국내 유일 이기종 AI 가속기 지원 구조도 차별점으로 내세웠다. 엔비디아 GPU뿐 아니라 리벨리온과 퓨리오사AI 등 국산 NPU 환경까지 지원해 기업과 기관이 프라이빗 AI와 소버린 AI 환경에서 특정 하드웨어 벤더 의존도를 낮추고 인프라를 유연하게 구성할 수 있도록 지원한다. 최근 AI 인프라 시장 경쟁축은 학습 중심에서 추론 중심으로 이동하는 분위기다. 생성형 AI 서비스가 실제 업무 환경에 본격 적용되면서 GPU 확보 경쟁을 넘어 운영 효율과 자원 활용 최적화, LLM옵스 역량이 새로운 경쟁력으로 부상하고 있다. 오케스트로 역시 콘체르토 AI를 통해 기업 AI 인프라 운영 효율을 높이고 프라이빗 AI 시장 공략을 강화한다는 전략이다. 김범재 오케스트로 대표는 "생성형 AI가 실제 업무로 확산되고 에이전트형 AI 서비스가 늘어나면서 기업 AI 인프라 과제는 더 많은 GPU를 확보하는 것에서 보유 자원을 얼마나 효율적으로 운영하느냐로 옮겨가고 있다"며 "콘체르토 AI를 기반으로 기업이 보유한 AI 인프라 활용 효율을 높이고 프라이빗 AI 환경에서도 안정적인 AI 서비스 운영을 지원하겠다"고 말했다.

2026.05.29 10:48한정호 기자

[AI는 지금] "추론판 AWS 되겠다"…엔비디아가 베팅한 바세텐, 몸값 110억 달러 논의

인공지능(AI) 반도체 공룡 엔비디아가 투자한 미국 AI 추론 인프라 스타트업 '바세텐(Baseten)'이 110억 달러(약 15조원)의 기업가치로 대규모 투자 유치에 나섰다. 지난 1월 50억 달러의 가치를 평가받은 지 불과 3개월 만으로, 글로벌 AI 시장의 투자 중심축이 거대 모델 '학습'에서 비용 효율화를 위한 '추론(실제 서비스 구동)' 인프라로 급격히 이동한 분위기다. 29일 IT 전문매체 디인포메이션에 따르면 바세텐은 최근 투자자들과 10억 달러 규모 신규 투자 유치를 논의했다. 이번 투자 조건은 투자 후 기업가치 110억 달러를 전제로 한다. 성사될 경우 바세텐의 기업가치는 올해 초 인정받은 50억 달러에서 2배 이상 높아진다. 바세텐은 지난 2019년 미국 샌프란시스코에서 설립된 AI 추론 인프라 기업으로, 고객들이 오픈소스 모델과 자체 조정 모델을 서비스에 배포·운영할 수 있도록 모델 서빙, GPU 자원 관리, 지연시간 최적화, 비용 관리 기능을 제공한다. 주요 고객사로는 AI 코드 편집기 '커서(Cursor)'와 업무 협업 툴 '노션(Notion)' 등이 거론된다. 또 바세텐은 AI 모델 실행 인프라 시장에서 AWS와 같은 플랫폼 지위를 목표로 하고 있다. 클라우드 시장에서 AWS가 기업 컴퓨팅 인프라를 제공하며 성장한 것처럼 바세텐은 AI 시대의 추론 인프라를 겨냥하고 있다. 추론 인프라 수요가 커지면서 바세텐에는 대형 투자자 자금도 몰리고 있다. 바세텐은 올해 1월 50억 달러 평가액으로 3억 달러 투자 유치에 성공했다. 당시 라운드는 벤처캐피털 IVP와 알파벳 계열 독립 성장펀드 캐피털G가 공동 주도했으며 엔비디아도 참여했다. 엔비디아는 해당 거래의 일환으로 바세텐에 1억5000만 달러를 투자하기로 한 것으로 전해졌다. 바세텐은 최근 1년 사이 3차례 투자 유치에 나섰다. 누적 투자 유치액은 5억8500만 달러 수준으로 늘었다. 110억 달러 기업가치가 인정되면 올해 초 투자 라운드 이후 3개월 만에 평가액이 2배 이상 오르게 된다. 엔비디아의 투자는 추론 인프라 시장 확대와 맞물려 있다. 생성형 AI 도입이 확산되면서 기업들은 모델 학습용 GPU뿐 아니라 학습된 모델을 수많은 이용자 요청에 맞춰 빠르게 구동하는 추론 인프라 확보에 나서고 있다. 엔비디아는 GPU 수요를 키우는 추론 플랫폼 기업에 투자하며 하드웨어와 소프트웨어 생태계를 넓히고 있다. AI 업계에선 추론 시장의 성장성이 학습 시장보다 더 클 수 있다는 관측도 나온다. 모델 학습은 대규모 자본과 데이터센터 역량을 갖춘 소수 기업 중심으로 이뤄진다. 반면 추론은 AI 기능을 서비스에 붙이는 모든 기업에서 반복적으로 발생한다. 이용자가 AI 애플리케이션을 호출할 때마다 GPU 연산이 필요하기 때문이다. 오픈소스 AI 모델 확산도 바세텐의 성장 요인으로 꼽힌다. 라마, 딥시크, 미스트랄, 젬마 등 공개 모델을 업무와 서비스에 적용하는 기업이 늘면서 최근 모델 배포와 운영 수요가 증가하고 있다. 이 과정에서 파인튜닝, 모니터링, 비용 관리 등을 통합 지원하는 추론 인프라 플랫폼의 필요성은 커지고 있다. 추론 인프라 시장을 둘러싼 투자 경쟁도 거세지고 있다. 개발자들에게 AI 추론 인프라를 제공하는 파이어웍스AI는 지난해 10월 기업가치 40억 달러를 기준으로 2억5000만 달러를 조달했다. 추론 전용 칩을 설계한 세레브라스도 오픈AI와 파트너십을 맺은 뒤 기업가치 220억 달러로 10억 달러 투자 유치를 논의 중인 것으로 알려졌다. 대형 클라우드 사업자들도 추론 시장을 겨냥하고 있다. AWS, 구글 클라우드, 마이크로소프트 애저는 자체 AI 인프라와 모델 운영 서비스를 강화하고 있다. 코어위브, 람다, 토게더AI 등 GPU 인프라 기업들도 AI 스타트업과 기업 고객을 상대로 추론 워크로드 확보 경쟁을 벌이고 있다. 초기 생성형 AI 경쟁은 대규모 모델 개발과 학습 데이터 확보에 집중됐다. 최근에는 기업들이 AI 기능을 실제 서비스에 적용하기 시작하면서 지연시간, 안정성, 보안, 비용 효율성 등 운영 역량이 경쟁 변수로 떠올랐다. 모델 성능뿐 아니라 서비스 환경에서 모델을 얼마나 빠르고 저렴하게 구동할 수 있는지가 기업 AI 도입의 핵심 조건이 되고 있다. 엔비디아는 AI 반도체 공급자 지위를 넘어 오픈AI, AI 인프라 기업, 애플리케이션 기술 기업 등으로 투자 보폭을 넓히고 있다. GPU를 쓰는 기업에 자본을 투입하고, 이들이 다시 엔비디아 기반 인프라를 확장하는 구조다. 바세텐 투자도 엔비디아의 추론 생태계 확대 전략과 연결돼 있다는 분석이 나온다. 업계 관계자는 "AI 시장의 다음 경쟁은 누가 더 큰 모델을 만드느냐보다 그 모델을 실제 서비스에서 얼마나 빠르고 저렴하게 돌리느냐에 달려 있다"며 "바세텐의 투자 논의는 추론 인프라가 AI 생태계의 핵심 인프라로 자리 잡고 있다는 신호"라고 말했다.

2026.05.29 08:51장유미 기자

[현장] 엔비디아 독주 맞서는 국산 NPU…'추론·피지컬 AI'로 승부수

엔비디아 그래픽처리장치(GPU)가 인공지능(AI) 생태계를 장악하는 가운데, 국내 AI 반도체 기업들이 저전력·고효율 추론과 피지컬 AI 특화 전략을 앞세워 글로벌 시장 공략 의지를 드러냈다. AI 인프라 시장 무게중심이 단순 연산 성능 경쟁에서 전성비와 운영 효율, 인터커넥트, 소프트웨어 생태계 경쟁으로 빠르게 이동하면서 국산 신경망처리장치(NPU) 기업들도 데이터센터·추론·온디바이스 시장을 겨냥한 차별화 전략 강화에 속도를 내는 모습이다. 국내 AI 반도체 대표 기업인 리벨리온·퓨리오사AI·모빌린트 임원진은 28일 서울 강남구 GS타워에서 열린 '솔트룩스 AI 컨퍼런스(SAC)' 패널 토론에 참석해 이같은 비전을 공유했다. 토론은 '엔비디아, 적인가 친구인가? 소버린 AI 반도체의 미래'를 주제로 진행됐으며 사회는 이경일 솔트룩스 대표가 맡았다. 이날 연사들은 AI 시장이 학습 중심에서 추론 중심으로 빠르게 이동하면서 NPU 중요성이 더욱 커지고 있다고 입을 모았다. GPU 중심 AI 인프라가 막대한 전력과 운영 비용 부담으로 이어지면서 저전력·고효율 구조를 구현할 수 있는 추론 특화 반도체 수요가 빠르게 확대될 것이란 전망이다. 김광정 리벨리온 리더는 "AI 서비스 관점에서 비전부터 코드 에이전트까지 다양한 버티컬 서비스를 지원할 수 있는 추론 인프라가 중요해지고 있다"며 "효율적으로 AI 추론 서비스를 제공하는 것이 핵심 경쟁력이 될 것"이라고 말했다. 조영진 퓨리오사AI 부사장은 "최신 GPU는 전력 소모가 워낙 커 데이터센터 자체를 새롭게 지어야 하는 수준"이라며 "초기에는 단순 처리량 중심 경쟁이었다면 이제는 전성비와 총소유비용(TCO)을 중요하게 보는 방향으로 시장이 바뀌고 있다"고 설명했다. 윤상현 모빌린트 최고전략책임자(CSO)는 "우리는 데이터센터보다는 엣지와 온디바이스 환경에 맞춘 NPU를 개발하고 있다"며 "피지컬 AI 시대에 맞는 저전력·고효율 AI 반도체 경쟁력이 중요해질 것"이라고 강조했다. 연사들은 AI 인프라 시장 경쟁 구도가 단순 연산 성능 중심에서 운영 효율과 서비스 비용 경쟁 단계로 빠르게 이동하고 있다고 진단했다. AI 모델 규모가 커질수록 메모리 비용 부담이 핵심 변수로 떠오르고 있는 데다 기업 고객들도 이제는 단순 성능보다 토큰당 비용과 운영 효율성을 중요하게 보기 시작했다는 설명이다. 현장에선 AI 메모리 수급 불안과 비용 부담도 주요 화두로 떠올랐다. 김 리더는 메모리 가격이 지난해 대비 4배 가까이 상승했다고 언급했고 조 부사장 역시 GPU 전력 비용과 데이터센터 증설 부담이 AI 시장 핵심 변수로 떠오르고 있다고 진단했다. 특히 엣지 AI 시장에선 성능뿐 아니라 전력과 가격까지 동시에 만족해야 하는 구조적 한계가 커지고 있다는 분석도 나왔다. 연사들은 제한된 환경 안에서 AI 모델을 얼마나 효율적으로 경량화·양자화할 수 있느냐가 향후 핵심 경쟁력이 될 것으로 내다봤다. 또 수천 개 GPU와 NPU를 병렬로 연결하는 초대형 AI 인프라 시대가 열리면서 인터커넥트와 시스템 아키텍처 경쟁력이 AI 반도체 산업 핵심 변수로 떠오르고 있다고 강조했다. 조 부사장은 "현재 엔비디아와 가장 큰 격차는 인터커넥트와 시스템 기술"이라며 "국내 기업들도 이 부분에 대한 투자를 빠르게 확대하고 있다"고 말했다. 김 리더도 "글로벌 시장에서 경쟁하기 위해선 칩 성능만이 아니라 오픈소스 기반 소프트웨어 스택과 AI 프레임워크를 얼마나 잘 결합할 수 있느냐가 중요하다"며 "칩렛 기반 아키텍처와 네트워크 프로토콜 분야 투자를 지속 강화하고 있다"고 밝혔다. 국산 AI 반도체 기업들은 엔비디아를 단순 경쟁 상대가 아닌 AI 생태계를 키운 협력자이자 동시에 넘어야 할 대상으로 바라봤다. 연사들은 정부 지원이 국내 NPU 기업 성장 과정에서 중요한 역할을 했다고 평가하면서도 장기적으로 글로벌 시장에서 독자 경쟁력을 확보해야 한다고 강조했다. 특히 IT 시장이 과거 메인프레임 중심 구조에서 PC·모바일 중심으로 세분화된 것처럼 앞으로 AI 반도체 시장 역시 추론·엣지·온디바이스·피지컬 AI 등으로 빠르게 분화될 것으로 전망했다. 이에 국산 NPU 기업들도 특정 영역 중심으로 차별화 전략을 구축하면 충분히 글로벌 경쟁력을 확보할 수 있다는 기대감도 나타냈다. 조 부사장은 "현재 엔비디아와 직접 정면 승부를 벌이기보다는 추론 시장에서 차별화된 포지셔닝 전략으로 경쟁력을 확보하는 데 집중하고 있다"며 "10년 뒤에는 국내 AI 반도체 기업들이 세계 최고 수준 기업으로 성장할 수 있을 것으로 믿는다"고 말했다. 윤 CSO는 "온디바이스와 피지컬 AI 시장은 앞으로 빠르게 성장할 영역"이라며 "국내 기업들이 정부 지원을 기반으로 초기 시장을 선점한다면 글로벌 시장에서도 충분히 기회를 만들 수 있을 것"이라고 말했다. 김 리더는 "AI 시장은 특정 기업 중심 독과점 구조보다는 다양한 협력자와 생태계가 공존하는 방향으로 발전할 가능성이 크다"며 "국산 NPU 기업들도 글로벌 AI 생태계 안에서 의미 있는 역할을 차지할 수 있을 것"이라고 밝혔다.

2026.05.28 16:22한정호 기자

"제조업 AX 성패, 암묵지 표준화에 달렸다"

국내 제조업의 인공지능 전환(AX)을 고도화하기 위해 이질적 데이터를 규격화하고, 사후학습을 지원하는 신경망처리장치(NPU) 개발이 시급하다는 지적이 나왔다. 단순한 디지털 전환(DX)을 넘어 인공지능(AI) 중심 완전 자동화를 구현하려면 현장 숙련공의 노하우인 '암묵지'를 데이터화하고, 이를 저비용·고효율로 학습할 수 있는 국산 반도체 생태계가 뒷받침돼야 한다는 내용이다. 차석근 첨단제조표준화포럼 위원장은 27일 서울 양재에서 개최된 '2026 시스템-반도체 포럼'에서 "이제는 DX를 넘어 AX로 나아가야 할 때"라며 "AX 성패는 결국 생산현장에서 다이내믹하게 움직이는 유효 데이터를 어떻게 수집하고 활용하느냐에 달려 있다"고 강조했다. 차 위원장은 "센싱 기술로 현장에 숨어 있는 암묵지 데이터를 끌어올려야 하고, 이를 위해 제각각인 생산현장 데이터를 표준화하는 작업이 선행돼야 한다"고 설명했다. 현재 제조현장의 실제 의사결정은 표준작업지침서(SOP) 같은 형식지보다 오랜 경험을 가진 숙련자 감에 크게 의존하고 있다. 차 위원장은 "베테랑 작업자들은 설비에서 발생하는 미세한 진동음, 제품의 색상 변화, 당일 습도 등 정형화되지 않은 조건을 종합 판단해 공정 변수를 미세 조정한다"고 말했다. 문제는 이러한 판단의 근거가 문서화되지 않아 데이터화하기 까다롭다는 점이다. 불량 예측, 수율 최적화, 이상 탐지 등 AI를 통해 달성하고자 하는 고부가가치 자동화 영역이 바로 이 암묵지에 집중돼 있다는 점이 제조업 AX의 가장 큰 난제다. 차 위원장은 발표자료에서 "기존 형식지만 AI에 학습시킬 경우 현장의 단편적 공정만 자동화될 뿐, 제조업의 핵심 가치를 AI 모델에 담기 어렵다"고 덧붙였다. 업계는 암묵지를 기계가 인식할 수 있는 구조화·표준화된 데이터 형태로 번역하고, 이를 기반으로 생산공정을 100% 자동화하는 데 역량을 집중하고 있다. 제조 데이터의 높은 이질성은 걸림돌이다. 공장 내부에는 여러 벤더의 설비와 서로 다른 세대 장비가 혼재돼 있다. 통신 프로토콜과 단위, 샘플링 주기, 태그 명명 규칙 등이 제각각 얽혀 있다. 이에 따라 일정한 규격에 맞춰 암묵지를 정제하는 표준화 프로세스가 필수다. "피지컬 AI 시대, 학습 가능한 NPU가 핵심" 포럼에서는 '학습 기능'을 내장한 NPU 개발 필요성도 논의됐다. 장성준 한국전자기술연구원(KETI) 센터장은 "현재 시장에 나와 있는 NPU가 주로 추론 기능에 초점이 맞춰져 있는 것은 사실이지만, 미래에는 NPU가 학습 기능까지 수행하는 방향으로 나아가지 않을까 한다"고 전망했다. 장 센터장은 "로봇 파운데이션 모델은 범용 작업에 특화돼 새로운 작업에 직면했을 때는 제대로 대응하지 못할 가능성이 크다"며 "생산현장에서 발생하는 소량 샘플 데이터만으로도 실시간 학습을 수행할 수 있는 능력이 필수이고, 이때 온디바이스 NPU나 그래픽처리장치(GPU)가 경량 학습을 지원할 수 있어야 한다"고 짚었다. 아울러 제조현장 내 온프레미스 환경에서 사후학습과 파인튜닝(미세조정) 역할이 커지고 있다고 덧붙였다. 그는 "중앙 GPU 데이터센터에서 1차로 학습된 거대 모델을 가져와 각 팩토리의 고유 데이터에 맞게 파인튜닝하는 과정이 핵심"이라며 "이 과정에서 NPU가 같이 학습을 담당할 수 있으면 총소유비용(TCO)이 절감될 것"이라고 설명했다. 다만 장 센터장은 "현재 국내 반도체 생태계에는 학습 기능을 지원하는 토종 NPU가 전무한 실정"이라며 "아마존웹서비스(AWS)의 트레이니움이나 구글의 텐서처리장치(TPU)처럼 국내에서도 학습을 지원하는 NPU가 나와야 한다"고 말했다.

2026.05.27 14:09진운용 기자

'AI 거품설' 일축...엔비디아 "AI 투자 3조 달러 시대 온다"

"에이전틱 AI 시대에 접어들어 AI가 실제로 생산적이고 가치 있는 일을 수행하기 시작했다. 연산 역량이 매출과 영업이익에 직결되는 시대가 왔다. 토큰이 수익을 내고 주요 AI 기업들이 더 많은 서비스를 생산하기 위한 경쟁에 돌입했다." 20일(현지시간) 1분기(2~4월, 회계연도 기준 2027년 1분기) 실적 발표 이후 진행된 컨퍼런스콜에서 젠슨 황 엔비디아 CEO가 이렇게 강조했다. 이날 엔비디아가 공개한 1분기 매출은 816억 1500만 달러(약 122조 2503억원)로 전년 동기(440억 달러) 대비 85% 늘어났다. 영업이익은 535억 달러(약 80조 1371억원)로 전년 동기(187억 달러) 대비 세 배 이상 늘어났다. 젠슨 황 CEO는 "현재 AI 인프라 수요는 포물선 형태로 늘어나고 있다. 엔비디아는 모든 프론티어 AI 모델을 지원하는 유일한 플랫폼이며 하이퍼스케일 클라우드뿐 아니라 AI 네이티브 클라우드, 소버린 AI, 산업용 AI, 로보틱스까지 모두 지원한다"고 강조했다. "차세대 GPU '베라 루빈', 올 3분기부터 공급 시작" 이날 콜렛 크레스 엔비디아 최고재무책임자(CFO)는 "베라 루빈 출하는 올 3분기부터 시작해 4분기부터 대량 생산에 들어간다. 내년 1분기에는 큰 규모의 매출이 일어날 것"이라고 설명했다. 이어 "이미 주요 고객들의 주문 계획이 확정된 상태이며 수요 역시 충분히 확보됐다. 현재는 복잡한 시스템 조립과 생산 타이밍이 핵심 변수"라고 덧붙였다. 젠슨 황 CEO도 "모든 선도 AI 모델 기업이 베라 루빈을 도입할 것으로 예상된다. 베라 루빈은 블랙웰보다 더 성공적인 제품이 될 것"이라고 강조했다. 베라 루빈은 Arm 기반 88개 코어 탑재 CPU인 '베라'와 GPU '루빈'으로 구성된다. 엔비디아는 전 세대와 달리 올해부터는 베라 CPU를 별도로 분리해 공급할 예정이다. 젠슨 황 CEO는 "수십억 개 AI 에이전트가 등장하면 이들이 사용하는 도구와 오케스트레이션 작업은 CPU가 담당하게 된다. 올해 CPU에서 200억 달러 매출이 예상된다"고 설명했다. "AI 투자, 연 3조 달러 규모 간다" 젠슨 황 CEO는 글로벌 클라우드 업체와 하이퍼스케일러의 투자 규모에 대해서 낙관론을 내놨다. 그는 "애널리스트들은 하이퍼스케일러 투자가 내년 1조 달러에 달할 것이며 장기적으로는 3~4조 달러까지 지속 성장할 것"이라고 말했다. 그는 “AI 기업들은 과거 SaaS 기업들이 10년 걸려 달성했던 성장을 단 몇 달 만에 만들어내고 있다”며 “AI는 엄청난 수준의 컴퓨팅을 필요로 한다”고 설명했다. 특히 엔비디아는 향후 AI 데이터센터 시장이 단순 하이퍼스케일러를 넘어 산업·기업·국가 단위로 확대될 것으로 전망했다. 젠슨 황 CEO는 "현재 두 번째 시장군인 AI 네이티브 클라우드, 엔터프라이즈, 산업용 AI, 소버린 AI 시장이 매우 빠르게 성장하고 있다. 장기적으로 이 시장 규모가 하이퍼스케일러 시장보다 더 커질 가능성이 높다"고 말했다. "피지컬 AI와 로보틱스·추론 시장 확대 전망" 젠슨 황 CEO는 향후 AI 시장의 중심 축이 피지컬 AI와 로보틱스로 확장될 것으로 전망했다. "전 세계 수십만 개 기업들이 자체 AI 팩토리를 구축하게 될 것이며 특히 제조·산업 분야는 클라우드가 아닌 온프레미스 인프라가 필요하다"고 강조했다. 그는 "앞으로 수십억 개의 자율주행·로봇 시스템이 실제 세계에서 작동하는 시대가 올 것이며 엔비디아는 30년에 걸쳐 컴퓨팅 플랫폼을 구축해왔다"고 말했다. 젠슨 황 CEO는 추론 시장 점유율 확대도 전망했다. 그는 "올해 앤트로픽과 전략적 협력을 시작했고 AWS, 마이크로소프트 애저, 코어위브 등 다양한 클라우드 사업자를 통해 대규모 컴퓨팅 용량을 공급하고 있다"고 설명했다. "미국 정부 승인에도 중국 GPU 사업 여전히 불투명" 젠슨 황 CEO는 지난 주 미-중 정상회담 당시 도널드 트럼프 미국 대통령 전용기에 함께 탑승해 중국 베이징으로 향했다. 정상회담 직후 로이터통신은 "미국 상무부가 알리바바, 텐센트, 징둥닷컴 등 중국 기업 10여 곳에 H200 GPU 공급을 승인했다"고 보도했다. 그러나 콜렛 크레스 CFO는 "실제로 매출은 발생하지 않았다. 중국 정부의 수입 허가 여부도 불확실하다. 이 때문에 지난 분기와 마찬가지로 이번 가이던스에도 중국 시장 매출은 포함하지 않았다"고 설명했다.

2026.05.21 07:56권봉석 기자

한미마이크로닉스, 'AI 엑스포'서 전원·냉각 솔루션 전시

한미마이크로닉스가 6일부터 8일까지 서울 코엑스에서 열리는 'AI 엑스포' 행사에 참가해 글로벌 파트너 협력 기반의 전원 및 쿨링 인프라를 전시한다. 한미마이크로닉스는 올해 행사에서 자체 개발한 7U 규모 AI 추론용 서버 'GSR7 P2G8M24'를 공개한다. GPU 최대 8개를 탑재 가능하며 핫스왑 기반 스토리지와 이중화 전원 설계를 통해 안정적인 운용이 가능하다. 멀티 GPU 구성이 가능한 타워형 워크스테이션 'GSW P2G4M16', 고부하시 안정적 냉각이 가능한 서버 솔루션 'GSR4 P1G8M32'도 전시된다. 글로벌 전원 기업 '그레이트월', 서버·스토리지 솔루션 제조사 '실버스톤'이 공급하는 AI·서버·워크스테이션 환경에 적합한 전원 및 시스템 인프라 구성도 함께 전시된다. '그레이트월 GB300 파워셸프'는 엔비디아 블랙웰 GB300 GPU를 겨냥한 랙 단위 전원 솔루션이다. 5.5kW급 고효율 전원 모듈을 조합해 최대 33kW까지 구성이 가능하다. 핫스왑 기능으로 시스템 가동중 유지보수가 가능하며 원격 관리 기능, 보안 부팅을 지원한다. 실버스톤 CS383은 8베이 핫스왑 스토리지를 지원하는 PC 케이스로 대용량 데이터가 담긴 기업용 하드디스크 드라이브를 필요에 따라 간편하게 교체할 수 있다. SSI-EEB 규격 메인보드와 듀얼 PSU 구성을 지원해 확장성과 안정성을 동시에 확보했다. 이와 함께 다수의 냉각 팬 및 라디에이터 구성을 지원해 장시간 고부하 환경에서도 안정적인 열 관리를 구현했다. 박정수 한미마이크로닉스 사장은 "안정적인 전원 공급과 냉각은 AI 및 고성능 컴퓨팅 환경의 핵심 요소로 이번 전시 참가를 통해 다양한 산업군과의 협력 기회를 확대해 나갈 것"이라고 밝혔다.

2026.05.06 10:47권봉석 기자

딥시크, V4 모델 공개…"저비용 AI로 경쟁력 강화"

딥시크가 저비용·고성능 전략을 앞세운 인공지능(AI) 모델을 새로 내놔 기술 경쟁력 강화에 나섰다. 딥시크는 24일 거대언어모델(LLM) '딥시크 V4' 프리뷰 버전을 공개했다고 밝혔다. 모델은 프로와 플래시 두 가지 버전으로 제공된다. 이번 모델은 이전과 동일하게 오픈소스로 공개됐다. 사용자는 해당 모델 기능과 성능을 직접 시험할 수 있다. 개발자가 코드를 내려받아 수정하고 로컬 환경에서도 이를 실행할 수 있다. 딥시크는 이번 모델이 에이전트 기반 작업과 지식 처리 추론 영역에서 경쟁사 대비 높은 성능을 확보했다고 설명했다. V4는 특히 추론 비용 절감에 초점 맞춘 것으로 나타났다. 추론 비용은 AI 모델을 실제로 실행해 결과를 생성할 때 드는 컴퓨팅과 비용을 의미한다. 딥시크는 해당 모델이 앤트로픽 '클로드 코드'와 '오픈클로' 등 에이전트 도구 가능하다고 밝혔다. 벤치마크 기준으로는 낮은 비용 대비 높은 에이전트 성능을 보일 가능성도 알렸다. 딥시크는 2024년 V3 모델 출시에 이어 2025년 R1 모델을 통해 시장 주목을 받았다. R1이 낮은 성능 칩으로 약 2개월 만에 600만 달러 미만 비용으로 개발됐다는 주장 때문이다. 다수 외신은 이번 V4가 시장에 미치는 충격이 R1 수준에는 미치지 못할 것으로 분석했다. 이미 투자자들이 중국 AI 경쟁력과 비용 우위를 일정 부분 반영했기 때문이다. 업계에선 V4 출시 뒤 중국 내 AI 경쟁은 더욱 치열해질 것이란 전망이 나오고 있다. CNBC는 "알리바바와 바이트댄스 등 주요 기업이 잇따라 모델을 출시하며 딥시크와 직접 경쟁 구도를 형성하기 시작했다"고 보도했다. V4 학습에 사용된 칩 역시 주요 변수로 꼽힌다. 화웨이는 어센드 AI 프로세서 기반 클러스터가 V4를 지원할 수 있다고 밝혔지만 실제 학습 과정에서의 사용 비중은 공개되지 않은 상태다. 중국은 미국의 수출 규제로 엔비디아 최신 칩 확보에 제약을 받아왔다. 이에 따라 정부는 자국 반도체 사용을 확대하며 AI 주권 확보에 속도를 내고 있다. 웨이 쑨 카운터포인트 리서치 수석 AI 애널리스트는 "V4가 훨씬 낮은 비용으로 뛰어난 에이전트 역량을 제공할 수 있을 것"이라며 "글로벌 AI 개발 속도 향상을 도울 것"이라고 CNBC를 통해 밝혔다.

2026.04.25 17:11김미정 기자

  Prev 1 2 3 4 5 Next  

지금 뜨는 기사

이시각 헤드라인

정부, 서남권에 메모리 팹 4기 구축…5년 내 생산 능력 2배로 키운다

최태원 "AI 데이터센터·반도체에 2100조원 빅베팅"

2년 만에 AI 유니콘 반열 '젠스파크'…한·일 엔터프라이즈 AI 플랫폼 정조준

이재용 "새 팹 후보지 광주 고려"…최태원 "용인 클러스터 12년 앞당겨"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.