• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX-A100 GPU'통합검색 결과 입니다. (491건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

라인게임즈, 에이수스와 맞손…신작 '엠버 앤 블레이드' 에디션 그래픽카드 공개

라인게임즈가자체 개발 신작의 출시를 앞두고, 에이수스와 함께 협업 제품을 선보인다. 라인게임즈(공동대표 조동현·배영진)는 에이수스 코리아와 협력해 신작 '엠버 앤 블레이드' 에디션 게이밍 그래픽카드를 출시했다고 29일 밝혔다. 이번에 공개된 한정판 상품은 'ASUS 라데온 DUAL RX 9060 8G Ember and Blade 에디션 게이밍 그래픽카드'다. '라데온 DUAL RX 9060 GPU'을 기반으로 신작만의 독창적이고 상징적인 비주얼 디자인을 제품 외관에 녹여낸 것이 특징이다. 해당 에디션 제품은 전자제품 전문 쇼핑몰인 다나와와 컴퓨존을 비롯해 11번가, G마켓, 네이버 쇼핑 등 국내 주요 오픈마켓 플랫폼을 통해 편리하게 구매할 수 있다. 아울러 해당 제품 구매 시 제품에 동봉된 엠버 앤 블레이드 캐릭터 스티커와 게임 코드가 제공된다. 이용자는 추후 게임 서비스 시작에 맞춰 해당 코드를 활용해 플레이를 즐길 수 있다. 엠버 앤 블레이드는 개성 있는 그래픽과 박진감 넘치는 액션 등을 통해 에픽게임즈 스토어가 선정한 올해 기대되는 신작 타이틀 20선에 선정된 바 있다. 라인게임즈는 PC 플랫폼인 스팀과 에픽게임즈 스토어는 물론, 콘솔 플랫폼인 플레이스테이션5까지 발매 라인업을 확장했다. 올 하반기 앞서 해보기 버전을 우선 출시하며 글로벌 시장 공략의 첫 발을 뗼 예정이다.

2026.06.29 17:30진성우 기자

인텔, 자체 개발 에이전틱 AI 플랫폼 '슈퍼클로' 베타 공개

인텔이 기업 환경을 겨냥한 에이전틱 AI 플랫폼 '슈퍼클로' 베타 버전을 공개하고 오는 7월 정식 출시한다. 슈퍼클로는 오픈소스 프로젝트 '오픈클로'와 달리 인텔 내부에서 처음부터 자체 개발한 우분투 리눅스 기반 플랫폼이다. 기업 내부에서 거대언어모델(LLM)과 에이전틱 AI를 안전하고 비용 효율적으로 활용하는 데 초점을 맞췄다. 로컬 AI와 검색증강생성(RAG)을 결합하면서도 민감한 데이터를 클라우드로 보내지 않고 기업 내 방화벽에서 자체 처리한다. 또 이용자별 가상 컨테이너를 통해 보안성과 작업 연속성도 강화했다. 인텔은 컴퓨텍스 타이베이 2026에서 아크 프로 B70 기반 워크스테이션과 팬서레이크 노트북을 활용한 시연을 진행했으며, 윈도용 베타 버전을 공개한 데 이어 오는 7월 정식 출시할 예정이다. 인텔 자체 개발... 아크 GPU에 최적화 슈퍼클로는 인텔이 개인용 PC와 워크스테이션을 위해 개발중인 에이전틱 AI 플랫폼이다. 오픈소스 에이전틱 AI 플랫폼 '오픈클로', 이를 기반으로 파생된 엔비디아 '네모클로'와 이름은 비슷하지만 내용물은 전혀 다르다. 인텔 관계자는 "슈퍼클로는 처음부터 인텔이 자체 개발한 코드를 바탕으로 설계했고 오픈클로와 전혀 관계가 없다. 다만 유사한 기술임을 알리기 위해 이름만 비슷하게 가져온 것"이라고 설명했다. 또 GPU 없이 순수 CPU만 있어도 구동이 가능한 오픈클로와 달리 인텔 아크 GPU에 최적화됐다. 워크스테이션·일반 소비자용 아크 GPU, 또는 코어 울트라 프로세서에 내장된 내장 GPU가 반드시 필요하다. 기업이나 조직 내 안전한 AI 활용에 중점 오픈클로와 슈퍼클로가 겨냥하는 플랫폼에도 차이가 있다. 오픈클로는 개인이 미니PC나 노트북에서 여러 반복된 작업을 자동화할 수 있도록 설계됐다. 반면 슈퍼클로는 기업이나 조직 내 AI 활용을 염두에 두고 도커 등 가상화까지 시야에 넣었다. 강력한 GPU를 내장하지 못한 노트북으로 기업이나 조직 내 서버나 워크스테이션에서 거대언어모델(LLM)을 실행하도록 했다. 챗GPT나 제미나이, 클로드 등 클라우드 기반 LLM 대비 일정한 이점을 준다. 클라우드 서비스에 무심코 입력하는 대외비 정보나 개인정보 유출, LLM이 학습하지 못한 정보를 기반으로 인사이트를 얻기 위한 검색증강생성(RAG)시 위험을 최소화할 수 있는 방식이다. 인텔 관계자는 "외부 AI 서비스 활용시 비용과 토큰을 아끼기 위해 기본적으로는 성능이 뛰어난 로컬 AI 모델을 우선한다. 그러나 외부 데이터가 필요하거나 AI 서비스 접근이 필요하면 이용자가 이를 선택할 수 있다"고 설명했다. 컴퓨텍스서 아크 프로 B70 기반 시연 진행 인텔은 이달 초 '컴퓨텍스 타이베이 2026' 기간 중 아크 B70 GPU 탑재 워크스테이션과 코어 울트라 시리즈3(팬서레이크) 노트북에서 구동되는 슈퍼클로를 시연했다. 워크스테이션은 작년 인텔이 공개한 아크 프로 B시리즈 플랫폼 '프로젝트 배틀매트릭스'를 바탕으로 했다. Xe2 코어 32개와 32GB 메모리를 탑재한 아크 프로 B70 GPU 4개를 장착해 800억 개 매개변수 내장 모델 'Qwen3-Coder-Next-80B'를 구동했다. 당시 현장 인텔 관계자는 "널리 알려진 AI 서비스는 이용자가 그동안 주고 받은 대화 내용이나 지시한 작업에 대해 연속성 있는 결과물을 주지 못한다"고 지적했다. 이어 "슈퍼클로는 이런 단점을 보완해 작업 이력, 대화의 문맥을 추적해 보안 걱정 없는 AI 서비스를 제공하는 것이 목표"라고 설명했다. 가상 컨테이너로 보안 강화... 7월 출시 예정 슈퍼클로는 이용자별 가상 컨테이너 할당 기능도 가지고 있다. 이는 정보보호나 보안, 시스템 안정성 면에서도 일정한 이점을 지닌다. AI 에이전트가 수행하는 작업이 다른 이용자의 작업까지 영향을 미치거나 전체 작업을 날리는 치명적인 오류를 막을 수 있다. 인텔은 현재 아크 프로 B70이 장착된 워크스테이션에서 구동되는 슈퍼클로 서버, 그리고 여기에 접근할 수 있는 윈도용 슈퍼클로 앱 베타 버전을 공개했다. 정식 버전은 7월 출시를 앞두고 있다. 코어 울트라 시리즈3는 Xe3 코어 기반 아크 B390 등 강력한 GPU로 LLM 구동이 가능하다. 64GB 메모리를 탑재한 고성능 노트북을 위한 단독 버전도 추후 출시 예정이다.

2026.06.29 15:43권봉석 기자

K-AI 모델 현장 확산 '속도'…방송 제작부터 공공행정·반도체까지

한국 기업이 독자 인공지능(AI) 모델 산업·공공 현장 적용 사례를 넓혀 K-AI 생태계 확산에 속도를 내고 있다. 과학기술정보통신부는 NC AI를 비롯한 업스테이지, KT, SK텔레콤이 방송 콘텐츠 제작부터 공공 업무 효율화, 지방자치단체 행정 AI 전환, 국산 AI 반도체 기반 모델 구동 분야에 K-AI를 적용한다고 29일 밝혔다. NC AI는 MBC 손잡고 방송 콘텐츠 후반 제작 과정에 멀티모달 AI 기술을 도입한다. 그동안 방송산업은 촬영 후 편집과 자막 삽입 등 포스트 프로덕션 과정을 수작업에 의존했다. 이에 NC AI는 시각언어모델 등 멀티모달 기술을 활용해 편집과 자막 삽입 업무의 비효율을 줄이고 전체 제작 공정을 단축할 계획이다. 방송 제작진이 기획과 연출 등 창의적 업무에 더 집중할 수 있도록 지원한다는 구상이다. 업스테이지는 조달청과 공공 업무용 생성형 AI 업무 지원 서비스 공급 계약을 맺고 조달청 공급사로 선정됐다. 업스테이지는 '솔라' 모델과 광학문자인식(OCR) 기반 문서처리 AI 기술을 에이전트로 통합한 '공공 AI 워크스페이스'를 조달청 디지털서비스몰에 등재했다. 공공 AI 워크스페이스는 한글 파일과 워드, PDF 등 문서 형식을 지원한다. 문서 작업 비중이 큰 공공 업무망에서도 안전하고 신속하게 AI를 적용해 업무 생산성과 효율성을 높이는 데 기여할 것으로 기대된다. KT는 경기도청 '경기 생성형 AI 플랫폼 구축' 사업을 통해 공공행정 AI 전환 기반을 마련하고 있다. 이 사업에는 KT가 독자 기술로 처음부터 개발한 AI 모델 '믿음 2.0'과 행정 분야 특화 데이터 체계 구축, 그래픽처리장치(GPU) 기반 AI 인프라 통합형 플랫폼 구현 등이 포함됐다. 경기 생성형 AI 플랫폼은 여러 AI 모델을 적용할 수 있는 개방형 플랫폼 구조로 구축된다. 행정문서를 비롯한 업무지침, 법령, 제도자료 등 행정 정보를 활용해 문서 작성, 자료 정리, 정보 검색, 분석 기능을 제공하고 행정업무 수행을 지원할 예정이다. 경기도는 우리 AI 모델 기반으로 '경기도 생성형 AI 플랫폼 v1.0'과 'AI 거버넌스'에 대한 한국정보통신기술협(TTA) 인증도 받았다. 이를 통해 AI 서비스 신뢰성·안전성과 운영체계에 대한 객관적 검증을 확보했다. SK텔레콤과 리벨리온은 독자 AI 파운데이션 모델 프로젝트 일환으로 SK텔레콤 AI 모델 'A.X K1'을 리벨리온 서버에서 구동했다. 해당 서버에는 국산 AI 반도체 '리벨100'이 탑재됐다. 두 기업은 5천억 파라미터 이상 초거대 모델도 국산 AI 반도체 인프라에서 운영 가능하다는 점을 확인했다. 양사는 지난해부터 에이닷 통화 녹음 요약과 엑스칼리버 등 SK텔레콤 대규모 AI 서비스를 리벨리온 신경망처리장치(NPU)로 운영해 왔다. 이번 사례는 독자 AI 모델과 국산 AI 반도체가 실제 서비스 환경에서 작동할 수 있음을 보여준 결과다. 나아가 SK텔레콤과 리벨리온은 글로벌 반도체 기업 Arm의 중앙처리장치(CPU)와 리벨리온 NPU를 결합한 AI 서버를 공동 개발하고 SK텔레콤 데이터센터에서 실전 검증하고 있다. 정부는 이를 통해 소버린 AI 인프라의 글로벌 표준 정립 가능성도 기대하고 있다. 고현웅 업스테이지 모델테크 매니저는 "AI는 이미 일하는 방식과 산업의 기준을 빠르게 바꾸고 있다"며 "앞으로 기술 경쟁력을 지속적으로 고도화해 우리나라 AI 기술이 다양한 산업 현장에서 실질적인 혁신과 가치를 만들어낼 수 있도록 노력할 것"이라고 밝혔다.

2026.06.29 09:29김미정 기자

"AI 전력 소비 1000분의 1로 줄인다"…신형 AI 아키텍처 등장

생성형 인공지능(AI) 확산으로 데이터센터 전력 소비가 급증하는 가운데, AI 전력 사용량을 현재 대비 1000분의 1 수준으로 줄이겠다는 목표를 제시한 차세대 컴퓨팅 아키텍처가 등장했다. 28일 데이터브릭스 AI 부문 총괄 출신 나빈 라오 최고경영자(CEO)가 설립한 언컨벤셔널AI는 지난 25일 첫 번째 AI 모델 'Un-0'를 공개했다. 언컨벤셔널AI는 새로운 컴퓨팅 아키텍처를 통해 AI 추론에 필요한 전력 소비를 최대 1000배까지 줄일 수 있다고 주장했다. 현재 챗GPT를 비롯한 대부분의 생성형 AI는 엔비디아 GPU 수천~수만 개를 동원해 연산을 수행한다. AI 모델이 커질수록 전력 소비도 급격히 증가한다. 이로 인해 업계에서는 앞으로 AI 발전을 가로막는 가장 큰 문제가 반도체 부족이 아니라 전력 부족이 될 수 있다는 우려도 커지고 있다. 언컨벤셔널AI는 문제의 원인을 GPU 성능이 아닌 컴퓨터 구조 자체에서 찾았다. 더 많은 GPU를 사용하는 대신 계산하는 방식 자체를 바꾸겠다는 것이다. 회사가 공개한 Un-0는 이미지를 생성하는 AI 모델이다. 아직 실제 반도체가 아닌 소프트웨어 시뮬레이션 환경에서 동작하지만 기존 AI와 다른 방식으로 이미지 생성이 가능하다는 점을 보여주는 데 의미가 있다. 핵심은 '오실레이터'라 불리는 진동 기반 물리 시스템이다. 컴퓨터 칩 안의 트랜지스터가 계산을 수행하는 대신 여러 진동 장치가 서로 영향을 주고받으며 변화하는 과정 자체를 계산에 활용하는 방식이다. 언컨벤셔널AI는 자연스럽게 동기화되는 물리 현상을 계산에 활용함으로써 기존 GPU보다 훨씬 적은 에너지로 AI 연산을 수행할 수 있을 것으로 보고 있다. 나빈 라오 CEO는 "이번 모델은 새로운 종류의 컴퓨터가 보내는 첫 번째 인사"라며 "궁극적인 목표는 현재 AI 시스템보다 약 1000배 적은 에너지로 AI를 구동하는 것"이라고 밝혔다. 이 같은 비전에 투자자들도 주목하고 있다. 언컨벤셔널AI는 시드 투자 단계에서 4억7500만 달러(약 6600억원)를 유치했고, 기업가치는 45억 달러(약 6조2000억원)로 평가받았다. 세쿼이아, 안드레센 호로위츠(a16z), 럭스캐피털, 제프 베이조스 등이 투자에 참여했다. 아직 상용 제품이나 실물 칩도 없지만 AI 산업이 직면한 가장 큰 문제인 전력 문제를 해결할 수 있다는 가능성만으로 수조 원대 가치를 인정받은 셈이다. 다만 언컨벤셔널AI의 기술은 시뮬레이션 환경에서 얻어진 연구 성과로 실제 반도체와 데이터센터 환경에 대한 검증은 필요한 상황이다. 나빈 라오 CEO는 "AI 발전의 다음 과제는 성능이 아니라 에너지 효율"이라며 "단 20와트의 전력으로 작동하는 인간의 뇌처럼 적은 에너지로도 지능을 구현할 수 있는 새로운 컴퓨팅 기반을 구축하고 있다"고 말했다. 이어 "궁극적으로는 AI를 더 저렴하고 접근하기 쉬운 기술로 만들어 모든 사람이 그 혜택을 누릴 수 있도록 하는 것이 목표"라고 덧붙였다.

2026.06.28 07:41남혁우 기자

[ZD SW 투데이] 정철 나무기술 대표, '정보인의 날' 공로상 外

지디넷코리아가 소프트웨어(SW) 업계의 다양한 소식을 한 눈에 볼 수 있는 'ZD SW 투데이'를 새롭게 마련했습니다. SW뿐 아니라 클라우드, 보안, 인공지능(AI) 등 여러 분야에서 활발히 활동하고 있는 기업들의 소식을 담은 만큼 좀 더 쉽고 편하게 이슈를 확인해 보시기 바랍니다. [편집자주] ◆정철 나무기술 대표, '정보인의 날' 공로상 수상 정철 나무기술 대표가 서울 서초구 더 리버사이드호텔에서 열린 '제40회 정보인의 날 기념식'에서 한국인공지능·소프트웨어산업협회 공로상을 수상했다. 정철 대표는 엔터프라이즈 정보기술(IT) 분야에서 쌓은 기술 역량을 바탕으로 기업 현장의 AI 전환과 운영 체계 고도화를 추진해 왔다. 에이전틱 AI 플랫폼 중심 사업 확대와 공공·민간 협력을 통한 AI 활용 기반 마련, 클라우드·소프트웨어 산업 정책 제언과 생태계 활성화에 힘썼다는 평가다. 정보인의 날은 국내에 처음으로 컴퓨터가 도입된 1967년 6월 24일을 기념해 제정된 행사로, 정보통신 분야 발전에 기여한 유공자를 발굴·격려하기 위해 매년 열린다. 제40회 기념식은 한국IT전문가협회가 주최하고 한국인공지능·소프트웨어산업협회 등 10개 정보통신 관련 협·단체가 공동 주관했다. ◆솔트웨어, '공공 AI 산업 박람회'서 AI 보안 솔루션 소개 솔트웨어가 지난 23일부터 24일까지 경기 고양시 킨텍스에서 열린 '2026 공공 AI 산업 박람회(KPAIX)'에 참가해 생성형 AI 보안 솔루션 '사피가디언(Sapie-Guardian)'을 선보였다. 사피가디언은 챗GPT, 클로드 같은 서비스형소프트웨어(SaaS) AI의 입력(프롬프트)과 출력(응답) 구간에서 실시간 모니터링과 유사도 기반 필터링 기능을 제공한다. 이를 통해 개인정보와 내부 업무자료, 기밀 데이터 등 민감정보의 외부 유출을 막고 AI 사용 정책 수립과 운영 현황 관리 기능으로 공공기관의 안전한 AI 도입을 지원한다. 솔트웨어는 현장에서 데이터 유출 시나리오와 보안 통제 과정을 시연했다. 부스를 방문한 공공기관 정보화 담당자 및 디지털 혁신 관계자들과의 상담도 진행했다. ◆디딤, 'K-AI PaaS 서밋'서 AIOps 위한 하네스 운영 전략 발표 디딤이 한국인공지능클라우드산업협회(KACI)가 주최한 'K-AI PaaS 서밋 2026'에 참가해 인공지능 기반 IT운영(AIOps) 구현을 위한 '하네스(Harness)' 도입·운영 전략을 발표했다. 발표자로 나선 장정호 디딤 AX연구1센터장은 클라우드 환경의 복잡도와 운영 데이터가 급증하면서 관리서비스업체(MSP) 관점에서 AIOps 도입이 핵심 경쟁력이라고 강조했다. 다만 검증 없이 AI에 시스템 변경 권한을 전적으로 위임할 경우 오조치로 인한 장애 등 위험을 초래할 수 있다고 지적했다. 디딤이 제시한 해법은 통제된 자율을 구현하는 하네스 체계로, AI 에이전트 계층과 실제 인프라 실행 계층 사이에 운영자가 설계한 정책과 구조를 두는 전략이다. 디딤의 하네스 전략은 안전 게이트(쓰기 작업 전 검증), 멀티테넌시(고객 간 자격증명 격리), 감사 추적(모든 행위 기록) 등 3대 정책을 강제한다. 디딤은 검증된 권한만 단계적으로 허용하는 '통제형 자동화 아키텍처'로서의 하네스 실현 방안과 고객별 운영 정책 커스터마이징 전략도 소개했다. ◆한국데이터센터연합회, 데이터센터 역량강화 교육 2차 과정 모집 한국데이터센터연합회(KDCC)가 급변하는 데이터센터 산업 환경에 대응하고 현장 중심 전문인력을 양성하기 위해 '데이터센터 역량강화 교육' 2차 과정을 개설했다. 이 교육은 유료 과정으로 올해 총 3회 운영되며 지난달 열린 1차 교육은 모집 정원이 조기 마감됐다. 2차 교육은 다음달 22일과 23일 서울역 삼경교육센터에서 진행되고 3차 교육은 10월로 예정됐다. 한국데이터센터연합회는 이번 과정을 공통 분야인 데이터센터 시장 현황·정책·제도와 특화 분야인 시장·기술·사례 중심으로 구성했다. 데이터센터 산업 종사자들이 단편적 기술 이해를 넘어 구축·운영·리스크관리·지속가능성 대응을 포괄하는 종합적 관점을 갖추도록 하는 데 중점을 뒀다. 교육 신청은 다음달 17일까지 한국데이터센터연합회 홈페이지의 온라인 신청서를 통해 가능하다. ◆한국컴퓨팅산업협회, 'GPU 프로그램 모델 및 최적화' 교육과정 개설 한국컴퓨팅산업협회가 다음달 '그래픽처리장치(GPU) 프로그램 모델 및 최적화' 교육과정을 개설한다. 이 과정은 과학기술정보통신부 지원으로 운영 중인 'HPC 이노베이션 허브' 일환이다. 최신 고성능컴퓨팅(HPC) 시스템 구조와 GPU 아키텍처 이해부터 오픈CL·SYCL 프로그래밍 모델, GPU 연산과 메모리 최적화, 멀티 GPU 활용, 엔사이트(Nsight) 기반 프로파일링 방법론까지 산업 현장의 요구를 반영해 구성됐다. 참가자는 GPU 아키텍처와 프로그래밍 모델을 학습하고 실습 코드에 적용해 최적화와 분석을 실시간으로 진행할 수 있다. 한국컴퓨팅산업협회는 빅데이터·AI 개발자, 시스템 엔지니어, HPC 소프트웨어 개발자를 대상으로 커리큘럼을 고도화하고 중소·스타트업이 HPC 기반 AI 신사업을 추진하도록 지원을 이어갈 방침이다.

2026.06.26 16:45이나연 기자

NHN클라우드, AI 인프라 '글로벌 톱20' 진입…"국내 최고 성능"

NHN클라우드가 글로벌 슈퍼컴퓨터 생태계에서 인공지능(AI) 인프라 역량을 인정받았다. NHN클라우드는 AI 인프라 브랜드 'NHN 팩토리X'의 그래픽처리장치(GPU) 클러스터가 최근 공개된 '글로벌 슈퍼컴퓨터 톱500'에서 국내 가장 높은 순위로 이름을 올렸다고 26일 밝혔다. 글로벌 슈퍼컴퓨터 톱500은 전 세계 슈퍼컴퓨터의 연산 성능을 측정해 순위를 발표하는 대표 성능 평가 지표다. 고성능컴퓨팅(HPC) 분야 연구기관과 전문가들이 매년 6월과 11월 최신 순위를 공개하며 글로벌 AI·과학기술 인프라 경쟁력을 가늠하는 기준으로 활용된다. NHN클라우드의 B200 GPU 4080장으로 구축한 'NIPA-CL1'은 글로벌 20위이자 국내 1위를 기록했고 B200 GPU 2040장 기반 'NIPA-CL2'는 글로벌 40위이자 국내 4위에 올랐다. 이번 GPU 클러스터는 과학기술정보통신부의 GPU 확보·구축·운용 지원사업을 통해 확보한 엔비디아 B200 GPU 7656장을 기반으로 구축됐다. NHN클라우드는 4080장 규모의 NIPA-CL1과 2040장 규모의 NIPA-CL2를 구축하며 국내 상위 5대 슈퍼컴퓨터 가운데 2대를 운영한다. NIPA-CL1은 실제 측정 최고 성능(Rmax) 기준 137.4페타플롭스(FLOPS)를 기록했다. NIPA-CL2는 68.42FLOPS를 달성했다. NHN클라우드는 광주 국가 AI 데이터센터 운영 경험을 바탕으로 GPU 클러스터링 효율을 높였다. 인피니밴드 기반 초고속 네트워크와 AI 전용 데이터센터 기술을 적용했다. AI 전용 데이터센터 '팩토리X 서울'에는 랙당 75킬로와트(kW)급 고밀도 환경을 지원하는 100% 수랭식 GPU 냉각 시스템이 적용됐다. 이를 통해 기존 공랭식 대비 인프라 안정성을 높인 것으로 전해졌다. NHN클라우드는 이번 성과가 국내 AI 인프라가 글로벌 수준에 도달했음을 보여주는 사례라고 평했다. 또 정부 AI 컴퓨팅 자원 확충 정책 성과로 해외 의존도 높던 대규모 AI 연산 인프라를 국내에서 공급할 기반을 마련했다고 강조했다. NHN클라우드는 GPU 클러스터 최적화와 수랭식 데이터센터 설계 경험을 담은 'NHN 팩토리X 기술 백서'도 공개했다. 백서에는 AI 전용 데이터센터 구조 GPU 클러스터 구성 고속 네트워크 인터커넥트 D2C(Direct-to-Chip) 수랭식 인프라 GPUaaS 플랫폼 운영 구조 엑사스케일 클러스터 구축 사례 등이 포함됐다. 김동훈 NHN클라우드 대표는 "우리가 국가 AI 인프라 확보 사업 최전선에서 활약하고 있다는 것을 증명했다"며 "뛰어난 GPU 클러스터 구축 역량을 통해 명실상부한 국내 1위 AI 인프라 운영 기업으로 우뚝 섰음을 의미한다"고 밝혔다.

2026.06.26 15:59김미정 기자

[영상] "AI 실수도 기업 책임"…생성형 AI 시대, 리스크 관리가 생존 전략

생성형 인공지능(AI)이 기업 업무와 서비스 전반으로 확산되면서 새로운 과제가 떠오르고 있다. AI가 생산성을 높이고 업무 혁신을 이끄는 동시에 잘못된 답변과 보안 문제, 예기치 못한 오작동이 기업 리스크로 직결되고 있기 때문이다. 특히 AI가 고객과 직접 소통하는 서비스 영역으로 확대되면서 기업은 단순히 모델 성능을 높이는 것을 넘어 AI가 어떤 답변을 내놓고 어떤 행동을 수행하는지까지 관리해야 하는 상황에 직면했다. 생성형 AI 도입이 실험(PoC) 단계를 넘어 실제 서비스 운영 단계로 이동하면서 'LLM 옵저버빌리티(Observability)'가 새로운 기업 IT 과제로 부상하고 있다. 고지훈 와탭랩스 애플리케이션 팀 리드와 신민철 애플리케이션 팀 개발자는 26일 지디넷코리아와의 영상 인터뷰에서 생성형 AI 시대 기업이 마주할 변화와 이에 대응하기 위한 LLM 옵저버빌리티의 중요성을 강조했다. 고 팀장은 "AI가 제공한 답변이라도 결국 고객은 기업이 제공한 공식 정보로 받아들인다"며 "AI 서비스 운영 단계에서는 응답 품질과 신뢰성을 지속적으로 관리하는 체계가 필수"라고 말했다. AI 실수, 이제는 기업이 책임져야 고 팀장은 주요 사례로 캐나다 항공사 에어캐나다를 소개했다. 한 고객이 챗봇에 할인 혜택 적용 가능 여부를 문의하자 에어캐나다의 챗봇은 실제 존재하지 않는 할인 상품을 안내했다. 고객은 이를 믿고 항공권을 구매한 뒤 할인을 요구했지만 에어캐나다가 이를 거부하면서 법적 분쟁으로 이어졌다. 캐나다 법원은 'AI가 응답한 내용이라도 게시된 정보에 대한 책임은 기업에 있다'고 판단했다. 이에 에어캐나다는 패소했고 금전적 보상은 물론 기업 신뢰도에도 타격을 입었다. 신 개발자는 "AI 챗봇의 답변이 기업의 공식 입장으로 간주되는 사례가 실제로 빈번하게 발생하고 있다"며 "잘못된 응답 하나가 직접적인 비용 손실과 브랜드 신뢰도 하락으로 이어질 수 있다"고 설명했다. 고 팀장은 "작년까지는 많은 기업이 AI를 시범 적용하는 수준에 머물렀지만 올해부터는 금융, 공공, 엔터프라이즈를 중심으로 실제 서비스에 적용하는 사례가 빠르게 늘고 있다"며 "응답 품질을 관측할 체계 없이 서비스를 출시하는 기업도 적지 않다"고 지적했다. "지표는 정상인데 고객은 불만"…AI 시대 등장한 새로운 장애 문제는 기존 모니터링으로는 AI 응답 오류를 감지할 수 없다는 점이다. 서버·네트워크 지표가 정상이어도 AI가 잘못된 답변을 내보내면 알 방법이 없다. 고 팀장은 "CPU·메모리는 정상인데 고객 불만이 폭증하는 새로운 유형의 문제가 생긴다"며 "기존 인프라 모니터링만으로는 응답 품질 이상을 잡아낼 수 없다"고 말했다. 보안 위협도 새로운 형태로 진화했다. AI 에이전트가 코드 실행·시스템 제어까지 수행하게 되면서 악의적 입력으로 AI가 의도치 않은 동작을 하도록 유도하는 '프롬프트 인젝션' 공격이 현실화됐다. 와탭랩스 내부에서도 악의적 입력 없이 AI가 잘못된 판단을 내려 개발 PC 폴더가 통째로 삭제되는 사고를 경험했다. AI 보안 위협 역시 새로운 변수로 떠오르고 있다. 신 개발자는 "과거 LLM은 단순히 텍스트를 생성하는 수준이었지만 이제는 함수 호출, 코드 실행, 외부 시스템 제어까지 가능한 에이전트 형태로 발전하고 있다"며 "프롬프트 입력 하나가 실제 시스템 동작으로 연결될 수 있다"고 설명했다. 대표적인 위협은 '프롬프트 인젝션(Prompt Injection)'이다. 이는 특정 입력을 통해 AI가 의도하지 않은 행동을 수행하도록 유도하는 공격 방식이다. 특히 AI가 다양한 시스템과 연결될수록 피해 범위도 커질 수 있다. 와탭랩스 역시 내부 실험 과정에서 예상치 못한 사례를 경험했다. 오케스트레이션 기반 AI 개발 환경을 테스트하던 중 악의적 입력이 없었음에도 AI가 잘못된 판단을 내려 개발 PC의 특정 폴더를 삭제하는 사고가 발생한 것이다. 신 개발자는 "중요한 것은 사용자가 공격 의도를 갖지 않았더라도 AI가 예기치 않은 행동을 할 수 있다는 점"이라며 "AI가 어떤 과정을 거쳐 해당 결정을 내렸는지 추적하고 통제할 수 있어야 한다"고 말했다. GPU 다음은 LLM 운영…기업 AI 운영 경쟁 본격화 와탭랩스는 이러한 문제에 대응하기 위해 LLM 옵저버빌리티 솔루션을 선보인다. GPU 자원 사용량부터 애플리케이션 성능, AI 응답 품질까지 전체 흐름을 연계 분석해 서비스 운영 환경에서 발생하는 오류와 장애를 통합 관리한다. 주요 감시 항목은 ▲AI 답변 적합성·정확성 ▲할루시네이션(없는 정보를 만들어내는 AI 환각 현상) ▲프롬프트 인젝션 공격 ▲개인정보 포함 여부 ▲불필요한 응답 우회 경로 ▲토큰·GPU 리소스 효율 등이다. 특히 보안상 외부 AI 서비스를 사용할 수 없어 GPU를 직접 구축해 모델을 운영하는 국내 금융·공공기관에 적합하게 구현됐다. 자체 GPU로 모델을 운영하는 환경에서는 AI 응답에 쓰이는 토큰이 GPU 자원과 직결되기 때문에, 응답 경로를 최적화하면 처리 성능과 비용 효율을 동시에 높일 수 있다는 설명이다. 신 개발자는 "AI 서비스를 운영하는 기업이라면 응답 품질부터 보안 위협까지 한 플랫폼에서 감시할 수 있는 체계를 갖춰야 한다"며 "단순히 있으면 좋은 도구가 아니라 서비스 신뢰도를 지키는 핵심 인프라"라고 강조했다. 고지훈 팀장은 AI 시대 운영자의 역할 변화도 예고했다. 그는 "앞으로 운영자는 데이터를 직접 분석하는 사람이 아니라, AI가 안전하게 작동할 수 있는 가드레일을 설계하는 사람이 될 것"이라며 "인프라·애플리케이션·AI 모델을 통합 관측하는 체계가 기업 경쟁력을 좌우하게 될 것"이라고 강조했다.

2026.06.26 10:40남혁우 기자

메가존클라우드, 과기정통부 국산 AI반도체 실증 인프라 구축 참가

정부에서 추진하는 대규모 국산 인공지능(AI) 반도체 인프라 구축에 메가존클라우드(대표 염동훈)가 힘을 보탠다. 메가존클라우드는 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관하는 'AI컴퓨팅 실증 인프라 고도화' 2차년도 사업에 참여한다고 25일 밝혔다. 이번 사업은 국산 AI반도체를 기반으로 대규모 인프라를 구축하는 국가 과제다. 대규모언어모델(LLM) 기반 서비스와 GPU, NPU 혼용 환경을 실증한다. 메가존클라우드는 국산 NPU 기반 클라우드 인프라의 통합 운영 전반을 담당한다. NPU 자원할당과 통합 관리 모니터링 소프트웨어(SW)를 개발한다. AI컴퓨팅 인프라 통합 운영·관제 인프라도 구축한다. 국산 AI반도체가 실제 서비스 환경에서 안정적으로 작동하도록 돕는 역할이다. 이번 사업은 오는 2027년까지 3개년에 걸쳐 추진된다. 올해 2차년도 목표는 연산용량 60페타플롭스 이상의 컴퓨팅 인프라 구축이다. 메가존클라우드는 지난해에 이어 2년 연속 참여해 운영 안정성을 높일 계획이다. 이번 사업에는 퓨리오사AI, 리벨리온, NHN클라우드, 하이퍼엑셀, 네이버클라우드 등이 컨소시엄으로 함께 참여한다. 사업 성과는 제조, 금융, 헬스케어, 교육 등 다양한 산업군의 AI 서비스 고도화에 활용된다. 메가존클라우드는 국산 AI반도체의 해외 실증도 이끈다. 지난 5월 'AI-반도체 해외실증 지원 사업' 주관사업자로 선정됐다. 사우디아라비아 아람코 디지털을 대상으로 퓨리오사AI의 2세대 NPU 'RNGD' 기반 AI 서비스를 실증하고 있다. 황인철 메가존클라우드 CRO는 "국산 AI반도체의 상용화 경쟁력은 실제 서비스 환경에서 안정적으로 운영하고 확장할 수 있는 클라우드 플랫폼 역량이 함께 뒷받침돼야 한다"며 "국내 인프라 구축과 해외 현장 실증 양면에서 경험을 축적해 국산 AI반도체 생태계의 실질적인 성숙에 기여하겠다"고 말했다.

2026.06.25 15:30남혁우 기자

오픈AI도 자체 칩 승부수…'할라페뇨'로 엔비디아 의존 줄인다

오픈AI가 인공지능(AI) 추론 전용 반도체를 직접 설계하며 칩부터 모델, 서비스까지 아우르는 '풀스택' 전략에 본격 시동을 걸었다. 오픈AI는 24일(현지시간) 브로드컴과 공동 개발한 첫 AI 추론 가속기 '할라페뇨'를 공개했다. 올해 말부터 데이터센터에 배치할 예정인 이 칩은 두 회사가 함께 구축하는 다세대 컴퓨팅 플랫폼의 첫 제품이다. 오픈AI는 할라페뇨 초기 테스트에서 와트당 성능이 현존 최고 수준을 크게 웃돌았다고 설명했다. 최종 성능은 측정 중이며 세부 기술 보고서는 수개월 내 공개할 예정이다. 혹 탄 브로드컴 최고경영자(CEO)는 로이터 통신에 "할라페뇨는 엔비디아의 블랙웰 칩이나 구글의 텐서처리장치(TPU)와 대등한 성능을 갖췄다"고 말했다. 할라페뇨는 기존 AI 가속기를 개조한 범용 칩이 아니라 최신 거대언어모델(LLM) 추론을 겨냥해 처음부터 새로 설계됐다. 챗GPT·코덱스·응용 프로그램 인터페이스(API)를 매일 운영하며 쌓은 데이터가 반영됐다. 초기 설계부터 파운드리(반도체 수탁생산) 공장에 넘기는 '테이프아웃' 단계까지는 9개월밖에 걸리지 않았다. 이에 대해 양사는 고성능 첨단 반도체 분야에서 가장 빠른 주문형 반도체(ASIC) 개발 주기라고 강조했다. 할라페뇨는 대만 TSMC가 양산하며 삼성전자와 SK하이닉스가 브로드컴에 메모리 칩을 공급한다. 블룸버그 통신에 따르면 두 회사는 차기 칩을 2028년에 내놓고 이후 매년 새 칩을 선보일 계획이다. 최근 AI 모델 시장을 이끄는 기업들은 자체 칩을 확보해 엔비디아 의존도를 낮추는 전략을 추진하고 있다. TPU를 앞세운 구글에 이어 오픈AI도 할라페뇨를 통해 자체 추론 칩을 선보였고 앤트로픽 역시 자체 칩 개발을 타진하고 있다. 이들 기업이 모두 핵심 연산 인프라의 내재화에 나서면서 엔비디아 중심의 AI 가속기 주도권 경쟁이 새 국면에 접어들었다. 그렉 브록먼 오픈AI 사장은 "세계는 연산 기반 경제로 나아가고 있다"며 "할라페뇨는 연산 자원을 더 풍부하게 만들어 개인과 기업에 빠르고 안정적이며 저렴한 AI를 제공할 것"이라고 말했다.

2026.06.25 09:59이나연 기자

엔비디아-AWS, 협력 확대…AI 추론·벡터 검색 지원

엔비디아와 아마존웹서비스(AWS)가 기업용 인공지능(AI) 추론과 벡터 검색, 대규모 학습 환경을 업그레이드했다. 엔비디아는 '아마존 EC2'와 '아마존 오픈서치' 전반에 엔비디아 AI 인프라 적용 범위를 넓혔다고 24일 공식 홈페이지에서 밝혔다. 핵심은 엔비디아 블랙웰 기반 그래픽처리장치(GPU)를 탑재한 'EC2 G7 인스턴스'와 '엔비디아 cuVS' 기반 오픈서치 서버리스 벡터 검색 가속이다. 아마존 EC2 G7 인스턴스는 엔비디아 RTX 프로 4500 블랙웰 서버 에디션 GPU를 기반으로 작동한다. AI 추론과 그래픽, 공간 컴퓨팅, GPU 가속 데이터 분석 업무를 겨냥한 신규 인스턴스다. G7은 기존 G6 인스턴스와 비교해 AI 추론 성능을 최대 4.6배 높였다. 그래픽 성능은 최대 2.1배 향상됐다. 아마존 EMR에서 엔비디아 cuDF 라이브러리를 활용한 아파치 스파크 업무도 더 빠르게 처리할 수 있다. G7 인스턴스는 최대 8개 GPU와 총 256기가바이트(GB) GPU 메모리, 초당 700기가비트(Gbps) EFA 지원 네트워킹, 최대 7.6테라바이트(TB) 로컬 NVMe SSD 스토리지를 지원한다. 1개, 2개, 4개, 8개 GPU 구성과 베어메탈 구성을 제공해 기업이 업무에 맞춰 인프라를 선택할 수 있도록 했다. 이를 통해 AI 개발팀은 낮은 지연시간에 추론 환경을 구축할 수 있으며, 미디어·엔터테인먼트 기업은 고해상도 영상 제작과 렌더링 업무에 활용할 수 있다. 시뮬레이션과 컴퓨터 지원 설계, 가상 데스크톱 인프라, 게임, 공간 컴퓨팅 분야도 같은 인스턴스를 쓸 수 있다. AWS는 오픈서치 서버리스에도 엔비디아 cuVS를 적용했다. 차세대 아마존 오픈서치 서버리스는 모든 벡터 컬렉션에서 GPU 가속 벡터 인덱싱을 기본 컴퓨팅 방식으로 사용한다. 이는 검색증강생성(RAG), 의미 기반 검색, 추천 시스템, 에이전틱 AI 애플리케이션을 구축하는 기업에 의미가 크다. 기존에는 별도 최적화 프로젝트에 가까웠던 GPU 기반 벡터 검색을 AWS 기본 기능처럼 활용할 수 있기 때문이다. 엔비디아는 cuVS 적용으로 벡터 인덱싱 속도가 중앙처리장치(CPU) 기반 방식보다 최대 10배 빨라지고, 비용은 4분의 1 수준으로 낮아질 수 있다고 설명했다. 이를 통해 수십억 단위 벡터 데이터베이스(DB)도 1시간 내에 구축할 수 있다고 밝혔다. 엔비디아는 "이번 협력은 AWS의 AI 인프라 계층 전반을 강화하는 데 초점을 맞췄다"며 "운영 부담을 늘리지 않으면서 대규모로 작동하는 생산급 AI 인프라"라고 밝혔다.

2026.06.24 18:31김미정 기자

AI 내재화 확산에 서버용 고출력 전원 솔루션 주목

기업이나 조직 내에서 기업 비밀이나 민감한 개인정보 외부 유출을 막고 오픈소스·자체개발 AI 모델을 활용한 추론과 에이전틱 AI 구동을 위해 AI 서비스를 일부, 또는 전부 자체 서버로 전환하려는 움직임이 활발해지고 있다. 이를 위해 엔비디아·AMD 등 GPU 제조사 기반 서버 도입도 늘고 있다. 문제는 이 서버들이 활용하는 전력이 과거 수백 W에 불과했던 x86 서버 대비 최소 두 배 이상 늘어났다는 것이다. 예를 들어 엔비디아 DGX A100(6U) 기반 서버는 시스템 한 대당 최대 6.5kW(킬로와트)의 전력을 소비한다. 일반 웹서버나 가상화 서버에 쓰이는 x86 1U 서버의 전력 소모량인 300W의 20배 이상이다. 24일 한미마이크로닉스 관계자는 "고성능 GPU 서버 등장으로 단일 서버가 아닌 랙 단위 전력 수요가 증가하고 있는 상황"이라며 "데이터센터 운영 기업들이 전력 효율과 안정성을 높이기 위한 고효율·이중화 서버 전원 솔루션 도입을 확대중"이라고 설명했다. 고성능 AI 서버가 바꾼 전원 인프라 시장 고성능 GPU를 구동하는 서버 환경에서 서버용 전원공급장치의 중요성도 커지고 있다. 대용량 전력을 장시간 안정적으로 공급해야 하며, 이에 실패하면 내부 서비스 중단과 이로 인한 손해가 발생할 수 있다. 현재 주류 GPU인 엔비디아 블랙웰 GB200은 블랙웰 GPU 2개와 그레이스 CPU 1개로 구성되며 최대 2.7kW까지 소비한다. 이는 전세대 주력 제품인 H100의 700W 대비 4배 가까이 늘어난 것이다. AI 서버 전력 수요 증가에 대응해 글로벌 서버 제조사와 전원 솔루션 업체들도 고출력 PSU 및 파워쉘프 개발 경쟁을 벌이고 있다. 한미마이크로닉스 "AI 전원 솔루션 공급 확대" 한미마이크로닉스는 올해 2월 글로벌 전원 솔루션 전문기업 그레이트월과 AI·서버 및 엔터프라이즈 전원 솔루션 분야 협력을 위한 업무협약을 체결했다. 이 회사 관계자는 "이는 기존 PC와 워크스테이션 등에 집중됐던 포트폴리오를 서버 등 AI 인프라로 확장하기 위한 시도"라고 밝혔다. 현재 한미마이크로닉스는 그레이트월 제품군 중 엔비디아 GB300 구동을 위한 33kW급 파워쉘프, 서버용 특수 전원공급장치인 CRPS 제품 4종을 국내 유통중이다. CRPS는 서비스 운영 중단이 허용되지 않는 데이터센터 환경을 위해 설계된 특수 전원공급장치다. 전원 공급을 이중화해 문제가 생겨도 전원 차단 없이 교체가 가능해 다운타임을 크게 줄일 수 있다. "기존 GPU 서버 매각시 전원 교체 필요" AI 서버 도입 확대와 함께 기존 장비 교체 수요도 증가하고 있다. 기업들은 신규 AI 서버를 도입하면서 기존 서버 자산의 매각과 재활용, 유지보수 체계 구축에도 관심을 높이고 있다. 한미마이크로닉스는 올 상반기 진행된 자체 제품 발표 행사와 주요 AI 관련 전시회 등에 AI 인프라 환경을 고려한 그레이트월의 GB300 파워쉘프와 CRPS 시리즈를 비롯해 서버용 전력·냉각 인프라 제품군 전시에 나서기도 했다. 이 회사 관계자는 "기업들이 단가 최소 수천만원 이상인 GPU 서버를 교체하며 기존 제품을 매각하는 방식으로 비용 보전에 나서고 있으며, 이 과정에서 기존 전원공급장치를 신규 제품으로 교체하는 수요도 상당하다"고 설명했다. "전원부터 섀시, 추론 서버까지 포트폴리오 확대" 한미마이크로닉스는 전원 솔루션 외에도 서버 섀시와 냉각 솔루션, AI 서버 플랫폼 등 관련 인프라 사업을 확대하고 있다. 최근 출시한 1U 랙마운트 서버 케이스 RM100은 이중화 전원과 다양한 서버 환경 구성을 지원하며, 이 외에도 4U~6U 서버 섀시, 스토리지 서버 케이스, 듀얼 CPU 서버용 쿨러 및 산업용 고풍압 팬 등 서버 인프라 관련 포트폴리오를 확대 중이다. 자체 개발 제품 투입도 준비 중이다. 7U 규모 AI 추론용 서버 'GSR7 P2G8M24'는 GPU 최대 8개를 탑재 가능하며 핫스왑 기반 스토리지와 이중화 전원 설계를 통해 안정적인 운용이 가능하다. 업계에서는 AI 데이터센터 확산으로 전력 확보와 전력 효율 개선이 핵심 과제로 떠오르고 있다고 보고 있다. GPU 성능 경쟁이 이어지는 가운데 서버 전원공급장치와 파워쉘프 등 전력 인프라 시장 역시 함께 성장할 것으로 전망된다.

2026.06.24 17:25권봉석 기자

[AI 고속도로] AI 클라우드 판 흔드는 GPU 전쟁…네오클라우드, 82조 시장 '정조준'

그래픽처리장치(GPU) 집약형 인공지능(AI) 워크로드가 급증하면서 AI·고성능 컴퓨팅에 특화된 '네오클라우드'가 클라우드 시장의 새 축으로 떠오르고 있다. 생성형 AI 확산으로 대규모 학습·추론 인프라 수요가 커진 가운데 GPU 용량과 가격 경쟁력, 데이터 주권 확보 역량이 기업 클라우드 전략의 주요 변수로 부상했다. 24일 시장조사기관 가트너에 따르면 네오클라우드 공급업체는 오는 2030년까지 2670억 달러 규모 AI 클라우드 시장에서 20%를 차지할 전망이다. 원화 기준으로는 약 410조원 시장 가운데 82조원 규모다. 네오클라우드는 AI와 고성능 워크로드에 특화된 클라우드 공급업체를 의미한다. 가트너는 생성형 AI 도입이 확산되면서 GPU 기반 컴퓨팅 수요가 전례 없는 수준으로 늘고 있으며, 이 과정에서 기존 범용 클라우드 모델의 한계가 드러나고 있다고 분석했다. 엔리케 카스테라 가트너 수석 애널리스트는 "미국의 하이퍼스케일러가 자체 소버린 서비스를 출시하고 있는 가운데 네오클라우드 공급업체가 주목을 받고 있다"며 "네오클라우드는 AI 최적화 인프라와 고성능 워크로드에 중점을 둔다는 점에서 차별점이 있다"고 말했다. 소버린 클라우드도 네오클라우드의 주요 경쟁력으로 꼽힌다. 일부 네오클라우드 사업자는 데이터와 운영이 특정 관할권 안에 유지되도록 보장하는 기능을 강화하고 있다. 데이터, 운영, 거버넌스 등 클라우드 환경 일부 또는 전체를 국경 안에 두도록 해 해외 법적 청구나 역외 접근으로부터 보호하는 방식이다. 글로벌 AI 클라우드 시장에선 GPU 특화 사업자의 인프라 확장도 이어지고 있다. 코어위브는 엔비디아와 협력을 확대해 2030년까지 5GW 이상 규모 AI 팩토리를 구축하겠다는 계획을 내놨고, 람다는 엔비디아 베라 루빈 NVL72와 GB300 NVL72 기반 베어메탈 인스턴스를 준비하고 있다. 네비우스도 엔비디아와 전략적 협력을 맺고 차세대 풀스택 AI 클라우드 구축에 나섰다. 카스테라 애널리스트는 "네오클라우드는 AI 워크로드에 최적화된 성능, 유연한 배포 모델, 강력한 데이터 주권 보장을 바탕으로 차별화된 가치를 제공하고 가격 경쟁력에서도 앞선다"며 "주권, 성능, 인프라 전문성이 기업의 주요 의사결정 요인으로 부상하면서 AI 클라우드 시장은 새로운 국면에 접어들었다"고 설명했다. 가트너는 기업도 중앙집중형 글로벌 클라우드 모델을 넘어 현지화된 하이브리드 아키텍처로 전환하는 움직임을 보이고 있다고 봤다. 인프라 및 운영(I&O)을 비롯한 IT 리더는 전문 네오클라우드 공급업체를 평가해 고성능 AI 인프라와 한정된 GPU 용량을 확보하고 기존 하이퍼스케일러에 국한되지 않는 다각화 전략을 추진해야 한다고 제언했다. 카스테라 애널리스트는 "기업은 네오클라우드 공급업체를 활용해 AI 역량을 강화하면서 데이터 주권과 규제 준수에 대한 통제권도 함께 확보할 수 있을 것"이라며 "이들은 AI 워크로드에 특화된 고성능 인프라에 대해 보다 유연하게 접근할 수 있도록 지원함으로써 기업의 혁신 속도를 높인다"고 말했다.

2026.06.24 10:07장유미 기자

"AI 도입보다 어려운 건 운영"…락플레이스, '통제형 자율 운영' 해법 제시

인공지능(AI) 확산이 기업 디지털 전환을 가속화하며 생산성을 끌어올리고 있다. 하지만 생성형 AI와 그래픽처리장치(GPU) 인프라, 클라우드 네이티브 기술 도입이 본격화되면서 IT 운영 환경은 갈수록 복잡해지는 추세다. 성능과 비용, 보안, 장애 대응을 아우르는 통합 운영 체계 구축이 새로운 과제로 부상하면서 안정적인 서비스 운영 역량이 기업 경쟁력을 좌우하는 핵심 요소로 떠오르는 모습이다. 22일 락플레이스는 이러한 변화에 대응하기 위해 플랫폼 표준화와 옵저버빌리티, AI옵스(AIOps), 자동화를 결합한 통합 운영 모델 '로드(RO@D)'를 앞세워 통제형 자율 운영 전략을 제시했다. 기업 IT 환경은 디지털 서비스 확대와 데이터 주권, 비용 최적화 요구에 따라 단일 데이터센터 중심 구조에서 하이브리드·멀티 클라우드 환경으로 빠르게 전환되고 있다. 특히 생성형 AI 도입이 본격화되면서 대규모 GPU 자원과 탄력적 확장성이 요구되는 AI 워크로드와 강력한 보안 및 안정성이 요구되는 기존 레거시 업무 시스템이 서로 다른 인프라 환경에서 분산 운영되는 사례가 늘고 있다. 여기에 쿠버네티스 기반 컨테이너 애플리케이션과 마이크로서비스 아키텍처(MSA) 확산까지 더해지면서 IT 운영 조직이 관리해야 할 복잡성은 한층 높아지는 상황이다. 문제는 AI 서비스가 기존 애플리케이션과 다른 운영 특성을 가진다는 점이다. AI 서비스는 GPU 사용량과 거대언어모델(LLM) 호출 횟수, 데이터 처리량, 추론 비용 등 다양한 요소가 복합적으로 작용하며 실시간 변동성을 만들어낸다. 단순히 서버 가동 여부를 확인하는 수준을 넘어 인프라와 애플리케이션, 데이터 파이프라인, 사용자 경험, 비용 구조까지 하나의 흐름으로 파악해야 하는 이유다. 이를 해결하기 위한 방안으로 다양한 옵저버빌리티 플랫폼이 등장하고 있다. 하지만 업계에서는 가시성 확보만으로는 복잡해진 운영 환경을 관리하는 데 한계가 있다는 지적도 나온다. 장애 발생 시 원인 분석과 조치, 검증 과정은 여전히 운영자의 경험과 수작업에 의존하는 경우가 많기 때문이다. 락플레이스는 단순 관측을 넘어 지능형 분석과 대응 자동화, 거버넌스까지 운영 전 과정을 하나의 흐름으로 통합하는 클라우드 네이티브 운영 모델 '로드'를 제시했다. 로드는 클라우드 플랫폼과 옵저버빌리티, 자동화를 단일 체계로 통합한 것이 특징이다. 가상머신(VM)과 컨테이너, AI 워크로드를 하나의 인프라 체계에서 관리할 수 있도록 구조화했다. 옵저버빌리티와 AI옵스(AIOps), 런북(Runbook) 자동화를 유기적으로 결합해 실시간 탐지부터 분석, 조치, 검증까지 이어지는 전방위적 운영 프로세스를 제공한다. 락플레이스는 엔터프라이즈 시장에서 검증된 '레드햇 오픈시프트' 기반 플랫폼으로 VM과 컨테이너, AI 워크로드를 일관된 기준으로 다룰 수 있는 토대를 마련했다. 여기에 '다이나트레이스(Dynatrace)' 기반 옵저버빌리티를 더해 서비스 흐름과 의존관계, 사용자 영향도, 인프라 상태를 입체적으로 분석한다. 더불어 운영자 승인과 정책 통제를 포함하는 '휴먼인더루프(Human-in-the-Loop)' 방식 통제형 자율 운영 모델로 안정성을 높였다. 반복 업무는 자동화하되 최종 의사결정과 통제 권한은 운영자가 보유함으로써 엔터프라이즈 환경에 필요한 거버넌스와 감사 가능성을 확보할 수 있도록 돕는다. 회사는 기업의 운영 성숙도에 맞춰 단계적으로 자율 운영 체계를 구축할 수 있도록 지원할 계획이다. 운영 진단과 플랫폼 표준화를 시작으로 옵저버빌리티 구축, AIOps 기반 원인 분석, 런북(Runbook) 자동화, 거버넌스 고도화 단계로 확장하는 방식이다. 락플레이스 관계자는 "AI 시대에는 단순히 인프라를 구축하는 것보다 복잡한 운영 데이터를 얼마나 빠르게 분석하고 실행 가능한 판단으로 연결하느냐가 중요하다"며 "로드를 통해 기업들이 클라우드 네이티브 환경에서 운영 가시성과 안정성, 효율성을 동시에 확보할 수 있도록 지원할 것"이라고 말했다.

2026.06.22 11:36남혁우 기자

[AI 고속도로] 같은 GPU, 다른 결과…AI 인프라도 산업별 맞춤형 설계

인공지능(AI) 인프라 시장의 경쟁 축이 단순 그래픽처리장치(GPU) 확보에서 산업별 워크로드 최적화로 이동하고 있다. 로봇과 자율주행, 바이오, AI 에이전트 등 활용 분야가 다양해지면서 같은 GPU라도 데이터 특성과 운영 방식에 따라 필요한 인프라 구조가 달라지고 있다는 분석이 나온다. 21일 업계에 따르면 최근 젠슨 황 엔비디아 최고경영자(CEO)가 방한해 로보틱스·제조·모빌리티 분야 AI 활용 가능성을 강조하면서 한국형 피지컬 AI가 화두로 떠올랐다. 다만 업계에선 피지컬 AI 확산이 곧 획일적인 인프라 수요 증가로 이어지지는 않을 것으로 보고 있다. 산업마다 AI 모델을 학습·검증·배포하는 방식이 다르고 GPU 사용 규모와 기간, 배치 환경도 제각각이기 때문이다. 이에 대해 안재만 베슬AI 대표는 "AI 인프라 수요는 더 이상 하나의 덩어리로 움직이지 않는다"며 "GPU를 얼마나 확보하느냐 못지않게 누가·어떻게·어디서 쓰는지에 따라 인프라 설계가 달라지고 있다"고 말했다. 피지컬 AI 확산…LLM과 다른 인프라 필요 피지컬 AI는 로봇과 자율주행차처럼 현실 공간에서 동작하는 AI를 의미한다. 대규모언어모델(LLM)이 인터넷 기반 텍스트 데이터로 학습하는 것과 달리 물체 파지나 충돌 반응 등 물리 데이터를 필요로 한다. 이에 시뮬레이션 환경에서 데이터를 생성하고 실제 데이터와 결합하는 과정이 중요해지고 있다. 인프라 구조 역시 LLM과 차이가 있다. 베슬AI에 따르면 시뮬레이션 데이터 생성부터 비전·언어·행동(VLA) 모델 학습, 이후 로봇이나 차량의 온보드 컴퓨터에 탑재해 실시간으로 구동하는 과정까지 고려해야 한다. 안 대표는 "스토리지, 네트워크, 데이터 공급 구조까지 함께 설계해야 피지컬 AI 학습 효율을 높일 수 있다"고 밝혔다. 대학은 짧고 기업은 길게…GPU 사용 패턴도 차별화 실제 GPU 활용 방식도 기관 성격에 따라 뚜렷하게 구분된다. 베슬AI가 최근 30일간 자사 플랫폼 '베슬 클라우드' 운영 데이터를 분석한 결과 대학과 연구기관의 평균 동시 사용 GPU 중앙값은 1.8장 수준으로 나타났다. 반면 기업 고객의 경우 46%가 한 번에 8장 이상 GPU를 사용했으며 최대 32장 규모의 멀티노드 환경까지 확장한 사례도 확인됐다. 배치 환경 역시 산업별 특성이 반영된다. 방산과 금융, 바이오, 통신 분야는 민감 데이터를 다루는 만큼 온프레미스나 폐쇄망 환경을 선호해 왔지만 최근에는 보안 인증을 갖춘 클라우드 활용도 함께 검토하는 추세다. 실제 베슬AI 고객사에도 통신과 보험, 의료, 방산 기업이 포함된 것으로 전해졌다. 로봇·에이전트·바이오마다 다른 GPU 전략 베슬AI는 산업별 특성에 맞춰 GPU 기종과 계약 방식, 노드 구성, 배치 환경을 달리 제공하고 있다. A100과 H100은 물론 B200·B300급 GPU까지 지원하며 온디맨드와 단기·장기 약정 방식, 단일 GPU와 멀티노드 클러스터 등을 워크로드에 맞춰 조합하는 구조다. 베슬AI는 각 고객별 맞춤형 AI 인프라를 지원하고 있다. 대표적으로 휴머노이드 로봇용 파운데이션 모델을 개발하는 기업은 시뮬레이션 데이터와 실제 로봇 데이터를 함께 학습해야 하는 만큼 테라바이트(TB)급 대규모 스토리지와 고성능 GPU를 제공했다. 여러 고객사 프로젝트를 동시 운영할 수 있는 격리된 개발 환경이 중요했던 B2B AI 에이전트 기업에는 학습 환경 추상화 레이어와 클러스터 공유 스토리지를 제공해 다중 워크스페이스 운영을 지원했다. 또 바이오·신약 AI 기업은 보안성이 높은 프라이빗 환경과 클라우드 자원을 유연하게 활용하는 구조를 선호하기에 베슬AI는 글로벌 'SOC 2 Type II' 인증과 초기 도입 부담을 완화한 소규모 시범 사용 크레딧을 제공하고 있다. 안 대표는 "AI 인프라 시장은 GPU를 빌려주는 단계를 넘어 산업별 워크로드가 실제로 작동할 수 있는 환경을 설계하는 방향으로 진화하고 있다"며 "앞으로는 피지컬 AI, 바이오, AI 에이전트 등 산업별 수요에 맞춰 유연한 GPU 인프라 운영 모델을 제공하는 것이 중요하다"고 강조했다.

2026.06.21 15:00한정호 기자

엔비디아 성공 공식, 구글이 따라 쓴다…TPU로 'GPU 장벽' 넘을까

구글이 자체 인공지능(AI) 반도체인 텐서처리장치(TPU) 사업을 앞세워 엔비디아 중심 AI 컴퓨팅 시장에서 영역 확장에 본격 나섰다. 엔비디아가 그래픽처리장치(GPU) 판매 확대에 활용해온 데이터센터 금융 지원 방식을 본격 적용하며 외부 고객 확보에 속도를 내는 모습이다. 18일(현지시간) 월스트리트저널(WSJ)에 따르면 구글은 미국 뉴욕주 서부 온타리오호 인근 AI 데이터센터 클러스터 '레이크 매리너' 프로젝트에 32억 달러(약 4조9000억원) 규모 금융보증을 제공했다. 이 프로젝트는 AI 인프라 기업 테라울프와 구글이 투자한 클라우드 업체 플루이드스택이 추진 중이다. 해당 데이터센터의 컴퓨팅 자원은 앤트로픽에 임대될 예정이다. 이 같은 구글의 전략은 엔비디아가 AI 칩 시장 지배력을 키울 때 활용한 방식과 유사하다. 데이터센터 사업자가 낮은 비용으로 자금을 조달할 수 있도록 지원하고, 이 자금이 다시 칩 구매와 컴퓨팅 임대 계약으로 이어지도록 만드는 구조다. 구글은 TPU 공급과 클라우드 계약, 대형 AI 고객 수요를 함께 묶어 엔비디아 GPU 의존도를 낮추려 하고 있다. AI 경쟁 축이 모델 개발에서 컴퓨팅 자원 확보로 이동하면서 자체 칩을 보유한 빅테크의 영향력도 커지고 있다. 구글은 검색과 AI 서비스 운영을 위해 TPU를 장기간 내부적으로 사용해 왔다. 이후 생성형 AI 수요가 급증하자 구글 클라우드를 통해 외부 기업에 TPU를 제공하기 시작했다. 최근에는 TPU 사업을 더 공격적으로 확장하고 있다. 지난달 TPU를 고객에게 직접 판매하겠다는 계획을 발표했고, AI 추론에 특화한 첫 TPU도 공개했다. 추론은 이용자 질의에 AI 모델이 답변을 생성하는 과정으로, 생성형 AI 서비스 확산에 따라 수요가 빠르게 늘고 있다. 하지만 엔비디아의 진입장벽은 여전히 높은 상태다. 엔비디아는 AI 칩 시장에서 90% 이상 점유율을 가진 것으로 추정된다. 이는 GPU 성능에 더해 쿠다(CUDA) 소프트웨어 생태계, 네트워킹 장비, 서버 시스템을 결합한 전체 하드웨어 스택이 강점으로 작용하고 있어서다. 또 AI 클라우드 업체들이 엔비디아 제품 배정 물량을 의식해 경쟁사 칩 도입에 부담을 느끼고 있기 때문이란 분석도 있다. 여기에 젠슨 황 엔비디아 최고경영자(CEO)는 구글 TPU의 경쟁력을 낮게 보고 있다. 그는 지난 4월 팟캐스트 인터뷰에서 엔비디아가 구글과 ASIC 업체보다 훨씬 넓은 시장 접근성을 갖췄다고 말했다. 앤트로픽 외에 TPU의 의미 있는 외부 고객이 많지 않다는 취지의 언급도 내놨다. 황 CEO는 "TPU가 비용 우위를 갖췄다는 점을 입증해 보였으면 한다"며 "엔비디아는 구글 TPU나 주문형 반도체(ASIC)보다 훨씬 앞서 있다"고 말했다. 이에 구글은 자금력을 앞세워 엔비디아에 맞설 기반을 넓히고 있다. 특히 이달에는 AI 인프라 투자를 위해 850억 달러 규모 자본 조달 계획을 밝히기도 했다. 또 루이지애나주 배턴루지 인근 70억 달러 규모 AI 데이터센터 프로젝트 '리버 벤드'에도 금융 지원을 제공하고 있다. 텍사스주 콜로라도시티 AI 컴퓨팅 임대 프로젝트에는 14억 달러 규모 금융보증을 제공 중이다. 더불어 구글은 블랙스톤과 50억 달러 규모 클라우드 서비스 합작법인 설립 계약도 체결했다. 이 법인은 엔비디아 칩을 기반으로 성장한 코어위브, 네비우스 등 AI 클라우드 업체와 경쟁한다. 아민 바흐다트 구글 AI 인프라 최고기술책임자(CTO)는 "엔비디아와의 경쟁에만 초점을 맞추고 있지 않다"며 "우리에게 중요한 것은 구글과 고객을 위한 더 나은 제품을 만드는 것"이라고 말했다.

2026.06.19 17:45장유미 기자

래블업 "인텔 '아크 프로 B70', RTX 프로 4000 대비 추론 처리량 높아"

AI 시장의 중심이 모델 학습에서 추론과 에이전틱 AI 서비스 운영으로 이동하면서 GPU 내장 메모리 용량의 중요성이 커지고 있다. 거대언어모델(LLM)에서 길게 이어지는 대화의 맥락을 처리하고 여러 이용자를 동시에 처리하려면 대용량 메모리가 중요하다. 특히 에이전틱 AI는 장시간 대화 맥락을 유지하고 여러 작업을 병렬 처리해야 하는 만큼 GPU 메모리 사용량이 급격히 증가한다. 이 과정에서 이전 추론 결과를 저장하는 'KV 캐시(Key-Value Cache)'가 중요한 역할을 한다. KV 캐시가 충분하지 않으면 기존 KV 캐시 데이터를 제거하거나 재배치해야 하며 이 과정에서 처리량이 감소하거나 응답 지연이 발생할 수 있다. 반대로 KV 캐시를 담을 메모리 용량이 충분하면 더 많은 사용자 요청과 긴 컨텍스트를 동시에 처리할 수 있다. 래블업, '백엔드.AI'에서 LLM 2종 대상 벤치마크 수행 국내 AI 플랫폼 기업인 래블업은 최근 엔터프라이즈 AI 인프라 운영 플랫폼 '백엔드.AI'에서 인텔 아크 프로 B70과 엔비디아 RTX 프로 4000 블랙웰을 대상으로 한 LLM 벤치마크 결과를 공개했다.(인텔 제온 w9-3475X, 우분투 25.10 환경) 인텔 아크 프로 B70은 지난 3월 말 출시된 워크스테이션용 GPU로 AI 추론 수요를 겨냥했다. Xe2 코어 32개와 32GB 메모리 기반으로 대용량 AI 모델을 분할 없이 구동할 수 있다는 점이 차별화 포인트다. 연산 성능은 최대 367 INT8 TOPS(초당 1조 회 연산) 수준이며 GDDR6 32GB 메모리를 탑재해 중소규모 기업과 개발자가 대형 언어모델(LLM)을 로컬 환경에서 직접 구동할 수 있게 했다. 비교 대상이 된 RTX 프로 4000 블랙웰은 쿠다 코어 8960개, ECC GDDR7 24GB 메모리를 탑재했고 메모리 대역폭은 672GB/s 수준이다. Qwen3 8B 모델에서 동시 요청시 초당 처리량 향상 현재 기업들이 활용하는 7B~30B급 오픈소스 LLM은 추론 과정에서 상당한 KV 캐시 공간을 요구하기 때문에 24GB와 32GB 메모리의 차이가 실제 처리량 격차로 이어질 수 있다. 래블업이 Qwen3 8B 모델을 기반으로 수행한 8K 컨텍스트 테스트에서 아크 프로 B70은 동시 요청 수가 늘어나도 초당 처리량이 꾸준히 높아졌다. 반면 RTX 프로 4000 블랙웰은 동시 요청 수가 16개 수준에 도달하자 메모리 부족 현상으로 처리량이 급감했다. 이 테스트에서 아크 프로 B70은 엔비디아 GPU 대비 최대 2.24배 높은 처리량을 기록했다. 컨텍스트 길이를 32K까지 늘린 환경에서는 격차가 더욱 커졌고 특정 구간에서는 아크 프로 B70이 최대 4배 이상 높은 처리량을 보였다. 이는 AI 에이전트 시대에 GPU 연산 성능 못지않게 메모리 용량이 중요해지고 있음을 시사한다. GPT-OSS 20B에서도 RTX 프로 4000 대비 처리량 25% 우위 GPT-OSS 20B 모델을 이용한 테스트에서도 비슷한 경향이 확인됐다. 아크 프로 B70은 동시 요청 수가 증가해도 안정적으로 성능을 유지했으며 32개 동시 요청 환경에서 RTX 프로 4000 블랙웰 대비 25% 처리량이 높았다. 래블업은 실제 벤치마크에서 아크 프로 B70의 KV 캐시 활용 가능 용량이 RTX 프로 4000 블랙웰 대비 평균 2배 수준으로 나타났다고 설명했다. 래블업 관계자는 "이에 따라 모델 가중치를 적재한 이후에도 더 많은 메모리 여유 공간을 확보할 수 있다"고 설명했다. 이어 "처리량과 가격을 함께 고려한 비용 효율 분석에서도 아크 프로 B70이 더 나은 결과를 보였고 AI 서비스 운영에 중요한 토큰당 비용 기준으로는 최대 8배 이상의 효율 향상이 가능하다"고 분석했다. AI 에이전트 등장에 GPU 메모리 용량 중요성 ↑ 래블업은 "장비와 솔루션 도입 시 토큰 처리 비용은 주요 검토 항목 중 하나이며 처리량과 GPU 가격에 따라 결정된다. 정가 기준 아크 프로 B70은 1099달러(약 149만원), RTX 프로 4000 블랙웰은 2199달러(약 297만원)로 벤치마크 결과를 반영하면 두 제품 간 비용 효율 격차는 더욱 커진다"고 설명했다. 다만 이번 결과는 특정 모델과 특정 추론 환경에서 측정된 것으로, AI 학습 성능이나 모든 워크로드에서 동일한 우위를 의미하지는 않는다. 또 AI 생태계 전반에서는 여전히 엔비디아의 영향력이 압도적이다. 쿠다(CUDA)를 중심으로 구축된 개발 환경과 풍부한 소프트웨어 지원은 AMD나 인텔 등 경쟁사가 단시간에 따라잡기 힘들다. 그러나 오픈소스 기반 인텔 AI 프레임워크인 '오픈비노'를 비롯해 vLLM, llama.cpp 등 주요 AI 프레임워크가 인텔 GPU 지원을 확대하고 있다. 업계에서는 아크 프로 B70이 AI 추론 시장을 겨냥한 실용적인 대안으로 자리잡을 가능성이 높다고 보고 있다. AI 에이전트가 확산될 수록 연산 성능뿐 아니라 메모리 용량과 비용 효율이 중요해지고 있기 때문이다.

2026.06.18 16:08권봉석 기자

엠키스코어, HPE 'AI 파트너상' 2년 연속 수상…국내기업 유일

엠키스코어가 HPE로부터 2년 연속 수상하며 인공지능(AI) 인프라 기술력을 인정받았다. 엠키스코어는 미국 라스베이거스에서 열린 HPE 파트너 그로스 서밋에서 아시아태평양(APAC) 채널 파트너 부문 'AI 파트너상'을 수상했다고 17일 밝혔다. 이 상은 전 세계 HPE 파트너사 중 비즈니스 성과와 기술 혁신을 종합 평가해 수여한다. 엠키스코어는 올해 수상 명단에 한국 기업으로는 유일하게 이름을 올렸다. 엠키스코어는 지난해에도 한국 HPE 파트너 중 최초로 'AI 솔루션 프로바이더상'을 받았다. 이번 수상으로 이 회사는 2년 연속 글로벌 무대에서 기술력을 검증받았다. 엠키스코어는 국내 최초로 수랭식 AI 데이터센터 데모센터를 구축해 운영 중이다. 해당 시설을 기반으로 실제 고객 환경에서 검증된 수랭 기반 턴키 솔루션을 제공해 왔다. 이 기술은 고성능 그래픽처리장치(GPU) 서버의 전력과 발열 문제를 해소하는 대안으로 꼽힌다. 지속가능한 AI 인프라 구축 측면에서도 효율성이 높다는 평가를 받는다. 정문기 엠키스코어 대표는 "2년 연속 글로벌 기업으로부터 기술력과 혁신성을 인정받게 돼 매우 기쁘다"며 "앞으로도 국내 최대 규모 수랭 전환 레퍼런스를 구축한 경험과 기술력을 바탕으로 국내 AI 데이터센터 인프라 시장을 선도해 나가겠다"고 말했다.

2026.06.18 10:45남혁우 기자

Arm "GPU에 AI 가속기 접목, 중저가폰 게임 성능 향상"

영국에 본사를 둔 반도체 설계자산(IP) 기업 Arm이 AI를 활용한 차세대 그래픽 기술 '뉴럴 렌더링(Neural Rendering)'을 공개했다. 모바일 게임 그래픽 품질 향상과 함께 Arm이 자체 개발한 GPU IP의 경쟁력 강화를 노렸다. 모바일 게임 업계는 그래픽 품질을 높일수록 전력 소모와 발열이 증가하는 근본적 문제 해결을 위해 노력해 왔다. Arm이 15일 공개한 모바일 게임 '뉴럴 던(Neural Dawn)'은 이런 한계를 극복하기 위해 뉴럴 렌더링을 전면에 내세웠다. 최신 모바일용 Arm GPU와 NPU, AI 기술을 결합해 CPU·GPU의 부하는 줄이고 배터리 소모와 발열을 줄일 수 있다는 것이 Arm 설명이다. 스마트폰 GPU 시장, 자체 GPU 경쟁 치열 시장조사업체 카운터포인트리서치에 따르면 올해 1분기 세계 스마트폰 SoC 시장 점유율은 미디어텍 32%, 퀄컴 23%, 애플 19%, 삼성전자 7% 순이다. 이 가운데 퀄컴은 수년 전부터 자체 설계 GPU인 아드레노를 발전시켜 왔고, 삼성전자는 AMD RDNA 아키텍처 기반 엑스클립스 GPU를 플래그십 제품에 적용하고 있다. 애플 역시 자체 GPU를 설계해 아이폰에 탑재한다. 반면 미디어텍은 대부분 제품군에서 Arm GPU IP를 활용한다. Arm 입장에서는 말리 GPU를 채택하는 제조사들의 경쟁력을 높이는 것이 중요하다. 최근 모바일 게임이 콘솔 수준의 그래픽을 요구하면서 GPU 성능 중요성이 더욱 커지고 있지만, 중저가 스마트폰은 전력과 발열, 제조 원가 문제로 플래그십 수준 GPU를 탑재하기 어렵다. Arm의 해법, AI 접목 '뉴럴 렌더링' Arm이 게임 스튜디오 스모 디지털과 함께 제작한 게임 '뉴럴 던'은 이러한 문제에 대한 해법을 제시한다. 뉴럴 던은 Arm의 최신 GPU 아키텍처인 이모탈리스(Immortalis)를 기반으로 제작됐다. 여기에 하드웨어 레이트레이싱과 향후 GPU에 탑재될 신경망 가속기를 결합한 뉴럴 렌더링 기술이 적용됐다. 원리는 PC 게임 분야에서 널리 쓰이는 AI 업스케일링 기술과 유사하다. GPU가 먼저 상대적으로 낮은 해상도로 화면을 생성한 뒤 AI 신경망 모델이 이를 분석해 고품질 이미지로 복원한다. 이를 통해 GPU 연산량을 줄이면서도 높은 해상도와 프레임을 유지할 수 있다. Arm은 여기에 스마트폰의 NPU를 일부 활용해 AI 관련 연산을 분산 처리하는 방안도 제시했다. 중저가 스마트폰 시장의 게임 경쟁력 강화에 방점 Arm의 말리 GPU 기반 뉴럴 렌더링 기술은 GPU 성능 여유가 상대적으로 적은 보급형·중급형 스마트폰에서 효과가 클 것으로 기대된다. 고가 스마트폰은 이미 강력한 GPU를 탑재해 고사양 게임 구동이 가능하다. 반면 중저가 스마트폰은 GPU 성능 제약으로 인해 그래픽 품질과 프레임 유지에 어려움을 겪는다. 뉴럴 렌더링은 GPU가 수행해야 할 작업을 줄이는 대신 AI를 활용해 화질을 보완한다. 같은 하드웨어에서도 더 높은 프레임과 그래픽 품질을 구현할 수 있는 것이다. 결국 Arm의 목표는 말리 GPU가 적용된 대중형 스마트폰의 게임 성능을 끌어올리는 데 있다. 모바일 GPU 성능 경쟁 역시 AI를 활용해 더 높은 프레임과 그래픽 품질을 구현하는 방향으로 이동할 수 있다. 언리얼엔진과 협력... 생태계 확대 추진 Arm은 이번 뉴럴 던 데모에서 언리얼엔진5의 차세대 조명 기술인 '메가라이트(MegaLights)'도 모바일 환경에서 구현했다. 메가라이트는 수백 개 광원을 효율적으로 처리해 보다 사실적인 빛과 그림자 효과를 구현하는 기술이다. 기존에는 PC나 콘솔 수준의 하드웨어가 필요한 기능으로 여겨졌다. Arm은 개발자들이 뉴럴 렌더링을 쉽게 활용할 수 있도록 언리얼엔진 개발사인 에픽게임스와 협력해 전용 플러그인을 제공할 예정이다. 또 오는 7월에는 Arm 신경망 그래픽 개발 키트도 업데이트할 계획이다.

2026.06.17 15:45권봉석 기자

KAIST-MIT-마이크로소프트 "비전 알고리즘 구글 대비 성능 20% 개선"

저해상 시각정보를 제한된 GPU 메모리만으로 고해상도로 손쉽게 복원하는 기술이 개발됐다. 구글이 최근 내놓은 컴퓨터 비전 알고리즘보다 최소 20%이상 성능이 우수하다는 것이 연구진 설명이다. 연구는 김창익 KAIST 전기및전자공학부 교수 연구팀이 미국 MIT 및 마이크로소프트 연구진과 공동으로 제한된 GPU 메모리만으로도 AI의 시각 성능을 원본대비 90%이상 높일 수 있는 '업샘플 애니띵(Upsample Anything)'을 개발했다고 17일 밝혔다. 연구결과는 인공지능 및 컴퓨터 비전 분야 세계 최고 학회인 'CVPR 2026'에서 계산 자원의 효율적 활용을 인정받아 'CVPR 컴퓨트 골드 스타(CVPR Compute Gold Star)'를 수상했다. 골드스타는 전체 논문 가운데 최고를 의미한다. 이와함께 연구 과정 투명성과 재현 가능성 부문 '트랜스패런시 챔피언(Transparency Champion)'에도 선정됐다. 논문 제1저자인 서민석 KAIST 전기및전자공학부 박사과정생은 전화통화에서 "휴머노이드는 대부분 수입 제품을 쓰는데, 비전 분야에서 이미지는 보통 16배 압축해 쓰기 때문에 해상도가 많이 떨어지는데다, 유니트리 등 각 회사들이 자체 기준에 따라 제품을 출시하기 때문에 복원 이미지 품질이 제각각"이라며 "이를 연구 목적에 맞게 바꾸는 추가 작업이 많이 번거롭다"고 설명했다. 서민석 박사과정생은 "예를 들어 자율주행을 하면서 글자를 읽거나 제조공정에서 흠집 등을 제대로 잡지 못하는 어려움이 있다. 이를 해결하기 위해서는 픽셀 100만개의 경우 최소 256회의 연산이 필요하다"며 "이 문제를 해결하기 위해 이 기술을 개발했다"고 말했다. 연구팀은 우선 학습이 필요없는 테스트 시점 최적화(TTO) 기반 업샘플링 프레임워크를 설계했다. 먼저 고해상도 이미지를 저해상도 이미지로 다운샘플링한 뒤, 다시 원본 이미지를 가장 잘 복원할 수 있도록 픽셀별 적응형 가우시안 커널을 최적화한다. 이를 통해 각 픽셀은 주변 영역 공간적 거리와 색상 유사도를 동시에 고려하는 엣지-어웨어(edge-aware) 복원 방식을 학습하게 되며, 이미지 경계와 구조를 유지하면서 고해상도 복원을 수행할 수 있다. 연구팀은 "이 과정은 새로운 값을 생성하는 생성형 방식이 아니라, 기존 특징 정보를 공간적으로 재배치하고 혼합하는 방식이기 때문에 모델 구조나 도메인에 관계없이 높은 범용성을 가진다"고 설명했다. 성능 시험 결과 224×224 해상도 기준 약 0.4초, 1,000×1,000 해상도 기준 3초 수준의 경량 최적화만으로 동작한다. 기존 테스트 시점 최적화 기반 기법 대비 메모리 사용량도 16분의 1에 불과하다는 것. 연구팀은 또 기존 업샘플링 구조인 JBU와 GS 장점을 결합해, 경계 보존 능력과 연속적 공간 표현 능력을 동시에 활용할 수 있는 업샘플링 구조를 제안했다. 이는 픽셀별 방향성과 공간 구조를 반영하는 적응형 업샘플링이라고 연구팀은 부연 설명했다. 김창익 교수는 “적은 메모리 자원으로도 인공지능 시각 정밀도를 크게 높일 수 있는 알고리즘"이라며 "휴머노이드 로봇과 온디바이스 AI 실용화를 앞당길 것"으로 기대했다.

2026.06.17 08:49박희범 기자

엘리스그룹, AICA 국가 AI데이터센터 'GPU 엔진' 맡는다

엘리스그룹이 국가 인공지능(AI) 연구개발을 지원하는 공공 그래픽처리장치(GPU) 클라우드 사업에 앞장선다. 자체 모듈형 AI 데이터센터와 고성능 GPU 인프라를 앞세워 국내 AI 생태계 공용 인프라 구축에 힘을 보태며 국가 AI 경쟁력 강화에 기여한다는 목표다. 엘리스그룹은 광주 인공지능산업융합사업단(AICA)이 추진하는 '2026년 국가 AI데이터센터 고도화 사업' GPU 클라우드 공급사로 선정됐다고 16일 밝혔다. AICA가 추진하는 이번 사업은 국내 기업과 기관, 대학을 대상으로 연구·개발·서비스에 특화된 고성능 AI 컴퓨팅 자원과 서비스를 제공해 국가 AI 산업 경쟁력을 높이는 것을 목표로 한다. 엘리스그룹은 복수 공급사 가운데 한 곳으로 참여해 자사 AI 클라우드 서비스인 '엘리스클라우드'를 통해 GPU 인프라를 제공한다. 협약 기간은 이달부터 12월 말까지 약 7개월이다. 회사는 엔비디아 H100과 최신 GPU인 B200 기반 클라우드 자원을 지원한다. 대규모 AI 학습과 추론에 필요한 인피니밴드 기반 고성능컴퓨팅(HPC) 멀티노드·단일노드 환경을 제공하며 공공기관 활용을 위한 클라우드 보안인증(CSAP) 존도 함께 운영한다. 특히 이번 사업에는 엘리스그룹이 자체 개발한 모듈형 AI 데이터센터 '엘리스 AI PMDC' 기술이 활용된다. 엘리스 AI PMDC는 고밀도 전력 인프라와 고효율 냉각 시스템을 적용해 고성능 GPU를 안정적으로 운영할 수 있도록 설계된 것이 특징이다. 엘리스그룹은 이를 기반으로 서비스수준협약(SLA)에 따른 장애 대응과 보안 모니터링 등 AI 클라우드 운영 전반을 지원할 계획이다. 연구기관과 대학, 기업들이 인프라 구축 부담 없이 AI 연구개발에 집중할 수 있는 환경을 제공한다는 목표다. 김재원 엘리스그룹 대표는 "AICA 국가 AI데이터센터는 국내 AI 생태계 공용 인프라 역할을 하는 만큼, 안정적인 GPU 클라우드 기반을 확보하는 것이 중요하다"며 "이번 사업을 통해 검증된 GPU 클라우드 인프라를 제공해 연구·개발 환경 제약을 줄이고 대규모 인프라 운영 경험을 바탕으로 국내 AI 인프라 고도화와 국가 AI 경쟁력 강화에 기여하겠다"고 밝혔다.

2026.06.16 11:33한정호 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

정부, 서남권에 메모리 팹 4기 구축…5년 내 생산 능력 2배로 키운다

최태원 "AI 데이터센터·반도체에 2100조원 빅베팅"

2년 만에 AI 유니콘 반열 '젠스파크'…한·일 엔터프라이즈 AI 플랫폼 정조준

이재용 "새 팹 후보지 광주 고려"…최태원 "용인 클러스터 12년 앞당겨"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.