• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'NPU'통합검색 결과 입니다. (150건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

글로벌 AI 추론 시장 급성장…한국 NPU 기업, 기회 잡을까

AI 추론 시장이 확대됨에 따라 글로벌 빅테크들은 GPU(그래픽처리장치) 의존도를 줄이고 있다. 가격이 비싸고, 발열량이 높은 GPU를 대신할 차세대 제품을 찾는 것이다. 대안으로 떠오르고 있는 칩이 AI 추론에 특화된 NPU(신경망처리장치)다. AI 연산에 특화된 구조가 낮은 전력으로도 높은 효율을 구사할 수 있게 만들어졌다. 대표적인 글로벌 기업이 미국 쌈바노바(SambaNova)와 그로크(Groq)다. 이들 기업은 이미 독자 생태계를 앞세워 시장 내 입지를 쌓아가고 있다. 이 같은 상황에 국내 업체인 리벨리온과 퓨리오사AI가 본격적으로 도전장을 내밀며 글로벌 NPU 기술 경쟁이 가속화되는 양상이다. AI 추론 시장 성장세...NPU 시장 전망 긍정적 28일 업계에 따르면 글로벌 AI 추론 시장은 가파르게 성장할 전망이다. 시장조사업체 마케츠앤마케츠는 추론 시장이 올해 약 106억달러(약 14조7천976억원)를 기록한 뒤, 오는 2030년 약 255억달러(약 35조5천980억원)까지 성장할 것으로 내다봤다. 연평균 약 19%에 달하는 성장률이다. 이에 따라 추론형 NPU 시장도 동반 성장할 것으로 점쳐진다. 다양한 AI 애플리케이션이 더 많은 추론 처리량, 낮은 지연, 높은 에너지 효율을 요구하며, 이를 가장 잘 대응할 수 있는 것이 추론형 NPU이기 때문이다. 삼일PwC경영연구원은 보고서를 통해 “AI에 사용되는 반도체 중 CPU, GPU 시장은 이미 기술 성숙 단계 진입했으며, 최적화된 저전력·고효율 ASIC(주문형반도체) 중심의 추론형 AI 반도체(NPU) 시장이 성장 중”이라고 분석했다. 美 쌈바노바·그로크, 자체 시장 구축 중 특히 NPU 시장에서 두각을 드러내는 업체는 쌈바노바와 그로크다. 양사 모두 미국의 스타트업이다. 먼저 쌈바노바는 데이터플로우 아키텍처 기반의 NPU와 자체 소프트웨어를 통합 제공하며 초대형 언어모델(LLM) 훈련과 추론을 아우른다. 고객에게 하드웨어뿐 아니라 모델·플랫폼까지 묶어 공급하는 방식으로 미국 정부, 금융기관 등 대형 고객을 확보했다. 업계 안팎에서는 자체적인 생태계를 구축했다는 점을 특징으로 지목한다. 그로크는 추론에 극단적으로 특화된 칩을 양산한다. 자체 칩과 소프트웨어를 통해 수백만 토큰 단위의 실시간 추론 속도를 구현하며, 클라우드 기반 'LLM 서빙 서비스'를 사업 모델로 삼았다. 대규모 데이터센터에서 고속 검색·RAG(검색증강생성) 서비스에 적합하다는 평가다. 하드웨어 판매보다 클라우드 추론 서비스로 수익을 내고 있다. 韓 AI반도체 도약 조건은 효율성·맞춤형 시장 공략...리벨리온, 리벨쿼드 공개 업계 안팎에서는 국내 AI 반도체 기업들이 글로벌 경쟁에서 승부를 내려면 두 가지 전략에 집중해야 한다고 보고 있다. 첫째, 전력 효율성에서 확실한 우위를 확보해야 한다는 점이다. 데이터센터의 전력 소비와 운영비용이 AI 확산의 최대 걸림돌로 떠오르는 상황에서, 효율이 곧 경쟁력으로 직결된다는 주장이다. 둘째, 맞춤형 시장 공략이다. 엔비디아처럼 범용 GPU로 모든 영역을 장악하기는 현실적으로 어렵다. 대신 통신사, 공공기관, 금융, 국방 등 특정 산업에 특화된 '맞춤형 추론형 NPU'로 영역을 넓히는 것이 현실적인 전략이다. 실제로 국내 AI반도체 스타트업인 리벨리온과 퓨리오사AI 모두 저전력·고효율 NPU를 앞세워 데이터센터·통신사·공공기관 등 특화 수요처를 공략하고 있다. 이런 가운데 리벨리온은 현지시간 27일 미국 핫칩스에서 차세대 NPU 리벨 쿼드(Rebel-Quad)를 공개했다. 이 칩은 삼성전자 4nm(나노미터, 10억분의 1m) 공정을 통해 양산되며, 엔비디아 블랙웰 수준의 성능을 자랑한다. 그러면서도 에너지 부담은 획기적으로 줄여준다. 박성현 리벨리온 대표는 “AI 산업은 GPU라는 단일 AI 하드웨어만으로는 감당하기 어려울 정도로 빠르게 커졌다”며, “리벨쿼드는 B200급 플래그십 GPU에 버금가는 성능을 유지하면서도 에너지 부담을 획기적으로 줄일 수 있는 지속가능한 AI시대의 대안으로, 리벨리온은 향후 초거대 AI 모델을 누구나 더 쉽고 효율적으로 활용할 수 있는 시대를 열어갈 것”이라고 말했다.

2025.08.28 09:14전화평

리벨리온, 사우디 법인 설립…중동 '소버린 AI' 시장 공략 속도

리벨리온은 AI반도체 스타트업 최초로 사우디아라비아의 수도 리야드에 현지 단독 법인을 설립한다고 19일 밝혔다. 이를 통해 아람코 데이터센터 내 제품 공급과 현지 기업과 파트너십 등 사업 전개에 힘을 주겠다는 전략이다. 리벨리온은 지난해 7월 사우디 아람코의 CVC인 Wa'ed Ventures(와에드 벤처스)로부터 전략적 투자를 유치했으며, 이후 아람코와 AI반도체 공급을 전제로 한 MOU를 체결했다. 이후 아람코의 데이터센터에 랙(Rack) 단위 제품을 공급하고, 기술검증(PoC)를 성공적으로 진행해 마무리 단계에 접어들었으며, 이 과정에서 단순 기능 검증을 넘어 실제 운영 환경에서의 성능과 호환성을 입증했다. 리벨리온은 아람코 엔지니어 및 현지 기술지원 파트너사와 긴밀하게 협력하며 기술 세션과 실습을 병행하고 있으며, 이러한 협업 구조를 바탕으로 향후 대규모 도입과 장기 파트너십을 확보할 전망이다. 리벨리온은 아람코와 성공적인 협업 경험과 더불어 한국 주요 통신사와 이뤄낸 AI반도체 상용화 성과를 기반으로 사우디 현지 주요 통신사와 파트너십 논의를 진행 중이다. 또한, 중소 규모 ICT 기업과도 협력해 사업 포트폴리오를 다변화하고 있다. 더불어 마벨과 손잡고 사우디를 포함한 중동 시장 주요 타깃으로 커스텀 AI인프라 사업 추진에 착수했다. 최근 사우디를 비롯한 중동 전역에서는 데이터 주권 확보 및 자국어 AI 모델 구축을 위한 '소버린 AI' 수요가 폭발적으로 증가하고 있다. 특히 비교적 저렴한 에너지와 정부 주도의 대규모 데이터센터 인프라 구축 계획을 바탕으로 글로벌 AI 기업 뿐 아니라 기술력을 갖춘 스타트업에게도 기회가 열리고 있다. 최근 사우디 휴메인(HUMAIN)은 2030년까지 대규모 데이터센터 구축 계획을 발표했으며, 오픈AI와 G42, 오라클 역시 아랍에미리트 아부다비에 대규모 데이터센터 캠퍼스를 조성 중이다. 사우디는 대면 소통과 밀접한 사업 관계를 중시하는 시장인 만큼, 리벨리온은 이에 맞춘 현지화 전략의 일환으로 법인을 설립했다. 이번 법인 설립을 통해 사우디 기업·기관과 진행 중인 도입 테스트와 공동 사업을 한층 가속화하고, 거점을 기반으로 인력 채용과 적극적인 사업을 전개하며 지속적인 매출 성과를 창출할 계획이다. 사우디 사업 전략을 총괄하는 엄채영 리벨리온 신사업 전략 이사는 “사우디는 현지화가 핵심인 시장으로 현지 법인의 중요성이 매우 크다”며 “리벨리온은 지난해부터 현지 주요 기업·기관과 긴밀히 협력해 온 경험을 바탕으로 체계화된 영업 및 기술지원 체계를 갖추는 한편, 적극적인 현지 네트워킹으로 매출 창출에 속도를 낼 것”이라고 말했다. 박성현 리벨리온 대표는 “이번 법인 설립은 급성장하는 소버린 AI 수요에 대응하고 의미있는 성과를 만들어가는 본격적인 출발점이 될 것”이라고 밝혔다.

2025.08.19 09:36장경윤

퓨리오사AI, 베트남 CMC코리아와 전략적 업무협약 체결

AI 반도체 팹리스 기업 퓨리오사AI는 최근 베트남의 선도적인 IT 서비스와 DX 솔루션 제공업체 CMC글로벌의 한국 법인인 CMC코리아와 전략적 협력 양해각서(MOU)를 체결했다고 14일 밝혔다. 이번 협약을 통해 양사는 퓨리오사AI의 고성능 NPU(신경망처리장치)와 CMC코리아의 소프트웨어 개발·운영 서비스 역량을 결합해, 한국과 베트남을 포함한 글로벌 시장에서 AI 솔루션 공동 개발과 사업 확장을 추진하기 위한 기반을 마련했다. 또한 한국·베트남의 각사가 보유한 현지 네트워크 및 채널을 적극 활용해 시장 확대를 지원하며, AI 반도체 아키텍처와 최적화 기술, 대규모 소프트웨어 프로젝트 운영 노하우를 상호 공유할 계획이다. 양사의 고객·파트너 네트워크를 바탕으로 한 교차 마케팅과 잠재 고객 발굴도 병행해 추진하는 등 소프트웨어 개발, IT 운영 서비스, AI 플랫폼 등 다양한 산업 분야에서 긴밀히 협력할 예정이다. 이를 통해 퓨리오사AI와 CMC코리아는 추후 산업·국가별 맞춤형 AI 솔루션으로 협력 범위를 단계적으로 확대한다는 계획이다. MOU 체결식에는 퓨리오사AI 백준호 대표와 호 탄 퉁(Ho Thanh Tung) CMC글로벌 이사장, 당 응옥 바오(Dang Ngoc Bao) CMC글로벌 대표, 권영언 CMC코리아 대표 등이 참석했다. 백준호 퓨리오사AI 대표는 “동남아 ICT 강자인 CMC와의 협업을 통해 신흥시장 공략에 속도를 가하겠다”며 “고성능·고효율 AI 반도체에 대한 수요가 전지구적으로 급증하는 가운데 글로벌 선두주자로 도약할 것”이라고 강조했다. 당 응옥 바오 CMC글로벌 대표는 “퓨리오사AI의 NPU가 당사의 디지털 솔루션을 확장하는 데에 크게 기여하리라 믿는다”며 “이번 협력은 베트남의 소프트웨어 전문성과 한국의 반도체 혁신을 결합해 AI 애플리케이션 개발과 상용화 속도를 앞당기고, 아시아·태평양 시장에 새로운 기술 표준을 제시할 것”이라고 말했다.

2025.08.14 09:20장경윤

국가AI컴퓨팅센터 3차 공모 앞두고 조건 완화 추진…문턱 낮춘다

'국가 인공지능(AI) 컴퓨팅센터' 구축 사업이 두 차례 유찰 끝에 조건을 완화해 재추진될 전망이다. 정부는 민간 참여 확대를 위해 지분 구조, 매수청구권(바이백), 국산 AI 반도체 신경망처리장치(NPU) 도입 의무 등 핵심 요건을 대폭 손질하는 방안을 마련 중인 것으로 알려졌다. 12일 업계에 따르면 과학기술정보통신부는 이르면 이달 말 국가AI컴퓨팅센터 구축 사업 3차 공모 계획을 발표할 예정이다. 앞서 정부는 민관 합작 특수목적법인(SPC)을 설립해 2027년까지 1엑사플롭스(EF) 이상 성능을 갖춘 AI 데이터센터를 비수도권에 짓고 이를 통해 국내 기업과 기관의 AI 개발·활용을 지원하는 총 2조5천억원 규모의 프로젝트를 추진해왔다. 하지만 지난 5월과 6월 두 차례 공모에서 지원자가 단 한 곳도 없으면서 일정이 최소 두 달 이상 지연됐다. 당초 11월 사업 착수를 위해 10월까지 SPC 설립을 마친다는 로드맵은 사실상 불가능해진 상황이다. 정부는 유찰의 주된 원인으로 지목된 세 가지 조항의 완화를 검토하고 있다. 우선 SPC 지분 구조를 조정해 공공이 51%를 확보하는 기존안 대신 민간 지분 비율을 높이는 방안을 논의 중인 것으로 알려졌다. 이와 함께 정부가 원할 경우 민간이 공공지분을 다시 사들여야 하는 바이백 조건 역시 완화해 기업 부담을 줄이는 방안을 검토 중이다. 기존 조건에서는 수천억원을 투자하고도 경영권을 확보하지 못한 채 추가 공공 투자금까지 부담해야 하는 구조가 민간 참여를 가로막았다는 지적이 많았다. 특히 2030년까지 센터 내 AI 반도체의 절반을 국산으로 채워야 하는 의무 조항도 삭제될 가능성이 크다는 관측이 나온다. 업계는 엔비디아 GPU를 선호하는 수요가 절대적인 현실에서 검증된 상용 실적이 부족한 국산 NPU를 대량 도입하는 것은 부담이라는 입장이다. 이에 정부는 해당 의무를 없애는 대신 별도 예산으로 국산 반도체를 구매하거나 민간 사업자가 NPU 활용 목표를 달성하면 인센티브를 제공하는 방안을 검토 중인 것으로 전해졌다. 과기정통부 관계자는 "국산 AI 반도체 생태계 성장을 위한 별도 지원책을 마련하고 민간이 안정적으로 참여할 수 있는 구조를 고려 중"이라고 설명했다. 과기정통부는 이같은 조건 완화를 통해 3차 공모 유찰을 막겠다는 방침이다. 다시 한번 재유찰되면 센터 개소 시점이 2028년 이후로 더 늦춰지고 사업 추진에 차질이 불가피할 것으로 예상된다. 업계에서도 사업 구조가 현실적으로 조정되면 참여 유인이 커질 것이라는 기대가 나온다. 다만 여전히 초기 투자 부담과 불확실한 수익모델 등의 진입 장벽이 남아 있다. 업계 관계자는 "조건이 완화되면 기업들의 참여가 확대될 것"이라며 "추가적으로 수요처 확보와 장기적인 수익모델 설계도 뒷받침될 필요가 있다"고 말했다.

2025.08.12 10:05한정호

퓨리오사AI, 1700억원 투자 유치…"AI 칩 양산 준비"

AI 반도체 기업 퓨리오사AI는 시리즈 C 브릿지 라운드에서 총 1천700억원 규모의 투자를 유치했다고 31일 밝혔다. 이로써 퓨리오사AI는 국내 딥테크 기업 중 드물게 기업가치 1조원을 돌파하며 유니콘 반열에 올라섰다. 이번 라운드는 프리 머니(pre-money) 기준 8천300억원의 기업가치를 바탕으로, 총 40여개 기관이 참여했다. 국책금융기관인 산업은행(300억)과 기업은행(100억) 및 계열사인 IBK증권(60억), IBK벤처투자(50억), 유진-성장금융펀드(116억)에 더해, 케이스톤파트너스(200억), 피아이파트너즈(132억), 대성창업투자(50억) 등의 사모펀드(PE), 그리고 카카오인베스트먼트(30억) 등이 참여했다. 퓨리오사AI는 그동안 시드 투자유치부터 시리즈 C까지 7년간 유치한 누적 투자금에 상응하는 규모의 투자를 이번 단일 C 브릿지 라운드에서 유치하며 시장으로부터의 꾸준한 기대감 및 신뢰를 입증했다. 기존 투자자들이 재참여해 퓨리오사AI에 대한 변함없는 신뢰를 보여준 가운데, 케이스톤파트너스, 넥스트랜스, 대성창투 등 신규 투자자들이 퓨리오사AI의 기술력과 성장 가능성에 대한 기대를 기반으로 참여했다. 특히 이번 라운드에서는 기술 및 시장 리스크가 높은 초기 기업에는 잘 투자하지 않는 사모펀드(PE)가 총 400억원 규모로 복수 참여해 눈길을 끈다. 퓨리오사AI가 자본시장으로부터 기술 및 제품의 시장성을 인정받아 성장(Growth) 단계 기업으로 도약했다는 의미로 풀이된다. 실제로 생성형 AI 시장이 엔비디아 GPU 의존도를 줄일 수 있는 대안을 모색하는 흐름 속에서 퓨리오사AI에 대한 글로벌 시장의 관심은 나날이 커져가고 있다. 올 7월 퓨리오사AI는 자사의 2세대 인공지능 반도체 RNGD(이하 레니게이드)를 LG AI연구원의 대규모 언어모델인 EXAONE(엑사원)에 공급하면서 성공적으로 기업 엔터프라이즈 시장에 진출했다. 공급을 위한 선정 과정에서 레니게이드가 LG 측의 고성능 조건을 충족시키는 동시에 기존 GPU 대비 2.25배 높은 전력당 성능을 보인 만큼, LG 엑사원 사례는 포춘 글로벌 500대 기업들을 대상으로 유력한 레퍼런스로 작용할 전망이다. 퓨리오사AI는 이번 투자금을 레니게이드 양산과 3세대 제품 초기 개발에 사용할 예정이다. 레니게이드가 본격적으로 대형 엔터프라이즈 시장에 진입한 만큼 선제적인 다수의 물량 확보가 필수적이고, 더 나아가 야심찬 목표를 가지고 있는 차세대 칩을 계획하고 있기 때문이다. 백준호 퓨리오사AI 대표는 “투자 유치는 레니게이드 양산에 진입하는 중요한 시점에 자본시장이 당사의 기술력과 비전에 대해 강한 신뢰를 보내고 있다는 뜻이라고 생각한다. 반드시 글로벌 엔터프라이즈를 대상으로 매출 확대를 이끌어 내겠다”며 “정부의 AI 스타트업 스케일업을 위한 모험자본 확대 기조 역시 매우 고무적이다”라고 밝혔다. 백 대표는 이어 “한국이 미국, 중국과 함께 AI G3 강국으로 도약하기 위해서는 AI 반도체의 글로벌 경쟁력 확보는 단순한 목표가 아니라 반드시 해내야 할 사명”이라고 덧붙였다.

2025.07.31 09:43장경윤

정부 AI 인프라 정책에 외면받는 '국산 서버'…"NPU와 함께 풀스택 고려해야"

정부가 인공지능(AI) 경쟁력 강화를 위한 국가 인프라 확충 정책을 본격 추진하는 가운데 국산 AI 서버 업계에선 그래픽처리장치(GPU)나 신경망처리장치(NPU)뿐 아니라 서버·스토리지 등 AI 인프라 전반을 아우르는 풀스택 관점의 전략이 필요하다는 목소리가 거세지고 있다. 정부가 국산 AI 반도체 실증에 집중하고 있지만 정작 이를 담아 구동할 서버 인프라 산업은 외산 일색이라는 현실이 재조명되며 정책 사각지대라는 지적도 잇따른다. 21일 업계에 따르면 과학기술정보통신부는 두 차례 유찰됐던 국가AI컴퓨팅센터 구축 사업의 재공모를 준비하며 기업 및 부처 간 협의를 통해 GPU 자원에 대한 대규모 구매와 클라우드 위탁 운영 방안 등을 검토 중이다. AI 학습과 추론에 필요한 컴퓨팅 자원을 대규모로 제공하겠다는 취지는 긍정적이나 업계 일각에선 이번 기회에 국산 서버 생태계도 함께 육성해야 한다는 주장이 제기되고 있다. 현재 국내 AI 서버 시장은 델·HPE·레노버 등 외산 기업들이 과점한 상황이다. 국내 기업들은 대부분 외산 서버를 리브랜딩해 공급하거나 제한된 모델만을 자체 설계·제조하는 수준에 머물고 있다. 기술적으로는 글로벌 수준과의 격차를 상당 부분 좁혔지만 여전한 공공 조달 관행, 낮은 인지도, 외산 선호 등의 이유로 실질적인 공급 기회를 확보하지 못하고 있다는 게 업계의 토로다. 특히 GPU 기반 AI 인프라 확산이 본격화되면서 서버는 외산, 반도체만 국산이라는 구조가 고착화될 수 있다는 우려도 나온다. 국내 서버 업체 한 대표는 "국산 서버 제조사들은 이미 공공 조달 시장에 x86 아키텍처 기반 제품을 다수 등록해 놓고 있지만, 시스템 통합(SI) 업체 중심의 총액계약이 일반화되면서 직접 공급 기회는 제한적"이라며 "여기에 공공 발주자들의 외산 선호까지 겹치면서 국산 제품의 입지가 더욱 좁아지고 있다"고 말했다. 실제 행정안전부의 '2024년도 공공부문 정보자원 현황 통계보고서'에 따르면 국산 서버의 공공기관 점유율은 28.15%에 그쳤다. 이외의 스토리지는 4.34%, 백업 장비는 4.01% 등으로 조사되며 대부분의 하드웨어(HW) 유형에서 외산 비율이 높게 나타났다. 국산 기술력이 일정 수준 이상 올라섰음에도 불구하고 인지도와 신뢰도를 넘는 벽은 여전히 높다는 게 공통된 시각이다. 이 가운데 정부는 최근 국산 AI 반도체인 NPU를 중심으로 민간 클라우드 기업과 컨소시엄을 구성하는 실증 사업을 추진하고 앞으로 구축될 국가AI컴퓨팅센터 내 NPU 점유율 확대 등 정책 지원을 집중 중이다. 이에 정부가 AI 기술 자립을 목표로 '소버린 AI' 전략을 실행하나 국산 AI 반도체가 실질적으로 탑재될 서버 인프라에 대한 정책 지원은 뒷전이라는 지적이 나온다. 업계 관계자는 "AI 생태계가 GPU나 NPU로만 구성되는 것이 아니다"라며 "이를 구동하고 관리하는 서버· 스토리지·운영 소프트웨어(SW)가 함께 고려돼야 풀스택 관점의 AI 기술 자립이 가능하다"고 강조했다. 아울러 국내 HW 업계는 AI 정책 수혜가 SW와 클라우드 위주로 쏠리는 현 구조도 개선해야 한다고 주장한다. 정부가 현재 서비스형 소프트웨어(SaaS), 클라우드 서비스 확산, 국가 AI 모델 육성에 정책 역량을 집중하며 민간 SW 수요만을 부각시키고 있다는 비판이다. 업계에 따르면 국산 서버 제조사는 메인보드와 펌웨어를 자체 설계하고 글로벌 수준의 인증을 확보하는 등 기술 경쟁력을 끌어올렸지만 정부 차원의 연구개발(R&D) 사업 지원은 사실상 2010년대 중반 이후 끊긴 상태다. 일각에선 정부의 '중소 기업자 간 경쟁 제품 제도' 등 일부 제도적 지원 기반이 존재하긴 하나 실질적으로는 외산 중심의 조달 관행을 깨기 어렵다는 회의론도 나온다. 실제 일부 기관은 조달 예외조항을 근거로 외산 제품을 구매하거나 입찰 조건을 통해 국산 제품을 사실상 배제하고 있는 것으로 알려졌다. 국산 HW 업계는 이에 대응하기 위해 기업 간 공동 기술지원 체계를 논의하고 있지만 정책적 뒷받침 없이는 자생이 어렵다는 견해다. 국내 서버 업체 한 대표는 "AI 경쟁력의 핵심은 GPU도, 서버도 아닌 전체 인프라의 균형 있는 발전"이라며 "정부가 AI 반도체에만 시선을 둘 게 아니라 이들을 실제 운용할 기반 인프라 생태계에도 관심을 가져야 한다"고 강조했다. 또 다른 관계자는 "잘 만든 SW 하나가 매력적인 서비스로 이어질 수 있지만 그것도 안정적인 HW가 뒷받침될 때 가능하다"며 "이제는 국산 AI·SW만큼이나 HW도 국가 전략산업으로 키워야 할 시점"이라고 말했다.

2025.07.21 11:17한정호

퀄컴 스냅드래곤 PC, 국내 AI PC 시장 점유율 10% 달성

'윈도 PC 성능 리더십'을 내세우며 지난해 6월 출발한 퀄컴 스냅드래곤 X 시리즈 PC가 올 상반기 국내 AI PC 시장에서 점유율 10%를 달성했다. 이는 윈도11 코파일럿+ 기능을 온전히 활용할 수 있는 45 TOPS(1초당 45조번 연산)급 신경망처리장치(NPU)와 배터리 지속시간 등을 앞세운 결과로 평가된다. 반면 전체 노트북 시장으로 범위를 넓히면 스냅드래곤 기반 AI PC 점유율은 1%를 조금 넘는 수준에 머물러 있다. 일반 소비자는 게임에서, 기업은 기존 업무용 소프트웨어에서 호환성 문제를 우려하는 것으로 추정된다. 스냅드래곤 노트북, 국내 AI PC 시장서 10% 확보 11일 커넥트웨이브 가격비교서비스 다나와 집계 자료에 따르면, 올 상반기 NPU를 탑재한 AI PC(노트북) 판매량 중 스냅드래곤 탑재 제품 비율은 10% 가량으로 집계됐다. 다나와에 따르면 스냅드래곤 기반 노트북 판매량은 졸업·입학 시즌을 낀 노트북 최성수기로 꼽히는 2~3월까지 급격히 상승했다. 올 1월 판매량 기준으로 2월 판매량은 1.8배, 3월 판매량은 3.35배 늘어나 최고치에 달한 뒤 2분기부터 하향세로 돌아섰다. 그러나 전체 노트북 시장에서 스냅드래곤 기반 제품 비중은 1%를 약간 넘어서는 수준에 그쳤다. 다나와가 제공하는 지난 주 기준 데이터로 추정하면 퀄컴 헥사곤 NPU를 탑재한 노트북 판매량 점유율은 약 1% 가량이다. 뉴럴 엔진을 탑재한 애플 맥북프로·맥북에어 등 제품 판매량은 2%로 더 높다. 호환성 우려로 플랫폼 전환 망설이는 기업들 스냅드래곤 기반 AI PC 보급을 가로막는 가장 큰 요소는 기존 x86 프로세서용 소프트웨어 구동시 발생하는 호환성 문제다. 퀄컴 스냅드래곤 AI PC는 인텔·AMD 등으로 만들어진 각종 응용프로그램을 윈도11 내장 번역 기능으로 실행할 수 있다. 그러나 하드웨어 드라이버 등을 활용하는 게임이나 가상사설망(VPN), 보안 소프트웨어나 프린터 드라이버에서 문제가 생길 수 있다. 이 문제를 해결하기 위해서는 외부소프트웨어개발사(ISV)의 협력이 절대적으로 필요하다. 익명을 요구한 주요 글로벌 제조사 관계자는 "기업에서 PC 도입시 호환성 문제로 실무자와 결정권자의 의견이 갈리는 경우가 많다"고 설명했다. 이 관계자는 "특히 금융권 등에서는 기존 소프트웨어 호환성을 중요하게 따지며 문제가 생겼을 경우 결정권자가 책임을 져야 한다. 배터리 지속시간이나 NPU 성능만으로 플랫폼 전환을 결정하기 어려운 것이 사실"이라고 덧붙였다. 호환성 해결 지속 노력 퀄컴은 지난 5월 말 롯데하이마트와 협업해 '스냅드래곤 X 시리즈 PC존'을 운영하는 등 국내 시장 저변 확대를 위한 다양한 시도를 진행하고 있다. 그러나 소프트웨어 생태계 확장과 호환성 문제는 여전히 해결해야 할 과제로 남았다. 11일 퀄컴 관계자는 "현재 스냅드래곤 X 시리즈에서는 750개 이상의 Arm 네이티브 응용프로그램이 실행되고 있으며 이 중 100개 이상은 기업용이다. 또 1천400개 이상의 개임을 구동 가능하다"고 설명했다. 이어 "퀄컴은 스냅드래곤의 PC 시장 기회에 여전히 큰 기대를 걸고 있으며, 2029 회계연도까지 40억 달러(약 5조 5천억원) 매출 달성을 향해 꾸준히 나아가고 있다. 새로운 기기와 시장 및 유통 채널 확대, 기업용 시장 진출, 응용프로그램 생태계 확장을 위해 전력을 다하고 있다"고 덧붙였다.

2025.07.11 16:12권봉석

KAIST-하이퍼엑셀, NPU 신기술 공개…"챗GPT 추론성능 60% 개선"

챗GPT의 추론 성능을 60%이상 개선할 수 있는 신경망처리장치(NPU) 핵심기술이 개발됐다. KAIST는 전산학부 박종세 교수 연구팀과 (주)하이퍼엑셀(전기및전자공학부 김주영 교수 창업기업)이 챗GPT와 같은 생성형AI 클라우드에 특화된 고성능·저전력 NPU 핵심기술을 새로 설계하는데 성공했다고 4일 밝혔다. 핵심은 2가지다. 키-값(KV) 캐시를 경량화하는 양자화 (quantization) 알고리즘과 이를 가속하는 NPU 기반 하드웨어 모듈(아키텍처)을 새로 개발했다. 트랜스포머 기반 언어 모델 추론 과정에서 생성되는 KV 캐시는 매 요청, 매 토큰마다 생성돼 누적되기 때문에 대규모 시스템에서는 메모리 용량과 대역폭 사용량 대부분을 차지한다. 이로인해 시스템 성능 병목을 초래한다. 연구자들이 이를 타개하기 위한 방편으로 최신 GPU를 최대한 많이 확보하려고 애쓰는 이유다. 연구팀은 이같은 문제 해결을 위해 다양한 모델 및 입력 데이터셋 KV 캐시 값 분포를 분석하고 이를 특성화했다. 연구팀은 "이를 바탕으로 정확도 손실을 최소화하는 양자화 기법을 새로 설계했다"며 "양자화된 KV 캐시 평균 비트 폭 (bitwidth)를 줄이기 위해 양자화가 어려운 값들을 효과적으로 처리하는 경량화 기법도 함께 설계했다"고 설명했다. 하드웨어 모듈은 기존 NPU 아키텍처 연산 로직을 변경하지 않으면서도 메모리 인터페이스와 통합될 수 있도록 설계했다. 연구팀은 이 모듈에 제한된 메모리 대역폭 및 용량을 효율적으로 활용하기 위한 페이지 단위 메모리 관리 기법과 양자화된 KV 캐시에 최적화된 새로운 인코딩 기법 등을 개발, 적용했다. 연구팀은 "이를 적용한 NPU 디바이스는 최신 GPU 기반 기존 경량화 기법 대비 추론 성능(초당 생성 토큰 개수)과 정확도가 60%이상 우수했다"며 "전력 소모도 기존 대비 44%이상 효율성을 확보했다"고 부연 설명했다. 박종세 교수는 "메모리 사용의 대부분을 차지하는 KV 캐시를 양자화함으로써, 적은 수의 NPU 디바이스 만으로 동일 수준의 AI 인프라를 구성할 수 있게 됐다"며 "생성형 AI 클라우드 구축 비용을 크게 절감할 수 있을 것"이라고 말했다. 박 교수는 또 "능동적인 실행형 AI인 '에이전틱 AI '등으로 대표되는 AI 대전환(AX) 환경에서도 핵심 역할을 할 것"으로 기대했다. 연구는 KAIST 김민수 연구생(박사과정)과 ㈜하이퍼엑셀 홍성민 박사가 공동 제1 저자로 진행했다. 연구결과는 지난 달 21일부터 25일까지 일본 도쿄에서 열린 '2025 국제 컴퓨터구조 심포지엄(ISCA)'에 발표됐다. 예산은 한국연구재단 우수신진연구자지원사업, 정보통신기획평가원(IITP), 인공지능반도체대학원지원사업 지원을 받았다.

2025.07.04 09:01박희범

SK텔레콤 AI 서비스, 리벨리온 AI 반도체로 구동

SK텔레콤은 AI반도체 스타트업 리벨리온과 '에이닷 전화 통화요약'과 같은 주요 AI 서비스에 리벨리온의 NPU를 적용하기 위한 테스트를 진행 중이라고 25일 밝혔다. SK텔레콤과 리벨리온은 데이터센터용 AI 반도체 아톰(ATOM)을 탑재한 서버를 ▲에이닷 전화 통화요약 ▲PASS 스팸필터링 ▲PASS금융비서 ▲엑스칼리버 등에 테스트 중이다. 테스트 결과에 따라 아톰의 성능 강화판인 '대규모 AI 추론용 AI 반도체 아톰 맥스(ATOM-Max)'를 이들 서비스에 연내 상용 적용하는 것을 목표로 하고 있다. 또한 테스트 결과를 토대로 향후 리벨리온 NPU 서버 도입을 지속적으로 확장할 계획이다. 양사는 이를 두고 국내 AI 생태계 자립에 큰 의미를 가지고 있다고 설명했다. 에이닷 전화 통화요약은 SK텔레콤의 LLM 모델 에이닷엑스(A.X)를 기반으로 하고 있어, 국산 AI 반도체인 리벨리온의 아톰을 통해 상용 서비스 될 경우 '국산 LLM'이 '국산 NPU'를 통해 서비스되는 소버린 AI가 이뤄진다는 설명이다. 특히 SK텔레콤 자체 개발한 한국어 특화 LLM 에이닷엑스 4.0은 현존하는 LLM 중 최고 수준의 한국어 이해 성능을 확보하고 있어 국내 비즈니스 환경에 최적화된 모델이라는 평가를 얻고 있다 양사는 테스트를 시작으로 협력 범위를 지속 확대해 국내 AI 생태계의 자립성을 강화해 나갈 계획이다. 이상민 SK텔레콤 성장사업추진실장은 “국가 간 AI 기술 경쟁이 심화되고 있는 이 때, 국내 AI 생태계 자립성 강화는 개별 기업이 아닌 국가의 경쟁력을 좌우할 수 있는 중요한 요소”라며 “앞으로도 AI 데이터센터, LLM, AI 반도체 등을 포함한 국내 AI 생태계의 역량 강화를 위해 노력할 것”이라고 말했다. 박성현 리벨리온 대표는 “국산 AI반도체가 SKT의 국산 LLM 기반 서비스에 적용될 수 있게 된 것은 기술적 완성도를 넘어, 국내 AI 생태계 자립을 실현하는 중요한 이정표”라며, “리벨리온은 앞으로도 안정적이고 에너지 효율적인 AI 인프라를 통해, 대한민국이 AI 세계 3대 강국으로 도약하는 데 기여하겠다”고 밝혔다.

2025.06.25 09:03박수형

정부-학계, 국산 NPU 육성 본격화…실증부터 인재양성까지

정부가 국산 AI반도체에 대한 지원을 대폭 늘리고 있다. 추경(추가경정예산)을 두차례 진행해 약 800억원 규모 예산을 NPU(신경망처리장치)에 투자하는 것이다. 이에 더해 학계에서는 국산 AI반도체를 AI 개발에 활용하며, 국산 칩 상용화의 단초를 다지고 있다. 정부, NPU 사업에 794억원 투자 23일 업계에 따르면 정부는 최근 국무회의에서 제2차 추경안을 의결했다. 이번 추경은 국산 NPU 상용화 개발 지원 예산 300억원을 추가하는 내용을 골자로 한다. 지난 1차 추경 금액인 494억원까지 더해, 총 794억원의 지원금이 국산 NPU 조기 상용화에 투입된다. 정부는 구체적으로 ▲AI 컴퓨팅 실증 인프라 고도화 ▲인공지능 전환(AX) 실증 지원 ▲AI 반도체 사업화 적시 지원 ▲AI 반도체 해외 실증 지원 ▲국산 AI 반도체 기반 디바이스 AX 개발·실증 등에 예산을 투입한다. 특히 AI반도체 업체들이 글로벌 시장에 진출할 수 있도록 기술을 실증하는데 사업 역량이 집중된다. 정보통신사업진흥원(NIPA)은 해외 실증 지원 추경 사업에 참여할 컨소시엄을 총 4개 선정한다. 서버형 2개, 엣지형 2개 등 총 4개 지원 사업에 1개씩 컨소시엄을 참여시킨다는 구상이다. 사업 대상은 기존에 참여하던 리벨리온(서버형), 딥엑스(엣지형) 외에도 퓨리오사AI가 서버형 지원 사업에 참여하는 방안을 검토하는 걸로 전해진다. 한편, NIPA는 다음달 초 컨소시엄을 선정할 예정이다. 서울대, 국산 NPU로 융합형 인재 양성 다만 NPU를 현장에서 바로 활용할 수 있는 인재는 부족한 실정이다. AI 기술을 이해하면서도 반도체 구조와 시스템을 고려하는 HW(하드웨어)-SW(소프트웨어) 융합 인재가 없기 때문이다. 최기창 서울대학교 교수는 “현재 대학 교육은 대부분 AI와 반도체를 분리된 전공으로만 다루고 있다”며 “실제 산업 환경에서 사용되는 도구나 플랫폼에 대한 경험이 부족한 이유”라고 설명했다. 이에 서울대 차세대반도체 혁신융합대학은 올해 2학기부터 국산 AI반도체를 활용한 'We-Meet' 프로그램을 수업에 본격 도입한다. 국산 NPU의 활용 사례를 늘리면서도, AI반도체 전문 인재를 양성하기 위함이다. 수업은 크게 세가지로 분류된다. 먼저 국산 AI반도체 기반 LLM(대규모 언어모델) 실습 수업이다. 서울대 규장각 데이터인 조선왕조실록을 기반으로 수업이 진행되며, 단순히 생성형 AI 결과를 보는 데 그치지 않고 학생들이 직접 프롬프트(AI 모델에 텍스트 지시) 설계에 참여한다. 결과가 나오면 직접 분석하고, 생성형 AI 구조와 작동 원리를 실습 중심으로 학습한다. 이 때 퓨리오사AI에서 양산한 '레니게이드'를 수업에 활용한다. 실제 인프라 환경부터 모델 구현까지 익힐 수 있는 셈이다. 이혁재 서울대 반도체공동연구소장은 “국산 칩인 퓨리오사AI의 반도체로 AI가 잘돌아간다는 걸 보여줄 수 있는 기회”라고 말했다. 두번째는 '반도체 산업 활용 AI 최적화 기술과 MLOps 플랫폼' 수업이다. 이 수업은 반도체 제조 과정에서 실제로 사용되고 있는 품질검사 AI 기술을 교육과정에 반영한 케이스다. 학생들은 공개 가능한 반도체 제품 이미지 데이터셋을 활용해 AI 모델을 학습한다. 최 교수는 “수업 중 진행되는 MLOps 플랫폼과 API 연동 실습은 실제 기업들이 운영 중인 생산 환경과 유사한 구조”라며 “실무적인 성격이 강하다”고 말했다. 세번째 수업은 'NPU 기반 AI 추론 및 응용이다. 요즘 급부상하고 있는 온비다이스 AI, 엣지 컴퓨팅을 다루는 수업으로, 국산 NPU 하드웨어에서 AI 모델을 실행하는 걸 목표로 한다. 최 교수는 “실제 AI 반도체 서버, Llama3, MLOps, NPU 개발환경까지 체험하면서 최신 기술 흐름을 실습 중심으로 익히게 될 예정”이라며 “단순한 '교과 성적'이 아닌 산업 현장에서 검증된 실전 역량이라는 점에서 취업 경쟁력에서 큰 차별화 요소가 될 것으로 기대된다”고 내다봤다.

2025.06.23 16:52전화평

HP "AI 컴패니언, 올해 안에 온디바이스로 전환"

"HP코리아가 현재 출시하고 있는 AI PC에는 업무 생산성을 향상할 수 있는 소프트웨어인 'AI 컴패니언'이 기본 탑재됩니다. 여러 지식을 검색하는 '디스커버', 각종 문서 파일을 분석해 주는 '애널라이즈' 등 기능을 갖췄습니다." 12일 오후 서울 여의도 HP코리아 브리핑룸에서 만난 최순모 HP코리아 테크니컬 컨설턴트가 AMD 라이젠 AI 9 HX 프로 375 기반 AI PC인 엘리트북 X G1a를 앞에 두고 이렇게 설명했다. HP코리아는 지난 해 6월 스냅드래곤 X 엘리트 기반 '엘리트북 울트라'를 시작으로 지난 4월 인텔 코어 울트라 시리즈2 기반 '엘리트북 울트라 G1i', AMD 라이젠 AI 기반 고성능 미니PC 'Z2 미니 G1a' 등 다양한 AI PC를 시장에 출시하고 있다. 이들 PC는 40 TOPS(1초당 1조 번 연산)급 이상 성능을 갖춘 NPU를 탑재했고 이를 활용할 수 있는 'AI 컴패니언'을 기본 탑재한다. 오픈AI가 개발한 언어모델인 GPT-4o를 이용해 지식 검색, 문서 분석 등을 수행한다. 등산로 추천부터 화면 분석까지 무료로 수행 AI 컴패니언의 '디스커버' 탭에서 '초보자용 북한산 코스를 추천해줘'라는 질문을 입력하자 다양한 코스를 추천했다. 최순모 컨설턴트는 "챗GPT는 매달 구독료가 필요하지만 AI 컴패니언은 이를 무료로 활용할 수 있다"고 설명했다. HP는 지난 3월 AI 컴패니언 업데이트로 '스닙 투 프롬프트'(Snip-To-Prompt) 기능을 추가했다. 현재 PC 화면을 선택해 물어보면 관련 내용을 정리해 제공한다. 최순모 컨설턴트는 "이 기능이 추가되며 활용도가 크게 높아졌다"고 설명했다. 기자가 11일 촬영한 취재 사진을 띄운 다음 사진에 대한 설명을 요청하자 촬영 상황과 상당히 부합하는 설명을 내놨다. 단 6월 현재 사진 파일을 직접 올려 관련 정보를 검색하는 기능은 지원하지 않는다. 문서 요약과 분석 진행하는 '애널라이즈' 기능 최순모 컨설턴트는 AI 컴패니언 기능 중 직장인과 학생에게 가장 도움을 줄 기능으로 '애널라이즈'를 꼽았다. 이용자가 가지고 있는 워드, 파워포인트, PDF, 일반 텍스트 파일 등 다양한 자료를 모아 요약하고 인사이트를 얻을 수 있다. 최 컨설턴트는 "애널라이즈 기능은 라이브러리당 최대 100MB 파일, 최대 10개 라이브러리를 생성 가능하다. 문서 처리는 PC에서 처리하고 분석만 클라우드에서 진행하는 하이브리드 구조"라고 설명했다. 5월 중순 '컴퓨텍스 타이베이 2025' 기간동안 기자가 작성한 한국어 기사 원문(텍스트) 파일을 모아 라이브러리를 생성한 다음 '주요 업체가 발표한 신제품과 기술 10개를 추천하고 특징을 요약하라'고 질문하자 관련 내용을 출력했다. 최순모 컨설턴트는 "보안 관련 영문 기술 문서나 연구 자료를 분석하고 요약하는 데는 상당한 시간이 걸린다. 그러나 애널라이즈를 활용하면 불과 30초만에 요점을 추출할 수 있어 저 자신도 고객사를 위한 제안서 작성 등 실제 업무에 활용하고 있다"고 밝혔다. "이 설정 어떻게 하지" PC 초보자 돕는 '퍼폼' '퍼폼'은 PC 초보자를 대상으로 LLM이 성능 최적화 방법이나 설정 방법을 알려주는 기능이다. 최 컨설턴트는 "중장년층 이외에도 스마트폰·태블릿에 친숙한 25-34세 세대 중 각종 설정을 어려워하는 사람들이 많다. 이런 이용자들을 위한 기능"이라고 말했다. 이어 "현재는 키보드로 질문을 입력해야 하지만 음성인식 기능을 이용해 질문할 수 있는 기능도 추가될 것"이라고 설명했다. 미국이나 유럽, 일본 등 외국에서는 주요 IT 업체 고객지원센터를 사칭해 결제를 유도하거나 개인정보, 금융정보를 훔치고 스파이웨어 등 악성코드를 설치하는 '서포트 스캠'이 빈발하고 있다. 동석한 HP코리아 관계자는 "퍼폼 기능을 활용하면 서포트 스캠으로 인한 금전적 손실이나 개인정보 유출 등 선의의 피해를 막는데도 도움이 될 것"이라고 말했다. "AI 컴패니언, 올해 안에 온디바이스로 갈 것" 현재 AI 컴패니언은 AI PC의 CPU와 GPU, NPU 등 연산 성능과 HP가 제공하는 클라우드를 활용하는 하이브리드 형태로 작동한다. 그러나 데이터가 클라우드로 전송되기 때문에 영업 비밀이나 기업 비밀, 개인정보나 프라이버시 노출 우려가 발생한다. 최순모 컨설턴트는 "현재 AI 컴패니언 버전은 1.1이지만 올해 안에 2.0으로 업데이트하면 AI 모델을 PC에 설치해 완전한 온디바이스 구동이 가능할 것"이라고 설명했다. 기기에 설치되는 AI 모델은 매개 변수가 40억 개 수준인 마이크로소프트 소형언어모델(SLM), 파이 3.5가 될 예정이다. 최 컨설턴트는 "파이 3.5는 문서 요약 등에 충분히 활용할 수 있는 성능을 내며 이를 위해서는 최소 32GB 메모리가 필요하다"고 설명했다. "기업 내 자체 AI 모델 개발용 워크스테이션 수요도 대응" 주요 PC 제조사는 오는 10월 윈도10 지원 종료를 앞두고 주요 기업 대상으로 AI PC를 내세우고 있다. 그러나 정보 유출 우려나 기업 내 보안 정책 등으로 AI 기능 관련 기대치에는 여전히 온도 차이가 있다. 관련 업계는 결국 기업들이 필요로 하는 AI 기능을 직접 개발해 AI PC상에서 실행하고, 보다 복잡한 처리가 필요한 기능은 기업이 직접 관리하는 클라우드 도움을 받는 하이브리드 형태로 갈 것으로 예상하고 있다. HP코리아 관계자는 "기업이나 기관, 조직 내 AI 모델 개발에는 고성능 워크스테이션이 필요하다. 이런 수요에도 대응하는 한편 AI PC의 활용도를 높이기 위해 글로벌 차원에서 개발자 지원 프로그램도 운영중"이라고 밝혔다.

2025.06.13 14:41권봉석

과기정통부, AI반도체 추경사업 통합설명회 11일 개최

과학기술정보통신부가 국내 팹리스 NPU의 조기 상용화를 지원하기 위해 추경으로 편성한 AI반도체 분야 사업에 대한 통합 설명회를 11일 오후 한국과학기술회관에서 개최한다. 과기정통부는 AI반도체 분야 중요성을 고려해 올해 추경 494억원을 포함해 R&D, 실증, 인재 양성 등에 총 2천434억원을 투자한다. 특히 추경사업은 우수한 기술력을 갖춘 국내 유망 팹리스들이 NPU 조기 상용화에 필수적이라고 요청한 현장 의견을 적극 반영해 기획됐다. AI반도체 분야 추경 사업은 ▲AI컴퓨팅 실증 인프라 고도화(120억) ▲AX 실증 지원(40억) ▲AI반도체 사업화 적시 지원(220억) ▲AI-반도체 해외 실증 지원(54억) ▲국산 AI반도체 기반 디바이스 AX 개발·실증(60억) 사업으로 구성됐다. 이 가운데 AI컴퓨팅 실증 인프라 고도화 사업, AX 실증 지원 사업, AI반도체 사업화 적시 지원 사업(제품 제작지원)은 이달 30일까지 공고를 통해 신규 과제 수행자를 모집하고 있다. 통합설명회는 추경사업을 실제 집행하기 전에 기업들에게 사업 내용을 상세히 설명하고 사업 추진에 대한 의견을 수렴하기 위해 마련한 자리로, 사업 전반에 걸친 자유로운 질의응답을 진행하여 기업들이 과제를 지원하는데 애로사항이 없도록 실무적인 소통도 강화할 예정이다. 아울러 과기정통부는 통합 설명회와 연계해 AI반도체 팹리스 간담회도 함께 진행한다. 박태완 과기정통부 정보통신산업정책관은 “과기정통부는 그간 기업과의 긴밀한 소통을 바탕으로 정책수요를 발굴하여 이번 추경 사업 등 기업이 실제 필요한 지원 사업을 추진해왔다”며 “앞으로도 사업 기획은 물론, 집행 과정에서도 지속적으로 의견을 청취하여 국내 팹리스에게 실질적인 도움을 제공하고 국산 NPU가 조기에 상용화되는 성과를 창출할 수 있도록 노력하겠다”고 말했다.

2025.06.10 12:00박수형

퀄컴, 英 '알파웨이브 세미' 24억 달러에 인수…AI 데이터센터 공략 강화

퀄컴이 고속 데이터 연결 솔루션 기업 알파웨이브 세미(Alphawave Semi)를 인수하기로 했다. 스마트폰·PC에 이어 데이터센터로 사업 영역을 확장하기 위한 투자다. 퀄컴은 영국 런던에 상장된 반도체 기업 알파웨이브 세미를 24억 달러(한화 약 3조2천억원)에 인수하기로 했다고 9일 밝혔다. 퀄컴은 "이번 인수는 데이터센터 확장을 가속화하고 핵심 자산을 확보하는 것을 목표로 한다"며 "퀄컴의 오라이온 CPU(중앙처리장치)와 헥사곤 NPU(신경망처리장치) 프로세서는 점차 확대되는 고성능·저전력 컴퓨팅 수요를 충족할 수 있는 유리한 위치에 있다"고 설명했다. 지난 2017년 설립된 알파웨이브 세미는 고속 연결 및 컴퓨팅 기술 분야에 주력해 온 반도체 설계 기업이다. 빠르고 안정적인 데이터 전송을 위한 IP(설계자산), 맞춤형 실리콘, 칩렛(여러 개의 단일 칩을 하나로 집적하는 기술) 플랫폼 등을 제공하고 있다. 크리스티아노 아몬 퀄컴 최고경영자(CEO)는 "알파웨이브 세미는 전력 효율적인 CPU 및 NPU 코어를 보완하는 선도적인 고속 유선 연결 및 컴퓨팅 기술을 개발했다"며 "이번 인수의 목표는 데이터센터 인프라를 포함한 다양한 고성장 분야에서 차세대 커넥티드 컴퓨팅 성능을 구현하는 것"이라고 밝혔다. 한편 이번 인수는 내년 1분기 내 완료될 것으로 예상된다.

2025.06.10 08:51장경윤

[유미's 픽] "삼성만 믿는다"…과기부, '이재명 정부' 출범 속 국가AI컴퓨팅센터 유찰 막을까

최대 2조5천억원이 투입되는 국가인공지능(AI)컴퓨팅센터 구축 사업 재공고에 나선 과학기술정보통신부가 이번에는 유찰을 막고 명예회복에 성공할 지 주목된다. 높은 초기 투자 부담과 구체적인 수익 확보 및 비즈니스 모델을 제시하고 있지 못했던 탓에 한 차례 유찰됐지만, 이번에는 1개 이상 기업이 참여할 가능성이 높은 것으로 알려져 기대감을 키우고 있다. 5일 업계에 따르면 오는 13일 마감되는 국가AI컴퓨팅센터 사업 재입찰에 삼성SDS를 주축으로 한 컨소시엄이 참여할 것으로 알려졌다. 당초 삼성SDS는 네이버클라우드, 엘리스그룹, 삼성물산 등과 컨소시엄을 구성해 초기 입찰에 참여하려고 했으나, 막판에 네이버클라우드 측에서 발을 빼 무산된 것으로 전해졌다. 이 컨소시엄에서 삼성전자는 지분이 없지만 사업 협력에 나서려고 했던 상황이다. 이 컨소시엄은 정부가 연내 확보할 계획인 그래픽처리장치(GPU) 1만 장을 네이버 데이터센터 각 세종 등 기존 인프라에서 우선 구동한 후 비수도권에 국가AI컴퓨팅센터를 신규 구축하는 방안을 마련했던 것으로 알려진 바 있다. 그러나 업계에선 네이버클라우드가 각 세종, 각 춘천 등 기존 인프라에 이미 네이버 자체 물량을 소화하고 있고, 외부 업체 물량은 데이터센터를 임차하는 방식으로 운영하고 있어 현실성이 떨어지는 것으로 봤다. 다만 네이버클라우드가 올 초 경기도 용인에 전력량 20MWh(메가와트시) 가량의 데이터센터를 임차한 것으로 알려져 이를 대비했던 것 아니냐는 시각도 있다. 업계 관계자는 "엘리스그룹은 아직 제대로 상용화되진 않았지만 국산 신경망처리장치(NPU)에 많은 관심을 보이며 컨소시엄에 적극 참여하겠다는 의지를 드러냈다"며 "삼성SDS는 GPU를 확보해 운영하려고 했던 분위기 속에 네이버클라우드의 역할이 다소 애매해진 영향이 있었던 것으로 안다"고 말했다. 이어 "컨소시엄 자체가 대부분 클라우드 서비스 제공업체(CSP)로 구성됐다는 점에서 서로 간의 역할 구분이 어려웠을 수도 있다"면서도 "조건 변경 없이 재공고된 상황에서 삼성 측이 컨소시엄을 구성할 때 네이버클라우드가 기존대로 참여할지, 아닐지 주목된다"고 덧붙였다. 업계에선 네이버클라우드가 국내 인공지능(AI) 시장에서 중요한 역할을 하고 있는 만큼, 삼성 측이 컨소시엄을 구성해 재입찰에 나선다면 충분한 설득 작업을 벌여 그대로 참여시킬 것으로 봤다. 조건 변경 없이 재입찰 공고가 나와 사업 매력도는 다소 떨어지지만 국가를 대표하는 기업들이 정부 사업에 기여를 해야 한다는 통합된 의견을 가지고 있는 만큼, 이번에 함께 나설 것이라고 보는 게 중론이다. 더불어 이번에는 1개 이하 컨소시엄이라도 사업 참여를 신청할 경우 공모지침상 평가기준에 의거, 적정 사업자인지 판단을 거쳐 수의계약을 바로 체결한다는 점에서도 삼성 측의 참여 확률이 높다고 봤다. 높은 초기 투자 부담과 구체적인 수익 확보 및 비즈니스 모델을 제시하고 있지 못한 상황이지만, 수의계약 과정에서 삼성 측과 정부의 지분 및 수익성 구조 등에 재협상에 나설 가능성도 있다고 판단해서다. 일단 사업자들이 국가AI컴퓨팅센터 구축 사업 공모 조건에서 가장 우려하는 부분은 정부가 특수목적법인(SPC) 지분 51%를 갖기 때문에 기업이 수익성을 늘리는 방향으로 사업을 주도하기 어렵다는 점이다. 결국 정부 의도대로 공공사업 성격을 가질 수밖에 없다고 봐서다. 여기에 AI 시대에 접어들며 엔비디아의 GPU 가격이 급등한 상황에서 수만 장을 사들여야 하는 데다 이를 국내 기업·기관에 기존보다 저렴하게 빌려줘야 해 수익을 내지 못한다는 점은 큰 걸림돌이 되고 있다. 업계 관계자는 "사업자 입장에선 자체 운영 중인 AI 데이터센터와 국가AI컴퓨팅센터가 같은 고객사를 두고 서로 경쟁해야 하는 관계라는 인식도 가지고 있다"며 "국가AI컴퓨팅센터를 통해 더 저렴한 GPU 서비스를 내놓는 것이 자체 데이터센터의 고객을 빼앗기거나 가격 경쟁으로 수익성이 낮아지는 결과를 초래할 수 있다는 점에서 매력적으로 보이진 않는다"고 밝혔다. 하지만 과기정통부는 이번에는 기필코 유찰을 막겠다는 강한 의지를 보이고 있는 것으로 전해졌다. 이번에도 유찰이 될 경우 사업에 막대한 차질을 빚을 수 있어서다. 정부는 오는 13일까지 국가AI컴퓨팅센터 참여 희망 기업·컨소시엄의 사업 참여 계획서를 접수하고 이달 안에 기술·정책 평가(1단계)를 거쳐 7월 투자·대출 등 금융심사(2단계) 후 이르면 8월 말께 최종 적정 기업 또는 컨소시엄을 선정한다는 계획을 세운 바 있다. 또 9월에는 특별위원회를 개최해 사업 시행계획을 보고한 후 10월께 특수목적법인(SPC) 설립을 위한 협약을 민간참여자와 체결할 예정이었다. SPC 설립 후에는 오는 11월부터 사업에 착수할 계획을 갖고 있었다. 센터 설립 시기는 오는 2027년으로 설정됐으며 내년에 착공을 시작할 예정이다. 하지만 신청에 나선 사업자가 이번에도 없게 되면 모든 계획이 물거품이 된다. 새롭게 출범한 '이재명 정부' 입장에서도 'AI 100조원 투자'를 공약한 상황에서 초기부터 AI 관련 국가 사업이 무산되게 되면 난감한 상황에 놓일 수 있다. 이에 과기정통부는 삼성 측이 그간 공공연하게 의지를 보였다는 점에서 적극적으로 참여 유도를 하고 있는 것으로 알려졌다. 실제 삼성SDS는 이준희 대표까지 나서서 국가AI컴퓨팅센터 사업에 참여하겠다는 의사를 밝힌 바 있다. 앞서 이 대표는 지난 3월 '제40기 정기 주주총회'에서 "정부에서 하는 대구센터나 행안부, 복지부 등 여러 안건들이 있어 (국가AI컴퓨팅센터 구축 사업에 대해) 잘 검토할 것"이라며 "국가에서 하는 것인 만큼 다방면으로 보고 있다"고 언급해 기대감을 높였다. 업계 관계자는 "이번 재공고는 유찰되지 않을 가능성이 상당히 높은 것으로 보인다"며 "모두가 예상하고 있는 곳의 참여가 유력한 것으로 안다"고 밝혔다. 또 다른 관계자는 "수천억원이 투입되는 장기 사업인 데다 낮은 수익성이 우려된다는 점에서 현재 공개된 조건에선 다른 기업들이 참여 결정을 내리기 쉽지 않다"며 "공모지침 변경을 통해 광범위한 제안 조건과 사업 참여 부담 등이 일정 부분 해소될 수 있다면 참여를 고려해보려고 했는데, 재공고 때도 대부분의 기업은 참여하지 않을 듯 하다"고 말했다. 그러면서 "두 번 유찰되면 자동으로 지원한 사업자가 우선 협상할 수 있게 될텐데, 지금으로선 삼성밖에 지원할 곳이 없어 보인다"며 "향후 우선 협상을 하게 된다면 삼성이 정부와 지분 및 수익성 구조 등에 대해 재협상에 나설 여지가 크다"고 덧붙였다.

2025.06.05 17:31장유미

"클라우드 제약 벗어난 AI 혁신, 퀄컴 AI 허브로 돕는다"

"AI는 자료 요약이나 정리를 통한 생산성 향상과 업무 효율 향상, 문자인식이나 번역, 카메라 화질 개선 등 이미 우리 일상생활에서 널리 쓰이고 있다. 보다 다양한 기기와 응용프로그램이 AI로 지능적으로 작동하도록 돕는 것이 퀄컴의 목표다." 5일 오후 서울 강남구 그랜드 인터컨티넨탈 서울 파르나스에서 열린 '컨버전스 인사이트 서밋'(CIS 2025)에서 이규진 퀄컴코리아 이사가 이렇게 강조했다. 이날 이규진 이사는 "클라우드를 거치지 않고 다양한 기기 연산 능력만 활용하는 온디바이스 AI 개발에는 다양한 장애물이 있으며 퀄컴은 이를 해소할 수 있는 '퀄컴 AI 허브'를 제공하고 있다"고 설명했다. "온디바이스 AI, 지연시간·비용에 장점 지녀" 현재 주목받는 다양한 AI 서비스는 대부분 클라우드에서 구동된다. 웹브라우저나 스마트폰 앱으로 질문이나 이미지 생성 요청을 넣으면 불과 수 초 안에 원하는 결과물을 되돌려준다. 그러나 클라우드로 데이터가 오가고 결과물을 받아보는 구조 상 개인 정보 등 프라이버시나 기업 비밀, 민감 정보 노출 가능성에서 자유롭지 않다. 또 지연 시간이나 서비스 장애/중단시 이를 활용할 수 없다는 문제도 있다. 이규진 이사는 "AI 구동을 클라우드에서 로컬 기기로 전환하면 컴퓨팅 자원 이용에 드는 비용을 줄이는 것은 물론 처리 시간 단축, 개인정보나 민감정보, 비밀 유출 차단 등 다양한 이점을 얻을 수 있다"고 설명했다. 이어 "온디바이스 AI를 효과적으로 실행하려면 CPU나 GPU 뿐만 아니라 각종 AI 연산을 저전력으로 실행하는 NPU(신경망처리장치)가 필요하다. 퀄컴이 스마트폰이나 PC, 오토모티브(자동차)나 IoT용으로 제공하는 스냅드래곤 플랫폼은 이를 충족한다"고 덧붙였다. 다양한 모델 사전 최적화해 제공하는 '퀄컴 AI 허브' 퀄컴 AI 허브는 퀄컴 스냅드래곤/드래곤윙 시스템반도체(SoC) 탑재 기기에서 작동하는 AI 앱이나 서비스 개발을 돕기 위한 개발자 포털로 작년 3월부터 가동을 시작했다. 지원하는 런타임은 현재 라이트RT와 범용성을 갖춘 ONNX, 퀄컴 SoC에 최적화된 퀄컴 AI 스택 등 3가지다. 이규진 이사는 "퀄컴 AI 허브는 6월 기준으로 220개 이상의 오픈소스 AI 모델을 퀄컴 플랫폼에 최적화해 제공하고 있고 이들 모델을 활용한 상용 서비스 구현도 문제가 없다"고 설명했다. 이어 "자체 개발한 AI 모델이나 추론 성능을 강화한 모델, 튜닝한 모델을 가져와 대상 플랫폼에 맞는 형태로 최적화하는 작업도 '자체 모델 불러오기' 기능으로 지원한다"고 덧붙였다. "물리 기기 기반 프로파일링으로 PoC 시간 단축" 퀄컴 AI 허브는 허브 내에서 구동되는 실물 기기 기반 시뮬레이션으로 AI 모델을 직접 실행하고 실행 소요 시간 프로파일링, 메모리 이용량, 연산량 측정 등 기능도 수행한다. 이규진 이사는 "이들 기능을 활용하면 개념실증(PoC)을 더 빠르게 추진하고 완성도를 강화할 수 있다. 또 개발자와 퀄컴 담당자가 참여하는 슬랙 커뮤니티를 통해 개발 과정에서 겪는 어려움에 대해 서로 논의할 수 있다"고 설명했다. 이어 "퀄컴 AI 허브를 활용해 국내에서도 더 많은 개발자들이 온디바이스 AI 앱과 서비스를 개발하고 이를 통해 관련 생태계 활성화가 일어나길 바란다"고 당부했다.

2025.06.05 16:50권봉석

메가존클라우드, '경기 K-AI 클라우드존' 개소…AI 스타트업 GPU·NPU 무상 지원

메가존클라우드(대표 염동훈)가 경기도 인공지능(AI) 스타트업을 대상으로 클라우드 기반 기술지원에 나선다. 메가존클라우드는 경기도와 차세대융합기술연구원(이하 융기원)이 추진하는 '경기도 AI 기업 고성능 컴퓨팅 지원사업'의 클라우드 인프라 공급사로 선정됐다고 5일 밝혔다. 이번 공급 계약에 따라 고성능 컴퓨팅 인프라 제공부터 운영, 기술 지원까지 전 과정을 통합 매니지드 서비스 형태로 제공한다. 특히 GPU·NPU 등 고가의 장비를 자체적으로 확보하기 어려운 스타트업, 중소기업, 대학 창업기업 등에 클라우드 기반 고성능 자원을 무상으로 지원함으로써 AI 기술 개발 환경을 획기적으로 개선하겠다는 전략이다. 과천 메가존산학연센터에서 열린 경기 K-AI 클라우드존 개소식 및 사업설명회에는 메가존클라우드 서민택 부사장, 김기병 경기도 AI국 국장, 배수문 융기원 부원장 등이 참석했다. 메가존클라우드는 이날 행사에서 수요기업들을 대상으로 사업 개요와 지원 내용을 소개하고, 주요 클라우드 기업들의 활용 사례를 공유했다. 경기 K-AI 클라우드존은 이번 사업 전용 공간으로 과천 메가존산학연센터 내에 구축했다. 수요기업은 이 공간에서 엔비디아 H100, A100, V100, H200 등 GPU 자원은 물론, NPU 등 최신 고성능 컴퓨팅 자원을 비교·체험할 수 있다. 네이버클라우드, NHN클라우드, KT클라우드, 삼성클라우드, 카카오클라우드 등 주요 국내 K-클라우드 기업의 서비스도 선택해 활용할 수 있도록 구성됐다. 현장에는 메가존클라우드의 전문 엔지니어가 상주하며, 수요기업의 클라우드 서비스 도입과 운영을 1:1로 지원하는 기술 컨설팅도 제공한다. 특히 메가존클라우드는 각 클라우드 서비스 제공사(CSP)별 전담 기술팀을 구성해 인프라 구축, 장애 대응 등 전 과정을 통합 지원함으로써 기업들이 클라우드 자원을 안정적이고 효율적으로 활용할 수 있도록 돕는다. 경기도 AI 기업 고성능 컴퓨팅 지원사업의 참여기업 모집은 6월 20일까지 진행된다. 지원 대상은 경기도 내 본사 또는 주된 사업장을 둔 AI 스타트업, 중소기업, 대학 창업기업, 청년기업이며, 총 50개사를 선정할 예정이다. 이 가운데 GPU만 활용하는 기업은 40개사, GPU와 NPU를 함께 활용하는 기업은 10개사를 대상으로 기본 3개월간 고성능 자원을 무상 제공하며, 크레딧 소진 후에도 할인된 가격으로 자원을 추가 활용할 수 있다. 경기도 김기병 AI국장은 "AI 기업에 있어 고성능 컴퓨팅 자원 제공은 실질적인 성장의 사다리를 놓아주는 것과 같다"며 "잠재력 있는 혁신기업들이 AI 인프라 격차를 넘어 글로벌 무대에 도전할 수 있도록 아낌없는 지원을 이어가겠다"고 밝혔다. 메가존클라우드 황인철 최고매출책임자(CRO)는 "AI 기업들이 인프라 부담 없이 기술 개발에 집중할 수 있는 환경을 만드는 것이 이번 사업의 핵심 목표"라며 "사업 성공에 그치지 않고, 축적된 경험을 기반으로 타 지자체 및 유사 사업으로 확산해 국내 클라우드 생태계 활성화에 기여하겠다"고 강조했다.

2025.06.05 09:41남혁우

국내 팹리스 NPU 조기 상용화 지원...494억 추경 사업 시동

과학기술정보통신부는 최근 국내 팹리스의 NPU 조기 상용화를 지원하기 위해 추경으로 편성한 AI반도체 분야 주요 신규 과제 공고를 6월30일까지 진행한다고 밝혔다. 과기정통부는 유망한 AI반도체 기업에게 실질적인 지원을 제공하기 위해 올해 추경으로 총 494억원을 편성했다. 주요 내용은 ▲AI컴퓨팅 실증 인프라 고도화(120억) ▲국산 AI반도체 기반 디바이스 AX 개발 실증(60억) ▲AX 실증 지원(40억) ▲AI-반도체 해외 실증 지원(54억) ▲AI반도체 사업화 적시 지원(220억)이다. 이에 따라 과기정통부는 이번 추경을 포함해 올해 R&D, 실증 및 인재양성 등 전 주기에 걸쳐 총 2천434억원을 투자해 AI반도체 산업 활성화를 지원하게 된다. 공고는 AI컴퓨팅 실증 인프라 고도화 사업, AX 실증 지원 사업, AI반도체 사업화 적시 지원 사업 중 제품 제작 고도화 지원 등 주요 신규 과제 수행 기업과 기관 모집을 위한 것이다. 먼저 AI컴퓨팅 실증 인프라 고도화 사업은 총 3년간 추진될 예정으로, 기존 소규모 기술 검증 중심에서 조기 상용화를 뒷받침하기 위한 대규모 국산 NPU 실증을 추진한다. 이를 위해 120페타플롭스(PF) 규모의 대규모 클러스터링 환경을 구현할 예정이며, 상용 AI컴퓨팅 서비스에 대응하는 실증 인프라를 구축한다. 올해는 우선적으로 상용 LLM을 실증할 수 있는 50PF 규모 인프라를 구축하고 내년부터는 단계적으로 인프라를 확충하고 본격적으로 다양한 최신 LLM을 실증할 계획이다. 또 AX 실증 지원 사업은 2년간 지원 예정으로, 이미 상용화된 다양한 AI서비스를 국산 AI반도체로 기반으로 전환하고 상용화까지 지원한다. 지역 산업 등과 연계한 총 4건의 상용 AI서비스에 대한 전환을 지원하여 산업계의 AX를 촉진하고, 전국 단위로 확산될 수 있도록 하여 NPU 기반 AI 추론 시장을 활성화할 계획이다. 마지막으로 AI반도체 사업화 적시지원 사업은 설계SW, 제품 제작, 카드 서버 단위 검증 등 유망 AI반도체 스타트업의 사업화 전주기 지원체계를 구축하여 지원 공백을 해소할 예정이다. 특히 기업들이 자체 실정에 맞게 지원받을 수 있도록 바우처 방식 등을 활용해 실질적인 지원 효과를 극대화하였다. 이와 함께 각 단계별 맞춤형 컨설팅·기술 지원 등도 제공하여 역량 있는 AI반도체 팹리스들의 신속한 시장진출을 촉진할 계획이다. 공고에서는 시제품 및 양산품 제작 지원 대상 기업을 모집할 예정이며, 바우처 방식으로 제공될 설계 SW 수요 기업은 6월 중 모집할 예정이다. 또한, 광주 AI집적단지 등에 구축한 AI반도체 검증체계를 고도화하여 올해 안에 팹리스의 제품 상용화에 필수적인 카드 서버 단위 안정성 및 호환성, 신뢰성 검증을 제공할 계획이다. 박태완 과기정통부 정보통신산업정책관은 “과기정통부는 그간 AI반도체의 중요성을 인식하고 기업과의 긴밀한 소통을 바탕으로 정책수요를 발굴해 사업화하는 등 국내 AI반도체 업계의 도약을 위해 지원해왔다”며, “앞으로도 산업계와 원팀이 되어 국산 AI반도체가 골든 타임 내 상용화되고 기업들에게 실질적인 지원이 이루어질 수 있도록 노력하겠다”고 밝혔다.

2025.05.29 14:45박수형

"2030년 기업용 PC 10대 중 1대는 AI 기반 워크스테이션"

AI 기술의 급속한 발전과 함께 컴퓨팅 환경이 데이터센터 중심에서 엣지 기반으로 이동하고 있다. 글로벌 엣지 AI 시장 규모는 2024년 326억 달러(약 44조 6천620억원)에서 2029년 761억 달러(약 104조 2천570억원)로 연평균 25.9% 성장할 것으로 예측된다. AI 관련 칩 시장도 2023년 160억 달러(약 21조 9천200억원)에서 2030년까지 연평균 33.9%의 고성장이 전망된다. 이런 변화는 워크스테이션 시장에도 직접적인 영향을 미치고 있다. 시장조사업체 IDC에 따르면, 지난 해 전 세계 워크스테이션은 2023년 대비 7% 성장했다. 또 2030년까지 판매되는 기업용 PC 10대 중 1대가 워크스테이션으로 예상된다. 업계는 현재 기업용 PC 시장에서 워크스테이션 비중은 5%이며 5년 뒤에는 10%까지 성장할 것으로 예측하고 있다. "제조·연구·개발 종사자 40% 워크스테이션 활용중" 글로벌 PC 제조사 델테크놀로지스가 지난 1월 공개한 '업무용 PC 사용 현황 및 AI PC 전망 보고서'에 따르면, 응답자 2천500명 중 제조, 연구, 개발 직무 종사자의 42%가 이미 워크스테이션을 사용하고 있으며, 기존 워크스테이션 사용 기업 중 46%가 올해 AI 프로젝트를 위한 추가 투자를 계획하고 있다. 샘 버드(Sam Burd) 델테크놀로지스 클라이언트 솔루션 그룹 사장은 "델은 AI에 '올인'했다. 디바이스 측면에선 AI의 역량을 품은 PC를 제공하며, 특히 기업용 PC 고객들이 엣지에서 생성된 데이터를 로컬 PC로 이동시켜 AI 모델을 구동할 수 있게 됐다"고 밝혔다. 델테크놀로지스는 올해 본격적인 AI 시대를 맞아 기존 워크스테이션 제품을 '델 프로 맥스'로 새롭게 브랜딩했다. 델 프로 맥스는 신경망처리장치(NPU)를 내장한 인텔·AMD 최신 프로세서와 AMD·엔비디아 전문가용 그래픽카드, 거대언어모델(LLM)을 원활히 처리할 수 있는 최대 128GB DDR5 메모리, AI 모델 입출력 데이터 처리에 필요한 고성능 NVMe SSD로 복잡한 AI 워크로드 처리에 필요한 사양을 갖췄다. 델 프로 맥스 타워 T2, 대규모 데이터 분석에 최적화 델 프로 맥스 타워 T2는 인텔 코어 울트라 200S 프로세서와 엔비디아 RTX 프로 6000X 블랙웰, 지포스 RTX 5090 GPU를 선택 가능한 데스크톱형 제품이다. 고성능 프로세서와 GPU 구동에 필요한 1500W급 전원공급장치와 128GB DDR5 메모리, 최대 24TB 스토리지로 대규모 데이터 분석과 모델 훈련 작업을 원활하게 수행할 수 있다. AI 처리에 필요한 데이터가 생성되는 장소를 오가며 작업해야 하는 전문가를 위한 모바일 워크스테이션은 14인치부터 18인치까지 다양한 화면 크기로 제공된다. DCI-P3 색공간을 100% 만족하는 OLED 디스플레이로 데이터 시각화와 머신러닝 결과 분석에 적합하다. 올 3월 엔비디아 GTC 2025에서 공개한 GB10과 GB300 기반 델 프로 맥스는 개인 개발자가 구매해 책상 위에서 거대 모델을 테스트할 수 있다. 27일 델테크놀로지스 관계자는 "이용료와 접근성에 제약을 받던 기존 개발 환경 대비 제약을 최소화할 것"이라고 전망했다. 델 "ISV와 협업해 AI 기능 확대... 개발자도 지원" AI 처리를 위한 강력한 하드웨어를 뒷받침하는 것이 바로 소프트웨어다. 델테크놀로지스는 'RAG(검색증강생성)을 위한 델 가속 서비스'를 제공해 개발자들의 업무를 지원한다. TPM 기반 이중 암호화를 적용한 '컨트롤볼트' 기술로 AI 모델 개발과 이에 활용되는 데이터를 보호하며 ECC 메모리와 델 RMT 프로 기술로 메모리 오류를 자동 보정해 정밀한 AI 연산 작업의 신뢰성을 보장한다. 제프 클라크(Jeff Clarke) 델 최고운영책임자(COO)는 "델테크놀로지스는 현재 150여개 ISV들이 제공하는 300여개의 기능을 검토하고 있으며, NPU 기반 애플리케이션 관련해 협력하는 것을 긍정적으로 고려하고 있다"고 설명했다. IDC "향후 10년간 워크스테이션 황금기 맞을 것" 데이터 보안과 처리 속도를 동시에 만족해야 하는 기업 환경에서 로컬 AI 처리 능력을 갖춘 워크스테이션의 중요성은 더욱 부각되고 있다. 린 황 IDC 연구부사장은 "현재 AI 시대의 시작점에 불과하고 AI 개발을 가속화하는 데 워크스테이션이 얼마나 중요한 역할을 할 것인지 고려할 때, 향후 10년간 이 카테고리는 황금기를 맞이할 것"이라고 전망했다. 그러나 많은 기업 내 IT 결정권자들은 현재의 워크로드 요구사항뿐만 아니라 보안 역시 고려해야 한다. 델테크놀로지스 관계자는 "데스크톱형 제품에는 제품을 분해하고 내부 부품에 무단 접근할 경우 부팅을 원천 차단하는 '섀시 침입 센서', 노트북 제품에는 등록되지 않은 이용자가 화면을 볼 경우 이를 감지하고 차단하는 기능을 탑재하는 등 물리 보안 기능 추가에도 주력하고 있다"고 설명했다.

2025.05.27 14:56권봉석

모빌린트, AWS와 손잡고 엣지 AI 시장 공략 박차

AI 반도체 전문기업 모빌린트는 아마존웹서비스(AWS)와의 기술 협력을 추진한다고 23일 밝혔다. 양사는 'CES 2025'에서 첫 논의를 계기로 AWS의 엣지 컴퓨팅 플랫폼인 AWS IoT 그린그라스(Greengrass)에 모빌린트의 고성능 NPU를 연동하는 방안을 협의해왔으며, 이를 기반으로 엣지 AI 분야 고객 확보를 위한 전략적 협력과 공동 마케팅 방안을 함께 검토 중이다. 모빌린트는 현재 미국 산호세에서 열리고 있는 'Embedded Vision Summit(EVS) 2025'에 참가해 AWS와 기술 협력 방향을 소개하고, 처음 선보이는 MXM(Mobile PCI Express Module) 폼팩터 AI 가속기 'MLA100 MXM'을 활용한 데모를 포함해 자사 제품을 전시하며 많은 관심을 받았다. 이번 협력을 통해 AWS 플랫폼 상에서 모빌린트의 NPU를 직접 활용할 수 있는 환경이 마련되면, 고객은 실시간 데이터 처리, AI 추론, 민감 정보의 로컬 처리 등 엣지 환경에 필요한 핵심 기능을 로컬 디바이스에서 효율적으로 구현할 수 있게 된다. 특히 아마존 세이지메이커(Amazon SageMaker)와 모빌린트의 NPU SDK를 연계하면, AI 모델의 학습부터 배포, 최적화까지의 전 과정을 간소화할 수 있어 개발자 경험 또한 크게 향상될 것으로 기대된다. 신동주 모빌린트 대표는 “이번 AWS와의 협력은 단순한 기술 연계를 넘어, 글로벌 엣지 AI 시장에서 NPU 기반 통합 솔루션을 제시한다는 점에서 의미가 크다”며 “EVS현장에서 확인한 시장의 반응을 바탕으로, AWS와의 공동 마케팅 및 고객 확보 활동을 적극 전개해 나갈 것”이라고 밝혔다. MLA100 MXM은 자사 AI 가속기 칩 'ARIES'를 기반으로 설계된 고성능·저전력 엣지 AI 모듈로, 25W 전력 소모로 최대 80 TOPS의 연산 성능을 제공한다. 8개의 NPU 코어를 통해 복수의 AI 모델을 병렬 처리할 수 있으며, 82x70mm 크기와 110g의 경량 설계를 갖춰 로보틱스, 산업 자동화 등 공간 제약이 있는 시스템에 적합하다. 특히 자율주행, 스마트 팩토리, 산업용 로봇 등 고속 연산이 요구되는 분야에서 GPU 대비 뛰어난 전력 효율과 비용 효율을 바탕으로 차별화된 경쟁력을 제공한다

2025.05.23 11:21장경윤

엘리스클라우드 "최신 GPU·국산 NPU 이용 기관 수 반년 만에 9배↑"

AI 교육 솔루션 기업 엘리스그룹(대표 김재원)의 AI 특화 클라우드 솔루션 '엘리스클라우드' 이용 기관 수가 9배 이상 급성장했다고 22일 밝혔다. 지난해 11월부터 올해 5월까지 6개월 만의 성과다. 엘리스클라우드는 고성능 GPU와 NPU를 모두 제공하는 AI 특화 클라우드다. 다수의 스타트업, AI 연구실 등에서 활발히 활용되어 왔으며, 지난해 하반기부터 기업, 대학 고객이 크게 늘어나고 있는 추세다. 특히 신규 프로젝트, 학기 등이 시작되는 3월부터 엘리스클라우드 도입 문의가 늘어나고 있으며, 이용 기관 수 역시 이에 발맞춰 상승하고 있다. 올해 3월부터 5월까지 월 평균 성장세는 50% 이상으로 나타났다. AI 데이터 관리부터 프로젝트, AI 모델 개발 및 배포까지 가능한 원스톱 AI 클라우드 솔루션을 구축한 결과다. 또 올해 3월 클라우드 보안인증인 CSAP IaaS를 획득함으로써 보안역량을 입증 받아 CSAP를 필수로 하는 공공 기관은 물론, 데이터 보안을 중요시하는 기업의 관심도 높아지고 있다고 회사는 설명했다. 엘리스클라우드 이용자 수 역시 서비스 도입 초기인 2023년 6월 대비 2025년 3월, 21개월 만에 약 74배 증가하는 성과를 거뒀다. AI 도입을 원하지만 AI 모델 활용에 어려움을 느끼던 고객들을 고려해 편의성을 높인 다양한 AI 특화 서비스를 선보인 덕이다. 엘리스는 AI 모델에 대한 높아진 관심을 반영해 지난 2월 오픈소스를 포함한 다양한 범용 AI 모델을 별다른 설치 없이 편리하게 사용할 수 있는 최적화된 'ML API 라이브러리' 기능을 선보였다. 고객이 체감하는 가장 큰 혜택인 합리적인 가격은 엘리스클라우드만의 경쟁력이다. 회사에 따르면 이용자는 글로벌 클라우드와 동일한 조건으로 엘리스클라우드를 사용할 경우 77% 이상 비용을 절감할 수 있다. 이는 엘리스가 자체 기술로 개발한 클라우드 인프라를 활용해 AI에만 특화한 클라우드 솔루션을 제공해 가능하다. AI 모델을 효율적으로 운영할 수 있도록 NPU에 최적화된 솔루션도 제공한다. 엘리스는 AI에 특화한 고성능의 GPU와 NPU를 모두 제공 가능한 CSP로서 국산화한 GPU, NPU 클라우드 기술을 확보하고 있다. 김재원 엘리스그룹 대표는 "엘리스클라우드는 AI PMDC 기반으로는 국내에서 가장 많은 GPU 이용 기관을 보유하고 있다. 지속적인 성장세를 기록하고 있다"며 "특히 지난해부터 엔비디아 H100을 인피니밴드 기반 클러스터로 제공해 큰 성장을 기록했다. 이를 발판 삼아 올해 공공 부문과 해외까지 시장을 확대하고 다양한 고객 레퍼런스를 확보할 수 있도록 더욱 도약할 것"이라고 말했다.

2025.05.22 17:27백봉삼

  Prev 1 2 3 4 5 6 7 8 Next  

지금 뜨는 기사

이시각 헤드라인

SK·삼성, 韓 대표 AI반도체 리벨리온 잡기 혼신

임단협 희비 갈린 조선 빅2…한화오션 '타결'·HD현대重 '연쇄파업'

"양자기술 개발, 기초·원천도 좋지만 수요처 기반 트랙 있어야"

"한국 통신사 해킹" 프랙 의혹 제기에…과기정통부 "포렌식 분석중"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.