• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'NPU'통합검색 결과 입니다. (142건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

SK텔레콤 AI 서비스, 리벨리온 AI 반도체로 구동

SK텔레콤은 AI반도체 스타트업 리벨리온과 '에이닷 전화 통화요약'과 같은 주요 AI 서비스에 리벨리온의 NPU를 적용하기 위한 테스트를 진행 중이라고 25일 밝혔다. SK텔레콤과 리벨리온은 데이터센터용 AI 반도체 아톰(ATOM)을 탑재한 서버를 ▲에이닷 전화 통화요약 ▲PASS 스팸필터링 ▲PASS금융비서 ▲엑스칼리버 등에 테스트 중이다. 테스트 결과에 따라 아톰의 성능 강화판인 '대규모 AI 추론용 AI 반도체 아톰 맥스(ATOM-Max)'를 이들 서비스에 연내 상용 적용하는 것을 목표로 하고 있다. 또한 테스트 결과를 토대로 향후 리벨리온 NPU 서버 도입을 지속적으로 확장할 계획이다. 양사는 이를 두고 국내 AI 생태계 자립에 큰 의미를 가지고 있다고 설명했다. 에이닷 전화 통화요약은 SK텔레콤의 LLM 모델 에이닷엑스(A.X)를 기반으로 하고 있어, 국산 AI 반도체인 리벨리온의 아톰을 통해 상용 서비스 될 경우 '국산 LLM'이 '국산 NPU'를 통해 서비스되는 소버린 AI가 이뤄진다는 설명이다. 특히 SK텔레콤 자체 개발한 한국어 특화 LLM 에이닷엑스 4.0은 현존하는 LLM 중 최고 수준의 한국어 이해 성능을 확보하고 있어 국내 비즈니스 환경에 최적화된 모델이라는 평가를 얻고 있다 양사는 테스트를 시작으로 협력 범위를 지속 확대해 국내 AI 생태계의 자립성을 강화해 나갈 계획이다. 이상민 SK텔레콤 성장사업추진실장은 “국가 간 AI 기술 경쟁이 심화되고 있는 이 때, 국내 AI 생태계 자립성 강화는 개별 기업이 아닌 국가의 경쟁력을 좌우할 수 있는 중요한 요소”라며 “앞으로도 AI 데이터센터, LLM, AI 반도체 등을 포함한 국내 AI 생태계의 역량 강화를 위해 노력할 것”이라고 말했다. 박성현 리벨리온 대표는 “국산 AI반도체가 SKT의 국산 LLM 기반 서비스에 적용될 수 있게 된 것은 기술적 완성도를 넘어, 국내 AI 생태계 자립을 실현하는 중요한 이정표”라며, “리벨리온은 앞으로도 안정적이고 에너지 효율적인 AI 인프라를 통해, 대한민국이 AI 세계 3대 강국으로 도약하는 데 기여하겠다”고 밝혔다.

2025.06.25 09:03박수형

정부-학계, 국산 NPU 육성 본격화…실증부터 인재양성까지

정부가 국산 AI반도체에 대한 지원을 대폭 늘리고 있다. 추경(추가경정예산)을 두차례 진행해 약 800억원 규모 예산을 NPU(신경망처리장치)에 투자하는 것이다. 이에 더해 학계에서는 국산 AI반도체를 AI 개발에 활용하며, 국산 칩 상용화의 단초를 다지고 있다. 정부, NPU 사업에 794억원 투자 23일 업계에 따르면 정부는 최근 국무회의에서 제2차 추경안을 의결했다. 이번 추경은 국산 NPU 상용화 개발 지원 예산 300억원을 추가하는 내용을 골자로 한다. 지난 1차 추경 금액인 494억원까지 더해, 총 794억원의 지원금이 국산 NPU 조기 상용화에 투입된다. 정부는 구체적으로 ▲AI 컴퓨팅 실증 인프라 고도화 ▲인공지능 전환(AX) 실증 지원 ▲AI 반도체 사업화 적시 지원 ▲AI 반도체 해외 실증 지원 ▲국산 AI 반도체 기반 디바이스 AX 개발·실증 등에 예산을 투입한다. 특히 AI반도체 업체들이 글로벌 시장에 진출할 수 있도록 기술을 실증하는데 사업 역량이 집중된다. 정보통신사업진흥원(NIPA)은 해외 실증 지원 추경 사업에 참여할 컨소시엄을 총 4개 선정한다. 서버형 2개, 엣지형 2개 등 총 4개 지원 사업에 1개씩 컨소시엄을 참여시킨다는 구상이다. 사업 대상은 기존에 참여하던 리벨리온(서버형), 딥엑스(엣지형) 외에도 퓨리오사AI가 서버형 지원 사업에 참여하는 방안을 검토하는 걸로 전해진다. 한편, NIPA는 다음달 초 컨소시엄을 선정할 예정이다. 서울대, 국산 NPU로 융합형 인재 양성 다만 NPU를 현장에서 바로 활용할 수 있는 인재는 부족한 실정이다. AI 기술을 이해하면서도 반도체 구조와 시스템을 고려하는 HW(하드웨어)-SW(소프트웨어) 융합 인재가 없기 때문이다. 최기창 서울대학교 교수는 “현재 대학 교육은 대부분 AI와 반도체를 분리된 전공으로만 다루고 있다”며 “실제 산업 환경에서 사용되는 도구나 플랫폼에 대한 경험이 부족한 이유”라고 설명했다. 이에 서울대 차세대반도체 혁신융합대학은 올해 2학기부터 국산 AI반도체를 활용한 'We-Meet' 프로그램을 수업에 본격 도입한다. 국산 NPU의 활용 사례를 늘리면서도, AI반도체 전문 인재를 양성하기 위함이다. 수업은 크게 세가지로 분류된다. 먼저 국산 AI반도체 기반 LLM(대규모 언어모델) 실습 수업이다. 서울대 규장각 데이터인 조선왕조실록을 기반으로 수업이 진행되며, 단순히 생성형 AI 결과를 보는 데 그치지 않고 학생들이 직접 프롬프트(AI 모델에 텍스트 지시) 설계에 참여한다. 결과가 나오면 직접 분석하고, 생성형 AI 구조와 작동 원리를 실습 중심으로 학습한다. 이 때 퓨리오사AI에서 양산한 '레니게이드'를 수업에 활용한다. 실제 인프라 환경부터 모델 구현까지 익힐 수 있는 셈이다. 이혁재 서울대 반도체공동연구소장은 “국산 칩인 퓨리오사AI의 반도체로 AI가 잘돌아간다는 걸 보여줄 수 있는 기회”라고 말했다. 두번째는 '반도체 산업 활용 AI 최적화 기술과 MLOps 플랫폼' 수업이다. 이 수업은 반도체 제조 과정에서 실제로 사용되고 있는 품질검사 AI 기술을 교육과정에 반영한 케이스다. 학생들은 공개 가능한 반도체 제품 이미지 데이터셋을 활용해 AI 모델을 학습한다. 최 교수는 “수업 중 진행되는 MLOps 플랫폼과 API 연동 실습은 실제 기업들이 운영 중인 생산 환경과 유사한 구조”라며 “실무적인 성격이 강하다”고 말했다. 세번째 수업은 'NPU 기반 AI 추론 및 응용이다. 요즘 급부상하고 있는 온비다이스 AI, 엣지 컴퓨팅을 다루는 수업으로, 국산 NPU 하드웨어에서 AI 모델을 실행하는 걸 목표로 한다. 최 교수는 “실제 AI 반도체 서버, Llama3, MLOps, NPU 개발환경까지 체험하면서 최신 기술 흐름을 실습 중심으로 익히게 될 예정”이라며 “단순한 '교과 성적'이 아닌 산업 현장에서 검증된 실전 역량이라는 점에서 취업 경쟁력에서 큰 차별화 요소가 될 것으로 기대된다”고 내다봤다.

2025.06.23 16:52전화평

HP "AI 컴패니언, 올해 안에 온디바이스로 전환"

"HP코리아가 현재 출시하고 있는 AI PC에는 업무 생산성을 향상할 수 있는 소프트웨어인 'AI 컴패니언'이 기본 탑재됩니다. 여러 지식을 검색하는 '디스커버', 각종 문서 파일을 분석해 주는 '애널라이즈' 등 기능을 갖췄습니다." 12일 오후 서울 여의도 HP코리아 브리핑룸에서 만난 최순모 HP코리아 테크니컬 컨설턴트가 AMD 라이젠 AI 9 HX 프로 375 기반 AI PC인 엘리트북 X G1a를 앞에 두고 이렇게 설명했다. HP코리아는 지난 해 6월 스냅드래곤 X 엘리트 기반 '엘리트북 울트라'를 시작으로 지난 4월 인텔 코어 울트라 시리즈2 기반 '엘리트북 울트라 G1i', AMD 라이젠 AI 기반 고성능 미니PC 'Z2 미니 G1a' 등 다양한 AI PC를 시장에 출시하고 있다. 이들 PC는 40 TOPS(1초당 1조 번 연산)급 이상 성능을 갖춘 NPU를 탑재했고 이를 활용할 수 있는 'AI 컴패니언'을 기본 탑재한다. 오픈AI가 개발한 언어모델인 GPT-4o를 이용해 지식 검색, 문서 분석 등을 수행한다. 등산로 추천부터 화면 분석까지 무료로 수행 AI 컴패니언의 '디스커버' 탭에서 '초보자용 북한산 코스를 추천해줘'라는 질문을 입력하자 다양한 코스를 추천했다. 최순모 컨설턴트는 "챗GPT는 매달 구독료가 필요하지만 AI 컴패니언은 이를 무료로 활용할 수 있다"고 설명했다. HP는 지난 3월 AI 컴패니언 업데이트로 '스닙 투 프롬프트'(Snip-To-Prompt) 기능을 추가했다. 현재 PC 화면을 선택해 물어보면 관련 내용을 정리해 제공한다. 최순모 컨설턴트는 "이 기능이 추가되며 활용도가 크게 높아졌다"고 설명했다. 기자가 11일 촬영한 취재 사진을 띄운 다음 사진에 대한 설명을 요청하자 촬영 상황과 상당히 부합하는 설명을 내놨다. 단 6월 현재 사진 파일을 직접 올려 관련 정보를 검색하는 기능은 지원하지 않는다. 문서 요약과 분석 진행하는 '애널라이즈' 기능 최순모 컨설턴트는 AI 컴패니언 기능 중 직장인과 학생에게 가장 도움을 줄 기능으로 '애널라이즈'를 꼽았다. 이용자가 가지고 있는 워드, 파워포인트, PDF, 일반 텍스트 파일 등 다양한 자료를 모아 요약하고 인사이트를 얻을 수 있다. 최 컨설턴트는 "애널라이즈 기능은 라이브러리당 최대 100MB 파일, 최대 10개 라이브러리를 생성 가능하다. 문서 처리는 PC에서 처리하고 분석만 클라우드에서 진행하는 하이브리드 구조"라고 설명했다. 5월 중순 '컴퓨텍스 타이베이 2025' 기간동안 기자가 작성한 한국어 기사 원문(텍스트) 파일을 모아 라이브러리를 생성한 다음 '주요 업체가 발표한 신제품과 기술 10개를 추천하고 특징을 요약하라'고 질문하자 관련 내용을 출력했다. 최순모 컨설턴트는 "보안 관련 영문 기술 문서나 연구 자료를 분석하고 요약하는 데는 상당한 시간이 걸린다. 그러나 애널라이즈를 활용하면 불과 30초만에 요점을 추출할 수 있어 저 자신도 고객사를 위한 제안서 작성 등 실제 업무에 활용하고 있다"고 밝혔다. "이 설정 어떻게 하지" PC 초보자 돕는 '퍼폼' '퍼폼'은 PC 초보자를 대상으로 LLM이 성능 최적화 방법이나 설정 방법을 알려주는 기능이다. 최 컨설턴트는 "중장년층 이외에도 스마트폰·태블릿에 친숙한 25-34세 세대 중 각종 설정을 어려워하는 사람들이 많다. 이런 이용자들을 위한 기능"이라고 말했다. 이어 "현재는 키보드로 질문을 입력해야 하지만 음성인식 기능을 이용해 질문할 수 있는 기능도 추가될 것"이라고 설명했다. 미국이나 유럽, 일본 등 외국에서는 주요 IT 업체 고객지원센터를 사칭해 결제를 유도하거나 개인정보, 금융정보를 훔치고 스파이웨어 등 악성코드를 설치하는 '서포트 스캠'이 빈발하고 있다. 동석한 HP코리아 관계자는 "퍼폼 기능을 활용하면 서포트 스캠으로 인한 금전적 손실이나 개인정보 유출 등 선의의 피해를 막는데도 도움이 될 것"이라고 말했다. "AI 컴패니언, 올해 안에 온디바이스로 갈 것" 현재 AI 컴패니언은 AI PC의 CPU와 GPU, NPU 등 연산 성능과 HP가 제공하는 클라우드를 활용하는 하이브리드 형태로 작동한다. 그러나 데이터가 클라우드로 전송되기 때문에 영업 비밀이나 기업 비밀, 개인정보나 프라이버시 노출 우려가 발생한다. 최순모 컨설턴트는 "현재 AI 컴패니언 버전은 1.1이지만 올해 안에 2.0으로 업데이트하면 AI 모델을 PC에 설치해 완전한 온디바이스 구동이 가능할 것"이라고 설명했다. 기기에 설치되는 AI 모델은 매개 변수가 40억 개 수준인 마이크로소프트 소형언어모델(SLM), 파이 3.5가 될 예정이다. 최 컨설턴트는 "파이 3.5는 문서 요약 등에 충분히 활용할 수 있는 성능을 내며 이를 위해서는 최소 32GB 메모리가 필요하다"고 설명했다. "기업 내 자체 AI 모델 개발용 워크스테이션 수요도 대응" 주요 PC 제조사는 오는 10월 윈도10 지원 종료를 앞두고 주요 기업 대상으로 AI PC를 내세우고 있다. 그러나 정보 유출 우려나 기업 내 보안 정책 등으로 AI 기능 관련 기대치에는 여전히 온도 차이가 있다. 관련 업계는 결국 기업들이 필요로 하는 AI 기능을 직접 개발해 AI PC상에서 실행하고, 보다 복잡한 처리가 필요한 기능은 기업이 직접 관리하는 클라우드 도움을 받는 하이브리드 형태로 갈 것으로 예상하고 있다. HP코리아 관계자는 "기업이나 기관, 조직 내 AI 모델 개발에는 고성능 워크스테이션이 필요하다. 이런 수요에도 대응하는 한편 AI PC의 활용도를 높이기 위해 글로벌 차원에서 개발자 지원 프로그램도 운영중"이라고 밝혔다.

2025.06.13 14:41권봉석

과기정통부, AI반도체 추경사업 통합설명회 11일 개최

과학기술정보통신부가 국내 팹리스 NPU의 조기 상용화를 지원하기 위해 추경으로 편성한 AI반도체 분야 사업에 대한 통합 설명회를 11일 오후 한국과학기술회관에서 개최한다. 과기정통부는 AI반도체 분야 중요성을 고려해 올해 추경 494억원을 포함해 R&D, 실증, 인재 양성 등에 총 2천434억원을 투자한다. 특히 추경사업은 우수한 기술력을 갖춘 국내 유망 팹리스들이 NPU 조기 상용화에 필수적이라고 요청한 현장 의견을 적극 반영해 기획됐다. AI반도체 분야 추경 사업은 ▲AI컴퓨팅 실증 인프라 고도화(120억) ▲AX 실증 지원(40억) ▲AI반도체 사업화 적시 지원(220억) ▲AI-반도체 해외 실증 지원(54억) ▲국산 AI반도체 기반 디바이스 AX 개발·실증(60억) 사업으로 구성됐다. 이 가운데 AI컴퓨팅 실증 인프라 고도화 사업, AX 실증 지원 사업, AI반도체 사업화 적시 지원 사업(제품 제작지원)은 이달 30일까지 공고를 통해 신규 과제 수행자를 모집하고 있다. 통합설명회는 추경사업을 실제 집행하기 전에 기업들에게 사업 내용을 상세히 설명하고 사업 추진에 대한 의견을 수렴하기 위해 마련한 자리로, 사업 전반에 걸친 자유로운 질의응답을 진행하여 기업들이 과제를 지원하는데 애로사항이 없도록 실무적인 소통도 강화할 예정이다. 아울러 과기정통부는 통합 설명회와 연계해 AI반도체 팹리스 간담회도 함께 진행한다. 박태완 과기정통부 정보통신산업정책관은 “과기정통부는 그간 기업과의 긴밀한 소통을 바탕으로 정책수요를 발굴하여 이번 추경 사업 등 기업이 실제 필요한 지원 사업을 추진해왔다”며 “앞으로도 사업 기획은 물론, 집행 과정에서도 지속적으로 의견을 청취하여 국내 팹리스에게 실질적인 도움을 제공하고 국산 NPU가 조기에 상용화되는 성과를 창출할 수 있도록 노력하겠다”고 말했다.

2025.06.10 12:00박수형

퀄컴, 英 '알파웨이브 세미' 24억 달러에 인수…AI 데이터센터 공략 강화

퀄컴이 고속 데이터 연결 솔루션 기업 알파웨이브 세미(Alphawave Semi)를 인수하기로 했다. 스마트폰·PC에 이어 데이터센터로 사업 영역을 확장하기 위한 투자다. 퀄컴은 영국 런던에 상장된 반도체 기업 알파웨이브 세미를 24억 달러(한화 약 3조2천억원)에 인수하기로 했다고 9일 밝혔다. 퀄컴은 "이번 인수는 데이터센터 확장을 가속화하고 핵심 자산을 확보하는 것을 목표로 한다"며 "퀄컴의 오라이온 CPU(중앙처리장치)와 헥사곤 NPU(신경망처리장치) 프로세서는 점차 확대되는 고성능·저전력 컴퓨팅 수요를 충족할 수 있는 유리한 위치에 있다"고 설명했다. 지난 2017년 설립된 알파웨이브 세미는 고속 연결 및 컴퓨팅 기술 분야에 주력해 온 반도체 설계 기업이다. 빠르고 안정적인 데이터 전송을 위한 IP(설계자산), 맞춤형 실리콘, 칩렛(여러 개의 단일 칩을 하나로 집적하는 기술) 플랫폼 등을 제공하고 있다. 크리스티아노 아몬 퀄컴 최고경영자(CEO)는 "알파웨이브 세미는 전력 효율적인 CPU 및 NPU 코어를 보완하는 선도적인 고속 유선 연결 및 컴퓨팅 기술을 개발했다"며 "이번 인수의 목표는 데이터센터 인프라를 포함한 다양한 고성장 분야에서 차세대 커넥티드 컴퓨팅 성능을 구현하는 것"이라고 밝혔다. 한편 이번 인수는 내년 1분기 내 완료될 것으로 예상된다.

2025.06.10 08:51장경윤

[유미's 픽] "삼성만 믿는다"…과기부, '이재명 정부' 출범 속 국가AI컴퓨팅센터 유찰 막을까

최대 2조5천억원이 투입되는 국가인공지능(AI)컴퓨팅센터 구축 사업 재공고에 나선 과학기술정보통신부가 이번에는 유찰을 막고 명예회복에 성공할 지 주목된다. 높은 초기 투자 부담과 구체적인 수익 확보 및 비즈니스 모델을 제시하고 있지 못했던 탓에 한 차례 유찰됐지만, 이번에는 1개 이상 기업이 참여할 가능성이 높은 것으로 알려져 기대감을 키우고 있다. 5일 업계에 따르면 오는 13일 마감되는 국가AI컴퓨팅센터 사업 재입찰에 삼성SDS를 주축으로 한 컨소시엄이 참여할 것으로 알려졌다. 당초 삼성SDS는 네이버클라우드, 엘리스그룹, 삼성물산 등과 컨소시엄을 구성해 초기 입찰에 참여하려고 했으나, 막판에 네이버클라우드 측에서 발을 빼 무산된 것으로 전해졌다. 이 컨소시엄에서 삼성전자는 지분이 없지만 사업 협력에 나서려고 했던 상황이다. 이 컨소시엄은 정부가 연내 확보할 계획인 그래픽처리장치(GPU) 1만 장을 네이버 데이터센터 각 세종 등 기존 인프라에서 우선 구동한 후 비수도권에 국가AI컴퓨팅센터를 신규 구축하는 방안을 마련했던 것으로 알려진 바 있다. 그러나 업계에선 네이버클라우드가 각 세종, 각 춘천 등 기존 인프라에 이미 네이버 자체 물량을 소화하고 있고, 외부 업체 물량은 데이터센터를 임차하는 방식으로 운영하고 있어 현실성이 떨어지는 것으로 봤다. 다만 네이버클라우드가 올 초 경기도 용인에 전력량 20MWh(메가와트시) 가량의 데이터센터를 임차한 것으로 알려져 이를 대비했던 것 아니냐는 시각도 있다. 업계 관계자는 "엘리스그룹은 아직 제대로 상용화되진 않았지만 국산 신경망처리장치(NPU)에 많은 관심을 보이며 컨소시엄에 적극 참여하겠다는 의지를 드러냈다"며 "삼성SDS는 GPU를 확보해 운영하려고 했던 분위기 속에 네이버클라우드의 역할이 다소 애매해진 영향이 있었던 것으로 안다"고 말했다. 이어 "컨소시엄 자체가 대부분 클라우드 서비스 제공업체(CSP)로 구성됐다는 점에서 서로 간의 역할 구분이 어려웠을 수도 있다"면서도 "조건 변경 없이 재공고된 상황에서 삼성 측이 컨소시엄을 구성할 때 네이버클라우드가 기존대로 참여할지, 아닐지 주목된다"고 덧붙였다. 업계에선 네이버클라우드가 국내 인공지능(AI) 시장에서 중요한 역할을 하고 있는 만큼, 삼성 측이 컨소시엄을 구성해 재입찰에 나선다면 충분한 설득 작업을 벌여 그대로 참여시킬 것으로 봤다. 조건 변경 없이 재입찰 공고가 나와 사업 매력도는 다소 떨어지지만 국가를 대표하는 기업들이 정부 사업에 기여를 해야 한다는 통합된 의견을 가지고 있는 만큼, 이번에 함께 나설 것이라고 보는 게 중론이다. 더불어 이번에는 1개 이하 컨소시엄이라도 사업 참여를 신청할 경우 공모지침상 평가기준에 의거, 적정 사업자인지 판단을 거쳐 수의계약을 바로 체결한다는 점에서도 삼성 측의 참여 확률이 높다고 봤다. 높은 초기 투자 부담과 구체적인 수익 확보 및 비즈니스 모델을 제시하고 있지 못한 상황이지만, 수의계약 과정에서 삼성 측과 정부의 지분 및 수익성 구조 등에 재협상에 나설 가능성도 있다고 판단해서다. 일단 사업자들이 국가AI컴퓨팅센터 구축 사업 공모 조건에서 가장 우려하는 부분은 정부가 특수목적법인(SPC) 지분 51%를 갖기 때문에 기업이 수익성을 늘리는 방향으로 사업을 주도하기 어렵다는 점이다. 결국 정부 의도대로 공공사업 성격을 가질 수밖에 없다고 봐서다. 여기에 AI 시대에 접어들며 엔비디아의 GPU 가격이 급등한 상황에서 수만 장을 사들여야 하는 데다 이를 국내 기업·기관에 기존보다 저렴하게 빌려줘야 해 수익을 내지 못한다는 점은 큰 걸림돌이 되고 있다. 업계 관계자는 "사업자 입장에선 자체 운영 중인 AI 데이터센터와 국가AI컴퓨팅센터가 같은 고객사를 두고 서로 경쟁해야 하는 관계라는 인식도 가지고 있다"며 "국가AI컴퓨팅센터를 통해 더 저렴한 GPU 서비스를 내놓는 것이 자체 데이터센터의 고객을 빼앗기거나 가격 경쟁으로 수익성이 낮아지는 결과를 초래할 수 있다는 점에서 매력적으로 보이진 않는다"고 밝혔다. 하지만 과기정통부는 이번에는 기필코 유찰을 막겠다는 강한 의지를 보이고 있는 것으로 전해졌다. 이번에도 유찰이 될 경우 사업에 막대한 차질을 빚을 수 있어서다. 정부는 오는 13일까지 국가AI컴퓨팅센터 참여 희망 기업·컨소시엄의 사업 참여 계획서를 접수하고 이달 안에 기술·정책 평가(1단계)를 거쳐 7월 투자·대출 등 금융심사(2단계) 후 이르면 8월 말께 최종 적정 기업 또는 컨소시엄을 선정한다는 계획을 세운 바 있다. 또 9월에는 특별위원회를 개최해 사업 시행계획을 보고한 후 10월께 특수목적법인(SPC) 설립을 위한 협약을 민간참여자와 체결할 예정이었다. SPC 설립 후에는 오는 11월부터 사업에 착수할 계획을 갖고 있었다. 센터 설립 시기는 오는 2027년으로 설정됐으며 내년에 착공을 시작할 예정이다. 하지만 신청에 나선 사업자가 이번에도 없게 되면 모든 계획이 물거품이 된다. 새롭게 출범한 '이재명 정부' 입장에서도 'AI 100조원 투자'를 공약한 상황에서 초기부터 AI 관련 국가 사업이 무산되게 되면 난감한 상황에 놓일 수 있다. 이에 과기정통부는 삼성 측이 그간 공공연하게 의지를 보였다는 점에서 적극적으로 참여 유도를 하고 있는 것으로 알려졌다. 실제 삼성SDS는 이준희 대표까지 나서서 국가AI컴퓨팅센터 사업에 참여하겠다는 의사를 밝힌 바 있다. 앞서 이 대표는 지난 3월 '제40기 정기 주주총회'에서 "정부에서 하는 대구센터나 행안부, 복지부 등 여러 안건들이 있어 (국가AI컴퓨팅센터 구축 사업에 대해) 잘 검토할 것"이라며 "국가에서 하는 것인 만큼 다방면으로 보고 있다"고 언급해 기대감을 높였다. 업계 관계자는 "이번 재공고는 유찰되지 않을 가능성이 상당히 높은 것으로 보인다"며 "모두가 예상하고 있는 곳의 참여가 유력한 것으로 안다"고 밝혔다. 또 다른 관계자는 "수천억원이 투입되는 장기 사업인 데다 낮은 수익성이 우려된다는 점에서 현재 공개된 조건에선 다른 기업들이 참여 결정을 내리기 쉽지 않다"며 "공모지침 변경을 통해 광범위한 제안 조건과 사업 참여 부담 등이 일정 부분 해소될 수 있다면 참여를 고려해보려고 했는데, 재공고 때도 대부분의 기업은 참여하지 않을 듯 하다"고 말했다. 그러면서 "두 번 유찰되면 자동으로 지원한 사업자가 우선 협상할 수 있게 될텐데, 지금으로선 삼성밖에 지원할 곳이 없어 보인다"며 "향후 우선 협상을 하게 된다면 삼성이 정부와 지분 및 수익성 구조 등에 대해 재협상에 나설 여지가 크다"고 덧붙였다.

2025.06.05 17:31장유미

"클라우드 제약 벗어난 AI 혁신, 퀄컴 AI 허브로 돕는다"

"AI는 자료 요약이나 정리를 통한 생산성 향상과 업무 효율 향상, 문자인식이나 번역, 카메라 화질 개선 등 이미 우리 일상생활에서 널리 쓰이고 있다. 보다 다양한 기기와 응용프로그램이 AI로 지능적으로 작동하도록 돕는 것이 퀄컴의 목표다." 5일 오후 서울 강남구 그랜드 인터컨티넨탈 서울 파르나스에서 열린 '컨버전스 인사이트 서밋'(CIS 2025)에서 이규진 퀄컴코리아 이사가 이렇게 강조했다. 이날 이규진 이사는 "클라우드를 거치지 않고 다양한 기기 연산 능력만 활용하는 온디바이스 AI 개발에는 다양한 장애물이 있으며 퀄컴은 이를 해소할 수 있는 '퀄컴 AI 허브'를 제공하고 있다"고 설명했다. "온디바이스 AI, 지연시간·비용에 장점 지녀" 현재 주목받는 다양한 AI 서비스는 대부분 클라우드에서 구동된다. 웹브라우저나 스마트폰 앱으로 질문이나 이미지 생성 요청을 넣으면 불과 수 초 안에 원하는 결과물을 되돌려준다. 그러나 클라우드로 데이터가 오가고 결과물을 받아보는 구조 상 개인 정보 등 프라이버시나 기업 비밀, 민감 정보 노출 가능성에서 자유롭지 않다. 또 지연 시간이나 서비스 장애/중단시 이를 활용할 수 없다는 문제도 있다. 이규진 이사는 "AI 구동을 클라우드에서 로컬 기기로 전환하면 컴퓨팅 자원 이용에 드는 비용을 줄이는 것은 물론 처리 시간 단축, 개인정보나 민감정보, 비밀 유출 차단 등 다양한 이점을 얻을 수 있다"고 설명했다. 이어 "온디바이스 AI를 효과적으로 실행하려면 CPU나 GPU 뿐만 아니라 각종 AI 연산을 저전력으로 실행하는 NPU(신경망처리장치)가 필요하다. 퀄컴이 스마트폰이나 PC, 오토모티브(자동차)나 IoT용으로 제공하는 스냅드래곤 플랫폼은 이를 충족한다"고 덧붙였다. 다양한 모델 사전 최적화해 제공하는 '퀄컴 AI 허브' 퀄컴 AI 허브는 퀄컴 스냅드래곤/드래곤윙 시스템반도체(SoC) 탑재 기기에서 작동하는 AI 앱이나 서비스 개발을 돕기 위한 개발자 포털로 작년 3월부터 가동을 시작했다. 지원하는 런타임은 현재 라이트RT와 범용성을 갖춘 ONNX, 퀄컴 SoC에 최적화된 퀄컴 AI 스택 등 3가지다. 이규진 이사는 "퀄컴 AI 허브는 6월 기준으로 220개 이상의 오픈소스 AI 모델을 퀄컴 플랫폼에 최적화해 제공하고 있고 이들 모델을 활용한 상용 서비스 구현도 문제가 없다"고 설명했다. 이어 "자체 개발한 AI 모델이나 추론 성능을 강화한 모델, 튜닝한 모델을 가져와 대상 플랫폼에 맞는 형태로 최적화하는 작업도 '자체 모델 불러오기' 기능으로 지원한다"고 덧붙였다. "물리 기기 기반 프로파일링으로 PoC 시간 단축" 퀄컴 AI 허브는 허브 내에서 구동되는 실물 기기 기반 시뮬레이션으로 AI 모델을 직접 실행하고 실행 소요 시간 프로파일링, 메모리 이용량, 연산량 측정 등 기능도 수행한다. 이규진 이사는 "이들 기능을 활용하면 개념실증(PoC)을 더 빠르게 추진하고 완성도를 강화할 수 있다. 또 개발자와 퀄컴 담당자가 참여하는 슬랙 커뮤니티를 통해 개발 과정에서 겪는 어려움에 대해 서로 논의할 수 있다"고 설명했다. 이어 "퀄컴 AI 허브를 활용해 국내에서도 더 많은 개발자들이 온디바이스 AI 앱과 서비스를 개발하고 이를 통해 관련 생태계 활성화가 일어나길 바란다"고 당부했다.

2025.06.05 16:50권봉석

메가존클라우드, '경기 K-AI 클라우드존' 개소…AI 스타트업 GPU·NPU 무상 지원

메가존클라우드(대표 염동훈)가 경기도 인공지능(AI) 스타트업을 대상으로 클라우드 기반 기술지원에 나선다. 메가존클라우드는 경기도와 차세대융합기술연구원(이하 융기원)이 추진하는 '경기도 AI 기업 고성능 컴퓨팅 지원사업'의 클라우드 인프라 공급사로 선정됐다고 5일 밝혔다. 이번 공급 계약에 따라 고성능 컴퓨팅 인프라 제공부터 운영, 기술 지원까지 전 과정을 통합 매니지드 서비스 형태로 제공한다. 특히 GPU·NPU 등 고가의 장비를 자체적으로 확보하기 어려운 스타트업, 중소기업, 대학 창업기업 등에 클라우드 기반 고성능 자원을 무상으로 지원함으로써 AI 기술 개발 환경을 획기적으로 개선하겠다는 전략이다. 과천 메가존산학연센터에서 열린 경기 K-AI 클라우드존 개소식 및 사업설명회에는 메가존클라우드 서민택 부사장, 김기병 경기도 AI국 국장, 배수문 융기원 부원장 등이 참석했다. 메가존클라우드는 이날 행사에서 수요기업들을 대상으로 사업 개요와 지원 내용을 소개하고, 주요 클라우드 기업들의 활용 사례를 공유했다. 경기 K-AI 클라우드존은 이번 사업 전용 공간으로 과천 메가존산학연센터 내에 구축했다. 수요기업은 이 공간에서 엔비디아 H100, A100, V100, H200 등 GPU 자원은 물론, NPU 등 최신 고성능 컴퓨팅 자원을 비교·체험할 수 있다. 네이버클라우드, NHN클라우드, KT클라우드, 삼성클라우드, 카카오클라우드 등 주요 국내 K-클라우드 기업의 서비스도 선택해 활용할 수 있도록 구성됐다. 현장에는 메가존클라우드의 전문 엔지니어가 상주하며, 수요기업의 클라우드 서비스 도입과 운영을 1:1로 지원하는 기술 컨설팅도 제공한다. 특히 메가존클라우드는 각 클라우드 서비스 제공사(CSP)별 전담 기술팀을 구성해 인프라 구축, 장애 대응 등 전 과정을 통합 지원함으로써 기업들이 클라우드 자원을 안정적이고 효율적으로 활용할 수 있도록 돕는다. 경기도 AI 기업 고성능 컴퓨팅 지원사업의 참여기업 모집은 6월 20일까지 진행된다. 지원 대상은 경기도 내 본사 또는 주된 사업장을 둔 AI 스타트업, 중소기업, 대학 창업기업, 청년기업이며, 총 50개사를 선정할 예정이다. 이 가운데 GPU만 활용하는 기업은 40개사, GPU와 NPU를 함께 활용하는 기업은 10개사를 대상으로 기본 3개월간 고성능 자원을 무상 제공하며, 크레딧 소진 후에도 할인된 가격으로 자원을 추가 활용할 수 있다. 경기도 김기병 AI국장은 "AI 기업에 있어 고성능 컴퓨팅 자원 제공은 실질적인 성장의 사다리를 놓아주는 것과 같다"며 "잠재력 있는 혁신기업들이 AI 인프라 격차를 넘어 글로벌 무대에 도전할 수 있도록 아낌없는 지원을 이어가겠다"고 밝혔다. 메가존클라우드 황인철 최고매출책임자(CRO)는 "AI 기업들이 인프라 부담 없이 기술 개발에 집중할 수 있는 환경을 만드는 것이 이번 사업의 핵심 목표"라며 "사업 성공에 그치지 않고, 축적된 경험을 기반으로 타 지자체 및 유사 사업으로 확산해 국내 클라우드 생태계 활성화에 기여하겠다"고 강조했다.

2025.06.05 09:41남혁우

국내 팹리스 NPU 조기 상용화 지원...494억 추경 사업 시동

과학기술정보통신부는 최근 국내 팹리스의 NPU 조기 상용화를 지원하기 위해 추경으로 편성한 AI반도체 분야 주요 신규 과제 공고를 6월30일까지 진행한다고 밝혔다. 과기정통부는 유망한 AI반도체 기업에게 실질적인 지원을 제공하기 위해 올해 추경으로 총 494억원을 편성했다. 주요 내용은 ▲AI컴퓨팅 실증 인프라 고도화(120억) ▲국산 AI반도체 기반 디바이스 AX 개발 실증(60억) ▲AX 실증 지원(40억) ▲AI-반도체 해외 실증 지원(54억) ▲AI반도체 사업화 적시 지원(220억)이다. 이에 따라 과기정통부는 이번 추경을 포함해 올해 R&D, 실증 및 인재양성 등 전 주기에 걸쳐 총 2천434억원을 투자해 AI반도체 산업 활성화를 지원하게 된다. 공고는 AI컴퓨팅 실증 인프라 고도화 사업, AX 실증 지원 사업, AI반도체 사업화 적시 지원 사업 중 제품 제작 고도화 지원 등 주요 신규 과제 수행 기업과 기관 모집을 위한 것이다. 먼저 AI컴퓨팅 실증 인프라 고도화 사업은 총 3년간 추진될 예정으로, 기존 소규모 기술 검증 중심에서 조기 상용화를 뒷받침하기 위한 대규모 국산 NPU 실증을 추진한다. 이를 위해 120페타플롭스(PF) 규모의 대규모 클러스터링 환경을 구현할 예정이며, 상용 AI컴퓨팅 서비스에 대응하는 실증 인프라를 구축한다. 올해는 우선적으로 상용 LLM을 실증할 수 있는 50PF 규모 인프라를 구축하고 내년부터는 단계적으로 인프라를 확충하고 본격적으로 다양한 최신 LLM을 실증할 계획이다. 또 AX 실증 지원 사업은 2년간 지원 예정으로, 이미 상용화된 다양한 AI서비스를 국산 AI반도체로 기반으로 전환하고 상용화까지 지원한다. 지역 산업 등과 연계한 총 4건의 상용 AI서비스에 대한 전환을 지원하여 산업계의 AX를 촉진하고, 전국 단위로 확산될 수 있도록 하여 NPU 기반 AI 추론 시장을 활성화할 계획이다. 마지막으로 AI반도체 사업화 적시지원 사업은 설계SW, 제품 제작, 카드 서버 단위 검증 등 유망 AI반도체 스타트업의 사업화 전주기 지원체계를 구축하여 지원 공백을 해소할 예정이다. 특히 기업들이 자체 실정에 맞게 지원받을 수 있도록 바우처 방식 등을 활용해 실질적인 지원 효과를 극대화하였다. 이와 함께 각 단계별 맞춤형 컨설팅·기술 지원 등도 제공하여 역량 있는 AI반도체 팹리스들의 신속한 시장진출을 촉진할 계획이다. 공고에서는 시제품 및 양산품 제작 지원 대상 기업을 모집할 예정이며, 바우처 방식으로 제공될 설계 SW 수요 기업은 6월 중 모집할 예정이다. 또한, 광주 AI집적단지 등에 구축한 AI반도체 검증체계를 고도화하여 올해 안에 팹리스의 제품 상용화에 필수적인 카드 서버 단위 안정성 및 호환성, 신뢰성 검증을 제공할 계획이다. 박태완 과기정통부 정보통신산업정책관은 “과기정통부는 그간 AI반도체의 중요성을 인식하고 기업과의 긴밀한 소통을 바탕으로 정책수요를 발굴해 사업화하는 등 국내 AI반도체 업계의 도약을 위해 지원해왔다”며, “앞으로도 산업계와 원팀이 되어 국산 AI반도체가 골든 타임 내 상용화되고 기업들에게 실질적인 지원이 이루어질 수 있도록 노력하겠다”고 밝혔다.

2025.05.29 14:45박수형

"2030년 기업용 PC 10대 중 1대는 AI 기반 워크스테이션"

AI 기술의 급속한 발전과 함께 컴퓨팅 환경이 데이터센터 중심에서 엣지 기반으로 이동하고 있다. 글로벌 엣지 AI 시장 규모는 2024년 326억 달러(약 44조 6천620억원)에서 2029년 761억 달러(약 104조 2천570억원)로 연평균 25.9% 성장할 것으로 예측된다. AI 관련 칩 시장도 2023년 160억 달러(약 21조 9천200억원)에서 2030년까지 연평균 33.9%의 고성장이 전망된다. 이런 변화는 워크스테이션 시장에도 직접적인 영향을 미치고 있다. 시장조사업체 IDC에 따르면, 지난 해 전 세계 워크스테이션은 2023년 대비 7% 성장했다. 또 2030년까지 판매되는 기업용 PC 10대 중 1대가 워크스테이션으로 예상된다. 업계는 현재 기업용 PC 시장에서 워크스테이션 비중은 5%이며 5년 뒤에는 10%까지 성장할 것으로 예측하고 있다. "제조·연구·개발 종사자 40% 워크스테이션 활용중" 글로벌 PC 제조사 델테크놀로지스가 지난 1월 공개한 '업무용 PC 사용 현황 및 AI PC 전망 보고서'에 따르면, 응답자 2천500명 중 제조, 연구, 개발 직무 종사자의 42%가 이미 워크스테이션을 사용하고 있으며, 기존 워크스테이션 사용 기업 중 46%가 올해 AI 프로젝트를 위한 추가 투자를 계획하고 있다. 샘 버드(Sam Burd) 델테크놀로지스 클라이언트 솔루션 그룹 사장은 "델은 AI에 '올인'했다. 디바이스 측면에선 AI의 역량을 품은 PC를 제공하며, 특히 기업용 PC 고객들이 엣지에서 생성된 데이터를 로컬 PC로 이동시켜 AI 모델을 구동할 수 있게 됐다"고 밝혔다. 델테크놀로지스는 올해 본격적인 AI 시대를 맞아 기존 워크스테이션 제품을 '델 프로 맥스'로 새롭게 브랜딩했다. 델 프로 맥스는 신경망처리장치(NPU)를 내장한 인텔·AMD 최신 프로세서와 AMD·엔비디아 전문가용 그래픽카드, 거대언어모델(LLM)을 원활히 처리할 수 있는 최대 128GB DDR5 메모리, AI 모델 입출력 데이터 처리에 필요한 고성능 NVMe SSD로 복잡한 AI 워크로드 처리에 필요한 사양을 갖췄다. 델 프로 맥스 타워 T2, 대규모 데이터 분석에 최적화 델 프로 맥스 타워 T2는 인텔 코어 울트라 200S 프로세서와 엔비디아 RTX 프로 6000X 블랙웰, 지포스 RTX 5090 GPU를 선택 가능한 데스크톱형 제품이다. 고성능 프로세서와 GPU 구동에 필요한 1500W급 전원공급장치와 128GB DDR5 메모리, 최대 24TB 스토리지로 대규모 데이터 분석과 모델 훈련 작업을 원활하게 수행할 수 있다. AI 처리에 필요한 데이터가 생성되는 장소를 오가며 작업해야 하는 전문가를 위한 모바일 워크스테이션은 14인치부터 18인치까지 다양한 화면 크기로 제공된다. DCI-P3 색공간을 100% 만족하는 OLED 디스플레이로 데이터 시각화와 머신러닝 결과 분석에 적합하다. 올 3월 엔비디아 GTC 2025에서 공개한 GB10과 GB300 기반 델 프로 맥스는 개인 개발자가 구매해 책상 위에서 거대 모델을 테스트할 수 있다. 27일 델테크놀로지스 관계자는 "이용료와 접근성에 제약을 받던 기존 개발 환경 대비 제약을 최소화할 것"이라고 전망했다. 델 "ISV와 협업해 AI 기능 확대... 개발자도 지원" AI 처리를 위한 강력한 하드웨어를 뒷받침하는 것이 바로 소프트웨어다. 델테크놀로지스는 'RAG(검색증강생성)을 위한 델 가속 서비스'를 제공해 개발자들의 업무를 지원한다. TPM 기반 이중 암호화를 적용한 '컨트롤볼트' 기술로 AI 모델 개발과 이에 활용되는 데이터를 보호하며 ECC 메모리와 델 RMT 프로 기술로 메모리 오류를 자동 보정해 정밀한 AI 연산 작업의 신뢰성을 보장한다. 제프 클라크(Jeff Clarke) 델 최고운영책임자(COO)는 "델테크놀로지스는 현재 150여개 ISV들이 제공하는 300여개의 기능을 검토하고 있으며, NPU 기반 애플리케이션 관련해 협력하는 것을 긍정적으로 고려하고 있다"고 설명했다. IDC "향후 10년간 워크스테이션 황금기 맞을 것" 데이터 보안과 처리 속도를 동시에 만족해야 하는 기업 환경에서 로컬 AI 처리 능력을 갖춘 워크스테이션의 중요성은 더욱 부각되고 있다. 린 황 IDC 연구부사장은 "현재 AI 시대의 시작점에 불과하고 AI 개발을 가속화하는 데 워크스테이션이 얼마나 중요한 역할을 할 것인지 고려할 때, 향후 10년간 이 카테고리는 황금기를 맞이할 것"이라고 전망했다. 그러나 많은 기업 내 IT 결정권자들은 현재의 워크로드 요구사항뿐만 아니라 보안 역시 고려해야 한다. 델테크놀로지스 관계자는 "데스크톱형 제품에는 제품을 분해하고 내부 부품에 무단 접근할 경우 부팅을 원천 차단하는 '섀시 침입 센서', 노트북 제품에는 등록되지 않은 이용자가 화면을 볼 경우 이를 감지하고 차단하는 기능을 탑재하는 등 물리 보안 기능 추가에도 주력하고 있다"고 설명했다.

2025.05.27 14:56권봉석

모빌린트, AWS와 손잡고 엣지 AI 시장 공략 박차

AI 반도체 전문기업 모빌린트는 아마존웹서비스(AWS)와의 기술 협력을 추진한다고 23일 밝혔다. 양사는 'CES 2025'에서 첫 논의를 계기로 AWS의 엣지 컴퓨팅 플랫폼인 AWS IoT 그린그라스(Greengrass)에 모빌린트의 고성능 NPU를 연동하는 방안을 협의해왔으며, 이를 기반으로 엣지 AI 분야 고객 확보를 위한 전략적 협력과 공동 마케팅 방안을 함께 검토 중이다. 모빌린트는 현재 미국 산호세에서 열리고 있는 'Embedded Vision Summit(EVS) 2025'에 참가해 AWS와 기술 협력 방향을 소개하고, 처음 선보이는 MXM(Mobile PCI Express Module) 폼팩터 AI 가속기 'MLA100 MXM'을 활용한 데모를 포함해 자사 제품을 전시하며 많은 관심을 받았다. 이번 협력을 통해 AWS 플랫폼 상에서 모빌린트의 NPU를 직접 활용할 수 있는 환경이 마련되면, 고객은 실시간 데이터 처리, AI 추론, 민감 정보의 로컬 처리 등 엣지 환경에 필요한 핵심 기능을 로컬 디바이스에서 효율적으로 구현할 수 있게 된다. 특히 아마존 세이지메이커(Amazon SageMaker)와 모빌린트의 NPU SDK를 연계하면, AI 모델의 학습부터 배포, 최적화까지의 전 과정을 간소화할 수 있어 개발자 경험 또한 크게 향상될 것으로 기대된다. 신동주 모빌린트 대표는 “이번 AWS와의 협력은 단순한 기술 연계를 넘어, 글로벌 엣지 AI 시장에서 NPU 기반 통합 솔루션을 제시한다는 점에서 의미가 크다”며 “EVS현장에서 확인한 시장의 반응을 바탕으로, AWS와의 공동 마케팅 및 고객 확보 활동을 적극 전개해 나갈 것”이라고 밝혔다. MLA100 MXM은 자사 AI 가속기 칩 'ARIES'를 기반으로 설계된 고성능·저전력 엣지 AI 모듈로, 25W 전력 소모로 최대 80 TOPS의 연산 성능을 제공한다. 8개의 NPU 코어를 통해 복수의 AI 모델을 병렬 처리할 수 있으며, 82x70mm 크기와 110g의 경량 설계를 갖춰 로보틱스, 산업 자동화 등 공간 제약이 있는 시스템에 적합하다. 특히 자율주행, 스마트 팩토리, 산업용 로봇 등 고속 연산이 요구되는 분야에서 GPU 대비 뛰어난 전력 효율과 비용 효율을 바탕으로 차별화된 경쟁력을 제공한다

2025.05.23 11:21장경윤

엘리스클라우드 "최신 GPU·국산 NPU 이용 기관 수 반년 만에 9배↑"

AI 교육 솔루션 기업 엘리스그룹(대표 김재원)의 AI 특화 클라우드 솔루션 '엘리스클라우드' 이용 기관 수가 9배 이상 급성장했다고 22일 밝혔다. 지난해 11월부터 올해 5월까지 6개월 만의 성과다. 엘리스클라우드는 고성능 GPU와 NPU를 모두 제공하는 AI 특화 클라우드다. 다수의 스타트업, AI 연구실 등에서 활발히 활용되어 왔으며, 지난해 하반기부터 기업, 대학 고객이 크게 늘어나고 있는 추세다. 특히 신규 프로젝트, 학기 등이 시작되는 3월부터 엘리스클라우드 도입 문의가 늘어나고 있으며, 이용 기관 수 역시 이에 발맞춰 상승하고 있다. 올해 3월부터 5월까지 월 평균 성장세는 50% 이상으로 나타났다. AI 데이터 관리부터 프로젝트, AI 모델 개발 및 배포까지 가능한 원스톱 AI 클라우드 솔루션을 구축한 결과다. 또 올해 3월 클라우드 보안인증인 CSAP IaaS를 획득함으로써 보안역량을 입증 받아 CSAP를 필수로 하는 공공 기관은 물론, 데이터 보안을 중요시하는 기업의 관심도 높아지고 있다고 회사는 설명했다. 엘리스클라우드 이용자 수 역시 서비스 도입 초기인 2023년 6월 대비 2025년 3월, 21개월 만에 약 74배 증가하는 성과를 거뒀다. AI 도입을 원하지만 AI 모델 활용에 어려움을 느끼던 고객들을 고려해 편의성을 높인 다양한 AI 특화 서비스를 선보인 덕이다. 엘리스는 AI 모델에 대한 높아진 관심을 반영해 지난 2월 오픈소스를 포함한 다양한 범용 AI 모델을 별다른 설치 없이 편리하게 사용할 수 있는 최적화된 'ML API 라이브러리' 기능을 선보였다. 고객이 체감하는 가장 큰 혜택인 합리적인 가격은 엘리스클라우드만의 경쟁력이다. 회사에 따르면 이용자는 글로벌 클라우드와 동일한 조건으로 엘리스클라우드를 사용할 경우 77% 이상 비용을 절감할 수 있다. 이는 엘리스가 자체 기술로 개발한 클라우드 인프라를 활용해 AI에만 특화한 클라우드 솔루션을 제공해 가능하다. AI 모델을 효율적으로 운영할 수 있도록 NPU에 최적화된 솔루션도 제공한다. 엘리스는 AI에 특화한 고성능의 GPU와 NPU를 모두 제공 가능한 CSP로서 국산화한 GPU, NPU 클라우드 기술을 확보하고 있다. 김재원 엘리스그룹 대표는 "엘리스클라우드는 AI PMDC 기반으로는 국내에서 가장 많은 GPU 이용 기관을 보유하고 있다. 지속적인 성장세를 기록하고 있다"며 "특히 지난해부터 엔비디아 H100을 인피니밴드 기반 클러스터로 제공해 큰 성장을 기록했다. 이를 발판 삼아 올해 공공 부문과 해외까지 시장을 확대하고 다양한 고객 레퍼런스를 확보할 수 있도록 더욱 도약할 것"이라고 말했다.

2025.05.22 17:27백봉삼

ST, 신규 하이엔드 MCU 제품군으로 '에지 AI' 등 시장 공략

ST마이크로일렉트로닉스(이하 ST)가 에지(Edge)) AI를 비롯한 첨단 산업용 마이크로컨트롤러유닛(MCU) 시장 공략에 속도를 낸다. ST가 자체 개발한 신경망처리장치(NPU)와 MCU를 결합한 제품을 LG전자 등에 공급하는 한편, 무선 연결성과 보안 분야로도 제품군을 확장하고 있다. 최경화 ST마이크로일렉트로닉스코리아 이사는 20일 오전 서울 강남에서 열린 기자간담회에서 회사의 범용 MCU 사업 성장 전략에 대해 이같이 밝혔다. STM32는 Arm '코어텍스-M' 프로세서 기반의 32비트 MCU 및 마이크로프로세서(MPU) 제품군이다. AI와 같은 고성능은 물론 무선, 저전력, 임베디드 등 다양한 산업을 위한 칩으로 구성돼 있다. 최 이사는 "지난해 130만명 이상의 개발자들이 STM32 관련 생태계인 'STM32 큐브'를 사용했고, 이는 전년 대비 30% 성장한 수치"라며 "앞으로도 제품 고도화 및 다변화를 통해 범용 MCU 시장에서 오는 2027년까지 시장 대비 1.5배 높은 성장률을 기록하는 것이 목표"라고 강조했다. 이날 ST는 향후 수요가 증가할 것으로 예상되는 '지능형 사물' 시장을 공략하기 위한 최신 STM32 제품 3종을 소개했다. ▲엣지 AI 산업을 위한 고성능 MCU 'STM32N6' ▲다중 프로토콜을 지원하는 저전력 근거리 무선 MCU 'STM32WBA6' ▲고효율 및 강력한 보안 프로토콜이 탑재된 초저전력 MCU 'STM32U3' 등이다. 특히 STM32N6는 그간 ST가 출시한 제품 중 성능이 가장 뛰어나다. ST가 자체 개발한 NPU(신경망처리장치) '뉴럴-ART 가속기'를 최초로 탑재해, 기존 하이엔드급 STM32 MCU 대비 600배 뛰어난 머신러닝 성능을 갖췄다. 해당 칩은 지난 2023년 10월부터 일부 주요 고객을 대상으로 제공돼 왔으며, 현재 대량 양산 준비를 마쳤다. 국내 LG전자를 비롯해 레노버, 알프스 알파인, 메타바운즈 등 전세계 주요 기업들이 이미 STM32N6를 도입한 것으로 알려졌다. 문현수 ST 과장은 "Arm의 범용 NPU를 채택한 경쟁사들과 달리, ST는 자체 개발한 NPU를 MCU에 결합해 성능을 최적화한 것이 가장 큰 강점"이라며 "에지 AI가 시장에서 각광받고 있어, 개발자들이 관련 분야를 빠르게 개발하실 수 있도록 많은 상호작용을 하고 있다"고 강조했다. 또한 STM32WBA6는 소비자 및 산업용 기기를 IoT에 손쉽게 연결하도록 지원한다. 2MB의 확장된 고용량 메모리, 멀티 프로토콜을 지원해 무선 기능을 향상시킨다. STM32U3는 최첨단 하한계치 칩 설계를 통해 동적 전력 소모를 최소화했으며, 비밀 키 보호 및 제품 출고 전 공정 단계에서 프로비저닝으로 사이버 보안을 강화했다. 최 이사는 "신규 MCU 제품군이 저전력 AI 시장에 초점을 맞추고 있어, 향후 STM32 사업 확대의 동력이 될 것"이라며 "안정적인 공급망 구축을 위해 자사 팹은 물론 TSMC, 삼성전자 등 파운드리 기업과도 협업하고 있다"고 설명했다.

2025.05.20 15:43장경윤

퀄컴 "스냅드래곤 PC 성장중... 4년 뒤 40억 달러 매출 목표"

[타이베이(대만)=권봉석 기자] 퀄컴이 지난 해 6월 정식 출시한 AI PC용 스냅드래곤 X 엘리트, 플러스 등 SoC(시스템반도체) 3종은 출시 이후 꾸준히 성장중이다. 19일 오후(이하 현지시간) 대만 타이베이 난강전람관에서 각국 기자단과 진행한 질의응답에서 크리스티아노 아몬 퀄컴 CEO는 "비 핸드셋 부문에서 2029년까지 40억 달러(약 5조 5천980억원) 매출을 올리는 것이 목표"라고 설명했다. 이어 "미국과 유럽 AI PC 시장에서 9-10%의 점유율을 확보했으며 이런 추세가 지속된다면 2029년까지 목표는 충분히 달성할 수 있을 것"이라고 설명했다. "오라이온 CPU, 데이터센터까지 확장할 것" 퀄컴은 2022년 '스냅드래곤 서밋' 행사 당시 "오라이온 CPU는 다양한 곳에 쓰일 수 있는 IP이며 모바일부터 XR, 컴퓨트까지 여러 카테고리 플랫폼으로 확장될 것"이라고 설명한 바 있다. 크리스티아노 아몬 CEO는 이날 기조연설 말미에 등장한 데이터센터 시장 진출 관련 질문에 "엔비디아의 AI 관련 맞춤형 프로세서 생태계에 퀄컴 CPU가 포함됐다"고 말했다. 이날 오전 젠슨 황 엔비디아 CEO는 기조연설에서 자사 반도체 IP와 타사 IP를 결합할 수 있는 기술인 'NV링크 퓨전'을 공개한 바 있다. 기조연설에 등장한 슬라이드에도 퀄컴 이름과 로고가 노출됐다. 크리스티아노 아몬 CEO는 "데이터센터 시장은 앞으로도 지속 성장할 것으로 보이며, 고성능·저전력 CPU IP를 다양한 방식으로 적용할 수 있는 유연한 제품 로드맵을 준비 중”이라고 설명했다. 다만 구체적인 로드맵에 대해서는 말을 아꼈다. "샤오미-퀄컴 관계? 삼성전자를 보라" 샤오미는 최근 자체 개발한 스마트폰용 SoC인 '쉬안제(XRing) O1' 탑재 스마트폰을 이달 말부터 자국 시장에 공급 예정이다. 쉬안제 01은 2021년부터 3년간 개발을 시작해 최근 완성됐고 2022년 퀄컴이 출시한 스냅드래곤8 2세대와 비슷한 수준의 성능을 내는 것으로 알려져 있다. 향후 샤오미와 퀄컴의 관계를 묻는 질문에 그는 "샤오미가 독자적인 SoC 개발을 모색하고 있지만 여전히 최상위 제품에는 퀄컴 제품이 탑재된다"고 설명했다. 이어 "삼성전자는 2G 휴대전화 시절부터 자체 개발 반도체를 만들어왔지만 삼성전자와 관계는 여전히 원만하다. 샤오미와 퀄컴의 관계 역시 경쟁보다는 공존에 가깝다"고 부연했다. "완전한 Arm 라이선스 보유... 반소 절차 내년부터 시작" 퀄컴은 오라이온(Oryon) CPU에 포함된 Arm IP(지적재산권)과 관련해 2022년 하반기부터 법적 분쟁을 이어왔지만 지난 해 말 판정승을 거뒀다. 미국 델라웨어 주 연방법원에서 진행된 소송에서 8인 배심원단은 "퀄컴이 누비아 지적재산권(IP) 인수 과정에서 Arm 라이선스 계약을 침해하지 않았다"고 평결했다. 크리스티아노 아몬 CEO는 "퀄컴은 Arm의 ISA(명령어 세트) 사용에 대해 완전한 라이선스를 보유하고 있으며, 오라이온 CPU 역시 Arm 아키텍처 기반으로 개발중이다. Arm의 일방적인 라이선스 종료 요청도 철회됐다"고 밝혔다. 이어 "법원에서도 퀄컴의 주장이 받아들여졌다. 퀄컴이 Arm을 상대로 시작한 반소는 여전히 진행중이며 내년 초부터 시작 예정"이라고 설명했다. "스냅드래곤은 인간 지향, 드래곤윙은 기계 지향 브랜드" 퀄컴은 지난 2월 산업용 기기와 IoT, 셀룰러 인프라 솔루션 등을 겨냥한 새로운 브랜드 '드래곤윙'(Dragonwing)을 공개했다. 스마트폰과 PC를 통해 널리 알려진 '스냅드래곤'과 '드래곤윙'의 차이를 묻는 질문에 그는 이렇게 답했다. "사람과 직접 상호작용하는 스마트폰, PC, 웨어러블, 자동차 인포테인먼트 시스템 등은 '스냅드래곤'으로, 산업용, 로봇, 엣지 디바이스 등은 '드래곤윙' 브랜드를 적용한다." 크리스티아노 아몬 CEO는 "스냅드래곤은 사용자와 직접 연결된 경험을 중심으로, 드래곤윙은 기계와 산업용 컴퓨팅 중심으로 확장되고 있다”며 “AI는 기기를 넘나드는 사용자 경험을 만들어내며 OS, 앱스토어, SaaS 개념 자체를 재정의하고 있다”고 설명했다.

2025.05.19 21:24권봉석

퀄컴 "올해 창립 40주년... AI PC·서버로 도약"

[타이베이(대만)=권봉석 기자] "올해는 1985년에 설립된 퀄컴이 40주년을 맞는 해다. 2G 휴대전화로 시작해 연결성과 컴퓨팅, AI로 지난 40년 간 지속적으로 거듭났다." 19일 오후(이하 현지시간) 대만 타이베이 난강전람관 진행된 기조연설에서 크리스티아노 아몬 퀄컴 CEO가 이렇게 설명했다. 그는 "자신은 1995년 퀄컴 합류 이후 30년간 함께 했지만 40년 전 퀄컴과 현재의 퀄컴은 완전히 다른 회사다. 현재 퀄컴은 AI를 통한 변화를 이끄는 '새로운 퀄컴'(New Qualcomm)"이라고 강조했다. 스냅드래곤 PC, 점유율 확대중... 현장서 HP 신제품 '옴니북5' 공개 퀄컴은 지난 해 6월 자체 개발한 오라이온(Oryon) CPU를 탑재한 PC용 시스템반도체(SoC)인 스냅드래곤 X 엘리트를 시작으로 총 3개 제품을 시장에 투입했다. 레노버, 델테크놀로지스, HP 등 글로벌 제조사가 이를 탑재한 제품을 현재까지 85개 이상 출시했다. 크리스티아노 아몬 CEO는 "스냅드래곤 기반 AI PC는 윈도 PC에서 성능 리더십을 되찾겠다는 목표 아래 긴 배터리 작동시간과 NPU를 활용해 뛰어난 성능을 내세웠다. 현재 미국과 유럽 시장에서 9% 가량의 점유율을 확보해 새로운 경쟁자로 부상했다"고 소개했다. 이날 글로벌 제조사 중 한 곳인 HP는 스냅드래곤 X 기반 새 PC인 옴니북5를 공개했다. 알렉스 조(Alex Cho) HP 퍼스널시스템 총괄사장은 "기업용 보급형 제품에 2K 해상도 OLED 디스플레이 뿐만 아니라 AI를 보급하기 위한 제품"이라고 설명했다. 게임·콘텐츠 부문 경쟁력 강화 지속 AI PC, 특히 x86 기반 프로세서를 공급하는 경쟁사인 인텔과 AMD 대비 퀄컴의 가장 큰 약점으로 꼽히는 것은 게임 성능과 호환성 문제다. 크리스티아노 아몬 CEO는 스냅드래곤 시리즈의 가장 큰 약점으로 꼽히던 게임 부분에 대해 "현재 게임 '포트나이트'를 스냅드래곤에 최적화하기 위해 노력중이며 부정행위(치트)를 막는 소프트웨어의 호환성을 높이기 위해 에픽게임스와 협력하고 있다"고 설명했다. 이어 "어도비는 영상 편집 프로그램인 '어도비 프리미어'에 스냅드래곤 X 탑재 NPU를 활용해 CPU 대비 보다 적은 전력소모로 장면 자동 분할, 정리 등을 구현하기 위해 퀄컴과 협력하고 있다"고 덧붙였다. "오라이온 CPU 기반 데이터센터 프로세서 시장 진출" 퀄컴은 지난 해 말부터 데이터센터 칩 개발에 참여할 보안 관련 인력 채용에 이어 인텔 서버용 프로세서 '제온' 개발에 참여한 전문가를 영입하는 등 서버 시장 진출 의사를 드러냈다. 이날 퀄컴은 2022년부터 자체 개발을 선언한 오라이온 CPU를 PC와 스마트폰을 시작으로 서버 시장까지 확대하겠다는 계획을 공식화했다. 단 인텔이나 AMD 등 기존 서버용 프로세서 제조사와 달리 CPU 이외의 다른 부분은 타사와 협력할 것으로 보인다. 크리스티아노 아몬 퀄컴 CEO는 "퀄컴은 AI 시대에 적합한 저전력·고성능 CPU IP를 가지고 있으며 이날(19일) 오전 엔비디아 발표를 본 것처럼 CPU 중요성이 높아지고 있다"고 설명했다. 실제로 엔비디아는 19일 오전 진행한 컴퓨텍스 기조연설에서 자사 반도체 IP와 타사 IP를 결합할 수 있는 기술인 'NV링크 퓨전'을 공개한 바 있다. 기조연설에 등장한 슬라이드에도 퀄컴 이름과 로고가 노출됐다. 이날 크리스티아노 아몬 퀄컴 CEO는 "오는 9월 하순 미국 하와이에서 진행할 연례 기술 행사 '스냅드래곤 서밋 2025' 등에서 차세대 고성능 CPU를 발표할 것"이라고 설명했다. 데이터센터용 프로세서 제품군 관련 구체적인 제품과 출시 일정은 '곧 발표할 것'이라며 말을 아꼈다.

2025.05.19 20:29권봉석

[현장] "GPU 대체 가능성 보인다"…딥엑스, '초저전력' AI칩으로 엔비디아에 도전장

딥엑스가 초저전력 인공지능(AI) 반도체 전략을 공개하며 그래픽처리장치(GPU) 중심의 시장 구도를 정면으로 겨냥했다. 김정욱 딥엑스 부사장은 15일 서울 강남구 코엑스에서 열린 '2025 국제인공지능대전' 세션에 참가해 자사 AI 반도체 전략을 발표했다. 이날 발표에서 김 부사장은 클라우드 추론의 한계를 지적하고 GPU의 시대가 가고 있다고 단언했다. 김 부사장에 따르면 딥엑스의 신경망처리장치(NPU)는 엔비디아 GPU 대비 60분의 1 수준의 전력으로 동급 이상의 추론 성능을 낼 수 있다. 그는 회사의 칩이 GPU보다 탑스(TOPS) 수치상으로는 낮아 보일 수 있지만 실제 유효 성능은 더 높다고 설명했다. 그는 "GPU는 200탑스를 위해 40와트를 쓰지만 우리는 25탑스를 4.5와트로 구현한다"며 "연산량만 따질 게 아니라 실질적으로 몇 개의 프레임을 처리하느냐가 중요하다"고 강조했다. 이어 "'와트 당 탑스'가 아닌 '실효 처리량' 중심의 성능 평가 필요하다"고 강조했다. 또 김 부사장은 온디바이스 AI의 필요성을 7가지로 정리해 제시했다. ▲자율화 ▲무인화 ▲개인화 ▲연결 불안정 대응 ▲프라이버시 보호 ▲클라우드 비용 비효율 ▲탄소 배출 감축 등 기술적 필요부터 인프라·환경 이슈까지 아우르는 설명이다. 현재 딥엑스가 만든 AI 반도체는 실제 상용화 단계에 들어서 있다. 발표에서는 자율주행차, CCTV, 로봇 등에 실장된 실제 데모 영상이 이어졌다. 더불어 LG유플러스와 협업 중인 '스몰 LLM' 구동 사례도 소개됐다. 단말에서 일상적 질의응답을 처리하고 복잡한 연산만 클라우드에 넘기는 구조로, 속도·비용·보안 측면에서 모두 효율이 크다는 설명이다. 딥엑스는 이미 다양한 AI칩 라인업을 확보한 상태다. 김 부사장은 "우리는 성능은 높이고 발열은 사람 체온 수준인 35도 수준으로 유지한다"며 "팬리스 환경에서도 안정적으로 작동 가능한 것이 경쟁력"이라고 말했다. 이어 "이는 산업용 AI, 스마트시티, 군사 분야에도 곧바로 적용 가능하다는 점에서 실용성이 높다"고 설명했다. 딥엑스는 초저전력 온디바이스 AI 반도체를 개발하는 팹리스 스타트업이다. 기술력과 상용화 가능성을 바탕으로 현재까지 340건 이상의 특허를 확보했으며 CES 혁신상과 대통령 표창 등을 수상했다. 협력 기업은 국내외 300곳이 넘고 현대차, 삼성, 포스코, LG전자 등이 주요 파트너로 참여하고 있다. 김정욱 딥엑스 부사장은 발표를 마치며 "AI가 향후 전기처럼 작동하고 공기처럼 존재하게 될 것"이라며 "그 중심에는 GPU가 아닌 NPU가 자리해야 한다"고 강조했다.

2025.05.15 17:21조이환

모빌린트, AI 가속기 모듈 'MLA100 MXM' 출시

모빌린트는 자사 AI 가속기 칩 'ARIES'를 기반으로 설계한 MXM(Mobile PCI Express Module) 타입의 AI 가속기 모듈 'MLA100 MXM'을 새롭게 출시했다고 29일 밝혔다. MLA100 MXM은 25W의 저전력 환경에서 최대 80 TOPS(Tera Operations Per Second)의 연산 성능을 제공하며, 8개의 고성능 코어를 통해 복수의 AI 모델을 병렬 실행하거나 대규모 추론 연산을 안정적으로 소화할 수 있는 구조를 갖췄다. 또한 82x70mm의 콤팩트한 크기와 110g의 경량화 된 MXM 규격을 채택해, 공간과 전력, 발열 관리가 중요한 로보틱스, 산업 자동화, 엣지 서버 등 임베디드 AI 시스템에 적합하다. 또한 MLA100 MXM은 LLM, VLM 등의 Transformer 모델 처리도 가능해 이번 제품을 통해 기존 GPU 기반 엣지 솔루션의 대안으로 포지셔닝 한다는 전략이다. 현재 국내 주요 엣지형 AI 솔루션을 보유한 대기업 및 산업 파트너들이 해당 제품을 기반으로 임베디드 시스템 통합 및 PoC(기술 검증 테스트) 협력을 착수하였으며, 이를 바탕으로 로보틱스, 스마트팩토리, 헬스케어 등 특화 시장에서 적용 범위를 확대해 나가고 있다. 모빌린트 신동주 대표는 “MLA100 MXM 카드는 로보틱스 및 엣지 디바이스에 서버급 추론 성능을 제공하는 것을 목표로 하고 있다”며 “AI 성능 극대화를 위해서는 하드웨어, 소프트웨어, 알고리즘의 균형이 핵심이며 모빌린트는 자체 최적화된 소프트웨어 및 알고리즘 스택을 통해 이를 실현하고 있다”고 말했다. 한편 모빌린트는 기존 MLA100 PCIe 카드에 이어 MXM 제품을 일본, 대만 등 아시아 지역의 글로벌 파트너사와 함께 본격적인 공급에 나설 계획이다.

2025.04.29 09:31장경윤

"AI 반도체 기업 국제 경쟁력 갖추려면 세제혜택 등 정부 지원 절실"

국내 AI 반도체 기업이 글로벌 경쟁력을 갖추기 위해서는 관련기업 세제혜택과 함께 상용화와 연계된 R&D 강화를 지원해야 한다는 지적이 제기됐다. 과학기술정책연구원(STEPI)은 국산 AI 반도체 양산을 가로막는 생태계 차원의 주요 문제점으로 사업화 역량 부족 등을 꼽으며, 이 같이 분석했다. 이 분석 결과는 STEPI가 매달 발간하는 '과학기술정책 브리프'에 김용기 부연구위원 등이 게재했다. 이 보고서에 따르면 올해 AI 반도체 시장은 급속하게 진화 중이라고 언급했다. AI의 활용 범위 확대로 추론용 신경망처리장치(NPU)에 대한 요구가 급속히 증가하는 한편, 피지컬 AI 등에 활용되는 온디바이스·엣지 NPU와 같은 틈새시장이 발현 중인 것으로 분석했다. 이에 따른 국내 기업 대응 방안으로는 엔비디아 시장장악력이 상대적으로 낮으면서 미래 성장이 기대되는 추론, 온프레미스, 온디바이스, 엣지 NPU 시장에서 기회를 모색해야 할 것으로 내다봤다. 국산 AI 반도체 양산을 가로막는 생태계 차원의 주요 문제점으로 ▲수요기반 AI 반도체 제품 설계 및 사업화 역량 부족 ▲AI 반도체 양산을 위한 실증 역량 한계 및 수요 연계 레퍼런스 부족 ▲민간 투자의 전략성·전문성 부족 및 공공투자 부문의 한계 등을 꼽았다. 김용기 부연구위원은 이를 극복하기 위해 "개발된 칩의 실증·검증 기회를 확대해 초기 레퍼런스 확보의 어려움을 해소해야 한다"며 "이와함께 AI 반도체 도입 기업에 세제 혜택 또는 보조금 지원을 통해 초기 시장 진입장벽을 낮춰줘야 할 것"이라고 지적했다. 또 AI 반도체 전용 펀드를 설계해 민간의 투자 리스크를 분담하고, 지속가능한 투자 생태계 촉진할 필요도 있다고 언급했다. MPW(멀티프로젝트 웨이퍼), POC(개념증명) 등 상용화에 필요한 단계를 지원하는 상용화 연계 R&D를 강화해야 한다고 강조했다. 이외에 글로벌 빅테크와 정부간 협력 채널 확대 방안도 마련돼야 할 것으로 내다봤다. 김용기 부연구위원은 “AI 반도체는 승자독식 게임으로 대표 기업 육성을 위한 집중 지원이 바람직하고, MPW, 양산 등 사업화 과정에서 단계별로 체계적 지원이 필요하다"라며 "정부 R&D 예산의 부처별 분산 상황과 단계별 지원 예산 규모를 좀 더 면밀히 들여다봐야 할 것"이라고 덧붙었다에 주의를 환기했다. 김 부연구위원은 또 “지속가능한 국내 AI 반도체 생태계 발전을 위해 양산이 시작되는 국산 AI 반도체 기업의 수요-연계 강화와 R&D 정책의 전략적 개편이 시급하다”고 역설했다.

2025.04.23 20:47박희범

KT클라우드, 리벨리온·업스테이지 등과 'AI 동맹'…생태계 구축 본격화

KT클라우드가 업스테이지, 리벨리온 등 인공지능(AI) 전문 기업들과 전략적 동맹을 구축했다. 기업이 겪는 AI 도입의 복잡함을 하나의 플랫폼으로 해결할 수 있도록 돕기 위해 생태계 조성에 나선 것이다. KT클라우드는 지난 17일 서울 본사에서 AI 기반 통합 사업을 위한 다자간 협약을 맺었다고 18일 밝혔다. 협약식에는 공용준 KT클라우드 본부장, 권순일 업스테이지 부사장, 노홍찬 디노티시아 최고데이터책임자(CDO), 이해석 폴라리스오피스 부사장, 오진욱 리벨리온 최고기술책임자(CTO) 등이 참석했다. 이번 협약은 기업 고객이 자체 데이터를 바탕으로 신속하고 신뢰도 높은 AI 시스템을 구현할 수 있도록 하는 데 초점이 맞춰졌다. AI 모델과 검색증강생성(RAG) 기반 모듈을 결합해 비즈니스 전반에 AI를 도입할 수 있는 'AI 파운드리' 서비스가 핵심이다. 참여 기업들은 각자의 기술 역량을 기반으로 역할을 나눴다. 폴라리스오피스와 업스테이지는 광학문자인식(OCR) 및 파싱 기술을, 업스테이지는 임베딩 모델을, 디노티시아는 벡터 데이터베이스(DB) 기술을 제공한다. 이를 통해 모듈형 RAG 서비스 구현을 지원한다. AI 모델은 '라마4 스카우트', '미스트랄 7B', 업스테이지 '솔라' 등 주요 오픈소스 모델이 연동될 예정이다. 추론용 인프라는 엔비디아 그래픽 처리장치(GPU)와 함께 리벨리온의 신경망처리장치(NPU)를 도입해 다양한 모델 수요에 대응한다. 기업 고객은 실사용량 기반 과금 모델로 비용 부담을 줄일 수 있으며 고도화된 AI 모델을 빠르게 구현해 비즈니스 경쟁력을 확보할 수 있을 것으로 예측된다. 일례로 금융 기업이 투자 리포트를 자동 분석하고 고객 맞춤형 상담 시스템을 빠르게 구축하는 것도 가능해질 전망이다. 동시에 KT클라우드는 2분기 내 고객 참여형 파일럿 프로그램을 가동할 예정이다. 해당 프로그램은 기업 규모에 관계없이 무상으로 참여할 수 있으며 프로토타입 개발과 검증 기회를 제공받는다. 공용준 KT클라우드 본부장은 "업스테이지, 디노티시아, 폴라리스오피스, 리벨리온과 협력을 시작으로 AI 개방형 플랫폼인 AI 파운드리 사업을 본격화한다"며 "향후 수준 높은 AI 역량을 보유한 다양한 파트너사들과 협력을 지속 확대하며 고객이 실제로 필요로 하는 AI 서비스를 제공하는 하나의 AI 생태계를 만들어 나갈 것"이라고 밝혔다.

2025.04.18 14:48조이환

퓨리오사AI, MS 애저 마켓플레이스에 2세대 NPU 가속기 'RNGD' 출시

인공지능 반도체 기업 퓨리오사AI는 자사의 2세대 AI 추론 가속기 RNGD(레니게이드)를 마이크로소프트의 애저 마켓플레이스(Azure Marketplace)에 공식 출시했다고 17일 밝혔다. 애저 유저들은 레니게이드를 활용해 고성능 AI 인프라를 손쉽게 활용할 수 있게 될 전망이다. RNGD는 LLM 및 멀티모달 모델의 효율적인 추론을 위해 설계된 데이터 센터용 차세대 AI 가속기다. 지난해 8월 '핫 칩스(Hot chips) 2024' 컨퍼런스에서 첫 선을 보여 글로벌 테크 업계의 큰 관심을 모은 바 있다. 클라우드 중심, 온프레미스, 하이브리드 등 다양한 환경에 최적화돼 있어 유연하게 여러가지 목적으로 활용할 수 있다. 또한 ▲수분 내로 추론용 프로덕션 환경 배포 ▲수요에 따라 유연하게 추론 인프라 규모 조절 ▲기존 애저 데이터 및 소프트웨어 스택과 원활한 통합 등을 제공한다. 나아가 퓨리오사AI는 Llama 3.1 사전 컴파일 모델 기반 API를 곧 제공할 계획이다. 이를 통해 기업 고객은 레니게이드의 추론 성능을 기존 워크플로우 내에서 즉시 테스트하고 활용할 수 있다. 향후 다양한 모델 아키텍처 지원도 순차적으로 확대할 예정이다. 제이크 즈보로프스키 마이크로소프트 애저 플랫폼 총괄은 “애저 마켓플레이스는 전 세계 고객이 신뢰할 수 있는 파트너 솔루션을 쉽게 찾고 배포할 수 있는 공간”이라며 “퓨리오사AI의 레니게이드를 이 생태계에 새롭게 맞이하게 되어 기쁘다”고 말했다. 이번 출시를 계기로 퓨리오사AI는 자사 제품 보급에 박차를 가할 계획이다. 현재 국내외 기업 고객을 대상으로 레니게이드 제품평가를 진행 중이며, TSMC와의 협업을 통해 대규모 양산에 돌입했다. 퓨리오사AI 관계자는 “레니게이드의 애저 통합은 누구나 접근 가능한 효율적인 AI 추론 인프라를 제공한다는 당사의 비전을 실현하는 중요한 이정표”라며 “스타트업부터 대기업까지 복잡한 AI 인프라 없이도 필요한 성능을 쉽고 빠르게 확보할 수 있을 것”이라고 밝혔다. 퓨리오사AI는 지난 2017년 설립된 인공지능 반도체 스타트업이다. AMD, 삼성전자에서 근무했던 백준호 대표와 김한준 CTO(삼성전자), 구형일 CAO(Chief AI Officer; 퀄컴) 3인이 '지속 가능하고 지구상의 모두가 활용할 수 있는 AI 컴퓨팅 환경 구현'을 목표로 공동 창업했다. 지난 2022년에는 1세대 NPU를 출시해 상용화에 성공했고, 2024년 하반기 2세대 NPU RNGD를 출시해 현재 글로벌 고객사 제품 평가를 진행 중이다.

2025.04.17 08:59장경윤

  Prev 1 2 3 4 5 6 7 8 Next  

지금 뜨는 기사

이시각 헤드라인

"AI 3대 강국 되려면 기반 인프라 로드맵부터 이행돼야"... IT 업계 한목소리

[ZD 브리핑] SKT 침해사고 결과 나온다...국회 2차 추경안 논의 본격화

[비욘드IT] 7조 들여 AI 인프라 짓는 AWS, 지도 반출만 요구하는 구글

정은경 복지장관 후보자 "의정갈등 해결은 의료계와 신뢰 회복부터"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.