• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX 스파크'통합검색 결과 입니다. (6건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[현장] "메일 요약에서 물류 시뮬레이션까지"…엔비디아가 제시한 실무형 AI

"컨베이어벨트 속도를 어떻게 조절해야 가장 효율적일까?" 스마트폰으로 물류센터 최적화 질문을 입력하자 네모트론의 인공지능(AI) 에이전트가 시뮬레이션을 설계하고, 가상 공간에서 여러 조건을 검증한 뒤 결과를 분석해 보고서까지 내놨다. 엔비디아는 21일 서울 마포 디캠프에서 열린 '네모트론 개발자 데이 서울 2026'의 '빌드-어-클로(Build-a-Claw)' 시연 세션을 통해 답변형 AI를 넘어 실제 산업 현장에서 작동하는 '현실형 AI 에이전트'의 가능성을 제시했다. 시연을 맡은 정구형 엔비디아코리아 솔루션아키텍트(SA)팀 팀장은 오픈 클로(Open Claw), 네모 클로(NeMo Claw), DGX 스파크를 중심으로 에이전트 AI가 단순 질의응답을 넘어 실제 업무를 수행하는 방향으로 진화하고 있다고 설명했다. 이번 시연의 핵심은 여러 역할을 가진 에이전트를 엮어 팀처럼 운영하는 구조였다. 사용자가 질문을 던지면 단일 모델이 답만 내놓는 것이 아니라 역할이 나뉜 복수의 에이전트가 각각 필요한 작업을 수행하고 이를 종합해 결과를 제시하는 방식이다. 현장 시연은 AI가 더 이상 '말을 잘하는 도구'에 머무르지 않고, 실제 업무 흐름 안으로 들어오고 있음을 보여주는 데 초점이 맞춰졌다. 물류센터 최적화 질문에 시뮬레이션·분석·보고서까지 정 팀장은 자신이 실제로 구성해 사용 중인 에이전트 트리를 예로 들며, 이를 관리하는 상위 에이전트와 그 아래 팀장, 리서처, 엔지니어, 솔루션 아키텍트, QA, 운영, HR 역할의 에이전트가 계층적으로 배치된 구조를 보여줬다. 실제 기업 조직의 역할 분담과 관리 체계를 AI 시스템 설계에 옮겨놓은 모습에 가까웠다. 그는 "이 많은 에이전트와 직접 하나하나 소통하는 게 아니라, 관리용 에이전트를 둬 전체를 관장하게 만든다"고 말했다. 이어 "계층 구조를 설정하지 않으면 각 에이전트의 자율성이 지나치게 커질 수 있다"며 "조직을 만들듯 체계를 잡아야 원하는 방향으로 움직일 수 있다"고 설명했다. 이 같은 멀티 에이전트 방식은 특정 작업을 여러 단계로 쪼개고, 각 단계에 적합한 역할을 맡긴다는 점에서 기존 단일 챗봇 방식과 차별화된다. 질문 해석, 자료 탐색, 실행, 검증, 결과 정리 등의 과정을 역할별로 분산 처리함으로써 보다 복잡한 업무도 소화할 수 있다는 것이 엔비디아 측 설명이다. 이번 시연에서 가장 눈길을 끈 부분은 디지털 트윈 기반 물류 시나리오였다. 화면에는 컨베이어벨트 위를 흐르는 박스를 집어 쌓는 로봇 팔 환경이 구현됐다. 정 팀장은 "로봇은 바꿀 수 없는 상황에서 컨베이어벨트 속도를 어떻게 조절해야 가장 효율적으로 동작할 수 있을지를 에이전트에 물었다"고 소개했다. 그러자 에이전트들은 내부적으로 역할을 나눠 움직였다. 먼저 시뮬레이션 시나리오를 만들고 디지털 트윈 공간을 구동하는 시뮬레이터인 아이작 심(Isaac Sim)에서 총 8가지 시나리오를 돌린 뒤 그 결과를 월드 파운데이션 모델 '코스모스(Cosmos)'로 분석해 최종 리포트 형태로 제시하는 흐름이었다. 정 팀장은 "이런 식으로 본인이 하는 업무를 자동화할 수 있고 시행착오도 많이 줄일 수 있다"고 설명했다. 메일 요약부터 답변 초안까지… 사무 자동화 가능성도 제시 정 팀장은 산업 현장뿐 아니라 일상 업무에 가까운 활용 사례도 공개했다. 그는 자신이 운영 중인 이른바 '세컨드 브레인' 예시를 보여주며 메일 계정에서 메일을 가져와 내용을 요약하고, 답변 초안을 자동으로 작성하는 구조를 소개했다. 일정 관리 자동화 예시도 함께 제시됐다. 데일리 노트를 크론 잡으로 생성한 뒤 스케줄을 불러와 템플릿에 맞게 정리하는 식이다. 반복 업무를 자동화하면서도 사용자가 최종 결과물을 검토할 수 있도록 설계했다는 점이 특징이다. 다만 회사 정책상 실제 발송 API는 막아둔 상태라고 했다. 대신 초안은 개인 노트에 정리되도록 하고, 사용자가 내용을 확인한 뒤 직접 메일을 보내는 방식이다. 완전 자동화보다 '통제 가능한 자동화'에 무게를 둔 접근이라는 점에서, 기업용 AI가 현실적으로 어떤 선에서 적용되고 있는지를 보여주는 사례로 읽혔다. 자유로운 에이전트일수록 통제 중요… 네모 클로로 가드레일 강화 정 팀장은 에이전트의 자유도가 높아질수록 통제 장치가 중요해진다고 강조했다. 시스템에 접근해 코드를 수정하거나 외부 네트워크를 호출하고, 내부 데이터를 외부로 전송하는 등 예상치 못한 문제가 발생할 수 있기 때문이다. 이를 방지하기 위해 엔비디아가 제시한 것이 네모 클로다. 그는 "에이전트가 데이터를 아카이빙하고 있는 만큼 민감한 정보가 있을 수 있는데, 예를 들어 '주식 리포트를 찾아 메일로 보내달라'고 했을 때 그대로 외부 전송이 이뤄지면 안 되는 경우도 있다"고 말했다. 이어 "이런 상황을 막기 위해 정책과 제한을 두고 그 규칙 안에서만 에이전트가 움직이도록 하는 것이 네모 클로의 핵심"이라고 설명했다. 정 팀장에 따르면 네모 클로는 오픈 클로를 대체하는 개념이라기보다, 이를 엔터프라이즈 환경에서 안정적으로 운영할 수 있도록 가드레일과 정책 제어 기능을 덧댄 프레임워크에 가깝다. 네트워크 접근, 시스템 호출, 특정 스킬 사용 등을 사전에 정의된 정책에 따라 제한함으로써 기업이 보다 안심하고 에이전트를 도입할 수 있도록 돕는다는 것이다. 로컬 AI 특화 하드웨어 'DGX 스파크'…24시간 일하는 AI 직원 이번 시연은 모두 DGX 스파크를 기반으로 진행됐다. DGX 스파크는 CPU와 GPU가 공유 메모리를 사용하는 구조를 바탕으로 대규모 언어 모델(LLM) 배포에 활용할 수 있는 메모리 공간을 넓힌 로컬 AI 개발 장비다. 외부 API에 의존하지 않고도 비교적 큰 모델을 엣지 환경에서 구동할 수 있어 상시 운영 비용을 줄일 수 있다는 게 엔비디아 측 설명이다. 정 팀장은 네모트론 1200억개 매개변수(120B)급 모델 구동은 물론 소형 모델의 학습·파인튜닝과 로보틱스용 강화학습 같은 작업에도 활용할 수 있다고 소개했다. 제품은 엔비디아가 직접 판매하는 것을 비롯해 에이수스(ASUS)와 기가바이트(GIGABYTE)가 최적화한 버전으로도 공급되며, 1TB와 5TB급으로 구성됐다. 정 팀장은 "오픈 클로 자체는 작은 장치에서도 구동할 수 있지만 엔터프라이즈 업무를 위해선 메인 에이전트에 쓰이는 LLM이 돌아야 한다"며 "GPU 자원이 없으면 외부 API를 붙여 쓸 수 있지만 상시 구동 모델은 비용이 커질 수 있다"고 설명했다. 그러면서 엣지 환경에서 비교적 큰 모델을 구동하며 비용을 절감할 수 있는 장비 수요가 있다고 강조했다. 이어 "CPU와 GPU가 공유 메모리를 사용하기 때문에 LLM 배포 시 활용할 수 있는 메모리 공간이 크고, 그래서 더 큰 모델을 돌릴 수 있다"고 소개했다. 또 그는 "네모트론 120B 같은 큰 모델도 해당 단말에서 구동할 수 있도록 구성돼 있다"며 "작은 모델은 학습이나 파인튜닝도 가능하고, 로봇 분야에서는 강화학습이나 소형 VLA 모델 튜닝에도 활용할 수 있다"고 덧붙였다.

2026.04.21 18:22남혁우 기자

엔비디아, Arm 윈도 PC 칩 'N1X/N1' 상반기 출시하나

엔비디아가 2024년 하반기부터 대만 팹리스 미디어텍과 개발을 시작한 윈도 PC용 Arm 기반 시스템반도체(SoC)인 N1X/N1이 올 상반기 안에 정식 제품으로 등장할 수 있다는 전망이 나왔다. N1X/N1은 고성능 CPU 코어와 블랙웰 GPU를 결합한 SoC로, 엔비디아 개인용 AI 워크스테이션 'DGX 스파크' 등에 에 적용된 GB10과 유사한 구성이다. 기존 Arm 윈도 노트북의 한계로 지적돼 온 그래픽 성능을 대폭 끌어올릴 수 있다. 대만 디지타임스는 엔비디아가 오는 3월 'GTC 2026' 행사에서 N1X/N1을 정식 공개하고, 6월 '컴퓨텍스 타이베이 2026' 행사 중 실제 제품을 공개할 가능성이 높다고 짚었다. 그러나 게임과 안티치트 등을 포함한 소프트웨어 호환성이 최대 변수로 꼽힌다. 2024년 하반기부터 N1/N1X 개발설 흘러나와 엔비디아가 대만 팹리스 미디어텍과 협력해 윈도 PC용 Arm 칩을 개발중이라는 루머는 2024년 하반기부터 대만 내 공급망을 중심으로 간헐적으로 흘러나왔다. 엔비디아가 개발중인 칩은 ▲ Arm 코어텍스(Cortex)-X925 CPU 코어 10개, 저전력·고효율 코어텍스-A725 코어 10개와 블랙웰 GPU를 결합한 'N1X' ▲ 코어 수를 줄이고 GPU 성능도 낮춘 'N1' 등 두 개다. 이 중 CPU와 GPU는 지난해 4분기부터 우분투 리눅스 기반 'DGX OS'를 탑재하고 시장에 출시된 개인용 AI 워크스테이션 'DGX 스파크' 내장 GB10과 거의 구성이 같은 것으로 알려져 있다. 작년 컴퓨텍스 공개는 불발... 벤치마크 수치는 노출 작년 5월 '컴퓨텍스 타이베이 2025' 개최를 앞두고 엔비디아와 미디어텍 두 회사가 N1X/N1 칩을 공개할 수 있다는 전망도 나왔다. 그간 컴퓨텍스를 포함해 공개석상에 등장하지 않았던 차이리싱(蔡力行) 미디어텍 CEO가 기조연설에 나섰다는 사실 때문이다. 그러나 엔비디아 기조연설이나 미디어텍 기조연설에서 N1X나 N1 관련 내용은 등장하지 않았다. 차이리싱 미디어텍 CEO와 젠슨 황 엔비디아 CEO도 GB10 관련 내용만 소개하는 데 그쳤다. 이후 작년 7월에는 N1X 칩 성능을 Arm용 윈도11에서 실행한 결과가 공개되기도 했다. CPU 성능은 인텔 14세대급 프로세서와, 내장 GPU 성능은 인텔 코어 울트라 시리즈3의 Xe3와 비슷할 것으로 예상된다. 디지타임스 "2분기부터 실제 제품 등장 전망" 대만 디지타임스는 지난 19일 공급망 관계자를 인용해 "엔비디아 N1X 칩 기반 노트북이 이르면 올 1분기 시장에 출시되고 2분기부터 본격적으로 시장에 공급될 것"이라고 보도했다. 실제로 작년 11월 경 주요 PC 제조사인 델테크놀로지스가 엔비디아 N1X 기반 '델 16 프리미엄' 노트북 시제품을 운송했다는 기록이 드러나기도 했다. 또 레노버도 최근 게이밍 노트북 '리전'에 탑재되는 소프트웨어인 '리전 스페이스' 관련 기술지원 문서에 'Legion 7 15N1X11'이라는 미출시 제품 명칭을 표기했다. 이는 '15인치 디스플레이와 엔비디아 N1X를 탑재한 리전 7 노트북'으로 해석될 수 있다. 이를 종합하자면 엔비디아가 오는 3월 중순 미국 새너제이에서 진행될 컨퍼런스 'GTC 2026'에서 N1X/N1칩을 공개하고, 6월 초순 대만에서 진행될 '컴퓨텍스 타이베이 2026'에서 실제 제품을 출시하는 스케줄로 이어질 수 있다. 게임 호환성이 관건... 최근 Arm용 X박스 앱 공개 엔비디아 N1X/N1 SoC는 현재까지 출시된 노트북용 SoC 중 그래픽 성능 면에서 최상위에 있다. Arm 진영에서는 배터리 지속시간과 휴대성이 중요한 업무용 노트북 수요가 퀄컴 스냅드래곤 X 엘리트로, 게임용 고성능 노트북은 엔비디아 N1X로 양분될 가능성도 있다. 그러나 오히려 GPU 성능보다는 주로 게임이나 안티치트 등 소프트웨어 호환성이 더 큰 문제가 될 것으로 보인다. 엔비디아에 한 발 앞서 Arm 윈도 PC 시장에 참여한 퀄컴도 별도 조직을 만들고 호환성 문제를 해결하는 데 10여 년 가량을 투자했다. 특히 GPU 등에 직접 접근해야 하는 게임 특성상 여러 문제가 발생할 수 있다. 다만 지난 21일 마이크로소프트가 Arm용 X박스 앱을 공개했고 X박스 게임 패스 카탈로그에 등록된 게임 중 85% 가량이 현재 Arm용 윈도11을 지원한다. 엔비디아가 자체 운영하는 클라우드 게이밍인 '지포스 나우'를 Arm용으로 개발하는 방안도 있다.

2026.01.26 16:39권봉석 기자

씨이랩, 엔비디아 손안의 슈퍼컴 'DGX 스파크' 예약 판매

비전AI 전문기업 씨이랩(대표 윤세혁, 채정환)이 미국 엔비디아가 차세대 개인용 AI 슈퍼 컴퓨터라 칭한 'DGX 스파크'의 국내 예약 판매를 시작했다. 4일 이 회사 블로그에 따르면, 엔비디아 DGX 스파크가 AI모델 개발 속도를 10배 향상 시켜준다면서 사전 예약을 시행, 현재 진행중이다. 씨이랩 블로그는 'DGX 스파크'가 개인용 AI슈퍼컴퓨터의 시작이며, 대용량 AI모델을 돌리려면 클라우드 비용이 너무 많이 나오는데, 이런 고민을 해결할 게임체인저가 'DGX 스파크'라고 밝혔다. 이어 "최대 2000억 개 매개변수를 가진 AI모델을 여러분의 책상 위에서 바로 실행하게 해주는 혁신적인 시스템"이라고 주장했다. 앞서 엔비디아코리아는 29일 “'DGX 스파크'의 국내 예약 주문을 시작한다”고 공지한 바 있다. 'DGX 스파크'는 엔비디아가 지난 1월 열린 'CES 2025'서 '프로젝트 디지츠(Project DIGITS)'로 처음 발표했다. 이어 3월 엔비디아 최대 연례행사인 'GTC'에서 공식 명칭이 'DGX 스파크'로 확정해 선보였고, 엔비디아는 'DGX 스파크'를 "개인용 AI 슈퍼컴퓨터"라고 강조했다. 생성형 AI, 대규모언어모델(LLM), 초고속 추론 등의 다양한 AI 워크플로우를 데이터센터 없이 데스크톱에서 바로 구현할 수 있어, AI 개발의 민첩성과 효율성을 획기적으로 강화할 수 있다. 엔비디아 최신 아키텍처인 'GB10 그레이스 블랙웰(GRACE Blackwell)' 슈퍼칩을 탑재, FP4 기준 최대 1페타플롭의 AI 연산 성능을 제공한다. 또 128GB 메모리와 엔비디아 AI 소프트웨어 스택이 기본 탑재돼 있어, 최신 AI 모델과 애플리케이션 개발도 로컬 환경에서 프로토타이핑 및 파인튜닝이 가능하다. 텐서플로(TensorFlow) 파이토치(PyTorch), 쥬피터(Jupyter) 등 인기 딥러닝 프레임워크와 호환이 가능하고 'DGX Cloud' 및 고속 데이터센터 환경으로의 확장도 손쉽게 지원한다. 이를 통해 AI 연구자를 비롯해 개발자, 학생 등 다양한 사용자가 복잡한 AI 인프라 구축과 소프트웨어 호환성 문제 없이 AI 모델 개발부터 배포까지 완전한 개발 환경을 제공받을 수 있다고 씨이랩은 밝혔다. 씨이랩은 엔비디아의 공식 파트너사인데, 이번 'DGX 스파크' 공급을 통해 기업 및 연구기관의 AI 개발 인프라 혁신을 적극 지원할 것으로 알려졌다. 특히, 도입 기업에 맞춤형 컨설팅과 하드웨어 및 소프트웨어 기술을 지원하며, AI 운영의 전 주기적인 통합 솔루션을 제공할 예정이다. 회사는 현재 공식 홈페이지에서 사전 예약 접수를 진행하고 있다. 윤세혁 씨이랩 대표는 “DGX 스파크는 개인부터 스타트업까지 다양한 사용자가 고성능 AI 모델을 로컬 환경에서 직접 개발하고 테스트할 수 있게 설계된 핵심 인프라”라며 “씨이랩은 엔비디아의 파트너로서, 제품 도입은 물론 기업의 실제 비즈니스에 맞는 모델 최적화, 성능 실증 등 AI 운영의 모든 단계에서 함께하는 실질적인 파트너 역할을 수행할 것”이라고 말했다. 한편 씨이랩은 2010년 설립된 비전AI 전문기업이다. AI 기반으로 대용량 영상 데이터 분석에 특화한 기술을 인정 받아 2021년 2월 코스닥에 상장했다. GPU 리소스를 최적으로 관리 및 운영해주는 솔루션 '아스트라고(AstraGo)' 등을 시장에 공급하고 있다. .

2025.08.05 08:40방은주 기자

엔비디아 'GB10' 기반 AI 워크스테이션, 이달 하순 본격 출시

엔비디아가 개인 개발자와 AI 전문가를 겨냥해 개발한 AI 가속용 GPU 'GB10' 기반 워크스테이션이 이달 하순부터 국내를 포함해 전세계 시장에 공급된다. 비용이나 보안 등 제약 없이 고성능 AI 응용프로그램을 개발하려는 수요가 집중될 것으로 보인다. GB10 기반 엔비디아 자체 제품인 'DGX 스파크'가 이달 초부터 공급되기 시작했고 에이수스, MSI 등 대만계 PC 제조사를 비롯해 델테크놀로지스, 레노버 등 글로벌 IT 기업들이 GB10 기반 제품을 이달 하순부터 순차 출시할 예정이다. 1월 첫 공개 이후 반 년만에 상용화 엔비디아는 지난 1월 'CES 2025' 기조연설에서 클라우드 없이 개인이 AI 처리용으로 활용할 수 있는 장치 '프로젝트 디지츠'를 공개했다. 3월 'GTC 2025'에서는 이 기기의 정식 명칭을 'DGX 스파크'로 설명하고 올 하반기부터 시장에 공급한다고 설명했다. 이 기기에는 블랙웰 GPU 'GB10'과 Arm IP 기반 20코어 그레이스(Grace) CPU를 결합한 SoC, 128GB LPDDR5X 통합메모리를 탑재해 클라우드 서버 없이 AI 작업을 테스트할 수 있다. 이런 구조 개발에는 대만 팹리스인 미디어텍이 협력했다. 젠슨 황 엔비디아 CEO는 5월 중순 '컴퓨텍스 타이베이 2025' 기간 중 진행된 질의응답에서 "DGX 스파크는 클라우드 기반 AI 개발 과정에서 마주할 수 있는 비용이나 지연 시간, 보안 관련 문제를 해결할 수 있는 제품"이라고 설명했다. 현재 엔비디아는 GB10 기반 자체 제품인 'DGX 스파크'를 이 달부터 전세계 주요 파트너사를 통해 공급하고 있다. "GB10, 7월부터 대량생산 돌입... 하순부터 출시" 지난 8일 대만 경제일보(經濟日報)는 미디어텍 관계자를 인용해 "엔비디아와 미디어텍이 공동 개발한 GB10이 이 달부터 대량생산 체제에 들어갈 예정이며 주요 제조사에 공급될 것"이라고 보도했다. 이어 "GB10은 엔비디아의 AI 시장 지배력을 강화하는 한편 미디어텍의 AI 사업 진출에 중요한 이정표가 될 전망"이라고 분석했다. 에이수스, MSI 등 대만계 PC 제조사를 포함해 델테크놀로지스, 레노버도 GB10 탑재 제품을 출시 예정이다. 가격은 기본 구성 기준 4천 달러(약 550만원) 내외로 예상된다. 한 제조사 국내 법인 관계자는 "관련 제품 글로벌 출시 일자는 이달 하순이 맞지만 국내 공급 일정과 예상 가격은 유동적"이라고 설명했다. 윈도 OS 기반 PC용 SoC 개발설 '솔솔' GB10 기반 엔비디아 'DGX 스파크'와 기타 제조사가 출시할 기기는 리눅스 기반 DGX OS 기반으로 작동한다. 모니터를 연결할 수 있는 HDMI 단자를 갖추고 유·무선 키보드와 마우스도 연결할 수 있지만 일반적인 PC처럼 쓸 수 있는 제품은 아니다. 엔비디아와 미디어텍이 윈도 운영체제를 구동할 수 있는 Arm 기반 AI PC용 시스템반도체(SoC)를 개발중이라는 관측도 여전히 현재 진행형이다. 지난 5월 초에는 엔비디아와 미디어텍이 Arm 코어텍스(Cortex) X9 CPU와 엔비디아 GPU를 조합한 윈도용 Arm SoC를 컴퓨텍스 기간 중 공개할 것이라는 전망이 나오기도 했다. 그러나 이는 실현되지 않았다. 당시 해당 사안에 정통한 한 관계자는 익명을 전제로 "미디어텍이 설계한 CPU와 GPU의 연동 과정에서 생긴 문제를 해결하지 못해 발표 시기를 놓친 것"이라며 "올 연말이나 내년 초로 공개 시기가 미뤄질 가능성이 있다"고 내다봤다.

2025.07.09 16:20권봉석 기자

수익 안 나는 일 뛰어든 AI 스타트업…'100대 개인 슈퍼컴' 들여온 이유는

포티투마루가 단기 수익을 기대하기 어려운 사업임에도 인공지능(AI) 슈퍼컴퓨터 '디지엑스 스파크(DGX Spark)' 100대를 국내에 들여왔다. 엔비디아가 한국에 한정 배정한 초기 물량 중 상당수를 확보한 셈으로, AI 인프라 저변 확대와 기술 실험 기회를 넓히기 위한 전략적 '마이너스 투자'다. 30일 업계에 따르면 포티투마루는 지난 27일 엔비디아의 블랙웰 기반 개인용 AI 슈퍼컴 '디지엑스 스파크'를 선점 물량 형태로 100대 확보했다. 이는 글로벌 전체 2만대 중 한국 배정분 중 상당수에 해당하며 국내 기업 중 단일 확보 기준 최대치다. '디지엑스 스파크'는 가로세로 15센티미터 크기에 1.2킬로그램 무게를 갖춘 데스크톱형 고성능 AI 연산 장비다. 1페타플롭 수준의 AI 연산이 가능하며 128기가바이트 메모리를 탑재해 2천억개 규모의 대형 언어 모델 추론 및 파인튜닝이 가능하다. 가격은 대당 3천999달러(한화 약 560만원)로 책정됐다. 더불어 이 모델은 클라우드 기반 AI 연산이 어려운 환경에서 로컬 장비로 활용될 수 있다. 최대 2천억 파라미터 모델을 사전 설치된 AI 스택을 통해 바로 추론할 수 있고 메타·구글·딥시크 등의 최신 모델도 프로토타입 형태로 실험 가능하다. 클라우드 없이 자체 데이터를 활용해 모델을 실험할 수 있다는 점에서 일부 기업과 연구자에겐 대안이 될 수 있다. 포티투마루 측은 국내 딜러들이 한국 시장에선 수요가 적을 것이라 판단해 엔비디아가 원래 계획했던 1천500대 중 일부만 들여왔다는 설명이다. 김동환 대표는 "이런 기회를 국내에서 제대로 활용하지 못하는 것이 아쉽다"며 "안타까운 마음에 확보를 결심했다"고 밝혔다. 이는 자체 수익성과는 거리가 먼 결정이었다. 포티투마루 측은 '디지엑스 스파크' 확보로 직접적인 매출 전환은 어려울 것으로 판단하고 있다. 초기 대응과 행정 처리에 따른 리소스 소모도 적지 않다. 그럼에도 장기적으론 국내 AI 기술 실험 환경과 활용 저변 확대에 일정 수준의 기여를 할 수 있다는 판단이 작용했다. 김동환 포티투마루 대표는 "미국은 2만대 전량을 소화하겠다고 할 텐데 국내 시장 상황이 안타깝다"며 "이런 장비를 접하고 실험해볼 기회가 많아야 AI 저변이 확산되고 궁극적으론 시장의 트렌드를 선도할 수 있다"고 밝혔다.

2025.06.30 14:37조이환 기자

미디어텍 "엣지에서 클라우드까지 AI 혁신 가속"

[타이베이(대만)=권봉석 기자] "미디어텍은 1997년 설립 이후 광학드라이브를 거쳐 스마트폰, TV, 사물인터넷(IoT)는 물론 오토모티브(자동차)와 AI 시장으로 사업을 꾸준히 확장해 왔다. 그러나 일관된 목표는 사람들의 삶을 개선하고 풍요롭게 하는 것이다." 컴퓨텍스 2025 개막일인 20일 오전(이하 현지시간) 타이베이 난강전람관에서 진행된 기조연설에서 차이리싱(蔡力行, Rick Tsai) 미디어텍 CEO가 이렇게 설명했다. 미디어텍은 스마트폰을 시작으로 웨어러블 등 IoT 기기, 산업용 기기에 이어 최근 오토모티브와 AI 가속기용 반도체 시장까지 사업 영역을 넓히고 있다. 이날 기조연설에서는 스마트폰용 시스템반도체(SoC)인 디멘시티 9400 2종 등의 성과와 TSMC·엔비디아와 협업 관계도 소개됐다. 스마트폰·맞춤형 반도체 등 5개 영역에 AI 역량 확대 차이리싱 CEO는 "지난 10년 간 전 세계 200억 개의 기기에 미디어텍 칩이 탑재됐고 이를 지구 인구로 환산하면 미디어텍 제품이 들어간 제품을 한 사람당 2.5개 이상 쓰고 있는 셈"이라고 설명했다. 이어 "스마트폰과 크롬북, IoT와 오토모티브, 데이터센터용 서버와 맞춤형 반도체 등 총 5개 영역에서 경쟁력을 강화하고 AI 혁신을 이끌 것"이라고 설명했다. 이날 미디어텍은 전력 효율 향상과 성능 향상을 위해 반도체 생산 공정을 2나노급으로 전환할 것이라고 밝혔다. 차이리싱 CEO는 "TSMC 3나노급(N3) 공정 대비 2나노급 공정은 15% 성능 향상, 전력 소모 25% 절감 등 효과가 있으며 오는 9월까지 최종 설계 절차(테이프아웃)를 마칠 것"이라고 설명했다. 오토모티브·데이터센터로 포트폴리오 확장 미디어텍은 2년 전 오토모티브용 반도체 시장에 본격 진출해 엔비디아와 협력을 강화하고 있다. '콘딧-X1'은 미디어텍의 Arm CPU와 엔비디아 GPU, AI 가속 기능을 갖춘 차량용 칩이다. 미디어텍은 3년 전부터 데이터센터용 AI ASIC 개발에도 주력하고 있다. 차이리싱 CEO는 "91x91mm 크기의 대형 네트워킹 칩을 개발했으며, HBM을 칩렛으로 적재하는 기술을 보유하고 있다"고 설명했다. 그는 "AI 가속기는 반도체 생산 공정과 반도체간 연결 기술, 패키징 등에서 복잡한 기술이 필요하며 각종 문제 해결을 위해 TSMC는 물론 엔비디아와 협력하고 있다. 최근 공개된 엔비디아 패브릭 'NV링크 퓨전'에도 초기 파트너로 참여했다"고 밝혔다. 젠슨 황 "NV링크 퓨전, 미디어텍과 협업에서 출발" 기조연설 말미에는 전날(19일) 기조연설에서 반도체 연결 기술 'NV링크 퓨전'을 발표한 젠슨 황 엔비디아 CEO가 등장했다. NV링크 퓨전 생태계의 초기 파트너사로 미디어텍 외에 퀄컴도 이름을 올렸다. 차이리싱 CEO의 소개로 무대에 오른 젠슨 황 CEO는 "NV링크 퓨전은 하반기 출시를 앞둔 개인용 AI 컴퓨터 'DGX 스파크' 설계 당시 얻은 아이디어에서 출발했다"고 설명했다. 이어 "NV링크 퓨전 기술은 서로 다른 두 반도체를 단순히 연결하는 기술이 아니라 한 패키지 안에 두 반도체가 동시에 공존하는 기술이다. 엔비디아의 IP를 다른 회사에 공개하는 것은 이번이 처음"이라고 설명했다. 젠슨 황 CEO는 "NV링크 퓨전은 이를 이용하는 고객사의 선택지가 넓어진다는 면에서, 또 엔비디아에게는 다른 생태계로 반도체 제품을 연결할 수 있어 모두에게 이익인 좋은 아이디어"라고 설명했다.

2025.05.20 14:55권봉석 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

잇단 대형 해킹사고, 정부 '그립'은 강해져…보안 B+학점

현대차 배터리 구독, 니오·르노와 다른 길 간다

IPO 속도 내는 '이그니스'는 어떤 인재 원할까

삼성전자, 잠정합의안 가결로 파업리스크 해소…11시 임협 조인식

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.