• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX'통합검색 결과 입니다. (9건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[현장] "메일 요약에서 물류 시뮬레이션까지"…엔비디아가 제시한 실무형 AI

"컨베이어벨트 속도를 어떻게 조절해야 가장 효율적일까?" 스마트폰으로 물류센터 최적화 질문을 입력하자 네모트론의 인공지능(AI) 에이전트가 시뮬레이션을 설계하고, 가상 공간에서 여러 조건을 검증한 뒤 결과를 분석해 보고서까지 내놨다. 엔비디아는 21일 서울 마포 디캠프에서 열린 '네모트론 개발자 데이 서울 2026'의 '빌드-어-클로(Build-a-Claw)' 시연 세션을 통해 답변형 AI를 넘어 실제 산업 현장에서 작동하는 '현실형 AI 에이전트'의 가능성을 제시했다. 시연을 맡은 정구형 엔비디아코리아 솔루션아키텍트(SA)팀 팀장은 오픈 클로(Open Claw), 네모 클로(NeMo Claw), DGX 스파크를 중심으로 에이전트 AI가 단순 질의응답을 넘어 실제 업무를 수행하는 방향으로 진화하고 있다고 설명했다. 이번 시연의 핵심은 여러 역할을 가진 에이전트를 엮어 팀처럼 운영하는 구조였다. 사용자가 질문을 던지면 단일 모델이 답만 내놓는 것이 아니라 역할이 나뉜 복수의 에이전트가 각각 필요한 작업을 수행하고 이를 종합해 결과를 제시하는 방식이다. 현장 시연은 AI가 더 이상 '말을 잘하는 도구'에 머무르지 않고, 실제 업무 흐름 안으로 들어오고 있음을 보여주는 데 초점이 맞춰졌다. 물류센터 최적화 질문에 시뮬레이션·분석·보고서까지 정 팀장은 자신이 실제로 구성해 사용 중인 에이전트 트리를 예로 들며, 이를 관리하는 상위 에이전트와 그 아래 팀장, 리서처, 엔지니어, 솔루션 아키텍트, QA, 운영, HR 역할의 에이전트가 계층적으로 배치된 구조를 보여줬다. 실제 기업 조직의 역할 분담과 관리 체계를 AI 시스템 설계에 옮겨놓은 모습에 가까웠다. 그는 "이 많은 에이전트와 직접 하나하나 소통하는 게 아니라, 관리용 에이전트를 둬 전체를 관장하게 만든다"고 말했다. 이어 "계층 구조를 설정하지 않으면 각 에이전트의 자율성이 지나치게 커질 수 있다"며 "조직을 만들듯 체계를 잡아야 원하는 방향으로 움직일 수 있다"고 설명했다. 이 같은 멀티 에이전트 방식은 특정 작업을 여러 단계로 쪼개고, 각 단계에 적합한 역할을 맡긴다는 점에서 기존 단일 챗봇 방식과 차별화된다. 질문 해석, 자료 탐색, 실행, 검증, 결과 정리 등의 과정을 역할별로 분산 처리함으로써 보다 복잡한 업무도 소화할 수 있다는 것이 엔비디아 측 설명이다. 이번 시연에서 가장 눈길을 끈 부분은 디지털 트윈 기반 물류 시나리오였다. 화면에는 컨베이어벨트 위를 흐르는 박스를 집어 쌓는 로봇 팔 환경이 구현됐다. 정 팀장은 "로봇은 바꿀 수 없는 상황에서 컨베이어벨트 속도를 어떻게 조절해야 가장 효율적으로 동작할 수 있을지를 에이전트에 물었다"고 소개했다. 그러자 에이전트들은 내부적으로 역할을 나눠 움직였다. 먼저 시뮬레이션 시나리오를 만들고 디지털 트윈 공간을 구동하는 시뮬레이터인 아이작 심(Isaac Sim)에서 총 8가지 시나리오를 돌린 뒤 그 결과를 월드 파운데이션 모델 '코스모스(Cosmos)'로 분석해 최종 리포트 형태로 제시하는 흐름이었다. 정 팀장은 "이런 식으로 본인이 하는 업무를 자동화할 수 있고 시행착오도 많이 줄일 수 있다"고 설명했다. 메일 요약부터 답변 초안까지… 사무 자동화 가능성도 제시 정 팀장은 산업 현장뿐 아니라 일상 업무에 가까운 활용 사례도 공개했다. 그는 자신이 운영 중인 이른바 '세컨드 브레인' 예시를 보여주며 메일 계정에서 메일을 가져와 내용을 요약하고, 답변 초안을 자동으로 작성하는 구조를 소개했다. 일정 관리 자동화 예시도 함께 제시됐다. 데일리 노트를 크론 잡으로 생성한 뒤 스케줄을 불러와 템플릿에 맞게 정리하는 식이다. 반복 업무를 자동화하면서도 사용자가 최종 결과물을 검토할 수 있도록 설계했다는 점이 특징이다. 다만 회사 정책상 실제 발송 API는 막아둔 상태라고 했다. 대신 초안은 개인 노트에 정리되도록 하고, 사용자가 내용을 확인한 뒤 직접 메일을 보내는 방식이다. 완전 자동화보다 '통제 가능한 자동화'에 무게를 둔 접근이라는 점에서, 기업용 AI가 현실적으로 어떤 선에서 적용되고 있는지를 보여주는 사례로 읽혔다. 자유로운 에이전트일수록 통제 중요… 네모 클로로 가드레일 강화 정 팀장은 에이전트의 자유도가 높아질수록 통제 장치가 중요해진다고 강조했다. 시스템에 접근해 코드를 수정하거나 외부 네트워크를 호출하고, 내부 데이터를 외부로 전송하는 등 예상치 못한 문제가 발생할 수 있기 때문이다. 이를 방지하기 위해 엔비디아가 제시한 것이 네모 클로다. 그는 "에이전트가 데이터를 아카이빙하고 있는 만큼 민감한 정보가 있을 수 있는데, 예를 들어 '주식 리포트를 찾아 메일로 보내달라'고 했을 때 그대로 외부 전송이 이뤄지면 안 되는 경우도 있다"고 말했다. 이어 "이런 상황을 막기 위해 정책과 제한을 두고 그 규칙 안에서만 에이전트가 움직이도록 하는 것이 네모 클로의 핵심"이라고 설명했다. 정 팀장에 따르면 네모 클로는 오픈 클로를 대체하는 개념이라기보다, 이를 엔터프라이즈 환경에서 안정적으로 운영할 수 있도록 가드레일과 정책 제어 기능을 덧댄 프레임워크에 가깝다. 네트워크 접근, 시스템 호출, 특정 스킬 사용 등을 사전에 정의된 정책에 따라 제한함으로써 기업이 보다 안심하고 에이전트를 도입할 수 있도록 돕는다는 것이다. 로컬 AI 특화 하드웨어 'DGX 스파크'…24시간 일하는 AI 직원 이번 시연은 모두 DGX 스파크를 기반으로 진행됐다. DGX 스파크는 CPU와 GPU가 공유 메모리를 사용하는 구조를 바탕으로 대규모 언어 모델(LLM) 배포에 활용할 수 있는 메모리 공간을 넓힌 로컬 AI 개발 장비다. 외부 API에 의존하지 않고도 비교적 큰 모델을 엣지 환경에서 구동할 수 있어 상시 운영 비용을 줄일 수 있다는 게 엔비디아 측 설명이다. 정 팀장은 네모트론 1200억개 매개변수(120B)급 모델 구동은 물론 소형 모델의 학습·파인튜닝과 로보틱스용 강화학습 같은 작업에도 활용할 수 있다고 소개했다. 제품은 엔비디아가 직접 판매하는 것을 비롯해 에이수스(ASUS)와 기가바이트(GIGABYTE)가 최적화한 버전으로도 공급되며, 1TB와 5TB급으로 구성됐다. 정 팀장은 "오픈 클로 자체는 작은 장치에서도 구동할 수 있지만 엔터프라이즈 업무를 위해선 메인 에이전트에 쓰이는 LLM이 돌아야 한다"며 "GPU 자원이 없으면 외부 API를 붙여 쓸 수 있지만 상시 구동 모델은 비용이 커질 수 있다"고 설명했다. 그러면서 엣지 환경에서 비교적 큰 모델을 구동하며 비용을 절감할 수 있는 장비 수요가 있다고 강조했다. 이어 "CPU와 GPU가 공유 메모리를 사용하기 때문에 LLM 배포 시 활용할 수 있는 메모리 공간이 크고, 그래서 더 큰 모델을 돌릴 수 있다"고 소개했다. 또 그는 "네모트론 120B 같은 큰 모델도 해당 단말에서 구동할 수 있도록 구성돼 있다"며 "작은 모델은 학습이나 파인튜닝도 가능하고, 로봇 분야에서는 강화학습이나 소형 VLA 모델 튜닝에도 활용할 수 있다"고 덧붙였다.

2026.04.21 18:22남혁우 기자

"2천억 매개변수 LLM, 개발자 책상 위에서 구동"

11일 늦은 오후, 서울 역삼동 소재 델테크놀로지스 본사 내 '사랑채'에서 32인치 4K 모니터 앞에 펼쳐진 리눅스 데스크톱 환경과 마주했다. 파이어폭스 웹브라우저에는 챗GPT나 제미나이 등 거대언어모델(LLM) 기반 생성 AI와 닮은 입력창이 떠 있다. '인텔 64비트 어셈블리 언어로 사칙연산을 진행하는 예제 코드를 작성하라'는 프롬프트를 입력하자 잠시 후 스무 줄 남짓한 어셈블리 코드가 화면에 쏟아졌다. 이 코드를 생성한 것은 인터넷에 연결된 클라우드 AI 서비스가 아니라 엔비디아 GB10 기반 AI 워크스테이션 '델 프로 맥스 위드 GB10'이다. 200억개 매개변수(파라미터)로 구성된 오픈소스 AI 모델 'gpt-oss-20b'가 로컬에서 작동한 것이다. 이날 델테크놀로지스는 국내 출입기자 대상으로 작년 10월 출시한 '델 프로 맥스 위드 GB10' 설명과 함께 실제 구동 시연, 체험 등 기회를 제공했다. GB10 탑재 제품을 출시한 주요 회사 중 처음이다. GB10, AI 개발 환경 개인 수준까지 확장 GB10은 엔비디아가 데이터센터와 클라우드 중심이었던 AI 개발 환경을 개인 수준까지 확장하기 위해 개발한 시스템반도체(SoC)다. Arm 기반 코어텍스-X925 10코어/A725 10코어 등 총 20코어로 구성된 '그레이스' CPU, 블랙웰 GPU로 구성됐고 128GB LPDDR5X 통합메모리와 한 쌍을 이룬다. 그래픽 메모리 제약이 있는 워크스테이션용 GPU와 달리 더 넓은 메모리 공간을 활용해 로컬 환경에서 최대 2000억 개 매개변수 LLM을 구동할 수 있다. 윤우진 델테크놀로지스 이사는 "AI 개발자들이 데이터센터 자원을 할당받아 사용하는 대신 책상 위에서 직접 모델을 개발하고 테스트할 수 있는 환경을 제공할 수 있다"고 설명했다. 델, GB10 확산 속 'AI 포트폴리오' 강조 델테크놀로지스를 포함해 레노버, 에이수스, HP 등 글로벌 제조사가 작년 10월을 전후해 GB10 탑재 AI 워크스테이션을 속속 시장에 출시하고 있다. 이들 제품은 128GB 통합 메모리와 우분투 리눅스 기반 DGX OS, AI 개발에 필요한 주요 소프트웨어 기본 제공 등 특징을 공유한다. 두 대의 시스템을 연결하면 최대 4000억 매개변수 규모 모델까지 처리할 수 있도록 확장 가능한 점도 동일하다. 윤 이사는 "델테크놀로지스는 데스크톱 워크스테이션부터 '델 프로 맥스 위드 GB10', GB300 등 일관된 AI 포트폴리오를 제공할 수 있다. 또 공기 흐름 설계와 전원 공급과 함께 글로벌 네트워크를 활용한 지원이 가능하다"고 강조했다. "게임 개발사 등 일부 기업 파일럿 도입" 이날 행사에서는 GB10을 활용한 AI 워크로드 시연도 함께 진행됐다. 로컬 환경에서 대형 언어모델을 실행해 챗봇 형태로 질의를 처리하는 한편 장비 두 대를 연결해 4000억 매개변수 LLM을 분산 실행하는 사례도 소개됐다. 시연을 진행한 김진효 메이머스트 이사는 "GB10은 모든 AI 스택이 맞춤형으로 구성된 일체형 장비(어플라이언스)로 임의로 시스템을 수정하면 정상 작동을 보장하기 어렵고 보증 대상에서도 제외될 수 있다"고 설명했다. 윤 이사는 "현재 일부 게임 개발사들이 GB10 탑재 제품을 시범 도입해 내부 테스트를 진행중이며 개발 환경에서 만족도가 확인되면 실제 도입으로 이어질 가능성도 있다"고 밝혔다.

2026.03.12 08:51권봉석 기자

엔비디아, Arm 윈도 PC 칩 'N1X/N1' 상반기 출시하나

엔비디아가 2024년 하반기부터 대만 팹리스 미디어텍과 개발을 시작한 윈도 PC용 Arm 기반 시스템반도체(SoC)인 N1X/N1이 올 상반기 안에 정식 제품으로 등장할 수 있다는 전망이 나왔다. N1X/N1은 고성능 CPU 코어와 블랙웰 GPU를 결합한 SoC로, 엔비디아 개인용 AI 워크스테이션 'DGX 스파크' 등에 에 적용된 GB10과 유사한 구성이다. 기존 Arm 윈도 노트북의 한계로 지적돼 온 그래픽 성능을 대폭 끌어올릴 수 있다. 대만 디지타임스는 엔비디아가 오는 3월 'GTC 2026' 행사에서 N1X/N1을 정식 공개하고, 6월 '컴퓨텍스 타이베이 2026' 행사 중 실제 제품을 공개할 가능성이 높다고 짚었다. 그러나 게임과 안티치트 등을 포함한 소프트웨어 호환성이 최대 변수로 꼽힌다. 2024년 하반기부터 N1/N1X 개발설 흘러나와 엔비디아가 대만 팹리스 미디어텍과 협력해 윈도 PC용 Arm 칩을 개발중이라는 루머는 2024년 하반기부터 대만 내 공급망을 중심으로 간헐적으로 흘러나왔다. 엔비디아가 개발중인 칩은 ▲ Arm 코어텍스(Cortex)-X925 CPU 코어 10개, 저전력·고효율 코어텍스-A725 코어 10개와 블랙웰 GPU를 결합한 'N1X' ▲ 코어 수를 줄이고 GPU 성능도 낮춘 'N1' 등 두 개다. 이 중 CPU와 GPU는 지난해 4분기부터 우분투 리눅스 기반 'DGX OS'를 탑재하고 시장에 출시된 개인용 AI 워크스테이션 'DGX 스파크' 내장 GB10과 거의 구성이 같은 것으로 알려져 있다. 작년 컴퓨텍스 공개는 불발... 벤치마크 수치는 노출 작년 5월 '컴퓨텍스 타이베이 2025' 개최를 앞두고 엔비디아와 미디어텍 두 회사가 N1X/N1 칩을 공개할 수 있다는 전망도 나왔다. 그간 컴퓨텍스를 포함해 공개석상에 등장하지 않았던 차이리싱(蔡力行) 미디어텍 CEO가 기조연설에 나섰다는 사실 때문이다. 그러나 엔비디아 기조연설이나 미디어텍 기조연설에서 N1X나 N1 관련 내용은 등장하지 않았다. 차이리싱 미디어텍 CEO와 젠슨 황 엔비디아 CEO도 GB10 관련 내용만 소개하는 데 그쳤다. 이후 작년 7월에는 N1X 칩 성능을 Arm용 윈도11에서 실행한 결과가 공개되기도 했다. CPU 성능은 인텔 14세대급 프로세서와, 내장 GPU 성능은 인텔 코어 울트라 시리즈3의 Xe3와 비슷할 것으로 예상된다. 디지타임스 "2분기부터 실제 제품 등장 전망" 대만 디지타임스는 지난 19일 공급망 관계자를 인용해 "엔비디아 N1X 칩 기반 노트북이 이르면 올 1분기 시장에 출시되고 2분기부터 본격적으로 시장에 공급될 것"이라고 보도했다. 실제로 작년 11월 경 주요 PC 제조사인 델테크놀로지스가 엔비디아 N1X 기반 '델 16 프리미엄' 노트북 시제품을 운송했다는 기록이 드러나기도 했다. 또 레노버도 최근 게이밍 노트북 '리전'에 탑재되는 소프트웨어인 '리전 스페이스' 관련 기술지원 문서에 'Legion 7 15N1X11'이라는 미출시 제품 명칭을 표기했다. 이는 '15인치 디스플레이와 엔비디아 N1X를 탑재한 리전 7 노트북'으로 해석될 수 있다. 이를 종합하자면 엔비디아가 오는 3월 중순 미국 새너제이에서 진행될 컨퍼런스 'GTC 2026'에서 N1X/N1칩을 공개하고, 6월 초순 대만에서 진행될 '컴퓨텍스 타이베이 2026'에서 실제 제품을 출시하는 스케줄로 이어질 수 있다. 게임 호환성이 관건... 최근 Arm용 X박스 앱 공개 엔비디아 N1X/N1 SoC는 현재까지 출시된 노트북용 SoC 중 그래픽 성능 면에서 최상위에 있다. Arm 진영에서는 배터리 지속시간과 휴대성이 중요한 업무용 노트북 수요가 퀄컴 스냅드래곤 X 엘리트로, 게임용 고성능 노트북은 엔비디아 N1X로 양분될 가능성도 있다. 그러나 오히려 GPU 성능보다는 주로 게임이나 안티치트 등 소프트웨어 호환성이 더 큰 문제가 될 것으로 보인다. 엔비디아에 한 발 앞서 Arm 윈도 PC 시장에 참여한 퀄컴도 별도 조직을 만들고 호환성 문제를 해결하는 데 10여 년 가량을 투자했다. 특히 GPU 등에 직접 접근해야 하는 게임 특성상 여러 문제가 발생할 수 있다. 다만 지난 21일 마이크로소프트가 Arm용 X박스 앱을 공개했고 X박스 게임 패스 카탈로그에 등록된 게임 중 85% 가량이 현재 Arm용 윈도11을 지원한다. 엔비디아가 자체 운영하는 클라우드 게이밍인 '지포스 나우'를 Arm용으로 개발하는 방안도 있다.

2026.01.26 16:39권봉석 기자

엔비디아, 퍼블릭 클라우드 사업 축소…韓 인프라 시장에 미칠 파장은

엔비디아가 퍼블릭 클라우드 사업을 축소하고 그래픽처리장치(GPU) 공급에 무게를 싣는 전략 전환에 나섰다. 그간 지속돼 왔던 고객과의 영역 다툼 문제를 해소하기 위한 방안으로, 국내 클라우드·인공지능(AI) 인프라 생태계에도 영향이 미칠 것이라는 관측이 나온다. 5일 디인포메이션 등 외신과 업계에 따르면 엔비디아는 최근 DGX 클라우드 조직을 엔지니어링·운영 조직 산하로 통합하며 외부 고객 대상 클라우드 서비스 확대 기조를 사실상 중단했다. 앞으로 DGX 클라우드는 엔비디아 내부 AI 모델 개발과 칩 설계를 지원하는 인프라로 활용될 전망이다. DGX 클라우드는 2023년 엔비디아가 처음 선보인 AI 특화 클라우드 서비스로, 아마존웹서비스(AWS)·마이크로소프트(MS)·구글 클라우드 등 하이퍼스케일러 인프라 위에서 엔비디아 GPU와 소프트웨어(SW) 스택을 통합 제공하는 방식이다. 그러나 고객 확보 속도가 기대에 미치지 못했고 주요 클라우드 고객과의 이해 충돌 우려가 지속적으로 제기돼왔다. 이번 조직 개편으로 엔비디아는 클라우드 사업자와의 직접 경쟁보다는 GPU와 AI 플랫폼 공급에 집중한다는 방침이다. 이는 엔비디아가 클라우드 사업자가 아닌 AI 인프라 핵심 공급자로서의 정체성을 강화하는 것으로 해석된다. 이같은 변화는 국내 클라우드 서비스 제공업체(CSP)에는 부담 완화 요인으로 작용할 가능성이 크다. 일각에서는 지난해부터 공공에 진입한 AWS·MS·구글에 더해 엔비디아도 DGX 클라우드를 앞세워 한국 시장에 직접 진출할 경우 국내 CSP 사업이 위축될 수 있다는 우려가 제기돼왔다. 네이버클라우드·KT클라우드·NHN클라우드 등은 엔비디아 GPU를 기반으로 AI 학습·추론 인프라를 확장하며 자체 서비스 경쟁력을 강화해왔다. 이런 상황에서 엔비디아가 퍼블릭 클라우드 전면 경쟁에서 한발 물러나면서, 국내 주도권을 유지한 채 GPU 수급과 기술 협력에 집중할 수 있는 여지가 커졌다는 평가다. 특히 네이버클라우드는 엔비디아와 소버린 AI 협력을 이어가며 국내외 AI 인프라 사업을 확대 중이다. 엔비디아가 내부 R&D 중심으로 DGX 클라우드를 재편하더라도 엔비디아 클라우드 파트너(NCP) 체계를 통한 협력 구조 자체가 흔들리지는 않을 것으로 점쳐진다. KT클라우드와 NHN클라우드 역시 공공·금융 부문을 중심으로 AI 인프라 수요 확대에 대응하고 있는 만큼, 엔비디아의 전략 전환은 향후 GPU 공급 안정성과 파트너십 지속성 측면에서 긍정적이라는 분석도 나온다. 하드웨어(HW) 생태계 측면에서도 변화가 감지된다. 델 테크놀로지스, HPE 등 GPU 서버 및 데이터센터 핵심 벤더들도 엔비디아가 직접 클라우드 서비스를 확대하기보다 파트너 중심 전략을 유지함에 따라 대형 CSP 및 기업 고객을 대상으로 한 AI 서버 공급 기회를 이어갈 수 있을 것으로 전망된다. 업계에서는 엔비디아가 DGX 클라우드를 통해 쌓은 운영 경험을 서버 레퍼런스 아키텍처와 SW 스택 고도화에 활용하면서 결과적으로 서버 벤더와 CSP 전반의 AI 인프라 구축 속도를 높이는 방향으로 작용할 가능성에 주목하고 있다. 다만 엔비디아의 전략 변화가 GPU 가격 정책이나 공급 우선순위에 어떤 영향을 미칠지는 여전히 변수로 꼽힌다. AI 수요 급증 속에서 GPU 확보 경쟁이 이어지는 만큼 국내 CSP들은 중장기 공급 전략과 자체 플랫폼 경쟁력 강화에 더욱 힘을 실을 필요가 있다는 지적도 제기된다. 이번 조직 개편에 대해 엔비디아 측은 "최첨단 R&D를 위한 세계적 수준의 인프라를 제공하고 클라우드 파트너들이 성공할 수 있도록 DGX 클라우드 SW 역량 강화에 지속 투자할 것"이라고 밝혔다. 국내 클라우드 업계 관계자는 "엔비디아가 직접 클라우드 사업자로 나서기보다는 GPU와 AI 플랫폼 공급에 집중하는 전략을 분명히 한 것"이라며 "국내 클라우드 사업자 입장에서는 GPU 의존도가 여전히 높은 만큼, 장기적으로 인프라 기술 고도화와 서비스 차별화가 핵심 경쟁력이 될 것"이라고 말했다.

2026.01.05 14:48한정호 기자

삼성전자, 엔비디아 AI 워크스테이션 'DGX 스파크'에 고성능 SSD 공급

삼성전자가 엔비디아의 최신 개인용 인공지능(AI) 워크스테이션 'DGX 스파크(Spark)'에 고성능 SSD를 공급한 사실이 확인됐다. DGX 스파크는 최근 스페이스X 본사(텍사스 스타베이스)에서 젠슨 황 엔비디아 CEO(최고경영자)가 직접 일론 머스크 CEO에게 전달하며 공개됐다. 엔비디아는 최근 링크드인 공식 계정을 통해 “로켓에서 AI로(From rockets to AI)”라는 문구와 함께 DGX 스파크 전달 영상을 공개했다. DGX 스파크는 연구자와 개발자, 크리에이터를 위한 데스크톱형 AI 슈퍼컴퓨터로, 초당 1페타플롭(PFLOPS)에 달하는 연산 성능을 갖춘 것으로 알려졌다. 이는 2016년 출시된 첫 DGX-1보다 5배 향상된 수준이다. 삼성전자 반도체 미주총괄을 맡고 있는 조상연 부사장도 자신의 링크드인 계정을 통해 해당 협력 사실을 언급했다. 그는 “엔비디아의 DGX 스파크가 스페이스X와 일론 머스크에게 전달된 것을 보니 흥미롭다”며 “삼성 반도체가 DGX 스파크용으로 설계된 고성능 스토리지 솔루션인 PM9E1 SSD를 통해 이 시스템을 지원할 수 있었던 점이 자랑스럽다”고 밝혔다. PM9E1은 삼성전자가 최근 출시한 고성능 PCIe 5.0 NVMe SSD로, 초당 14.5GB의 읽기 속도와 13GB의 쓰기 속도를 구현한다. 최대 4TB 용량을 지원하며, 8세대 V-낸드와 5나노 컨트롤러를 탑재해 전력 효율과 안정성을 대폭 개선했다. 이 제품은 AI 워크로드, 대용량 데이터 처리, 생성형 AI 모델 로딩 등 고성능·고효율이 동시에 요구되는 환경에 최적화돼 있다. 특히 DGX Spark와 같은 AI 슈퍼컴퓨팅 시스템의 데이터 병목을 최소화하고, 초고속 연산 처리를 위한 기반 스토리지 역할을 수행한다. 조 부사장은 “AI와 고성능 컴퓨팅의 발전은 생태계 전반의 공유된 혁신(shared innovation)에 기반하고 있다”며 “모든 부품이 '다음'을 가능하게 하는 데 중요한 역할을 한다”고 덧붙였다. DGX 스파크는 엔비디아가 새로운 세대의 생성형 AI 개발 환경을 위해 설계한 워크스테이션급 시스템으로, 개인 연구자나 소규모 개발 조직도 고성능 AI 모델을 구축할 수 있도록 지원한다. 한편 삼성전자는 이번 공급을 통해 AI 컴퓨팅 시장 내 고성능 메모리·스토리지 분야의 존재감을 한층 강화할 것으로 전망된다.

2025.10.27 09:54전화평 기자

씨이랩, 엔비디아 손안의 슈퍼컴 'DGX 스파크' 예약 판매

비전AI 전문기업 씨이랩(대표 윤세혁, 채정환)이 미국 엔비디아가 차세대 개인용 AI 슈퍼 컴퓨터라 칭한 'DGX 스파크'의 국내 예약 판매를 시작했다. 4일 이 회사 블로그에 따르면, 엔비디아 DGX 스파크가 AI모델 개발 속도를 10배 향상 시켜준다면서 사전 예약을 시행, 현재 진행중이다. 씨이랩 블로그는 'DGX 스파크'가 개인용 AI슈퍼컴퓨터의 시작이며, 대용량 AI모델을 돌리려면 클라우드 비용이 너무 많이 나오는데, 이런 고민을 해결할 게임체인저가 'DGX 스파크'라고 밝혔다. 이어 "최대 2000억 개 매개변수를 가진 AI모델을 여러분의 책상 위에서 바로 실행하게 해주는 혁신적인 시스템"이라고 주장했다. 앞서 엔비디아코리아는 29일 “'DGX 스파크'의 국내 예약 주문을 시작한다”고 공지한 바 있다. 'DGX 스파크'는 엔비디아가 지난 1월 열린 'CES 2025'서 '프로젝트 디지츠(Project DIGITS)'로 처음 발표했다. 이어 3월 엔비디아 최대 연례행사인 'GTC'에서 공식 명칭이 'DGX 스파크'로 확정해 선보였고, 엔비디아는 'DGX 스파크'를 "개인용 AI 슈퍼컴퓨터"라고 강조했다. 생성형 AI, 대규모언어모델(LLM), 초고속 추론 등의 다양한 AI 워크플로우를 데이터센터 없이 데스크톱에서 바로 구현할 수 있어, AI 개발의 민첩성과 효율성을 획기적으로 강화할 수 있다. 엔비디아 최신 아키텍처인 'GB10 그레이스 블랙웰(GRACE Blackwell)' 슈퍼칩을 탑재, FP4 기준 최대 1페타플롭의 AI 연산 성능을 제공한다. 또 128GB 메모리와 엔비디아 AI 소프트웨어 스택이 기본 탑재돼 있어, 최신 AI 모델과 애플리케이션 개발도 로컬 환경에서 프로토타이핑 및 파인튜닝이 가능하다. 텐서플로(TensorFlow) 파이토치(PyTorch), 쥬피터(Jupyter) 등 인기 딥러닝 프레임워크와 호환이 가능하고 'DGX Cloud' 및 고속 데이터센터 환경으로의 확장도 손쉽게 지원한다. 이를 통해 AI 연구자를 비롯해 개발자, 학생 등 다양한 사용자가 복잡한 AI 인프라 구축과 소프트웨어 호환성 문제 없이 AI 모델 개발부터 배포까지 완전한 개발 환경을 제공받을 수 있다고 씨이랩은 밝혔다. 씨이랩은 엔비디아의 공식 파트너사인데, 이번 'DGX 스파크' 공급을 통해 기업 및 연구기관의 AI 개발 인프라 혁신을 적극 지원할 것으로 알려졌다. 특히, 도입 기업에 맞춤형 컨설팅과 하드웨어 및 소프트웨어 기술을 지원하며, AI 운영의 전 주기적인 통합 솔루션을 제공할 예정이다. 회사는 현재 공식 홈페이지에서 사전 예약 접수를 진행하고 있다. 윤세혁 씨이랩 대표는 “DGX 스파크는 개인부터 스타트업까지 다양한 사용자가 고성능 AI 모델을 로컬 환경에서 직접 개발하고 테스트할 수 있게 설계된 핵심 인프라”라며 “씨이랩은 엔비디아의 파트너로서, 제품 도입은 물론 기업의 실제 비즈니스에 맞는 모델 최적화, 성능 실증 등 AI 운영의 모든 단계에서 함께하는 실질적인 파트너 역할을 수행할 것”이라고 말했다. 한편 씨이랩은 2010년 설립된 비전AI 전문기업이다. AI 기반으로 대용량 영상 데이터 분석에 특화한 기술을 인정 받아 2021년 2월 코스닥에 상장했다. GPU 리소스를 최적으로 관리 및 운영해주는 솔루션 '아스트라고(AstraGo)' 등을 시장에 공급하고 있다. .

2025.08.05 08:40방은주 기자

엔비디아 'GB10' 기반 AI 워크스테이션, 이달 하순 본격 출시

엔비디아가 개인 개발자와 AI 전문가를 겨냥해 개발한 AI 가속용 GPU 'GB10' 기반 워크스테이션이 이달 하순부터 국내를 포함해 전세계 시장에 공급된다. 비용이나 보안 등 제약 없이 고성능 AI 응용프로그램을 개발하려는 수요가 집중될 것으로 보인다. GB10 기반 엔비디아 자체 제품인 'DGX 스파크'가 이달 초부터 공급되기 시작했고 에이수스, MSI 등 대만계 PC 제조사를 비롯해 델테크놀로지스, 레노버 등 글로벌 IT 기업들이 GB10 기반 제품을 이달 하순부터 순차 출시할 예정이다. 1월 첫 공개 이후 반 년만에 상용화 엔비디아는 지난 1월 'CES 2025' 기조연설에서 클라우드 없이 개인이 AI 처리용으로 활용할 수 있는 장치 '프로젝트 디지츠'를 공개했다. 3월 'GTC 2025'에서는 이 기기의 정식 명칭을 'DGX 스파크'로 설명하고 올 하반기부터 시장에 공급한다고 설명했다. 이 기기에는 블랙웰 GPU 'GB10'과 Arm IP 기반 20코어 그레이스(Grace) CPU를 결합한 SoC, 128GB LPDDR5X 통합메모리를 탑재해 클라우드 서버 없이 AI 작업을 테스트할 수 있다. 이런 구조 개발에는 대만 팹리스인 미디어텍이 협력했다. 젠슨 황 엔비디아 CEO는 5월 중순 '컴퓨텍스 타이베이 2025' 기간 중 진행된 질의응답에서 "DGX 스파크는 클라우드 기반 AI 개발 과정에서 마주할 수 있는 비용이나 지연 시간, 보안 관련 문제를 해결할 수 있는 제품"이라고 설명했다. 현재 엔비디아는 GB10 기반 자체 제품인 'DGX 스파크'를 이 달부터 전세계 주요 파트너사를 통해 공급하고 있다. "GB10, 7월부터 대량생산 돌입... 하순부터 출시" 지난 8일 대만 경제일보(經濟日報)는 미디어텍 관계자를 인용해 "엔비디아와 미디어텍이 공동 개발한 GB10이 이 달부터 대량생산 체제에 들어갈 예정이며 주요 제조사에 공급될 것"이라고 보도했다. 이어 "GB10은 엔비디아의 AI 시장 지배력을 강화하는 한편 미디어텍의 AI 사업 진출에 중요한 이정표가 될 전망"이라고 분석했다. 에이수스, MSI 등 대만계 PC 제조사를 포함해 델테크놀로지스, 레노버도 GB10 탑재 제품을 출시 예정이다. 가격은 기본 구성 기준 4천 달러(약 550만원) 내외로 예상된다. 한 제조사 국내 법인 관계자는 "관련 제품 글로벌 출시 일자는 이달 하순이 맞지만 국내 공급 일정과 예상 가격은 유동적"이라고 설명했다. 윈도 OS 기반 PC용 SoC 개발설 '솔솔' GB10 기반 엔비디아 'DGX 스파크'와 기타 제조사가 출시할 기기는 리눅스 기반 DGX OS 기반으로 작동한다. 모니터를 연결할 수 있는 HDMI 단자를 갖추고 유·무선 키보드와 마우스도 연결할 수 있지만 일반적인 PC처럼 쓸 수 있는 제품은 아니다. 엔비디아와 미디어텍이 윈도 운영체제를 구동할 수 있는 Arm 기반 AI PC용 시스템반도체(SoC)를 개발중이라는 관측도 여전히 현재 진행형이다. 지난 5월 초에는 엔비디아와 미디어텍이 Arm 코어텍스(Cortex) X9 CPU와 엔비디아 GPU를 조합한 윈도용 Arm SoC를 컴퓨텍스 기간 중 공개할 것이라는 전망이 나오기도 했다. 그러나 이는 실현되지 않았다. 당시 해당 사안에 정통한 한 관계자는 익명을 전제로 "미디어텍이 설계한 CPU와 GPU의 연동 과정에서 생긴 문제를 해결하지 못해 발표 시기를 놓친 것"이라며 "올 연말이나 내년 초로 공개 시기가 미뤄질 가능성이 있다"고 내다봤다.

2025.07.09 16:20권봉석 기자

수익 안 나는 일 뛰어든 AI 스타트업…'100대 개인 슈퍼컴' 들여온 이유는

포티투마루가 단기 수익을 기대하기 어려운 사업임에도 인공지능(AI) 슈퍼컴퓨터 '디지엑스 스파크(DGX Spark)' 100대를 국내에 들여왔다. 엔비디아가 한국에 한정 배정한 초기 물량 중 상당수를 확보한 셈으로, AI 인프라 저변 확대와 기술 실험 기회를 넓히기 위한 전략적 '마이너스 투자'다. 30일 업계에 따르면 포티투마루는 지난 27일 엔비디아의 블랙웰 기반 개인용 AI 슈퍼컴 '디지엑스 스파크'를 선점 물량 형태로 100대 확보했다. 이는 글로벌 전체 2만대 중 한국 배정분 중 상당수에 해당하며 국내 기업 중 단일 확보 기준 최대치다. '디지엑스 스파크'는 가로세로 15센티미터 크기에 1.2킬로그램 무게를 갖춘 데스크톱형 고성능 AI 연산 장비다. 1페타플롭 수준의 AI 연산이 가능하며 128기가바이트 메모리를 탑재해 2천억개 규모의 대형 언어 모델 추론 및 파인튜닝이 가능하다. 가격은 대당 3천999달러(한화 약 560만원)로 책정됐다. 더불어 이 모델은 클라우드 기반 AI 연산이 어려운 환경에서 로컬 장비로 활용될 수 있다. 최대 2천억 파라미터 모델을 사전 설치된 AI 스택을 통해 바로 추론할 수 있고 메타·구글·딥시크 등의 최신 모델도 프로토타입 형태로 실험 가능하다. 클라우드 없이 자체 데이터를 활용해 모델을 실험할 수 있다는 점에서 일부 기업과 연구자에겐 대안이 될 수 있다. 포티투마루 측은 국내 딜러들이 한국 시장에선 수요가 적을 것이라 판단해 엔비디아가 원래 계획했던 1천500대 중 일부만 들여왔다는 설명이다. 김동환 대표는 "이런 기회를 국내에서 제대로 활용하지 못하는 것이 아쉽다"며 "안타까운 마음에 확보를 결심했다"고 밝혔다. 이는 자체 수익성과는 거리가 먼 결정이었다. 포티투마루 측은 '디지엑스 스파크' 확보로 직접적인 매출 전환은 어려울 것으로 판단하고 있다. 초기 대응과 행정 처리에 따른 리소스 소모도 적지 않다. 그럼에도 장기적으론 국내 AI 기술 실험 환경과 활용 저변 확대에 일정 수준의 기여를 할 수 있다는 판단이 작용했다. 김동환 포티투마루 대표는 "미국은 2만대 전량을 소화하겠다고 할 텐데 국내 시장 상황이 안타깝다"며 "이런 장비를 접하고 실험해볼 기회가 많아야 AI 저변이 확산되고 궁극적으론 시장의 트렌드를 선도할 수 있다"고 밝혔다.

2025.06.30 14:37조이환 기자

미디어텍 "엣지에서 클라우드까지 AI 혁신 가속"

[타이베이(대만)=권봉석 기자] "미디어텍은 1997년 설립 이후 광학드라이브를 거쳐 스마트폰, TV, 사물인터넷(IoT)는 물론 오토모티브(자동차)와 AI 시장으로 사업을 꾸준히 확장해 왔다. 그러나 일관된 목표는 사람들의 삶을 개선하고 풍요롭게 하는 것이다." 컴퓨텍스 2025 개막일인 20일 오전(이하 현지시간) 타이베이 난강전람관에서 진행된 기조연설에서 차이리싱(蔡力行, Rick Tsai) 미디어텍 CEO가 이렇게 설명했다. 미디어텍은 스마트폰을 시작으로 웨어러블 등 IoT 기기, 산업용 기기에 이어 최근 오토모티브와 AI 가속기용 반도체 시장까지 사업 영역을 넓히고 있다. 이날 기조연설에서는 스마트폰용 시스템반도체(SoC)인 디멘시티 9400 2종 등의 성과와 TSMC·엔비디아와 협업 관계도 소개됐다. 스마트폰·맞춤형 반도체 등 5개 영역에 AI 역량 확대 차이리싱 CEO는 "지난 10년 간 전 세계 200억 개의 기기에 미디어텍 칩이 탑재됐고 이를 지구 인구로 환산하면 미디어텍 제품이 들어간 제품을 한 사람당 2.5개 이상 쓰고 있는 셈"이라고 설명했다. 이어 "스마트폰과 크롬북, IoT와 오토모티브, 데이터센터용 서버와 맞춤형 반도체 등 총 5개 영역에서 경쟁력을 강화하고 AI 혁신을 이끌 것"이라고 설명했다. 이날 미디어텍은 전력 효율 향상과 성능 향상을 위해 반도체 생산 공정을 2나노급으로 전환할 것이라고 밝혔다. 차이리싱 CEO는 "TSMC 3나노급(N3) 공정 대비 2나노급 공정은 15% 성능 향상, 전력 소모 25% 절감 등 효과가 있으며 오는 9월까지 최종 설계 절차(테이프아웃)를 마칠 것"이라고 설명했다. 오토모티브·데이터센터로 포트폴리오 확장 미디어텍은 2년 전 오토모티브용 반도체 시장에 본격 진출해 엔비디아와 협력을 강화하고 있다. '콘딧-X1'은 미디어텍의 Arm CPU와 엔비디아 GPU, AI 가속 기능을 갖춘 차량용 칩이다. 미디어텍은 3년 전부터 데이터센터용 AI ASIC 개발에도 주력하고 있다. 차이리싱 CEO는 "91x91mm 크기의 대형 네트워킹 칩을 개발했으며, HBM을 칩렛으로 적재하는 기술을 보유하고 있다"고 설명했다. 그는 "AI 가속기는 반도체 생산 공정과 반도체간 연결 기술, 패키징 등에서 복잡한 기술이 필요하며 각종 문제 해결을 위해 TSMC는 물론 엔비디아와 협력하고 있다. 최근 공개된 엔비디아 패브릭 'NV링크 퓨전'에도 초기 파트너로 참여했다"고 밝혔다. 젠슨 황 "NV링크 퓨전, 미디어텍과 협업에서 출발" 기조연설 말미에는 전날(19일) 기조연설에서 반도체 연결 기술 'NV링크 퓨전'을 발표한 젠슨 황 엔비디아 CEO가 등장했다. NV링크 퓨전 생태계의 초기 파트너사로 미디어텍 외에 퀄컴도 이름을 올렸다. 차이리싱 CEO의 소개로 무대에 오른 젠슨 황 CEO는 "NV링크 퓨전은 하반기 출시를 앞둔 개인용 AI 컴퓨터 'DGX 스파크' 설계 당시 얻은 아이디어에서 출발했다"고 설명했다. 이어 "NV링크 퓨전 기술은 서로 다른 두 반도체를 단순히 연결하는 기술이 아니라 한 패키지 안에 두 반도체가 동시에 공존하는 기술이다. 엔비디아의 IP를 다른 회사에 공개하는 것은 이번이 처음"이라고 설명했다. 젠슨 황 CEO는 "NV링크 퓨전은 이를 이용하는 고객사의 선택지가 넓어진다는 면에서, 또 엔비디아에게는 다른 생태계로 반도체 제품을 연결할 수 있어 모두에게 이익인 좋은 아이디어"라고 설명했다.

2025.05.20 14:55권봉석 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

美 연방정부 AI 활용 2년 새 4배…MS·구글·팔란티어가 깔았다

車산업 SDV 전환 속도내지만…SW·AI 인력 확보는 '난항'

과금보다 '재미'…넷마블 '게임 본질' 집중 전략, 글로벌 적중

삼성전자, 1분기 태블릿 출하량 12.6% 감소...애플은 7.9%↑

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.