• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'네모트론'통합검색 결과 입니다. (9건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

GPU 넘은 엔비디아, 한국 데이터까지 손댔다…소버린 AI 속도전

엔비디아가 한국 사회 특성을 반영한 대규모 합성 데이터셋을 공개하며 국내 인공지능(AI) 생태계 공략에 속도를 내고 있다. 단순 기술 공개를 넘어 '소버린 AI' 흐름 속에서 데이터까지 포함한 AI 인프라 주도권을 확보하려는 전략으로 풀이된다. 엔비디아는 한국형 합성 데이터셋 '네모트론-페르소나-코리아(Nemotron-Personas-Korea)'가 글로벌 AI 플랫폼 허깅페이스(Hugging Face) 데이터셋 부문 1위를 기록했다고 28일 밝혔다. 해당 데이터셋은 600만 건 규모로, 한국의 인구통계학적·지리적·문화적 특성을 반영한 것이 특징이다. 국가통계포털(KOSIS), 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버클라우드 등 공공·민간 데이터를 기반으로 구축됐다. 이름, 성별, 연령, 혼인 상태, 교육 수준, 직업, 거주 지역 등 주요 속성은 실제 통계 분포를 따르도록 설계됐다. 존댓말 체계와 지역별 직업 패턴 등 한국어 문화 맥락도 반영했다. 고령층과 농촌 지역, 다양한 교육 및 직업군까지 포함해 데이터 다양성을 확보했다. 해당 데이터셋은 개인정보를 포함하지 않는 합성 데이터로 구성돼 개인정보보호법(PIPA)을 준수하도록 설계됐다. 오픈소스로 공개돼 국내외 개발자들이 자유롭게 활용할 수 있다. 이번 데이터셋 공개는 단순 기술 성과를 넘어 AI 인프라 경쟁 구도가 데이터 영역으로 확장되고 있음을 보여주는 사례로 해석된다. 그동안 그래픽처리장치(GPU) 등 컴퓨팅 자원이 핵심 경쟁력이었다면, 최근에는 학습 데이터 확보가 AI 성능과 직결되는 핵심 변수로 부상하고 있기 때문이다. 특히 국가별 언어·문화·규제를 반영하는 '소버린 AI' 수요가 확대되는 상황에서 한국형 데이터셋을 선제적으로 구축해 공개했다는 점도 주목된다. 글로벌 빅테크들이 각국 맞춤형 AI 전략을 강화하는 가운데 엔비디아가 데이터 레이어까지 영향력을 확대하려는 포석으로 읽힌다. 합성 데이터 활용 전략도 눈에 띈다. 개인정보 규제를 준수하면서도 데이터 활용도를 높일 수 있는 대안으로, 향후 금융·의료·공공 등 규제 산업에서 활용 가능성이 크다는 평가다. 국내 시장을 겨냥한 행보라는 해석도 나온다. 네이버, KT 등 주요 기업들이 한국형 AI 모델 개발에 나선 가운데 엔비디아가 데이터·모델·인프라를 결합한 생태계 확장에 나서며 영향력 확대를 시도하고 있다는 분석이다. 더불어 엔비디아는 최근 '네모트론 디벨로퍼 데이즈 서울 2026'을 개최하는 등 국내 개발자 및 기업과 협업을 강화하려는 모습도 보였다. 업계 관계자는 "엔비디아가 단순 GPU 공급을 넘어 데이터와 모델까지 포함한 AI 플랫폼 사업자로 빠르게 전환하고 있다"며 "소버린 AI 확산과 함께 국가별 데이터 확보 경쟁도 본격화될 것"이라고 말했다.

2026.04.28 17:43장유미 기자

노타, 엔비디아 해커톤 1위…데이터 중심 AI 최적화 통했다

노타가 엔비디아 네모트론 해커톤에서 합성 데이터 기반 모델 최적화 기술력을 앞세워 종합 우승을 차지했다. 노타는 엔비디아 네모트론 해커톤에서 혼합전문가(MoE) 양자화에 특화된 합성 데이터 생성 기술로 트랙 C 1위를 차지하고 전체 20개 참가 팀 중 종합 1위에 올랐다고 24일 밝혔다. 이번 해커톤은 엔비디아 오픈소스 인공지능(AI) 모델 '네모트론' 연구 성과를 공유하고 국내 개발자들의 실무 적용 역량을 높이기 위해 마련된 행사다. 참가자들은 ▲실문제 해결형 AI 에이전트 개발(트랙 A) ▲도메인 특화 네모트론 모델의 지도미세조정(SFT)·강화학습(RL) 기반 고도화(트랙 B) ▲고품질 합성 데이터 파이프라인 설계(트랙 C) 등 세 트랙에서 경쟁했다. 노타는 엔비디아 '네모트론 3 슈퍼 120B' 기반 에이전트를 활용해 MoE 구조에 특화된 양자화용 데이터셋을 구축했다. 기존 양자화 방식이 수식·알고리즘 중심 최적화에 초점을 맞췄다면 노타는 데이터셋 구조·품질·목적 적합성을 정교하게 설계하는 데이터 중심 접근법으로 양자화 성능을 끌어올렸다. 노타는 자사 비전언어모델(VLM) 기반 실시간 영상 분석 솔루션 'NVA'에 엔비디아 검색·요약 도구 'VSS 블루프린트'를 접목해 이상 상황을 실시간으로 탐지·요약하는 등 엔비디아와 비전 AI 응용 분야 기술 협력도 이어가고 있다. 채명수 노타 대표는 "이번 수상은 AI 최적화가 알고리즘 고도화에 머무르지 않고 목적에 맞는 데이터를 어떻게 설계하고 활용하느냐에 따라 새로운 가능성을 만들 수 있음을 보여줬다"며 "엔비디아와의 협력을 바탕으로 데이터 중심 AI 최적화 기술과 솔루션을 고도화하겠다"고 말했다.

2026.04.24 14:12이나연 기자

[현장] "벤치마크보다 중요한 건 실전"… AI 리더가 짚은 국내 AI 생태계 과제

"벤치마크 점수가 높다고 고객이 만족하는 것은 아닙니다. 실제 기업 환경에서 실질적인 성능을 내는 것이 진짜 성과입니다." 21일 서울 마포 디캠프에서 열린 '엔비디아 네모트론 개발자 데이 서울 2026'에서 진행된 기술 패널 토론에는 한국 인공지능(AI) 생태계를 이끄는 주요 리더가 참석해 치열하고 솔직한 현장 경험담을 제시했다. 이날 토론은 정규형 엔비디아 솔루션아키텍트(SA) 팀장이 좌장을 맡았고 천성준 SKT AI리서치 엔지니어, 최홍준 업스테이지 부사장, 임정환 모티프 대표, 김수인 엘리스그룹 최고연구책임자(CRO)가 참석해 'K-AI 빌더들의 연결과 글로벌 진출'을 주제로 논의를 이어갔다. "점수보단 실전"… 글로벌 수준 도달한 K-AI, 이제는 추론 효율이 과제 패널들은 공통적으로 국내 기업들이 자체 AI 모델을 개발하는 단계를 넘어, 이를 실제 서비스에 올릴 수 있는 수준으로 고도화하는 것이 중요하다고 입을 모았다. 천성준 SK텔레콤 AI리서치 엔지니어는 "한국 기업도 글로벌 프런티어 모델에 근접한 성능을 낼 수 있다는 점은 이미 입증했다"며 "이제 과제는 추론 효율성과 배포 가능성을 높여 '쓸 만한 모델'을 넘어 '실제로 쓸 수 있는 모델'을 만드는 것"이라고 말했다. 임정환 모티프 대표는 단순한 매개변수 규모 경쟁을 경계했다. 그는 "비슷한 규모의 모델과 경쟁하는 것이 아니라 2~3배 큰 모델과 비견되거나 더 나은 성능을 내는 것이 진짜 기술력의 증거"라며 "현재 3000억개 매개변수(300B) 규모 모델을 비롯해 음성·비디오 생성까지 포함한 다양한 생성형 모델을 개발 중이고 장기적으로는 월드 모델 등으로 확장할 계획"이라고 밝혔다. "데이터 반출 장벽 넘어야"…엣지 환경과 엔드투엔드 인프라 부상 김수인 엘리스그룹 CRO는 산업 현장 도입의 가장 큰 장벽으로 데이터 거버넌스를 지목했다. 김 CRO는 "세계 최고 수준의 모델을 만들어도 실제 현장에 적용하려고 하면 데이터 반출 불가 등 수많은 병목 현상에 부딪힌다"며 "결국 칩, 인프라, 데이터, 모델, 애플리케이션까지 전 레이어를 아우르는 엔드투엔드 전략이 필요하다"고 설명했다. 그는 또 현장 수요가 엣지와 온프레미스 환경으로 확장되고 있다고 진단했다. 고객 데이터가 외부로 나갈 수 없는 경우가 많은 만큼, 실제 서비스 환경에서는 모델 성능뿐 아니라 배포 방식과 운영 구조까지 함께 설계해야 한다는 설명이다. 주최 측인 엔비디아의 소프트웨어 생태계에 대한 개선점도 제기됐다. 천성준 엔지니어는 네모 큐레이터, 메가트론LM 등을 유용하게 활용하고 있다고 언급하면서도 "새로운 알고리즘이 엔비디아의 고속 학습 프레임워크에 반영되는 속도는 지금보다 훨씬 더 빨라질 필요가 있다"고 짚었다. 임정환 대표는 한발 더 나아가 기술적 종속성을 경계했다. 그는 "모델 아키텍처 실험의 자유도가 무엇보다 중요하기 때문에 현재 엔비디아 소프트웨어는 잘 사용하지 않는다"며 "엔비디아가 제공하는 거대한 패키지 틀 안에 갇히게 되면 독자적인 혁신에 한계가 생길 수밖에 없다"고 지적하며 유연한 개발 환경의 필요성을 언급했다. 좌장을 맡은 정규형 팀장은 "현장의 따끔하고 생생한 피드백에 깊이 감사드린다"며 "개발자들이 더 효율적이고 자유롭게 사용할 수 있도록 한국 AI 기업들의 다양한 요구를 본사에 적극 전달해 프레임워크의 유연성을 개선하겠다"고 화답했다. 독자 파운데이션 모델과 소버린 AI… 글로벌 확장 가능성 주목 패널들은 정부가 추진 중인 독자 파운데이션 모델 사업에도 의미를 부여했다. 최홍준 부사장은 "글로벌 수준의 오픈 모델이 국내에 구축되면 민간이 이를 바탕으로 다양한 서비스를 만들 수 있고, 그 혜택이 산업 전반으로 확산될 수 있다"고 말했다. 이어 "동남아 등 많은 국가들은 언어, 문화, 규제 맥락이 달라 각국에 맞는 소버린 AI를 원하고 있다"며 "한국에서의 모델 구축과 인프라 운영 경험은 해외 진출의 자산이 될 수 있다"고 덧붙였다. 이날 토론은 AI 경쟁의 승부처가 더 큰 모델, 더 높은 벤치마크 점수에서 실제 배포와 운영, 데이터 주권, 산업 적용으로 이동하고 있음을 보여줬다. 이번 패널 토론은 독자 파운데이션 모델 프로젝트를 추진 중인 정보통신산업진흥원(NIPA)과 엔비디아가 협력해 마련한 자리다. NIPA는 자사가 보유한 국내 개발자·기업 네트워크를 바탕으로 이번 행사와 국내 AI 생태계를 연결하는 역할을 했다는 설명이다. 박진홍 NIPA 글로벌협력팀장은 "국내 기업에 실질적으로 도움이 될 만한 것이 무엇인지 계속 찾아보면서 함께 하려 한다"며 "구체적으로 어떤 사업을 추가로 추진할지, 어떤 프로그램을 만들지는 아직 확정되지 않았고 향후 더 논의가 필요하다"고 말했다.

2026.04.21 18:22남혁우 기자

[현장] "메일 요약에서 물류 시뮬레이션까지"…엔비디아가 제시한 실무형 AI

"컨베이어벨트 속도를 어떻게 조절해야 가장 효율적일까?" 스마트폰으로 물류센터 최적화 질문을 입력하자 네모트론의 인공지능(AI) 에이전트가 시뮬레이션을 설계하고, 가상 공간에서 여러 조건을 검증한 뒤 결과를 분석해 보고서까지 내놨다. 엔비디아는 21일 서울 마포 디캠프에서 열린 '네모트론 개발자 데이 서울 2026'의 '빌드-어-클로(Build-a-Claw)' 시연 세션을 통해 답변형 AI를 넘어 실제 산업 현장에서 작동하는 '현실형 AI 에이전트'의 가능성을 제시했다. 시연을 맡은 정구형 엔비디아코리아 솔루션아키텍트(SA)팀 팀장은 오픈 클로(Open Claw), 네모 클로(NeMo Claw), DGX 스파크를 중심으로 에이전트 AI가 단순 질의응답을 넘어 실제 업무를 수행하는 방향으로 진화하고 있다고 설명했다. 이번 시연의 핵심은 여러 역할을 가진 에이전트를 엮어 팀처럼 운영하는 구조였다. 사용자가 질문을 던지면 단일 모델이 답만 내놓는 것이 아니라 역할이 나뉜 복수의 에이전트가 각각 필요한 작업을 수행하고 이를 종합해 결과를 제시하는 방식이다. 현장 시연은 AI가 더 이상 '말을 잘하는 도구'에 머무르지 않고, 실제 업무 흐름 안으로 들어오고 있음을 보여주는 데 초점이 맞춰졌다. 물류센터 최적화 질문에 시뮬레이션·분석·보고서까지 정 팀장은 자신이 실제로 구성해 사용 중인 에이전트 트리를 예로 들며, 이를 관리하는 상위 에이전트와 그 아래 팀장, 리서처, 엔지니어, 솔루션 아키텍트, QA, 운영, HR 역할의 에이전트가 계층적으로 배치된 구조를 보여줬다. 실제 기업 조직의 역할 분담과 관리 체계를 AI 시스템 설계에 옮겨놓은 모습에 가까웠다. 그는 "이 많은 에이전트와 직접 하나하나 소통하는 게 아니라, 관리용 에이전트를 둬 전체를 관장하게 만든다"고 말했다. 이어 "계층 구조를 설정하지 않으면 각 에이전트의 자율성이 지나치게 커질 수 있다"며 "조직을 만들듯 체계를 잡아야 원하는 방향으로 움직일 수 있다"고 설명했다. 이 같은 멀티 에이전트 방식은 특정 작업을 여러 단계로 쪼개고, 각 단계에 적합한 역할을 맡긴다는 점에서 기존 단일 챗봇 방식과 차별화된다. 질문 해석, 자료 탐색, 실행, 검증, 결과 정리 등의 과정을 역할별로 분산 처리함으로써 보다 복잡한 업무도 소화할 수 있다는 것이 엔비디아 측 설명이다. 이번 시연에서 가장 눈길을 끈 부분은 디지털 트윈 기반 물류 시나리오였다. 화면에는 컨베이어벨트 위를 흐르는 박스를 집어 쌓는 로봇 팔 환경이 구현됐다. 정 팀장은 "로봇은 바꿀 수 없는 상황에서 컨베이어벨트 속도를 어떻게 조절해야 가장 효율적으로 동작할 수 있을지를 에이전트에 물었다"고 소개했다. 그러자 에이전트들은 내부적으로 역할을 나눠 움직였다. 먼저 시뮬레이션 시나리오를 만들고 디지털 트윈 공간을 구동하는 시뮬레이터인 아이작 심(Isaac Sim)에서 총 8가지 시나리오를 돌린 뒤 그 결과를 월드 파운데이션 모델 '코스모스(Cosmos)'로 분석해 최종 리포트 형태로 제시하는 흐름이었다. 정 팀장은 "이런 식으로 본인이 하는 업무를 자동화할 수 있고 시행착오도 많이 줄일 수 있다"고 설명했다. 메일 요약부터 답변 초안까지… 사무 자동화 가능성도 제시 정 팀장은 산업 현장뿐 아니라 일상 업무에 가까운 활용 사례도 공개했다. 그는 자신이 운영 중인 이른바 '세컨드 브레인' 예시를 보여주며 메일 계정에서 메일을 가져와 내용을 요약하고, 답변 초안을 자동으로 작성하는 구조를 소개했다. 일정 관리 자동화 예시도 함께 제시됐다. 데일리 노트를 크론 잡으로 생성한 뒤 스케줄을 불러와 템플릿에 맞게 정리하는 식이다. 반복 업무를 자동화하면서도 사용자가 최종 결과물을 검토할 수 있도록 설계했다는 점이 특징이다. 다만 회사 정책상 실제 발송 API는 막아둔 상태라고 했다. 대신 초안은 개인 노트에 정리되도록 하고, 사용자가 내용을 확인한 뒤 직접 메일을 보내는 방식이다. 완전 자동화보다 '통제 가능한 자동화'에 무게를 둔 접근이라는 점에서, 기업용 AI가 현실적으로 어떤 선에서 적용되고 있는지를 보여주는 사례로 읽혔다. 자유로운 에이전트일수록 통제 중요… 네모 클로로 가드레일 강화 정 팀장은 에이전트의 자유도가 높아질수록 통제 장치가 중요해진다고 강조했다. 시스템에 접근해 코드를 수정하거나 외부 네트워크를 호출하고, 내부 데이터를 외부로 전송하는 등 예상치 못한 문제가 발생할 수 있기 때문이다. 이를 방지하기 위해 엔비디아가 제시한 것이 네모 클로다. 그는 "에이전트가 데이터를 아카이빙하고 있는 만큼 민감한 정보가 있을 수 있는데, 예를 들어 '주식 리포트를 찾아 메일로 보내달라'고 했을 때 그대로 외부 전송이 이뤄지면 안 되는 경우도 있다"고 말했다. 이어 "이런 상황을 막기 위해 정책과 제한을 두고 그 규칙 안에서만 에이전트가 움직이도록 하는 것이 네모 클로의 핵심"이라고 설명했다. 정 팀장에 따르면 네모 클로는 오픈 클로를 대체하는 개념이라기보다, 이를 엔터프라이즈 환경에서 안정적으로 운영할 수 있도록 가드레일과 정책 제어 기능을 덧댄 프레임워크에 가깝다. 네트워크 접근, 시스템 호출, 특정 스킬 사용 등을 사전에 정의된 정책에 따라 제한함으로써 기업이 보다 안심하고 에이전트를 도입할 수 있도록 돕는다는 것이다. 로컬 AI 특화 하드웨어 'DGX 스파크'…24시간 일하는 AI 직원 이번 시연은 모두 DGX 스파크를 기반으로 진행됐다. DGX 스파크는 CPU와 GPU가 공유 메모리를 사용하는 구조를 바탕으로 대규모 언어 모델(LLM) 배포에 활용할 수 있는 메모리 공간을 넓힌 로컬 AI 개발 장비다. 외부 API에 의존하지 않고도 비교적 큰 모델을 엣지 환경에서 구동할 수 있어 상시 운영 비용을 줄일 수 있다는 게 엔비디아 측 설명이다. 정 팀장은 네모트론 1200억개 매개변수(120B)급 모델 구동은 물론 소형 모델의 학습·파인튜닝과 로보틱스용 강화학습 같은 작업에도 활용할 수 있다고 소개했다. 제품은 엔비디아가 직접 판매하는 것을 비롯해 에이수스(ASUS)와 기가바이트(GIGABYTE)가 최적화한 버전으로도 공급되며, 1TB와 5TB급으로 구성됐다. 정 팀장은 "오픈 클로 자체는 작은 장치에서도 구동할 수 있지만 엔터프라이즈 업무를 위해선 메인 에이전트에 쓰이는 LLM이 돌아야 한다"며 "GPU 자원이 없으면 외부 API를 붙여 쓸 수 있지만 상시 구동 모델은 비용이 커질 수 있다"고 설명했다. 그러면서 엣지 환경에서 비교적 큰 모델을 구동하며 비용을 절감할 수 있는 장비 수요가 있다고 강조했다. 이어 "CPU와 GPU가 공유 메모리를 사용하기 때문에 LLM 배포 시 활용할 수 있는 메모리 공간이 크고, 그래서 더 큰 모델을 돌릴 수 있다"고 소개했다. 또 그는 "네모트론 120B 같은 큰 모델도 해당 단말에서 구동할 수 있도록 구성돼 있다"며 "작은 모델은 학습이나 파인튜닝도 가능하고, 로봇 분야에서는 강화학습이나 소형 VLA 모델 튜닝에도 활용할 수 있다"고 덧붙였다.

2026.04.21 18:22남혁우 기자

[현장] "한국형 AI 생태계 지원"… 엔비디아, 네모트론 개발자 데이 서울 2026 개최

전 세계 국가와 산업계가 자국 언어와 문화, 산업적 특성을 반영한 자체 데이터 기반의 맞춤형 AI 모델 확보에 속도를 내고 있다. 이런 흐름에 따라 엔비디아가 국내 환경에 최적화된 인공지능(AI) 생태계 구축을 위한 방향과 핵심 기술을 제시했다. 엔비디아는 21일부터 22일까지 서울 디캠프 마포(d·camp)에서 '엔비디아 네모트론 개발자 데이 서울 2026'을 개최했다. 한국에서 처음 열린 네모트론 개발자 데이는 연례 개발자 컨퍼런스인 GPU 테크놀로지 컨퍼런스(GTC)에서 진행해 온 행사다. 엔비디아는 이번 행사를 통해 우리나라 환경에 맞는 AI 생태계 구축 방안과 이를 실현할 혁신적인 오픈 모델, 데이터셋, 개발 도구를 집중적으로 선보였다. "효율성이 곧 지능"… 에이전트 AI 시대 겨냥한 네모트론 전략 브라이언 카탄자로 엔비디아 딥러닝 응용 연구 부문 부사장은 AI 산업이 단순 질의응답형 챗봇을 넘어 스스로 추론하고 도구를 활용하는 에이전트 AI 시대로 빠르게 이동하고 있다고 진단했다. 그는 에이전트를 단순한 하나의 모델이 아니라 메모리, 멀티모달 기능, 파일 및 메시징 도구 접근, 컴퓨터 활용 능력, 여러 에이전트의 조합까지 포함하는 시스템으로 설명했다. 이에 따라 앞으로의 AI 경쟁력은 개별 모델 성능뿐 아니라 이를 얼마나 효율적으로 조합하고 운영하느냐에 달려 있다고 강조했다. 카탄자로 부사장은 "프리사이즈 의류가 모두에게 꼭 맞을 수 없듯, 하나의 획일화된 범용 모델이 모든 상황과 요구를 충족시키기는 어렵다"며 "각자의 데이터와 업무 환경에 맞춘 특화 모델이 필요하다"고 강조했다. 이어 "효율성이 곧 지능"이라며 제한된 컴퓨팅 자원 안에서 더 높은 성능을 구현하려면 하드웨어와 소프트웨어를 함께 최적화하는 공동 설계(Co-design)가 중요하다고 설명했다. 엔비디아는 이런 흐름에 맞춰 네모트론을 단순한 대규모언어모델(LLM)이 아니라 개방형 AI 모델 패밀리로 확장하고 있다. 베이스 모델과 포스트트레이닝 모델은 물론, 프리트레이닝 및 포스트트레이닝 데이터셋, 연구 기법, 하이퍼파라미터, 소프트웨어까지 함께 공개·공유하는 방식으로 생태계를 넓히겠다는 구상이다. 카탄자로 부사장은 차세대 GPU '블랙웰(Blackwell)'과 저정밀 연산 기술인 'NVFP4'도 언급했다. 그는 블랙웰이 전문가혼합(MoE) 모델 추론에서 이전 세대 대비 최대 55배 빠른 성능을 기록했으며, NVFP4는 숫자당 4.75비트 수준의 초저정밀 연산을 통해 전력 부담을 낮추면서도 정확도를 유지하는 데 기여한다고 설명했다. 데이터 품질이 AI 성능 좌우… 합성 데이터·큐레이션 도구 소개 메흐란 마구미 엔비디아 수석 딥러닝 엔지니어는 AI 모델 개발에서 데이터 품질과 다양성, 프라이버시, 비용 효율성이 갈수록 중요해지고 있다고 강조했다. 그는 인터넷 데이터만으로는 특정 국가와 산업에 적합한 모델을 만들기 어렵다며 합성 데이터와 데이터 변환 기술이 현지화된 AI 개발의 핵심이라고 설명했다. 완전히 새로운 데이터를 생성하는 방식뿐 아니라 기존 데이터를 목표 도메인에 맞게 변환하는 작업 역시 중요하다는 것이다. 이런 상황에 대응하기 위한 방안으로 마구미 엔지니어는 엔비디아의 오픈소스 도구인 '네모 데이터 디자이너'와 '네모 큐레이터'를 소개했다. 네모 데이터 디자이너는 합성 데이터를 처음부터 만들거나 기존 데이터를 특정 목적에 맞게 변환할 수 있도록 지원하는 도구다. 데이터 다양성 제어, 검증, 재현 가능한 데이터 파이프라인 구축에 초점이 맞춰져 있다. 네모 큐레이터는 대규모 데이터 정제와 중복 제거, 품질 필터링, 분류 작업을 확장성 있게 수행할 수 있도록 설계된 도구다. 특히 의미론적 중복 제거와 대규모 데이터 파이프라인 설계를 통해 모델 학습용 데이터 품질을 높이는 데 강점이 있다고 엔비디아는 설명했다. 엔비디아는 이들 도구를 통해 국내 개발자와 기업이 한국어 및 산업 특화 데이터 파이프라인을 보다 쉽게 설계하고, 데이터 생성부터 선별, 검증, 후속 학습까지 전 주기를 효율적으로 수행할 수 있을 것으로 기대하고 있다. "한국인 700만 명의 삶 담았다"… 한국 특화 페르소나 데이터셋 공개 한국 특화 생태계 조성을 위한 구체적 결과물도 공개됐다. 엔비디아 리서치의 김현우 연구원은 한국인의 문화와 현실을 반영한 '네모트론 페르소나 코리아(Nemotron Persona Korea)' 데이터셋을 발표했다. 김 연구원은 기존 글로벌 대형언어모델이 한국 사회를 묘사할 때 '40%가 샐러드를 즐겨 먹고 사과 과수원을 운영한다'는 식으로 직업, 거주지, 식습관, 가족 형태 등에서 왜곡된 인물상을 생성하는 문제가 있다고 지적했다. 잘못된 데이터 학습으로 인해 특정 지역 거주자 비율이 비현실적으로 높게 나오거나, 한국인의 생활상과 맞지 않는 직업 및 식문화가 과도하게 반영되고 있다는 설명이다. 이를 보완하기 위해 엔비디아는 통계청, 대법원, 국민건강보험 등 62개 통계 자료를 바탕으로 한국 사회의 분포와 문화적 특성을 반영한 합성 페르소나 데이터셋을 구축했다. 데이터셋 규모는 700만명 수준으로, 약 17억 토큰에 달한다. 김 연구원에 따르면 이 데이터셋은 연령, 성별, 지역, 혼인, 가족 구성, 주거 형태, 건강 지표 등 폭넓은 속성을 반영했다. 여기에 한국표준산업분류와 한국표준직업분류 체계를 적용해 8000개가 넘는 산업·직업 조합도 포함했다. 이름 데이터도 세대별 특성이 반영되도록 설계됐다. 엔비디아는 1940년대 이후 국내 이름 분포 데이터를 참고해 총 21만여개의 이름 데이터를 구성했으며, 이를 통해 세대별 정서와 시대상을 더 자연스럽게 반영할 수 있도록 했다. 김 연구원은 "페르소나 데이터셋은 단순한 인물 프로필 모음이 아니라 한국 사회의 분포와 문화적 맥락을 반영한 합성 데이터 생성 기반"이라며 "국내 개발자들이 보다 현실적인 사용자 시나리오와 서비스를 설계하는 데 도움이 될 것"이라고 설명했다. 또 해당 데이터셋은 개인식별정보를 포함하지 않는 합성 데이터 형태로 설계됐으며, 허용적 라이선스(CC BY 4.0)로 배포돼 국내 기업과 개발자들이 비교적 자유롭게 활용할 수 있도록 했다. 현장에선 기술 세션 외에도 개발자 실무 역량 강화를 위한 프로그램도 함께 진행됐다. 과학기술정보통신부와 정보통신산업진흥원(NIPA) 후원으로 마련된 패널 토론에서는 정부의 '독자 AI 파운데이션 모델' 프로젝트와 연계해 국내 통신사 및 AI 스타트업 관계자들이 K-AI 생태계의 경쟁력 확보 방안을 논의했다. 또 국내 혁신가들이 엔비디아 전문가들과 함께 48시간 동안 에이전틱 시스템과 산업 특화 모델을 구축하는 '네모트론 해커톤'도 마련됐다. GTC 2026에서 소개됐던 실습형 AI 에이전트 구축 데모 '빌드-어-클로(Build-a-Claw)' 팝업 이벤트도 한국에서 처음 운영돼 참가자들이 직접 에이전트 AI 개발 경험을 체험할 수 있도록 했다. 엔비디아는 이번 서울 행사를 계기로 국내 개발자 커뮤니티 및 기업과의 접점을 넓히고 협력 기반을 강화하겠다는 방침이다. 카탄자로 부사장은 "한국에는 수준 높은 AI 연구 조직과 기업이 다수 존재하며, 국내 기업들의 AI 추진 속도와 생태계 역동성이 매우 인상적"이라며 "이번 행사를 계기로 한국을 포함한 전 세계 생태계가 자체적인 AI 역량을 구축할 수 있도록 파트너십과 협업을 더욱 확대해 나가겠다"고 밝혔다.

2026.04.21 16:43남혁우 기자

엔비디아, 자율주행·로봇·신약 개발까지…차세대 오픈소스 AI 모델 공개

엔비디아가 로봇, 자율주행, 신약 개발 등에 활용되는 오픈소스 인공지능(AI) 모델 제품군을 공개했다. 엔비디아는 17일 미국 새너제이에서 열린 'GTC 2026'에서 새로운 오픈 모델 제품군을 발표했다. 이번 모델은 디지털 환경뿐 아니라 로봇, 자율주행차, 생명과학 연구 등 실제 산업 환경에서 활용할 수 있는 지능형 AI 시스템 구축을 목표로 한다. 먼저 에이전트형 AI 개발을 위한 '네모트론 3' 모델 제품군이 공개됐다. 해당 모델은 언어, 이미지, 음성을 동시에 이해하는 멀티모달 구조를 기반으로 자연스러운 대화와 복잡한 추론, 영상·문서 분석을 지원한다. 최상위 모델인 '네모트론 3 울트라'는 엔비디아 블랙웰 플랫폼에서 NVFP4 포맷을 활용해 최대 5배 높은 처리 효율을 제공한다. 코딩 지원, 검색, 업무 자동화 등 AI 애플리케이션 개발에 활용된다. 랭체인, 코드래빗, 퍼플렉시티, 서비스나우 등 기업들도 네모트론 모델을 활용한 에이전트형 AI 서비스를 개발하고 있다. 로봇과 자율주행차 개발을 위한 물리 AI 모델도 공개됐다. '코스모스 3'는 합성 세계 생성, 물리 AI 추론, 행동 시뮬레이션을 통합한 세계 기반 모델로 복잡한 환경에서 AI가 실제 행동을 학습하도록 지원한다. 휴머노이드 로봇용 모델 '아이작 그루트 N1.7'은 실제 환경에서 활용 가능한 수준으로 발전했다. 자율주행차용 모델 '알파마요 1.5'는 내비게이션 안내와 다중 카메라 인식 기능을 통해 차량의 상황 판단 능력을 강화한다. 젠슨 황 엔비디아 최고경영자(CEO)는 기조연설에서 차세대 로봇 파운데이션 모델 '그루트 N2'도 공개했다. 해당 모델은 새로운 세계 행동 모델 구조를 기반으로 기존 비전, 언어, 행동(VLA) 모델 대비 두 배 이상 높은 작업 성공률을 보인다고 설명했다. 헬스케어 분야에서는 AI 기반 신약 개발을 지원하는 모델도 공개됐다. '프로테이나 콤플렉사'는 단백질 결합 구조 설계를 지원하는 생성형 AI 모델로 구조 기반 신약 개발을 가속하는 데 활용된다. 노보 노디스크, 비바 바이오텍, 매니폴드 바이오 등 제약 기업들이 해당 모델을 활용해 단백질 설계 연구를 진행하고 있다. 엔비디아는 구글 딥마인드, 유럽생물정보연구소, 서울대학교와 협력해 알파폴드 단백질 구조 데이터베이스도 확대했다. 약 3천만 개의 단백질 복합체 예측 데이터를 계산했으며 이 가운데 약 170만 개의 고신뢰 단백질 구조 데이터를 추가했다. 또한 GPU 가속 시뮬레이션 엔진 'nvQSP'도 공개했다. 해당 기술은 임상시험 이전 단계에서 다양한 치료 시나리오를 컴퓨터 모델로 분석할 수 있도록 지원한다. 기존 CPU 기반 시뮬레이션 대비 최대 77배 빠른 성능을 제공한다. 엔비디아는 이번에 공개한 모델과 데이터, 프레임워크를 깃허브, 허깅페이스, 클라우드 AI 플랫폼 등을 통해 제공할 예정이다. 일부 모델은 '엔비디아 NIM' 마이크로서비스 형태로도 제공돼 엣지부터 클라우드까지 다양한 환경에서 활용할 수 있다. 카리 브리스키 엔비디아 생성형 AI 소프트웨어 부사장은 "오픈소스 AI는 글로벌 혁신의 핵심 동력이 됐다"며 "엔비디아의 오픈 모델 제품군은 언어를 넘어 생명과학, 로보틱스, 자율 기계 등 다양한 산업 영역에서 새로운 AI 혁신을 가능하게 할 것"이라고 말했다.

2026.03.17 10:45남혁우 기자

엔비디아, 오픈 모델 '네모트론 3' 시리즈 공개…"추론 속도 4배↑"

엔비디아가 에이전틱 인공지능(AI) 애플리케이션 구축을 위한 오픈 모델 제품군을 공개했다. 엔비디아는 오픈 모델과 데이터, 라이브러리로 구성된 '네모트론 3' 시리즈를 17일 발표했다. 네모트론 3는 '하이브리드 잠재 전문가 혼합(MoE)' 아키텍처로 대규모 멀티 에이전트 시스템 신뢰성을 높였다. 개발자는 이를 통해 통신 과부하와 맥락 이탈, 높은 추론 비용 등 기존 협업형 AI 시스템이 겪던 기술적 난제를 해결할 수 있다. 이 시리즈는 나노, 슈퍼, 울트라로 구성됐다. 네모트론 3 나노는 300억 개의 파라미터를 갖춘 소형 모델이다. 전 세대 대비 4배 높은 처리량을 갖췄다. 소프트웨어 디버깅이나 콘텐츠 요약 같은 작업에 최적화됐다. 추론 토큰 생성량을 최대 60%까지 줄일 수 있다. 내년 상반기 출시 예정인 슈퍼와 울트라 모델은 각각 1천억 개, 5천억 개의 파라미터를 탑재했다. 해당 시리즈는 엔비디아 블랙웰 아키텍처 기반의 고효율 훈련 포맷으로 이뤄져 메모리 요구 사항을 줄이면서도 훈련 속도를 높일 수 있다. 엔비디아는 이번 제품군을 통해 각국 조직이 데이터와 규제, 가치에 부합하는 소버린 AI를 구축하도록 적극 지원한다고 밝혔다. 이미 서비스나우, 퍼플렉시티, 지멘스 등 글로벌 기업들이 네모트론 모델을 자사 워크플로에 통합해 제조, 보안, 미디어 등 다양한 산업 분야에서 활용 중이다. 이날 엔비디아는 전문화된 에이전트 구축을 돕기 위해 3조 개 토큰으로 구성된 훈련 데이터셋과 '네모 짐' 등 오픈소스 라이브러리도 공개했다. 모든 도구와 데이터셋은 깃허브와 허깅 페이스를 통해 즉시 이용 가능하다. 젠슨 황 엔비디아 최고경영자(CEO)는 "오픈 혁신은 AI 발전의 토대"라며 "네모트론을 통해 첨단 AI를 개방형 플랫폼으로 전환하고, 개발자들이 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하겠다"고 밝혔다.

2025.12.17 14:37김미정 기자

[인터뷰] 줌 "화상회의 플랫폼 넘어서…AI로 모든 업무 환경 지원"

[샌프란시스코(미국)=김미정 기자] "우리는 더이상 화상회의 플랫폼만 제공하지 않습니다. 인공지능(AI) 기술을 앞세워 회의를 비롯한 전화, 채팅, 컨택센터, 문서 협업 기능을 통합 제공합니다. 이를 통해 고객이 줌에서 논의한 내용을 실제 비즈니스 결과로 이어질 수 있도록 돕는 것이 목표입니다." 벨챠미 샨카르링암 줌 프로덕트 및 엔지니어링 부문 사장은 최근 미국 샌프란시스코 산호세 본사에서 진행한 그룹 인터뷰를 통해 사업 전략을 이같이 밝혔다. 단순 화상회의 플랫폼에서 업무 전반을 책임지는 플랫폼으로 패러다임을 바꾸겠다는 포부다. 최근 줌은 플랫폼 새 버전 'AI 컴패니언 3.0'을 공개했다. 이번 버전은 회의 요약뿐 아니라 대화 내용 바탕으로 업무 실행까지 자동화하는 에이전틱 AI 형태다. AI가 단순히 업무를 제안하는 수준을 넘어 실제 행동을 수행하는 단계로 진화한 것이다. AI 컴패니언 3.0의 에이전틱 AI 기능 중심에는 '페더레이티드 AI'가 있다. 이 시스템은 업무 성격과 결과물 품질 요구에 따라 가장 적합한 모델을 자동 선택하는 분산형 프레임워크다. 줌 거대언어모델(LLM)와 소형모델(SLM)과 오픈AI, 앤트로픽 등 주요 AI 모델로 구성됐다. 예를 들어 회의 요약 같은 단순 업무는 SLM으로 처리하고, 결과물 품질이 충분치 않으면 고성능 모델로 자동 전환하는 식이다. 페더레이티드 AI의 또 다른 장점은 AI 연산이 어디에서 이뤄질지 기업이 직접 정할 수 있다는 것이다. 보안이 중요한 데이터는 온프레미스에서 처리하고, 대규모 분석이 필요한 작업은 클라우드 환경에서 수행 가능하다. 샨카르링암 사장은 "기업이 AI 연산 위치를 나눠 관리하면 데이터 보안을 지키면서도 클라우드 확장성·속도를 맞춤형으로 조절할 수 있다"고 강조했다. 줌은 최근 엔비디아의 오픈소스 모델 시리즈 '네모트론'를 추가 통합하는 작업을 진행 중이다. 그는 "네모트론까지 시스템에 추가하면 플랫폼 성능과 품질, 비용 균형을 지금보다 더 완벽히 잡을 수 있을 것"이라고 내다봤다. "클라우드 전화 고객 1천만 명 달성" 줌은 회의 플랫폼을 넘어 클라우드 전화 시장에서도 성과를 냈다고 강조했다. 대표 솔루션은 '줌 폰'이다. 이 솔루션은 클라우드 음성 통신 서비스다. 회의나 메시징, 컨택센터를 하나로 통합한 글로벌 통신 플랫폼이다. 현재 전 세계 1천만 명 이상이 줌 폰을 사용하고 있다. 줌 폰은 AI 기반 통화 요약과 음성 메시지 자동 분류 기능 등을 지원한다. 통화가 끝나면 AI가 대화 내용을 요약하고, 중요도에 따라 메시지를 분류한다. 해당 기능은 기존 구독 요금제에 포함돼 추가 비용 없이 제공된다. 샨카르링암 사장은 회의 솔루션에 이어 줌 폰을 두 번째 핵심 사업 축으로 육성하고 있다고 강조했다. 그는 "향후 통합 커뮤니케이션 전반에 AI 기능을 결합해 대화에서 업무 실행으로 이어지는 비즈니스 경험을 제공하는 것을 전략 목표로 정했다"고 말했다. 샨카르링암 사장은 줌 폰의 가장 큰 기술 차별점으로 '복원력'을 꼽았다. 그는 "우리는 전 세계에 다중 데이터센터를 운영하며 특정 클라우드 사업자에 단일 의존하지 않는 구조를 갖췄다"고 강조했다. 이어 "서비스 장애나 트래픽 폭주 상황 속에서도 안정적인 통화 품질을 유지할 수 있다"고 덧붙였다. 그는 줌 폰의 '서바이버빌리티 모드'도 주요 기능으로 소개했다. 이 기능은 병원이나 공항처럼 네트워크 연결이 끊기는 비상 상황에서 로컬 가상머신(VM)을 자동 실행하는 역할을 맡는다. 이를 통해 내부 통신이 중단 없이 지속될 수 있다. 그는 "통신 장애 복구와 자동 전환 기능이 플랫폼의 설계 단계부터 깊이 내장됐다"고 강조했다. "하이브리드 업무 핵심 되겠다" 샨카르링암 사장은 팬데믹이 끝난 뒤에도 회의 솔루션 수요는 여전히 높다고 강조했다. 다만 수요 형태가 원격 참여에서 회의실 중심의 협업 형태로 바뀌고 있다고 분석했다. 또 온라인과 오프라인이 혼합된 하이브리드 근무 환경이 늘었다고 봤다. 그는 "팬데믹 당시 다수 직원이 재택근무를 했지만, 지금은 각 기업이 상황에 맞는 하이브리드 근무 방식을 도입하고 있다"고 설명했다. 이어 "하이브리드 업무 환경은 기존 근무 형태보다 훨씬 복잡하다"며 "기업마다 업무 방식이 모두 다르고, 심지어 팀 단위로도 근무 정책이 다르기 때문"이라고 설명했다. 샨카르링암 사장은 이처럼 다양해진 근무 환경을 모두 지원할 수 있는 플랫폼을 구축하는 것이 목표라고 재차 강조했다. 그는 "우리는 오프라인과 온라인을 오가는 사용자 생산성을 높이는 데 집중하고 있다"며 "어떤 형태 근무 환경이든 AI 컴패니언과 줌 폰 등 통합 플랫폼을 통해 지원하겠다"고 밝혔다.

2025.11.02 12:00김미정 기자

줌, 엔비디아 '네모트론' 도입…기업 맞춤 추론 '강화'

줌이 엔비디아 손잡고 기업 맞춤형 인공지능(AI) 추론 기능을 업그레이드했다. 줌은 엔비디아의 오픈 모델 기술 '네모트론'을 연합형 AI 아키텍처에 통합했다고 28일 밝혔다. 이를 통해 줌 'AI 컴패니언 3.0'의 적용 범위를 금융·의료·공공 등 다양한 산업군으로 확장할 방침이다. 줌의 연합형 AI 아키텍처는 작업 특성에 따라 최적의 언어 모델을 자동 선택해 처리하는 하이브리드 구조다. 빠른 응답과 품질을 위해 자체 소규모 언어 모델(SLM)과 거대언어모델(LLM)을 유기적으로 결합하는 방식으로 이뤄졌다. 이번 통합으로 줌 AI 컴패니언은 엔비디아의 인프라와 다양한 모델을 활용할 수 있게 됐다. 줌은 "우리는 서비스 기능을 강화하면서도 비용 부담을 낮췄다"며 "고객은 더 정교하고 유연한 AI 지원을 받을 수 있다"고 강조했다. 엔비디아의 생성형 AI 개발 도구 '네모'를 기반으로 설계된 줌의 LLM은 약 490억 개 파라미터 규모로 이뤄졌다. 이 모델은 속도와 정확도, 비용 효율 균형을 목표로 개발됐으며, 개방형과 폐쇄형 모델의 강점을 모두 결합한 것으로 평가받고 있다. 기업과 공공기관은 이를 통해 더 빠른 워크플로와 고도화된 추론 능력을 경험할 수 있다. 줌은 이번 협업으로 연합형 AI 아키텍처의 완성도를 높였다고 강조했다. 특히 라마와 네모트론을 기반으로 한 고도화 추론 모델을 결합해 정확도·성능·비용 효율을 동시에 실현했다는 입장이다. 회의 기록·요약·번역 등 주요 기능에서 이미 검증된 AI 접근법에 엔비디아 기술을 더해 확장성을 높였다는 점도 알렸다. 줌은 AI 컴패니언이 마이크로소프트 365, 팀즈, 구글 워크스페이스, 슬랙, 세일즈포스, 서비스나우 등 주요 비즈니스 플랫폼과 연동된다고 밝혔다. 이를 통해 보안성과 확장성을 모두 확보한 고성능 AI 경험을 빠르게 고객에게 제공할 방침이다. 쉐동 황 줌 최고기술책임자(CTO)는 "엔비디아의 그래픽처리장치(GPU)와 AI 스택을 활용해 모델 선택 속도와 비용 효율성을 높였고 시장 출시 속도도 향상됐다"며 "네모트론 오픈 기술을 통해 검색증강생성(RAG) 기능 개발이 가속화됐다"고 말했다. 카리 브리스키 엔비디아 부사장도 "줌과의 협업은 이제 시작에 불과하다"며 "앞으로 더욱 스마트하고 효율적인 AI 추론 기술을 제공해 나갈 것"이라고 밝혔다.

2025.10.29 06:38김미정 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

유럽 최대 AI 기업도 미국에 의존…'소버린 AI'는 가능한가

[ZD브리핑] 기름값 묶자 소비 늘었다?…최고가격제 ‘연장 논쟁’

콧대 높던 패션 브랜드 변했다...네이버·쿠팡 멀티채널 본격화

삼성 파운드리 4나노 내년까지 '풀부킹'…하반기 흑자전환 시동

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.