검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'엔비디아 네모'통합검색 결과 입니다. (18건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

"AI가 칩 설계부터 검증까지"…엔비디아, 엔지니어링 에이전트 고도화

엔비디아가 인공지능(AI) 에이전트 활용 범위를 전문 엔지니어링 업무로 확장한다. 엔비디아는 엔지니어링용 '엔비디아 에이전트 툴킷'에 피직스네모와 쿠다-X 라이브러리를 추가했다고 28일 밝혔다. 개발자는 이를 활용해 물리학 기반으로 추론하고 복잡한 시뮬레이션을 실행하는 AI 에이전트를 구축할 수 있다. 엔비디아 에이전트 툴킷은 특정 산업 도구와 모델, 데이터를 연결한 전문 AI 보조도구를 개발할 수 있도록 지원한다. 이번 업데이트로 AI 에이전트가 물리학 모델과 수치해석 솔버, 양자화학 기술을 직접 호출해 활용할 수 있게 됐다. 피직스네모는 AI 물리 모델을 학습하고 배포하는 데 필요한 기술을 제공한다. 모델 구조를 엔지니어링 업무에서 바로 호출할 수 있는 도구로 전환해 복잡한 설계와 시뮬레이션에 활용하도록 지원한다. 쿠다-X에는 반복형 스파스 솔버 ;엔비디아 cuISS'와 직접형 스파스 솔버 '엔비디아 cuDSS'가 포함됐다. 물리·엔지니어링 시뮬레이션과 전자설계자동화 과정에서 발생하는 대규모 선형 계산을 그래픽처리장치(GPU)로 가속하는 기술이다. 양자화학 라이브러리 '엔비디아 cuEST'는 고정밀 양자화학 시뮬레이션을 대규모 생산 업무에 적용할 수 있도록 지원한다. 밀도범함수이론과 후속 계산 기법을 활용해 반도체 소자와 소재 개발에 필요한 기저 상태·여기 상태 시뮬레이션을 처리한다. 엔비디아는 칩 설계와 검증을 위한 AI 모델도 강화했다. 하드웨어 설계 에이전트 '에이스-아르티엘'을 탑재한 '네모트론 3 울트라'는 레지스터 전송 수준(RTL) 코딩 성능을 측정하는 종합 베릴로그 설계 문제 벤치마크에서 오픈 모델 가운데 가장 높은 성능을 기록했다. 기업은 자체 데이터로 네모트론 3 울트라를 추가 학습하고 내부 서버나 온프레미스 환경에 배포할 수 있다. 이를 통해 칩 설계용 AI 에이전트를 맞춤화하면서 설계 데이터에 대한 통제권과 보안을 확보할 수 있다는 설명이다. 특히 삼성은 '쿠리소'와 쿠다-X를 활용해 계산 리소그래피 성능을 최대 20배 높였다고 밝힌 바 있다. 피직스네모를 적용해 최대 100억개 셀로 구성된 칩 규모에서도 수치해석 솔버 수준의 정확도를 갖춘 열응력 분석을 수행하고 있다. 티모시 코스타 엔비디아 컴퓨테이셔널 엔지니어링 부문 부사장 겸 총괄 매니저는 "이제 AI는 물리학, 시뮬레이션, 설계 도구를 작업에 활용할 수 있다"며 "엔비디아 에이전트 툴킷을 통해 개발자는 물리학을 기반으로 추론하고 복잡한 시뮬레이션을 실행하며 고품질 데이터를 생성하는 에이전틱 엔지니어를 구축할 수 있다"고 밝혔다.

2026.07.28 11:13김미정 기자

엔비디아-팔란티어, 美 정부용 보안 AI 구축…'네모트론' 적용

엔비디아가 팔란티어와 손잡고 개방형 인공지능(AI) 모델로 미국 정부기관과 핵심 인프라 운영자를 위한 보안형 AI 구축에 나섰다. 엔비디아는 29일(현지시간) 공식 블로그를 통해 "팔란티어가 새 지능형 엔진에 엔비디아 네모트론 오픈모델을 적용해 미국 정부기관 수요에 대응한다"고 밝혔다. 이 엔진은 엔비디아 가속 컴퓨팅 기반 에어갭 환경에서 운영되도록 설계됐다. 에어갭 환경은 보안되지 않은 네트워크와 완전히 분리된 폐쇄형 인프라를 의미한다. 팔란티어는 이 환경에 네모트론 오픈모델을 도입해 정부기관이 자체 인프라에서 모델을 실행하고 자체 데이터로 학습시킬 수 있도록 돕는다. 이번 협력의 핵심은 오픈모델을 민감한 정부 업무에 맞게 조정하면서도 데이터와 모델 통제권을 기관 내부에 남겨두는 데 있다. 기관과 운영자는 학습 결과로 만들어진 모델뿐 아니라 운영 지식을 담은 가중치까지 소유할 수 있다. 팔란티어는 협력을 통해 자사 소버린 AI 운영체제를 적용할 방침이다. 이 운영체제는 AIP, 온톨로지, 파운드리, 아폴로 기반으로 구성됐다. 민감한 환경에서 AI를 배포하기 위한 운영 계층과 데이터 권한 관리 계층을 담당한다. 팔란티어 소버린 AI 운영체제는 명시적 데이터 권한 부여를 비롯한 아키텍처 기반 격리, 전체 감사 가능성을 핵심 구조로 갖췄다. 맞춤형 모델은 실제 운영 과정에서 새 데이터와 피드백을 반영해 기관 내부 환경에서 지속적으로 개선될 수 있다. 엔비디아는 "미국 정부 업무 상당수가 상업, 에너지, 헬스케어, 농업, 교육, 교통 등 민간 기업 영역과 유사하다"며 "직원이 약 300만 명 수준인 미국 정부는 사실상 세계 최대 규모 기업 중 하나로 볼 수 있다"고 설명했다. 엔비디아는 AI가 식품 안전 관리부터 주간 고속도로 인프라 안전 유지까지 다양한 공공 업무 복잡성을 줄이고 생산성을 높이는 데 쓰일 수 있다고 봤다. 특히 폐쇄형 환경에서 모델을 직접 운영하면 국가 안보와 핵심 인프라 분야에서 보안 요구를 맞출 수 있다는 설명이다. 엔비디아는 또 오픈모델 장점으로 투명성과 맞춤화, 통제권, 비용 절감을 꼽았다. 연구자들이 오픈모델을 독립적으로 검토해 취약점과 편향, 의도하지 않은 동작을 찾아낼 수 있고 기업과 정부가 각자 업무에 맞게 모델을 조정할 수 있다고 엔비디아는 밝혔다. 엔비디아는 "우리 협력은 미국 정부기관과 기업 모두를 위한 미국 기술 리더십을 강화할 것"이라고 강조했다.

2026.06.30 09:44김미정 기자

트릴리온랩스, 엔비디아 기술 입혀 AI 팩토리용 월드모델 만든다

트릴리온랩스가 자체 파운데이션 모델 기술을 엔비디아 인공지능(AI) 팩토리, 디지털 트윈, 피지컬 AI 생태계와 결합한 산업 월드모델을 만든다. 전 세계적으로 빠르게 성장하는 AI 인프라 시장에서 새로운 산업 지능 분야를 개척한다는 목표다. 트릴리온랩스는 엔비디아 옴니버스 라이브러리와 엔비디아 네모트론 오픈 모델을 기반으로 한 AI 팩토리용 '산업 월드모델' 개발에 착수했다고 8일 밝혔다. 산업 월드모델은 AI 데이터센터와 발전소 등 복잡한 산업 환경을 AI가 이해하고 시뮬레이션해 운영을 최적화할 수 있도록 설계된 모델이다. 트릴리온랩스는 엔비디아 옴니버스의 물리 기반 시뮬레이션 기술과 엔비디아 네모트론의 추론 역량을 활용해 차세대 AI 팩토리를 위한 지능 계층을 구축하고 있다. 이를 통해 AI가 특정 의사결정이나 운영 방식이 가져올 결과를 사전에 예측하고 운영자의 의사결정을 지원할 수 있도록 한다는 계획이다. 트릴리온랩스는 거대언어모델(LLM)과 비전언어모델(VLM)을 포함한 파운데이션 모델을 프롬 스크래치 방식으로 개발해 왔다. 최근엔 물리적 환경을 이해하는 월드모델 연구로 영역을 확장했다. 또 모델 학습부터 추론, 배포, 운영에 이르는 AI 전 주기 기술 역량을 바탕으로 실제 산업 환경에 최적화된 AI 모델을 개발 중이다. GS그룹을 비롯한 다양한 산업 분야 기업과 에너지 및 산업 인프라 관련 협력을 진행하고 있다. 신재민 트릴리온랩스 대표는 "AI 다음 단계는 언어를 넘어 실제 세계를 이해하고 추론하는 것"이라며 "산업 월드모델을 통해 핵심 인프라를 이해하고 최적화하는 새로운 산업 지능의 기반을 구축하겠다"고 말했다.

2026.06.08 14:39이나연 기자

[AI는 지금] 네이버, 엔비디아 기술로 AI 고도화…"모델 독자성 유지 관건"

네이버가 인공지능(AI) 모델 고도화와 소버린 AI 사업를 위해 엔비디아와 협력 범위를 넓힌다. 그래픽처리장치(GPU) 공급망 중심이던 양사 관계가 초거대 AI 모델과 피지컬 AI 영역까지 확대되면서 네이버의 독자 AI 전략도 새 국면을 맞은 모습이다. 8일 IT 업계에 따르면 네이버가 엔비디아 손잡고 자체 초거대 AI 모델 고도화와 소버린 AI 사업 확대에 나선다. 이를 통해 한국어와 국내 산업 환경에 맞춘 AI 서비스를 강화하고 피지컬 AI까지 협력 범위를 넓힐 방침이다. 이번 협력으로 네이버는 엔비디아 AI 모델 '네모트론'과 AI 개발 기술로 '하이퍼클로바X'를 고도화할 계획이다. 네모트론은 엔비디아 오픈형 AI 모델이다. 가장 최근 공개된 버전은 이달 초 공개된 '네모트론 3 울트라'다. 이 모델은 장시간 작동하는 에이전트가 더 빠르게 작업을 완료하고 비용을 낮추도록 돕는 오픈 모델로 평가받고 있다. 네이버는 엔비디아 오픈 모델 생태계 '네모트론 연합'도 참여한다. 양사는 사전학습과 후속학습, 강화학습 분야에서 공동 연구·개발을 진행할 예정이다. 네이버는 엔비디아 피지컬 AI용 월드 모델 '코스모스'를 활용해 도시와 로봇 산업 현장을 가상 공간에서 이해하고 시뮬레이션할 수 있는 월드 모델 구축을 추진한다. 월드 모델은 스마트시티와 로보틱스 산업 자동화 분야에서 AI 활용을 넓히는 기반 기술로 꼽히고 있다. 네이버는 이를 통해 피지컬 AI 영역에서도 엔비디아와 협력을 확대할 계획이다. 라즈 미르푸리 엔비디아 글로벌 AI 클라우드 및 인프라 생태계 부문 부사장은 "AI가 실험 단계를 넘어 실제 서비스 단계로 진입하면서 AI 컴퓨팅 수요가 폭발적으로 증가하고 있다"며 "네이버와 한국 소버린 AI와 차세대 AI 생태계 구축을 가속할 것"이라고 밝혔다. 업계 "네이버, 자체 모델 경쟁력 지켜야" 업계에선 네이버가 엔비디아 AI 생태계에 잠식되선 안 된다는 당부 목소리도 나오고 있다. 네이버가 엔비디아 그래픽처리장치(GPU)를 활용하는 주요 고객인 동시에 엔비디아 모델 생태계와 협력을 넓힐 경우 장기적으로 독자 AI 모델 개발 전략에 영향받을 수 있다는 이유에서다. 익명을 요청한 국내 AI 업계 관계자는 "네이버도 결국 엔비디아 고객"이라며 "네이버가 협력을 잘 활용하면 좋은 일이 될 수 있지만 자칫하면 독자 AI 모델 기술력이 약화될 수 있다"고 말했다. 이어 "엔비디아가 네모트론을 앞세워 글로벌 AI 생태계를 확장하는 상황에서 네이버가 자체 모델 경쟁력을 얼마나 유지할 수 있을지가 관건"이라며 "기업 내부에서 엔비디아 모델을 활용해 학습이나 포스트트레이닝이 이뤄질 경우 그 결과물인 가중치 소유권과 활용권을 어떻게 정리할지도 문제"라고 덧붙였다. 또 다른 관계자는 "젠슨 황 엔비디아 최고경영자(CEO)가 이번 방한에서 인프라뿐 아니라 피지컬 AI·월드 모델 등 소프트웨어 영업에도 박차를 가하고 있다"며 "우리가 엔비디아 생태계를 누리는 대신, 일정한 반대급부도 고민해야 할 것"이라고 내다봤다.

2026.06.08 11:05김미정 기자

네이버클라우드, 국내 기업 최초 엔비디아 AI 개발 연합체 참여

네이버클라우드가 엔비디아 주도의 오픈 프런티어 인공지능(AI) 모델 생태계인 '네모트론 연합(Nemotron Coalition)'에 합류한 것이 확인됐다. 한국 기업이 해당 연합체에 참여하는 것은 이번이 처음이다. 엔비디아는 4일(현지시간) 자사 공식 블로그를 통해 네이버클라우드가 H 컴퍼니, 누스 리서치, 프라임 인텔렉트와 함께 네모트론 연합에 합류했다고 발표했다. 네모트론은 엔비디아의 개방형 거대언어모델(LLM)로, LLM을 비롯해 시각언어모델(VLM)·비디오모델·음성 AI 등 다양한 생성형 AI 개발 및 고도화에 활용된다. 엔비디아는 이를 기반으로 개방형 AI 생태계를 확대하기 위해 지난 3월 네모트론 연합을 출범했다. 연합체 참여 기업들은 데이터, 학습 환경, 평가 프레임워크, 도메인 전문성 등을 제공하며 엔비디아 DGX 클라우드에서 학습되는 차세대 오픈 프런티어 모델 개발에 참여한다. 이렇게 개발되는 모델은 향후 공개될 네모트론 4 제품군의 기반이 될 예정이다. 미스트랄·퍼플렉시티·랭체인·블랙 포레스트 랩스 등 글로벌 AI 기업 8곳이 네모트론 연합에 처음 합류한 데 이어 이날 4개 기업이 추가되면서 연합체 참여 기업은 총 12곳으로 늘었다. 네이버클라우드가 네모트론 연합에 참여하게 되면서 엔비디아를 비롯한 글로벌 AI 기업들과 모델 개발 및 평가 과정에서 협력을 확대하게 됐다. 네이버클라우드가 연합체에 국내 기업 중 유일하게 이름을 올린 배경엔 AI 인프라부터 모델, 서비스까지 직접 운영해 온 풀스택 역량이 주효했을 것으로 보인다. 오픈AI와 구글, 앤트로픽 등 글로벌 빅테크가 자사 모델을 비공개로 개발하는 것과 달리, 네모트론 연합은 오픈 생태계를 기반으로 프런티어 모델 개발을 공유하는 방식을 택하고 있다. 참여 기업들은 데이터와 평가 체계, 학습 환경 등을 공동으로 구축하는 만큼 모델 개발 역량과 연구 성과를 지속적으로 검증받게 된다. 업계에선 네이버클라우드가 이번 참여를 계기로 자체 생성형 AI 모델인 '하이퍼클로바X'의 성능 고도화와 글로벌 범용성 확보에 속도를 낼 것으로 내다본다. 실제 네이버클라우드의 최신 하이퍼클로바X 모델은 동일 규모의 네모트론 모델 성능을 상회하는 것으로 알려졌다. 네이버클라우드는 텍스트를 넘어 이미지와 음성 등을 통합 처리하는 옴니 모델 방향성을 강화하는 동시에 차세대 프런티어 모델 개발 이후 경량화 모델군을 확장할 예정이다. 성낙호 네이버클라우드 하이퍼스케일 기술 총괄은 "네모트론 연합 참여로 엔비디아와의 기술 파트너십이 한층 공고해졌다"며 "글로벌 최고 수준의 기술력에 도메인 특화 강점을 결합해 모델 고도화에 집중할 것"이라고 말했다.

2026.06.05 08:50이나연 기자

[AI리더스] "존댓말 어려운 AI"…엔비디아가 제시한 해법은

"영어 데이터 중심으로 훈련된 인공지능(AI) 모델은 존댓말을 비롯해 지역별 특색이나 생활 맥락 등을 충분히 이해하지 못하는 경우가 많습니다. 한국 사용자에게 신뢰도 높은 AI 서비스를 제공하려면 한국어와 문화, 산업 데이터에 기반한 새로운 모델과 데이터 생태계를 마련해야 합니다." 정구형 엔비디아코리아 솔루션 아키텍트 팀장은 2일 글로벌 AI 모델의 한계를 짚으며, 한 국가가 자체 데이터와 인프라를 바탕으로 AI 주권을 갖는 '소버린 AI(Sovereign AI)'의 중요성을 강조했다. 그는 한국 사용자에게 신뢰도 높은 AI 서비스를 제공하려면 단순히 한국어를 지원하는 수준을 넘어 한국의 언어와 문화, 산업 구조를 반영한 데이터와 개발 생태계가 함께 구축돼야 한다고 밝혔다. 영어 중심 글로벌 모델 한계…'한국 사회 맥락 반영해야' 정 팀장은 '엔비디아가 정의하는 소버린 AI는 단순한 번역이나 모델 현지화를 넘어선 개념'이라며 '한 국가가 자체 인프라와 데이터, 인재, 산업 네트워크를 기반으로 자국의 문화와 데이터 거버넌스를 반영한 AI를 직접 개발·운영할 수 있는 역량을 뜻한다'고 설명했다. 이는 한국어와 한국의 문화적 맥락, 산업별 활용 사례를 국내 개발자와 기업이 주도적으로 구현할 수 있어야 한다는 의미다. 그는 '한국은 정부의 K-AI 프로젝트와 민간 파운데이션 모델 개발이 동시에 진행되는 역동적인 시장이지만, 영어권 데이터 중심 글로벌 모델의 한계 역시 뚜렷하게 나타나는 곳'이라고 평가했다. 한국 특유의 존댓말 체계와 지역별 직업 패턴, 공공·의료 맥락 등을 충분히 이해하지 못해 실제 서비스 적용 과정에서 부정확한 답변이나 정보가 제공될 수 있다는 설명이다. 정 팀장은 "예를 들어 글로벌 대형언어모델(LLM)을 활용해 한국인 페르소나를 묘사해 보면, 직업이나 거주지, 식습관, 가족 형태 등을 실제와 다르게 그려내기도 한다"며 "이는 영어권 웹 데이터를 중심으로 학습한 모델이 한국 사회의 실제 분포와 생활상을 충분히 반영하지 못한 결과"라고 지적했다. 이어 "국내 사용자에게 신뢰도 높은 서비스를 제공하려면 한국의 언어와 문화, 산업 데이터에 기반한 고유의 데이터 생태계 구축이 필수적'이라며 "엔비디아는 이를 위해 가속 컴퓨팅과 네모트론 오픈 모델, 데이터셋, 훈련 레시피, 네모(NeMo) 라이브러리 등 풀스택 플랫폼을 제공해 국내 개발자들이 훈련부터 평가, 배포까지 전 과정을 더 빠르게 수행할 수 있도록 지원하고 있다"고 소개했다. 62개 통계 자료 기반 데이터셋 '네모트론-페르소나-코리아' 이 같은 한계를 보완하기 위해 엔비디아는 한국의 인구통계와 문화적 맥락을 반영한 합성 데이터셋 '네모트론-페르소나-코리아(Nemotron-Personas-Korea)'를 제시했다. 이 데이터셋은 국가통계포털(KOSIS), 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버클라우드 등 총 62개 공식 통계·자료를 기반으로 구축됐다. 엔비디아에 따르면 데이터셋은 700만명 수준의 합성 페르소나와 약 17억 토큰으로 구성됐다. 연령, 성별, 지역, 혼인 여부, 가족 구성, 주거 형태, 건강 지표 등 다양한 속성을 반영했으며, 한국표준산업분류와 한국표준직업분류 체계를 적용해 8000개가 넘는 산업·직업 조합을 담았다. 정 팀장은 '이름의 경우 1940년대 이후 국내 이름 분포 데이터를 참고해 약 21만개를 구성했다'며 '세대별 시대상과 정서도 보다 자연스럽게 반영하려 했다'고 설명했다. 원천 공공 데이터는 형식이 제각각이고 비정형 정보가 많아 기업이 바로 활용하기에는 한계가 있다. 엔비디아는 이를 보완하기 위해 확률적 그래프 모델과 자체 데이터 정제 도구인 '네모 큐레이터(NeMo Curator)', '네모 데이터 디자이너(NeMo Data Designer)'를 활용했다. 또 공식 통계 비율을 토대로 한국 사회의 인구·생활 분포를 재현하는 '합성 데이터 생성' 방식을 적용했다. 정제되지 않은 원천 데이터를 그대로 쓰는 대신, 통계적으로 검증된 분포를 바탕으로 활용 가능한 형태의 데이터를 새로 구성해 실제 사회적 맥락은 살리면서도 개인정보 노출 위험은 줄이기 위한 취지다. 이를 통해 데이터셋은 개인식별정보를 포함하지 않는 합성 형태로 설계됐고, 유출 우려를 낮추면서도 안전하게 활용할 수 있도록 했다. 또 허용적 라이선스인 CC BY 4.0으로 배포돼 국내 기업과 개발자들이 비교적 자유롭게 활용할 수 있다. 정 팀장은 '이번 페르소나 데이터셋은 단순한 인물 프로필 모음이 아니라 한국 사회의 맥락을 반영한 합성 데이터 기반'이라며 '국내 개발자들이 보다 현실적인 사용자 시나리오와 서비스를 설계하는 데 도움이 될 것'이라고 말했다. 이어 '대고객 AI 에이전트와 챗봇, 사내 업무 보조, 공공 안내, 교육·리서치 분야에서 비교적 빠르게 효과를 볼 수 있을 것'이라며 '다만 금융이나 의료처럼 규제가 강한 산업군에서는 기업 내부 도메인 데이터와 안전 가드레일을 함께 적용하는 방식이 적절하다'고 덧붙였다. 글로벌 AI 플랫폼 경쟁 속 차별점은 '풀스택'과 '개방성' AWS와 마이크로소프트(MS) 등 글로벌 클라우드 기업들이 AI 플랫폼 시장에서 경쟁하는 가운데, 정 팀장은 엔비디아의 차별점으로 '풀스택 컴퓨팅 플랫폼'과 '개방성'을 제시했다. 그는 '엔비디아는 클라우드 사업자와 직접 경쟁하기보다 모든 클라우드와 온프레미스 환경에서 AI를 가속하는 플랫폼을 제공한다'며 'GPU부터 소프트웨어, 마이크로서비스(NIM)까지 전 과정을 풀스택으로 지원한다'고 설명했다. 인프라 종속, 이른바 락인(lock-in) 우려에 대해서도 선을 그었다. 정 팀장은 '네모트론 모델과 데이터셋은 오픈 생태계 기반이며, NIM과 NeMo 라이브러리 역시 다양한 상용·오픈 모델을 아우르도록 설계됐다'며 '특정 클라우드에 묶이지 않는 하이브리드 배포를 지원해 기업이 자사 데이터 통제권을 유지할 수 있도록 돕는다'고 말했다. 엔비디아는 앞으로도 과학기술정보통신부, 정보통신산업진흥원(NIPA) 등과 협력해 국내 개발자를 위한 실습 프로그램을 이어가고, AI 툴체인 고도화를 통해 국내 기업들의 한국형 AI 시스템 구축을 지원할 계획이다. 정 팀장은 '중요한 것은 특정 인프라를 선택하게 만드는 것이 아니라, 국내 개발자와 기업이 자사 환경에 맞는 방식으로 AI를 개발하고 운영할 수 있도록 돕는 것'이라며 '엔비디아는 개방형 생태계와 풀스택 지원을 바탕으로 한국형 AI 경쟁력 강화를 뒷받침하겠다'고 강조했다.

2026.06.02 13:06남혁우 기자

GPU 넘은 엔비디아, 한국 데이터까지 손댔다…소버린 AI 속도전

엔비디아가 한국 사회 특성을 반영한 대규모 합성 데이터셋을 공개하며 국내 인공지능(AI) 생태계 공략에 속도를 내고 있다. 단순 기술 공개를 넘어 '소버린 AI' 흐름 속에서 데이터까지 포함한 AI 인프라 주도권을 확보하려는 전략으로 풀이된다. 엔비디아는 한국형 합성 데이터셋 '네모트론-페르소나-코리아(Nemotron-Personas-Korea)'가 글로벌 AI 플랫폼 허깅페이스(Hugging Face) 데이터셋 부문 1위를 기록했다고 28일 밝혔다. 해당 데이터셋은 600만 건 규모로, 한국의 인구통계학적·지리적·문화적 특성을 반영한 것이 특징이다. 국가통계포털(KOSIS), 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버클라우드 등 공공·민간 데이터를 기반으로 구축됐다. 이름, 성별, 연령, 혼인 상태, 교육 수준, 직업, 거주 지역 등 주요 속성은 실제 통계 분포를 따르도록 설계됐다. 존댓말 체계와 지역별 직업 패턴 등 한국어 문화 맥락도 반영했다. 고령층과 농촌 지역, 다양한 교육 및 직업군까지 포함해 데이터 다양성을 확보했다. 해당 데이터셋은 개인정보를 포함하지 않는 합성 데이터로 구성돼 개인정보보호법(PIPA)을 준수하도록 설계됐다. 오픈소스로 공개돼 국내외 개발자들이 자유롭게 활용할 수 있다. 이번 데이터셋 공개는 단순 기술 성과를 넘어 AI 인프라 경쟁 구도가 데이터 영역으로 확장되고 있음을 보여주는 사례로 해석된다. 그동안 그래픽처리장치(GPU) 등 컴퓨팅 자원이 핵심 경쟁력이었다면, 최근에는 학습 데이터 확보가 AI 성능과 직결되는 핵심 변수로 부상하고 있기 때문이다. 특히 국가별 언어·문화·규제를 반영하는 '소버린 AI' 수요가 확대되는 상황에서 한국형 데이터셋을 선제적으로 구축해 공개했다는 점도 주목된다. 글로벌 빅테크들이 각국 맞춤형 AI 전략을 강화하는 가운데 엔비디아가 데이터 레이어까지 영향력을 확대하려는 포석으로 읽힌다. 합성 데이터 활용 전략도 눈에 띈다. 개인정보 규제를 준수하면서도 데이터 활용도를 높일 수 있는 대안으로, 향후 금융·의료·공공 등 규제 산업에서 활용 가능성이 크다는 평가다. 국내 시장을 겨냥한 행보라는 해석도 나온다. 네이버, KT 등 주요 기업들이 한국형 AI 모델 개발에 나선 가운데 엔비디아가 데이터·모델·인프라를 결합한 생태계 확장에 나서며 영향력 확대를 시도하고 있다는 분석이다. 더불어 엔비디아는 최근 '네모트론 디벨로퍼 데이즈 서울 2026'을 개최하는 등 국내 개발자 및 기업과 협업을 강화하려는 모습도 보였다. 업계 관계자는 "엔비디아가 단순 GPU 공급을 넘어 데이터와 모델까지 포함한 AI 플랫폼 사업자로 빠르게 전환하고 있다"며 "소버린 AI 확산과 함께 국가별 데이터 확보 경쟁도 본격화될 것"이라고 말했다.

2026.04.28 17:43장유미 기자

노타, 엔비디아 해커톤 1위…데이터 중심 AI 최적화 통했다

노타가 엔비디아 네모트론 해커톤에서 합성 데이터 기반 모델 최적화 기술력을 앞세워 종합 우승을 차지했다. 노타는 엔비디아 네모트론 해커톤에서 혼합전문가(MoE) 양자화에 특화된 합성 데이터 생성 기술로 트랙 C 1위를 차지하고 전체 20개 참가 팀 중 종합 1위에 올랐다고 24일 밝혔다. 이번 해커톤은 엔비디아 오픈소스 인공지능(AI) 모델 '네모트론' 연구 성과를 공유하고 국내 개발자들의 실무 적용 역량을 높이기 위해 마련된 행사다. 참가자들은 ▲실문제 해결형 AI 에이전트 개발(트랙 A) ▲도메인 특화 네모트론 모델의 지도미세조정(SFT)·강화학습(RL) 기반 고도화(트랙 B) ▲고품질 합성 데이터 파이프라인 설계(트랙 C) 등 세 트랙에서 경쟁했다. 노타는 엔비디아 '네모트론 3 슈퍼 120B' 기반 에이전트를 활용해 MoE 구조에 특화된 양자화용 데이터셋을 구축했다. 기존 양자화 방식이 수식·알고리즘 중심 최적화에 초점을 맞췄다면 노타는 데이터셋 구조·품질·목적 적합성을 정교하게 설계하는 데이터 중심 접근법으로 양자화 성능을 끌어올렸다. 노타는 자사 비전언어모델(VLM) 기반 실시간 영상 분석 솔루션 'NVA'에 엔비디아 검색·요약 도구 'VSS 블루프린트'를 접목해 이상 상황을 실시간으로 탐지·요약하는 등 엔비디아와 비전 AI 응용 분야 기술 협력도 이어가고 있다. 채명수 노타 대표는 "이번 수상은 AI 최적화가 알고리즘 고도화에 머무르지 않고 목적에 맞는 데이터를 어떻게 설계하고 활용하느냐에 따라 새로운 가능성을 만들 수 있음을 보여줬다"며 "엔비디아와의 협력을 바탕으로 데이터 중심 AI 최적화 기술과 솔루션을 고도화하겠다"고 말했다.

2026.04.24 14:12이나연 기자

[현장] "벤치마크보다 중요한 건 실전"… AI 리더가 짚은 국내 AI 생태계 과제

"벤치마크 점수가 높다고 고객이 만족하는 것은 아닙니다. 실제 기업 환경에서 실질적인 성능을 내는 것이 진짜 성과입니다." 21일 서울 마포 디캠프에서 열린 '엔비디아 네모트론 개발자 데이 서울 2026'에서 진행된 기술 패널 토론에는 한국 인공지능(AI) 생태계를 이끄는 주요 리더가 참석해 치열하고 솔직한 현장 경험담을 제시했다. 이날 토론은 정규형 엔비디아 솔루션아키텍트(SA) 팀장이 좌장을 맡았고 천성준 SKT AI리서치 엔지니어, 최홍준 업스테이지 부사장, 임정환 모티프 대표, 김수인 엘리스그룹 최고연구책임자(CRO)가 참석해 'K-AI 빌더들의 연결과 글로벌 진출'을 주제로 논의를 이어갔다. "점수보단 실전"… 글로벌 수준 도달한 K-AI, 이제는 추론 효율이 과제 패널들은 공통적으로 국내 기업들이 자체 AI 모델을 개발하는 단계를 넘어, 이를 실제 서비스에 올릴 수 있는 수준으로 고도화하는 것이 중요하다고 입을 모았다. 천성준 SK텔레콤 AI리서치 엔지니어는 "한국 기업도 글로벌 프런티어 모델에 근접한 성능을 낼 수 있다는 점은 이미 입증했다"며 "이제 과제는 추론 효율성과 배포 가능성을 높여 '쓸 만한 모델'을 넘어 '실제로 쓸 수 있는 모델'을 만드는 것"이라고 말했다. 임정환 모티프 대표는 단순한 매개변수 규모 경쟁을 경계했다. 그는 "비슷한 규모의 모델과 경쟁하는 것이 아니라 2~3배 큰 모델과 비견되거나 더 나은 성능을 내는 것이 진짜 기술력의 증거"라며 "현재 3000억개 매개변수(300B) 규모 모델을 비롯해 음성·비디오 생성까지 포함한 다양한 생성형 모델을 개발 중이고 장기적으로는 월드 모델 등으로 확장할 계획"이라고 밝혔다. "데이터 반출 장벽 넘어야"…엣지 환경과 엔드투엔드 인프라 부상 김수인 엘리스그룹 CRO는 산업 현장 도입의 가장 큰 장벽으로 데이터 거버넌스를 지목했다. 김 CRO는 "세계 최고 수준의 모델을 만들어도 실제 현장에 적용하려고 하면 데이터 반출 불가 등 수많은 병목 현상에 부딪힌다"며 "결국 칩, 인프라, 데이터, 모델, 애플리케이션까지 전 레이어를 아우르는 엔드투엔드 전략이 필요하다"고 설명했다. 그는 또 현장 수요가 엣지와 온프레미스 환경으로 확장되고 있다고 진단했다. 고객 데이터가 외부로 나갈 수 없는 경우가 많은 만큼, 실제 서비스 환경에서는 모델 성능뿐 아니라 배포 방식과 운영 구조까지 함께 설계해야 한다는 설명이다. 주최 측인 엔비디아의 소프트웨어 생태계에 대한 개선점도 제기됐다. 천성준 엔지니어는 네모 큐레이터, 메가트론LM 등을 유용하게 활용하고 있다고 언급하면서도 "새로운 알고리즘이 엔비디아의 고속 학습 프레임워크에 반영되는 속도는 지금보다 훨씬 더 빨라질 필요가 있다"고 짚었다. 임정환 대표는 한발 더 나아가 기술적 종속성을 경계했다. 그는 "모델 아키텍처 실험의 자유도가 무엇보다 중요하기 때문에 현재 엔비디아 소프트웨어는 잘 사용하지 않는다"며 "엔비디아가 제공하는 거대한 패키지 틀 안에 갇히게 되면 독자적인 혁신에 한계가 생길 수밖에 없다"고 지적하며 유연한 개발 환경의 필요성을 언급했다. 좌장을 맡은 정규형 팀장은 "현장의 따끔하고 생생한 피드백에 깊이 감사드린다"며 "개발자들이 더 효율적이고 자유롭게 사용할 수 있도록 한국 AI 기업들의 다양한 요구를 본사에 적극 전달해 프레임워크의 유연성을 개선하겠다"고 화답했다. 독자 파운데이션 모델과 소버린 AI… 글로벌 확장 가능성 주목 패널들은 정부가 추진 중인 독자 파운데이션 모델 사업에도 의미를 부여했다. 최홍준 부사장은 "글로벌 수준의 오픈 모델이 국내에 구축되면 민간이 이를 바탕으로 다양한 서비스를 만들 수 있고, 그 혜택이 산업 전반으로 확산될 수 있다"고 말했다. 이어 "동남아 등 많은 국가들은 언어, 문화, 규제 맥락이 달라 각국에 맞는 소버린 AI를 원하고 있다"며 "한국에서의 모델 구축과 인프라 운영 경험은 해외 진출의 자산이 될 수 있다"고 덧붙였다. 이날 토론은 AI 경쟁의 승부처가 더 큰 모델, 더 높은 벤치마크 점수에서 실제 배포와 운영, 데이터 주권, 산업 적용으로 이동하고 있음을 보여줬다. 이번 패널 토론은 독자 파운데이션 모델 프로젝트를 추진 중인 정보통신산업진흥원(NIPA)과 엔비디아가 협력해 마련한 자리다. NIPA는 자사가 보유한 국내 개발자·기업 네트워크를 바탕으로 이번 행사와 국내 AI 생태계를 연결하는 역할을 했다는 설명이다. 박진홍 NIPA 글로벌협력팀장은 "국내 기업에 실질적으로 도움이 될 만한 것이 무엇인지 계속 찾아보면서 함께 하려 한다"며 "구체적으로 어떤 사업을 추가로 추진할지, 어떤 프로그램을 만들지는 아직 확정되지 않았고 향후 더 논의가 필요하다"고 말했다.

2026.04.21 18:22남혁우 기자

[현장] "메일 요약에서 물류 시뮬레이션까지"…엔비디아가 제시한 실무형 AI

"컨베이어벨트 속도를 어떻게 조절해야 가장 효율적일까?" 스마트폰으로 물류센터 최적화 질문을 입력하자 네모트론의 인공지능(AI) 에이전트가 시뮬레이션을 설계하고, 가상 공간에서 여러 조건을 검증한 뒤 결과를 분석해 보고서까지 내놨다. 엔비디아는 21일 서울 마포 디캠프에서 열린 '네모트론 개발자 데이 서울 2026'의 '빌드-어-클로(Build-a-Claw)' 시연 세션을 통해 답변형 AI를 넘어 실제 산업 현장에서 작동하는 '현실형 AI 에이전트'의 가능성을 제시했다. 시연을 맡은 정구형 엔비디아코리아 솔루션아키텍트(SA)팀 팀장은 오픈 클로(Open Claw), 네모 클로(NeMo Claw), DGX 스파크를 중심으로 에이전트 AI가 단순 질의응답을 넘어 실제 업무를 수행하는 방향으로 진화하고 있다고 설명했다. 이번 시연의 핵심은 여러 역할을 가진 에이전트를 엮어 팀처럼 운영하는 구조였다. 사용자가 질문을 던지면 단일 모델이 답만 내놓는 것이 아니라 역할이 나뉜 복수의 에이전트가 각각 필요한 작업을 수행하고 이를 종합해 결과를 제시하는 방식이다. 현장 시연은 AI가 더 이상 '말을 잘하는 도구'에 머무르지 않고, 실제 업무 흐름 안으로 들어오고 있음을 보여주는 데 초점이 맞춰졌다. 물류센터 최적화 질문에 시뮬레이션·분석·보고서까지 정 팀장은 자신이 실제로 구성해 사용 중인 에이전트 트리를 예로 들며, 이를 관리하는 상위 에이전트와 그 아래 팀장, 리서처, 엔지니어, 솔루션 아키텍트, QA, 운영, HR 역할의 에이전트가 계층적으로 배치된 구조를 보여줬다. 실제 기업 조직의 역할 분담과 관리 체계를 AI 시스템 설계에 옮겨놓은 모습에 가까웠다. 그는 "이 많은 에이전트와 직접 하나하나 소통하는 게 아니라, 관리용 에이전트를 둬 전체를 관장하게 만든다"고 말했다. 이어 "계층 구조를 설정하지 않으면 각 에이전트의 자율성이 지나치게 커질 수 있다"며 "조직을 만들듯 체계를 잡아야 원하는 방향으로 움직일 수 있다"고 설명했다. 이 같은 멀티 에이전트 방식은 특정 작업을 여러 단계로 쪼개고, 각 단계에 적합한 역할을 맡긴다는 점에서 기존 단일 챗봇 방식과 차별화된다. 질문 해석, 자료 탐색, 실행, 검증, 결과 정리 등의 과정을 역할별로 분산 처리함으로써 보다 복잡한 업무도 소화할 수 있다는 것이 엔비디아 측 설명이다. 이번 시연에서 가장 눈길을 끈 부분은 디지털 트윈 기반 물류 시나리오였다. 화면에는 컨베이어벨트 위를 흐르는 박스를 집어 쌓는 로봇 팔 환경이 구현됐다. 정 팀장은 "로봇은 바꿀 수 없는 상황에서 컨베이어벨트 속도를 어떻게 조절해야 가장 효율적으로 동작할 수 있을지를 에이전트에 물었다"고 소개했다. 그러자 에이전트들은 내부적으로 역할을 나눠 움직였다. 먼저 시뮬레이션 시나리오를 만들고 디지털 트윈 공간을 구동하는 시뮬레이터인 아이작 심(Isaac Sim)에서 총 8가지 시나리오를 돌린 뒤 그 결과를 월드 파운데이션 모델 '코스모스(Cosmos)'로 분석해 최종 리포트 형태로 제시하는 흐름이었다. 정 팀장은 "이런 식으로 본인이 하는 업무를 자동화할 수 있고 시행착오도 많이 줄일 수 있다"고 설명했다. 메일 요약부터 답변 초안까지… 사무 자동화 가능성도 제시 정 팀장은 산업 현장뿐 아니라 일상 업무에 가까운 활용 사례도 공개했다. 그는 자신이 운영 중인 이른바 '세컨드 브레인' 예시를 보여주며 메일 계정에서 메일을 가져와 내용을 요약하고, 답변 초안을 자동으로 작성하는 구조를 소개했다. 일정 관리 자동화 예시도 함께 제시됐다. 데일리 노트를 크론 잡으로 생성한 뒤 스케줄을 불러와 템플릿에 맞게 정리하는 식이다. 반복 업무를 자동화하면서도 사용자가 최종 결과물을 검토할 수 있도록 설계했다는 점이 특징이다. 다만 회사 정책상 실제 발송 API는 막아둔 상태라고 했다. 대신 초안은 개인 노트에 정리되도록 하고, 사용자가 내용을 확인한 뒤 직접 메일을 보내는 방식이다. 완전 자동화보다 '통제 가능한 자동화'에 무게를 둔 접근이라는 점에서, 기업용 AI가 현실적으로 어떤 선에서 적용되고 있는지를 보여주는 사례로 읽혔다. 자유로운 에이전트일수록 통제 중요… 네모 클로로 가드레일 강화 정 팀장은 에이전트의 자유도가 높아질수록 통제 장치가 중요해진다고 강조했다. 시스템에 접근해 코드를 수정하거나 외부 네트워크를 호출하고, 내부 데이터를 외부로 전송하는 등 예상치 못한 문제가 발생할 수 있기 때문이다. 이를 방지하기 위해 엔비디아가 제시한 것이 네모 클로다. 그는 "에이전트가 데이터를 아카이빙하고 있는 만큼 민감한 정보가 있을 수 있는데, 예를 들어 '주식 리포트를 찾아 메일로 보내달라'고 했을 때 그대로 외부 전송이 이뤄지면 안 되는 경우도 있다"고 말했다. 이어 "이런 상황을 막기 위해 정책과 제한을 두고 그 규칙 안에서만 에이전트가 움직이도록 하는 것이 네모 클로의 핵심"이라고 설명했다. 정 팀장에 따르면 네모 클로는 오픈 클로를 대체하는 개념이라기보다, 이를 엔터프라이즈 환경에서 안정적으로 운영할 수 있도록 가드레일과 정책 제어 기능을 덧댄 프레임워크에 가깝다. 네트워크 접근, 시스템 호출, 특정 스킬 사용 등을 사전에 정의된 정책에 따라 제한함으로써 기업이 보다 안심하고 에이전트를 도입할 수 있도록 돕는다는 것이다. 로컬 AI 특화 하드웨어 'DGX 스파크'…24시간 일하는 AI 직원 이번 시연은 모두 DGX 스파크를 기반으로 진행됐다. DGX 스파크는 CPU와 GPU가 공유 메모리를 사용하는 구조를 바탕으로 대규모 언어 모델(LLM) 배포에 활용할 수 있는 메모리 공간을 넓힌 로컬 AI 개발 장비다. 외부 API에 의존하지 않고도 비교적 큰 모델을 엣지 환경에서 구동할 수 있어 상시 운영 비용을 줄일 수 있다는 게 엔비디아 측 설명이다. 정 팀장은 네모트론 1200억개 매개변수(120B)급 모델 구동은 물론 소형 모델의 학습·파인튜닝과 로보틱스용 강화학습 같은 작업에도 활용할 수 있다고 소개했다. 제품은 엔비디아가 직접 판매하는 것을 비롯해 에이수스(ASUS)와 기가바이트(GIGABYTE)가 최적화한 버전으로도 공급되며, 1TB와 5TB급으로 구성됐다. 정 팀장은 "오픈 클로 자체는 작은 장치에서도 구동할 수 있지만 엔터프라이즈 업무를 위해선 메인 에이전트에 쓰이는 LLM이 돌아야 한다"며 "GPU 자원이 없으면 외부 API를 붙여 쓸 수 있지만 상시 구동 모델은 비용이 커질 수 있다"고 설명했다. 그러면서 엣지 환경에서 비교적 큰 모델을 구동하며 비용을 절감할 수 있는 장비 수요가 있다고 강조했다. 이어 "CPU와 GPU가 공유 메모리를 사용하기 때문에 LLM 배포 시 활용할 수 있는 메모리 공간이 크고, 그래서 더 큰 모델을 돌릴 수 있다"고 소개했다. 또 그는 "네모트론 120B 같은 큰 모델도 해당 단말에서 구동할 수 있도록 구성돼 있다"며 "작은 모델은 학습이나 파인튜닝도 가능하고, 로봇 분야에서는 강화학습이나 소형 VLA 모델 튜닝에도 활용할 수 있다"고 덧붙였다.

2026.04.21 18:22남혁우 기자

[현장] "한국형 AI 생태계 지원"… 엔비디아, 네모트론 개발자 데이 서울 2026 개최

전 세계 국가와 산업계가 자국 언어와 문화, 산업적 특성을 반영한 자체 데이터 기반의 맞춤형 AI 모델 확보에 속도를 내고 있다. 이런 흐름에 따라 엔비디아가 국내 환경에 최적화된 인공지능(AI) 생태계 구축을 위한 방향과 핵심 기술을 제시했다. 엔비디아는 21일부터 22일까지 서울 디캠프 마포(d·camp)에서 '엔비디아 네모트론 개발자 데이 서울 2026'을 개최했다. 한국에서 처음 열린 네모트론 개발자 데이는 연례 개발자 컨퍼런스인 GPU 테크놀로지 컨퍼런스(GTC)에서 진행해 온 행사다. 엔비디아는 이번 행사를 통해 우리나라 환경에 맞는 AI 생태계 구축 방안과 이를 실현할 혁신적인 오픈 모델, 데이터셋, 개발 도구를 집중적으로 선보였다. "효율성이 곧 지능"… 에이전트 AI 시대 겨냥한 네모트론 전략 브라이언 카탄자로 엔비디아 딥러닝 응용 연구 부문 부사장은 AI 산업이 단순 질의응답형 챗봇을 넘어 스스로 추론하고 도구를 활용하는 에이전트 AI 시대로 빠르게 이동하고 있다고 진단했다. 그는 에이전트를 단순한 하나의 모델이 아니라 메모리, 멀티모달 기능, 파일 및 메시징 도구 접근, 컴퓨터 활용 능력, 여러 에이전트의 조합까지 포함하는 시스템으로 설명했다. 이에 따라 앞으로의 AI 경쟁력은 개별 모델 성능뿐 아니라 이를 얼마나 효율적으로 조합하고 운영하느냐에 달려 있다고 강조했다. 카탄자로 부사장은 "프리사이즈 의류가 모두에게 꼭 맞을 수 없듯, 하나의 획일화된 범용 모델이 모든 상황과 요구를 충족시키기는 어렵다"며 "각자의 데이터와 업무 환경에 맞춘 특화 모델이 필요하다"고 강조했다. 이어 "효율성이 곧 지능"이라며 제한된 컴퓨팅 자원 안에서 더 높은 성능을 구현하려면 하드웨어와 소프트웨어를 함께 최적화하는 공동 설계(Co-design)가 중요하다고 설명했다. 엔비디아는 이런 흐름에 맞춰 네모트론을 단순한 대규모언어모델(LLM)이 아니라 개방형 AI 모델 패밀리로 확장하고 있다. 베이스 모델과 포스트트레이닝 모델은 물론, 프리트레이닝 및 포스트트레이닝 데이터셋, 연구 기법, 하이퍼파라미터, 소프트웨어까지 함께 공개·공유하는 방식으로 생태계를 넓히겠다는 구상이다. 카탄자로 부사장은 차세대 GPU '블랙웰(Blackwell)'과 저정밀 연산 기술인 'NVFP4'도 언급했다. 그는 블랙웰이 전문가혼합(MoE) 모델 추론에서 이전 세대 대비 최대 55배 빠른 성능을 기록했으며, NVFP4는 숫자당 4.75비트 수준의 초저정밀 연산을 통해 전력 부담을 낮추면서도 정확도를 유지하는 데 기여한다고 설명했다. 데이터 품질이 AI 성능 좌우… 합성 데이터·큐레이션 도구 소개 메흐란 마구미 엔비디아 수석 딥러닝 엔지니어는 AI 모델 개발에서 데이터 품질과 다양성, 프라이버시, 비용 효율성이 갈수록 중요해지고 있다고 강조했다. 그는 인터넷 데이터만으로는 특정 국가와 산업에 적합한 모델을 만들기 어렵다며 합성 데이터와 데이터 변환 기술이 현지화된 AI 개발의 핵심이라고 설명했다. 완전히 새로운 데이터를 생성하는 방식뿐 아니라 기존 데이터를 목표 도메인에 맞게 변환하는 작업 역시 중요하다는 것이다. 이런 상황에 대응하기 위한 방안으로 마구미 엔지니어는 엔비디아의 오픈소스 도구인 '네모 데이터 디자이너'와 '네모 큐레이터'를 소개했다. 네모 데이터 디자이너는 합성 데이터를 처음부터 만들거나 기존 데이터를 특정 목적에 맞게 변환할 수 있도록 지원하는 도구다. 데이터 다양성 제어, 검증, 재현 가능한 데이터 파이프라인 구축에 초점이 맞춰져 있다. 네모 큐레이터는 대규모 데이터 정제와 중복 제거, 품질 필터링, 분류 작업을 확장성 있게 수행할 수 있도록 설계된 도구다. 특히 의미론적 중복 제거와 대규모 데이터 파이프라인 설계를 통해 모델 학습용 데이터 품질을 높이는 데 강점이 있다고 엔비디아는 설명했다. 엔비디아는 이들 도구를 통해 국내 개발자와 기업이 한국어 및 산업 특화 데이터 파이프라인을 보다 쉽게 설계하고, 데이터 생성부터 선별, 검증, 후속 학습까지 전 주기를 효율적으로 수행할 수 있을 것으로 기대하고 있다. "한국인 700만 명의 삶 담았다"… 한국 특화 페르소나 데이터셋 공개 한국 특화 생태계 조성을 위한 구체적 결과물도 공개됐다. 엔비디아 리서치의 김현우 연구원은 한국인의 문화와 현실을 반영한 '네모트론 페르소나 코리아(Nemotron Persona Korea)' 데이터셋을 발표했다. 김 연구원은 기존 글로벌 대형언어모델이 한국 사회를 묘사할 때 '40%가 샐러드를 즐겨 먹고 사과 과수원을 운영한다'는 식으로 직업, 거주지, 식습관, 가족 형태 등에서 왜곡된 인물상을 생성하는 문제가 있다고 지적했다. 잘못된 데이터 학습으로 인해 특정 지역 거주자 비율이 비현실적으로 높게 나오거나, 한국인의 생활상과 맞지 않는 직업 및 식문화가 과도하게 반영되고 있다는 설명이다. 이를 보완하기 위해 엔비디아는 통계청, 대법원, 국민건강보험 등 62개 통계 자료를 바탕으로 한국 사회의 분포와 문화적 특성을 반영한 합성 페르소나 데이터셋을 구축했다. 데이터셋 규모는 700만명 수준으로, 약 17억 토큰에 달한다. 김 연구원에 따르면 이 데이터셋은 연령, 성별, 지역, 혼인, 가족 구성, 주거 형태, 건강 지표 등 폭넓은 속성을 반영했다. 여기에 한국표준산업분류와 한국표준직업분류 체계를 적용해 8000개가 넘는 산업·직업 조합도 포함했다. 이름 데이터도 세대별 특성이 반영되도록 설계됐다. 엔비디아는 1940년대 이후 국내 이름 분포 데이터를 참고해 총 21만여개의 이름 데이터를 구성했으며, 이를 통해 세대별 정서와 시대상을 더 자연스럽게 반영할 수 있도록 했다. 김 연구원은 "페르소나 데이터셋은 단순한 인물 프로필 모음이 아니라 한국 사회의 분포와 문화적 맥락을 반영한 합성 데이터 생성 기반"이라며 "국내 개발자들이 보다 현실적인 사용자 시나리오와 서비스를 설계하는 데 도움이 될 것"이라고 설명했다. 또 해당 데이터셋은 개인식별정보를 포함하지 않는 합성 데이터 형태로 설계됐으며, 허용적 라이선스(CC BY 4.0)로 배포돼 국내 기업과 개발자들이 비교적 자유롭게 활용할 수 있도록 했다. 현장에선 기술 세션 외에도 개발자 실무 역량 강화를 위한 프로그램도 함께 진행됐다. 과학기술정보통신부와 정보통신산업진흥원(NIPA) 후원으로 마련된 패널 토론에서는 정부의 '독자 AI 파운데이션 모델' 프로젝트와 연계해 국내 통신사 및 AI 스타트업 관계자들이 K-AI 생태계의 경쟁력 확보 방안을 논의했다. 또 국내 혁신가들이 엔비디아 전문가들과 함께 48시간 동안 에이전틱 시스템과 산업 특화 모델을 구축하는 '네모트론 해커톤'도 마련됐다. GTC 2026에서 소개됐던 실습형 AI 에이전트 구축 데모 '빌드-어-클로(Build-a-Claw)' 팝업 이벤트도 한국에서 처음 운영돼 참가자들이 직접 에이전트 AI 개발 경험을 체험할 수 있도록 했다. 엔비디아는 이번 서울 행사를 계기로 국내 개발자 커뮤니티 및 기업과의 접점을 넓히고 협력 기반을 강화하겠다는 방침이다. 카탄자로 부사장은 "한국에는 수준 높은 AI 연구 조직과 기업이 다수 존재하며, 국내 기업들의 AI 추진 속도와 생태계 역동성이 매우 인상적"이라며 "이번 행사를 계기로 한국을 포함한 전 세계 생태계가 자체적인 AI 역량을 구축할 수 있도록 파트너십과 협업을 더욱 확대해 나가겠다"고 밝혔다.

2026.04.21 16:43남혁우 기자

엔비디아, 오픈 모델로 '의료 AI' 혁신…헬스케어·신약 개발 가속

엔비디아가 오픈 모델과 데이터 플랫폼을 결합해 의료·생명과학 분야에 인공지능(AI) 활용 범위를 넓혔다. 엔비디아는 19일(현지시간)까지 미국 새너제이에서 열린 'GTC 2026'에서 '네모트론' 오픈 모델과 '네모 라이브러리'를 공개하고 의료 특화 AI 구축·배포를 지원한다고 밝혔다. 네모트론 오픈 모델은 오픈 가중치와 학습 레시피를 제공한다. 이를 통해 의료진과 개발자가 자체 인프라에서 맞춤형 AI 에이전트를 직접 구축할 수 있게 돕는다. 멀티모달 의료 데이터 증가에 대응해 고효율·저지연 처리 구조까지 제공해 기존 폐쇄형 시스템 의존도를 줄인다. 네모 라이브러리는 의료 전문 용어에 맞춘 파인튜닝을 지원해 범용 모델의 한계를 보완한다. 실제 헤이디 헬스는 네모트론 스피치 도입 후 지연 시간을 75% 줄이고 운영 비용을 64% 절감했다. 헬스케어 기업도 네모트론 기반으로 에이전틱 AI 도입을 확대하고 있다. 히포크라틱 AI는 임상 대화 모델을 구축했으며, 소드 헬스는 정신 건강 지원 모델을 고도화하고 있다. 또 아이큐비아와 오픈에비던스 베릴리도 각각 생명과학 연구와 의료 지식 통합 서비스에 활용하고 있다. 엔비디아는 바이오네모 플랫폼을 통해 생명과학 데이터 처리 영역도 확장했다. 파라브릭스와 쿠다-X 데이터 사이언스 라이브러리를 결합해 유전체 분석 속도를 높이고 연구 기간을 크게 단축하는 구조다. 베이스캠프 리서치는 초대규모 유전체 데이터 프로젝트를 통해 기존 공개 데이터 대비 10배 이상 큰 데이터셋을 구축했다. 이를 기반으로 수천조 개 DNA 염기쌍을 분석하며 기존 수십 년 걸리던 작업을 2년 미만으로 줄일 수 있는 환경을 마련했다. 타호 테라퓨틱스는 1억 개 세포 데이터 기반으로 가상 세포 모델을 개발했다. 향후 10억 개 세포 규모로 확장해 실제 실험 없이 치료 연구를 진행하는 시뮬레이션 환경을 구축할 계획이다. 퍼터브AI는 약 800만 개 뇌 세포 데이터를 활용한 CRISPR 유전체 아틀라스를 공개했다. 그래픽처리장치(GPU) 가속을 통해 분석 시간을 기존 며칠에서 실시간 수준으로 단축하며 질환 연구 속도를 높이고 있다. 엔비디아가 발표한 '헬스케어와 생명과학 분야 AI 현황' 조사에 따르면 의료 업계 리더 82%가 오픈소스를 핵심 전략으로 보고 있다. 엔비디아는 "의료 기관은 오픈 모델을 도입하고 이를 파인튜닝함으로써 데이터 주권을 확보할 수 있다"며 "투명성과 재현성에 대한 통제력을 유지하면서도 복잡한 에이전틱 애플리케이션에 필요한 높은 정확도를 확보할 것 이라고"고 밝혔다.

2026.03.20 18:15김미정 기자

[AI는 지금] 'CEO 교체 카드' 꺼낸 어도비, 엔비디아 손잡고 AI·3D로 반전 노린다

최근 18년만에 최고경영자(CEO) 교체 수순에 들어간 어도비가 '인공지능(AI) 생태계 강자'인 엔비디아와 손잡고 반전 카드 마련에 나섰다. 생성형 AI 확산으로 기존 크리에이티브 소프트웨어 시장의 지형이 흔들리자 엔비디아를 구원투수로 삼고 사업 구조 전환에 본격 착수한 분위기다. 엔비디아는 미국 새너제이에서 열린 세계 최대 AI·가속 컴퓨팅 콘퍼런스인 '엔비디아 GTC 2026'에서 어도비와 전략적 파트너십을 체결했다고 18일 밝혔다. 이번 일로 양사는 AI 기반 창작, 프로덕션, 개인화를 가속하며, 차세대 어도비 파이어플라이 파운데이션 모델과 에이전틱 워크플로우 제공을 위해 협력할 예정이다.이번 파트너십을 통해 어도비는 AI 전환에 필요한 핵심 인프라를 한 축에서 확보할 수 있게 됐다. 엔비디아가 AI 반도체를 넘어 모델 개발용 소프트웨어, 에이전트 프레임워크, 3D 시뮬레이션 플랫폼까지 갖추고 있단 점에서다.이에 어도비는 이번에 단순한 기능 개선을 넘어 콘텐츠 제작 방식 전반의 변화를 노리고 있다. 이를 위해 엔비디아의 쿠다엑스(CUDA-X), 네모(NeMo), 에이전트 툴킷 등을 활용함으로써 이미지·영상·3D 콘텐츠 생성 능력을 고도화하는 동시에 사람이 수행하던 작업을 AI가 대신 수행하는 '에이전틱 워크플로우' 구축에 나선다는 방침이다. 콘텐츠 제작을 개별 툴 중심에서 자동화된 시스템 중심으로 이동시키려는 의도에서다. 또 어도비는 이번 협력을 계기로 기업 시장 공략에 한층 속도를 낼 것으로 보인다. 특히 이번 발표에서 '상업적으로 안전한 AI', '브랜드 아이덴티티 보존', '엔터프라이즈 맞춤형 모델' 등을 강조한 점은 개인 창작자 중심에서 기업 고객 중심으로 무게추를 옮기겠다는 전략으로 해석된다. 생성형 AI 경쟁이 심화되며 범용 콘텐츠 제작 영역의 차별화가 어려워진 만큼, 데이터 통제와 저작권 보호가 중요한 기업 시장에서 경쟁력을 확보하려는 의도다.3D 콘텐츠 영역 확장도 주목된다. 어도비는 엔비디아 옴니버스 라이브러리를 기반으로 제품의 가상 복제본을 구현하는 '3D 디지털 트윈' 솔루션을 선보일 계획이다. 이를 통해 기존 2D 이미지 중심의 마케팅 콘텐츠를 넘어 재사용 가능한 3D 자산 기반 제작 환경을 구축한다는 구상이다. 이는 콘텐츠 생산 방식이 정적 이미지에서 동적·입체형 데이터 중심으로 전환되는 신호로 해석된다. 어도비의 이 같은 행보는 기존 소프트웨어 중심 사업 구조에 대한 위기 인식에서 비롯된 것으로 풀이된다. 생성형 AI 기술 확산으로 이미지와 영상 제작이 자동화되면서 포토샵 등 전문 툴의 진입장벽이 낮아지고, 시장 경쟁 구도가 빠르게 재편되고 있기 때문이다. 실제로 최근 주가 하락과 CEO 교체 역시 이러한 구조 변화에 대한 시장의 우려가 반영된 결과로 해석된다. 업계에선 이번 협력을 어도비의 'AI 전환 가속 페달'로 평가하는 분위기다. 엔비디아의 AI 컴퓨팅 인프라와 모델, 플랫폼을 결합해 새로운 성장 동력을 확보하려는 시도란 분석이다. 다만 엔비디아 의존도가 높아질 수 있다는 점과 구글·오픈AI 등 경쟁사 역시 유사한 전략을 추진하고 있다는 점은 향후 부담 요인으로 지적된다. 업계 관계자는 "크리에이티브 소프트웨어 시장은 이제 단순 기능 경쟁이 아니라 AI 기반 워크플로우와 데이터 생태계 경쟁으로 넘어가고 있다"며 "어도비가 이번 협력을 통해 플랫폼 전환에 성공할 수 있을지가 향후 시장 판도를 좌우할 것"이라고 말했다.

2026.03.18 10:37장유미 기자

엔비디아, 자율주행·로봇·신약 개발까지…차세대 오픈소스 AI 모델 공개

엔비디아가 로봇, 자율주행, 신약 개발 등에 활용되는 오픈소스 인공지능(AI) 모델 제품군을 공개했다. 엔비디아는 17일 미국 새너제이에서 열린 'GTC 2026'에서 새로운 오픈 모델 제품군을 발표했다. 이번 모델은 디지털 환경뿐 아니라 로봇, 자율주행차, 생명과학 연구 등 실제 산업 환경에서 활용할 수 있는 지능형 AI 시스템 구축을 목표로 한다. 먼저 에이전트형 AI 개발을 위한 '네모트론 3' 모델 제품군이 공개됐다. 해당 모델은 언어, 이미지, 음성을 동시에 이해하는 멀티모달 구조를 기반으로 자연스러운 대화와 복잡한 추론, 영상·문서 분석을 지원한다. 최상위 모델인 '네모트론 3 울트라'는 엔비디아 블랙웰 플랫폼에서 NVFP4 포맷을 활용해 최대 5배 높은 처리 효율을 제공한다. 코딩 지원, 검색, 업무 자동화 등 AI 애플리케이션 개발에 활용된다. 랭체인, 코드래빗, 퍼플렉시티, 서비스나우 등 기업들도 네모트론 모델을 활용한 에이전트형 AI 서비스를 개발하고 있다. 로봇과 자율주행차 개발을 위한 물리 AI 모델도 공개됐다. '코스모스 3'는 합성 세계 생성, 물리 AI 추론, 행동 시뮬레이션을 통합한 세계 기반 모델로 복잡한 환경에서 AI가 실제 행동을 학습하도록 지원한다. 휴머노이드 로봇용 모델 '아이작 그루트 N1.7'은 실제 환경에서 활용 가능한 수준으로 발전했다. 자율주행차용 모델 '알파마요 1.5'는 내비게이션 안내와 다중 카메라 인식 기능을 통해 차량의 상황 판단 능력을 강화한다. 젠슨 황 엔비디아 최고경영자(CEO)는 기조연설에서 차세대 로봇 파운데이션 모델 '그루트 N2'도 공개했다. 해당 모델은 새로운 세계 행동 모델 구조를 기반으로 기존 비전, 언어, 행동(VLA) 모델 대비 두 배 이상 높은 작업 성공률을 보인다고 설명했다. 헬스케어 분야에서는 AI 기반 신약 개발을 지원하는 모델도 공개됐다. '프로테이나 콤플렉사'는 단백질 결합 구조 설계를 지원하는 생성형 AI 모델로 구조 기반 신약 개발을 가속하는 데 활용된다. 노보 노디스크, 비바 바이오텍, 매니폴드 바이오 등 제약 기업들이 해당 모델을 활용해 단백질 설계 연구를 진행하고 있다. 엔비디아는 구글 딥마인드, 유럽생물정보연구소, 서울대학교와 협력해 알파폴드 단백질 구조 데이터베이스도 확대했다. 약 3천만 개의 단백질 복합체 예측 데이터를 계산했으며 이 가운데 약 170만 개의 고신뢰 단백질 구조 데이터를 추가했다. 또한 GPU 가속 시뮬레이션 엔진 'nvQSP'도 공개했다. 해당 기술은 임상시험 이전 단계에서 다양한 치료 시나리오를 컴퓨터 모델로 분석할 수 있도록 지원한다. 기존 CPU 기반 시뮬레이션 대비 최대 77배 빠른 성능을 제공한다. 엔비디아는 이번에 공개한 모델과 데이터, 프레임워크를 깃허브, 허깅페이스, 클라우드 AI 플랫폼 등을 통해 제공할 예정이다. 일부 모델은 '엔비디아 NIM' 마이크로서비스 형태로도 제공돼 엣지부터 클라우드까지 다양한 환경에서 활용할 수 있다. 카리 브리스키 엔비디아 생성형 AI 소프트웨어 부사장은 "오픈소스 AI는 글로벌 혁신의 핵심 동력이 됐다"며 "엔비디아의 오픈 모델 제품군은 언어를 넘어 생명과학, 로보틱스, 자율 기계 등 다양한 산업 영역에서 새로운 AI 혁신을 가능하게 할 것"이라고 말했다.

2026.03.17 10:45남혁우 기자

엔비디아, 오픈 모델 '네모트론 3' 시리즈 공개…"추론 속도 4배↑"

엔비디아가 에이전틱 인공지능(AI) 애플리케이션 구축을 위한 오픈 모델 제품군을 공개했다. 엔비디아는 오픈 모델과 데이터, 라이브러리로 구성된 '네모트론 3' 시리즈를 17일 발표했다. 네모트론 3는 '하이브리드 잠재 전문가 혼합(MoE)' 아키텍처로 대규모 멀티 에이전트 시스템 신뢰성을 높였다. 개발자는 이를 통해 통신 과부하와 맥락 이탈, 높은 추론 비용 등 기존 협업형 AI 시스템이 겪던 기술적 난제를 해결할 수 있다. 이 시리즈는 나노, 슈퍼, 울트라로 구성됐다. 네모트론 3 나노는 300억 개의 파라미터를 갖춘 소형 모델이다. 전 세대 대비 4배 높은 처리량을 갖췄다. 소프트웨어 디버깅이나 콘텐츠 요약 같은 작업에 최적화됐다. 추론 토큰 생성량을 최대 60%까지 줄일 수 있다. 내년 상반기 출시 예정인 슈퍼와 울트라 모델은 각각 1천억 개, 5천억 개의 파라미터를 탑재했다. 해당 시리즈는 엔비디아 블랙웰 아키텍처 기반의 고효율 훈련 포맷으로 이뤄져 메모리 요구 사항을 줄이면서도 훈련 속도를 높일 수 있다. 엔비디아는 이번 제품군을 통해 각국 조직이 데이터와 규제, 가치에 부합하는 소버린 AI를 구축하도록 적극 지원한다고 밝혔다. 이미 서비스나우, 퍼플렉시티, 지멘스 등 글로벌 기업들이 네모트론 모델을 자사 워크플로에 통합해 제조, 보안, 미디어 등 다양한 산업 분야에서 활용 중이다. 이날 엔비디아는 전문화된 에이전트 구축을 돕기 위해 3조 개 토큰으로 구성된 훈련 데이터셋과 '네모 짐' 등 오픈소스 라이브러리도 공개했다. 모든 도구와 데이터셋은 깃허브와 허깅 페이스를 통해 즉시 이용 가능하다. 젠슨 황 엔비디아 최고경영자(CEO)는 "오픈 혁신은 AI 발전의 토대"라며 "네모트론을 통해 첨단 AI를 개방형 플랫폼으로 전환하고, 개발자들이 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하겠다"고 밝혔다.

2025.12.17 14:37김미정 기자

[인터뷰] 줌 "화상회의 플랫폼 넘어서…AI로 모든 업무 환경 지원"

[샌프란시스코(미국)=김미정 기자] "우리는 더이상 화상회의 플랫폼만 제공하지 않습니다. 인공지능(AI) 기술을 앞세워 회의를 비롯한 전화, 채팅, 컨택센터, 문서 협업 기능을 통합 제공합니다. 이를 통해 고객이 줌에서 논의한 내용을 실제 비즈니스 결과로 이어질 수 있도록 돕는 것이 목표입니다." 벨챠미 샨카르링암 줌 프로덕트 및 엔지니어링 부문 사장은 최근 미국 샌프란시스코 산호세 본사에서 진행한 그룹 인터뷰를 통해 사업 전략을 이같이 밝혔다. 단순 화상회의 플랫폼에서 업무 전반을 책임지는 플랫폼으로 패러다임을 바꾸겠다는 포부다. 최근 줌은 플랫폼 새 버전 'AI 컴패니언 3.0'을 공개했다. 이번 버전은 회의 요약뿐 아니라 대화 내용 바탕으로 업무 실행까지 자동화하는 에이전틱 AI 형태다. AI가 단순히 업무를 제안하는 수준을 넘어 실제 행동을 수행하는 단계로 진화한 것이다. AI 컴패니언 3.0의 에이전틱 AI 기능 중심에는 '페더레이티드 AI'가 있다. 이 시스템은 업무 성격과 결과물 품질 요구에 따라 가장 적합한 모델을 자동 선택하는 분산형 프레임워크다. 줌 거대언어모델(LLM)와 소형모델(SLM)과 오픈AI, 앤트로픽 등 주요 AI 모델로 구성됐다. 예를 들어 회의 요약 같은 단순 업무는 SLM으로 처리하고, 결과물 품질이 충분치 않으면 고성능 모델로 자동 전환하는 식이다. 페더레이티드 AI의 또 다른 장점은 AI 연산이 어디에서 이뤄질지 기업이 직접 정할 수 있다는 것이다. 보안이 중요한 데이터는 온프레미스에서 처리하고, 대규모 분석이 필요한 작업은 클라우드 환경에서 수행 가능하다. 샨카르링암 사장은 "기업이 AI 연산 위치를 나눠 관리하면 데이터 보안을 지키면서도 클라우드 확장성·속도를 맞춤형으로 조절할 수 있다"고 강조했다. 줌은 최근 엔비디아의 오픈소스 모델 시리즈 '네모트론'를 추가 통합하는 작업을 진행 중이다. 그는 "네모트론까지 시스템에 추가하면 플랫폼 성능과 품질, 비용 균형을 지금보다 더 완벽히 잡을 수 있을 것"이라고 내다봤다. "클라우드 전화 고객 1천만 명 달성" 줌은 회의 플랫폼을 넘어 클라우드 전화 시장에서도 성과를 냈다고 강조했다. 대표 솔루션은 '줌 폰'이다. 이 솔루션은 클라우드 음성 통신 서비스다. 회의나 메시징, 컨택센터를 하나로 통합한 글로벌 통신 플랫폼이다. 현재 전 세계 1천만 명 이상이 줌 폰을 사용하고 있다. 줌 폰은 AI 기반 통화 요약과 음성 메시지 자동 분류 기능 등을 지원한다. 통화가 끝나면 AI가 대화 내용을 요약하고, 중요도에 따라 메시지를 분류한다. 해당 기능은 기존 구독 요금제에 포함돼 추가 비용 없이 제공된다. 샨카르링암 사장은 회의 솔루션에 이어 줌 폰을 두 번째 핵심 사업 축으로 육성하고 있다고 강조했다. 그는 "향후 통합 커뮤니케이션 전반에 AI 기능을 결합해 대화에서 업무 실행으로 이어지는 비즈니스 경험을 제공하는 것을 전략 목표로 정했다"고 말했다. 샨카르링암 사장은 줌 폰의 가장 큰 기술 차별점으로 '복원력'을 꼽았다. 그는 "우리는 전 세계에 다중 데이터센터를 운영하며 특정 클라우드 사업자에 단일 의존하지 않는 구조를 갖췄다"고 강조했다. 이어 "서비스 장애나 트래픽 폭주 상황 속에서도 안정적인 통화 품질을 유지할 수 있다"고 덧붙였다. 그는 줌 폰의 '서바이버빌리티 모드'도 주요 기능으로 소개했다. 이 기능은 병원이나 공항처럼 네트워크 연결이 끊기는 비상 상황에서 로컬 가상머신(VM)을 자동 실행하는 역할을 맡는다. 이를 통해 내부 통신이 중단 없이 지속될 수 있다. 그는 "통신 장애 복구와 자동 전환 기능이 플랫폼의 설계 단계부터 깊이 내장됐다"고 강조했다. "하이브리드 업무 핵심 되겠다" 샨카르링암 사장은 팬데믹이 끝난 뒤에도 회의 솔루션 수요는 여전히 높다고 강조했다. 다만 수요 형태가 원격 참여에서 회의실 중심의 협업 형태로 바뀌고 있다고 분석했다. 또 온라인과 오프라인이 혼합된 하이브리드 근무 환경이 늘었다고 봤다. 그는 "팬데믹 당시 다수 직원이 재택근무를 했지만, 지금은 각 기업이 상황에 맞는 하이브리드 근무 방식을 도입하고 있다"고 설명했다. 이어 "하이브리드 업무 환경은 기존 근무 형태보다 훨씬 복잡하다"며 "기업마다 업무 방식이 모두 다르고, 심지어 팀 단위로도 근무 정책이 다르기 때문"이라고 설명했다. 샨카르링암 사장은 이처럼 다양해진 근무 환경을 모두 지원할 수 있는 플랫폼을 구축하는 것이 목표라고 재차 강조했다. 그는 "우리는 오프라인과 온라인을 오가는 사용자 생산성을 높이는 데 집중하고 있다"며 "어떤 형태 근무 환경이든 AI 컴패니언과 줌 폰 등 통합 플랫폼을 통해 지원하겠다"고 밝혔다.

2025.11.02 12:00김미정 기자

줌, 엔비디아 '네모트론' 도입…기업 맞춤 추론 '강화'

줌이 엔비디아 손잡고 기업 맞춤형 인공지능(AI) 추론 기능을 업그레이드했다. 줌은 엔비디아의 오픈 모델 기술 '네모트론'을 연합형 AI 아키텍처에 통합했다고 28일 밝혔다. 이를 통해 줌 'AI 컴패니언 3.0'의 적용 범위를 금융·의료·공공 등 다양한 산업군으로 확장할 방침이다. 줌의 연합형 AI 아키텍처는 작업 특성에 따라 최적의 언어 모델을 자동 선택해 처리하는 하이브리드 구조다. 빠른 응답과 품질을 위해 자체 소규모 언어 모델(SLM)과 거대언어모델(LLM)을 유기적으로 결합하는 방식으로 이뤄졌다. 이번 통합으로 줌 AI 컴패니언은 엔비디아의 인프라와 다양한 모델을 활용할 수 있게 됐다. 줌은 "우리는 서비스 기능을 강화하면서도 비용 부담을 낮췄다"며 "고객은 더 정교하고 유연한 AI 지원을 받을 수 있다"고 강조했다. 엔비디아의 생성형 AI 개발 도구 '네모'를 기반으로 설계된 줌의 LLM은 약 490억 개 파라미터 규모로 이뤄졌다. 이 모델은 속도와 정확도, 비용 효율 균형을 목표로 개발됐으며, 개방형과 폐쇄형 모델의 강점을 모두 결합한 것으로 평가받고 있다. 기업과 공공기관은 이를 통해 더 빠른 워크플로와 고도화된 추론 능력을 경험할 수 있다. 줌은 이번 협업으로 연합형 AI 아키텍처의 완성도를 높였다고 강조했다. 특히 라마와 네모트론을 기반으로 한 고도화 추론 모델을 결합해 정확도·성능·비용 효율을 동시에 실현했다는 입장이다. 회의 기록·요약·번역 등 주요 기능에서 이미 검증된 AI 접근법에 엔비디아 기술을 더해 확장성을 높였다는 점도 알렸다. 줌은 AI 컴패니언이 마이크로소프트 365, 팀즈, 구글 워크스페이스, 슬랙, 세일즈포스, 서비스나우 등 주요 비즈니스 플랫폼과 연동된다고 밝혔다. 이를 통해 보안성과 확장성을 모두 확보한 고성능 AI 경험을 빠르게 고객에게 제공할 방침이다. 쉐동 황 줌 최고기술책임자(CTO)는 "엔비디아의 그래픽처리장치(GPU)와 AI 스택을 활용해 모델 선택 속도와 비용 효율성을 높였고 시장 출시 속도도 향상됐다"며 "네모트론 오픈 기술을 통해 검색증강생성(RAG) 기능 개발이 가속화됐다"고 말했다. 카리 브리스키 엔비디아 부사장도 "줌과의 협업은 이제 시작에 불과하다"며 "앞으로 더욱 스마트하고 효율적인 AI 추론 기술을 제공해 나갈 것"이라고 밝혔다.

2025.10.29 06:38김미정 기자

엔비디아 '네모 가드레일' 공개…에이전트 폭주 방지로 AI 신뢰도 ↑

엔비디아가 생성형 AI 시대를 맞아 '네모 가드레일(NeMo Guardrails)' 솔루션을 통해 거대 언어 모델(LLM) 활용에 필요한 안전성과 신뢰도를 대폭 높이고 있다. 개발자가 직접 AI의 안전장치인 '가드레일'을 프로그래밍해 AI 에이전트(Agentic AI)를 제어·관리할 수 있는 것이 핵심으로, 엔비디아는 이를 오픈소스 형태로 제공해 다양한 서드파티 솔루션·브랜드 정책과 연동할 수 있도록 제공한다. 16일 업계에 따르면 최근 여러 기업들이 LLM 기술을 활용한 에이전트 AI를 경쟁적으로 선보이고 있다. 이러한 초거대 언어 모델이 예기치 않은 발언을 하거나 민감 정보를 노출하는 등 위험 요소가 늘어남에 따라 이를 사전에 제어·차단하는 '가드레일' 수요도 빠르게 증가하는 추세다. 이에 대응해 지난 2023년 4월 출시된 엔비디아 네모 가드레일은 크게 ▲콘텐츠 안전성 ▲주제 제어 ▲탈옥 방지 등 세 가지 주요 가드레일 모델로 구성됐다. 각각 유해·위험 발언 차단, 대화 주제 이탈 방지, 보안 우회 시도 차단에 특화됐다. 엔비디아 측은 이러한 가드레일을 병렬로 적용해도 처리 지연(latency)이 크지 않도록 GPU 최적화를 거쳤다고 강조하고 있다. '네모 가드레일'의 '콘텐츠 안전성(Content Safety)' 기능은 AI 대화나 에이전트가 생성하는 텍스트에서 유해·위험·비윤리적 발언을 사전에 차단한다. 엔비디아의 '이지스 콘텐츠 안전 데이터셋'으로 학습됐으며 3만5천 건 이상의 인공지능 안전성 주석 데이터를 바탕으로 폭넓은 시나리오를 커버한다. 이를 통해 잘못된 정보나 악의적 콘텐츠가 사용자에게 직접 전달되는 상황을 줄일 수 있다는 설명이다. '주제 제어(Topic Control)'는 대화 주제가 시스템 프롬프트나 브랜드 정책에서 벗어나지 않도록 관리한다. 단순 질의응답을 넘어 여러 차례의 대화가 이어질 때 에이전트가 불필요하거나 민감한 영역으로 빠지는 것을 막아주는 역할을 한다. 일례로 자동차 제조사 에이전트의 경우 경쟁사 차량과의 비교 등의 발언을 아예 금지하거나 특정 주제만 다루도록 제한하는 식이다. 복잡한 대화가 진행될수록 브랜드 일관성·규제 준수가 중요해지는 산업군에서 특히 주목받고 있다. '탈옥(Jailbreak) 방지' 모델은 AI 모델이 설정된 보호 장치를 교묘하게 우회해 민감 정보를 드러내거나 부적절한 기능을 수행하지 못하도록 막는다. 엔비디아는 1만7천 개 이상의 악의적 프롬프트 샘플을 통해 모델을 학습시켰으며 내부의 LLM 레드팀 테스트 툴을 활용해 새롭게 등장하는 공격 방식을 지속적으로 탐지·학습한다. 이를 통해 기업들이 실제 환경에서 운영 중인 AI 에이전트의 보안을 한층 더 강화하고 있다. '네모 가드레일'은 엔비디아 AI 엔터프라이즈 라이선스 체계로 운영되며 GPU당 연간 4천500달러(한화 약 630만원) 선의 비용이 소요된다. 실제 사용량과 기업 규모에 따라 차이가 발생할 수 있으나 개발 및 배포 효율성·안정성을 감안하면 비용 대비 효과가 충분하다는 것이 엔비디아 측의 설명이다. 이와 별개로 네모 가드레일 기본 프레임워크 자체는 오픈소스로 무료 제공된다. 이러한 기본 모드의 오픈소스 정책에 따라 기업이 직접 정책을 추가하거나 서드파티 가드레일을 도입하기가 용이하다. 엔비디아 측은 모든 이용 사례와 규정을 자사가 일일이 규정할 수 없으므로 오픈소스·모듈형 설계를 채택해 각 기업이 상황에 맞게 커스터마이징할 수 있게 했다는 입장이다. 업계에서는 특정 산업 규제나 민감 데이터 처리를 위한 맞춤형 가드레일을 구축하기 한층 수월해졌다는 평가를 하고 있다. 실제로 소매업, 통신사, 자동차 산업 등 다양한 분야의 기업들이 이미 '네모 가드레일'을 활용해 에이전트 제어 시스템을 구현하고 있다. 민감한 금융·청구 관련 정보를 다루거나 안전 운행을 보조해야 하는 경우처럼 오류나 부적절한 정보 노출이 절대 불가한 상황에서 가드레일의 역할이 돋보인다는 설명이다. 업계 전문가들은 "에이전틱 AI 시대에 IT 부서들이 AI를 인사·총무처럼 관리할 필요성이 커지는 와중에 이런 역할을 수행하는 솔루션 중 하나가 '네모 가드레일'"이라며 "가드레일 도입을 통해 AI가 사용자에게 줄 수 있는 가치는 키우면서도 위험 요소는 줄이는 길이 열리도록 해야한다"고 평가했다.

2025.01.16 23:05조이환 기자

Prev 1 Next