• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'엔비디아 네모'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아, 오픈 모델로 '의료 AI' 혁신…헬스케어·신약 개발 가속

엔비디아가 오픈 모델과 데이터 플랫폼을 결합해 의료·생명과학 분야에 인공지능(AI) 활용 범위를 넓혔다. 엔비디아는 19일(현지시간)까지 미국 새너제이에서 열린 'GTC 2026'에서 '네모트론' 오픈 모델과 '네모 라이브러리'를 공개하고 의료 특화 AI 구축·배포를 지원한다고 밝혔다. 네모트론 오픈 모델은 오픈 가중치와 학습 레시피를 제공한다. 이를 통해 의료진과 개발자가 자체 인프라에서 맞춤형 AI 에이전트를 직접 구축할 수 있게 돕는다. 멀티모달 의료 데이터 증가에 대응해 고효율·저지연 처리 구조까지 제공해 기존 폐쇄형 시스템 의존도를 줄인다. 네모 라이브러리는 의료 전문 용어에 맞춘 파인튜닝을 지원해 범용 모델의 한계를 보완한다. 실제 헤이디 헬스는 네모트론 스피치 도입 후 지연 시간을 75% 줄이고 운영 비용을 64% 절감했다. 헬스케어 기업도 네모트론 기반으로 에이전틱 AI 도입을 확대하고 있다. 히포크라틱 AI는 임상 대화 모델을 구축했으며, 소드 헬스는 정신 건강 지원 모델을 고도화하고 있다. 또 아이큐비아와 오픈에비던스 베릴리도 각각 생명과학 연구와 의료 지식 통합 서비스에 활용하고 있다. 엔비디아는 바이오네모 플랫폼을 통해 생명과학 데이터 처리 영역도 확장했다. 파라브릭스와 쿠다-X 데이터 사이언스 라이브러리를 결합해 유전체 분석 속도를 높이고 연구 기간을 크게 단축하는 구조다. 베이스캠프 리서치는 초대규모 유전체 데이터 프로젝트를 통해 기존 공개 데이터 대비 10배 이상 큰 데이터셋을 구축했다. 이를 기반으로 수천조 개 DNA 염기쌍을 분석하며 기존 수십 년 걸리던 작업을 2년 미만으로 줄일 수 있는 환경을 마련했다. 타호 테라퓨틱스는 1억 개 세포 데이터 기반으로 가상 세포 모델을 개발했다. 향후 10억 개 세포 규모로 확장해 실제 실험 없이 치료 연구를 진행하는 시뮬레이션 환경을 구축할 계획이다. 퍼터브AI는 약 800만 개 뇌 세포 데이터를 활용한 CRISPR 유전체 아틀라스를 공개했다. 그래픽처리장치(GPU) 가속을 통해 분석 시간을 기존 며칠에서 실시간 수준으로 단축하며 질환 연구 속도를 높이고 있다. 엔비디아가 발표한 '헬스케어와 생명과학 분야 AI 현황' 조사에 따르면 의료 업계 리더 82%가 오픈소스를 핵심 전략으로 보고 있다. 엔비디아는 "의료 기관은 오픈 모델을 도입하고 이를 파인튜닝함으로써 데이터 주권을 확보할 수 있다"며 "투명성과 재현성에 대한 통제력을 유지하면서도 복잡한 에이전틱 애플리케이션에 필요한 높은 정확도를 확보할 것 이라고"고 밝혔다.

2026.03.20 18:15김미정 기자

[AI는 지금] 'CEO 교체 카드' 꺼낸 어도비, 엔비디아 손잡고 AI·3D로 반전 노린다

최근 18년만에 최고경영자(CEO) 교체 수순에 들어간 어도비가 '인공지능(AI) 생태계 강자'인 엔비디아와 손잡고 반전 카드 마련에 나섰다. 생성형 AI 확산으로 기존 크리에이티브 소프트웨어 시장의 지형이 흔들리자 엔비디아를 구원투수로 삼고 사업 구조 전환에 본격 착수한 분위기다. 엔비디아는 미국 새너제이에서 열린 세계 최대 AI·가속 컴퓨팅 콘퍼런스인 '엔비디아 GTC 2026'에서 어도비와 전략적 파트너십을 체결했다고 18일 밝혔다. 이번 일로 양사는 AI 기반 창작, 프로덕션, 개인화를 가속하며, 차세대 어도비 파이어플라이 파운데이션 모델과 에이전틱 워크플로우 제공을 위해 협력할 예정이다.이번 파트너십을 통해 어도비는 AI 전환에 필요한 핵심 인프라를 한 축에서 확보할 수 있게 됐다. 엔비디아가 AI 반도체를 넘어 모델 개발용 소프트웨어, 에이전트 프레임워크, 3D 시뮬레이션 플랫폼까지 갖추고 있단 점에서다.이에 어도비는 이번에 단순한 기능 개선을 넘어 콘텐츠 제작 방식 전반의 변화를 노리고 있다. 이를 위해 엔비디아의 쿠다엑스(CUDA-X), 네모(NeMo), 에이전트 툴킷 등을 활용함으로써 이미지·영상·3D 콘텐츠 생성 능력을 고도화하는 동시에 사람이 수행하던 작업을 AI가 대신 수행하는 '에이전틱 워크플로우' 구축에 나선다는 방침이다. 콘텐츠 제작을 개별 툴 중심에서 자동화된 시스템 중심으로 이동시키려는 의도에서다. 또 어도비는 이번 협력을 계기로 기업 시장 공략에 한층 속도를 낼 것으로 보인다. 특히 이번 발표에서 '상업적으로 안전한 AI', '브랜드 아이덴티티 보존', '엔터프라이즈 맞춤형 모델' 등을 강조한 점은 개인 창작자 중심에서 기업 고객 중심으로 무게추를 옮기겠다는 전략으로 해석된다. 생성형 AI 경쟁이 심화되며 범용 콘텐츠 제작 영역의 차별화가 어려워진 만큼, 데이터 통제와 저작권 보호가 중요한 기업 시장에서 경쟁력을 확보하려는 의도다.3D 콘텐츠 영역 확장도 주목된다. 어도비는 엔비디아 옴니버스 라이브러리를 기반으로 제품의 가상 복제본을 구현하는 '3D 디지털 트윈' 솔루션을 선보일 계획이다. 이를 통해 기존 2D 이미지 중심의 마케팅 콘텐츠를 넘어 재사용 가능한 3D 자산 기반 제작 환경을 구축한다는 구상이다. 이는 콘텐츠 생산 방식이 정적 이미지에서 동적·입체형 데이터 중심으로 전환되는 신호로 해석된다. 어도비의 이 같은 행보는 기존 소프트웨어 중심 사업 구조에 대한 위기 인식에서 비롯된 것으로 풀이된다. 생성형 AI 기술 확산으로 이미지와 영상 제작이 자동화되면서 포토샵 등 전문 툴의 진입장벽이 낮아지고, 시장 경쟁 구도가 빠르게 재편되고 있기 때문이다. 실제로 최근 주가 하락과 CEO 교체 역시 이러한 구조 변화에 대한 시장의 우려가 반영된 결과로 해석된다. 업계에선 이번 협력을 어도비의 'AI 전환 가속 페달'로 평가하는 분위기다. 엔비디아의 AI 컴퓨팅 인프라와 모델, 플랫폼을 결합해 새로운 성장 동력을 확보하려는 시도란 분석이다. 다만 엔비디아 의존도가 높아질 수 있다는 점과 구글·오픈AI 등 경쟁사 역시 유사한 전략을 추진하고 있다는 점은 향후 부담 요인으로 지적된다. 업계 관계자는 "크리에이티브 소프트웨어 시장은 이제 단순 기능 경쟁이 아니라 AI 기반 워크플로우와 데이터 생태계 경쟁으로 넘어가고 있다"며 "어도비가 이번 협력을 통해 플랫폼 전환에 성공할 수 있을지가 향후 시장 판도를 좌우할 것"이라고 말했다.

2026.03.18 10:37장유미 기자

엔비디아, 자율주행·로봇·신약 개발까지…차세대 오픈소스 AI 모델 공개

엔비디아가 로봇, 자율주행, 신약 개발 등에 활용되는 오픈소스 인공지능(AI) 모델 제품군을 공개했다. 엔비디아는 17일 미국 새너제이에서 열린 'GTC 2026'에서 새로운 오픈 모델 제품군을 발표했다. 이번 모델은 디지털 환경뿐 아니라 로봇, 자율주행차, 생명과학 연구 등 실제 산업 환경에서 활용할 수 있는 지능형 AI 시스템 구축을 목표로 한다. 먼저 에이전트형 AI 개발을 위한 '네모트론 3' 모델 제품군이 공개됐다. 해당 모델은 언어, 이미지, 음성을 동시에 이해하는 멀티모달 구조를 기반으로 자연스러운 대화와 복잡한 추론, 영상·문서 분석을 지원한다. 최상위 모델인 '네모트론 3 울트라'는 엔비디아 블랙웰 플랫폼에서 NVFP4 포맷을 활용해 최대 5배 높은 처리 효율을 제공한다. 코딩 지원, 검색, 업무 자동화 등 AI 애플리케이션 개발에 활용된다. 랭체인, 코드래빗, 퍼플렉시티, 서비스나우 등 기업들도 네모트론 모델을 활용한 에이전트형 AI 서비스를 개발하고 있다. 로봇과 자율주행차 개발을 위한 물리 AI 모델도 공개됐다. '코스모스 3'는 합성 세계 생성, 물리 AI 추론, 행동 시뮬레이션을 통합한 세계 기반 모델로 복잡한 환경에서 AI가 실제 행동을 학습하도록 지원한다. 휴머노이드 로봇용 모델 '아이작 그루트 N1.7'은 실제 환경에서 활용 가능한 수준으로 발전했다. 자율주행차용 모델 '알파마요 1.5'는 내비게이션 안내와 다중 카메라 인식 기능을 통해 차량의 상황 판단 능력을 강화한다. 젠슨 황 엔비디아 최고경영자(CEO)는 기조연설에서 차세대 로봇 파운데이션 모델 '그루트 N2'도 공개했다. 해당 모델은 새로운 세계 행동 모델 구조를 기반으로 기존 비전, 언어, 행동(VLA) 모델 대비 두 배 이상 높은 작업 성공률을 보인다고 설명했다. 헬스케어 분야에서는 AI 기반 신약 개발을 지원하는 모델도 공개됐다. '프로테이나 콤플렉사'는 단백질 결합 구조 설계를 지원하는 생성형 AI 모델로 구조 기반 신약 개발을 가속하는 데 활용된다. 노보 노디스크, 비바 바이오텍, 매니폴드 바이오 등 제약 기업들이 해당 모델을 활용해 단백질 설계 연구를 진행하고 있다. 엔비디아는 구글 딥마인드, 유럽생물정보연구소, 서울대학교와 협력해 알파폴드 단백질 구조 데이터베이스도 확대했다. 약 3천만 개의 단백질 복합체 예측 데이터를 계산했으며 이 가운데 약 170만 개의 고신뢰 단백질 구조 데이터를 추가했다. 또한 GPU 가속 시뮬레이션 엔진 'nvQSP'도 공개했다. 해당 기술은 임상시험 이전 단계에서 다양한 치료 시나리오를 컴퓨터 모델로 분석할 수 있도록 지원한다. 기존 CPU 기반 시뮬레이션 대비 최대 77배 빠른 성능을 제공한다. 엔비디아는 이번에 공개한 모델과 데이터, 프레임워크를 깃허브, 허깅페이스, 클라우드 AI 플랫폼 등을 통해 제공할 예정이다. 일부 모델은 '엔비디아 NIM' 마이크로서비스 형태로도 제공돼 엣지부터 클라우드까지 다양한 환경에서 활용할 수 있다. 카리 브리스키 엔비디아 생성형 AI 소프트웨어 부사장은 "오픈소스 AI는 글로벌 혁신의 핵심 동력이 됐다"며 "엔비디아의 오픈 모델 제품군은 언어를 넘어 생명과학, 로보틱스, 자율 기계 등 다양한 산업 영역에서 새로운 AI 혁신을 가능하게 할 것"이라고 말했다.

2026.03.17 10:45남혁우 기자

엔비디아, 오픈 모델 '네모트론 3' 시리즈 공개…"추론 속도 4배↑"

엔비디아가 에이전틱 인공지능(AI) 애플리케이션 구축을 위한 오픈 모델 제품군을 공개했다. 엔비디아는 오픈 모델과 데이터, 라이브러리로 구성된 '네모트론 3' 시리즈를 17일 발표했다. 네모트론 3는 '하이브리드 잠재 전문가 혼합(MoE)' 아키텍처로 대규모 멀티 에이전트 시스템 신뢰성을 높였다. 개발자는 이를 통해 통신 과부하와 맥락 이탈, 높은 추론 비용 등 기존 협업형 AI 시스템이 겪던 기술적 난제를 해결할 수 있다. 이 시리즈는 나노, 슈퍼, 울트라로 구성됐다. 네모트론 3 나노는 300억 개의 파라미터를 갖춘 소형 모델이다. 전 세대 대비 4배 높은 처리량을 갖췄다. 소프트웨어 디버깅이나 콘텐츠 요약 같은 작업에 최적화됐다. 추론 토큰 생성량을 최대 60%까지 줄일 수 있다. 내년 상반기 출시 예정인 슈퍼와 울트라 모델은 각각 1천억 개, 5천억 개의 파라미터를 탑재했다. 해당 시리즈는 엔비디아 블랙웰 아키텍처 기반의 고효율 훈련 포맷으로 이뤄져 메모리 요구 사항을 줄이면서도 훈련 속도를 높일 수 있다. 엔비디아는 이번 제품군을 통해 각국 조직이 데이터와 규제, 가치에 부합하는 소버린 AI를 구축하도록 적극 지원한다고 밝혔다. 이미 서비스나우, 퍼플렉시티, 지멘스 등 글로벌 기업들이 네모트론 모델을 자사 워크플로에 통합해 제조, 보안, 미디어 등 다양한 산업 분야에서 활용 중이다. 이날 엔비디아는 전문화된 에이전트 구축을 돕기 위해 3조 개 토큰으로 구성된 훈련 데이터셋과 '네모 짐' 등 오픈소스 라이브러리도 공개했다. 모든 도구와 데이터셋은 깃허브와 허깅 페이스를 통해 즉시 이용 가능하다. 젠슨 황 엔비디아 최고경영자(CEO)는 "오픈 혁신은 AI 발전의 토대"라며 "네모트론을 통해 첨단 AI를 개방형 플랫폼으로 전환하고, 개발자들이 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하겠다"고 밝혔다.

2025.12.17 14:37김미정 기자

[인터뷰] 줌 "화상회의 플랫폼 넘어서…AI로 모든 업무 환경 지원"

[샌프란시스코(미국)=김미정 기자] "우리는 더이상 화상회의 플랫폼만 제공하지 않습니다. 인공지능(AI) 기술을 앞세워 회의를 비롯한 전화, 채팅, 컨택센터, 문서 협업 기능을 통합 제공합니다. 이를 통해 고객이 줌에서 논의한 내용을 실제 비즈니스 결과로 이어질 수 있도록 돕는 것이 목표입니다." 벨챠미 샨카르링암 줌 프로덕트 및 엔지니어링 부문 사장은 최근 미국 샌프란시스코 산호세 본사에서 진행한 그룹 인터뷰를 통해 사업 전략을 이같이 밝혔다. 단순 화상회의 플랫폼에서 업무 전반을 책임지는 플랫폼으로 패러다임을 바꾸겠다는 포부다. 최근 줌은 플랫폼 새 버전 'AI 컴패니언 3.0'을 공개했다. 이번 버전은 회의 요약뿐 아니라 대화 내용 바탕으로 업무 실행까지 자동화하는 에이전틱 AI 형태다. AI가 단순히 업무를 제안하는 수준을 넘어 실제 행동을 수행하는 단계로 진화한 것이다. AI 컴패니언 3.0의 에이전틱 AI 기능 중심에는 '페더레이티드 AI'가 있다. 이 시스템은 업무 성격과 결과물 품질 요구에 따라 가장 적합한 모델을 자동 선택하는 분산형 프레임워크다. 줌 거대언어모델(LLM)와 소형모델(SLM)과 오픈AI, 앤트로픽 등 주요 AI 모델로 구성됐다. 예를 들어 회의 요약 같은 단순 업무는 SLM으로 처리하고, 결과물 품질이 충분치 않으면 고성능 모델로 자동 전환하는 식이다. 페더레이티드 AI의 또 다른 장점은 AI 연산이 어디에서 이뤄질지 기업이 직접 정할 수 있다는 것이다. 보안이 중요한 데이터는 온프레미스에서 처리하고, 대규모 분석이 필요한 작업은 클라우드 환경에서 수행 가능하다. 샨카르링암 사장은 "기업이 AI 연산 위치를 나눠 관리하면 데이터 보안을 지키면서도 클라우드 확장성·속도를 맞춤형으로 조절할 수 있다"고 강조했다. 줌은 최근 엔비디아의 오픈소스 모델 시리즈 '네모트론'를 추가 통합하는 작업을 진행 중이다. 그는 "네모트론까지 시스템에 추가하면 플랫폼 성능과 품질, 비용 균형을 지금보다 더 완벽히 잡을 수 있을 것"이라고 내다봤다. "클라우드 전화 고객 1천만 명 달성" 줌은 회의 플랫폼을 넘어 클라우드 전화 시장에서도 성과를 냈다고 강조했다. 대표 솔루션은 '줌 폰'이다. 이 솔루션은 클라우드 음성 통신 서비스다. 회의나 메시징, 컨택센터를 하나로 통합한 글로벌 통신 플랫폼이다. 현재 전 세계 1천만 명 이상이 줌 폰을 사용하고 있다. 줌 폰은 AI 기반 통화 요약과 음성 메시지 자동 분류 기능 등을 지원한다. 통화가 끝나면 AI가 대화 내용을 요약하고, 중요도에 따라 메시지를 분류한다. 해당 기능은 기존 구독 요금제에 포함돼 추가 비용 없이 제공된다. 샨카르링암 사장은 회의 솔루션에 이어 줌 폰을 두 번째 핵심 사업 축으로 육성하고 있다고 강조했다. 그는 "향후 통합 커뮤니케이션 전반에 AI 기능을 결합해 대화에서 업무 실행으로 이어지는 비즈니스 경험을 제공하는 것을 전략 목표로 정했다"고 말했다. 샨카르링암 사장은 줌 폰의 가장 큰 기술 차별점으로 '복원력'을 꼽았다. 그는 "우리는 전 세계에 다중 데이터센터를 운영하며 특정 클라우드 사업자에 단일 의존하지 않는 구조를 갖췄다"고 강조했다. 이어 "서비스 장애나 트래픽 폭주 상황 속에서도 안정적인 통화 품질을 유지할 수 있다"고 덧붙였다. 그는 줌 폰의 '서바이버빌리티 모드'도 주요 기능으로 소개했다. 이 기능은 병원이나 공항처럼 네트워크 연결이 끊기는 비상 상황에서 로컬 가상머신(VM)을 자동 실행하는 역할을 맡는다. 이를 통해 내부 통신이 중단 없이 지속될 수 있다. 그는 "통신 장애 복구와 자동 전환 기능이 플랫폼의 설계 단계부터 깊이 내장됐다"고 강조했다. "하이브리드 업무 핵심 되겠다" 샨카르링암 사장은 팬데믹이 끝난 뒤에도 회의 솔루션 수요는 여전히 높다고 강조했다. 다만 수요 형태가 원격 참여에서 회의실 중심의 협업 형태로 바뀌고 있다고 분석했다. 또 온라인과 오프라인이 혼합된 하이브리드 근무 환경이 늘었다고 봤다. 그는 "팬데믹 당시 다수 직원이 재택근무를 했지만, 지금은 각 기업이 상황에 맞는 하이브리드 근무 방식을 도입하고 있다"고 설명했다. 이어 "하이브리드 업무 환경은 기존 근무 형태보다 훨씬 복잡하다"며 "기업마다 업무 방식이 모두 다르고, 심지어 팀 단위로도 근무 정책이 다르기 때문"이라고 설명했다. 샨카르링암 사장은 이처럼 다양해진 근무 환경을 모두 지원할 수 있는 플랫폼을 구축하는 것이 목표라고 재차 강조했다. 그는 "우리는 오프라인과 온라인을 오가는 사용자 생산성을 높이는 데 집중하고 있다"며 "어떤 형태 근무 환경이든 AI 컴패니언과 줌 폰 등 통합 플랫폼을 통해 지원하겠다"고 밝혔다.

2025.11.02 12:00김미정 기자

줌, 엔비디아 '네모트론' 도입…기업 맞춤 추론 '강화'

줌이 엔비디아 손잡고 기업 맞춤형 인공지능(AI) 추론 기능을 업그레이드했다. 줌은 엔비디아의 오픈 모델 기술 '네모트론'을 연합형 AI 아키텍처에 통합했다고 28일 밝혔다. 이를 통해 줌 'AI 컴패니언 3.0'의 적용 범위를 금융·의료·공공 등 다양한 산업군으로 확장할 방침이다. 줌의 연합형 AI 아키텍처는 작업 특성에 따라 최적의 언어 모델을 자동 선택해 처리하는 하이브리드 구조다. 빠른 응답과 품질을 위해 자체 소규모 언어 모델(SLM)과 거대언어모델(LLM)을 유기적으로 결합하는 방식으로 이뤄졌다. 이번 통합으로 줌 AI 컴패니언은 엔비디아의 인프라와 다양한 모델을 활용할 수 있게 됐다. 줌은 "우리는 서비스 기능을 강화하면서도 비용 부담을 낮췄다"며 "고객은 더 정교하고 유연한 AI 지원을 받을 수 있다"고 강조했다. 엔비디아의 생성형 AI 개발 도구 '네모'를 기반으로 설계된 줌의 LLM은 약 490억 개 파라미터 규모로 이뤄졌다. 이 모델은 속도와 정확도, 비용 효율 균형을 목표로 개발됐으며, 개방형과 폐쇄형 모델의 강점을 모두 결합한 것으로 평가받고 있다. 기업과 공공기관은 이를 통해 더 빠른 워크플로와 고도화된 추론 능력을 경험할 수 있다. 줌은 이번 협업으로 연합형 AI 아키텍처의 완성도를 높였다고 강조했다. 특히 라마와 네모트론을 기반으로 한 고도화 추론 모델을 결합해 정확도·성능·비용 효율을 동시에 실현했다는 입장이다. 회의 기록·요약·번역 등 주요 기능에서 이미 검증된 AI 접근법에 엔비디아 기술을 더해 확장성을 높였다는 점도 알렸다. 줌은 AI 컴패니언이 마이크로소프트 365, 팀즈, 구글 워크스페이스, 슬랙, 세일즈포스, 서비스나우 등 주요 비즈니스 플랫폼과 연동된다고 밝혔다. 이를 통해 보안성과 확장성을 모두 확보한 고성능 AI 경험을 빠르게 고객에게 제공할 방침이다. 쉐동 황 줌 최고기술책임자(CTO)는 "엔비디아의 그래픽처리장치(GPU)와 AI 스택을 활용해 모델 선택 속도와 비용 효율성을 높였고 시장 출시 속도도 향상됐다"며 "네모트론 오픈 기술을 통해 검색증강생성(RAG) 기능 개발이 가속화됐다"고 말했다. 카리 브리스키 엔비디아 부사장도 "줌과의 협업은 이제 시작에 불과하다"며 "앞으로 더욱 스마트하고 효율적인 AI 추론 기술을 제공해 나갈 것"이라고 밝혔다.

2025.10.29 06:38김미정 기자

엔비디아 '네모 가드레일' 공개…에이전트 폭주 방지로 AI 신뢰도 ↑

엔비디아가 생성형 AI 시대를 맞아 '네모 가드레일(NeMo Guardrails)' 솔루션을 통해 거대 언어 모델(LLM) 활용에 필요한 안전성과 신뢰도를 대폭 높이고 있다. 개발자가 직접 AI의 안전장치인 '가드레일'을 프로그래밍해 AI 에이전트(Agentic AI)를 제어·관리할 수 있는 것이 핵심으로, 엔비디아는 이를 오픈소스 형태로 제공해 다양한 서드파티 솔루션·브랜드 정책과 연동할 수 있도록 제공한다. 16일 업계에 따르면 최근 여러 기업들이 LLM 기술을 활용한 에이전트 AI를 경쟁적으로 선보이고 있다. 이러한 초거대 언어 모델이 예기치 않은 발언을 하거나 민감 정보를 노출하는 등 위험 요소가 늘어남에 따라 이를 사전에 제어·차단하는 '가드레일' 수요도 빠르게 증가하는 추세다. 이에 대응해 지난 2023년 4월 출시된 엔비디아 네모 가드레일은 크게 ▲콘텐츠 안전성 ▲주제 제어 ▲탈옥 방지 등 세 가지 주요 가드레일 모델로 구성됐다. 각각 유해·위험 발언 차단, 대화 주제 이탈 방지, 보안 우회 시도 차단에 특화됐다. 엔비디아 측은 이러한 가드레일을 병렬로 적용해도 처리 지연(latency)이 크지 않도록 GPU 최적화를 거쳤다고 강조하고 있다. '네모 가드레일'의 '콘텐츠 안전성(Content Safety)' 기능은 AI 대화나 에이전트가 생성하는 텍스트에서 유해·위험·비윤리적 발언을 사전에 차단한다. 엔비디아의 '이지스 콘텐츠 안전 데이터셋'으로 학습됐으며 3만5천 건 이상의 인공지능 안전성 주석 데이터를 바탕으로 폭넓은 시나리오를 커버한다. 이를 통해 잘못된 정보나 악의적 콘텐츠가 사용자에게 직접 전달되는 상황을 줄일 수 있다는 설명이다. '주제 제어(Topic Control)'는 대화 주제가 시스템 프롬프트나 브랜드 정책에서 벗어나지 않도록 관리한다. 단순 질의응답을 넘어 여러 차례의 대화가 이어질 때 에이전트가 불필요하거나 민감한 영역으로 빠지는 것을 막아주는 역할을 한다. 일례로 자동차 제조사 에이전트의 경우 경쟁사 차량과의 비교 등의 발언을 아예 금지하거나 특정 주제만 다루도록 제한하는 식이다. 복잡한 대화가 진행될수록 브랜드 일관성·규제 준수가 중요해지는 산업군에서 특히 주목받고 있다. '탈옥(Jailbreak) 방지' 모델은 AI 모델이 설정된 보호 장치를 교묘하게 우회해 민감 정보를 드러내거나 부적절한 기능을 수행하지 못하도록 막는다. 엔비디아는 1만7천 개 이상의 악의적 프롬프트 샘플을 통해 모델을 학습시켰으며 내부의 LLM 레드팀 테스트 툴을 활용해 새롭게 등장하는 공격 방식을 지속적으로 탐지·학습한다. 이를 통해 기업들이 실제 환경에서 운영 중인 AI 에이전트의 보안을 한층 더 강화하고 있다. '네모 가드레일'은 엔비디아 AI 엔터프라이즈 라이선스 체계로 운영되며 GPU당 연간 4천500달러(한화 약 630만원) 선의 비용이 소요된다. 실제 사용량과 기업 규모에 따라 차이가 발생할 수 있으나 개발 및 배포 효율성·안정성을 감안하면 비용 대비 효과가 충분하다는 것이 엔비디아 측의 설명이다. 이와 별개로 네모 가드레일 기본 프레임워크 자체는 오픈소스로 무료 제공된다. 이러한 기본 모드의 오픈소스 정책에 따라 기업이 직접 정책을 추가하거나 서드파티 가드레일을 도입하기가 용이하다. 엔비디아 측은 모든 이용 사례와 규정을 자사가 일일이 규정할 수 없으므로 오픈소스·모듈형 설계를 채택해 각 기업이 상황에 맞게 커스터마이징할 수 있게 했다는 입장이다. 업계에서는 특정 산업 규제나 민감 데이터 처리를 위한 맞춤형 가드레일을 구축하기 한층 수월해졌다는 평가를 하고 있다. 실제로 소매업, 통신사, 자동차 산업 등 다양한 분야의 기업들이 이미 '네모 가드레일'을 활용해 에이전트 제어 시스템을 구현하고 있다. 민감한 금융·청구 관련 정보를 다루거나 안전 운행을 보조해야 하는 경우처럼 오류나 부적절한 정보 노출이 절대 불가한 상황에서 가드레일의 역할이 돋보인다는 설명이다. 업계 전문가들은 "에이전틱 AI 시대에 IT 부서들이 AI를 인사·총무처럼 관리할 필요성이 커지는 와중에 이런 역할을 수행하는 솔루션 중 하나가 '네모 가드레일'"이라며 "가드레일 도입을 통해 AI가 사용자에게 줄 수 있는 가치는 키우면서도 위험 요소는 줄이는 길이 열리도록 해야한다"고 평가했다.

2025.01.16 23:05조이환 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

공공클라우드 인증, 국정원으로 단일화...CSAP 10년만에 해체

권봉석 LG 부회장 "벤츠와 배터리 협력 강화…사업 규모 3배 성장"

맘스터치 매장 난동 사건, 뒤늦게 논란…"경찰 조사 중"

월드컵 JTBC 단독중계 피했다...KBS 공동 중계

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.