• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
인공지능
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'엔비디아 네모'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[인터뷰] 줌 "화상회의 플랫폼 넘어서…AI로 모든 업무 환경 지원"

[샌프란시스코(미국)=김미정 기자] "우리는 더이상 화상회의 플랫폼만 제공하지 않습니다. 인공지능(AI) 기술을 앞세워 회의를 비롯한 전화, 채팅, 컨택센터, 문서 협업 기능을 통합 제공합니다. 이를 통해 고객이 줌에서 논의한 내용을 실제 비즈니스 결과로 이어질 수 있도록 돕는 것이 목표입니다." 벨챠미 샨카르링암 줌 프로덕트 및 엔지니어링 부문 사장은 최근 미국 샌프란시스코 산호세 본사에서 진행한 그룹 인터뷰를 통해 사업 전략을 이같이 밝혔다. 단순 화상회의 플랫폼에서 업무 전반을 책임지는 플랫폼으로 패러다임을 바꾸겠다는 포부다. 최근 줌은 플랫폼 새 버전 'AI 컴패니언 3.0'을 공개했다. 이번 버전은 회의 요약뿐 아니라 대화 내용 바탕으로 업무 실행까지 자동화하는 에이전틱 AI 형태다. AI가 단순히 업무를 제안하는 수준을 넘어 실제 행동을 수행하는 단계로 진화한 것이다. AI 컴패니언 3.0의 에이전틱 AI 기능 중심에는 '페더레이티드 AI'가 있다. 이 시스템은 업무 성격과 결과물 품질 요구에 따라 가장 적합한 모델을 자동 선택하는 분산형 프레임워크다. 줌 거대언어모델(LLM)와 소형모델(SLM)과 오픈AI, 앤트로픽 등 주요 AI 모델로 구성됐다. 예를 들어 회의 요약 같은 단순 업무는 SLM으로 처리하고, 결과물 품질이 충분치 않으면 고성능 모델로 자동 전환하는 식이다. 페더레이티드 AI의 또 다른 장점은 AI 연산이 어디에서 이뤄질지 기업이 직접 정할 수 있다는 것이다. 보안이 중요한 데이터는 온프레미스에서 처리하고, 대규모 분석이 필요한 작업은 클라우드 환경에서 수행 가능하다. 샨카르링암 사장은 "기업이 AI 연산 위치를 나눠 관리하면 데이터 보안을 지키면서도 클라우드 확장성·속도를 맞춤형으로 조절할 수 있다"고 강조했다. 줌은 최근 엔비디아의 오픈소스 모델 시리즈 '네모트론'를 추가 통합하는 작업을 진행 중이다. 그는 "네모트론까지 시스템에 추가하면 플랫폼 성능과 품질, 비용 균형을 지금보다 더 완벽히 잡을 수 있을 것"이라고 내다봤다. "클라우드 전화 고객 1천만 명 달성" 줌은 회의 플랫폼을 넘어 클라우드 전화 시장에서도 성과를 냈다고 강조했다. 대표 솔루션은 '줌 폰'이다. 이 솔루션은 클라우드 음성 통신 서비스다. 회의나 메시징, 컨택센터를 하나로 통합한 글로벌 통신 플랫폼이다. 현재 전 세계 1천만 명 이상이 줌 폰을 사용하고 있다. 줌 폰은 AI 기반 통화 요약과 음성 메시지 자동 분류 기능 등을 지원한다. 통화가 끝나면 AI가 대화 내용을 요약하고, 중요도에 따라 메시지를 분류한다. 해당 기능은 기존 구독 요금제에 포함돼 추가 비용 없이 제공된다. 샨카르링암 사장은 회의 솔루션에 이어 줌 폰을 두 번째 핵심 사업 축으로 육성하고 있다고 강조했다. 그는 "향후 통합 커뮤니케이션 전반에 AI 기능을 결합해 대화에서 업무 실행으로 이어지는 비즈니스 경험을 제공하는 것을 전략 목표로 정했다"고 말했다. 샨카르링암 사장은 줌 폰의 가장 큰 기술 차별점으로 '복원력'을 꼽았다. 그는 "우리는 전 세계에 다중 데이터센터를 운영하며 특정 클라우드 사업자에 단일 의존하지 않는 구조를 갖췄다"고 강조했다. 이어 "서비스 장애나 트래픽 폭주 상황 속에서도 안정적인 통화 품질을 유지할 수 있다"고 덧붙였다. 그는 줌 폰의 '서바이버빌리티 모드'도 주요 기능으로 소개했다. 이 기능은 병원이나 공항처럼 네트워크 연결이 끊기는 비상 상황에서 로컬 가상머신(VM)을 자동 실행하는 역할을 맡는다. 이를 통해 내부 통신이 중단 없이 지속될 수 있다. 그는 "통신 장애 복구와 자동 전환 기능이 플랫폼의 설계 단계부터 깊이 내장됐다"고 강조했다. "하이브리드 업무 핵심 되겠다" 샨카르링암 사장은 팬데믹이 끝난 뒤에도 회의 솔루션 수요는 여전히 높다고 강조했다. 다만 수요 형태가 원격 참여에서 회의실 중심의 협업 형태로 바뀌고 있다고 분석했다. 또 온라인과 오프라인이 혼합된 하이브리드 근무 환경이 늘었다고 봤다. 그는 "팬데믹 당시 다수 직원이 재택근무를 했지만, 지금은 각 기업이 상황에 맞는 하이브리드 근무 방식을 도입하고 있다"고 설명했다. 이어 "하이브리드 업무 환경은 기존 근무 형태보다 훨씬 복잡하다"며 "기업마다 업무 방식이 모두 다르고, 심지어 팀 단위로도 근무 정책이 다르기 때문"이라고 설명했다. 샨카르링암 사장은 이처럼 다양해진 근무 환경을 모두 지원할 수 있는 플랫폼을 구축하는 것이 목표라고 재차 강조했다. 그는 "우리는 오프라인과 온라인을 오가는 사용자 생산성을 높이는 데 집중하고 있다"며 "어떤 형태 근무 환경이든 AI 컴패니언과 줌 폰 등 통합 플랫폼을 통해 지원하겠다"고 밝혔다.

2025.11.02 12:00김미정

줌, 엔비디아 '네모트론' 도입…기업 맞춤 추론 '강화'

줌이 엔비디아 손잡고 기업 맞춤형 인공지능(AI) 추론 기능을 업그레이드했다. 줌은 엔비디아의 오픈 모델 기술 '네모트론'을 연합형 AI 아키텍처에 통합했다고 28일 밝혔다. 이를 통해 줌 'AI 컴패니언 3.0'의 적용 범위를 금융·의료·공공 등 다양한 산업군으로 확장할 방침이다. 줌의 연합형 AI 아키텍처는 작업 특성에 따라 최적의 언어 모델을 자동 선택해 처리하는 하이브리드 구조다. 빠른 응답과 품질을 위해 자체 소규모 언어 모델(SLM)과 거대언어모델(LLM)을 유기적으로 결합하는 방식으로 이뤄졌다. 이번 통합으로 줌 AI 컴패니언은 엔비디아의 인프라와 다양한 모델을 활용할 수 있게 됐다. 줌은 "우리는 서비스 기능을 강화하면서도 비용 부담을 낮췄다"며 "고객은 더 정교하고 유연한 AI 지원을 받을 수 있다"고 강조했다. 엔비디아의 생성형 AI 개발 도구 '네모'를 기반으로 설계된 줌의 LLM은 약 490억 개 파라미터 규모로 이뤄졌다. 이 모델은 속도와 정확도, 비용 효율 균형을 목표로 개발됐으며, 개방형과 폐쇄형 모델의 강점을 모두 결합한 것으로 평가받고 있다. 기업과 공공기관은 이를 통해 더 빠른 워크플로와 고도화된 추론 능력을 경험할 수 있다. 줌은 이번 협업으로 연합형 AI 아키텍처의 완성도를 높였다고 강조했다. 특히 라마와 네모트론을 기반으로 한 고도화 추론 모델을 결합해 정확도·성능·비용 효율을 동시에 실현했다는 입장이다. 회의 기록·요약·번역 등 주요 기능에서 이미 검증된 AI 접근법에 엔비디아 기술을 더해 확장성을 높였다는 점도 알렸다. 줌은 AI 컴패니언이 마이크로소프트 365, 팀즈, 구글 워크스페이스, 슬랙, 세일즈포스, 서비스나우 등 주요 비즈니스 플랫폼과 연동된다고 밝혔다. 이를 통해 보안성과 확장성을 모두 확보한 고성능 AI 경험을 빠르게 고객에게 제공할 방침이다. 쉐동 황 줌 최고기술책임자(CTO)는 "엔비디아의 그래픽처리장치(GPU)와 AI 스택을 활용해 모델 선택 속도와 비용 효율성을 높였고 시장 출시 속도도 향상됐다"며 "네모트론 오픈 기술을 통해 검색증강생성(RAG) 기능 개발이 가속화됐다"고 말했다. 카리 브리스키 엔비디아 부사장도 "줌과의 협업은 이제 시작에 불과하다"며 "앞으로 더욱 스마트하고 효율적인 AI 추론 기술을 제공해 나갈 것"이라고 밝혔다.

2025.10.29 06:38김미정

엔비디아 '네모 가드레일' 공개…에이전트 폭주 방지로 AI 신뢰도 ↑

엔비디아가 생성형 AI 시대를 맞아 '네모 가드레일(NeMo Guardrails)' 솔루션을 통해 거대 언어 모델(LLM) 활용에 필요한 안전성과 신뢰도를 대폭 높이고 있다. 개발자가 직접 AI의 안전장치인 '가드레일'을 프로그래밍해 AI 에이전트(Agentic AI)를 제어·관리할 수 있는 것이 핵심으로, 엔비디아는 이를 오픈소스 형태로 제공해 다양한 서드파티 솔루션·브랜드 정책과 연동할 수 있도록 제공한다. 16일 업계에 따르면 최근 여러 기업들이 LLM 기술을 활용한 에이전트 AI를 경쟁적으로 선보이고 있다. 이러한 초거대 언어 모델이 예기치 않은 발언을 하거나 민감 정보를 노출하는 등 위험 요소가 늘어남에 따라 이를 사전에 제어·차단하는 '가드레일' 수요도 빠르게 증가하는 추세다. 이에 대응해 지난 2023년 4월 출시된 엔비디아 네모 가드레일은 크게 ▲콘텐츠 안전성 ▲주제 제어 ▲탈옥 방지 등 세 가지 주요 가드레일 모델로 구성됐다. 각각 유해·위험 발언 차단, 대화 주제 이탈 방지, 보안 우회 시도 차단에 특화됐다. 엔비디아 측은 이러한 가드레일을 병렬로 적용해도 처리 지연(latency)이 크지 않도록 GPU 최적화를 거쳤다고 강조하고 있다. '네모 가드레일'의 '콘텐츠 안전성(Content Safety)' 기능은 AI 대화나 에이전트가 생성하는 텍스트에서 유해·위험·비윤리적 발언을 사전에 차단한다. 엔비디아의 '이지스 콘텐츠 안전 데이터셋'으로 학습됐으며 3만5천 건 이상의 인공지능 안전성 주석 데이터를 바탕으로 폭넓은 시나리오를 커버한다. 이를 통해 잘못된 정보나 악의적 콘텐츠가 사용자에게 직접 전달되는 상황을 줄일 수 있다는 설명이다. '주제 제어(Topic Control)'는 대화 주제가 시스템 프롬프트나 브랜드 정책에서 벗어나지 않도록 관리한다. 단순 질의응답을 넘어 여러 차례의 대화가 이어질 때 에이전트가 불필요하거나 민감한 영역으로 빠지는 것을 막아주는 역할을 한다. 일례로 자동차 제조사 에이전트의 경우 경쟁사 차량과의 비교 등의 발언을 아예 금지하거나 특정 주제만 다루도록 제한하는 식이다. 복잡한 대화가 진행될수록 브랜드 일관성·규제 준수가 중요해지는 산업군에서 특히 주목받고 있다. '탈옥(Jailbreak) 방지' 모델은 AI 모델이 설정된 보호 장치를 교묘하게 우회해 민감 정보를 드러내거나 부적절한 기능을 수행하지 못하도록 막는다. 엔비디아는 1만7천 개 이상의 악의적 프롬프트 샘플을 통해 모델을 학습시켰으며 내부의 LLM 레드팀 테스트 툴을 활용해 새롭게 등장하는 공격 방식을 지속적으로 탐지·학습한다. 이를 통해 기업들이 실제 환경에서 운영 중인 AI 에이전트의 보안을 한층 더 강화하고 있다. '네모 가드레일'은 엔비디아 AI 엔터프라이즈 라이선스 체계로 운영되며 GPU당 연간 4천500달러(한화 약 630만원) 선의 비용이 소요된다. 실제 사용량과 기업 규모에 따라 차이가 발생할 수 있으나 개발 및 배포 효율성·안정성을 감안하면 비용 대비 효과가 충분하다는 것이 엔비디아 측의 설명이다. 이와 별개로 네모 가드레일 기본 프레임워크 자체는 오픈소스로 무료 제공된다. 이러한 기본 모드의 오픈소스 정책에 따라 기업이 직접 정책을 추가하거나 서드파티 가드레일을 도입하기가 용이하다. 엔비디아 측은 모든 이용 사례와 규정을 자사가 일일이 규정할 수 없으므로 오픈소스·모듈형 설계를 채택해 각 기업이 상황에 맞게 커스터마이징할 수 있게 했다는 입장이다. 업계에서는 특정 산업 규제나 민감 데이터 처리를 위한 맞춤형 가드레일을 구축하기 한층 수월해졌다는 평가를 하고 있다. 실제로 소매업, 통신사, 자동차 산업 등 다양한 분야의 기업들이 이미 '네모 가드레일'을 활용해 에이전트 제어 시스템을 구현하고 있다. 민감한 금융·청구 관련 정보를 다루거나 안전 운행을 보조해야 하는 경우처럼 오류나 부적절한 정보 노출이 절대 불가한 상황에서 가드레일의 역할이 돋보인다는 설명이다. 업계 전문가들은 "에이전틱 AI 시대에 IT 부서들이 AI를 인사·총무처럼 관리할 필요성이 커지는 와중에 이런 역할을 수행하는 솔루션 중 하나가 '네모 가드레일'"이라며 "가드레일 도입을 통해 AI가 사용자에게 줄 수 있는 가치는 키우면서도 위험 요소는 줄이는 길이 열리도록 해야한다"고 평가했다.

2025.01.16 23:05조이환

엔비디아-미스트랄AI, 신규 AI 모델 출시…"개인 데스크톱도 AI 실행"

인공지능(AI) 하드웨어 시장을 주도하는 엔비디아와 오픈AI의 경쟁자로 주목받는 미스트랄AI가 새로운 언어모델을 발표했다. 신규 언어 모델은 엔비디아의 개인용 그래픽카드인 RTX 시리즈로도 구현할 수 있는 소규모 AI로, 기업을 비롯해 개인 사용자의 AI 활용에도 많은 변화를 일으킬 수 있을 전망이다. 미스트랄AI는 공식 홈페이지를 통해 엔터프라이즈용 언어모델 미스트랄 네모(Mistral-NeMo)를 출시했다고 19일 밝혔다. 미스트랄 네모는 퍼블릭 클라우드가 아닌 환경에서도 고성능 AI를 실무자의 데스트톱을 통해 직접 제공하기 위해 설계된 AI 모델이다. 120억 개의 매개변수로 학습된 이 모델은 글로벌 다국어 앱을 위해 설계된 것이 특징으로 기존 언어모델과 비교해 16배 큰 12만8천 토큰의 컨텍스트 창을 제공한다. 8비트 부동 소수점 포맷(FP8) 추론을 지원해 양자화 인식 훈련을 통해 더욱 빠른 처리 속도를 제공한다. 이를 통해 한 번에 대규모 텍스트를 인식하고 처리하는 것이 가능하다. 또 100개 이상의 언어로 훈련된 틱토큰(Tiktoken) 기반의 새로운 토크나이저인 테큰(Tekken)을 사용해 언어에 대한 인식을 개선했다. 라마3(Llama3) 토크나이저와 비교해 모든 언어 대비 약 85% 성능이 향상됐다. 특히 영어, 한국어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 중국어, 일본어, 아랍어, 힌디어에 특화된 성능을 지원한다. 미스트랄AI에 따르면 한국어와 아랍어를 각각 2배와 3배 더 효율적으로 압축할 수 있으며 중국어, 이탈리아어, 프랑스어, 독일어, 스페인어, 러시아어도 30% 성능 향상을 달성했다. 미스트랄 네모는 기존 AI모델과 벤치마크 테스트를 통해 비교한 결과 MT벤치 7.84, 와일드벤치 42.57를 기록했다. 6.48와 25.55를 달성한 미스트랄 7B와 6.85, 28.77을 기록한 라마3 8B 등 기존 AI모델에 비해 월등한 성능을 기록했다. 엔비디아의 응용 딥러닝 연구 부사장인 브라이언 카탄자로는 "이 모델은 아파치 2.0 라이선스로 출시되는 오픈소스"라며 "우리는 높은 정확도를 가진 모델의 다양한 작업에서 활용될 것을 기대하고 있다"고 밝혔다. 이어 "미스트랄 네모는 많은 사람들이 이미 가지고 있는 RTX GPU에서도 실행할 수 있는 소규모 AI"라며 "집에서 데스크톱으로도 사용할 수 있는 만큼 많은 변화를 가져올 수 있을 것"이라고 덧붙였다.

2024.07.19 09:22남혁우

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

쿠팡, 개인정보 노출 3천370만개 확인..."진심으로 사과”

패션 플랫폼, ‘굿즈 시장’ 참전…"K-컬처 팬덤 품는다"

다이소 ‘무릎 사과’ 진실은…고객·직원 "왜곡 멈춰달라"

두 번 접는 갤럭시Z 트라이폴드, 생각보다 싸게 나올까

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.