• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
AI의 눈
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'네모트론 페르소나 코리아'통합검색 결과 입니다. (1건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI리더스] "존댓말 어려운 AI"…엔비디아가 제시한 해법은

"영어 데이터 중심으로 훈련된 인공지능(AI) 모델은 존댓말을 비롯해 지역별 특색이나 생활 맥락 등을 충분히 이해하지 못하는 경우가 많습니다. 한국 사용자에게 신뢰도 높은 AI 서비스를 제공하려면 한국어와 문화, 산업 데이터에 기반한 새로운 모델과 데이터 생태계를 마련해야 합니다." 정구형 엔비디아코리아 솔루션 아키텍트 팀장은 2일 글로벌 AI 모델의 한계를 짚으며, 한 국가가 자체 데이터와 인프라를 바탕으로 AI 주권을 갖는 '소버린 AI(Sovereign AI)'의 중요성을 강조했다. 그는 한국 사용자에게 신뢰도 높은 AI 서비스를 제공하려면 단순히 한국어를 지원하는 수준을 넘어 한국의 언어와 문화, 산업 구조를 반영한 데이터와 개발 생태계가 함께 구축돼야 한다고 밝혔다. 영어 중심 글로벌 모델 한계…'한국 사회 맥락 반영해야' 정 팀장은 '엔비디아가 정의하는 소버린 AI는 단순한 번역이나 모델 현지화를 넘어선 개념'이라며 '한 국가가 자체 인프라와 데이터, 인재, 산업 네트워크를 기반으로 자국의 문화와 데이터 거버넌스를 반영한 AI를 직접 개발·운영할 수 있는 역량을 뜻한다'고 설명했다. 이는 한국어와 한국의 문화적 맥락, 산업별 활용 사례를 국내 개발자와 기업이 주도적으로 구현할 수 있어야 한다는 의미다. 그는 '한국은 정부의 K-AI 프로젝트와 민간 파운데이션 모델 개발이 동시에 진행되는 역동적인 시장이지만, 영어권 데이터 중심 글로벌 모델의 한계 역시 뚜렷하게 나타나는 곳'이라고 평가했다. 한국 특유의 존댓말 체계와 지역별 직업 패턴, 공공·의료 맥락 등을 충분히 이해하지 못해 실제 서비스 적용 과정에서 부정확한 답변이나 정보가 제공될 수 있다는 설명이다. 정 팀장은 "예를 들어 글로벌 대형언어모델(LLM)을 활용해 한국인 페르소나를 묘사해 보면, 직업이나 거주지, 식습관, 가족 형태 등을 실제와 다르게 그려내기도 한다"며 "이는 영어권 웹 데이터를 중심으로 학습한 모델이 한국 사회의 실제 분포와 생활상을 충분히 반영하지 못한 결과"라고 지적했다. 이어 "국내 사용자에게 신뢰도 높은 서비스를 제공하려면 한국의 언어와 문화, 산업 데이터에 기반한 고유의 데이터 생태계 구축이 필수적'이라며 "엔비디아는 이를 위해 가속 컴퓨팅과 네모트론 오픈 모델, 데이터셋, 훈련 레시피, 네모(NeMo) 라이브러리 등 풀스택 플랫폼을 제공해 국내 개발자들이 훈련부터 평가, 배포까지 전 과정을 더 빠르게 수행할 수 있도록 지원하고 있다"고 소개했다. 62개 통계 자료 기반 데이터셋 '네모트론-페르소나-코리아' 이 같은 한계를 보완하기 위해 엔비디아는 한국의 인구통계와 문화적 맥락을 반영한 합성 데이터셋 '네모트론-페르소나-코리아(Nemotron-Personas-Korea)'를 제시했다. 이 데이터셋은 국가통계포털(KOSIS), 대법원, 국민건강보험공단, 한국농촌경제연구원, 네이버클라우드 등 총 62개 공식 통계·자료를 기반으로 구축됐다. 엔비디아에 따르면 데이터셋은 700만명 수준의 합성 페르소나와 약 17억 토큰으로 구성됐다. 연령, 성별, 지역, 혼인 여부, 가족 구성, 주거 형태, 건강 지표 등 다양한 속성을 반영했으며, 한국표준산업분류와 한국표준직업분류 체계를 적용해 8000개가 넘는 산업·직업 조합을 담았다. 정 팀장은 '이름의 경우 1940년대 이후 국내 이름 분포 데이터를 참고해 약 21만개를 구성했다'며 '세대별 시대상과 정서도 보다 자연스럽게 반영하려 했다'고 설명했다. 원천 공공 데이터는 형식이 제각각이고 비정형 정보가 많아 기업이 바로 활용하기에는 한계가 있다. 엔비디아는 이를 보완하기 위해 확률적 그래프 모델과 자체 데이터 정제 도구인 '네모 큐레이터(NeMo Curator)', '네모 데이터 디자이너(NeMo Data Designer)'를 활용했다. 또 공식 통계 비율을 토대로 한국 사회의 인구·생활 분포를 재현하는 '합성 데이터 생성' 방식을 적용했다. 정제되지 않은 원천 데이터를 그대로 쓰는 대신, 통계적으로 검증된 분포를 바탕으로 활용 가능한 형태의 데이터를 새로 구성해 실제 사회적 맥락은 살리면서도 개인정보 노출 위험은 줄이기 위한 취지다. 이를 통해 데이터셋은 개인식별정보를 포함하지 않는 합성 형태로 설계됐고, 유출 우려를 낮추면서도 안전하게 활용할 수 있도록 했다. 또 허용적 라이선스인 CC BY 4.0으로 배포돼 국내 기업과 개발자들이 비교적 자유롭게 활용할 수 있다. 정 팀장은 '이번 페르소나 데이터셋은 단순한 인물 프로필 모음이 아니라 한국 사회의 맥락을 반영한 합성 데이터 기반'이라며 '국내 개발자들이 보다 현실적인 사용자 시나리오와 서비스를 설계하는 데 도움이 될 것'이라고 말했다. 이어 '대고객 AI 에이전트와 챗봇, 사내 업무 보조, 공공 안내, 교육·리서치 분야에서 비교적 빠르게 효과를 볼 수 있을 것'이라며 '다만 금융이나 의료처럼 규제가 강한 산업군에서는 기업 내부 도메인 데이터와 안전 가드레일을 함께 적용하는 방식이 적절하다'고 덧붙였다. 글로벌 AI 플랫폼 경쟁 속 차별점은 '풀스택'과 '개방성' AWS와 마이크로소프트(MS) 등 글로벌 클라우드 기업들이 AI 플랫폼 시장에서 경쟁하는 가운데, 정 팀장은 엔비디아의 차별점으로 '풀스택 컴퓨팅 플랫폼'과 '개방성'을 제시했다. 그는 '엔비디아는 클라우드 사업자와 직접 경쟁하기보다 모든 클라우드와 온프레미스 환경에서 AI를 가속하는 플랫폼을 제공한다'며 'GPU부터 소프트웨어, 마이크로서비스(NIM)까지 전 과정을 풀스택으로 지원한다'고 설명했다. 인프라 종속, 이른바 락인(lock-in) 우려에 대해서도 선을 그었다. 정 팀장은 '네모트론 모델과 데이터셋은 오픈 생태계 기반이며, NIM과 NeMo 라이브러리 역시 다양한 상용·오픈 모델을 아우르도록 설계됐다'며 '특정 클라우드에 묶이지 않는 하이브리드 배포를 지원해 기업이 자사 데이터 통제권을 유지할 수 있도록 돕는다'고 말했다. 엔비디아는 앞으로도 과학기술정보통신부, 정보통신산업진흥원(NIPA) 등과 협력해 국내 개발자를 위한 실습 프로그램을 이어가고, AI 툴체인 고도화를 통해 국내 기업들의 한국형 AI 시스템 구축을 지원할 계획이다. 정 팀장은 '중요한 것은 특정 인프라를 선택하게 만드는 것이 아니라, 국내 개발자와 기업이 자사 환경에 맞는 방식으로 AI를 개발하고 운영할 수 있도록 돕는 것'이라며 '엔비디아는 개방형 생태계와 풀스택 지원을 바탕으로 한국형 AI 경쟁력 강화를 뒷받침하겠다'고 강조했다.

2026.06.02 13:06남혁우 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

K-컬처 성장전략 내세웠지만 현장 체감은 아직...문화 B+학점

'변화'냐 '변질'이냐...디캠프 내부 갈등 격화

[SW키트] 쓴 만큼 돈 내는 '깃허브'…비영어권 개발자 부담 클까

삼성 파운드리, 미세공정 우위·전력 비용 효율 '투트랙' 공략 나섰다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.