• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'쿠다'통합검색 결과 입니다. (9건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다. 엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다. 'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다. 새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다. 시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다. 이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다. 성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다. RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다. 'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다. 엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.

2025.05.12 15:33조이환

한국판 엔비디아 '쿠다' 마련한다…과기정통부, 시스템 SW 생태계 활성화 '박차'

과학기술정보통신부가 인공지능(AI)·반도체 등 첨단 산업의 핵심 기반인 시스템 소프트웨어(SW) 경쟁력을 강화하기 위해 앞장선다. 과기정통부는 25일 국내 시스템 SW의 경쟁력 강화와 생태계 활성화를 위한 정책 방향을 모색하고자 '시스템 SW 경쟁력 강화를 위한 전문가 간담회'를 개최했다. 이번 간담회는 유상임 과기정통부 장관을 비롯한 국내 주력 산업 분야 기업, 시스템 SW 전문 기업과 학계·연구기관 관계자들이 참석해 산업 현장의 목소리를 공유하고 실효성 있는 정책 지원 방안을 논의했다. 먼저 건국대 김두현 교수가 시스템 SW 중요성 및 우수사례에 대해 발제하고 정보통신기획평가원 오윤제 PM이 K-클라우드 사업 추진 계획에 따른 AI 반도체 시스템 SW 추진 전략을 발표했다. 이어진 자유토론에서는 ▲시스템 SW 인력 양성 관련 지원 확대 ▲국산 고신뢰 시스템 SW 중요성 ▲SW 정의(SDx)를 통한 주력 산업의 혁신을 위한 지원 강화 ▲국산 시스템 SW 생태계 조성을 위한 중장기적 지원 등 국내 시스템 SW 경쟁력 강화를 위한 심도 있는 논의가 진행됐다. 참석자들은 산업과 교육 현장의 직접 겪은 경험을 바탕으로 시스템 SW 기업이 겪고 있는 전문 인재 확보의 어려움과 산·학 공동연구 및 중‧장기적 지원을 통한 생태계 조성 추진 필요성 등을 제시했다. 과기정통부는 이번 간담회에서 제기된 산·학·연의 건의사항과 제안을 검토해 향후 정책 수립에 반영할 계획이다. 특히 새롭게 성장하는 분야의 튼튼한 기반 조성 및 주력 산업과 연계한 시스템 SW 육성을 위한 장기적 관점의 정책을 적극 추진해 나간다는 방침이다. 유상임 장관은 "시스템 SW는 반도체·AI·로봇 등 첨단 기술의 핵심 기반으로, 국가 디지털 경쟁력 확보를 위한 전략 산업"이라며, "엔비디아는 '쿠다(Cuda)'라는 시스템 SW 플랫폼을 통해 글로벌 시장을 장악했다"고 강조했다. 또 그는 "우리도 국내 SW 분야의 '어벤져스'를 만들어 글로벌 경쟁력을 확보하고 국내·외 시스템 SW 관련 인재를 양성하고 확보할 수 있도록 노력할 것"이라며 "민·관이 함께 힘을 모아 핵심 기술 자립과 글로벌 경쟁력 확보를 이뤄내야 한다"고 말했다.

2025.04.25 14:16한정호

엔비디아, 오디오 생성·수정하는 모델 개발…"출시는 아직"

메타, 오픈AI에 이어 엔비디아도 오디오와 음성을 생성할 수 있는 생성형 인공지능(AI) 모델을 공개한다. 26일 CNBC 등 외신에 따르면 엔비디아는 새 AI 모델 '푸가토(Fugatto)'를 출시할 계획이다. 해당 모델은 주로 음악, 영화, 비디오 게임 제작자 대상으로 개발됐다. 오픈소스 음성 데이터로 학습했다. 사용법은 간단하다. 사용자가 푸가토에게 원하는 음향 효과나 음악을 문자로 입력하기만 하면 된다. 푸가토는 앞서 공개된 메타, 오픈AI의 모델처럼 오디오를 생성할 뿐 아니라 수정까지가능하다. 예를 들어 피아노로 연주된 선율을 사람 목소리로 변환하거나, 음성에 사용된 톤이나 감정을 바꿀 수도 있다. 엔비디아 브라이언 카탄자로 응용딥러닝 연구부사장은 "지난 50년 동안 합성 오디오를 생각해 보면 음악 품질이 성장했다"며 "생성형 AI는 음악과 비디어 게임, 창작자들에게 새 능력을 제공할 것"이라고 강조했다. 엔비디아는 푸가토 출시 계획에 대해선 구체적으로 밝히지 않았다. 사람 음성이나 음향을 생성·수정하는 기능을 갖춘 만큼 윤리적 부담감이 크기 때문이다. 앞서 오픈AI와 메타도 오디오나 비디오를 생성하는 모델을 소개한 바 있다. 엔비디아처럼 이를 출시하지는 않은 상태다. 엔비디아 브라이언 카탄자로 응용딥러닝 연구부사장은 "모든 AI 기술은 예상치 못한 것을 만들 수 있는 위험이 있다"며 "이에 대해 신중히 생각하기 위해 당장 출시하지는 않을 것"이라고 외신에 밝혔다.

2024.11.26 09:21김미정

엔비디아 "다가오는 100조 달러 기술혁명 시대…카카오 AI 기업으로 만들겠다"

"엔비디아는 인공지능(AI) 산업에서의 새로운 혁명을 이끌고 있습니다. 카카오와의 협력을 통해 카카오를 AI 네이티브 기업으로 전환시키고 글로벌 시장에서 선두로 도약할 수 있도록 지원하겠습니다." 타이 맥커처 엔비디아 수석 부사장은 23일 경기도 용인시 카카오 AI 캠퍼스에서 열린 '이프카카오 2024' 행사에서 이같이 밝혔다. '이프카카오 2024'는 카카오 그룹이 AI와 클라우드 기술 성과를 공유하고 국내 IT 기술 발전에 기여하기 위해 마련된 행사로, 지난 22일부터 사흘간 진행되고 있다. 이날 맥커처 부사장은 '엔비디아 AI 네이티브 컴퍼니' 키노트 세션에서 엔비디아의 AI 전략과 카카오와의 협업 계획을 상세히 소개했다. 그는 AI가 촉발하고 있는 새로운 산업 혁명과 그 거대한 시장 규모에 대해 강조하며 카카오가 이 흐름의 중심에 설 수 있다고 전망했다. 그는 "AI는 약 100조 달러(한화 약 13경원) 규모의 새로운 산업 혁명을 일으키고 있다"며 "카카오는 AI 공장을 통해 데이터를 지식으로 전환해 다양한 산업 분야에서 혁신을 주도할 것"이라고 말했다. 현재 엔비디아는 카카오의 AI 모델 개발, 머신러닝 운영(MLOps) 플랫폼 구축, 서비스 통합 등을 지원하며 카카오의 AI 전환을 가속화하고 있다. 특히 최신 그래픽처리장치(GPU)인 'GH200'과 텐서RT 거대언어모델(LLM) 라이브러리를 활용해 카카오의 AI 모델 추론 성능을 극대화할 계획이다. 맥커처 부사장은 "현재 카카오의 알파팀과 인프라팀과 긴밀히 협력하고 있다"며 "참조 아키텍처와 블루프린트를 제공함으로써 카카오가 시장에 더 빠르게 진입할 수 있도록 돕겠다"고 설명했다. 또 그는 엔비디아의 그래픽 전송 네트워크(GDN)를 활용한 기술적 솔루션을 강조했다. GDN은 AI 모델의 동시 처리와 지연 시간 문제를 해결해 챗봇, 의료 분야, 경로 최적화 등 다양한 애플리케이션에서 높은 성능을 제공한다. 그는 "GDN은 동시성 문제와 지연 시간을 최소화해 사용자에게 최상의 경험을 제공한다"며 "카카오의 다양한 서비스에 적용돼 사용자 만족도를 높일 것"이라고 말했다. 엔비디아는 지난 1993년 비디오 게임을 좋아하는 컴퓨터 연구자들의 스타트업으로 출발한 바 있다. 게임 장비 회사로 시작했음에도 GPU 기술과 컴퓨팅 기술의 지속적인 발전으로 인해 AI와 가속 컴퓨팅 분야의 선두주자로 성장했다. 그중 하나의 핵심 기술로 맥커처 부사장은 '쿠다(CUDA)' 플랫폼을 꼽았다. 그는 "2006년부터 일관된 프로그래밍 인터페이스를 제공한 '쿠다' 플랫폼을 통해 개발자 생태계를 구축했다"며 "이를 기반으로 우리는 지속적인 AI 혁신을 지원해왔다"고 밝혔다. 이러한 기술력은 카카오의 글로벌 경쟁력 강화에도 큰 기여를 할 예정이다. 엔비디아의 기술 지원을 통해 카카오가 금융, 모빌리티 등 다양한 서비스에 AI를 적용할 수 있을 것이기 때문이다. 이를 통해 사용자에게 혁신적인 경험을 제공하고 편의성을 향상시킬 수 있다. 맥커처 부사장은 가속 컴퓨팅의 중요성을 다시 한번 강조했다. 그는 "우리가 운영하는 AI 홈페이지를 통해 누구나 최신 AI 모델을 경험하고 자신의 환경에 적용해 볼 수 있다"며 "가속 컴퓨팅은 AI의 필수 요소로, 이를 통해 전체 소유 비용을 줄이고 혁신을 가속화할 수 있다"고 말했다. 그러면서 "지속적으로 솔루션을 제공함으로써 카카오가 AI 분야에서 글로벌 리더로 도약하게끔 함께 노력할 것"이라고 강조했다.

2024.10.23 15:00조이환

[유미's 픽] "이젠 수익 내자"…삼성 제친 '반도체 1위' 인텔, SW서도 존재감 드러낼까

"소프트웨어 사업에서 이젠 수익을 내야 합니다." 팻 겔싱어 인텔 최고경영자(CEO)는 지난 2021년 6월 VM웨어에서 최고기술책임자(CTO)로 활동하고 있던 그렉 라벤더를 인텔 CTO로 영입하며 이처럼 주문했다. 그간 인텔이 컴퓨터 하드웨어 회사로 꾸준한 성장세를 보였지만, 소프트웨어 시장에선 크게 존재감을 드러내지 못했던 탓이다. 인텔에서 VM웨어로 자리를 옮겼다가 다시 인텔로 돌아온 겔싱어 CEO는 소프트웨어에서 수익을 내지 못하고 있는 것이 답답하게만 느껴졌다. 19일 업계에 따르면 겔싱어 CEO가 합류하기 전인 2020년 인텔의 전체 매출 700억 달러 중 소프트웨어 매출은 1억 달러 정도에 불과했다. 겔싱어 CEO는 취임 직후 소프트웨어 사업을 강화하기 위해 자체 개발 및 인수에 나서 관련 매출을 50%까지 늘리겠다는 목표를 세웠다. 이를 위해 겔싱어 CEO는 VM웨어에서 한솥밥을 먹던 그렉 라벤더 CTO를 지난 2021년 6월 인텔에 합류시켰다. 또 소프트웨어를 담당하는 부문과 고성능 컴퓨팅 및 그래픽에 특화된 부문도 새롭게 만들었다. 겔싱어 CEO는 인텔에서 30년 가까이 근무한 후 스토리지 업체 EMC를 거쳐 9년 간 엔터프라이즈 클라우드 소프트웨어 업체인 VM웨어 CEO로 있으며 소프트웨어 사업의 중요성을 일찌감치 알아봤다. 이에 겔싱어 CEO는 새롭게 조직한 인텔의 소프트웨어 및 고급 기술 그룹(Software and Advanced Technology Group)을 라벤더 CTO가 이끌도록 했다. 라벤더 CTO는 VM웨어 전에 시티그룹, 시스코, 선 마이크로시스템즈 등을 거쳤다. 라벤더 CTO 외에도 인텔 직원 중 소프트웨어 개발자들이 차지하는 비중은 상당하다. 실제 지난 2022년 기준 전 세계 12만 임직원 중 14%인 1만7천여 명이 소프트웨어 엔지니어로 일했는데, 이는 전 세계 빅테크 기업 중 톱3에 꼽히는 규모다. 현재는 1만9천여 명으로 늘었다. 밥 오도넬 테크낼리시스 리서치 수석 애널리스트는 "많은 이들이 인텔에 대해 잘 모르는 사실 중 하나는 하드웨어 엔지니어보다 소프트웨어 엔지니어가 더 많다는 것"이라며 "IoT와 엣지 및 HPC를 확장하는 데에는 방대한 소프트웨어가 필요하고, 이를 조직적으로 뒷받침하는 것이 도움이 된다"고 말했다. 인텔은 삼성전자와 세계 1, 2위를 다투는 종합 반도체 기업으로 잘 알려져 있지만, 반도체를 설계하고 제조하는 하드웨어 기술력뿐 아니라 소프트웨어에도 역량을 꾸준히 쏟고 있다. 기술 개발 축이 소프트웨어 쪽으로 옮겨가고 있다는 것을 빨리 인지한 덕분이다. 실제 2009년에는 임베디드 소프트웨어 업체인 윈드리버를 8억8천400만 달러에, 2011년에는 보안 업체인 맥아피를 76억8천만 달러에 인수했다. 인텔은 반도체 사업 역량 강화를 위해 필요하다는 명분을 내세우며 두 회사를 모두 사들였다. 하지만 인텔은 예상과 달리 맥아피 보안 기술을 인텔칩에 통합하는 작업을 제대로 이뤄내지 못했다. 결국 2016년에는 사모펀드에 인텔이 갖고 있던 맥아피 주요 지분을 42억 달러에 매각해 아쉬움을 남겼다. 임베디드 칩 비즈니스를 강화하기 위해 인텔이 인수했던 윈드리버 역시 제대로 사업을 펼치지 못한 채 2018년 사모펀드에 재매각됐다. 이처럼 뼈 아픈 과거를 묻고 인텔은 같은 해 개방형 통합 프로그래밍 모델 '원API(OneAPI)'를 적극 개발하고 나섰다. 이는 개발자가 CPU(중앙처리장치), GPU(그래픽처리장치), FPGA(프로그래밍이 가능한 반도체) 등 어떤 하드웨어를 사용해도 단 하나의 코드만으로 교차가 된다는 점이 강점으로 꼽혔다. 덕분에 칩별로 코드를 달리 개발해야 하는 시간이 줄었을 뿐 아니라, 인텔이 개발자 소스 코드 오류점검(디버깅), 기계어 번역(컴파일러) 등 소프트웨어 성능 최적화를 위한 여러 도구를 모두 무료로 오픈해 비용도 훨씬 절감됐다. 하지만 수익에는 크게 도움되지 못했다. 이에 인텔은 겔싱어 CEO 체제에서 수익성 확보를 위해 다른 면모를 보여주고 있다. 특히 서비스형 소프트웨어(SaaS) 사업을 앞세워 완제품보다는 소프트웨어 제작자들을 겨냥한 제품과 서비스들을 전진배치시키는 모습을 보였다. 매니지드 AI 서비스인 씨엔브이알지.아이오(Cnvrg.io)와 클라우드 최적화 서비스인 그래뉼레이트(Granulate) 등이 대표적인 예로, 다양한 유형 데이터센터 인프라들에 걸쳐 워크로드를 관리하고 최적화할 필요가 있는 조직들을 위해 SaaS를 제공하고자 힘썼다. 겔싱어 CEO는 2022년 5월 개최한 비전 2022 행사에서 "보다 많은 SaaS를 제공할 뿐 아니라 보다 많은 SaaS들을 인수할 것"이라며 "소프트웨어는 반도체 역량 강화를 위한 솔루션"이라고 강조했다. 최근에는 AI 시장을 노리고 모듈식 개방형 소프트웨어 플랫폼 '타이버™ 비즈니스 솔루션 포트폴리오'도 공개했다. 오는 3분기에 출시될 예정인 '타이버'는 기업이 엣지 및 인공지능 애플리케이션을 대규모로 개발·배포·관리할 수 있게 지원하며, 오픈비노(OpenVINO) 인공지능 추론 런타임을 내장해 효율적인 인공지능 솔루션 개발이 가능하다. 인텔은 우리나라 기업인 네이버와 손잡고 '가우디2'를 활용한 소프트웨어 플랫폼 구축에도 나섰다. '가우디2'는 인텔이 엔비디아 GPU(그래픽처리장치)에 대항하고자 만든 AI 가속기다. 엔비디아의 서버용 AI 반도체 'H100' 가격은 약 5천만원에 달하지만, 인텔 '가우디2' 가격은 'H100' 대비 3분의 1에 그친다는 점에서 가격 경쟁력이 있다. 인텔은 'H100' 대비 전력 효율이 두 배 이상 높고 AI 모델 실행이 1.5배 더 빠른 '가우디3'도 최근 공개했다. 인텔과 네이버는 지난 4월 대전 카이스트 공동연구소를 설립해 '가우디'를 기반으로 vLLM(시각거대언어모델) 운영을 위한 여러 실험도 진행하고 있다. 이와 관련해 라벤더 CTO는 다음달께 잠시 한국에 방문해 진행 상황 점검에 나설 것으로 알려졌다. 또 인텔은 개발자들에게 파이토치 표준화 등을 구현하는 식으로 지원함으로써 자사 소프트웨어 생태계 조성에 박차를 가할 계획이다. 업계 관계자는 "AI를 비롯한 하드웨어 대부분이 소프트웨어를 통해 최적화 될 때 성능을 더 높일 수 있다"며 "소프트웨어 개발자 생태계를 조성해 인텔 하드웨어가 더 많은 곳에서 더 혁신적인 솔루션을 쓸 수 있도록 함으로써 경쟁사들과 격차를 벌리려는 것이 인텔의 전략인 듯 하다"고 분석했다. 그러면서 "소프트웨어 생태계를 만드는 것은 하드웨어처럼 물건을 팔아 바로 수익을 볼 수 있는 구조가 아니라, 10년 이상 막대한 투자를 하며 인고의 과정을 거쳐야만 비로소 경쟁력을 갖출 수 있는 분야"라며 "GPU 업계 1위 엔비디아의 개발 플랫폼 '쿠다'가 점유하고 있는 공고한 생태계를 깨고 인텔이 소프트웨어 시장에서도 얼마나 존재감을 드러낼 지에 따라 AI 주도권도 잡을 수 있을 것"이라고 덧붙였다. 라벤더 CTO는 "인텔은 어떠한 종류의 개방형 가속 컴퓨팅 환경에서도 고객이 인공지능을 개발할 수 있도록 요구 조건을 맞추고 있다"며 "앞으로도 최고의 AI용 하드웨어 및 소프트웨어를 제공함으로써 고객 수요를 맞추고, 최대한 빠르게 역량을 구축하기 위해 노력할 것"이라고 말했다.

2024.06.19 09:48장유미

엔비디아, 1분기 매출 262%·순이익 4.5배 '껑충'

엔비디아가 22일(미국 현지시간) 1분기(2~4월) 실적을 발표했다. 매출은 260억 4천만 달러(약 35조 6천억원)로 전년 동기 대비 262% 늘어났고 순이익은 주당 6.12달러(약 8천360원)로 전년 동기 대비 4.5배 늘어났다. 콜레트 크레스 엔비디아 CFO(최고재무책임자)는 "호퍼 GPU 출하량이 급격히 늘어났으며 메타는 라마3에 2만 4천개의 H100 GPU를 적용했다"며 "현재 엔비디아 데이터센터 수익의 40% 가량이 대형 클라우드 서비스 제공 업체에서 나온다"고 밝혔다. 데스크톱PC·노트북용 지포스 GPU를 공급하는 게이밍 부분 매출은 26억 5천만 달러(약 3조 6천217억원)로 전년 대비 18% 증가했다. 서버간 데이터 전송을 처리하는 인피니티밴드 제품 매출은 32억 달러(약 4조 3천753억원)로 전년 대비 3배 이상 늘었다. 각종 설계 분석 등에 쓰이는 쿼드로 등 워크스테이션 칩 매출은 4억 2천700만 달러(약 5천838억원), 자동차용 반도체 매출은 3억2천900만 달러(약 4천498억원)로 집계됐다. 컨퍼런스콜에서 젠슨 황 엔비디아 CEO는 "오는 4분기 차세대 GPU인 '블랙웰'을 주요 데이터센터에 공급할 것이며 이를 통한 매출 상승이 기대된다"고 설명했다. 최근 아마존은 연말에 출시될 엔비디아 GPU '블랙웰' 구매를 위해 현재 판매되고 있는 호퍼 시리즈의 구매를 중단한다고 밝힌 바 있다. 엔비디아는 올 2분기(5~7월) 매출을 280억 달러(약 38조 2620억원)로 예상했다. 또 오는 6월 8일 주식을 10대 1로 액면분할하는 한편 분기별 현금 배당금을 주당 4센트에서 10센트로 2배 이상 늘릴 것이라고 밝혔다.

2024.05.23 09:22권봉석

[영상] 'AI 우등생' 엔비디아…독주 막을 경쟁자 언제 나오나

블록체인을 넘어 인공지능(AI)시대가 되며 엔비디아의 영향력이 더욱 거세지고 있습니다. 견제 세력이 없는 것은 아닙니다. AMD, 인텔 등 경쟁사들이 엔비디아를 넘어서기 위해 온 힘을 다하고 있습니다. 오픈AI와 마이크로소프트를 비롯해 구글, 메타 등 AI를 주도하는 소프트웨어 기업들도 분주하게 움직이고 있습니다. 이들은 삼성전자, 하이닉스 같은 국내외 반도체 업체와 만나 긴밀하게 협력을 논의하고 있습니다. 하지만 이들 중 어느 업체도 엔비디아를 위협하기엔 역부족인 상황입니다. 엔비디아의 이런 경쟁력은 어디에서 나오는 것일까요. 많은 사람이 하드웨어에 앞서 쿠다(CUDA)를 주목합니다. 쿠다는 GPU에서 수행하는 병렬 처리 알고리즘을 C 프로그래밍 언어를 비롯한 산업 표준 언어를 사용하여 작성할 수 있도록 하는 GPGPU 기술입니다. 등장 초기에는 게임의 그래픽 작업 등에 주로 사용됐습니다. 하지만 블록체인 등장 이후 암호화폐 채굴 등 반복 병렬작업에 효율적이라는 것이 알려지며 폭발적인 인기를 모으기 시작했습니다. 특히 한발 먼저 시작한 이 서비스는 빠르게 개발 생태계를 구축했고 이후 급격하게 쌓인 개발리소스는 더 이상 AMD 등 다른 곳으로 이전하는 것을 가로막는 장벽의 역할을 하게 됐습니다. 이와 함께 엔비디아 그래픽카드 자체의 성능 차이도 무시할 수 없는 수준의 영향을 보이는 상황입니다. 국내외 많은 기업과 개발자들이 AMD 그래픽카드의 저렴한 가격을 이점으로 대량으로 구입해 AI 시스템을 구축하는 시도를 매번 이어가고 있지만 아직 주목할만한 성과를 내지 못하고 있는 이유이기도 하죠. 결국 하드웨어와 소프트웨어 생태계 모두 엔비디아가 다른 모든 기업을 압도하고 있는 상황인 만큼 AI 생태계에서 최상위권의 지위는 한동안 유지할 수밖에 없을 것 같습니다. 자세한 이야기는 영상을 통해 확인하실 수 있습니다.

2024.05.03 16:54남혁우

네이버 "인텔 '가우디2' 기반 생성 AI 생태계 구축 목표"

인텔이 네이버와 AI 가속기 '가우디2'(Gaudi 2)를 이용한 LLM(거대언어모델)과 소프트웨어 생태계 확대에 나선다. 네이버클라우드는 인텔 개발자 클라우드 상에 구축된 가우디2 인스턴스를 활용해 LLM 구축 가능성을 평가하는 한편 국내 대학교·스타트업과 협업해 가우디2 기반 오픈소스 모델 등을 공동 개발할 예정이다. 11일 오전 서울 여의도 한경협회관에서 인텔코리아 주최로 진행된 질의응답에서 이동수 네이버클라우드 하이퍼스케일 AI담당 이사(박사)는 "네이버와 인텔 협력 결과물이 오픈소스로 제공되면 학계와 스타트업의 AI 소프트웨어 개발의 문턱을 크게 낮출 수 있다. 국산 소프트웨어 대중화 면에서 큰 의미가 있다"고 강조했다. ■ 네이버 "가우디2 기반 고성능 LLM 모델 개발 목표" 인텔은 9일(미국 현지시간) 미국 애리조나 주 피닉스에서 진행된 '인텔 비전' 행사에서 네이버와 협업을 발표했다. 당일 기조연설에 등장한 하정우 네이버클라우드 AI 혁신센터장은 "생성 AI 생태계 확대를 위한 공동 연구소 설립, 가우디2 성능 평가, LLM(거대언어모델) 인스턴스 제공을 위해 인텔과 협업할 것"이라고 밝혔다. 하정우 혁신센터장은 "가우디2 가속기는 AI 전용 설계를 통해 와트당 성능과 총소유비용(TCO) 측면에서 뛰어난 성능을 낸다. 이번 인텔과 협력을 통해 고성능, 비용 효율 인프라 기반으로 강력한 LLM 기반 모델을 개발하는 것이 목표"라고 설명했다. ■ "가우디2, 하드웨어 특성·성능 면에서 좋은 평가" 이날 오전 이동수 네이버클라우드 하이퍼스케일 AI담당 이사(박사)는 "네이버는 현재 거의 모든 서비스에 AI 기술을 접목하고 있으며 좋은 AI 반도체 확보는 서비스 경쟁력 확보에 직결된다"고 설명했다. 이어 "많은 반도체를 평가하고 분석하는 과정에서 인텔 가우디2 가속기의 하드웨어 특징과 성능 면에서 좋은 결과를 얻었고 이것을 향후 네이버 서비스와 융합하려면 생태계와 소프트웨어 확보가 필요하다"고 밝혔다. 이날 네이버클라우드 관계자는 "일부 언론 관측처럼 이번 협업에 네이버 사옥이나 데이터센터 내에 물리적인 공간을 확보하는 것은 아니다. 평가는 가우디2가 적용된 인텔 개발자 클라우드를 활용할 것"이라고 밝혔다. ■ "가우디2 기반 최적화 코드로 개발 문턱 낮출 것" 이동수 이사는 "현재 LLM 기반 코드 최적화는 고수준 언어가 아닌 어셈블리어(기계어) 수준에서 이뤄지지만 이런 기술력을 갖춘 엔지니어는 극히 드물다"고 설명했다. 이어 "엔비디아 쿠다 역시 하드웨어가 바뀔 때마다 코드를 바꿔야 한다. 이런 난점때문에 엔비디아 역시 별도 개발 없이 기업들이 그대로 쓸 수 있는 바이너리(실행파일)를 제공하고 있다"고 설명했다. 권세중 네이버클라우드 리더는 "국내 대학과 스타트업은 GPU나 가속기 활용이 어려워 연구에 어려움을 겪는다. 국내 상위권 대학 내 연구실과 협업을 논의중이며 이들이 가우디2 기반 코드를 오픈소스로 공개하면 어려움을 덜 수 있을 것"이라고 밝혔다. ■ "삼성전자 마하1도 활용... 생태계 확장이 우선" 이동수 이사는 "가우디2 역시 성능 대비 전력 효율성이 뛰어나며 LLM이나 서비스 운영에 여전히 장점을 지니고 있다. 이번 인텔과 협업은 소프트웨어나 생태계 확장에 중점을 둔 것이며 소프트웨어나 드라이버 등이 안정된 가우디2로 진행할 것"이라고 설명했다. 반도체 업계에 따르면 네이버는 LLM 처리에 특화된 삼성전자 AI 반도체 '마하1'을 이르면 올 연말부터 공급받아 활용할 예정이다. 이동수 이사는 "인텔과 삼성전자 모두 중요한 협력사이며 함께 생태계 확장을 하는 것이 목표다. 마하1이나 가우디2는 모두 초기 단계이며 모델 학습·훈련이나 추론 등 용도를 정해둔 것은 아니다"라고 밝혔다.

2024.04.11 11:15권봉석

"엔비디아에 대항"…인텔·퀄컴·구글, AI연합 추진

엔비디아 생태계에 맞서기 위해 구글과 인텔, 퀄컴 등이 손을 잡았다. 로이터통신은 25일(현지시간) 소식통을 인용해 작년 9월 퀄컴과 구글, 인텔 등이 'UXL 재단'이라는 기술 컨소시엄을 구성해 '원API'라는 오픈소스 프로젝트를 추진하고 있다고 보도했다. 해당 프로젝트는 어떤 반도체 칩이나 하드웨어에 상관없이 모든 컴퓨터에서 구동하는 소프트웨어를 구축하는 것을 목표로 하고 있다. 이 같은 움직임은 400만 명이 넘는 개발자들이 인공지능(AI) 앱 개발을 위해 사용하는 쿠다(CUDA) 소프트웨어 플랫폼에 대항하기 위한 움직임이다. 쿠다로 만든 플랫폼은 엔비디아의 GPU에서만 돌아간다. 그렇기 때문에 그 동안 대부분의 AI 개발자들은 AI 반도체도 엔비디아 GPU만을 사용해야만 했다. 퀄컴의 AI·머신러닝 책임자 비네쉬 수크마르(Vinesh Sukumar)는 인터뷰를 통해 "실제로 개발자들에게 엔비디아 플랫폼에서 마이그레이션하는 방법을 보여주고 있다"고 밝혔다. 구글의 고성능 컴퓨팅 담당 최고 기술 전문가 빌 마그로(Bill Magro)는 "UXL재단은 머신러닝 프레임워크 관점에서 개방형 생태계를 구축하고 생산성 및 하드웨어 선택을 촉진할 수 있는 지에 관한 것"고 밝혔다. 또, 그는 구글은 UXL 재단의 창립 멤버 중 하나이며 프로젝트의 기술적 방향을 결정하는 데 도움을 주고 있다고 설명했다. UXL 기술운영위원회는 올해 상반기까지 기술적 사양 확정하고 올해 말에는 기술적 세부 사항을 '성숙한' 상태로 개선할 계획이라고 밝혔다. 또, 해당 프로젝트 초기에는 AI 앱과 고성능 컴퓨팅 애플리케이션에 대한 옵션을 개방하는 것을 목표로 할 예정이지만, 궁극적으로는 엔비디아의 하드웨어와 코드도 지원할 계획이라고 밝혔다. UXL은 향후 해당 소프트웨어가 모든 칩이나 하드웨어에 배포될 수 있도록 추가 칩 제조사와 마이크로소프트(MS)나 아마존 등의 클라우드 컴퓨팅 회사의 동참을 요청할 예정이다. 아직 UXL 연합에 속하지 않은 MS의 경우, 엔비디아의 독점에 대항할 수 있는 대체 AI 칩을 개발하기 위해 작년에 AMD와 협력 했다는 소문이 돌기도 했다.

2024.03.26 15:16이정현

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

"북한 해커, 위장취업해 北 송금"…메일 1천개 적발

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현