• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
6.3 대선
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'딥시크'통합검색 결과 입니다. (94건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

MS·AWS·메타, 딥시크 'R1' 쓴다…챗GPT 의존도↓

중국 인공지능(AI) 스타트업 딥시크가 새 모델 'R1' 출시로 AI 생태계에 돌풍을 일으킨 가운데 미국 빅테크가 R1을 사업에 활용하는 전략으로 발빠른 대응에 나섰다. 30일 글로벌 업계에 따르면, 마이크로소프트와 아마존웹서비스(AWS), 메타가 딥시크 R1을 활용해 자사 서비스와 모델 개발을 업그레이드하기 위해 나선 것으로 전해졌다. 마이크로소프트와 AWS는 R1을 서비스에 접목했으며, 메타는 R1 기술을 분석해 자사 모델 라마에 적용할 방침이다. 마이크로소프트는 딥시크의 R1을 자사 클라우드 컴퓨팅 플랫폼 애저(Azure)와 개발자 도구 깃허브에 제공한다고 밝혔다. 마이크로소프트 플랫폼 내 1천800개 넘는 AI 모델 목록에 R1을 추가한다. R1은 애저와 깃허브의 모델 카탈로그에서 우선 제공된다. 다수 외신은 마이크로소프트가 챗GPT 개발사인 오픈AI에 대한 의존도를 줄이려는 전략이라고 분석했다. 앞서 로이터도 지난달 마이크로소프트가 자사 대표 AI 제품인 마이크로소프트 365 코파일럿을 강화하기 위해 내부·서드파티 AI 모델을 추가하는 작업을 진행 중이라고 보도한 바 있다. 또 마이크로소프트는 고객들이 R1 모델을 코파일럿+PC에서 로컬로 실행할 수 있도록 지원할 계획도 밝혔다. 이를 통해 사용자 데이터가 중국 서버로 전송되지 않고 PC 내부에서만 AI가 작동하도록 해 프라이버시를 완화하려는 전략이다. 앞서 딥시크는 사용자 정보를 중국 내 서버에 저장한다고 발표했다. 이에 업계에서는 딥시크의 해외 진출 도입에 걸림돌이 생길 가능성을 높게 봤다. AWS "아마존 베드락 사용자, R1 호출 가능" AWS는 아마존 베드락 사용자가 R1의 증류모델을 '아마존 베드락 커스텀 임포트(Amazon Bedrock Custom Import)'에서 사용 가능하다고 29일 발표했다. AWS는 6천710억개 학습 파라미터 모델로 이뤄진 R1을 더 작은 모델로 압축한 증류 모델 '딥시크-R1-Distill-Llama-8B'와 '딥시크-R1-Distill-Llama-70B'를 아마존 베드락에 호출해 이용할 수 있다고 공식 블로그에서 밝혔다. 두 모델은 기존 R1 모델에서 추출한 내용 토대로 학습하는 지식증류 방식을 통해 개발됐다. 원본 딥시크-R1 기반으로 메타의 '라마'와 알리바바의 '큐원' 아키텍처를 융합한 변형 모델이다. 원본 딥시크-R1 행동과 논리적 추론 패턴을 학습했다. 모델 크기는 작지만 이용료가 적게 드는 것으로 알려졌다. 예를 들어 8B 모델은 요청을 더 빠르게 처리할 수 있으며 리소스 소모가 원본 모델보다 적다. 이에 프로덕션 환경에서 비용 효율적으로 사용될 수 있다. 반면 70B 모델과 같은 대형 증류 모델은 원본 모델에 가까운 성능을 유지하면서도 효율성 개선에 초점 맞췄다. AWS는 "딥시크-R1 모델 군은 코드 생성부터 일반 추론에 이르기까지 다양한 작업을 수행할 수 있도록 설계됐다"며 "경쟁력 있는 성능과 효율성을 유지하면서 폭넓은 활용이 가능하다"고 공식 블로그를 통해 강조했다. 이같은 AWS의 전략은 기업과 개발자가 아마존 베드락에서 다양한 AI 모델을 호출해 멀티 에이전트를 구현할 수 있도록 돕겠다는 기업 목표와 일맥상통한다. 맷 가먼 AWS 최고경영자(CEO)는 "개발자는 아마존 베드락에서 여러 모델을 통합해 AI 서비스와 모델을 개발할 것"이라며 "아마존 베드락을 통해 다양한 모델을 융합할 기회를 제공할 것"이라고 지난 미국 라스베이거스에서 열린 'AWS 리인벤트'에서 발언했다. "딥시크 기술 분석"…메타, 4개 워룸 구성 메타는 딥시크의 AI 기술 분석과 전략 수립을 위해 4개의 '워룸(war room)'을 구성한 것으로 전해졌다. 워룸은 긴급한 상황에서 집중적으로 전략을 짜고 실행하는 핵심 조직이다. 디인포메이션은 29일 메타 매튜 올덤 AI 인프라 디렉터가 딥시크의 최신 모델이 메타의 차세대 라마 모델보다 성능이 뛰어날 수 있다 언급했다고 내부 소식통을 인용해 보도했다. 앞서 메타는 올 초 '라마4' 출시 계획을 밝힌 바 있다. 내부 소식통에 따르면 메타가 구성한 워룸 4개 중 두 팀은 딥시크가 어떻게 AI 훈련·운영 비용을 낮출 수 있었는지 분석 중이다. 이 전략으로 메타의 라마 모델에 적용하는 것이 목표다. 또 다른 팀은 딥시크가 어떤 데이터로 AI 모델을 훈련시켰는지 조사하는 역할을 맡은 것으로 전해졌다. 나머지 팀은 딥시크 AI 모델 특성 기반으로 라마의 모델 구조를 어떻게 재설계 할 수 있을지 연구 중인 것으로 알려졌다. 메타는 "경쟁 모델을 지속적으로 평가하기 위한 과정일 뿐"이라며 "사내 생성형 AI 그룹이 생긴 이후 지속한 연구"라고 디인포메이션에 입장 밝혔다. 이어 "라마는 오픈소스 AI 모델 생태계 구축에 중요한 역할을 했다"며 "출시 예정인 라마4를 위해 해당 리더십을 확장할 것"이라고 덧붙였다. 마크 저커버그 최고경영자(CEO)도 지난 29일 4분기 실적 발표 컨퍼런스 콜에서 "딥시크가 여러 가지 새로운 시도를 했다"며 "현재 이를 분석하는 중"이라고 밝힌 바 있다. 이어 "딥시크의 '기술적 발전'을 라마 모델에 적용할 계획"이라고 말했다. 저커버그 CEO는 딥시크 등장으로 인해 AI 모델에 높은 컴퓨팅 자원이 필요하지 않을 가능성에 대해서도 입을 열었다. 그는 "여전히 대규모 자본 지출과 인프라에 대한 공격적인 투자가 필요할 것"이라며 "시간이 지날수록 이 방식이 전략적 이점으로 자리 잡을 것으로 확신한다"고 강조했다.

2025.01.30 15:37김미정

메타 저커버그 "딥시크 걱정하지 않는다"

마크 저커버그 메타 최고경영자(CEO)가 최근 주목받고 있는 인공지능 기업 딥시크에 대해 우려하지 않는다는 입장을 밝혔다. 저커버그 CEO는 30일(현지시간) 진행된 2024년 4분기 실적발표에서 "딥시크가 적은 비용으로 이룬 성과를 보면서 우리가 가고 있는 방향이 맞다는 확신이 더욱 커졌다"고 말했다. 이어 그는 "딥시크가 도입한 몇 가지 혁신적인 기술들을 현재 분석 중"이라며 "이러한 발전 사항들을 메타의 인공지능 모델인 라마에 구현할 계획"이라고 덧붙였다. 딥시크의 등장으로 인공지능 모델 개발에 필요한 컴퓨팅 연산량이 줄어들 것이라는 전망이 제기되며 인공지능 관련 주식이 큰 폭으로 하락했다. 하지만 저커버그는 "시간이 지날수록 인프라와 자본 지출에 대한 대규모 투자가 전략적 이점이 될 것"이라며 그래픽처리장치(GPU) 투자 지속 의지를 강조했다. 저커버그는 컴퓨팅 연산량이 인공지능 개발의 학습 단계에서 추론 능력 향상으로 이동할 것이라고 전망했다. 그는 "더 높은 수준의 지능과 서비스 품질을 위해서는 추론 시간에 더 많은 컴퓨팅이 필요하다"고 설명했다. 메타는 앞으로 몇 달 안에 다중양식과 '에이전트' 기능을 갖춘 라마4를 출시할 예정이다. 주커버그는 메타의 인공지능 비서가 올해 10억 사용자를 확보할 것으로 전망했다. 한편 메타는 2024년 4분기에 매출 483억 9천만 달러를 기록해 전년 동기 대비 22% 증가했다. 순이익은 208억 달러로 43% 증가했다. 일간 활성 사용자 수는 33억 5천만명으로 전년 대비 5% 증가했다.

2025.01.30 15:28최지연

美 해군 이어 이탈리아도 '딥시크' 다운 금지

미국 해군에 이어 이탈리아 규제 당국도 딥시크 모바일 애플리케이션 다운로드를 금지했다. 로이터 통신은 30일 이탈리아의 구글과 애플의 앱스토어에서 딥시크 다운이 차단됐다고 보도했다. 이탈리아 개인정보보호기관 '가란테'가 지난 28일 딥시크에 개인정보 처리 방식 등에 대한 정보 제공을 요구한 뒤 내려진 조치다. 가란테는 딥시크에 어떤 정보가 수집되고 있는지, 수집 목적과 근거는 무엇인지, 개인 정보는 중국에서 저장되는지 등도 문의한 상태다. 딥시크는 이를 20일 내 답변해야 한다. 파스콸레 스탄치오네 가란테 수장은 "앱 철수 결정에 대한 원인은 구체적으로 설명할 수 없다"며 "딥시크 앱이 유럽연합(EU) 데이터 보호법을 준수하고 있는지 심층 조사할 필요가 있다"고 밝혔다. 현재 딥시크 앱을 다운받은 사용자는 서비스를 지속 이용할 수 있는 것으로 전해졌다. 또 이탈리아를 제외한 다른 EU 국가와 영국에선 여전히 내려받을 수 있다. 앞서 미국 해군도 딥시크 앱 다운로드와 사용을 전면 금지한 상태다. 해군은 공식 이메일을 통해 "딥시크의 AI를 어떤 방식으로도 사용해선 안 된다"며 "데이터 출처와 사용방식, 보안 등에 잠재적으로 문제가 있기 때문"이라고 당부했다.

2025.01.30 15:24김미정

오픈AI "딥시크, 지적 재산권 침해"…美 해군 "사용 금지"

중국 인공지능(AI) 스타트업 딥시크가 새 모델 'R1'을 출시하자 미국 정부와 기업이 견제에 나섰다. 30일 업계에 따르면 오픈AI는 딥시크가 R1 훈련 과정에서 자사 지적 지산권을 침해했다고 주장했다. 미국 해군은 안전한 사용을 보장하지 못할 가능성이 높다며 애플리케이션 사용을 전면 금지했다. CNBC는 30일 오픈AI는 딥시크가 GPT로 지식증류(distillation) 기법을 통해 R1을 학습시켰다는 의혹을 제기했다고 보도했다. 지식증류 기법은 거대 AI 모델이 학습한 내용을 소형 모델에 전달해 주는 방식이다. 마치 경험 많은 사람이 핵심 개념을 정리해 초보자에게 설명해 주는 것과 같다. 이를 통해 소형 AI 모델은 적은 비용으로 더 뛰어난 성능을 낼 수 있다. 오픈AI는 "딥시크는 GPT 모델 군의 학습 내용을 R1에 넣은 정황을 포착했다"며 "이는 명백한 지적 재산권 침해"라고 파이낸셜타임스(FT)를 통해 밝혔다. 다만 구체적인 증거를 공개하진 않았다. 앞서 마이크로소프트도 지난해부터 딥시크와 연계된 것으로 추정되는 계정들이 오픈AI의 API를 사용한 정황을 발견했다고 밝혔다. 당시 마이크로소프트 관계자는 "서비스 이용 약관을 위반한 것으로 의심되는 해당 계정을 모두 차단했다"고 블룸버그를 통해 설명했다. 전문가들은 이같은 학습 방식이 AI 업계 관행으로 자리잡은 탓이라고 입을 모았다. AI 모델이 사람처럼 자연스럽게 응답할 수 있도록 만들려면 대규모 인력을 고용해 데이터 라벨링 작업을 수행해야 하는데, 이는 비용과 시간이 많이 드는 작업이기 때문이다. 이에 스타트업과 중소·중견 기업은 지식증류 기법으로 거대모델의 학습 내용을 자사 소형 모델에 그대로 탑재하기 시작했다는 설명이다. 미국 캘리포니아대 버클리캠퍼스 리트윅 굽타 AI 박사과정 연구원은 "스타트업과 학계서도 상업용 거대언어모델(LLM) 출력 내용을 소규모 모델 학습에 활용하는 것이 매우 일반적"이라며 "특히 챗GPT처럼 인간 피드백이 반영된 모델을 가장 많이 사용한다"고 말했다. 이어 그는 "딥시크가 이 방법을 사용한 것은 결코 놀라운 일이 아니다"며 "이러 관행을 완전히 차단하는 것은 어려울 것"이라고 덧붙였다. 미국 해군은 딥시크 애플리케이션 사용을 군 내부서 금지하도록 지시한 것으로 전해졌다. CNBC 등 외신은 28일 해군 최고정보책임자(CIO)가 사이버보안 정책에 기반해 이같은 결정을 내렸다고 보도했다. 해군은 공식 이메일을 통해 "딥시크의 AI를 어떤 방식으로도 사용해선 안 된다"며 "데이터 출처와 사용방식, 보안 등에 잠재적으로 문제가 있기 때문"이라고 강조했다. 도널드 트럼프 행정부의 AI·암호화폐 정책 고문 겸 벤처 캐피털리스트 데이비드 삭스 는 "딥시크는 글로벌 AI 경쟁을 더 치열하게 만들 것"이라며 "미국도 충분히 경쟁력을 갖췄다고 확신하지만 방심해서 안 된다"고 소셜미디어 X(구 트위터)에서 강조했다.

2025.01.30 15:23김미정

알리바바, 새 AI 모델 출시…"오픈AI·딥시크·메타 능가"

알리바바가 오픈AI와 메타, 딥시크의 모델을 능가하는 새 인공지능(AI) 모델을 개발했다고 주장했다. 29일 알리바바는 세 번째 AI 모델 '큐원(Qwen) 2.5-맥스' 출시 소식을 소셜미디어 위챗 계정을 통해 이같이 밝혔다. 큐원 2.5-맥스가 오픈AI의 GPT-4o와 딥시크-V3, 메타의 라마-3.1-405B를 거의 모든 영역에서 뛰어넘었다는 주장이다. 알리바바는 "이번 모델의 사전 훈련 데이터는 토큰만 20조개를 넘는다"고 "전 세계에서 가장 진보한 오픈소스 AI 모델"이라고 강조했다. 테크크런치 등 외신은 딥시크 돌풍 속에서 중국 기업이 미국뿐 아니라 자국 기업끼리도 AI 경쟁을 본격화했다고 평했다. 앞서 지난해 5월 딥시크가 딥시크-V2 사용료를 100만 토큰당 1위안(약 200원)으로 제시하자 알리바바는 자사 모델 가격을 97%까지 낮추면서 국내 기업 간 경쟁을 시작했다. 이후 텐센트와 바이두 등 중국 빅테크도 AI 모델 경쟁에 합류했다. 이런 가운데 딥시크가 최근 가성비를 앞세워 딥시크 R1을 새로 출시했다. 이를 통해 중국을 넘어선 글로벌 AI 생태계를 강타했다. 이어 알리바바가 모델을 새로 출시해 재응수한 셈이다. 같은 날 틱톡을 운영하는 중국 바이트댄스도 플래그십 AI 모델 업데이트를 발표하면서 새 모델 성능이 오픈AI의 GPT-4o를 능가한다고 주장했다.

2025.01.30 10:35김미정

오픈AI, 美정부 전용 챗GPT 출시…美中 AI경쟁 본격화 전망

오픈AI가 미국 정부 기관을 위한 맞춤형 AI 챗봇 '챗GPT Gov'를 출시하면서 중국과의 인공지능(AI) 경쟁이 더욱 치열해질 전망이다. 30일 오픈AI는 미국 정부 기관용 인공지능(AI) 업무 보조 도구 '챗GPT Gov'를 소개했다. 챗GPT Gov는 비대중적이고 민감한 정보를 다루는 정부 기관을 위해 특별히 설계된 AI챗봇이다. 각 정부 기관에 특화된 AI 기능을 지원하며, 특히 민감한 데이터와 업무를 다루는 만큼 사이버 보안과 개인정보 보호 및 규정 준수 요구 사항을 더 쉽게 관리할 수 있다. 또한 자체 마이크로소프트 애저 상업용 클라우드나 애저 거버먼트 커뮤니티 클라우드에서 구동된다. 이를 통해 챗GPT Gov를 사용하는 공무원들은 자체 보안과 프라이버시, 규정에 대한 준수 사항을 관리할 수 있다. 오픈AI는 지난해부터 1년여간 3천500여 개의 미국 연방·지방정부 기관에서 9만여 명의 이용자가 일상 업무에 도움을 받기 위해 챗GPT를 이용했다고 밝혔다. 이런 수요를 반영해 이번에 정부 기관용 챗GPT를 선보이게 됐다는 설명이다. 챗GPT Gov의 출시는 미국 정부의 AI 도입을 가속화하고 국가 경쟁력을 높이는 데 기여할 것으로 보인다. 오픈AI는 "미국 정부의 인공지능 도입은 효율성과 생산성을 높일 수 있으며, 이 기술 분야에서 미국의 글로벌 리더십을 유지하고 강화하는 데 매우 중요하다"고 강조했다. 이와 함께 챗GPT Gov 출시와 함께 미중 간 AI 경쟁이 더욱 치열해질 것이란 전망도 나오고 있다. 정부에서 본격적으로 AI를 활용하는 만큼 정부관계자들이 직접 성능을 체험할 것으로 예상되기 때문이다. 한편, 최근 중국의 AI 스타트업 딥시크(DeepSeek)에서 공개한 AI챗봇 'R1'이 챗GPT보다 우수하다는 평가를 받으며 주목받고 있다. R1은 오픈AI, 메타 등 미국 기업들보다 훨씬 적은 비용으로 경쟁 AI 모델에 필적하는 성능을 달성한 것으로 알려지면서 AI시장의 변화를 예고했다. 도널드 트럼프 대통령은 딥시크의 R1 모델에 대해 "미국 산업에 경각심을 줄 신호"라며 "중국에서 했다면 미국 기업도 해낼 수 있을 것이라며 이번 사례가 경쟁력을 강화하는 계기가 될 것"이라며 했다.

2025.01.30 07:59남혁우

"딥시크 R1, 어떻게 만들었나?"…美연구진, AI역설계로 뜯어본다

미국 AI 커뮤니티가 딥시크 R1 모델의 숨겨진 기술 분석에 나섰다. 미국 인공지능(AI) 개발자들이 중국의 최신 AI 모델의 숨겨진 비밀을 찾기 위한 프로젝트를 진행한다. 30일 AI 개발플랫폼 허깅페이스는 '오픈-R1(Open-R1)' 프로젝트를 실시한다고 밝혔다. 이 프로젝트의 목표는 R1 모델의 역설계(reverse engineering)를 통해 동일한 성능을 갖춘 완전한 오픈소스 버전을 제작하는 것이다. 현재 R1은 오픈소스로 공개됐지만 학습 데이터와 일부 알고리즘은 공개되지 않았다. 허깅페이스 측은 숨겨진 부분을 모두 분석한 후 완전한 오픈소스 버전으로 구축해 누구나 자유롭게 연구할 수 있도록 투명성을 확보해야 한다고 강조하며 프로젝트를 추진하고 있다. 예상보다 뛰어난 성능을 보인 R1 모델에 경계심을 느끼며 어떻게 비용을 절감하면서도 성능을 유지했는지 파악하기 위해서라는 이유다. 관련 업계에선 이 프로젝트를 통해 R1 모델의 학습 방법과 기술이 더욱 명확히 밝혀지는 만큼 AI 기술 발전에 영향을 미칠 것으로 기대하고 있다. 특히 적은 비용과 인프라로 높은 수준의 AI모델을 개발할 수 있는 방법이 제시되며 다양한 AI모델이 오픈소스로 공개될 수 있을 것이란 전망도 나오고 있다. 오픈-R1 프로젝트를 담당 중인 허깅페이스의 엘리 바쿠치 엔지니어는 "R1 모델은 인상적이지만, 공개 데이터 세트, 실험 세부 정보 또는 중간 모델이 제공되지 않아 복제 및 추가 연구가 어렵다"며 "R1의 전체 아키텍처를 완전히 오픈소스화하는 것은 투명성만을 위한 것이 아니라 잠재력을 끌어내는 역할이 될 것"이라고 설명했다.

2025.01.30 07:52남혁우

'억만장자' 스티브 코헨 "엔비디아 주가 폭락은 잘못된 정보 때문"

미국 유명 헤지펀드 '포인트72'의 설립자이자 억만장자인 스티브 코헨이 중국 인공지능(AI) 스타트업 딥시크(DeepSeek) 쇼크로 엔비디아 등 기술주가 폭락한 것을 두고 잘못된 정보 때문이라고 지적했다. 29일(현지시간) 파이낸셜타임즈에 따르면 스티브 코헨은 미국 마이애미에서 열린 헤지펀드 컨퍼런스에 참석해 “딥시크 AI 그룹의 등장이 이 분야 강세를 불러올 것”이라며 “그것이 인공 초지능으로의 이동을 앞당기고 있다”고 말했다. 이날 그는 최근 있었던 주가 폭락에 대해서도 언급했다. 앞서 딥시크가 공개한 새로운 모델은 엔비디아가 출시한 비교적 낮은 성능의 칩을 활용해 훈련한 것으로 알려졌다. 이에 AI 모델 개발에 필수적인 것으로 여겨졌던 엔비디아의 최첨단 AI 칩이 필요하지 않을 수 있다는 전망이 나오며 엔비디아 주가는 16.97% 급락한 바 있다. 스티브 코헨은 “일을 하지 않고 떠드는 사람들이 많고 그들은 투자자와 대중에게 잘못된 정보를 제공할 수 있다”며 “최근에도 그런 모습을 봤다”고 말했다. 이어, “AI는 엄청난 변화이며 모든 사람과 그들이 삶을 영위하는 방식, 사업을 하는 방식에 영향을 미칠 것”이라며 “사람들이 어제처럼 의심하는 순간이 있을 것이고 주식을 소유한 사람 중에는 자신이 무엇을 소유하고 있는지, 왜 소유하고 있는지를 모르는 사람이 많을 것”이라고 덧붙였다.

2025.01.29 11:39김민아

엔비디아 "딥시크 AI 혁신, GPU 수요 더 증가시킬 것"

엔비디아가 27일(미국 현지시간) 중국 AI 스타트업 딥시크(DeepSeek)가 공개한 새 AI 모델 'R1'에 대해 긍정적인 평가를 내왔다. 딥시크 R1은 20일 공개된 추론 특화 AI 모델이다. 자체 테스트 결과에 따르면 딥시크 R1은 일부 테스트에서 오픈AI의 추론 특화 모델 'o1'보다 나은 성능을 보였다. 또 2022년 미국 상무부의 수출 통제 조치를 우회하기 위해 엔비디아가 성능을 낮춘 H800 GPU를 이용했다. 모델 훈련에 든 순수 비용은 557만6천달러(약 80억원)이며 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준이다. 지난 주 알렉산더 왕 스케일AI CEO는 미국 CNBC와 인터뷰에서 "딥시크가 미국 정부의 수출 규제를 우회해 고성능 GPU를 썼을 것"이라고 주장했다. 그러나 엔비디아는 "시크가 사용한 GPU가 미국의 수출 규정을 완전히 준수했다"고 확인했다. 27일 미국 증권 시장에서는 딥시크 R1 이후 비교적 성능이 낮은 GPU로 고성능 AI 모델 개발이 활발해질 것이라는 전망에 따라 엔비디아 주가가 크게 하락했다. 1주당 가격은 지난 주 대비 16.86% 하락한 118.58달러(약 17만 2천원)로 마감했고 시가총액은 6천억 달러(약 868조원) 가까이 줄었다. 미국 CNBC에 따르면 엔비디아는 "딥시크는 탁월한 AI 발전의 사례이며, 사용 가능한 모델과 완전한 수출 통제 준수 하에 구축된 컴퓨팅을 활용하여 새로운 모델을 생성하는 방법을 잘 보여준다"고 밝혔다. 엔비디아 관계자는 이어 "추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 전망했다.

2025.01.28 16:22권봉석

中 딥시크, 이미지 AI '야누스 프로'도 공개…美, AI 지위 흔들

중국 스타트업 딥시크가 저비용 거대언어모델(LLM) 인공지능(AI) 'R1'에 이어 그림 AI 모델 '야누스 프로(Janus-Pro)'를 공개하며 이미지 생성과 분석 기술로 시장 점유율 확대를 노린다. 28일 테크크런치 등 외신에 따르면 딥시크는 '야누스 프로' 모델을 AI 개발 플랫폼인 허깅페이스에서 다운로드 가능하도록 공개했다. '야누스 프로'는 10억~70억 파라미터 규모로 구성됐으며 MIT 라이선스 하에 상업적 활용이 가능하다. '야누스 프로'는 이미지 생성과 분석이 모두 가능한 '새로운 자율회귀 프레임워크'를 적용한 모델이다. 딥시크는 해당 모델이 AI 평가 벤치마크인 젠이밸과 DPG벤치에서 오픈AI의 '달리 3' 뿐만 아니라 '픽스아트알파', '스테이블 디퓨전 XL' 등의 기존 경쟁 모델을 능가했다고 설명했다. 딥시크는 자사의 언어 모델과 챗봇 앱으로도 이미 주목받고 있다. 최근 챗봇 앱이 애플 앱스토어 1위를 차지하며 미국과 중국 간 AI 경쟁에서 중요한 플레이어로 부상했다. AI 시장에서는 이번 발표로 미국의 우위가 흔들릴 가능성이 제기되고 있다. 특히 딥시크가 가성비 높은 효율적인 컴퓨팅 기술을 통해 학습한 모델을 선보임에 따라 AI 칩 수요의 지속 여부에도 이목이 집중되고 있다. 테크크런치는 "효율적인 컴퓨팅 기술을 활용해 학습된 딥시크의 모델은 미국이 AI 경쟁에서 우위를 유지할 수 있을지에 대해 논란을 불러일으키고 있다"며 "또 AI 칩 수요가 지속될지에 대해 월스트리트 애널리스트들과 기술 전문가들 사이에서도 논쟁이 일고 있다"고 분석했다.

2025.01.28 16:11조이환

中 딥시크 AI 돌풍, 엔비디아 급락…트럼프 "긍정적 신호"

중국 스타트업 딥시크가 개발한 저비용 거대언어모델(LLM)이 전 세계 인공지능(AI) 산업에 충격을 주고 있다. 이 모델이 효율성과 경제성을 기반으로 업계 1위 오픈AI '챗GPT'를 넘어서는 성과를 기록하는 가운데 도널드 트럼프 미국 대통령은 이를 긍정적인 산업 변화의 신호로 평가했다. 28일 로이터 등 외신에 따르면 딥시크가 지난주 출시한 AI가 기존 '챗GPT' 모델보다 20~50배 저렴한 운영 비용을 강점으로 빠르게 시장의 주목을 받고 있다. 이 AI는 곧 애플 앱스토어 다운로드 순위에서 1위를 기록하며 '챗GPT'의 인기를 넘어섰다. 이러한 영향으로 기술주 중심의 나스닥 지수는 월요일 3.1% 하락했으며 엔비디아는 하루 만에 주가가 17% 하락하면서 5천930억 달러(한화 약 840조원)의 시장 가치를 잃었다. 딥시크는 '챗GPT'와 유사한 LLM 모델로, 기존의 고비용 데이터 센터나 대규모 전력 소모 없이도 효과적인 성능을 제공하는 점에서 주목받고 있다. 특히 딥시크 'R1' 모델은 오픈AI의 프론티어 모델인 'o1'과 유사한 성능을 보여주면서도 모바일과 PC 사용에 최적화돼 있다. 딥시크는 엔비디아가 출시한 비교적 낮은 성능의 H800 칩을 활용해 약 600만 달러(한화 약 80억원)로 모델을 훈련시킨 것으로 알려졌다. 특히 이 모델은 데이터를 보다 효율적으로 활용해 AI 모델의 비용과 전력 소모를 대폭 줄였다는 평가를 받는다. 이번 딥시크의 출시는 엔비디아 이외의 전 세계 기술주에도 큰 영향을 미쳤다. 필라델피아 반도체 지수는 9.2% 하락해 지난 2020년 3월 이후 최대 낙폭을 기록했으며 일본의 소프트뱅크와 유럽의 ASML 같은 주요 기업들 또한 큰 타격을 입었다. 도널드 트럼프 대통령은 플로리다에서 열린 행사에서 딥시크의 기술을 "미국 산업에 경각심을 줄 신호"라며 긍정적으로 평가했다. 그는 미국 기업들이 더 저렴한 솔루션을 개발할 수 있을 것으로 기대하며 딥시크의 사례가 경쟁력을 강화하는 계기가 될 것이라고 말했다. 전문가들 역시 딥시크의 등장으로 AI 산업의 기존 판도가 크게 변할 가능성을 제기하고 있다. 마크 안드리센 실리콘밸리 벤처 투자자는 이를 "AI의 스푸트니크 모멘트"로 칭하며 딥시크 R1 모델을 "놀랍고 인상적인 기술적 혁신"으로 평가했다. 브라이언 제이콥슨 아넥스 웰스 매니지먼트 수석 이코노미스트는 "딥시크의 기술이 더 나은 AI 모델의 기준이 될 가능성이 있다"며 "이는 기존의 대규모 데이터 센터와 전력 인프라에 대한 수요를 감소시킬 수 있다"고 분석했다.

2025.01.28 11:02조이환

[미장브리핑] 中 AI '딥시크' 발 쇼크에 나스닥 3%대 급락

◇ 27일(현지시간) 미국 증시 ▲다우존스산업평균(다우)지수 전 거래일 대비 0.65% 상승한 44713.58. ▲스탠다드앤푸어스(S&P)500 지수 전 거래일 대비 1.46% 하락한 6012.28. ▲나스닥 지수 전 거래일 대비 3.07% 하락한 19341.83. ▲중국 인공지능(AI)의 저가 공습에 AI 관련주 거품이 터질 것이라는 우려가 커지면서 S&P 500과 나스닥 지수 하락 마감. 중국 스타트업 딥시크(DeepSeek)는 미국 실리콘밸리가 지출한 금액보다 적은 투자로 경쟁력 있는 AI 모델을 만들었을 것으로 추정돼. 딥시크는 2023년 4월 중국 헤지펀드 투자로 시작해 인공일반지능(AGI) 연구 중. 지난 주 딥시크는 오픈AI의 o1에 대적할 수 있는 'R1'을 발표. 이는 앱 스토어서 순위권 차지. 구체적인 발표는 없었지만 오픈AI나 구글 등에 비해 비용이 저렴하다고 추정돼. 딥시크 측은 12월말 출시된 대규모 언어모델 초기 버전을 설계하는데 600만달러도 들지 않았다고 주장. R1 비용이나 그래픽 처리 장치가 얼마나 들어갔는지 공개하지 않지만 훈련 비용이 560만달러에 불과한 것으로 업계 가늠하고 있는데 이는 메타의 라마 비용의 10% 미만. ▲엔비디아(Nvidia) 약 17% 하락, AMD는 6.4% 급락, 마이크로소프트는 2.1% 하락. ▲미국 연방준비제도(연준) 올해 첫 공개시장위원회(FOMC)에서 금리를 동결할 것이라는 예상이 지배적. CME 페트 워치 툴에 따르면 가능성 97%.

2025.01.28 08:40손희연

"10분의1 가성비"…中 AI '딥시크'에 업계 긴장

중국 스타트업 딥시크가 출시한 생성 인공지능(AI) 모델이 일부 분야에서 오픈AI의 성능을 제쳤다고 밝히면서 관심을 모으고 있다. 특히 메타 등 실리콘 빅테크 기업들이 생성AI 개발에 투입한 비용 대비 10분의1 수준의 개발비만 들인 것으로 알려져 업계가 긴장하는 모습이다. 최근 뉴욕타임스, 테크크런치 등 외신들은 딥시크가 우수한 성능을 보여주면서, 빅테크 업계 긴장감이 높아졌다고 보도했다. 딥시크는 지난달 '딥시크-V3'을 출시한 데 이어 지난 20일 추론 특화 모델로 '딥시크-R1'을 출시하고 기술 보고서를 공개했다. 기술 보고서에 따르면 딥시크 R1은 일부 테스트에서 오픈AI의 추론 특화 모델 'o1'보다 나은 성능을 보였다. 미국 수학경시대회 벤치마크(성능 측정 기준) 테스트 결과 R1은 79.8%로 나타나 79.2%를 획득한 o1을 앞섰다. 코딩 테스트 정확도도 딥시크 R1은 65.9%, o1은 63.4%로 평가됐다. 딥시크는 사전 연구와 실험을 제외하고 모델 훈련에 투입한 비용이 557만6천달러(약 80억원)에 불과하다고 밝혔다. 이는 메타가 AI 개발에 투입한 비용의 10분의 1 수준이다. 딥시크가 엔비디아 'H800' 칩을 사용해 생성AI를 개발하고 있다는 점에서도 주목을 받았다. H800은 엔비디아가 지난 2022년 미국 정부의 수출 통제 조치가 도입됨에 따라 중국 수출 목적으로 개발한 저사양 칩이다. 빅테크보다 성능이 더 좋지 않은 하드웨어를 사용해 경쟁력 있는 AI 모델을 만든 것이다. 딥시크-R1의 경우 H800 2천48개를 사용해 개발됐다. 사용자 단에서도 딥시크에 대한 관심이 고조됐다. 26일(미국시간) 비지니스인사이더는 딥시크 R1가 애플 앱스토어의 무료 앱 분야 다운로드 1위를 차지했다고 보도했다. 오픈AI '챗GPT'는 2위로 나타났다.

2025.01.27 15:42김윤희

[AI는 지금] 中 딥시크, 'V3'로 실리콘밸리에 도전장…"비용·성능 모두 잡았다"

중국 인공지능(AI) 스타트업 딥시크가 최근 새로운 오픈소스 거대언어모델(LLM) 'V3'를 공개하며 주목받고 있다. 주요 벤치마크에서 오픈AI 등 실리콘밸리 빅테크의 AI 모델과 대등하거나 우수한 성능을 입증하면서도 누구나 사용이 가능해 글로벌 생태계에 큰 변화를 가져올 잠재력을 인정받고 있다. 9일 업계에 따르면 딥시크 'V3'는 총 6천710억 개에 달하는 매개변수를 갖춘 모델로, 메타의 최신 모델인 '라마(Llama) 3.1' 버전보다 약 1.5배 더 큰 규모다. 그동안 오픈소스 LLM으로 가장 널리 알려진 라마 시리즈와 비교해도 방대한 수준의 매개변수를 자랑한다. 또 누구나 쉽게 접근할 수 있는 오픈소스 형태로 출시돼 향후 글로벌 AI 생태계에 적잖은 파장을 일으킬 것이라는 관측이 제기된다. 전문가들은 딥시크 'V3'의 성능이 공인 가능한 벤치마크들을 통해 인정받았다고 평가한다. 코딩 분야에서는 코드포스(Codeforces) 등 국제 공인 프로그래밍 테스트를 통해 메타 '라마 3.1'이나 오픈AI의 '챗GPT 4o'와 어깨를 나란히 하거나 일부 영역에서는 오히려 앞선 결과를 보였다. 언어 능력에 있어서도 마찬가지다. 'V3'는 LLM 언어능력을 평가하는 MMLU 벤치마크에서도 88.5점을 달성했다. 이 점수는 88.7점을 받은 'GPT-4o'와의 점수 차가 매우 근소한 수준으로, '클로드 3.5'나 구글 '제미나이' 모델의 점수를 능가해 사실상 최고 수준에 가까운 역량을 입증했다. 개발 비용 측면에서의 가성비는 기술적 완성도만큼이나 'V3'가 주목받는 이유다. 딥시크 측은 'V3' 개발에 약 557만 달러(한화 약 82억 원)를 투입했다고 설명했는데 이는 오픈소스 방식으로 개발된 메타 라마 모델에 투입된 6억4000만 달러(한화 약 8천960억원)의 1% 수준에 불과하다. 또 엔비디아의 최신 AI칩인 'H100' 대신 상대적으로 낮은 성능의 'H800' 활용하면서도 데이터 압축과 연산 최적화를 통해 컴퓨팅 자원을 효율적으로 활용해 성능을 확보했다. 업계 전문가들은 이를 단순히 비용을 절감했다는 차원을 넘어 제한된 환경에서도 고성능 모델을 구현할 수 있다는 가능성을 보여줬다고 평가한다. 다만 오픈AI의 샘 알트먼 대표는 최근 자신의 소셜미디어 계정에서 “이미 운영 중인 것을 복사하는 것은 쉽다"며 "새롭고 어려운 일을 하는 것이 진정한 도전"이라고 언급했다. 업계 일각에서는 이를 딥시크와 같은 중국 AI 기업의 빠른 모델 출시를 겨냥한 우회적 비판으로 분석했다. 그럼에도 불구하고 딥시크가 내세우는 오픈소스 경쟁력과 저렴한 애플리케이션 프로그램 인터페이스(API) 요금 체계는 글로벌 시장에서 테크 기업들의 변화를 초래하는 주요 동력으로 작용할 가능성이 높다. 개인 구독제 형태로 과금을 하는 오픈AI, 구글 등 실리콘 밸리 AI 스타트업과는 달리 'V3'는 깃허브나 허깅페이스에서 개인이 무료로 다운로드가 가능하기 때문이다. 또 API 가격 역시 백만토큰 당 입력토큰이 약 30센트(한화 약 520원), 출력토근이 약 1달러(한화 약 1400원)로 '챗GPT 4'에 비해 약 30~40배 저렴하다. 실제로 중국 내 빅테크 기업들은 이미 딥시크 'V3'를 계기로 모델 사용료를 낮추는 방안을 검토하고 있는 것으로 알려졌다. 'V3' 모델의 경이로운 발전에는 미중 기술 경쟁과 AI 보호무역주의가 오히려 기여했다는 시각도 존재한다. 'H100' 등 미국 정부의 대중국 고성능 반도체 수출 규제 상황과 오픈AI의 중국 내 서비스 중단이 중국 AI 기술 발전을 초래했다는 것이다. 실제로 딥시크는 이보다 훨씬 낮은 사양인 'H800 GPU'에 각종 최적화 기술을 접목해 고효율화를 이뤄낸 것으로 평가된다. 또 지난해 7월부터 오픈AI가 중국 내 '챗GPT' 서비스를 VPN 접속마저 전면 차단하면서 중국 AI 기업들이 독자적인 모델을 키워낼 기회를 갖게 됐다는 분석이다. 미·중 간 기술 패권 경쟁이 중국 AI 스타트업을 더욱 독려하고 있는 셈이다. 다만 정치적 민감 이슈에 대한 회피와 모델 자체의 환각 문제 등은 'V3'이 극복해야 할 과제로 거론된다. 다수의 외신과 소셜 미디어 포스트 등에 따르면 'V3'는 천안문 사태처럼 중국 당국이 민감하게 여기는 주제에 대해서는 답변을 기피하도록 설계됐다. 이는 체제 안정을 AI 개발의 정책적 목표 중 하나로 간주하는 중국 당국의 정책때문이다. 이와 더불어 해외 사용자들이 진행한 테스트 결과 모델은 자신을 'GPT-4'로 혼동하거나 "나는 챗GPT입니다"라고 소개하는 등 환각 현상이 일부 포착됐다. 이에 런던 킹스칼리지의 마이크 쿡 연구원은 "경쟁 모델을 무분별하게 참조하면 현실 왜곡이 일어날 수 있다"고 우려했다. 이같은 단점에도 불구하고 딥시크 'V3'는 성능과 비용 효율 면에서 중요한 진전을 이뤄냈으며 글로벌 AI 시장에 새로운 변화를 불러올 가능성 가진 것으로 평가된다. 한 국내 AI 업계 관계자는 "LLM 수준이 상향 평준화되고 있기 때문에 'GPT 4' 수준의 성능을 보이는 것은 특기할 만한 점은 아니지만 그 외의 조건들이 주목할만 하다"며 "특히 671B 수준의 대형 모델 학습비용이 겨우 77억원밖에 나오지 않았다는 점이 고무적"이라고 평가했다.

2025.01.09 14:16조이환

  Prev 1 2 3 4 5 Next  

지금 뜨는 기사

이시각 헤드라인

새 정부 핵심 키 쥔 AI정책수석...누가 될까

'혹시 나도 AI 노예?'...정치·젠더·종교·세대 성향 알려준다

"K-방산, 국가대표 산업으로"…이재명 직속 컨트롤타워에 기대감↑

불길 잡혔던 '플랫폼법'...새 정부서 불씨 살까

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현