• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
지스타2025
인공지능
스테이블코인
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'컴퓨트'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

구글, '프라이빗 AI 컴퓨트' 공개…"보안·성능 다 잡아"

구글이 개인정보를 보호하면서도 고성능 인공지능(AI) 연산력을 활용할 수 있는 클라우드 플랫폼을 내놨다. 12일 더버지 등 외신에 따르면 구글은 새 클라우드 시스템 '프라이빗 AI 컴퓨트'를 공개했다. 이 플랫폼은 사용자 데이터를 기기 밖으로 내보내지 않으면서 고성능 AI 기능을 실행할 수 있게 하는 것이 특징이다. AI 요청이 클라우드로 전달돼도 구글을 포함한 그 누구도 사용자 데이터를 복호화하거나 접근할 수 없다는 점을 핵심으로 한다. 이를 통해 이용자 프라이버시와 AI의 고도화를 동시에 실현하겠다는 전략이다. 구글은 "그동안 번역이나 오디오 요약, 챗봇 기능 등 주요 AI 처리를 기기 내에서 수행해왔다"며 "이런 방식이 AI 도구의 연산 요구를 감당하기 어렵다고 판단했다"고 밝혔다. 이어 "프라이빗 AI 컴퓨트는 안전하고 강화된 공간(secure, fortified space)"이라며 "민감 데이터는 오직 이용자만 접근할 수 있고 우리조차 볼 수 없다"고 강조했다. 구글은 이 플랫폼을 통해 AI가 단순한 명령 수행을 넘어 개인 맞춤형 제안까지 제공할 수 있을 것으로 기대했다. 예를 들어 픽셀10에서는 이메일과 캘린더 정보 바탕으로 문맥형 제안을 제공하는 '매직 큐' 기능과 더 많은 언어의 리코더 전사 기능이 지원되는 식이다. 앞서 애플도 프라이빗 클라우드 컴퓨터를 올해 WWDC에서 공개한 바 있다. 해당 시스템은 아이폰과 아이패드, 맥 등 기기에서 처리하기 어려운 AI 연산을 클라우드로 넘기되, 개인정보는 노출되지 않도록 설계된 보안 구조로 이뤄졌다. 구글은 "이는 시작에 불과하다"며 "앞으로 다양한 기기와 서비스에 프라이빗 AI 컴퓨터를 확대 적용할 것"이라고 강조했다.

2025.11.12 10:28김미정

Arm "AI 시대, 전력 효율이 데이터센터 생존 키워드"

"인공지능(AI) 워크로드가 폭증하면서 전력 효율성이 데이터센터 산업의 핵심 과제로 부상했다. 현재 AI 서버 랙 한 대가 미국 가정 100가구 분량의 전력을 소비하다. 또 2030년까지 AI 연산을 위해 160GW(기가와트)의 추가 전력 공급이 필요할 것으로 예상된다." 21일 오전 서울 삼성동 'Arm 언락드 2025 서울' 행사장에서 에디 라미레즈 Arm 인프라 사업부 시장 진입 전략 부사장이 이렇게 설명했다. Arm은 지난 9월 중국 상하이를 시작으로 오는 11월까지 반도체 생태계가 형성된 전세계 주요 도시를 돌며 파트너사 사례와 Arm 기술을 소개하는 '언락드'(Unlocked) 행사를 진행중이다. 이날 오전 진행된 미디어 브리핑에서 에디 라미레즈 부사장은 "AI 하드웨어 혁신은 더 빠르고 효율적인 맞춤형 실리콘 설계에 달려 있다"며 "Arm은 한국을 포함한 전 세계 파트너들과 함께 전력 효율적인 AI 시대의 인프라를 만들어갈 것"이라고 말했다. Arm 네오버스 기반 서버용 칩 10억 코어 출하 Arm은 2019년 대형 클라우드 서비스 제공자와 데이터센터를 겨냥한 CPU IP '네오버스'(Neoverse)를 출시한 이후 AWS, 구글, 마이크로소프트, 오라클 등 주요 CSP(클라우드 서비스 사업자)의 서버에 10억 개 이상의 코어를 출하하는 성과를 거뒀다. Arm은 네오버스 플랫폼과 함께 Arm IP를 활용한 맞춤형 시스템반도체(SoC) 설계 기간을 단축하고 파트너 간 기술을 공유해 비용과 리스크를 줄이는 협력 모델인 'Arm 토털 디자인'(ATD) 프로그램도 진행하고 있다. 지난 주 미국에서 열린 'OCP 서밋 2025'에서는 리벨리온, 코아시아, 삼성전자 파운드리, 세미파이브 등 한국 기업들이 새로 합류해 현재 36개 글로벌 반도체 기업이 참여하고 있다. Arm, OCP 이사회 합류... 칩렛 기술도 제공 오픈컴퓨트프로젝트(OCP)는 개방형·오픈소스 기술 기반으로 데이터센터 하드웨어를 개발하기 위한 프로젝트로 구글·마이크로소프트·인텔·AMD 등 글로벌 IT 기업과 연구기관이 참여하고 있다. Arm은 이번 OCP 서밋 2025에서 AMD·엔비디아와 함께 오픈컴퓨트프로젝트(OCP) 이사회에 합류하는 한편, 서로 다른 제조사와 IP 기반 반도체 칩렛(조각)을 2.5차원/3차원으로 쉽게 통합할 수 있는 기반 시스템 칩렛 아키텍처(FCSA) 사양을 OCP에 제공하기로 했다. 에디 라미레즈 부사장은 "FCSA는 서로 다른 반도체 사이에 부팅, 보안, I/O 확장 등 상호 운용성을 강화할 수 있는 프로토콜 수준 표준화를 통해 다양한 제조사가 참여 가능한 벤더 중립적 생태계를 구축하는 것이 목표"라고 설명했다. 이어 "FCSA는 특정 칩 설계나 패키징 기술을 강제하지 않으며, CPU·가속기·메모리 등 이기종 연산 환경에서 통합을 도울 것"이라고 밝혔다. "韓 파트너사, 칩렛 기반 혁신의 핵심 축 될 것" 에디 라미레즈 부사장은 이날 한국 반도체 생태계의 중요성도 강조했다. 그는 "한국은 파운드리부터 ASIC(맞춤형반도쳬), 제3자 반도체 IP(지적재산권), 고급 패키징까지 공급망이 완비된 특이한 시장 중 하나"라고 평가했다. 이어 국내 팹리스 반도체 업체 리벨리온이 개발한 AI 추론 특화 반도체 '립프로그'(Leapfrog)를 예로 들며 "립프로그는 Arm의 네오버스 반도체 IP, 삼성전자 파운드리의 2나노급 제조 기술, 에이디테크놀로지의 칩렛 설계 기술 기반으로 구성된 ATD 협력의 대표적 성과"라고 설명했다. 그는 "한국 시장은 정부의 AI 전략 투자와 스타트업 성장세가 맞물려 Arm의 글로벌 AI 생태계 확장에 중요한 역할을 하고 있다"며 "한국 파트너사들은 칩렛 기반 맞춤형 실리콘 개발의 새로운 장을 여는 핵심 축이 될 것"이라고 강조했다.

2025.10.21 16:13권봉석

Arm, OCP 이사회 합류... 칩렛 표준화 기술 기여

Arm은 21일 개방형 데이터센터 표준을 주관하는 업계 단체인 오픈컴퓨트프로젝트(OCP) 이사회에 합류한다고 밝혔다. OCP는 개방형·오픈소스 기술 기반으로 데이터센터 하드웨어를 개발하기 위한 프로젝트로 구글·마이크로소프트·인텔·AMD 등 글로벌 IT 기업과 연구기관이 참여하고 있다. Arm은 OCP 네트워킹 프로젝트(OCP Networking Project) 산하 대규모 AI용 이더넷 기술 발전 협력체 ESUN에 합류하는 등 이미 펌웨어, 관리 가능성, 서버 하드웨어 설계 관련 OCP 워크스트림에서 활발히 활동하고 있다. Arm은 이번에 AMD, 엔비디아 등 주요 반도체 업체와 함께 OCP 이사회에 합류했으며 OCP에 참여하는 주요 기업과 AI 데이터센터를 위한 개방적이고 상호운용 가능한 설계 발전을 위해 노력할 예정이다. 모하메드 아와드 Arm 인프라 사업부 총괄은 "AI 경제는 컴퓨팅 인프라를 재편하고 있으며, 클라우드부터 엣지까지 전례 없는 성능과 효율성, 확장성을 요구하고 있다"고 설명했다. 이어 "현재 AI 전용 랙(rack) 시스템은 미국 100가구 수준의 전력을 소비하며 2020년 최고 슈퍼컴퓨터급 성능을 낸다. 이런 과제를 해결하려면 차세대 인프라와 함께 빠르게 진화하는 생태계 전반의 개방적 협력이 필수적"이라고 밝혔다. Arm은 OCP 이사회 합류와 함께 서로 다른 제조사와 IP 기반 반도체 칩렛(조각)을 2.5차원/3차원으로 쉽게 통합할 수 있는 기반 시스템 칩렛 아키텍처(FCSA) 사양을 OCP에 제공하기로 했다. Arm이 제안하는 FCSA는 특정 기업이나 프로세서 아키텍처, ISA에 종속되지 않는 개방형 프레임워크로 칩렛 설계 및 통합 기간 단축, 칩렛 재사용과 상호운용성 실현을 목표로 한다. Arm은 "Arm은 데이터센터 내 모든 배포 환경에서 AI를 효율적으로 확장할 수 있는 방안 마련에 주력하고 있다. OCP 이사회 합류와 FCSA 제공은 이러한 노력의 시작에 불과하다"고 밝혔다.

2025.10.21 11:15권봉석

[AI는 지금] 300억 달러 조달한 메타, 데이터센터 투자에 빚 부담 덜어낸 비결은?

글로벌 인공지능(AI) 시장 내 패권 잡기에 속도를 높이고 있는 마크 저커버그 메타 최고경영자(CEO)가 초대형 데이터센터 '하이페리온' 프로젝트를 위해 대규모 자금 유치에 성공했다. AI 경쟁이 연산력 중심으로 재편되는 상황에서 자본 효율성과 기술 주권을 동시에 잡는 전략을 취해 업계의 주목을 받고 있다. 17일 블룸버그통신에 따르면 메타는 미국 루이지애나주에 짓고 있는 '하이페리온' 데이터센터 부지 개발을 위해 300억 달러(약 41조원) 규모의 자금조달에 성공했다. 이는 민간 자본이 참여한 사상 최대 규모의 데이터 인프라투자로 평가된다. 이를 위해 앞서 미국 투자은행 모건스탠리는 270억 달러 부채와 25억 달러 지분을 묶어 특수목적법인(SPV)을 설립했다. 사모펀드 블루아울캐피털·핌코(PIMCO) 등 금융기관도 자금조달 파트너로 뛰어들었다. 이번 거래에서 메타는 블루아울캐피털과 하이페리온 부지를 공동 소유하되 20%의 지분만 유지키로 합의했다. 또 SPV 구조에 따라 메타가 직접 차입을 하지 않았다는 점에서 자금 부담도 다소 덜었다. 직접 돈을 빌리기보다 SPV가 자금을 차입하고 메타는 개발자·운영자·임차인 역할만 담당하는 식이다. 다만 일정 부분 자산 가치 보증 조건은 포함된 것으로 알려졌다.이로써 메타는 신용등급(AA-)을 유지하면서도 대규모 AI 인프라 투자를 이어갈 수 있는 구조를 확보했다. 또 외부 파트너와의 공동 개발로 기술 기업과 투자자들은 윈윈(win-win) 효과를 얻을 것으로 보인다. 블룸버그통신은 "AI와 데이터 수요 증가로 인해 대규모 차입은 점점 늘어나고 있는 추세"라며 "이번 일은 대형 테크기업들이 신용등급을 해치지 않으면서도 초대형 데이터센터를 개발할 수 있는 새로운 자금 조달 모델로 주목받고 있다"고 말했다. 실제 올해 9월 말까지 미국 채권시장에서 테크 기업들이 조달한 금액은 약 1천570억 달러로, 전년 동기 대비 70%나 증가했다. 메타는 전 세계에 29개 데이터센터 설립 및 운영 중으로, 올해만 AI 관련 인프라 프로젝트 등에 최대 720억 달러(약 102조원)의 자본을 지출할 예정이어서 부담이 큰 상태였다. 다른 빅테크들도 자금 부담을 덜기 위해 다양한 방안을 마련 중이다. 실제 오픈AI는 미국 내 데이터센터 구축을 위해 오라클과 수십억 달러 규모의 컴퓨팅 파워 공급 계약을 맺고 5년 단위의 확장 계획을 세우고 있다. 세계 최대자산운용사 블랙록과 엔비디아·마이크로소프트(MS)·xAI 등은 'AI 인프라 파트너십(AIP)'이라는 투자 컨소시엄을 꾸리고, 데이터센터 설계·운영사인 '얼라인드 데이터 센터'를 400억 달러(약 56조원)에 인수하기로 합의했다. 업계 관계자는 "AI 데이터센터 투자는 규모가 워낙 크기 때문에 기업들이 자금 확보에 대해 고민이 많다"며 "이번 일을 계기로 기업들이 재무제표에 직접 부채를 올리지 않고 자산을 분리하는 구조가 확산될 것"이라고 전망했다. 메타는 하이페리온 데이터센터를 통해 외부 클라우드 의존도도 낮출 것으로 기대하는 눈치다. 오는 2029년 완공되는 하이페리온 데이터센터는 메타가 전 세계에 보유한 약 25개 데이터센터 가운데 최대 규모다. 총 400만 제곱피트(약 37만㎡) 부지에 들어서며 완공 시 최대 5기가와트(GW)의 전력을 소모할 예정이다. 이는 미국 가정 400만 가구의 전력 사용량에 해당한다. 업계 관계자는 "이 시설은 메타의 AI 모델 학습·추론용 핵심 연산 허브가 될 것"이라며 "엔비디아 H100·B100급 그래픽처리장치(GPU) 수십만 개를 동시에 구동할 수 있는 규모로, 메타가 아마존웹서비스(AWS)나 MS 애저(Azure) 같은 외부 클라우드 의존도를 낮추고 자체 AI 인프라 비중을 높이려는 시도로 보인다"고 분석했다. 이어 "이는 곧 'AI 컴퓨트 주권' 확보로 이어질 것"이라며 "AI 모델의 크기가 급증하고 전력 수요가 폭증하는 상황에서 자체 인프라를 보유한 기업만이 지속 가능한 AI 경쟁력을 확보할 수 있기 때문"이라고 덧붙였다. 또 다른 관계자는 "AI 시장의 경쟁력은 더 이상 데이터나 알고리즘이 아닌 연산력·전력·자본 구조의 효율성으로 이동하고 있다"며 "메타의 이번 거래는 그 전환을 대표하는 사례"라고 봤다.

2025.10.17 17:35장유미

"데이터 주권 실현"…오라클, 소버린 클라우드 서비스 출시

오라클이 규제 산업에서도 데이터 주권·보안을 확보할 수 있는 소버린 클라우드 솔루션을 공개했다. 오라클은 인터넷과 완전히 분리된 소버린 클라우드 서비스 '오라클 컴퓨트 클라우드앳커스터머 아이솔레이티드'를 발표했다고 30일 밝혔다. 이 솔루션은 각국 정부, 방위 산업, 정보 기관, 의료, 통신 분야 등 고위험 산업이 기밀 워크로드를 안전하게 운용할 수 있도록 설계됐다. 이 서비스는 기존 오라클 컴퓨트 클라우드앳커스터머와 동일한 컴퓨팅, 스토리지, 네트워킹 서비스·도구를 갖췄다. 오라클은 이번 솔루션을 통해 클라우드와 인공지능(AI) 이점을 규제 대상 산업에 확산할 방침이다. 온프레미스 환경에서도 유연하게 서비스를 구축할 수 있도록 지원한다. 오라클은 이 솔루션을 단일 랙(rack) 단위로 신속하게 배포할 수 있으며 필요에 따라 확장도 가능하다고 밝혔다. 이를 통해 격리된 환경에서 데이터 주권을 유지하면서도 AI 기반 혁신을 추구할 수 있다는 설명이다. 방위 산업체는 클라우드 마이그레이션이 필요한 상황에서 빠르게 클라우드 서비스를 활용할 수 있다. 오라클은 6~8주간에 걸친 '빠른 시작' 프로그램도 제공한다. 이 프로그램은 고객이 오라클 클라우드 아이솔레이티드 리전을 구축하는 과정의 초석을 마련해 준다. 초기에는 전략적 엣지 컴퓨팅을 시작점으로 삼고 점진적으로 에어갭 환경까지 확장하는 방식이다. 후지쯔 앤디 레이들러 방위 및 국가 보안 최고디지털책임자는 "디지털 서비스가 군 작전 근간이 되는 가운데 오라클 솔루션은 어떤 환경에서도 미션에 필요한 연결성과 접근성을 제공한다"며 "안전하고 격리된 환경이기 때문에 필요한 기능을 가장 필요한 곳에 배포할 수 있다"고 말했다.

2025.06.30 11:00김미정

인텔, AI GPU 전략 재정비...'실리콘 포토닉스'로 활로 모색

인텔이 립부 탄 신임 CEO 취임과 함께 AI 가속기 전략을 전면 재정비하고 있다. 특히 연이은 GPU 출시 지연과 취소로 흔들렸던 AI 하드웨어 로드맵을 새롭게 구축하는 데 총력을 기울이고 있다. 인텔은 가우디 시리즈를 통해 '가성비' 전략으로 AI 가속기 시장에 진입했지만 엔비디아와 AMD가 주도하는 GPU 시장에서 큰 성과를 거두지 못하고 있다. 립부 탄 CEO는 데이터센터와 묶여 있던 AI 부문을 독립 조직으로 분리하고 신임 CTO를 임명하는 등 조직 개편도 단행했다. x86 아키텍처와 광전송 기술의 결합이라는 독자적 접근법으로 대형 하이퍼스케일러 고객을 확보하는 데 집중할 전망이다. 출시 연기·취소·중단에 시달린 인텔 AI GPU 인텔의 AI 처리용 GPU 전략은 출시 시점 지연, 개발 취소, 출시 연기 등으로 계속해서 흔들리고 있다. 2019년부터 개발이 시작된 서버용 GPU '데이터센터 GPU 맥스'는 2021년 시제품 공개, 2022년 11월 출시 이후 미국 아르곤 국립연구소에 구축한 슈퍼컴퓨터 '오로라'(Aurora) 등에 탑재됐지만 지난 해 5월 단종됐다. 데이터센터 GPU 맥스 후속 제품인 '리알토 브리지'(Rialto Bridge) 출시 계획도 2023년 3월 좌절됐다. 이를 대신할 서버용 GPU '팰콘 쇼어'(Falcon Shore)는 개발을 마쳤지만 시장 출시를 포기했다. 지난 1월 말 미셸 존스턴 홀타우스 인텔 프로덕트 그룹 CEO는 "관련 업계 피드백에 따라 팰콘 쇼어는 내부 테스트용으로만 활용하고 외부 판매하지 않을 것"이라고 밝혔다. 가우디 시리즈, 성능 아닌 '가성비'에 초점 현재 인텔의 AI 관련 주력 제품은 GPU가 아닌 AI 연산 가속기 '가우디'(Gaudi)다. 2019년 20억 달러(약 2조 5천530억원)에 인수한 이스라엘 스타트업 업체인 하바나랩스 기술력을 기반으로 2022년 '가우디2', 지난 해 6월 '가우디3'를 출시했다. 인텔은 가우디 시리즈의 강점을 성능이 아닌 '가격 대비 성능'으로 잡고 있다. 가우디3는 엔비디아 H100 기반 시스템 대비 총소유비용(TCO)이 최대 2.5배 더 우수하며, 후속 제품인 H200 대비 소형 AI 모델에서 60%, 대형 모델에서도 최대 30% 더 효율적이라는 것이다. 그러나 경쟁사인 AMD가 AI 가속용 GPU인 MI300 시리즈로 틈새 시장을 꾸준히 넓히는 가운데 가우디3의 실제 판매 실적은 자체 예상 대비 미미하다. 인텔이 AI 소프트웨어 개발을 위해 제공하는 오픈소스 기반 '원API'가 가우디 시리즈를 제한적으로 지원하는 것도 문제다. 립부 탄 인텔 CEO, AI 전략 전면 재수정 이에 지난 3월 취임한 립부 탄 인텔 CEO는 GPU를 포함해 AI 전략 전반 재조정에 나섰다. 먼저 인텔 프로덕트 그룹 내 '데이터센터·AI'(DCAI) 부문에서 AI 부문을 독립시켰다. 또 네트워크·엣지(NEX) 담당 사친 카티(Sachin Katti) 부사장을 최고기술책임자(CTO)와 AI 담당 최고 책임자로 승진시켰다. 지난 주 실적발표 이후 컨퍼런스콜에서 립부 탄 CEO는 "AI 에이전트와 추론 모델이 정의하는 새로운 컴퓨팅 시대에 진입하는 가운데 새로운 AI 워크로드에 대응하기 위해 제품 로드맵을 조정하고 있다"고 설명했다. 재규어 쇼어에 실리콘 포토닉스 통합 가능성 ↑ 재규어 쇼어(Jaguar Shore)는 출시가 좌절된 팰콘 쇼어 후속 제품으로 내년 출시 예정이다. 인텔은 재규어 쇼어에 광전송 기술 '실리콘 포토닉스'를 결합하는 방안도 고려중이다. 광섬유와 레이저를 이용한 데이터 전송은 구리선 대비 더 먼 거리로 대용량 데이터를 주고 받을 수 있다. 이를 처리하려면 광신호를 데이터로 변환해 주고 받는 장치인 '트랜시버'(Transceiver)가 반드시 필요하다. 실리콘 포토닉스는 트랜시버 없이 광섬유를 직접 실리콘에 연결해 데이터를 주고 받기 위한 기술이다. 여러 GPU로 구성되는 클러스터의 데이터 처리량을 극적으로 향상시킬 수 있다. 인텔은 지난 해 6월 광통신 전시회 'OFC 2024' 기간 중 단방향 최대 256GB/s(2048Gbps), 양방향 512GB/s(4096Gbps)로 데이터를 전송하는 광학 컴퓨트 인터커넥트(OCI) 칩렛을 공개하고 시연하기도 했다. 인텔 "x86·실리콘 포토닉스, AI 기회 넓힐 것" 인텔은 재규어 쇼어와 함께 고성능 x86 프로세서, 실리콘 포토닉스, 타일(Tile) 단위 칩렛 설계, 패키징 기술을 활용해 신규 고객사를 확보할 예정이다. 미셸 존스턴 홀타우스 인텔 프로덕트 그룹 CEO는 "실리콘 포토닉스는 랙 스케일 대형 아키텍처에서 매우 중요한 요소이며 인텔은 파운드리 고객사에 실리콘 포토닉스 기술을 제공할 수 있는 유일한 회사"라고 설명했다. 이어 "실리콘 포토닉스가 랙 스케일 아키텍처 구축 기회를 더욱 넓혀줄 것으로 매우 낙관한다. 또한 오픈 x86 역시 강점이다. 고객들은 x86 생태계와 그 소프트웨어를 선호한다. x86으로 AI 인프라를 구축할 수 있다면 매우 관심이 크다. 이미 대형 맞춤형 설계 계약을 하나 체결했고, 추가 계약도 기대한다"고 덧붙였다.

2025.04.29 14:25권봉석

앤트로픽, '클로드 3.7 소네트' 공개…하이브리드 AI 시대 연다

앤트로픽이 실시간 응답과 심층적인 추론을 하나로 통합한 인공지능(AI)을 출시해 거대언어모델(LLM)의 새로운 기준을 제시했다. 보다 직관적인 방식으로 인간과 상호작용하도록 함으로써 갈수록 치열해지는 AI 경쟁에서 우위를 점하려는 전략이다. 25일 테크크런치에 따르면 앤트로픽은 거대언어모델(LLM)과 추론 모델을 결합한 '하이브리드 AI'인 '클로드 3.7 소네트'를 공식 발표했다. 이 모델을 통해 사용자는 기존의 LLM을 활용했을 때처럼 즉각적인 응답을 받을 수도 있고 AI가 보다 깊이 사고하도록 추론을 하게 명령할 수도 있다. 앤트로픽은 '클로드 3.7 소네트'의 추론 기능을 유료 사용자에게만 제공한다고 밝혔다. 무료 사용자에게는 일반적인 답변 기능만 제공되나 전체적인 성능은 기존 모델인 '클로드 3.5 소네트'보다 개선됐다. 가격은 100만 개 입력 토큰당 3달러(한화 약 4천200원), 100만 개 출력 토큰당 15달러(한화 약 2만1천원)다. 오픈AI의 'o3-미니'나 딥시크의 'R1'보다 높은 수준이지만 '하이브리드 모델'이 업계에서 처음으로 도입된 점을 감안하면 향후 가격이 인하될 것으로 예측된다. '클로드 3.7 소네트'는 실전 활용성에도 초점을 맞췄다. 어려운 코딩 문제 해결과 에이전트 기반 작업에서 강력한 성능을 발휘하며 개발자가 추론 시간을 조절할 수 있는 기능도 포함됐다. 이 모델은 '소프트웨어 엔지니어링(Bench SWE)' 벤치마크 테스트에서 62.3% 정확도를 기록해 오픈AI의 'o3-미니'보다 높은 성능을 보였다. 또 AI의 애플리케이션 프로그램 인터페이스(API) 상호작용 능력을 측정하는 'TAU-벤치'에서도 오픈AI의 'o1'을 앞서는 성적을 거뒀다. AI 업계의 반응은 뜨겁다. 소셜미디어에서는 지금까지 출시된 AI 중 최고라는 업계 관계자들의 평가가 잇따르고 있다. 특히 개발자들은 클로드 3.7 소네트가 복잡한 코드베이스를 다루는 능력이 뛰어나다며 극찬하고 있다. 유명 AI 팟캐스터 렉스 프리드먼은 자신의 X 계정에서 "'클로드 3.7 소네트'는 프로그래밍에 가장 적합한 모델"이라며 "AI 경쟁이 정말 치열해지고 있어 살아 있는 것이 신나는 시대"라고 언급했다. '클로드 3.7 소네트'의 등장은 AI 산업의 새로운 흐름을 시사한다. 오픈AI 역시 최근 'GPT-5'를 마지막으로 추론모델인 'o' 시리즈를 폐기하고 기존 GPT 모델에 통합하는 방향을 예고했다. AI 업계가 '하이브리드 모델' 중심으로 재편될 가능성이 높아지고 있는 것이다. 테크크런치는 "앤트로픽의 모델 출시는 AI 연구소들이 신모델을 빠르게 내놓는 치열한 경쟁 속에서 이뤄진 결정"이라며 "오픈AI 등의 경쟁자들도 자체 하이브리드 모델을 내놓으려고 하는 상황에서 회사가 AI 경쟁에서 얼마나 오래 선두를 유지할 수 있을지는 지켜봐야 할 것"이라고 분석했다.

2025.02.25 09:42조이환

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

李 "투자 늘려라" 당부에 재계 833조원 투자 보따리 푼다

SK그룹, 3년간 국내 128조 투자…연 2만명 고용 확대

지스타2025 폐막, 사흘간 20만 관람객…엔씨소프트 존재감 빛나

현대차그룹, 5년간 국내 125조원 투자…韓 제조업 '초격차'

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.