• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'추론 모델'통합검색 결과 입니다. (8건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

오픈AI, 한 달 만에 GPT-5.2 공개…구글 제미나이에 반격 나섰다

구글 제미나이의 거센 추격 속에서 오픈AI가 한 달 만에 프런티어 모델 'GPT-5.2'를 내놓으며 정면 돌파에 나섰다. 챗GPT 트래픽 감소와 내부 '코드 레드' 비상 체제까지 겹친 상황에서 강화된 성능의 신모델이 경쟁 구도를 다시 뒤흔들 것이라는 평가가 나온다. 오픈AI는 11일(현지시간) GPT-5.2 시리즈를 출시한다고 발표했다. 새 모델은 즉답·사고·프로 등 세 가지 모드로 구성되며 전문 지식 업무와 장시간 에이전트 실행에 최적화된 것이 특징이다. GPT-5.2는 챗GPT 유료 구독자에게 순차 제공되며 개발자들은 API를 통해 즉시 이용할 수 있다. GPT-5.1은 앞으로 3개월 뒤 지원이 종료된다. 이번 공개는 단순한 기능 업그레이드를 넘어 최근 제미나이 3의 급성장으로 흔들린 인공지능(AI) 시장 판도에 오픈AI가 다시 우위를 확보하려는 전략으로 풀이된다. 시장조사업체 시밀러웹에 따르면 챗GPT 트래픽 점유율은 1년 전 87%에서 최근 71.3%까지 떨어진 반면, 구글 제미나이는 같은 기간 5.7%에서 15.1%로 뛰어올랐다. 내부적으로도 샘 알트먼 오픈AI 최고경영자(CEO)는 직원들에게 코드 레드를 선언하며 챗GPT 모델 품질 개선을 최우선 과제로 지시한 바 있다. 이번에 공개된 GPT-5.2는 추론·코딩·수학·장문 분석·비전·도구 활용 등 전 영역에서 성능이 향상됐다. 오픈AI 자체 평가에서 사고 모드는 70.9%, 프로 모드는 74.1%를 기록해 인간 전문가와 대등하거나 능가하는 수준으로 평가됐다. 이전 버전 GPT-5의 38.8%와 비교하면 압도적인 성장이다. SWE 벤치마크에서도 80%를 기록하며 구글 제미나이 3 프로(76.2%)를 넘어섰고 앤트로픽 클로드 오퍼스4.5(80.9%)와도 1% 미만 차이에 불과한 것으로 나타났다. 또 사고 모드의 환각 오류율은 6.2%로 전작 대비 약 30% 감소했으며 긴 문서 맥락 이해와 이미지·그래프 분석 능력, 다단계 업무 처리 능력도 상향됐다. 복잡한 논리·수학 문제 해결 과정에 있어서도 이전보다 38% 적은 오류를 냈고 추론·코딩·과학 벤치마크에서도 최고치를 기록했다. 개발자들을 위한 API 측면에서는 추론 강도를 선택할 수 있는 다섯 단계의 옵션을 제공해 복잡한 프로젝트 수행 능력을 강화했다. 오픈AI 피지 시모 최고제품책임자(CPO)는 "GPT-5.2는 스프레드시트 제작, 프레젠테이션 구성, 코드 작성, 이미지 이해, 장문 맥락 추론, 도구 활용 등 실제 업무에서 큰 경제적 가치를 제공하도록 설계됐다"고 설명했다. 이번 공개는 오픈AI가 빠른 속도로 AI 모델을 출시하는 전환점으로 평가된다. GPT-5.1 발표 후 불과 한 달 만의 출시로, 이는 챗GPT 서비스를 시작한 2022년 이후 가장 짧은 주기다. 월스트리트저널과 여러 외신은 오픈AI가 내부 비상 상황 속에서 제미나이 3 프로의 벤치마크 공세를 의식해 GPT-5.2 출시 일정을 당긴 것으로 분석했다. 이번 GPT-5.2 공개로 오픈AI·구글·앤트로픽 간 경쟁이 한층 격렬해질 전망이다. 한편 오픈AI 내부에서는 고도화된 추론 모델 중심 전략이 높은 연산 비용 부담으로 이어질 수 있다는 우려도 제기되고 있다. 업계에서는 오픈AI의 추론 비용 상당 부분이 클라우드 이용료가 아닌 현금으로 지불되고 있다는 관측도 나온다. 오픈AI는 "더 효율적인 모델 구조와 강화된 성능을 통해 동일 비용 대비 더 높은 지능을 제공하는 방향으로 나아가고 있다"며 "앞으로도 안전성과 신뢰성을 강화하고 사용자가 기대하는 품질을 꾸준히 발전시켜 나가겠다"고 밝혔다.

2025.12.12 10:08한정호 기자

"팔리든, 합치든, 함께하든"... AI 반도체, 세 갈래 생존전 시작됐다

AI 반도체 시장이 대전환기에 들어섰다. AI 모델의 단계가 '훈련(Training)'에서 '추론(Inference)'으로 이동하며, 글로벌 빅테크들은 GPU(그래픽처리장치) 이후 시대를 준비하고 있는 것이다. 이에 국내외 AI반도체 스타트업은 인수, 컨소시엄, 고객동맹형으로 생존을 모색하고 있다. 7일 반도체 업계에 따르면 최근 AI 반도체 산업의 무게중심이 훈련용 칩에서 추론용 칩으로 이동하고 있다. 챗GPT를 비롯한 생성형 AI의 확산으로, 서비스 제공 기업들이 대규모 학습보다 실시간 응답 효율성을 높이는 데 집중하면서다. 추론형 칩이 주목받는 이유로 전력 효율과 운영비 절감 효과가 꼽힌다. 대모델 학습이 일회성 작업이라면, 추론은 상시 반복되는 과정이어서 누적 전력 소모가 훨씬 크기 때문이다. 특히 글로벌 데이터센터들이 에너지 절감과 처리 속도 향상을 동시에 요구하면서, GPU 기반 범용 구조 대신 특정 워크로드에 최적화된 전용 ASIC(맞춤형 반도체) 수요가 급증하고 있다. 이 같은 시장 변화는 AI 반도체 스타트업들의 생존 전략에도 직접적인 영향을 미치고 있다. 시장 전체가 여전히 GPU 중심 구조에 의존하고 있는 상황에서 스타트업들은 독자 노선만으로는 수익성을 확보하기 어렵다고 판단하고 있는 것이다. 이에 따라 일부는 대기업 인수에 나서고, 일부는 컨소시엄이나 고객사 공동 설계 방식으로 기술을 시장 안으로 편입시키는 전략을 택하고 있다. 결국 추론 효율 경쟁이 AI칩 산업 전반의 재편으로 이어지고 있는 셈이다. 거대 기업 품으로… '인수 전쟁' 치열 AI 반도체 스타트업들이 가장 많이 택하는 생존 방식은 대기업 인수다. 유망한 스타트업이 빅테크의 생태계에 편입돼 기술·인력·시간을 동시에 거래하는 형태다. 대표적인 예시가 인텔의 삼바노바 인수 추진이다. 삼바노바는 누적 투자액이 10억 달러를 넘겼지만, 후속 자금 유치가 막히며 매각을 검토하고 있다. AI칩 개발은 테이프아웃 이후 양산까지 3년 이상 걸리고 수천억 원이 투입되는 구조라 독자 생존이 어려운 기업들이 매각 협상에 나서는 사례가 늘고 있다. 빅테크에서도 자체 칩 개발을 위해 인수를 시도 중이다. 엔비디아 의존도를 낮추고, 자체 칩 생태계를 구축하기 위함이다. 올해 상반기 있었던 메타의 퓨리오사AI 인수 시도 역시 같은 맥락이다. 메타는 퓨리오사AI 인수에는 실패했으나, 현재 미국 리보스 인수를 추진하고 있다. 소프트뱅크의 경우 앰페어를 65억달러(약 9조4천600억원)에 인수했으며, AMD는 AI 소프트웨어 최적화 스타트업 브리움을 흡수했다. AI 반도체 업계 관계자는 “AI 반도체 스타트업의 인수는 어느 회사나 투자자들이 기대하는 어떤 성과를 내야하는 냉엄한 현실을 보여주는 예시”라면서도 “한편으로는 AI 반도체가 이전에 없던 분야이기 때문에, 어려운 도전에 대해서 똘똘 뭉쳐 있는 스타트업 팀이 성과를 더 내기 좋은 구조다. 대기업도 그래서 스타트업 인수로 눈을 돌리는 것 같다”고 설명했다. 협력으로 버틴다… 대기업 연합형 생존 모델 확산 두 번째 생존 방식은 대기업 컨소시엄이다. 대기업에 종속되는 인수형과 달리 AI 반도체 스타트업이 대기업과 손잡고 운영을 공유하는 구조다. 해당 방식의 대표적인 예시는 국내 AI 반도체 스타트업 리벨리온이다. 리벨리온은 SK텔레콤, SK하이닉스 등 SK그릅과 함께 국산 AI반도체 개발을 위한 전략적 컨소시엄을 꾸려 상용화에 나섰다. 리벨리온은 이 외에도 KT, 네이버 등 국내 대기업과 협력해 시장을 공략하고 있다. 지난해 투자를 받기 시작한 아람코도 대기업 협력 모델 중 하나로 볼 수 있다. 또한 반도체의 전설 짐 켈러가 있는 텐스토렌트와 LG AI연구원, 삼성전자 간 협력처럼 RISC-V(리스크파이브) 기반 IP와 대형 언어모델(LLM) 최적화를 함께 개발하는 형태도 나타나고 있다. 업계에서는 이러한 대기업 연합형 모델이 스타트업의 자금난을 완화하고 공급망 리스크를 줄이는 현실적 대안으로 보고 있다. 다만 협력 구조가 복잡해지는 만큼 스타트업의 장점인 빠른 의사결정이 다소 늦어진다는 점이 한계로 지목된다. 고객과 함께 만든다… 맞춤형 공동 설계 확산 세 번째 방식은 고객동맹 모델이다. 칩 기업이 클라우드·AI 서비스 사업자 등 실제 수요자와 공동으로 반도체를 설계·최적화하는 형태다. 미국 세레브라스시스템즈는 UAE 국부펀드 계열 G42와 협력해 AI 데이터센터 '콘도르 갤럭시'를 구축했다. 양사는 초대형 인공지능 모델 '자이스(Jais)'의 추론 효율을 높이기 위해하드웨어와 소프트웨어를 함께 최적화하는 공동 개발을 진행하고 있다. 초대형 모델 자이스의 추론 효율을 높이기 위한 하드웨어–소프트웨어 공동 최적화를 진행 중이다. 그록은 생성형 AI 서비스 기업인 퍼플렉시티AI, 캐릭터 AI등과 협력해 응용프로그램인터페이스(API) 기반의 추론 성능을 개선하는 서비스형 추론 모델을 운영하고 있다. 그래프코어는 스태빌리티AI, 마이크로소프트, 델과 협력해 이미지 생성 모델에 최적화된 지능처리장치(IPU) 공동 설계를 추진하고 있다. 한 AI반도체 업계 관계자는 “현재 AI반도체 기업들의 생존 방식은 전략이기도 하지만 산업 구조가 강제한 결과”라며 “칩 개발에만 수천억원의 자금이 필요하고, GPU 중심의 생태계가 이어지고 있기 때문에 독자적으로 살아남기 힘든 산업 구조다”라고 말했다.

2025.11.09 14:14전화평 기자

UAE, 오픈AI·딥시크에 도전장…저비용 추론 모델 'K2 씽크' 공개

아랍에미리트(UAE)가 글로벌 인공지능(AI) 경쟁 구도 속에서 새로운 도전장을 내밀었다. 10일 CNBC에 따르면 UAE 아부다비에 위치한 무함마드 빈 자이드 인공지능대학(MBZUAI)은 오픈AI와 중국 딥시크에 맞설 수 있는 저비용 AI 추론 모델 'K2 씽크'를 공개했다. K2 씽크는 320억 개 파라미터로, 오픈AI와 딥시크의 플래그십 모델보다 훨씬 작은 규모다. 딥시크가 올해 초 공개한 'R1'은 6천710억 개 파라미터를 탑재한 것과 비교하면 큰 차이다. 이번 모델은 알리바바의 오픈소스 '큐원 2.5' 기반으로 구축됐으며 AI 반도체 기업 세레바스의 하드웨어(HW)에서 실행·검증됐다. 개발에는 마이크로소프트(MS)가 투자한 UAE AI 기업 G42가 참여했다. MBZUAI 측은 수학·코딩·과학 등 여러 벤치마크 테스트에서 오픈AI와 딥시크 모델에 필적하는 성능을 보였다고 설명했다. 핵심 기술로는 단계별 추론 방식의 감독학습 미세조정, 추론 시 연산 자원을 추가 투입하는 테스트 타임 스케일링 기법 등이 활용됐다. MBZUAI 헥터 류 기초모델연구소장은 "모델을 단순히 배포하는 데 그치지 않고 시스템처럼 운영·개선한 점이 차별점"이라고 강조했다. UAE는 이번 행보를 통해 AI 강국으로서 입지를 다지고 원유 의존도를 낮추려는 전략을 가속화하고 있다. 다만 미국과 중국이 각각 개방형·전략형으로 이미 AI 패권 경쟁을 주도하고 있어 얼마나 경쟁력을 이어갈지 주목된다. MBZUAI는 이번 모델이 챗봇과 같은 범용 서비스보다는 수학·과학 연구 지원 등 특정 목적에 최적화됐다고 밝혔다. MBZUAI 리처드 모튼 전무는 "이번 기술은 수천 명의 연구자가 수년간 진행할 작업을 단기간에 압축할 수 있는 가능성을 보여준다"며 "무엇보다 우리는 적은 자원으로도 훨씬 많은 일을 할 수 있다는 점을 확인하고 있다"고 말했다.

2025.09.10 10:59한정호 기자

오픈AI, AWS 클라우드에 상륙…MS 독점 균열 가시화

오픈AI가 처음으로 글로벌 클라우드 1위 사업자인 아마존웹서비스(AWS)를 통해 인공지능(AI) 모델을 제공한다. 6일 테크크런치에 따르면 오픈AI는 자체 오픈 가중치 추론 모델 2종을 발표하며 해당 모델들이 AWS의 AI 서비스 플랫폼인 '아마존 베드록'과 '세이지메이커'에 탑재된다고 밝혔다. AWS는 오픈AI 모델을 자사 클라우드 서비스에 처음으로 도입하게 됐다. 오픈AI는 이번 모델을 아파치 2.0 오픈소스 라이선스로 공개했으며 누구나 허깅페이스를 통해 내려받을 수 있지만, AWS는 오픈AI의 승인과 협력하에 해당 모델을 직접 호스팅하는 방식으로 서비스를 시작했다. 이는 AWS가 올 초 중국의 '딥시크-R1'을 자사 플랫폼에 탑재한 것과 유사한 접근 방식이다. 이번 협력은 양사 모두에게 전략적인 의미가 있다. AWS는 오픈AI 모델을 통해 마이크로소프트(MS)와의 경쟁 구도에서 균열을 꾀할 수 있게 됐다. 오픈AI는 MS 외 클라우드 파트너를 확대함으로써 독점적 구조에서 벗어나 유연성을 확보하게 됐다. 그동안 오픈AI는 MS의 애저를 통해 AI 서비스를 주로 제공해 왔다. MS는 오픈AI 최대 투자자이자 클라우드 파트너로, 자사 애저 플랫폼을 기반으로 챗GPT와 GPT API를 운영하고 있다. 하지만 최근 오픈AI와 MS가 장기 파트너십 재협상을 진행 중인 것으로 알려지면서 관계 변화 조짐이 감지됐다. 이런 상황 속 AWS와의 협력은 오픈AI가 협상력을 강화하기 위한 포석으로도 해석된다. AWS 입장에서도 이번 파트너십은 시기적으로 중요하다. 최근 발표된 실적 발표에서 AWS는 MS와 구글에 비해 AI 분야에서의 경쟁력이 약하다는 투자자들의 지적을 받았다. 특히 JP모건과 모건스탠리 등 주요 투자기관 애널리스트들은 AWS의 생성형 AI 경쟁력 저하에 대한 우려를 직접적으로 제기하며 점유율 하락 가능성을 지적했다. AWS는 이번 오픈AI 모델 도입을 통해 클라우드·AI 주도권을 다시금 공고히 한다는 목표다. 아마존 베드록과 세이지메이커 플랫폼에서 오픈AI 모델을 직접 사용할 수 있게 되면서 AWS 사용자들은 보다 손쉽게 고성능 추론 모델을 활용한 서비스를 개발할 수 있게 된다. 업계 관계자는 "오픈AI가 AWS에 모델을 공식 제공한 것은 단순한 파트너십 이상의 상징성을 가진다"며 "MS 중심이었던 오픈AI의 생태계가 점차 다변화되고 있다는 신호이자 AWS 역시 생성형 AI 경쟁에서 반격의 계기를 마련한 것으로 볼 수 있다"고 말했다.

2025.08.06 11:19한정호 기자

[써보고서] 업스테이지 '솔라 프로 2' 써보니…韓 AI 모델, 어디까지 왔나

업스테이지가 자체 개발한 '솔라 프로 2'로 추론 인공지능(AI)의 실무 활용성을 입증하며 국내 기업 시장 공략의 포문을 열었다. 13일 업계에 따르면 업스테이지는 최근 일반 사용자도 '솔라 프로 2'를 직접 체험할 수 있도록 회사의 콘솔 플랫폼을 개방했다. 이에 기자는 해당 플랫폼에 직접 접속해 한정된 데모가 아닌 실제 서비스와 동일한 환경에서 모델의 성능을 점검했다. '솔라 프로 2'는 업스테이지가 최근 선보인 차세대 거대언어모델(LLM)이다. 사용자는 이 모델을 통해 단순 질의응답은 물론 복잡한 자료의 요약 및 번역, 데이터 변환 같은 고차원적인 과제를 수행할 수 있다. 사용자 인터페이스(UI)는 현재 시장의 주류 AI 챗봇들과 유사한 대화형 방식을 따른다. 사용자에게 익숙한 채팅 창에 바로 질문을 입력해 사용하는 구조로, 별도의 사용법을 익힐 필요는 없다. 기자에게 거대언어모델(LLM)의 추론 능력이 가장 필요한 순간은 해외 자료에 나온 수치를 원화로 환산할 때다. 이에 가트너 보고서에 언급된 생성 AI 관련 투자액을 달러에서 원화로 변환해달라고 요청했다. '솔라 프로 2'는 1달러가 1천400원이라는 기준을 세우고 지난해와 올해 글로벌 생성 AI 모델 지출액을 오차 없이 환산해냈다. 결과값은 단순히 숫자를 나열하는 데 그치지 않고 '억' 단위를 사용해 한국 사용자가 이해하기 쉬운 형태로 깔끔하게 정리해 보여줬다. 복잡한 수학 문제는 아니지만 업무 중 빈번하게 발생하는 데이터 처리 과정에서 신뢰할 수 있는 성능을 보여준다는 점은 분명한 장점이다. 기계번역에 있어서도 상당한 성능을 드러냈다. 기자는 한국의 소버린 AI 전략에 대해 최근 작성한 2천 단어 분량의 영문 기사를 한국어로 번역하도록 지시했다. 수 초가 지나지 않아 결과물이 쏟아져 나왔다. 보다 경량모델이기 때문이겠지만 체감상 구글 '제미나이 2.5 프로'나 오픈AI '챗GPT-4o'보다 신속한 속도였다. 번역의 질도 만족스러웠다. 내용 확인 결과 모든 문장이 원문의 의미를 정확하게 담고 있었다. 문체가 아주 유려하지는 않았다. 일부 표현은 '약간 투박한 대학생의 과제물' 같은 느낌을 주기도 했다. 사람 이름과 같은 고유명사에서는 일부 오류가 있기도 했다. 다만 속도와 정확성의 수준을 고려하면 해외 자료를 신속히 검토하고 핵심을 파악해야 하는 실무 환경에서는 충분한 수준이다. 결과물을 빠른 시간에 내놓는다는 점에서 실용성은 글로벌 경쟁 모델과 비교해도 뒤지지 않았다. 더불어 고유명사에서의 오류는 파운데이션 모델 자체가 고질적으로 겪는 구조적 문제다. 이번 테스트는 '솔라 프로 2'에만 진행되지 않았다. 업스테이지의 또 다른 핵심 기술인 광학문자인식(OCR) 성능도 함께 확인했다. 이는 업스테이지가 창업 초기부터 두각을 나타낸 분야로, 김성훈 대표는 여러 차례 OCR과 LLM을 통합해 '일의 미래'를 실현하겠다는 비전을 밝힌 바 있다. 플랫폼의 '도큐먼트 OCR' 기능을 이용해 2차 세계대전 당시 헨리 스팀슨 미 육군장관이 트루먼 대통령에게 보낸 편지를 인식시켜 봤다. 결과는 상당히 괜찮았다. 80%의 신뢰도(Confidence)로 인식이 진행됐으며 흘려 써서 사람도 알아보기 힘든 몇몇 단어를 제외하고는 대부분의 내용을 정확하게 디지털 텍스트로 변환했다. 이는 업스테이지가 단순히 LLM 개발에만 매달리는 것이 아니라 문서 처리라는 핵심 기술력 위에 AI 모델을 쌓아 올리고 있음을 보여주는 대목이다. '솔라 프로 2'를 체험한 소감은 '실용적이고 빠르다'로 요약할 수 있다. 사실 오픈AI, 구글, 앤트로픽 등 글로벌 빅테크부터 알리바바, 딥시크 같은 중화권 모델에 이르기까지 파운데이션 모델의 발전 방향은 대체로 대동소이해지며 상향 평준화되는 추세다. 이같은 상황에서 완전히 새로운 기능은 없으나 번역·요약·계산 등 사용자가 가장 필요로 하는 핵심 기능에서 국내 스타트업이 꾸준히 경쟁력을 유지하고 있다는 점은 그 자체로 고무적이다. 글로벌 최상위 모델과 성능 수치를 일대일로 비교하기엔 무리가 있을 수 있다. 다만 '솔라 프로 2'가 보여준 성능은 기업 실무자가 현장에서 필요로 하는 수준을 이미 충분히 만족시키는 수준이다. 이는 곧 시장에서의 현명한 포지셔닝으로 이어질 수 있는 대목이다. 글로벌 B2C 구독 시장은 미국 빅테크가, 중국 내수 시장은 중국 기업들이 장악한 구도 속에서 국내 기업이 정면으로 경쟁하기는 쉽지 않다. 대신 데이터 보안에 민감하거나 국내 환경에 최적화된 기술 지원을 필요로 하는 기업들에게 '솔라 프로 2'는 매력적인 B2B 대안이 될 수 있다. 김성훈 대표는 "'솔라 프로2'는 문제를 이해하고 논리적으로 사고하며 AI 비서처럼 명령까지 수행한다"며 "향후 발전과 사용자들의 적극적인 참여를 기대한다"고 말했다.

2025.07.13 06:49조이환 기자

업스테이지, '추론형 AI' 상용화로 정면 승부…"글로벌 LLM 판 흔든다"

생성형 인공지능(AI) 산업의 추론형 모델 전환이 본격화된 가운데 업스테이지가 국내 스타트업 최초로 글로벌 경쟁 모델과 어깨를 나란히 하는 추론 모델을 완성했다. 업스테이지는 10일 차세대 거대언어모델(LLM) '솔라 프로 2(Solar Pro 2)'를 공개했다. 이 모델은 파라미터 규모를 310억으로 확대했으며 고도화된 추론 능력을 갖춘 '하이브리드 모드'를 도입한 것이 특징이다. 사용자는 빠른 질의응답을 위한 '챗 모드'와 논리적 사고 기반의 '추론 모드'를 상황에 따라 선택할 수 있다. '솔라 프로 2'는 수학 문제 풀이 성능을 측정하는 '매스500', 코딩 과제 해결력을 평가하는 '에스더블유이(SWE) 벤치', 종합 지식 기반의 추론 능력을 보는 '엠엠엘유(MMLU) 프로' 등 고난도 벤치마크에서 오픈AI 'GPT-4o', 딥시크 'R1', 미스트랄 '스몰 3.2'와 유사한 성능을 기록했다. 특히 '생각의 사슬(CoT)' 기법을 적용한 추론 모드가 뚜렷한 성능 향상을 이끌었다. 한국어 성능도 주목할 만하다. '솔라 프로 2'는 케이오-엠엠엘유(Ko-MMLU), 해례(Hae-Rae), 아레나-하드-오토(Arena-Hard-Auto) 등 벤치마크에서 글로벌 오픈모델을 넘어서는 결과를 보였고 어휘와 문맥 이해는 물론 금융·법률·의료 등 전문 분야 질의에도 실효성 있는 답변을 도출하는 수준에 도달했다. 모델 구조도 기능 중심으로 진화했다. 단순 문장 응답을 넘어 사용자의 의도를 파악하고 외부 도구를 호출해 실질적인 결과물을 도출하는 '에이전트형 LLM' 구조가 탑재됐다. 일례로 실시간 웹 검색, 정보 정리, 프레젠테이션 초안 작성까지 일련의 업무를 자율적으로 수행할 수 있다. 업계에서는 최근 국내 대기업들이 잇따라 추론 특화 모델을 공개한 데 이어 업스테이지가 스타트업 최초로 이 영역에 진입한 점에 주목하고 있다. LG AI연구원은 지난 3월 다중 입력을 처리하는 멀티모달 기반의 에이전트형 LLM '엑사원 2.0'을 선보이며 본격적인 추론 경쟁에 가세했다. 네이버도 지난달 '하이퍼클로바X 씽크'를 공개하며 언어와 시각 정보를 모두 다루는 추론 구조를 구현한 모델을 제시했다. 이어 업스테이지가 상용 모델을 내놓으면서 국내 LLM 개발 주체는 대기업에서 벤처로까지 외연을 넓히는 양상이다. 김성훈 업스테이지 대표는 "'솔라 프로 2'는 단순히 말을 잘하는 AI가 아니라 문제를 이해하고 논리적으로 사고하며 실질적인 행동까지 수행하는 AI 에이전트"라며 "자체 기술로 구현한 세계 최고 수준의 LLM을 기반으로, AI가 업무 방식을 근본적으로 혁신하고 '일의 미래'를 앞당길 수 있도록 기술을 고도화해 나가겠다"고 밝혔다.

2025.07.10 08:00조이환 기자

앤트로픽, '클로드 3.7 소네트' 공개…하이브리드 AI 시대 연다

앤트로픽이 실시간 응답과 심층적인 추론을 하나로 통합한 인공지능(AI)을 출시해 거대언어모델(LLM)의 새로운 기준을 제시했다. 보다 직관적인 방식으로 인간과 상호작용하도록 함으로써 갈수록 치열해지는 AI 경쟁에서 우위를 점하려는 전략이다. 25일 테크크런치에 따르면 앤트로픽은 거대언어모델(LLM)과 추론 모델을 결합한 '하이브리드 AI'인 '클로드 3.7 소네트'를 공식 발표했다. 이 모델을 통해 사용자는 기존의 LLM을 활용했을 때처럼 즉각적인 응답을 받을 수도 있고 AI가 보다 깊이 사고하도록 추론을 하게 명령할 수도 있다. 앤트로픽은 '클로드 3.7 소네트'의 추론 기능을 유료 사용자에게만 제공한다고 밝혔다. 무료 사용자에게는 일반적인 답변 기능만 제공되나 전체적인 성능은 기존 모델인 '클로드 3.5 소네트'보다 개선됐다. 가격은 100만 개 입력 토큰당 3달러(한화 약 4천200원), 100만 개 출력 토큰당 15달러(한화 약 2만1천원)다. 오픈AI의 'o3-미니'나 딥시크의 'R1'보다 높은 수준이지만 '하이브리드 모델'이 업계에서 처음으로 도입된 점을 감안하면 향후 가격이 인하될 것으로 예측된다. '클로드 3.7 소네트'는 실전 활용성에도 초점을 맞췄다. 어려운 코딩 문제 해결과 에이전트 기반 작업에서 강력한 성능을 발휘하며 개발자가 추론 시간을 조절할 수 있는 기능도 포함됐다. 이 모델은 '소프트웨어 엔지니어링(Bench SWE)' 벤치마크 테스트에서 62.3% 정확도를 기록해 오픈AI의 'o3-미니'보다 높은 성능을 보였다. 또 AI의 애플리케이션 프로그램 인터페이스(API) 상호작용 능력을 측정하는 'TAU-벤치'에서도 오픈AI의 'o1'을 앞서는 성적을 거뒀다. AI 업계의 반응은 뜨겁다. 소셜미디어에서는 지금까지 출시된 AI 중 최고라는 업계 관계자들의 평가가 잇따르고 있다. 특히 개발자들은 클로드 3.7 소네트가 복잡한 코드베이스를 다루는 능력이 뛰어나다며 극찬하고 있다. 유명 AI 팟캐스터 렉스 프리드먼은 자신의 X 계정에서 "'클로드 3.7 소네트'는 프로그래밍에 가장 적합한 모델"이라며 "AI 경쟁이 정말 치열해지고 있어 살아 있는 것이 신나는 시대"라고 언급했다. '클로드 3.7 소네트'의 등장은 AI 산업의 새로운 흐름을 시사한다. 오픈AI 역시 최근 'GPT-5'를 마지막으로 추론모델인 'o' 시리즈를 폐기하고 기존 GPT 모델에 통합하는 방향을 예고했다. AI 업계가 '하이브리드 모델' 중심으로 재편될 가능성이 높아지고 있는 것이다. 테크크런치는 "앤트로픽의 모델 출시는 AI 연구소들이 신모델을 빠르게 내놓는 치열한 경쟁 속에서 이뤄진 결정"이라며 "오픈AI 등의 경쟁자들도 자체 하이브리드 모델을 내놓으려고 하는 상황에서 회사가 AI 경쟁에서 얼마나 오래 선두를 유지할 수 있을지는 지켜봐야 할 것"이라고 분석했다.

2025.02.25 09:42조이환 기자

"앤트로픽, 클로드 새 모델 공개 임박?"…출시설에 AI 업계 촉각

앤트로픽이 추론과 신속 응답을 결합한 '하이브리드' 인공지능(AI) 모델을 개발하고 있는 것으로 보인다. 최근 AI 업계에서는 주요 기업들이 잇따라 신형 모델을 출시하며 기술 경쟁이 격화되고 있어 앤트로픽의 행보에도 관심이 집중되고 있다. 14일에 디인포메이션에 따르면 앤트로픽은 향후 몇 주 안에 차세대 AI 모델을 출시할 계획을 가지고 있는 것으로 알려졌다. 이번 모델이 도입할 가능성이 높은 핵심 기술 중 하나는 '슬라이딩 스케일' 기능이다. 이 기능을 활용하면 AI의 연산 모드를 조절해 성능을 최적화할 수 있다. 앤트로픽 내부 직원들은 신형 AI 모델이 일부 프로그래밍 작업에서 오픈AI의 'o3-미니-하이' 모델을 능가하는 성능을 보였다고 전했다. 이에 따라 이 모델은 대규모 코드베이스 분석 및 비즈니스 활용에서도 강점을 가질 것으로 예상된다. 앤트로픽의 이번 행보는 AI 업계의 치열한 경쟁 구도 속에서 나온 결정으로 보인다. xAI의 최고경영책임자(CEO)인 일론 머스크 역시 지난 13일 두바이에서 열린 행사에서 "우리 AI 모델 '그록 3'가 최종 개발 단계에 있다"며 "향후 1~2주 내 출시될 것"이라고 밝힌 바 있다. 다만 이번 보도는 내부 정보망을 기반으로 한 것으로, 출시 여부와 정확한 일정은 공식적으로 확인되지 않았다. 업계에서는 앤트로픽의 신형 AI 모델이 오픈AI, 구글, xAI를 비롯한 경쟁사들과의 기술 격차를 줄이는 계기가 될지 주목하고 있다. 다리오 아모데이 앤트로픽 대표는 최근 테크크런치와의 인터뷰에서 "우리는 자체적으로 더 차별화된 추론 모델을 만드는 데 집중하고 있다"며 "일반 모델과 추론 모델을 구분하는 기존 개념이 다소 이해하기 어렵다"고 밝혔다.

2025.02.14 10:04조이환 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

삼성, 엔비디아향 HBM4 양산검증 목전…1c D램 대량 할당

"20세기 법 이제는 버릴까"...통합미디어법 공론장 다시 열렸다

1년 내내 할인했지만…현금 없는 홈플러스, 왜?

코스닥, 하루 7% 상승 '광풍'…한때 사이드카 발동

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.