검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'토큰 비용'통합검색 결과 입니다. (3건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

깃허브, '코파일럿 하네스' 성능 공개…"토큰 줄이고 모델 선택권 넓혀"

깃허브가 코파일럿의 에이전틱 하네스를 앞세워 인공지능(AI) 토큰 효율과 모델 선택권을 강화했다. 깃허브는 '깃허브 코파일럿 에이전틱 하네스'가 주요 소프트웨어(SW) 엔지니어링 벤치마크에서 오픈AI, 앤트로픽 같은 모델 개발사가 제공하는 전용 실행 도구와 비슷한 수준으로 작업을 해결했다고 28일 공식 홈페이지를 통해 밝혔다. 특히 동일한 모델·작업을 기준으로 비교했을 때 대부분의 구성에서 더 적은 토큰을 사용해 비용 효율성을 높인 것으로 전해졌다. 하네스는 AI 모델이 실제 개발 업무를 처리하도록 파일 탐색, 도구 실행, 작업 순서 관리를 돕는 기능을 갖췄다. 깃허브 코파일럿 에이전틱 하네스는 코파일럿 CLI를 비롯한 코파일럿 앱, 코파일럿 코드 리뷰 등 여러 기능에 공통 적용돼 코파일럿 전반 개발 작업을 지원한다. 깃허브는 하네스 성능을 검증하기 위해 공개 벤치마크와 내부 벤치마크를 동시에 활용했다. 공개 벤치마크에는 SWE-벤치 버리파이드, SWE-벤치 프로, 스킬스벤치, 터미널벤치가 포함됐다. 내부 벤치마크로는 윈도 컨테이너 환경에서 작업을 검증하는 윈-힐이 쓰였다. 비교 대상 모델은 앤트로픽 '클로드 소넷 4.6' '클로드 오퍼스 4.7', 오픈AI 'GPT-5.4' 'GPT-5.5'다. 깃허브는 코파일럿 CLI를 클로드 계열 모델의 경우 클로드 코드와 비교했으며, GPT 계열 모델은 코덱스 CLI와 비교했다. 분석 결과 토큰 효율성 측면에서는 코파일럿 하네스가 여러 벤치마크에서 모델 공급사 하네스와 비슷한 작업 완료율을 유지하면서도 대부분 구성에서 더 낮은 토큰 사용량을 보인 것으로 나타났다. 클로드 소넷 4.6과 클로드 오퍼스 4.7에서는 모든 비교 항목에서 코파일럿 CLI가 더 나은 성능을 보였고 더 적은 토큰을 사용한 것으로 집계됐다. GPT-5.4와 GPT-5.5에서는 SWE-벤치 버리파이드를 제외한 모든 항목에서 코파일럿 CLI가 더 나은 성능을 보인 것으로 확인됐다. SWE-벤치 버리파이드에서는 코파일럿 CLI가 각각 7%, 4% 낮은 성능을 보인 것으로 전해졌다. 작업 해결률에서는 코파일럿 에이전틱 하네스가 고정된 모델과 벤치마크 작업 기준으로 모델 공급사 하네스와 대체로 비슷한 수준을 기록했다. 깃허브는 일부 차이가 있었지만 모델 확률적 특성에 따른 실행 간 분산 범위 안에 있어 사실상 동등한 수준이라고 평가했다. 깃허브는 터미널벤치 2.0 분석에서 작업당 비용과 해결률을 비교했다. 이를 통해 각 에이전트·모델 조합을 최소 다섯 차례 실행해 결과 변동성을 확인했다. 코파일럿 하네스가 평가 구성 전반에서 작업 완료율과 작업당 비용 측면에서 다른 에이전트와 비슷하거나 앞선 것으로 나타났다. 깃허브는 다중 모델 지원을 코파일럿 하네스 핵심 차별점으로 제시했다. 코파일럿 에이전틱 하네스는 GPT와 클로드, 제미나이, 마이크로소프트AI(MAI) 계열의 20개 이상 프런티어 모델을 지원한다. 오픈소스와 로컬 모델을 위한 자체 키 사용도 제공한다. 사용자는 작업 성격과 비용 구조에 맞춰 모델을 직접 선택할 수 있다. 자동 모델 선택 기능을 활용하면 작업 의도와 모델 상태를 고려해 토큰 효율을 최적화할 수도 있다. 깃허브는 다중 모델 아키텍처가 모델 공급사 단일 하네스에서 제공하기 어려운 기능도 지원한다고 강조했다. 예를 들어 러버 덕은 서로 다른 모델 계열 간 비평을 활용해 한 모델이 다른 모델의 작업을 검토하도록 한다. 깃허브는 "깃허브 코파일럿 경쟁력이 모델 자체를 넘어 하네스와 운영 구조로 확장되고 있다"며 "낮은 토큰 비용과 다중 모델 선택권을 통해 개발자에게 유사한 작업 완료 성능을 제공할 수 있을 것"이라고 강조했다.

2026.06.29 09:34김미정 기자

AI 싸져도 기업 부담은 그대로…가트너 "토큰 샤용량 증가 때문"

인공지능(AI) 모델 추론 비용이 낮아져도 기업 부담까지 쉽게 줄어들지 않을 것이라는 전망이 나왔다. 30일 가트너가 공개한 분석 결과에 따르면 2030년까지 1조 파라미터 규모 AI 모델 추론 비용은 2025년 대비 90% 이상 감소할 것으로 나타났다. 동일 규모 모델 기준 비용 효율성은 2022년 대비 최대 100배 개선될 것이으로 분석횄다. 이런 변화는 반도체 성능 개선과 모델 설계 발전, 추론 특화 칩 확대, 엣지 디바이스 활용 증가 등에 따른 결과라는 평가가 이어지고 있다. 가트너는 최첨단 반도체를 사용하는 프런티어 시나리오와 기존 반도체를 혼합 사용하는 시나리오를 비교했다. 그 결과 혼합 방식은 비용 부담이 더 큰 것으로 나타났다. 가트너는 토큰 단가 하락이 곧바로 기업 비용 절감으로 이어지지는 않을 것으로 봤다. AI 에이전트 확산으로 작업당 토큰 사용량이 기존 대비 5배에서 최대 30배까지 늘어나 전체 추론 비용은 오히려 증가할 가능성이 크다는 분석이다. 특히 고급 추론 기능은 더 많은 연산 자원을 요구하는 구조로 알려졌다. 이에 기본 AI 기능은 저렴해지지만 고성능 추론을 위한 인프라와 시스템은 여전히 제한된 자원으로 남을 것이란 설명이다. 가트너는 기업 AI 경쟁력이 단일 모델이 아닌 멀티 모델 오케스트레이션 전략에 달릴 것으로 봤다. 반복 업무는 소형 모델이나 도메인 특화 모델로 처리하고, 복잡한 작업에만 고비용 프런티어 모델을 선택적으로 활용해야 한다는 의미다. 윌 소머 가트너 시니어 디렉터 애널리스트는 "기업은 범용 토큰 가격 하락을 고급 추론 역량 대중화로 오해해서는 안 된다"며 "현재 저렴한 토큰 비용으로 아키텍처 비효율을 가리는 기업은 향후 에이전트 기반 AI 확장 단계에서 한계에 직면하게 될 것"이라고 밝혔다.

2026.03.30 17:18김미정 기자

알리바바 "5년 내 AI 관련 매출 150조원으로 확대할 것"

알리바바 그룹이 향후 5년 내 인공지능(AI) 관련 연간 매출을 1000억 달러(약 148조 9000억원)로 5배 확대하겠다는 목표를 세웠다. 19일(현지시간) 블룸버그 등 외신에 따르면 에디 우 알리바바 그룹 최고경영자(CEO)는 이번 분기 실적 발표에서 “자사 AI 전략의 사업 목표는 매우 명확하다”며 “향후 5년 내 클라우드와 AI 외부 매출을 합쳐 1000억 달러를 넘기는 것이 목표”라고 밝혔다. 이같은 목표 제시를 통해 알리바바는 비용이 많이 드는 AI 사업에서 수익을 창출해야 할 필요성이 커졌음을 드러냈다. 알리바바는 이번 분기 순이익이 67% 감소하고, 매출 성장도 미미한 수준에 그쳤다. 다만, 우 CEO는 해당 목표 달성 방안에 대해 구체적인 계획을 언급하지는 않았는데 이는 연평균 최소 35% 성장해야 가능한 수준으로, 지난해 12월 분기 클라우드 부문 성장률과 비슷하다. 알리바바는 지난해 12월까지 3개월 간 매출이 전년 대비 2% 증가한 2848억 위안(약 61조 6193억원)을 기록했지만 시장 예상치에는 못 미쳤다. 순이익은 2024년 초 이후 가장 큰 폭으로 줄었으며, 이는 경쟁 심화 속에서 진행된 대규모 기획전 비용 증가의 영향이 컸다. 실적 부진은 알리바바가 방대한 AI 사업에서 수익을 창출하기 위해 대대적인 조직 개편을 추진하는 이유를 보여준다. 알리바바는 이번 주 기업 고객용 에이전트형 AI 서비스 '우쿵'을 출시했으며 클라우드 및 스토리지 서비스 가격도 최대 34% 인상했다. 알리바바는 세계 최대 클라우드 서비스 기업 중 하나로 범용 인공지능(AGI) 경쟁에서 중국 내 선두주자로 평가받는다. 투자 규모 면에서 가장 공격적인 기업으로 수년간 530억 달러(약 79조원) 이상의 AI 투자를 약속했다. 이는 중국 경쟁사보다 많지만, 내년까지 6500억 달러(약 968조원)를 투자할 예정인 미국 빅테크와 비교하면 여전히 작은 규모다. 알리바바 클라우드 사업은 그룹 내 가장 빠르게 성장하는 수익원으로 자리 잡았으며 AI 관련 제품 매출은 10개 분기 연속 세 자릿수 성장률을 기록했다. 현재 중국에서 오픈클로와 같은 에이전트형 AI에 대한 관심이 높아지면서 위챗 생태계를 보유한 텐센트가 유리한 위치를 확보했다. 텐센트는 방대한 사용자 데이터를 확보하고 있으며 위챗을 통해 다양한 앱 접근을 통제하고 있어 AI 확장에 유리하다는 평가를 받는다. 아울러, 딥시크, 문샷 AI, 미니맥스, 즈푸 등의 스타트업도 경쟁에 뛰어들고 있다. 이들은 주로 오픈소스 모델을 제공해 사용 비용이 낮아 업계 전반의 수익성을 압박하고 있다. 이와 관련해 블룸버그 인텔리전스는 알리바바의 에이전트형 AI 확대와 '토큰 허브' 구축이 단기적으로 AI 수익성 개선으로 이어지기는 어렵다고 분석하고 있다. 높은 연산 비용과 낮은 가격 구조로 인해 응용 프로그램 인터페이스(API)는 손실을 감수하는 구조이며, 클라우드 수요 증가만으로는 이커머스와 음식 배달 사업의 수익 압박을 상쇄하기 어렵다는 이유에서다. 알리바바의 AI 사업은 큐웬 모델 개발을 이끌던 핵심 인물 린쥔양의 퇴사에도 영향을 받았다. 이후 알리바바는 다시 기업용 AI 사업에 집중하며 조직 개편을 단행한 바 있다. '알리바바 토큰 허브'라는 새로운 사업부를 통해 대부분의 AI 관련 조직을 CEO 직속으로 통합했다. 게리 유 모건스탠리 애널리스트는 “강력한 토큰 사용량은 AI 수요의 폭발적 증가를 보여준다”며 “가장 큰 의미는 AI 수익화가 더욱 강화된다는 점”이라고 말했다.

2026.03.20 09:20박서린 기자