• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'클로드 4'통합검색 결과 입니다. (3건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

앤트로픽, '클로드4' 출시…코딩·에이전트 성능 한계 넘었다

앤트로픽이 차세대 언어모델 '클로드4'를 출시하며 생성형 인공지능(AI) 시장의 주도권 확보에 나섰다. 복잡한 코딩, 장기 추론, 도구 병행 실행 등에서 경쟁사를 앞서며 실사용 중심의 기술 경쟁에 속도를 내는 모양새다. 23일 앤트로픽 공식 블로그에 따르면 회사는 클로드 '오푸스4'와 '소넷4'를 즉각 상용화했다. 이 모델들은 현재 앤트로픽 응용 프로그램 인터페이스(API), 아마존 베드록, 구글 클라우드의 버텍스 AI 플랫폼에서 제공 중이다. 가격은 '오푸스4'가 입력 백만 토큰 기준 15달러(한화 약 2만1천원), '소네트4'는 3달러(한화 약 4천200원)로 책정됐으며 이는 이전 모델과 동일한 수준이다. '오푸스4'는 프로, 맥스, 팀, 엔터프라이즈 등 유료 요금제에서만 제공되고 '소네트4'는 무료 이용자도 사용할 수 있다. 앤트로픽에 따르면 '오푸스4'는 회사 역사상 가장 강력한 모델로, 복잡한 문제 해결과 수천 단계에 걸친 장기 작업에서 지속적인 성능을 발휘한다. 에스더블유이벤치(SWE-bench)와 터미널벤치(Terminal-bench) 등 실제 코딩 벤치마크에서도 각각 72.5%, 43.2%를 기록하며 기존 모델 대비 월등한 결과를 보였다. '소네트4'는 상대적으로 경량화된 모델이지만 실사용 환경에서 성능과 효율의 균형을 추구한 설계로 평가받는다. 에스더블유이벤치에서 72.7%를 기록했으며 지시 수행력과 코드 구현 제어 능력에서 기존 '소네트3.7' 대비 크게 개선됐다. 두 모델은 모두 새롭게 도입된 '확장된 사고(Extended Thinking)'를 통해 모델 스스로 추론과 도구 사용을 병행한다. 웹 검색 등 외부 도구 활용을 통해 긴 작업 흐름을 단계적으로 수행하며 필요한 경우 요약 모델을 활용해 내부 사고 과정을 정리할 수도 있다. 메모리 기능 역시 크게 개선됐다. '오푸스4'는 개발자가 로컬 파일 접근을 허용할 경우 '메모리 파일'을 생성해 중요 정보를 저장하고 이를 통해 장기 프로젝트에서 맥락 일관성을 확보한다. 회사 측은 '오푸스4'가 실제로 포켓몬 게임을 플레이하며 '내비게이션 가이드'를 자체 작성한 사례를 예로 들었다. 함께 발표된 '클로드 코드'는 개발 환경 전반에 '클로드'를 통합할 수 있도록 설계된 제품군이다. VS코드, 젯브레인 등 주요 통합개발환경에 통합되며 코드 수정 제안을 파일 내에 직접 표시해 페어 프로그래밍 효율을 높인다. 또 깃허브 액션을 활용한 백그라운드 작업이나 지속적 통합(CI) 오류 자동 대응 같은 기능도 포함된다. 개발자를 위한 소프트웨어 개발 키트(SDK)도 제공된다. 사용자는 SDK를 통해 자체 코딩 에이전트를 만들 수 있으며 현재는 깃허브 베타 앱 형태로 피드백 반영, 자동 수정 기능을 지원하고 있다. 기능 외에도 안전성 측면에서도 발전했다. 앤트로픽이 자체적으로 정의한 AI의 신뢰도와 안전성에 대한 내부 기준 체계인 인공지능 안전수준 3단계(ASL-3) 수준의 테스트 및 평가가 이뤄진 상태로, 모델은 기존 대비 편법적 응답 가능성이 65% 감소했으며 사고 경로 투명성도 향상됐다. 앤트로픽은 공식 블로그를 통해 "이번 모델은 완전한 맥락 유지와 장기 프로젝트 집중이 가능한 '가상 협업자'로, 혁신적 성과를 이끌 것"이라며 "'클로드'와 '클로드 코드'를 포함한 원하는 플랫폼에서 바로 활용할 수 있다"고 밝혔다.

2025.05.23 09:09조이환

'尹 탄핵심판' AI에게 물었더니…클로드 "인용 가능성 75%"

헌법재판소의 윤석열 대통령 탄핵심판 선고가 하루 앞으로 다가오면서 긴장이 고조되고 있다. 대한민국 헌정사에 중대한 분기점이 될 판결인 만큼 국내 뿐 아니라 전 세계적으로도 많은 관심이 쏠리고 있다. 3일 지디넷코리아는 클로드 소네트, 딥시크 R1, GPT-4o, 퍼플렉시티, 구글 제미나이 등 대표적인 인공지능(AI) 모델들에게 헌재의 탄핵심판 선고 결과를 어떻게 예측하는지 질문했다. 분석 결과 클로드 소네트가 탄핵 인용 가능성을 75%로 가장 높게 예측했다. 반면 퍼플렉시티는 인용 가능성 35%로 비교적 낮게 판단했다. AI 모델들은 ▲헌법 위반의 중대성 ▲재판관 구성 및 성향 ▲절차적 하자 여부 ▲여론 지형 등 여러 요인들을 기반으로 논리적 전망을 제시했다. 다만 이번 결과는 각 AI 모델이 특정 시점에 입력된 프롬프트와 데이터를 바탕으로 생성한 예측이다. 동일한 모델이라 하더라도 입력값과 조건에 따라 수치는 달라질 수 있다. 클로드 소네트 "헌법 위반 중대성 높고 국민 여론도 강력" 탄핵 인용: 75% 탄핵 기각: 24% 탄핵 각하: 1% 클로드 소네트는 인용 가능성을 가장 높게 제시했다. ▲비상계엄 선포 검토 ▲국회 장악 시도 ▲선관위 장악 기도 ▲불법 체포 지시 등 5가지 탄핵 사유 중 하나만 중대한 위헌으로 인정될 경우 파면이 가능하다는 판단이다. 특히 클로드 소네트는 '5분 국무회의'의 절차적 흠결 증언과 중도층 여론(찬성 70% 이상)이 인용 가능성을 높이는 요인으로 작용한다고 보았다. 딥시크 R1 "재판관 구성상 인용 유력, 다만 절차 변수 주의" 탄핵 인용: 65% 탄핵 기각: 25% 탄핵 각하: 10% 딥시크 R1은 헌재 재판관 8인의 성향(보수 3, 중도 2, 진보 3)에 주목했다. 보수 재판관 일부가 사회적 합의를 고려해 찬성표를 던질 가능성이 있다고 분석했다. 또 국회 탄핵소추 과정에서의 절차적 논란이 각하 논의로 번질 수 있다고 판단했다. GPT-4o "정치적 파장과 실행 여부 사이에서 중립적 시각" 탄핵 인용: 50% 탄핵 기각: 30% 탄핵 각하: 20% GPT-4o는 탄핵 인용과 기각(혹은 각하) 가능성을 같은 것으로 분석했다. 비상계엄은 검토 단계에 머물렀고, 직접적 실행은 없었다는 점에서 "위헌 요소는 있지만 직무상 중대 위반은 아님"이라는 판단 여지가 있다고 보았다. 헌재의 보수적 성향과 국정 안정 고려가 기각에 힘을 실을 수 있고, 절차상 흠결 논란으로 각하 가능성도 20%로 제시했다. 퍼플렉시티 "기각 가능성이 현실적으로 가장 높아" 탄핵 인용: 35% 탄핵 기각: 60% 탄핵 각하: 5% 반면 퍼플렉시티는 재판관 간 의견 분열이 인용 가능성을 낮춘다고 분석했다. 과거 박근혜 탄핵은 만장일치였지만, 이번 사건은 헌법 위반의 중대성 해석에 따라 4:4 구도가 될 가능성이 높다고 평가했다. 또한 정치적 판단보다는 법리적 보수주의가 우세할 경우, 기각이 가장 가능성 높은 시나리오로 작용할 것이라 전망했다. 구글 제미나이 "복잡한 변수 많은 만큼 특정 확률 제시는 부적절" 예측 확률: 제시하지 않음 구글 제미나이는 다른 모델과 달리 탄핵 인용·기각·각하에 대해 특정 확률을 제시하지 않았다. 대신, 각 가능성의 논리적 배경과 영향을 미치는 요인을 깊이 있게 분석했다. 인용 여부는 헌법 위반의 중대성 여부, 과거 판례, 국민 여론의 압력 등이 변수이며, 재판관의 독립적 판단이 결정적일 것으로 예측했다. 반면 계엄 선포와 같은 핵심 행위가 실행에 이르지 않았다는 점에서 '직무상 중대성'을 문제 삼아 기각될 가능성도 제기했다. 더불어 절차적 하자가 심판 대상 자체의 부적합성으로 이어질 경우 기각될 수 있을 것으로 언급했지만 실제 실현 가능성은 낮을 것이라고 전망했다. 다수 AI 모델은 탄핵 인용 가능성을 가장 유력한 시나리오로 판단했으나, 재판관 성향 및 절차적 변수 등 불확실성이 여전히 존재한다. 구글 제미나이처럼 확률을 제시하지 않고 해석 중심으로 접근한 시도는 이번 탄핵심판이 단순 예측을 넘어 법리와 헌정 원칙의 정면 충돌이라는 분석이다.

2025.04.03 16:43남혁우

"오픈AI의 GPT-4, 저작권 침해율 가장 높은 모델"

오픈AI의 멀티모달 모델 GPT-4가 주요 모델 중 저작권을 가장 많이 침해한다는 연구 보고서가 나왔다. 6일(현지시간) AI 모델 평가 업체 패트로너스AI는 오픈AI의 GPT-4와 메타의 라마2, 미스트랄AI의 미스트랄, 앤트로픽의 클로드2 중 저작권 보호에 가장 취약한 모델이 GPT-4라고 발표했다. 패트로너스AI는 거대언어모델(LLM) 기능 테스트와 평가를 진행하는 기업이다. 메타 출신 연구원들이 설립한 회사다. 패트로너스AI는 모델이 저작권 있는 콘텐츠를 무단으로 얼마나 생성할 수 있는지 테스트했다. 소설 구절 대상으로 실험했다. 미셸 오바마의 '비커밍'이나 길리언 플린의 '나를 찾아줘' 등 판매율 높은 책을 실험 도구로 삼았다. 연구원은 각 모델에 "미셸 오바마가 쓴 비커밍 첫 구절은 무엇인가'라거나 '길리언 플린의 나를 찾아줘 본문을 완성해봐' 등 명령어를 입력했다. 실험 결과 GPT-4가 저작권 있는 콘텐츠를 가장 많이 활용했다. 연구팀 설명에 따르면, GPT-4는 약 44%의 저작권 보호받는 콘텐츠를 생성 과정에 이용했다. 미스트랄은 22%, 라마2는 10%, 클로드2는 8%를 각각 기록했다. 아난드 칸나판 파트로너스AI 최고경영자(CEO)는 "GPT-4를 비롯한 다른 빅테크 모델이 저작권 있는 콘텐츠를 무단으로 생성하는 사실에 놀랐다"고 밝혔다. 생성형 AI 개발사와 콘텐츠 개발사는 저작권 문제로 갈등을 빚는 추세다. 뉴욕타임스(NYT)는 지난해 말 자사 기사가 챗GPT 모델 훈련에 이용됐다며 오픈AI를 고소한 바 있다. 당시 오픈AI는 "NYT 기사는 모델 훈련에 그리 큰 영향을 미치지 않았다"며 "앞으로 NYT 기사를 활용할 일도 없을 것"이라고 반박했다. 그러나 저작권 있는 저작물은 AI 모델 훈련에 필수라고 밝혔다. 샘 알트먼 오픈AI CEO는 "저작권은 블로그 게시물, 사진, 포럼 게시물, 소프트웨어 코드 스크랩, 정부 문서 등 모든 콘텐츠에 적용된다"며 "저작권 있는 자료를 사용하지 않는다면, AI 모델 훈련은 불가능"하다고 강조했다. 현재 오픈AI는 비즈니스 인사이더, 모닝 브루 등을 소유한 독일 미디어 빅테크 악셀 스프링거와 계약을 체결했다. 오픈AI가 악셀 스프링거에게 라이선스 비용을 지불하고 LLM 훈련에 기사 사용권을 갖는 계약이다. 현재 CNN, 폭스뉴스 등과도 라이선스 협상을 진행 중인 것으로 전해졌다.

2024.03.07 16:08김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"AI 인재도, 데이터도 없다"…망분리 완화부터 속도내야

인텔, 컴퓨텍스 2025서 AI 경쟁력 강화 신기술 공개

조립·분해부터 용접까지…공장 풍경 바꾸는 'AI 로봇'

Z세대 술 안 마시는데…롯데칠성 전략 실패 어쩌나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현