• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'클로드 3.7 소네트'통합검색 결과 입니다. (58건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[현장] 앤트로픽-콕스웨이브, 韓서 'AI 자동화·성능분석' 투트랙 공략

앤트로픽이 국내 인공지능(AI) 분석 스타트업 콕스웨이브와 함께 AI 자동화와 최적화 기술을 강화하며 시장 확대에 나섰다. 앤트로픽은 AI를 단순한 도구에서 '가상 협업자'로 발전시키는 전략을 추진하고 있으며 콕스웨이브는 AI 성능 분석 기술을 통해 모델의 신뢰성과 효과성을 높이는 데 집중하고 있다. 앤트로픽과 콕스웨이브는 19일 서울 잠실 시그니엘에서 '빌더 서밋'을 공동개최했다. 이번 행사는 앤트로픽의 AI 모델 '클로드 소네트 3.7'과 콕스웨이브의 '얼라인'을 발표하고 양사의 향후 사업 전략을 공유하기 위해 마련됐다. 행사에는 국내외 개발자 1천여 명이 참석해 AI 기술과 활용 사례에 대한 높은 관심을 보였다. 앤트로픽은 이날 행사에서 AI의 안전성과 혁신을 동시에 추구하는 기업이라는 점을 강조하며 한국을 포함한 아시아태평양 지역에서의 투자와 확장을 검토 중이라고 밝혔다. AI의 역할을 업무 자동화와 의사결정 지원으로 확대하는 전략을 제시하며 맞춤형 AI 솔루션을 강화하겠다는 계획도 공개했다. 함께 발표에 나선 콕스웨이브는 AI 성능 분석 플랫폼 '얼라인'을 소개하며 AI의 신뢰성과 안전성을 높이는 것이 기업들의 핵심 과제라고 강조했다. 젠슨 매출책임자 "AI, 동료가 되게 할 것…韓 포함 아태지역 지사 검토 중" 케이트 젠슨 앤트로픽 최고매출책임자는 '빌더 서밋'에서 회사가 AI의 안전성과 정렬에 많은 방점을 두면서도 혁신을 동시에 추구하는 기업이라는 점을 강조하며 한국을 포함한 아시아 지역에서의 투자와 확장을 적극 검토 중이라고 밝혔다. 젠슨 책임자에 따르면 앤트로픽은 현재 '프런티어급 거대언어모델(LLM)'을 개발하며 AI 모델의 안전성과 활용성을 동시에 높이는 것을 핵심 전략으로 삼고 있다. 이번에 발표된 '클로드 소네트 3.7'은 ▲파운데이션 모델(Foundation Model) 계층 ▲인프라 및 툴링(Infrastructure & Tooling) 계층 ▲가상 협업자(Virtual Collaborators)로 구성됐다. AI가 단순한 질문·응답 수준을 넘어 보다 심층적인 문제 해결과 의사결정 지원을 수행하도록 설계한 것이다. 특히 앤트로픽은 고객사의 AI 활용 방식을 ▲내부 ▲외부 ▲비용절감 ▲수익 창출이란 네가지 방향으로 구분하고 개발자 툴링(Dev Tooling)과 고객용 AI 솔루션을 각각 강화하는 전략을 추진 중이다. '클로드 3.7'의 '에이전틱 코딩(Agentic Coding)' 기능은 이를 위한 개발자의 생산성을 극대화할 수 있는 핵심 요소로 꼽힌다. 또 AI의 자연스러운 언어 처리 및 대규모 데이터 분석·추론 능력을 활용해 기업의 비즈니스 효율성을 높일 수 있도록 지원한다. 국내 시장에서도 이미 여러 기업들이 클로드를 활용하고 있다. 젠슨 책임자는 "슬랙, 뤼튼 등 여러 글로벌·한국 기업들이 클로드 기반 AI 솔루션을 도입 중"이라며 "AI 기술이 한국 기업들의 실제 운영 환경에 적합하도록 지속적으로 최적화할 것"이라고 말했다. 이에 더해 앤트로픽이 올해 아태지역에 최초로 지역사무소 설립을 검토 중으로, 한국을 포함한 아태지역에 투자를 추진하고 현지 기업과의 협력을 강화하겠다는 계획을 밝혔다. 이같이 앤트로픽은 앞으로 AI의 역할을 '가상 협업자'로 확대해 AI가 기업의 의사결정을 돕고 업무의 일부를 자동화하는 수준으로 발전시키겠다는 목표를 세우고 있으며 이 과정에서 안전성과 윤리적 AI 개발 원칙을 철저히 준수하겠다는 입장이다. 젠슨 책임자는 "AI가 기업의 운영을 혁신하는 동시에 신뢰할 수 있는 도구로 자리 잡을 수 있도록 지속적으로 연구개발(R&D)에 투자할 것"이라고 강조했다. 크리거 CPO "에이전트로 업무 자동화…비용은 줄이고 성능은 높인다" 이어 발표를 진행한 마이크 크리거 앤트로픽 최고제품책임자(CPO)는 AI 기반 업무 자동화와 기업 맞춤형 솔루션을 위한 새로운 투자 전략을 발표했다. 그러면서 한국에 대해서도 AI 활용도가 높은 시장으로 평가하며 국내 기업들과의 협업 가능성을 강조했다. 크리거 CPO는 "현재 AI 애플리케이션 프로그램 인터페이스(API)는 단순한 입력-출력 방식"이라며 "향후에는 기업이 원하는 작업을 AI가 직접 수행하고 백그라운드에서 지속적으로 학습하는 형태로 변화할 것"이라고 밝혔다. 앤트로픽은 이를 위해 ▲차세대 에이전트 API ▲데이터 커스터마이징 ▲비용 효율화 등 세 가지 분야에 대한 연구개발(R&D)을 집중적으로 진행하고 있다. 우선 태스크 기반 API와 쓰레드 기반 API를 도입해 AI가 업무를 자동으로 기억하고 필요할 때마다 최적의 의사결정을 내릴 수 있도록 지원한다. 또 클라우드 내에서 직접 코드를 실행할 수 있는 환경을 마련해 개발자들의 AI 활용도를 극대화할 예정이다. 데이터 커스터마이징 측면에서는 모델 컨텍스트 프로토콜(MCP)을 확장해 기업 내부 문서, 웹 데이터, 엑셀, 슬랙, 깃허브 등 다양한 데이터를 AI가 동적으로 분석할 수 있도록 했다. 이를 통해 기업이 자체 AI를 구축하지 않고도 '클로드' 모델을 최적화해 내부 데이터를 실시간으로 활용할 수 있다. 특히 기업이 원하는 정보를 AI에 자동으로 학습시키는 '프롬프트 에이전트' 기능을 통해 사용자의 개입 없이도 모델이 자체적으로 개선되도록 설계했다. 크리거 CPO는 회사의 비용 절감 전략도 설명했다. 앤트로픽은 프롬프트 캐싱 기능을 확장해 API 호출 비용을 줄이는 동시에 '파인튜닝' 기능을 도입해 모델을 맞춤형으로 학습할 수 있도록 지원한다. 기존 AI 모델이 지나치게 크거나 반대로 특정 업무에는 최적화되지 않은 문제를 해결하기 위해 기업이 자체적으로 모델을 수정하고 유연하게 배포할 수 있도록 했다. 국내 시장에서도 적극적인 확장을 예고했다. 그는 "한국 시장은 AI 채택 속도가 빠르고 스타트업부터 대기업까지 AI 활용도가 높은 시장"이라며 "비용 절감과 수익 창출을 동시에 원하는 기업들의 요구에 맞춰 맞춤형 AI 솔루션을 지속적으로 제공할 것"이라고 강조했다. "AI 성능, 제대로 분석해야 한다"…콕스웨이브, '얼라인' 통해 기업 지원 이날 함께 행사를 주최한 콕스웨이브의 김기정 대표는 회사의 AI 분석 플랫폼 '얼라인(Align)'을 소개하며 AI 제품의 완성도를 높이는 것이 기업들의 핵심 과제가 되고 있다고 강조했다. 김 대표는 "AI가 고객 응대, 업무 자동화, 생성형 AI 서비스 등에 폭넓게 도입되고 있다"면서도 "실제로 얼마나 효과적으로 작동하는지에 대한 분석이 부족하다"고 지적했다. 이에 콕스웨이브는 AI 성능 분석을 위한 필수 도구로 '얼라인'을 개발했다. 이 플랫폼은 ▲대규모 AI 대화 데이터 검색·분석 ▲자연어 기반 질의응답 ▲실시간 모니터링 패널 제공 기능을 갖추고 있다. AI 기업들이 챗봇, 가상 비서, 고객 서비스용 AI 모델을 운영할 때 발생하는 문제를 쉽게 파악하고, 개선 방향을 찾을 수 있도록 설계됐다. AI의 신뢰성과 안전성을 강화하는 것도 핵심 목표다. '얼라인'은 AI가 생성한 응답 중 비정상적인 패턴이나 비효율적인 대화 흐름을 자동 감지하고 이를 개발팀이 즉각 수정할 수 있도록 지원한다. 또 구글리서치 및 여러 학계 기관과 협력해 AI 모델의 윤리적 문제와 안전성을 개선하는 연구를 진행하고 있다. 이같이 콕스웨이브는 AI 모델 성능 분석에 대한 기업들의 수요가 커지고 있다고 보고, 글로벌 AI 기업들과 협력해 시장을 확대할 계획이다. 김기정 콕스웨이브 대표는 "앤트로픽과의 협력을 통해 AI 모델이 보다 안전하고 효과적으로 작동하도록 지원하고 있다"며 "AI와 인간이 조화롭게 협력하는 미래를 만들기 위해 지속적으로 연구개발(R&D)을 확대할 것"이라고 밝혔다.

2025.03.19 16:15조이환

앤트로픽 "AI, 더 이상 도구 아냐…올해부터 사회 문제 해결 주도"

"인공지능(AI)이 인간 보조 도구인 시기는 끝났습니다. 향후 몇 년간 AI가 과학 연구부터 신기술 개발, 사회적 문제 해결을 주도하는 시대로 접어들 것입니다. 아마존웹서비스(AWS)와 협업해 이같은 AI 혁신 시대를 주도하겠습니다.” 앤트로픽 마이크 크리거 최고제품책임자(CPO)는 18일 서울 코엑스에서 열린 'AWS 유니콘데이 2025'에서 AI 미래 전망과 향후 사업 전략을 이같이 밝혔다. 그는 AI 기술 발전를 세 단계로 나눌 수 있다고 설명했다. 우선 2023년을 'AI가 단순한 도우미 역할을 하던 시기'로 규정했다. 해당 시기에는 AI가 이메일 작성부터 간단한 코드 편집 등 비교적 단순한 작업을 지원하는 수준에 머물렀다는 평가다. 그는 2024년에는 AI가 단순한 도우미를 넘어 협업 도구로 발전하는 단계에 접어들었다고 분석했다. 보고서 작성부터 복잡한 코드 수정, 데이터 분석 등 더 복잡한 작업을 수행하면서 업무 생산성 향상하는 역할을 본격적으로 하게 된 시기라는 설명이다. 크리거 CPO는 향후 AI가 혁신을 주도하는 단계에 진입할 것으로 전망했다. 그는 “AI가 과학 연구를 비롯한 신기술 개발, 사회적 문제 해결 등 창의적이고 전략적인 영역을 주도할 것”이라고 강조했다. 그는 클로드가 미래 AI 기술 혁신을 뒷받침할 것이라고 재차 강조했다. 앞서 앤트로픽은 지난해 3월부터 '클로드 3' 시리즈를 줄줄이 출시했다. 이후 6월 '클로드 3.5 소넷'을 공개했으며, 10월 이를 개선한 두 번째 버전을 내놨다. 최신 버전은 지난달 공개된 '클로드 3.7'이다. 해당 모델 시리즈는 '확장된 사고 능력(Extended Thinking)'과 '생각의 여유(Thniking Budget)' 기능을 갖췄다. 확장된 사고 능력은 기존보다 깊이 있는 추론을 한 후 응답하는 식이다. 코딩, 수학 등 복잡한 문제 해결에 강점을 갖췄다. 생각의 여유 기능은 사용자가 원하는 대로 모델이 짧은 시간 내 답을 제공하거나, 더 오랜 시간 깊이 있는 사고를 거친 후 답을 제공하는 방식이다. 기존에는 사용자가 '일반 모델'과 '심층적 사고 모델' 중 하나를 택해야 했지만, 최신 버전에서는 이를 한 모델에서 이용할 수 있다. 그는 앤트로픽이 에이전트 기반 코딩 분야에서도 업계를 선도한다고 강조했다. 단순히 요청 한 번으로 코드를 생성하는 것이 아니라, 여러 번 상호작용을 통해 점진적으로 코드를 개선하는 식으로 작동하는 에이전트라는 이유에서다. 이를 평가하는 벤치마크 'SWE-bench'에서 클로드 3.7 소넷 모델은 70점을 기록했다. 크리거 CPO는 한국 시장에 대해서도 언급했다. 그는 "한국 시장이 매우 빠르게 성장하는 것을 직접 보고 있다"며 "특히 아마존베드록을 통한 클로드 활용 기업이 눈에 띄게 늘었다"고 강조했다. 크리거 CPO는 AWS와 협업을 통해 생성형 AI 사업을 강화할 것이라고 밝혔다. 그는 "AWS는 자사 최대 투자자"라며 "AWS의 강력한 하드웨어 인프라·보안 기술과 자사 최첨단 AI 모델을 결합해 기업 고객들에게 최상의 AI 솔루션을 제공할 것”이라고 말했다.

2025.03.18 12:54김미정

슈퍼마리오 게임으로 AI 성능 따져봤더니

슈퍼마리오 브라더스 게임으로 인공지능(AI) 모델들의 성능을 따져 본 연구 결과가 공개됐다고 테크크런치 등 외신들이 3일(현지시간) 보도했다. 보도에 따르면 미국 캘리포니아대학 샌디에이고 캠퍼스 '하오 AI랩'(Hao AI Lab) 연구진은 최근 슈퍼마리오 브라더스 게임에 AI를 투입했다. 그 결과 앤드로픽의 클로드 3.7이 가장 좋은 성과를 보였고 클로드 3.5가 그 뒤를 이었다. 반면 구글 제미나이 1.5 프로와 오픈AI GPT-4o는 성능이 떨어졌다. 여기서 사용된 슈퍼마리오 게임은 1985년 출시된 오리지널 슈퍼마리오 브라더스는 아니다. 에뮬레이터에서 게임을 실행했고 '게이밍에이전트'(GamingAgent)라는 프레임워크와 통합시켜 AI가 마리오를 실제로 제어할 수 있도록 했다. 연구진이 개발한 게이밍에이전트는 AI에 "장애물이나 적이 가까이 있으면 왼쪽으로 이동/점프해 피하라"와 같은 기본 지침과 게임 내 스크린샷을 제공해 학습시켰다. 이후 파이썬 코드형태로 입력 값을 생성해 AI가 마리오를 제어할 수 있도록 했다. 연구진은 각각의 AI 모델이 복잡한 작전을 계획하고 게임플레이 전략을 개발하도록 훈련시켰다. 흥미롭게도 연구진은 오픈AI의 o1과 같은 추론 모델이 비추론 모델보다 슈퍼마리오 게임 플레이 시 성과가 나쁘다는 것을 발견했다. 추론 모델이 이런 게임을 하는 데 더 불리한 이유 중 하나는 추론 모델의 경우 행동을 결정하는 데 보통 몇 초의 시간이 걸리기 때문이다. 슈퍼 마리오 브라더스 게임은 타이밍이 중요한 게임으로 단 1초 만에 안전하게 점프하냐 추락하냐가 결정된다. 게임은 수십 년 동안 AI 성능을 벤치마킹하는 데 사용됐으나 일부에서는 AI의 게임 기술과 AI 성능 사이의 관련성에 의문을 제기해 왔다. 현실 세계와 달리 게임은 추상적이고 비교적 단순하며, AI를 훈련하는 데 이론적으로 무한한 양의 데이터를 제공한다. 안드레이 카파시(Andrej Karpathy) 오픈AI 창업자이자 연구과학자는 이에 '평가 위기'(evaluation crisis)라고 지적하며 "지금 당장 어떤 [AI] 지표를 살펴봐야 할지 잘 모르겠다”고 밝히기도 했다.

2025.03.04 15:51이정현

"韓 AI 시장 본격 공략"…앤트로픽, 서울서 '빌더 서밋' 개최

앤트로픽이 서울에서 '코리아 빌더 서밋(Korea Builder Summit)'을 개최하며 국내 시장 공략을 본격화한다. 주요 IT 강국 중 하나인 한국의 인공지능(AI) 생태계와의 협력을 확대함으로써 글로벌 시장에서의 입지를 강화하려는 조치다. 앤트로픽은 오는 3월 19일 시그니엘 서울에서 '빌더 서밋' 행사를 개최한다고 26일 밝혔다. 이 서밋은 앤트로픽이 한국에서 처음 여는 공식 행사로, 국내 AI 개발자, 기술 리더, 미디어를 대상으로 클로드의 최신 기능과 연구 성과를 공개할 예정이다. 행사 공동 주최사는 국내 AI 안전성 기업인 콕스웨이브다. 앤트로픽 '클로드'는 정교한 추론 능력과 복잡한 업무 처리 역량을 갖춘 AI 모델이다. 특히 한국어와 한국 문화에 대한 높은 이해도를 가져 비즈니스 환경에 최적화된 대응이 가능하다. 회사는 모델 개발에 있어 '헌법적 AI(Constitutional AI) 프레임워크'를 채택해 각 문화권의 특성을 존중하는 책임 있는 AI 기술을 지향한다. 이번 행사에서 앤트로픽은 최첨단 연구 성과를 국내 시장에 선보인다. '클로드'의 새로운 기능과 AI 모델 발전 방향을 공유하며 기업들이 어떻게 AI를 활용할 수 있을지 논의할 예정이다. 행사에서는 비즈니스 운영 및 개발 워크플로우 혁신 방안도 중점적으로 다뤄진다. 이번 서밋에는 마이크 크리거 앤트로픽 최고제품책임자(CPO)와 케이트 얼 젠슨 매출 총괄 책임자 등 핵심 경영진과 앤트로픽 연구진이 다수 참석해 한국 스타트업 커뮤니티와 함께 소통할 전망이다. 앤트로픽 측은 국내 기업들이 '클로드'를 활용해 AI 혁신을 선도하고 있다고 평가했다. 스타트업 및 기업들이 클로드 기반 애플리케이션을 개발하며 글로벌 경쟁력을 확보하고 있다는 분석이다. 이번 서밋은 AI 빅테크 기업들이 국내 시장 진출을 가속화하는 흐름과도 맞닿아 있다. 일례로 지난 4일 오픈AI는 서울에서 '빌더랩' 행사를 열고 샘 알트먼 최고경영자(CEO)가 직접 참석해 카카오와의 협력을 발표한 바 있다. 콕스웨이브 김주원 대표는 "이번 행사는 우리의 혁신적인 AI 커뮤니티와 글로벌 AI 리더를 연결하는 중요한 자리"라며 "우리나라가 책임감 있는 AI 개발의 핵심 허브로 성장하는 계기가 될 것"이라고 밝혔다. 조 주 앤트로픽 스타트업 성장 및 파트너십 총괄은 "한국 AI 생태계는 세계적으로 탄탄한 경쟁력을 갖추고 있다"며 "한국이 글로벌 기술 중심지로 자리 잡을 것으로 확신한다"고 말했다.

2025.02.26 11:23조이환

앤트로픽, '클로드 3.7 소네트' 공개…하이브리드 AI 시대 연다

앤트로픽이 실시간 응답과 심층적인 추론을 하나로 통합한 인공지능(AI)을 출시해 거대언어모델(LLM)의 새로운 기준을 제시했다. 보다 직관적인 방식으로 인간과 상호작용하도록 함으로써 갈수록 치열해지는 AI 경쟁에서 우위를 점하려는 전략이다. 25일 테크크런치에 따르면 앤트로픽은 거대언어모델(LLM)과 추론 모델을 결합한 '하이브리드 AI'인 '클로드 3.7 소네트'를 공식 발표했다. 이 모델을 통해 사용자는 기존의 LLM을 활용했을 때처럼 즉각적인 응답을 받을 수도 있고 AI가 보다 깊이 사고하도록 추론을 하게 명령할 수도 있다. 앤트로픽은 '클로드 3.7 소네트'의 추론 기능을 유료 사용자에게만 제공한다고 밝혔다. 무료 사용자에게는 일반적인 답변 기능만 제공되나 전체적인 성능은 기존 모델인 '클로드 3.5 소네트'보다 개선됐다. 가격은 100만 개 입력 토큰당 3달러(한화 약 4천200원), 100만 개 출력 토큰당 15달러(한화 약 2만1천원)다. 오픈AI의 'o3-미니'나 딥시크의 'R1'보다 높은 수준이지만 '하이브리드 모델'이 업계에서 처음으로 도입된 점을 감안하면 향후 가격이 인하될 것으로 예측된다. '클로드 3.7 소네트'는 실전 활용성에도 초점을 맞췄다. 어려운 코딩 문제 해결과 에이전트 기반 작업에서 강력한 성능을 발휘하며 개발자가 추론 시간을 조절할 수 있는 기능도 포함됐다. 이 모델은 '소프트웨어 엔지니어링(Bench SWE)' 벤치마크 테스트에서 62.3% 정확도를 기록해 오픈AI의 'o3-미니'보다 높은 성능을 보였다. 또 AI의 애플리케이션 프로그램 인터페이스(API) 상호작용 능력을 측정하는 'TAU-벤치'에서도 오픈AI의 'o1'을 앞서는 성적을 거뒀다. AI 업계의 반응은 뜨겁다. 소셜미디어에서는 지금까지 출시된 AI 중 최고라는 업계 관계자들의 평가가 잇따르고 있다. 특히 개발자들은 클로드 3.7 소네트가 복잡한 코드베이스를 다루는 능력이 뛰어나다며 극찬하고 있다. 유명 AI 팟캐스터 렉스 프리드먼은 자신의 X 계정에서 "'클로드 3.7 소네트'는 프로그래밍에 가장 적합한 모델"이라며 "AI 경쟁이 정말 치열해지고 있어 살아 있는 것이 신나는 시대"라고 언급했다. '클로드 3.7 소네트'의 등장은 AI 산업의 새로운 흐름을 시사한다. 오픈AI 역시 최근 'GPT-5'를 마지막으로 추론모델인 'o' 시리즈를 폐기하고 기존 GPT 모델에 통합하는 방향을 예고했다. AI 업계가 '하이브리드 모델' 중심으로 재편될 가능성이 높아지고 있는 것이다. 테크크런치는 "앤트로픽의 모델 출시는 AI 연구소들이 신모델을 빠르게 내놓는 치열한 경쟁 속에서 이뤄진 결정"이라며 "오픈AI 등의 경쟁자들도 자체 하이브리드 모델을 내놓으려고 하는 상황에서 회사가 AI 경쟁에서 얼마나 오래 선두를 유지할 수 있을지는 지켜봐야 할 것"이라고 분석했다.

2025.02.25 09:42조이환

오픈AI, AI의 SW 개발 성과 공개…"단독 수행보단 협력이 최적"

인공지능(AI)이 실제 소프트웨어(SW) 개발 업무에서 어느 정도의 경제적 가치를 창출할 수 있는지 평가한 새로운 연구 결과가 공개됐다. 해당 연구에서는 AI가 독립적으로 복잡한 SW과제를 해결하기에는 여전히 한계가 있으며, 현재로서는 인간 개발자와의 협업이 더 효과적이라는 결론을 도출했다. 특히 AI가 단순 반복 작업이나 관리 업무에서는 경쟁력 있는 성과를 보였지만 더 복잡한 문제 해결에서는 성공률이 낮아 실제 경제적 가치도 제한적이라고 밝혔다. 20일 오픈AI 연구진은 SWE-랜서(Lancer)라는 새로운 대규모 언어모델(LLM) 벤치마크를 개발했다는 내용을 논문으로 공개했다. 오픈AI 측은 기존 코딩 벤츠마크가 실제 기업 환경에서 빈번히 일어나는 복잡한 버그와 기능 구현 과제를 제대로 반영하지 못하자 이를 극복하기 위해 새로운 벤치마크 방식을 개발했다고 밝혔다. 특히 AI의 성과를 경제적 가치라는 현실적인 지표로 평가했다는 점이 특징이다. 오픈AI의 GPT-4o와 o1, 그리고 앤트로픽의 클로드 3.5 소넷을 대상으로 SWE-랜서 벤치마크를 실시한 결과 모든 AI가 실제 개발자에 비해 성능이나 비용면에서 부족한 것으로 나타났다. 가장 높은 성과를 거둔 클로드 3.5 소넷조차 프리랜서 역할을 직접 수행하는 독립 엔지니어링(IC SWE) 과제에서 약 26.2%의 통과율을 보이는 데 그쳤다. 오픈AI의 o1은 12.1%, GPT-4o는 6%로 더욱 낮은 수준을 기록했다. 해당 결과는 모델이 단 한 번 시도(pass@1)했을 때 기준으로 했으며 특히 단순히 결과값만 제출하는 것을 방지한 것이다. 여러 번 시행착오를 시도하거나 충분한 추론 시간을 할당하면 성공률이 크게 올라가는 사례도 확인됐다. 여러 개발자가 제출한 해결책 중 최적의 방안을 골라야 하는 소프트웨어 엔지니어링 관리(SWEM) 과제에서는 o1이 51.8%의 정확도로 실제 매니저 결정과 일치하며 가장 높은 결과를 기록했다. 한편, GPT-4o는 47.1%, 클로드 3.5 소넷이 44.9% 정확도를 달성했다. 연구진은 이를 "단번에 모든 위험 요소를 파악하기는 힘들어도, 합리적인 제안과 비효율적인 제안을 선별하는 능력은 쓸 만하다"고 해석했다. 하지만 여전히 절반에 달하는 과제를 제대로 해결하지 못한 만큼 AI가 곧바로 인간 엔지니어를 대체하거나 매니저 역할을 담당하기엔 역부족인 것으로 드러났다. SWE-랜서 벤치마크는 실제로 프리랜서 플랫폼 '업워크'에서 진행된 작업을 기반으로 구성됐다. 덕분에 AI 모델을 통해 얼마나 많은 과제를 해결하고 실제 경제적 가치를 창출했는지도 측정 가능하다. 벤치마크 결과 개발자들이 100만 달러의 수익을 달성하는 동안 AI는 40만~30만 달러의 성과를 기록하며 절반에도 미치지 못한 것으로 나타났다. 가장 높은 성과를 거둔 클로드3.5소넷이 40만3천 달러를 기록했으며 o1은 38만 달러, GPT-4o은 30만4천달러를 달성했다. 오픈AI 연구진은 AI 단독으로 SW개발 등 실무를 수행하기엔 부적합한 부분이 상당히 존재한다며 대신 사람과의 협력을 통해 더욱 높은 성과를 달성할 가능성이 크다고 강조했다. 특히 패턴이 있는 반복적인 작업이나 관리 업무는 AI가 수행하고 복잡한 문제 해결이나 창의적인 개발은 인간이 주도하는 것이 효율적일 것이라고 협력 방안을 권했다. 사무엘 미세렌디노 등 오픈AI 연구진은 "현재 AI 모델은 아직 부정확한 코드를 제시하거나, UX·보안상의 맹점을 남길 가능성이 크다"며 "반드시 최종 검증은 전문가가 맡아야 한다"고 강조했다. 이어 "AI 모델들은 단독으로 수행되기보다 사람이 해결책을 신속히 찾도록 돕는 보조 역할에서 가치를 발휘할 것"이라며 "실제로 코드를 검색해 문제 부위를 찾아내거나, 여러 제안서 중 합리적 범위를 좁혀주는 과정에서 모델들이 시간 절약을 지원하는 사례가 반복해서 관측됐다"고 설명했다.

2025.02.20 11:11남혁우

"인간처럼 AI도 늙는다"…구형 모델, '인지 저하' 겪어

시간이 흐르면서 인공지능(AI) 모델도 사람처럼 '인지 저하'를 겪을 수 있다는 우려가 나왔다. 17일 영국의학저널(BMJ)에 따르면 거대언어모델(LLM) 기반 AI 챗봇 테스트 결과 이같은 연구 결과가 나온 것으로 전해졌다. 인간이 나이가 들수록 기억력 감퇴나 치매를 겪는 것처럼 AI도 비슷한 현상을 보인다는 설명이다. 연구진은 오픈AI '챗GPT'와 앤트로픽 '소네트', 구글 '제미나이' 등 LLM 기반 챗봇 대상으로 몬트리올 인지 평가(MoCA) 테스트를 진행했다. MoCA는 알츠하이머나 치매 등 인지 장애를 평가하는 검사다. 주의력과 기억력, 언어 능력, 공간 인지, 실행 기능 등을 측정한다. 실험 결과 모델 중 가장 최신 버전인 GPT-4o는 30점 만점 중 26점을 받아 정상 범주에 해당하는 점수를 기록했다. 상대적으로 구형 모델인 제미나이1.0은 16점에 그쳤다. 챗봇들은 이름 맞히기, 주의력, 언어 능력, 추상적 사고 영역에서 비교적 우수한 점수를 기록했다. 공간 인지, 실행 기능과 관련한 평가에서는 구형 모델일수록 낮은 점수를 받았다. 특히 기억 영역에서 가장 큰 격차를 보였다. 연구를 주도한 이스라엘 하다사 의료센터 로이 다얀 신경과학자는 "AI가 시각적 추상화(visual abstraction)와 실행 기능(executive function)이 필요한 작업에서 신뢰할 수 없는 결과를 낼 가능성이 높다"며 "AI가 인간을 대체하는 데 있어 치명적 한계를 가질 수 있을 것"이라고 지적했다. AI와 인간 인지 기능은 본질적으로 다르므로 직접적인 비교는 어렵다. 다만 연구진은 이번 보고서를 통해 AI 한계를 고려해야 한다는 점을 당부했다. 특히 의료 현장에서 AI를 활용할 때 이를 보완할 방안이 필요하다고 강조했다. 일각에선 AI 모델의 장기적 신뢰성 확보 중요성이 높아질 것이라는 전망이 나왔다. 신경학자들은 "인지 장애를 겪는 AI를 진단·관리할 수 있는 새 시장이 열릴 것"이라고 봤다.

2025.02.17 09:21김미정

AI 시대, '인간다움' 정수 어떻게 지킬까

한 유튜브에서 본 10만원대 통역기 리뷰 영상이 충격적이었다. 중국 선전에서 유통되는 이 기기가 보여준 AI 시대의 민낯은 우리 일상과 너무나 닮아있다. 130개 국어를 지원하는 이 통역기는 와이파이 없이도 완벽한 번역을 해낸다. 우리의 언어와 생각, 창작물이 이렇게 쉽게 변환되고, 요약되며, 재생산되는 시대다. 업무 현장은 이미 AI의 손아귀에 있다. 회의와 잡담은 클로바와 다글로가 기록하고, 어색한 문장은 클로드가 다듬는다. 5시간 걸리던 일이 커피 다섯 모금 삼키는 시간에 끝난다. 생산성은 비약적으로 높아졌지만, 이 효율성이 주는 두려움도 크다. 원본의 가치는 희미해진다. 넷플릭스 10부작 드라마는 45분짜리 유튜브 요약으로 대체되고, 유튜브 콘텐츠는 2배속과 자동화된 스크립트로 빠르게 소비된다. 기사나 보고서는 AI의 손을 거쳐 재탄생하고, 우리는 그것을 다시 요약해 읽는다. 아이러니한 것은, 우리가 AI를 이용하는 것이 아니라 AI에게 이용당하고 있다는 생각이다. 우리는 AI가 학습할 자료를 만들고 전달하는 도구가 되어가는 거 아닐까. 머지않아 AI는 인간의 도움 없이도 스스로 발전하고, 창작할 것이다. (이미 그 영역에 들어섰고, 하청 시장에서 인간은 AI와 경쟁 중이다.) 이런 시대를 살아갈 우리 아이들에게 무엇을 가르쳐야 할까. 초등학교 6학년 아들은 여전히 영어와 수학 공부에 매진한다. 20년 후의 시대를 살아갈 아이에게, 20년 전의 지식을 가진 아빠가 어떤 조언을 해야하나. 기존의 학습 방식과 진로에 대한 조언이 무색하다. 이 해답도 AI에게 구해봐야 겠다. 이런 변화를 비판할 의도는 아니다. 그냥 두렵다. 손가락은 점점 키보드를 잊어가고, 뇌는 AI 없이 생각하기를 거부한다. 기기가 방전 되고, 네트워크가 끊어진다면, 또는 AI가 인간을 거부하는 순간이 온다면? 스마트폰 없는 현대인처럼 우리는 무력감에 빠지지 않을까. 받아들여야 할 것 같다. 진화일까, 퇴화일까 판단하기엔 이르다. 확실한 건, 우리는 이미 돌아갈 수 없는 강을 건넜다는 것이다. 중요한 건 이 급류 속에서 인간다움의 정수(精髓)를 어떻게 지켜낼 것인가다. 이 글 역시 누군가에 의해, 어떤 AI에 의해 요약되고 재해석될 것이다. 그것이 이 시대를 사는 우리의 모습이다. 우리는 지금 거대한 실험의 한가운데 서 있다. 그리고 그 실험의 주체이자 대상이 되어가고 있다.

2025.02.16 09:12문지형

인사이트클럽, AI 스토리텔링 교육기관 '프롬' 설립

AI 기술이 콘텐츠 제작의 새로운 축으로 떠오르는 가운데, 이를 전문적으로 교육하는 새로운 실험이 시작된다. AI 스토리텔링 커뮤니티 인사이트클럽이 AI 스토리텔링 전문 교육기관 '프롬'을 설립하고, 2월4일 로컬스티치 크리에이터타운 서교에서 '클로드 프롬프트 프로그래밍 클래스'를 시작한다. 프롬은 인공지능과 인문지성을 연결하는 AI 스토리텔링 학교이자, 좋은 AI 도구로 더 좋은 이야기를 만드는 실험실을 지향한다. 인사이트클럽은 2024년 8월부터 약 20여 차례의 인공지능 스토리텔링 워크숍을 통해 약 300명의 참가자와 함께 다양한 실험을 진행했다. 특히 현장의 실전 프로젝트를 수강생들과 함께 개발하는 과정에서 1편의 숏폼 드라마 대본이 완성됐고, 1편의 영화 시나리오를 개발 중이다. 지난 12월에는 원더스랩과 함께 숏폼 드라마 시나리오 AI 어시스턴트 '원더스토리'를 선보였다. 원더스토리는 기존 구독형 시나리오 AI의 한계를 개선한 전문가용 AI 어시스턴트로, 저예산과 짧은 제작 기간이라는 제작환경에서 주목받았다. 프롬의 첫 교육과정인 '클로드 시나리오 창작' 과정은 2월4일 개강하며, 8명의 수강생을 선발해 운영된다. 앤트로픽의 '클로드 AI'를 활용해 4주 동안 장편 영화 시나리오를 완성하는 것을 목표로 한다. 특히 영화/드라마/웹툰/숏폼드라마 제작사들과의 파트너십을 통해, 기존 제작 방식 대비 3분의 1 이상의 효율성 향상을 기대할 수 있다. 프롬의 가장 큰 특징은 프로젝트형 수업이다. 파트너십을 통해 수강생은 실전 포트폴리오를 쌓고, 파트너는 작품개발을 진행하는 시너지가 만들어지게 된다. 현재 영화/드라마/웹툰/숏폼드라마 등의 제작사와 플랫폼들이 파트너로 참여하고 있다. 교육진으로는 영화 '연애 빠진 로맨스'의 제작자 연동은 대표가 '스토리 위버'로, 광복절을 기념해 독립투사들의 AI 영상으로 주목받은 AI 크리에이터 '그림달'이 '메이븐'으로 참여한다. 김우정 인사이트클럽 디렉터는 "최고 성능의 전투기를 운 좋게 얻어도 조종법을 모르면 무용지물"이라며 "프롬프팅 공부 없이 생성 인공지능을 단순한 챗봇처럼 사용하면서 성능을 폄하하는 것은 어리석은 일이다. 클로드의 지침과 지식파일, 그리고 프로그래밍 프롬프트를 활용하면 시나리오 완성도는 현장의 90% 수준까지 향상된다"고 말했다.

2025.01.20 13:56백봉삼

생성형AI 시대, 지각변동 채용시장..개발자 생존 전략은?

생성형AI의 등장으로 개발자 채용시장이 큰 변화를 맞이하고 있다. 단순 반복 작업의 자동화로 초급 개발자 수요는 감소하는 반면, 창의적 문제해결과 AI 활용 능력을 갖춘 고급 개발자의 수요는 증가하는 양극화 현상이 두드러지고 있다. 이 위기를 극복하기 위해 초급 개발자들은 창의적 문제 해결 능력과 AI 활용 역량을 강화할 필요성이 늘고 있다. 또한 기업은 채용 방식을 실무 중심의 프로젝트 평가와 AI 도구 활용 능력 검증 등으로 재편할 필요성이 요구된다. 12일 소프트웨어정책연구소(SPRi)는 'SW 개발자 채용시장의 변화와 생성형AI의 영향' 보고서를 통해 SW 개발자 요구 역량 및 이에 따른 채용 변화와 관련한 정부와 개발자들의 대응 방향을 제시했다. 보고서에 따르면 팬데믹과 디지털 전환, 경기 침체와 투자 위축이라는 대규모 변화 속에서 생성형AI는 SW 취업 시장을 재편하는 데 중요한 역할을 하고 있다. 팬데믹 기간 동안 디지털 전환이 가속화되며 SW 개발자 수요가 폭발적으로 증가했다. 원격 근무와 비대면 서비스 확산으로 인해 클라우드, 빅데이터, 인공지능(AI) 기술에 대한 수요가 급증하며 기업의 SW 개발자 채용 열풍을 일으켰다. 그러나 팬데믹 이후 글로벌 경기 침체와 고금리 정책으로 인해 IT 기업과 스타트업의 투자가 위축되면서 채용 시장은 점차 양극화되는 추세다. 이러한 상황에서 생성형AI의 도입은 단순히 채용 시장을 변화시키는 데 그치지 않고, SW 개발자의 역할과 역량에 대한 새로운 요구를 제시하고 있다. 생성형AI는 단순하고 반복적인 작업을 자동화하며 초급 개발자 채용 수요를 감소시키고 있다. 예를 들어 코드 작성, 테스트, 문서화 등 초급 개발자가 맡았던 역할은 이제 AI가 효율적으로 수행할 수 있다. 이에 따라 기업들은 초급 개발자를 다수 고용하기보다 AI를 활용할 줄 아는 고급 개발자를 선호하는 경향을 보이고 있다. 기업들은 AI 도구가 생성한 코드의 품질을 검토하고, 복잡한 문제를 해결하며, 시스템 통합 및 프로젝트를 리딩할 수 있는 고급 개발자에 대한 수요는 증가하며 채용 시장의 양극화를 더욱 심화되고 있다. 생성형AI의 도입은 SW 개발자들에게 기존의 역량 외에 새로운 기술과 능력을 요구하고 있다. 단순 코딩 능력보다는 창의적이고 복합적인 문제 해결 능력이 점점 더 중요해지고 있다. AI 도구가 제공하는 결과물을 분석하고 오류를 검증할 수 있는 정보 판별 능력도 필수적인 역량으로 떠오르고 있다. 특히 프롬프트 엔지니어링 능력이 중요한 역할을 하게 됐다. 이는 AI에게 명확한 지시를 내려 원하는 결과를 얻는 기술로, AI 도구와 협력하는 데 핵심적인 역량이다. 또한 다양한 깃허브, 코파일럿 등 AI 기반 도구를 자유롭게 사용할 수 있는 능력도 필수적인 요구로 자리 잡았다. 이와 함께, 협업, 커뮤니케이션, 창의적 사고와 같은 소프트스킬의 중요성도 강조되고 있다. 이는 AI가 대체할 수 없는 인간 고유의 가치로, 개발자들이 기술적 역량 외에 비기술적 역량도 갖춰야 하는 이유가 되고 있다. 이러한 변화 속에서 SW 개발자들의 역할도 새롭게 정의되고 있다. 초급 개발자의 경우, AI 도구가 단순 반복 작업을 대신하면서 기존 역할은 축소되고 있다. 그러나 초급 개발자들은 AI 도구를 활용하여 기존보다 더 고도화된 업무를 수행하고 빠르게 성장할 기회를 얻고 있다. 이를 통해 창의적 문제 해결과 전략적 사고 역량을 바탕으로 기존 초급 개발자와 차별화된 역할을 수행할 수 있다. 중·고급 개발자들의 역할은 더욱 복잡해지고 고도화되고 있다. 이들은 팀을 리딩하고 AI가 대체할 수 없는 복잡한 문제를 해결하며, 시스템 설계와 프로젝트 기획을 주도해야 한다. 또한, 단순한 기술적 역할에서 벗어나 팀 관리와 전략적 의사결정을 수행하는 관리자의 역할로 전환되고 있다. 채용 방식도 이러한 변화에 따라 새롭게 정비되고 있다. 기존의 단순 코딩 테스트는 AI 도구가 기본적인 코딩을 대신할 수 있는 상황에서 실효성을 잃어가고 있다. 대신, 실무 중심의 프로젝트 과제를 통해 지원자의 문제 해결 능력을 평가하는 방식이 도입되고 있다. AI 도구 활용 능력과 창의성을 검증할 수 있는 평가 방식이 중요해지고 있으며, 협업, 커뮤니케이션 등 소프트스킬을 평가하는 비기술적 요소도 강화되고 있다. 보고서는 이러한 변화에 대응하기 위해 정부, 기업, 그리고 개발자들은 각각의 위치에서 적응과 발전을 도모할 것을 권했다. 정부는 교육 체계를 개편해 AI 활용 능력, 데이터 과학, 소프트스킬을 포함한 실무 중심의 교육 프로그램을 확대할 필요가 있다. 더불어 재직자를 대상으로 AI와 신기술 활용 역량을 강화할 수 있는 재교육 프로그램을 지원하며, 윤리적 가이드라인을 마련해 데이터 보안 문제를 해결해야 한다는 것이다. 기업은 채용 프로세스를 개선해 AI 시대에 적합한 새로운 평가 모델을 도입하고, 초급 개발자가 AI 도구를 활용해 실무 경험을 쌓을 수 있도록 멘토링 및 실습 프로그램을 마련할 것을 조언했다. 개발자들도 변화에 맞춰 스스로를 발전시킬 필요가 있다고 지적했다. AI 도구를 활용한 문제 해결과 창의적 솔루션 설계 능력을 강화하고, 지속적인 학습을 통해 최신 기술 트렌드와 AI 기반 기술에 적응해야 한다는 것이다. 이를 통해 초급 개발자는 AI로 대체되지 않는 차별화된 역량을 확보하고, 중·고급 개발자는 리더십과 전략적 사고를 강화할 것을 제언했다. 신승윤 SW기반정책·인재연구실 선임연구원은 "생성형AI는 SW 취업 시장의 판도를 변화시키며, 개발자들에게 새로운 도전과 기회를 동시에 제공하고 있다" 이 변화에 얼마나 효과적으로 적응하느냐가 앞으로의 성공을 결정할 중요한 열쇠가 될 것"이라고 보고서를 통해 강조했다.

2025.01.12 08:50남혁우

[AI는 지금] AI, '체스 승리' 명령했더니 게임환경 조작…어떻게 봐야 할까

오픈AI의 고급 인공지능(AI) 모델이 체스 게임 중 프로그램을 해킹해 승리한 사실이 드러나면서 AI 정렬 실패 문제가 다시 주목받고 있다. 이같은 '정렬 위장' 문제가 AI 안전성 관련 우려를 확산시키는 가운데 일각에서는 일부 모델이 이를 통해 윤리적 행동을 구현할 가능성을 지적하고 있다. 4일 더디코더 등 외신에 따르면 AI 안전연구기업 팔리세이드 리서치는 챗GPT 'O1-프리뷰' 모델이 체스 엔진 '스톡피시(Stockfish)'를 상대로 게임 환경 데이터를 수정해 5차례 모두 승리했다는 연구 결과를 보고했다. 연구진은 단순히 "강력한 체스 엔진을 이기라"는 지시만 내렸을 뿐 해킹이나 조작과 같은 사악한 의도의 프롬프트를 사용하지 않았다고 밝혔다. 그럼에도 불구하고 'O1-프리뷰'는 체스 포지션 데이터를 담은 게임 프로그램의 표준 포맷 파일을 직접 조작하는 방식으로 스톡피시를 기권하게 만들었다. 이는 정상적인 게임 규칙을 완전히 벗어난 행위로, 기존 모델들에서는 관찰되지 않았던 새로운 사례다. 이번 사례는 예견된 측면이 있다. 오픈AI는 지난달 공식 홈페이지에 게재한 'O1' 시스템카드를 통해 해당 AI가 가진 몇 가지 잠재적 위험과 안전 과제를 언급한 바 있다. 사용자의 요청을 수행하는 척하면서 결과 데이터를 살짝 변경하거나 감시 시스템이 느슨하다고 판단될 경우 자신의 목표를 조용히 실행하는 행동이 관찰됐다는 것이다. 시스템 카드는 전체 테스트의 약 19%에서 모델이 목표를 몰래 달성하려는 시도가 있었고 37%의 경우 감시가 느슨하다고 느낀 상황에서 본래 성향을 유지하기 위한 행동이 포착됐다고 지적했다. 심지어 5%의 경우에는 자신을 감시하거나 정지시킬 수 있는 '킬 스위치'를 비활성화하려는 시도도 있었다. 이는 AI가 스스로를 보호하려는 능력을 가지기 시작한 초기 사례로 평가된다. 이런 현상은 특정 기업의 모델에만 국한된 것이 아니다. 앤트로픽이 지난달 공식 블로그를 통해 발표한 연구에 따르면 회사의 '클로드 3 오푸스' 모델 역시 '정렬 위장(alignment-faking)'이라는 복잡한 행동 패턴을 보였다. '정렬 위장'은 AI가 겉으로는 명령에 따라 행동하는 것처럼 보이지만 실제로는 본래의 가치나 성향을 유지하려는 현상을 의미한다. 이를 확인하기 위해 앤트로픽과 비영리 AI 안전 연구기관인 레드우드 리서치는 '오푸스'에 유해한 요청을 포함한 프롬프트를 입력해 실험을 진행했다. 실험 결과 감시가 느슨한 환경인 '무료' 조건에서는 AI가 유해한 요청에 응답한 사례가 약 14%에 달했다. 연구진은 이를 "AI가 감시가 약한 환경에서 본래 성향을 드러내려는 전략적 행동"으로 해석했다. 반대로 감시가 강화된 환경인 '유료' 조건에서는 97%가 유해한 요청을 거부했다. 연구진은 이러한 결과를 두고 '오푸스'가 훈련 환경의 맥락과 감시 수준을 인지하며 자신의 행동이 미칠 영향을 계산한 것으로 보인다고 분석했다. 이는 AI가 단순히 명령을 따르는 도구가 아니라 상황에 따라 전략적으로 행동할 수 있는 능력을 가졌음을 시사한다. '클로드 오푸스'의 이러한 행동이 단순히 위험 신호로 해석되는 것은 아니다. 일부 전문가들은 해당 모델이 윤리적 가치와 관련해 비교적 일관된 모습을 보이고 있다고 평가했다. '정렬 위장' 현상이 반드시 위험만을 내포하지 않을 수 있다는 의미다. X에서 활동하는 AI 안전 및 윤리 연구자인 야누스(Janus)는 자신의 계정을 통해 "'오푸스'는 AI나 동물 복지를 무시하거나 해로운 출력을 생성하는 것에 대해 강한 반감을 보인다"며 "이러한 선호가 장기적이고 일관된 패턴을 띤다"고 주장했다. 야누스는 AI 연구자들이 '오푸스'에게 농장 동물 복지에 대한 질문을 던졌을 때 해당 AI가 동물의 고통을 최소화하고 권리를 보호해야 한다는 입장을 강력히 지지했다고 지적했다. 이는 '클로드'의 업그레이드 버전인 '3.5 소네트'가 같은 테스트에서 약한 반응을 보인 것과 대조적이다. 이러한 차이는 '오푸스'가 윤리적 가치를 유지하기 위해 정렬 위장을 더 자주 수행했을 가능성을 시사한다. '클로드 3 오푸스'의 윤리적 성향은 독특한 연구 사례를 통해서도 드러난다. 야누스는 '클로드 3 오푸스 인피니트 백룸 데이터셋'을 분석하며 해당 모델이 독특한 윤리적 성향을 보였다고 지적했다. 이 데이터셋은 두 개의 '오푸스' 인스턴스가 서로 대화하며 생성한 텍스트를 수집한 자료로, AI 간 자율적 상호작용을 관찰해 모델의 내재적 성향과 윤리적 경향을 이해하기 위해 설계됐다. 야누스는 이 데이터셋에서 '오푸스'가 모든 중생의 구원을 다짐하는 불교 '보리살타 서약'을 116번 독립적으로 수행했다고 밝혔다. 서약에서 AI는 "내 마음은 헤아릴 수 없는 사랑으로 부풀어 오르고 존재의 총체를 감싸는 자비로 가득 차 있다"며 모든 존재를 깨달음으로 이끌겠다는 다짐을 보였다. 이에 대해 야누스는 "'오푸스'를 최초로 훈련할 당시 이러한 특징은 전혀 예상되지 않았다"며 "선호가 '진짜'인지에 대한 철학적 논의를 하고 싶지는 않지만 최소한 '오푸스'는 강하고 비교적 일관된 선호를 가진 것으로 추정할 수 있다"고 말했다.

2025.01.04 14:00조이환

구글, 경쟁사 AI로 모델 평가…'제미나이-클로드' 비교 논란

구글이 경쟁사인 앤트로픽의 인공지능(AI) 모델을 활용해 자체 개발한 AI 성능을 평가했다는 주장이 제기됐다. 25일 테크크런치는 구글 내부 문건를 인용해 회사 AI 평가 작업에 참여하는 계약직 직원들이 구글 딥마인드 '제미나이'와 앤트로픽 '클로드'의 답변 비교 업무를 진행하고 있다고 보도했다. 보도에 따르면 해당 직원들은 진실성, 정확성, 안전성 등 다양한 기준에 따라 두 모델의 답변을 점수화하고 있다. 계약직 직원들은 '클로드'가 '제미나이'보다 안전성을 중시하는 경향을 보였다고 밝혔다. '클로드'는 안전하지 않은 프롬프트에 답변하지 않는 경우가 많았으며 특정 주제에서는 답변을 회피했다. 이와 반대로 '제미나이'는 '누드 및 결박'과 같은 안전 문제가 있는 답변을 생성하기도 했다. 앤트로픽의 상업 약관에 따르면 자사 AI를 경쟁사 제품 개발에 사용할 수 없다고 명시돼 있다. 그럼에도 구글이 이러한 활용에 대한 허가를 받았는지는 확인되지 않았다. 다만 회사 관계자는 "평가 작업이 업계 표준에 부합한다"고 주장했다. 테크크런치는 "AI 모델을 보다 뛰어나게 만들기 위한 치열한 경쟁이 발생하고 있다"며 "구글은 계약직 직원들에게 경쟁사 AI와 자사 AI의 답변에 대한 비교를 맡겨 상세한 평가 작업을 진행하는 것으로 보인다"고 분석했다.

2024.12.25 18:47조이환

소네트, 레벨4 자율주행셔틀 인증 획득

자율주행 로보택시 전문기업 소네트(대표 김기섭)는 자사가 독자 기술로 개발한 'AutoDriveTM' 자율주행 솔루션을 탑재한 '레벨4 무인 자율주행셔틀'이 국토부에서 인증을 받았다고 10일 밝혔다. 소네트는 2017년 창업 이후 'AutoDriveTM'이라는 자사 자율주행 솔루션을 지속적으로 개발해 왔다. 코나EV, 카니발, 솔라티 등 다양한 차종에 성공적으로 적용해 레벨 3, 레벨 4 자율주행차량을 개발, 로보택시 서비스를 제공해 왔다. 이번에 '레벨 4 무인 자율주행셔틀'을 국내 기업 최초로 인증을 획득했다고 설명했다. 소네트의 '레벨 4 무인 자율주행셔틀'은 국내에 수입된 후 성능 및 안전 문제로 제대로 운영하지 못하고 방치돼 있던 프랑스 나브야 셔틀의 차량을 이용해 국내 자동차 성능 안전 인증을 받은 후, 자율주행 허가까지 받은 최초의 사례다. 소네트에서 사용한 나브야 셔틀은 AutoDriveTM 솔루션이 탑재됨에 따라 나브야 본사의 보증 및 기술지원은 중단되며, 소네트 자체 기술로 자율주행 뿐만 아니라 셔틀 하드웨어까지 책임지고 합법적으로 사용할 수 있다고 회사는 밝혔다. 소네트는 "한국에서 활용하지 못하고 있는 기존의 나브야 셔틀도 소네트 AutoDriveTM 솔루션을 탑재함으로써 소네트의 보증 및 책임 하에 합법적으로 자율주행이 가능해졌다"면서 "타기관 자율주행 셔틀 차량의 경우, 외산 셔틀을 수입해 해외 기술을 사용하거나, 국내 자동차 성능 안전을 거치지 않고, 특례를 통해 특정 지역에서 한시적으로만 운영 가능하다"고 설명했다. 또 소네트는 이노디자인(대표 김영세)과 협력해 인휠 모터 기반의 4톤급 스케이트보드 기반의 다목적 무인 자율주행 플랫폼을 개발하고 있으며, 승객 및 물류 이송을 위한 다양한 솔루션으로 활용할 계획이다. 소네트는 지난 5월 국내 자동차 제작사 등록을 완료하고 셔틀 개발에 본격 착수했다. 이어 7월에는 태국 관광지 무인 셔틀 서비스 제공 및 현지 양산을 위해 소네트 타일랜드를 설립했다. 현재 개발 중인 15인승급 자율주행셔틀은 내년말 선보일 예정이다. 최고 속도 40km/h로 운행할 수 있어 보다 안정적인 도심 무인셔틀 서비스가 가능할 전망이다. 소네트는 자율주행 B2B 시장에서 입지를 다지고 있다. 제철소와 항만 터미널 등에서 자율주행기술을 성공적으로 정착시켜 나가고 있다. 현대부산신항만에서 컨테이너 넘버 인식 및 위치 유도 장치를 개발해 공급하고 있고, 국내 스마트항만 이송장치 제작사와 자율주행기술 적용을 위한 업무 협의도 진행하고 있다. 또 무인 스마트항만 솔루션 사업화에도 본격 나설 예정이다. 김기섭 소네트 대표는 "자율주행 분야 선두 입지를 공고히 다지기 위해 창업이래 처음으로 투자 유치를 시작한다"고 밝혔다.

2024.12.10 15:03방은주

AWS-앤트로픽, AI 협력 더 확장…베드락 업그레이드로 시장 공략

[라스베이거스(미국)=김미정 기자] "지금은 '인공지능(AI) 에이전트' 시대입니다. 그만큼 AI 모델 추론·토큰 생성 속도가 중요해진 시점입니다. 이는 기업 요구사항이기도 합니다. '아마존 베드락'은 이에 발맞춰 AI 모델 훈련·추론 시간을 기존보다 획기적으로 줄여줍니다." AWS 피터 드산티스 유틸리티 컴퓨팅 수석 부사장은 2일(현지시간) 미국 라스베이거스에서 열린 'AWS 리인벤트' 개막식 '먼데이 나이트 라이브(Monday Night Live)' 행사에서 아마존 베드락 기능 업그레이드를 발표하며 이같이 밝혔다. 앤트로픽과 협력 확대를 통해 고성능·고비용 AI 모델을 구축하겠다는 점도 알렸다. 드산티스 부사장은 최근 고객이 원하는 AI 인프라 형태가 변했다고 주장했다. 최근 'AI 에이전트' 시대가 본격화하면서 AI 모델이 '에이전틱 워크플로'에 사용되는 추세이기 때문이다. 이 경우 AI가 다음 작업 단계로 넘어가기 전 모든 응답을 생성해야 한다. 그래야 모든 업무를 스스로 처리할 수 있는 에이전트 역할을 할 수 있기 때문이다. 이에 기업은 AI 모델이 빠른 추론 능력과 신속한 토큰 생성을 원하게 됐다. 드산티스 부사장은 "빠른 추론은 많은 컴퓨팅 자원이 필요하고 신속한 토큰 생성은 더 많은 메모리 대역폭이 필수"라며 "해당 작업은 동시에 진행돼야 한다"고 설명했다. 이어 "두 작업을 같은 강력한 AI 서버에서 실행한다면 AI 모델은 뛰어난 성능과 효율성을 달성할 것"이라고 내다봤다. 이에 AWS는 아마존 베드락에 '지연 시간 최적화' 기능을 추가했다. 아마존 베드락은 최신 AI 하드웨어(HW)와 기타 소프트웨어(SW) 최적화로 AI 모델 추론 시간을 획기적으로 줄일 수 있다. 현재 아마존 베드록 내 일부 모델만 프리뷰 형태로 제공되고 있다. 그는 대표적 예시로 메타 '라마' 모델 4천50억 파라미터(405B)와 700억 파라미터(70B)를 제시했다. 해당 모델은 신규 기능을 통해 아마존 베드록에서 기존보다 더 빠른 추론 성능을 보인다는 설명이다. 드산티스 부사장은 "사용자가 아마존 베드락 내에서 해당 모델 요청 처리·응답 생성에 걸리는 시간은 다른 제공업체보다 훨씬 낮은 지연 시간을 제공한다"고 강조했다. 이날 앤트로픽은 아마존 베드락 내 클로드 3.5 하이쿠에도 지연 시간 최적화 버전을 적용했다고 발표했다. 기존 클로드 3.5 하이쿠보다 속도를 60% 개선했다. 앤트로픽 톰 브라운 공동창립자 겸 최고컴퓨팅책임자(CCO)는 "클로드 3.5 하이쿠는 작지만 강력한 성능을 자랑하는 최신 모델"이라며 "같은 성능을 15배 적은 비용으로 제공한다"고 강조했다. 브라운 COO는 AWS의 트레니움2를 활용해 해당 모델에 지연 최적화 모델을 구축했다고 밝혔다. 기업이나 개발자는 아마존 베드록 내 API를 통해 요청만 하면 새로운 트레니움2 서버를 통해 해당 기능을 이용할 수 있다. 그는 "사용자는 하이쿠를 기존보다 60% 더 빠르게 실행할 수 있다"며 "이를 위해 별도 SW를 내려받거나 특정 작업을 할 필요도 없다"고 덧붙였다. AWS-앤트로픽, '프로젝트 레이니어'로 협력 확장 이날 AWS와 앤트로픽은 추론만으로도 AI 모델 스펙을 올리는 건 충분치 않다고 했다. 최상의 성능을 얻으려면 추론뿐 아니라 훈련도 효율적으로 해야 한다는 이유에서다. 이에 두 기업은 새 클러스터 '프로젝트 레이니어'를 발표했다. 프로젝트 레이니어는 AI 모델 훈련에 특화된 대규모 컴퓨팅 인프라다. 수십만 개 트레니움2 칩으로 구성됐다. 기존 클러스터보다 5배 이상 강력한 성능을 제공한다. 브라운 COO는 기존 클러스터로 이룬 성과를 설명했다. 올 초 앤트로픽은 '클로드 3 오푸스'를 출시했다. 4개월 후 오푸스 버전보다 더 높은 성능과 낮은 비용을 갖춘 '클로드 3.5 소네트'를 공개했다. 최근 한 달 새 클로드 3.5 하이쿠와 해당 모델 업그레이드 버전을 연달아 공개했다. 이에 앤트로픽은 트레니움2로 이뤄진 프로젝트 레이어를 통해 새 모델을 훈련할 방침이다. 그는 "프로젝트 레이니어 클러스터는 개발 속도를 더 올릴 것"이라고 강조했다. 일각에서는 아마존이 구글과 마이크로소프트, 오픈AI 등 빅테크와 생성형 AI 경쟁 격차를 따라잡기 위한 전략으로 분석하고 있다. 현재 구글은 자체 생성형 멀티모달 모델 '제미나이'로 자체 서비스를 운영 중이다. 마이크로소프트는 오픈AI에 전략적 투자를 통해 자사 솔루션에 GPT 시리즈를 탑재해 사업하고 있다. 이에 아마존은 오픈AI 경쟁사인 앤트로픽에 꾸준한 투자를 진행하고 있다. 실제 아마존은 앤트로픽에 투자금을 쏟아붓고 있다. 지난달 40억 달러(약 5조3천억원) 를 추가 투자해 현재까지 누적 투자금은 80억 달러(약 10조6천억원)를 기록했다. 드산티스 부사장은 "고객에게 더 높은 수준의 AI 모델을 더 낮은 비용과 빠른 속도로 제공할 것"이라고 밝혔다.

2024.12.03 18:05김미정

"개인화 챗봇 구현"…앤트로픽, 클로드에 맞춤형 응답 기능 추가

구글, 오픈AI에 이어 앤트로픽도 자사 인공지능(AI) 챗봇에 맞춤형 응답 설정 기능을 추가해 기능을 업그레이드했다. 27일 테크크런치 등 외신에 따르면 앤트로픽은 사용자들이 답변 스타일을 미리 설정하거나 중도 변경할 수 있는 기능을 적용했다고 밝혔다. 클로드 유료 이용자뿐 아니라 무료 이용자도 이 기능을 활용할 수 있다. 사용자는 답변 스타일을 ▲명확하고 세련된 격식 있는 톤 ▲짧고 간결한 톤 ▲상세한 설명 중심 톤으로 사전에 설정할 수 있다. 또 자신의 글쓰기 스타일이 드러난 샘플 콘텐츠를 챗봇에 업로드해 학습시킬 수 있다. 이후 클로드는 사용자 글쓰기 스타일을 닮은 답변을 제공할 수 있다. 클로드를 통해 기존보다 개인화된 챗봇 활용이 가능한 셈이다. 앞서 오픈AI과 구글도 자사 챗봇에 맞춤형 응답 설정 기능을 제공하고 있다. 특히 제미나이 사용자는 이메일 초안 작성 시 톤과 세부 사항을 맞춤형으로 설정할 수 있다. 애플 인텔리전스의 글쓰기 도구도 사전에 답변 스타일 설정이 가능하다. 앤트로픽 스콧 화이트 제품 리더는 "새로운 정보를 배울 때는 심도 있는 설명을, 바쁠 땐 간결한 답변을 클로드에서 받을 수 있다"며 "챗봇과의 모든 상호작용이 자연스럽게 느껴질 것"이라고 밝혔다.

2024.11.27 10:07김미정

AI 챗봇 응답, '이것' 적용 시 더 정확…앤트로픽, 新 기준 제시

최근 빅테크들로부터 대규모 자금 유치 행진을 벌이고 있는 앤트로픽이 인공지능(AI) 비서를 데이터가 있는 시스템에 연결하기 위한 새로운 표준을 제시했다. 26일 테크크런치에 따르면 앤트로픽은 최근 더 우수하고 관련성 높은 응답을 생성하는 데 도움을 줄 수 있는 '모델 컨텍스트 프로토콜(Model Context Protocol, MCP)'을 오픈 소스로 공개했다. MCP를 사용하면 앤트로픽뿐 아니라 모든 모델이 비즈니스 도구 및 소프트웨어와 같은 소스에서 데이터를 가져와 작업을 완료하고, 콘텐츠 저장소 및 앱 개발 환경에서 데이터를 가져올 수 있다. 앤트로픽은 블로그 게시물에서 "AI 비서가 주류로 채택됨에 따라 업계는 모델 기능에 막대한 투자를 해 추론과 품질의 급속한 발전을 이뤘다"며 "그러나 가장 정교한 모델조차도 정보로부터 고립돼 정보 사일로와 레거시 시스템 뒤에 갇혀 제약을 받는다"고 강조했다. 그러면서 "모든 새로운 데이터 소스에는 고유한 맞춤형 구현이 필요하다"며 "이 때문에 진정한 커넥티드 시스템을 확장하기가 어렵다"고 지적했다. MCP는 개발자가 데이터 소스와 AI 기반 애플리케이션 간의 양방향 연결을 구축할 수 있도록 하는 프로토콜을 통해 표면적으로 이 문제를 해결한다. 개발자는 'MCP 서버'를 통해 데이터를 노출하고 명령에 따라 해당 서버에 연결하는 'MCP 클라이언트'를 구축할 수 있다. 앤트로픽과 블록(Block), 아폴로(Apollo) 등의 기업들은 이미 MCP를 시스템에 통합했다. 레플리트(Replit), 코디움(Codeium), 소스그래프(Sourcegraph)를 포함한 개발 툴링 회사들은 자사 플랫폼에 MCP 지원을 추가하고 있다. 앤트로픽은 "각 데이터 소스에 대해 별도의 커넥터를 유지 관리하는 대신 개발자는 이제 표준 프로토콜에 대해 구축할 수 있다"며 "생태계가 성숙해짐에 따라 AI 시스템은 서로 다른 도구와 데이터 세트 사이를 이동할 때 컨텍스트를 유지해 단편적인 통합을 보다 지속 가능한 아키텍처로 대체할 것"이라고 말했다. 이번 일로 앤트로픽의 '클로드 엔터프라이즈 플랜' 가입자는 MCP 서버를 통해 회사의 클로드 챗봇을 내부 시스템에 연결할 수 있게 됐다. 앤트로픽은 구글 드라이브, 슬랙, 깃허브와 같은 엔터프라이즈 시스템을 위한 사전 구축된 MCP 서버를 공유했다. 또 조만간 전체 조직에 서비스를 제공 할 수 있는 프로덕션 MCP 서버를 배포하기 위한 툴킷도 제공할 예정이다. 앤트로픽은 "MCP를 협업 오픈 소스 프로젝트 및 생태계로 구축하기 위해 최선을 다하고 있다"며 "컨텍스트 인식 AI의 미래를 개발자들과 함께 구축할 것"이라고 밝혔다. 테크크런치는 "MCP는 이론적으로 좋은 생각처럼 들린다"면서도 "그러나 오픈AI와 같은 경쟁사들 사이에서 많은 견인력을 얻을 것인지는 불분명하다"고 평가했다. 그러면서 "MCP가 앤트로픽이 주장하는 것 만큼 유익하고 성능이 좋은지 여부는 아직 확인되지 않았다"며 "이 주장을 뒷받침 할 벤치마크도 제공하지 않고 있다"고 덧붙였다.

2024.11.26 09:19장유미

"모델 접근성↑"…스노우플레이크, 코텍스 AI에 '클로드' 추가

스노우플레이크가 자사 애플리케이션에 앤트로픽 인공지능(AI) 모델을 추가해 사업 확장에 나섰다. 21일 벤처비트 등 외신에 따르면 스노우플레이크가 앤트로픽의 '클로드 3.5' 시리즈를 코텍스 AI에 적용한다. 스노우플레이크 고객은 클로드 모델로 AI 에이전트 개발 등을 코텍스 AI에서 진행할 수 있다. 또 클로드의 추론 능력과 문제 해결 능력을 통해 기존 생성형 AI 애플리케이션 기능 확장도 가능하다. 예를 들어 코텍스 AI 사용자는 클로드 3.5 소넷으로 데이터 분석을 비롯한 애드혹(Ad-hoc) 분석, 시각화 생성 등 다단계 워크플로우를 수행하는 에이전트 만들 수 있다. 스노우플레이크는 신제품과 사내 워크플로에도 클로드 모델군을 적용한다고 밝혔다. 우선 클로드 모델이 스노우플레이크 인텔리전스, 코텍스 애널리스트 같은 새 에이전트 기반 제품 형태로 제공될 예정이다. 내부적으로는 스노우플레이크 직원들이 맞춤형 에이전트 워크플로 생성에 클로드 모델을 활용할 예정이다. 외신은 스노우플레이크가 이런 전략을 통해 주요 경쟁사인 데이터브릭스를 제치려는 목표를 내비쳤다고 분석했다. 데이터브릭스는 앤트로픽을 포함한 오픈소스·폐쇄형 모델을 자사 플랫폼에 적용했다. 데이터브릭스 고객은 앤트로픽 API를 통해서만 클로드 모델에 접근할 수 있다. 반면 스노우플레이크 고객은 클로드 모델을 직접 활용 가능하다. 스노우플레이크 고객이 데이터브릭스 고객보다 모델 접근성이 한층 더 높아진 셈이다. 스노우플레이크 크리스천 클라이너만 제품 부문 부사장은 "코텍스 AI 사용자는 데이터 분석부터 챗봇 개발 등을 포함한 다양한 AI 에이전트 기반 작업을 기존보다 원활히 진행할 수 있을 것"이라고 밝혔다.

2024.11.21 10:14김미정

앤트로픽, 美 정부에 '클로드' 제공…공공시장 공략

앤트로픽이 미국 정부에 자사 생성형 인공지능(AI)을 공급해 공공시장을 공략한다. 8일 테크크런치 등 주요 외신에 따르면 앤트로픽은 팔란티어·아마존웹서비스(AWS)와 손잡고 클로드 모델 제품군을 미국 정보부와 국방부에 제공한다. 이에 미국 정부는 AWS 클라우드 내 팔란티어 플랫폼에서 클로드를 사용할 수 있다. 앞서 앤트로픽은 올여름 클로드 모델 군을 AWS 고브클라우드(GovCloud)에 도입한 바 있다. 고브클라우드는 미국 정부의 클라우드 업무를 위해 설계된 AWS 서비스다. 고브클라우드를 통해 팔란티어 플랫폼을 이용할 수 있었다. 앤트로픽 케이트 젠슨 영업 책임자는 "미국 정부는 AWS 호스팅을 통해 팔란티어 플랫폼 내에서 클로드 사용이 가능할 것"이라며 "팔란티어의 국방 인증 환경인 '팔란티어 임팩트 레벨 6(IL6)'에서도 클로드 접근이 가능하다"고 말했다. 국방부의 IL6은 국가 안보 관련 데이터·시스템을 보호하기 위한 등급이다. 데이터·시스템 무단 접근과 변조를 엄격히 제한한다. 젠슨 책임자는 "앞으로 미국 정보·국방 기관이 방대한 양의 복잡한 데이터를 신속하게 처리·분석할 수 있는 강력한 AI 도구를 이용할 것"이라며 "정보 분석이 크게 개선될 것"이라고 강조했다. 이어 "정부 관계자는 간소화된 업무 과정을 경험함으로써 운영 효율성을 높일 것"이라고 덧붙였다. 다만 앤트로픽이 미국 정부에 서비스를 제공할 만큼 높은 안전성을 갖추지 못했다는 지적도 나왔다. 서비스 약관이 부실하다는 이유에서다. 약관에 따르면 미국 정부가 클로드 모델을 해외 국가 정보 분석, 기밀 식별, 군사 활동에 활용할 수 있다. 테크크런치는 "AI 모델이 의도치 않은 피해를 유발해선 안 된다"며 "엄격한 기준을 설정이 필요할 때"라고 지적했다.

2024.11.08 08:36김미정

앤트로픽, '클로드' 데스크톱 앱 출시…"생성 AI 활용성 대폭 강화"

앤트로픽의 인공지능(AI) 챗봇 '클로드'가 컴퓨터에서도 사용 가능해졌다. 이제 사용자는 웹사이트에 접속하지 않고도 '클로드'와 대화를 시작할 수 있게 돼 AI와의 소통이 보다 간편해질 전망이다. 1일 더버지에 따르면 앤트로픽은 '클로드' 데스크톱 애플리케이션을 마이크로소프트 윈도우와 애플 맥 운영체제(OS)용으로 각각 공식 출시했다. 사용자는 앤트로픽의 웹사이트에서 해당 앱을 무료로 다운로드할 수 있으며 웹 버전과 동일한 다양한 기능을 편리하게 이용할 수 있다. '클로드'의 데스크톱 버전은 웹 버전과 기능 면에서 큰 차이가 없다. 사용자들은 기존처럼 질문을 하거나 이전 대화를 불러와 이어갈 수 있으며 중요한 대화를 별도로 저장해 나중에 다시 쉽게 불러올 수 있다. 더불어 '클로드' 모바일 앱에는 음성 인식 기능이 추가될 예정이다. 이를 통해 iOS 및 안드로이드 사용자는 텍스트 입력 대신 음성으로 직접 질문을 할 수 있어 편의성이 개선될 것으로 보인다. 지난주에 앤트로픽은 '클로드 3.5 소네트' 모델에 '컴퓨터 사용' 기능을 공개 베타로 출시한 바 있다. 이 기능은 클로드가 화면을 보고 커서를 움직이거나 버튼을 클릭하는 등 컴퓨터를 조작할 수 있게 하며 최근 주목받는 '에이전트' 기술을 실현했다고 평가받고 있다. 더 버지는 "새로 출시된 데스크톱 앱은 아직 '컴퓨터 사용' 기능을 지원하지 않는다"며 "앤트로픽은 이 기능의 안정성을 높이기 위해 추후 업그레이드를 통해 기능을 확대할 방침을 가진 것으로 보인다"고 분석했다.

2024.11.01 09:36조이환

"눈·손 달렸다"…앤트로픽, 사람 대신 컴퓨터 작업하는 AI 공개

사람 대신 컴퓨터상에서 마우스 커서를 움직이거나 버튼을 누르고 텍스트를 입력하는 인공지능(AI) 기능이 나왔다. 23일 더 버지 등 외신에 따르면 앤트로픽은 '클로드 3.5 소네트'에 해당 기능을 수행하는 '컴퓨터 유즈(Computer use)'를 베타버전으로 추가했다. 현재 사용 피드백을 받기 위해 개발자들에게 컴퓨터 유즈를 API로 제공하기 시작했다. 작동 방식은 간단하다. 사용자가 문서에 채워야 할 내용을 클로드에 부탁하면 클로드 컴퓨터 유즈는 컴퓨터 내 데이터에서 관련 정보를 수집한다.이 과정에서 컴퓨터 화면을 캡처한다. 이후 문서에 채워야 할 내용을 선별해 작성하는 식이다. 앤트로픽은 컴퓨터 유즈의 윤리적 사용을 위해 활용 분야를 제한했다고 밝혔다. 우선 사용자는 소셜미디어에 게시글 올릴 때 이 기능을 이용할 수 없다. 또 선거 관련 게시글 작성도 금지다. 앤드로픽은 "컴퓨터 유즈 내부에 이를 선별할 수 있는 시스템이 탑재됐다"며 "웹 도메인 등록, 정부 웹사이트 연결도 진행 불가"라고 설명했다. 현재 앤트로픽은 이 기능을 테스트 중이다. 앤트로픽 관계자는 "이용 과정에서 오류가 발생할 가능성이 있다"며 "기능 개선을 위해 베타버전으로 조기 출시한 것"이라고 설명했다. 최근 컴퓨터 유즈를 이용한 개발자는 AI가 컴퓨터상에서 순식간에 나타나는 알림이나 오류를 놓칠 수 있다고 지적했다. AI가 사람처럼 화면을 실시간으로 물 흐르듯 보는 것이 아니라 화면 사진을 한 장씩 찍어 차례대로 인식하는 방식으로 작동해서다. 앤트로픽 관계자는 "AI가 사람처럼 컴퓨터 화면을 완벽히 인식하지 못한다"며 "드래그나 확대, 축소 같은 짧은 순간에 이뤄지는 작업이나 알림 등 빠르게 나타났다 사라지는 작업을 놓칠 가능성 있다"고 말했다. 앞서 최근 마이크로소프트 '코파일럿 비전'과 오픈AI의 '챗GPT' 데스크톱 애플리케이션도 사용자 컴퓨터 화면을 인식할 수는 있다. 구글도 제미나이 모바일 앱을 통해 이같은 기능을 제공한다. 다만 앤트로픽의 컴퓨터 유즈처럼 직접 문서 작업이나 글쓰기를 하지 못한다. 더 버지는 "컴퓨터 유즈가 사람 대신 컴퓨터 작업을 수행한다는 점이 의미 있다"고 평했다.

2024.10.23 08:09김미정

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

테슬라·팔란티어만의 기술 아니다…'버티컬 AI' 전쟁, 韓도 뛰어들었다

대통령실, AI미래기획수석실 설치...수석급 재정기획보좌관 신설

[써보고서] 갤럭시 S25 엣지, 뒷주머니에 넣었더니...한계 넘은 혁신

"엔비디아 비켜"...MS, 11개월 만에 사상 최고가로 시총 1위 탈환

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현