• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'컴퓨터 유즈'통합검색 결과 입니다. (3건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"AI 에이전트, 우리가 주도"…구글, 더 똑똑한 '제미나이 2.0'으로 승부수

구글이 멀티모달(복합 정보처리) 능력이 향상된 차세대 인공지능(AI) 모델을 앞세워 급성장하고 있는 'AI 에이전트(비서)' 시장 공략에 본격 나선다. 챗봇을 넘어 사용자 대신 행동까지 수행하는 'AI 에이전트'가 AI 시대의 새로운 트렌드로 자리 잡으면서 글로벌 빅테크들의 기술 경쟁도 한층 강화된 모습이다. 12일 블룸버그통신 등에 따르면 구글은 지난 11일(현지 시간) '제미나이 2.0'을 새롭게 출시했다. 구글의 새 AI 모델 출시는 올해 2월 '제미나이 1.5'를 내놓은 지 약 10개월 만이다. 자체 개발한 6세대 칩(TPU)인 '트릴리움(Trillium)'을 기반으로 구축된 '제미나이 2.0'은 구글이 지금까지 선보인 AI 모델 중 가장 뛰어난 성능을 가진 것으로 평가됐다. 텍스트는 물론 이미지와 동영상 기능을 갖춘 멀티모달 기능도 전작 대비 한층 더 개선된 것으로 나타났다. 주요 벤치마크에선 '제미나이1.5 프로'에 비해 속도가 2배 빠른 것으로 평가됐다. 구글은 이날부터 '제미나이2.0 플래시'를 개발자를 위한 플랫폼인 '구글 AI 스튜디오'와 기업용 플랫폼인 '버텍스 AI'에서 실험 모델로 제공한다. 이 중 '플래시' 모델은 울트라, 프로, 나노 등 매개변수 크기에 따른 제미나이 제품군 가운데 프로 모델을 경량화한 모델로, 지난 1.5 버전부터 선보였다. 구글은 '제미나이 2.0'의 고급 추론 기능을 10억 명이 이용하는 AI 검색 서비스 'AI 오버뷰'에도 적용할 예정이다. 수학 방정식이나 멀티모달 질문 및 코딩 등 더 복잡한 질문도 처리할 수 있도록 할 계획이다. 또 구글 검색을 시작으로 전 제품에 빠르게 '제미나이 2.0'을 적용될 계획이다. 순다 피차이 구글 최고경영자(CEO)는 "(이번 일로) 범용 어시스턴트라는 우리의 비전에 더 가까이 다가갈 수 있게 됐다"고 말했다. 구글은 '제미나이 2.0'을 기반으로 한 새로운 AI 에이전트도 이날 함께 선보였다. 실험 단계인 '프로젝트 마리너'는 '제미나이 2.0'을 탑재해 브라우저 화면을 이해하고 추론하는 등 복잡한 작업을 지원한다. 개발자를 위한 AI 에이전트 '줄스'는 코딩 작업을 도와준다. 지난 5월 선보인 '프로젝트 아스트라'에도 '제미나이 2.0'이 탑재됐다. 이에 따라 이용자와의 대화가 더욱 자연스러워지고 응답 속도가 빠르며 최대 10분간 대화 내용을 기억하는 등 기억력도 강화됐다. 또 다국어로 대화하는 것뿐 아니라 구글 검색과 구글 렌즈, 구글 맵스 등 다양한 기능도 활용할 수 있게 됐다. 구글은 제미나이 애플리케이션뿐 아니라 안경 형태의 폼팩터에서도 프로젝트 아스트라를 구현할 예정이다. 데미스 허사비스 구글 딥마인드 최고경영자(CEO)는 "'제미나이 2.0'은 다양한 기능 조합, 더욱 자연스러운 상호작용, 빠른 응답 속도, 복잡한 작업 처리 능력을 통해 완전히 새로운 차원의 에이전트형 기반 경험을 제공한다"며 "아직 항상 정확하지는 않고 작업을 완료하는 속도가 느리지만 시간이 지나며 빠르게 개선될 것"이라고 설명했다. 구글은 이날 '제미나이 2.0'을 장착해 복잡한 연구 보고서 작성을 도와주는 AI 어시스턴트 '딥 리서치'도 함께 공개했다. AI를 활용해 복잡한 주제를 탐구한 뒤 결과를 이해하기 쉬운 보고서로 제공하는 것이 특징이다. '딥 리서치'는 유료 구독제인 제미나이 어드밴스드를 통해 이용할 수 있다. 이번 일로 주요 글로벌 빅테크들의 AI 에이전트 경쟁은 한층 더 치열해질 것으로 보인다. 현재 AI 에이전트 개발에 두각을 나타내는 곳은 마이크로소프트(MS)로, 오픈AI와 손잡고 AI 비서 '코파일럿'을 공개한 데 이어 올해 11월에는 연례 행사인 '이그나이트 2024'를 통해 '자율형 AI 에이전트' 기술력을 뽐냈다. 아마존 역시 이달 초 개최한 'AWS 리인벤트 2024'에서 새로운 에이전트 기능을 선보여 눈길을 끌었다. 올해 공개한 기업용 AI 에이전트인 '아마존 Q 비즈니스'에 워크 플로우 자동화 기능을 추가한 것으로, 기업들이 사내 업무를 자동화 할 수 있게 만들었다. 이 외에 새 대규모언어모델(LLM) '노바'뿐 아니라 '노바 스피치 투 스피치 모델'과 '애니 투 애니 모델' 등 멀티모달 모델도 공개했다. 앤트로픽이 만든 AI 에이전트 기능 '컴퓨터 유즈'도 업계의 주목을 받고 있다. 이는 앤트로픽의 최신 AI 모델인 '클로드 3.5 소네트'를 기반으로 작동하는 AI 에이전트로, 키보드와 마우스 입력 등을 조작할 때 '인간처럼' 스스로 수행한다. '챗GPT' 등으로 AI 시장을 주도하고 있는 오픈AI도 코드명 '오퍼레이트'로 알려진 AI 에이전트 출시를 준비 중이다. 세라 프라이어 오픈AI 최고재무책임자(CFO)는 최근 파이낸셜타임스(FT)와의 인터뷰에서 "정보 수집과 예약, 상품 구매 등을 웹에서 실행하는 챗봇 비서 같은 'AI 에이전트'의 출시가 내년의 핵심 초점"이라며 "사람들의 일상을 돕는 매우 성공적인 에이전트가 배치되는 것을 보게 될 것"이라고 밝혔다. 이처럼 빅테크들이 AI 에이전트 시장에 경쟁적으로 나온 것은 성장성이 높아서다. 글로벌 시장조사기관 그랜드뷰리서치에 따르면 지난해 AI 에이전트 시장 규모는 약 58억2천만 달러로, 2030년까지 연평균 42.8% 성장할 것으로 전망된다. 2030년 시장 규모는 약 705억3천만 달러(약 100조원)로 전망된다. 하지만 해외 빅테크들과 달리 국내 업체들의 대응은 다소 더디다. 네이버, 카카오는 아직 본격적으로 서비스를 선보이지 못하고 있고, 통신사들이 운영하는 AI 에이전트는 부가 서비스 수준에 그치고 있다는 평가다. 업계 관계자는 "글로벌 빅테크들에 비해 국내 업체들의 움직임이 더디면서 AI 에이전트 시장에서 기술 격차가 더 벌어질 것으로 보인다"며 "빅테크들은 자체 LLM을 기반으로 다양한 AI 서비스 출시와 함께 수익화에 나서고 있지만, 국내 업체들은 갈수록 입지가 줄어드는 분위기"라고 말했다.

2024.12.12 10:03장유미

명령하면 AI가 컴퓨터 작업 척척…"가성비 낮고 보안 위험"

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 사람 대신 컴퓨터에서 웹 서핑부터 예약, 문서 작성을 대신 처리해 주는 생성형 인공지능(AI)이 높은 보안 위험과 낮은 가성비로 지적받았다. 생성형 AI가 모든 업무 과정을 관리할 뿐 아니라 이때 발생하는 텍스트 이해·처리 과정이 비효율적이라는 이유에서다. 11일 업계에 따르면 최근 미국 빅테크가 공개한 이런 생성형 AI 기능에 보안 이슈와 비용 문제가 끊이지 않을 것이란 전망이 이어지고 있다. 겉으로 보기에 완벽한 '자비스' 역할을 하는 것처럼 보이지만 실상 오류투성이에 돈 먹는 하마 역할을 할 것이란 의미다. 앤트로픽은 이달 초 사람 대신 웹 서핑을 비롯한 호텔 예약, 자료 조사, 문서 작성 등 업무를 명령어 한 줄 만으로 처리해 주는 AI 시스템 '컴퓨터 유즈'를 공개했다. 현재 앤트로픽 클로드에 탑재됐다. 클로드는 사람 대신 반복적이고 지루한 업무를 컴퓨터 유즈로 자동화할 수 있다. 기존에는 사용자가 과정마다 별도 프롬프트를 입력해 다음 명령을 생성형 AI에 줬다면, 컴퓨터 유즈는 추가 명령 없이 작업을 끝까지 수행할 수 있다. 예를 들어 사용자가 클로드에게 컴퓨터에 흩어져 있는 데이터를 모아 특정 공급업체 양식을 작성해 달라고 요청하면, 클로드는 화면 스크린샷을 통해 필요한 정보를 찾는다. 우선 고객관계관리(CRM) 시스템에 접속해 해당 업체를 검색한 뒤 데이터를 자동으로 옮겨 양식 작성을 수행한다. 이 과정에서는 사용자의 추가 명령어가 필요 없다. 구글도 지난 7일 AI 프로토타입 '자비스'를 크롬 웹 스토어에 일시적으로 공개했다. 자비스는 사용자가 브라우저를 통해 필요한 작업을 자동으로 처리하게 돕는 AI다. 앤트로픽의 컴퓨터 유즈와 비슷한 서비스다. "사람 눈·손 필요…토큰 비용 천정부지" 업계에서는 해당 기능에 보안 이슈가 끊이지 않을 것이란 분석이 나왔다. 생성형 AI가 컴퓨터상에서 직접 마우스 이동·클릭을 비롯한 웹사이트 이동, 문서 관리 등을 직접 통제하기 때문이다. 이에 갑작스런 오류와 팝업창 대응을 적절히 수행하지 못할 것이란 우려다. 최근 시연에서도 컴퓨터 유즈가 사용자 의도와 다른 웹사이트에 접속하거나 관련 없는 시스템을 작동시키는 사례까지 등장했다. 생성형 AI가 사용자 명령어에 맞게 코딩을 시연하다가 갑자기 미국 옐로스톤 국립공원 사진을 둘러보기 시작한 것이 대표 예시다. 앤트로픽의 컴퓨터 유즈 테스트 버전을 이용해 본 한 개발자는 "생성형 AI가 모든 컴퓨터 시스템을 장악하는 셈"이라며 "사람이 AI의 모든 움직임을 지속적으로 체크해야위험을 피할 수 있을 것"이라고 지디넷코리아에 밝혔다. 또 "컴퓨터 유즈는 갑작스럽게 나타나는 오류나 팝업창을 신속히 처리하지도 못한 상태"라고 덧붙였다. 업계에서는 컴퓨터 유즈가 상용화돼도 기업이 이를 적극적으로 활용할지 미지수라고 내다봤다. 가장 큰 걸림돌은 작동 과정서 발생하는 토큰 비용이다. 보통 컴퓨터 유즈는 사람 눈처럼 컴퓨터 화면을 자연스럽게 인식할 수 없다. 실시간으로 캡처본을 찍어내는 식으로 콘텐츠를 볼 수 있다. 스크린샷을 통해 화면 내 문자를 인식하고 정보를 찾을 수 있다. 이 개발자는 "컴퓨터 유즈는 스크린샷으로 정보 인식·처리에 생기는 모든 텍스트를 토큰 단위로 처리한다"며 "이 과정에서 불필요한 토큰 비용이 급격히 증가한다"고 지적했다. 또 "화면 인식 중 불필요한 캡처·중복 스크린샷도 걸러내지 못한다"며 "가성비가 낮다"고 덧붙였다.

2024.11.11 14:49김미정

"눈·손 달렸다"…앤트로픽, 사람 대신 컴퓨터 작업하는 AI 공개

사람 대신 컴퓨터상에서 마우스 커서를 움직이거나 버튼을 누르고 텍스트를 입력하는 인공지능(AI) 기능이 나왔다. 23일 더 버지 등 외신에 따르면 앤트로픽은 '클로드 3.5 소네트'에 해당 기능을 수행하는 '컴퓨터 유즈(Computer use)'를 베타버전으로 추가했다. 현재 사용 피드백을 받기 위해 개발자들에게 컴퓨터 유즈를 API로 제공하기 시작했다. 작동 방식은 간단하다. 사용자가 문서에 채워야 할 내용을 클로드에 부탁하면 클로드 컴퓨터 유즈는 컴퓨터 내 데이터에서 관련 정보를 수집한다.이 과정에서 컴퓨터 화면을 캡처한다. 이후 문서에 채워야 할 내용을 선별해 작성하는 식이다. 앤트로픽은 컴퓨터 유즈의 윤리적 사용을 위해 활용 분야를 제한했다고 밝혔다. 우선 사용자는 소셜미디어에 게시글 올릴 때 이 기능을 이용할 수 없다. 또 선거 관련 게시글 작성도 금지다. 앤드로픽은 "컴퓨터 유즈 내부에 이를 선별할 수 있는 시스템이 탑재됐다"며 "웹 도메인 등록, 정부 웹사이트 연결도 진행 불가"라고 설명했다. 현재 앤트로픽은 이 기능을 테스트 중이다. 앤트로픽 관계자는 "이용 과정에서 오류가 발생할 가능성이 있다"며 "기능 개선을 위해 베타버전으로 조기 출시한 것"이라고 설명했다. 최근 컴퓨터 유즈를 이용한 개발자는 AI가 컴퓨터상에서 순식간에 나타나는 알림이나 오류를 놓칠 수 있다고 지적했다. AI가 사람처럼 화면을 실시간으로 물 흐르듯 보는 것이 아니라 화면 사진을 한 장씩 찍어 차례대로 인식하는 방식으로 작동해서다. 앤트로픽 관계자는 "AI가 사람처럼 컴퓨터 화면을 완벽히 인식하지 못한다"며 "드래그나 확대, 축소 같은 짧은 순간에 이뤄지는 작업이나 알림 등 빠르게 나타났다 사라지는 작업을 놓칠 가능성 있다"고 말했다. 앞서 최근 마이크로소프트 '코파일럿 비전'과 오픈AI의 '챗GPT' 데스크톱 애플리케이션도 사용자 컴퓨터 화면을 인식할 수는 있다. 구글도 제미나이 모바일 앱을 통해 이같은 기능을 제공한다. 다만 앤트로픽의 컴퓨터 유즈처럼 직접 문서 작업이나 글쓰기를 하지 못한다. 더 버지는 "컴퓨터 유즈가 사람 대신 컴퓨터 작업을 수행한다는 점이 의미 있다"고 평했다.

2024.10.23 08:09김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

이재명 대통령 "AI·반도체·재생에너지·문화 투자 아끼지 않겠다"

마디마다 구동기 탑재…정교한 로봇손에 숨겨진 비밀

삼성전자, HBM3E 12단 라인 가동률 축소…엔비디아 공급 논의 길어지나

KT, 한국적AI '믿음2.0' 오픈소스 공개...국내 AI 대중화

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.