• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'딥마인드'통합검색 결과 입니다. (40건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] 오픈AI '비영리' 유지…AI 산업 기준선 바꿀까?

오픈AI가 비영리 지배구조를 유지하기로 하면서 외부 투자와 기술 확장을 위해 추진해온 영리화 전환 계획은 사실상 철회된 모양새다. 이에 주요 인공지능(AI) 경쟁사들과의 전략적 구도에도 변화가 있을지 주목된다. 11일 업계에 따르면 오픈AI는 최근 자사의 영리 부문(OpenAI LP)을 별도 투자자 중심 법인으로 전환하는 계획을 중단하고 기존 비영리 이사회가 실질적 통제권을 유지하는 구조를 지속하기로 결정했다. 앞서 오픈AI는 지난해 말까지 영리 법인으로 전환하지 않으면 소프트뱅크 등의 대규모 투자 조건 일부가 무산될 수 있다는 압박을 받아왔다. 그럼에도 검찰의 비영리 목적 위반 조사 가능성, 외부 반발, 일론 머스크의 계약 위반 소송 등이 복합적으로 작용하면서 구조 개편 속도 조절에 들어간 것으로 보인다. 이같이 수년 간 이어진 조직 전환 논의의 급제동은 글로벌 AI 생태계 내 경쟁 구도 재편에도 영향을 미칠 것으로 보인다. 구글·메타·앤트로픽 등 경쟁사들은 자체적으로 업계 1위인 오픈AI를 견제하는 전략을 내세우며 차별화에 나서고 있기 때문이다. 오픈AI 역시 마이크로소프트(MS)와의 기존 수익 공유 구조를 일부 축소하려는 논의를 병행하고 있어 클라우드·AI 모델 생태계의 균형도 중장기적으로 영향을 받을 것으로 보인다. 공익으로 회귀한 오픈AI…정치·법률·업계 반발, '영리화 철회' 이끌었다 오픈AI의 이번 결정에는 정치적 압박이 핵심적으로 작용했다. 미국 캘리포니아·델라웨어주 검찰은 최근 오픈AI 이사회를 상대로 비영리 공익 목적 위반 여부를 검토하고 있다고 밝혔던 바 있다. 회사 구조 전환이 법률상 공익법인의 범위를 벗어날 수 있다는 지적이 수면 위로 올라왔다. 정책 전문가들과 AI 윤리 연구자들 역시 집단적으로 반발해 왔다. 지난해 4월에는 수십 명의 AI 연구자, 전직 오픈AI 직원, 정책 고문들이 서명한 '수익을 위한 것이 아니다(Not for Private Gain)' 공개 서한을 보냈다. 이들은 "오픈AI가 인류 전체에 유익하도록 해야 한다"고 경고했다. 해당 서한은 오픈AI 공동 창업자인 샘 알트먼과 그렉 브록먼이 과거에 남긴 발언도 그대로 인용했다. 그들이 언급한 "우리는 주주가 아니라 인류 전체에만 책임진다"나 "우리가 AGI를 만드는 게 목표가 아니라 범용인공지능(AGI)이 잘 작동하게 만드는 게 목표"라는 문장은 현재의 영리화 계획이 창업 당시의 정신과 정면으로 충돌하고 있음을 지적했다. 일론 머스크의 소송도 원인이 됐다. 지난 2010년대에 오픈AI의 파트너였던 머스크는 회사가 본래의 비영리 약속을 어기고 MS와 손잡으며 수익 중심 구조로 변질됐다고 주장했다. 법원은 오픈AI 측의 소송 기각 요청을 받아들이지 않았고 본안 재판은 내년 3월로 예정돼 있었다. 소송의 핵심 근거로 머스크는 "오픈AI는 원래 구글 딥마인드가 AGI를 장악하는 것을 방지하기 위한 오픈소스 대안으로 만든 비영리 조직이었지만 지금은 마이크로소프트에 장악당한 최대 이윤 기업이 됐다"며 "공익 목적이 사라졌다"고 주장했다. 사회적 여론의 압박도 한 몫했다. 제프리 힌턴, 마크 저커버그 등 업계 주요 인사들이 영리화 반대 입장을 공개적으로 밝혔기 때문이다. 특히 저커버그는 "AI 권력을 소수가 독점해서는 안 된다"고 발언한 바 있다. 이와 함께 투자자들 사이에서도 균열이 발생했다. 소프트뱅크는 앞서 연말까지 오픈AI가 영리 구조로 전환하지 않으면 최대 400억 달러(약 52조원)의 투자금 중 절반만 집행할 수 있다는 조건을 내걸었지만 다른 투자자들은 비영리 이사회의 통제권 약화에 따른 평판 리스크를 우려했다. 이같은 상황 속에서 오픈AI는 공익법인(PBC)이라는 타협 구조를 택했다. 수익은 열어두되 비영리 이사회의 감독을 그대로 유지하는 방식이다. 투자자들의 이익 추구와 공공 책임 간 균형을 겨냥한 절충안이다. 또 하나의 핵심 요인은 마이크로소프트(MS) 독점 프레임이다. 현재 구조상 오픈AI는 MS의 클라우드 인프라에 대부분 의존하고 있으며 기술 사용권과 수익 배분에서도 MS가 독보적 위치를 점하고 있다. 이런 구조는 미국뿐 아니라 유럽·아시아 규제 당국의 감시를 자극할 수 있다는 우려도 있었다. 오픈AI 입장에서는 비영리 지배구조를 유지함으로써 기술 독립성과 파트너 확장 가능성을 모두 열어두는 셈이 된다. 브렛 테일러 오픈AI 이사회 의장은 "우리는 비영리 이사회의 통제를 유지하기로 결정했다"며 "이사회의 방향은 전 세계 시민과 전문가, 규제기관의 의견을 반영한 결과"라고 밝혔다. AI 생태계 재편 신호탄?…경쟁사 전략 '재정의' 되나 오픈AI가 비영리 체제를 유지하겠다고 밝힌 뒤 AI 경쟁사들의 기존 전략이 다시 주목받고 있다. 지금까지와는 다른 기준선이 생기면서 각자 선택한 노선이 어떤 결과를 가져올지에 대한 해석도 새롭게 나오고 있다. 구글은 일찌감치 조직 개편을 단행하며 속도전에 대비해왔다. AI 조직인 브레인과 딥마인드를 통합하고 거대언어모델 '제미나이' 시리즈의 연구·제품 개발을 하나로 묶었다. 데미스 하사비스 딥마인드 CEO는 과거 "오픈AI가 해커 같은 민첩성으로 모델 상용화를 밀어붙인 결과 우리가 먼저 개발한 기술에서도 주도권을 빼앗겼다"고 말한 바 있다. 이에 최근 구글의 행보도 매서워지고 있다. '제미나이' 시리즈는 점유율이 꾸준히 상승 중이며 마케팅 강화는 물론 하드웨어 연계 전략도 병행하고 있다. 자체 AI 반도체인 텐서처리장치(TPU)를 통해 모델 효율성도 높이고 있으며 최신 버전인 '제미나이 2.5'는 완성도 면에서 긍정적인 평가를 받고 있다. 메타는 '라마' 시리즈를 통해 오픈소스 전략을 꾸준히 고수해왔다. 이 같은 노선은 오픈AI의 이번 결정 이후 더욱 주목받고 있다. AI 기술의 소수 기업 독점을 경계해온 메타의 메시지가 다시 부각된 것이다. 오픈AI가 비영리 지배구조를 유지하기로 하면서 메타의 '공익 중심 개방 전략'에도 한층 설득력이 실리고 있다. 마크 저커버그 메타 CEO는 "AI의 기회는 모두에게 돌아가야 한다"며 "우리는 모델을 팔아서 수익을 내는 구조가 아니다"라고 말한 바 있다. 앤트로픽 역시 원래부터 오픈AI의 상업화에 대한 우려에서 출발한 조직이다. 공익법인(PBC) 구조를 채택했고 '헌법적 AI' 같은 안전 중심 모델 설계 원칙도 강조해왔다. 최근 오픈AI 안전 인력의 이탈과 더불어 그간의 입장이 정당화되는 흐름이 나타나고 있다. 정책과 규제 측면에서도 움직임이 감지된다. 미국 연방거래위원회(FTC), 유럽연합(EU) 등 주요 규제기관은 초거대 AI 모델과 클라우드 독점 구조를 함께 검토 중이다. 오픈AI의 구조 재조정이 이들 규제 당국과의 마찰 가능성을 줄였다는 업계의 분석도 나온다. AI 투자 생태계에서도 시각이 엇갈리고 있다. 소프트뱅크를 비롯한 일부 투자자는 여전히 오픈AI의 수익성과 확장력을 믿고 있지만 다른 자본은 비영리 체제의 유지가 장기적 평판 관리에 긍정적이라는 평가를 내리고 있다고 전해지고 있기 때문이다. '이익'과 '공익' 사이 절충 지점에 대한 수용 폭이 넓어진 셈이다. 업계 관계자는 "오픈AI의 영리화 철회는 단순한 조직 구조의 변화가 아니라 AI 산업 전체의 방향성을 재조명하는 계기가 됐다"며 "최근 경쟁이 격화된 상황에서 이번 결정은 AI 기술의 발전 속도뿐 아니라 안전과 공공성 측면에도 적지 않은 영향을 미칠 것으로 보인다"고 덧붙였다.

2025.05.11 10:05조이환

[AI는 지금] 제미나이·클로드가 치고 올라와도…사람들 머릿속 AI, 여전히 '챗GPT'

생성형 인공지능(AI) 시장이 치열한 경쟁 구도로 접어든 가운데 일반 사용자에게 'AI' 하면 가장 먼저 떠오르는 브랜드는 여전히 오픈AI의 '챗GPT'인 것으로 나타났다. 다만 구글의 '제미나이'와 앤트로픽의 '클로드'가 빠르게 점유율을 끌어올리며 추격하고 있어 긴장감도 함께 높아지고 있다. 8일 업계에 따르면 '챗GPT'는 지난 2월 기준 주간 사용자 수 4억명, 월간 활성 사용자 수 약 6억명을 기록 중이다. 지난 2022년 출시 직후 5일 만에 100만명을 확보했던 이 서비스는 현재 전 세계 161개국에서 서비스되고 있으며 하루 평균 쿼리 처리량만 약 1천만 건에 달한다. 월간 웹 방문 수는 약 51억9천만 회에 이르며 오픈AI는 연말까지 사용자 수를 10억명까지 끌어올린다는 목표다. '챗GPT'는 브랜드 인지도 측면에서도 경쟁자들과 확연한 격차를 보이고 있다. 미국 성인의 72.1%가 챗GPT를 알고 있으며 이 중 30.7%는 실제 사용 경험이 있다고 답했다. 젊은 세대에서는 이 현상이 더 두드러진다. Z세대와 밀레니얼 AI 도구 사용자 가운데 절반 가까이가 '챗GPT'를 선호 브랜드로 꼽고 있기 때문이다. 서울 소재 모 대학교 4학년생은 '챗GPT' 사용 경험에 대해 묻는 기자의 질문에 "처음에는 리포트 과제 때문에 무료 버전으로 잠깐 썼는데 지금은 그냥 일상에서 빠질 수 없는 앱이 돼버렸다"며 "올해부터는 구독해서 모르는 게 있을 때마다 검색보다 먼저 '챗GPT'에 물어보게 된다"고 말했다. 지난 3월에는 일명 '지브리 사태'로 불리는 바이럴 트렌드가 '챗GPT' 사용자 증가에 기름을 부었다. 오픈AI가 'GPT-4o' 기반 이미지 생성 기능을 출시한 직후 사용자들이 스튜디오 지브리 스타일의 이미지를 대량 생성하며 소셜미디어에서 폭발적 반응을 얻은 것이다. 오픈AI 측에 따르면 해당 시기 1시간 만에 신규 이용자 100만명이 유입됐으며 주간 활성 사용자 수는 1억5천만명을 돌파했다. 한국에서도 일일 사용자 수가 125만명을 기록하며 역대 최대치를 찍었다. 기술적 업데이트 하나가 대중 문화 트렌드와 맞물려 실사용자 증가로 직결된 대표 사례로 분석된다. 이같은 상황 속에서 구글은 자사 생성형 AI 모델 '제미나이'를 대중 시장에 안착시키기 위해 K팝 스타와의 협업, 삼성 기기 기본 탑재 등 전방위 전략을 총동원하고 있다. '챗GPT'가 선점한 브랜드 지위를 따라잡기 위해 대중 노출을 극대화하는 방식으로 정면 승부에 나선 셈이다. 구글에 따르면 '제미나이'는 지난 3월 기준 월간 활성 사용자 수 3억5천만명을 기록했다. 이러한 폭발적인 성장세는 기존 서비스에의 깊은 통합과 공격적인 콘텐츠 마케팅에 의해 촉진됐다. 구글은 워크스페이스, 유튜브, 크롬 등 자사 핵심 플랫폼에 제미나이를 내장해 사용자가 별도 앱을 설치하지 않아도 자연스럽게 AI 기능에 접근할 수 있도록 설계하고 있다. 브랜드 인지도 강화를 위한 마케팅도 공격적이다. 구글은 최근 K팝 그룹 르세라핌과의 협업으로 뮤직 콘텐츠에 제미나이를 접목한 영상을 공개하고 챌린지 형식의 참여형 캠페인을 병행해 MZ세대의 눈높이에 맞춘 노출 전략을 구사하고 있다. AI가 일상과 문화 콘텐츠 속에 자연스럽게 녹아드는 구조를 통해 '익숙함' 자체를 브랜드 자산으로 끌어올리려는 시도다. 하드웨어 채널 확보에도 속도를 내고 있다. 구글은 삼성의 최신 스마트폰 기종에 제미나이를 기본 탑재해 초기 사용자 경험에서부터 AI와의 상호작용이 시작되도록 설계했다. 별도 앱을 실행할 필요 없이 기본 설정 단계나 홈화면 위젯 등에서 바로 접근할 수 있도록 구현하면서, 기능 노출 자체를 사용자 습관으로 전환시키는 데 집중하고 있다. 이 가운데 앤트로픽은 '클로드'의 구조화된 작업 보조 능력과 탁월한 프로그래밍 수준을 무기로 개발자와 기업 중심(B2C) 시장에서 꾸준한 확산세를 이어가고 있다. 코딩, 분석, 문서화 등 실무 영역에서의 성능이 입증되면서 특정 전문 사용자층 사이에서는 이미 작업 흐름에 깊이 들어와 있는 도구라는 평가도 나온다. 실제로 미국 주요 대학 내 사용 분석에서도 '클로드'는 컴퓨터공학 전공자들을 중심으로 높은 사용률을 보이고 있다. 코드 리팩토링이나 논리 구조 정리에 강점을 보여 문장 생성보다는 목적 지향적 업무에 적합하다는 인식이 자리잡은 상태다. 일부 스타트업이나 기술 조직에서는 내부 협업용 AI로 '클로드'를 우선 채택하기도 한다. 다만 일반 사용자 시장에서는 상대적으로 낮은 인지도를 벗어나지 못하고 있다. '챗GPT'나 '제미나이'에 비해 콘텐츠 노출이나 홍보에 대한 전략적 투자가 상대적으로 적은 편이기 때문이다. 결과적으로 AI 도구를 처음 접하는 일반 사용자에게는 익숙하지 않은 이름으로 남아 있는 상황이다. 업계 관계자는 "앤트로픽은 현재 직원 약 500명 정도로, 확장세에 있긴 하지만 직원 수가 3천명이 넘는 오픈AI나 대기업인 구글에 비해 인력이 부족한 상황"이라며 "최근 열린 한국 서밋에서도 국내 AI 기업들과 적극적으로 소통하는 모습에서 전반적으로 B2B 중심 전략이 메인이라는 인상을 받았다"고 말했다.

2025.05.08 16:57조이환

구글, AI 윤리 약속 철회…딥마인드 직원들, 노조 결성 나섰다

구글 딥마인드 영국팀 일부 직원들이 노조 결성을 추진하고 있다. 구글이 인공지능(AI)을 무기 및 감시 목적으로 활용하지 않겠다는 기존 서약을 삭제하면서 윤리적 우려를 제기하는 목소리가 조직화되는 모양새다. 28일 파이낸셜타임스 등 외신에 따르면 딥마인드 런던 본사 직원 약 300명이 최근 노조 결성 절차에 착수한 것으로 확인됐다. 이들은 구글이 AI 원칙에서 군사기술 등을 포함한 '추구하지 않을 기술' 목록을 삭제하고 이스라엘 군과 대규모 클라우드 계약을 체결한 점을 주요 문제로 지목했다. 딥마인드는 영국에 약 2천 명의 직원을 두고 있다. 구글의 이같은 정책 변화에 대해 딥마인드 직원들 사이에서는 불만이 확산된 것으로 전해졌다. 노조 추진과 별개로 최소 5명의 직원이 같은 문제를 이유로 퇴사한 사실도 확인됐다. 구글 측은 이번 상황과 관련해 "직원들과의 건설적이고 열린 대화를 장려한다"고 밝혔다. 다만 AI 윤리 정책 변경의 배경이나 세부적 설명은 내놓지 않았다. 앞서 구글은 지난 2월 초 회사의 원칙 페이지를 개정하면서 "AI 무기화 및 감시 기술 개발을 하지 않겠다"는 서약을 삭제했다. 이 서약은 지난 2018년 미국 국방부의 '메이븐 프로젝트'에 참여했다가 내부 반발로 계약을 철회하면서 구글이 직접 내세운 방침이었다. 당시 구글은 원칙 개정과 관련해 "국가 안보를 지원하는 AI를 만들기 위해 정부 및 조직과 협력해야 한다"며 "국제법과 인권 원칙을 준수하겠다"고 밝혔다. 다만 구체적인 변경 이유나 무기화 가능성에 대한 명확한 방침은 제시하지 않았다. 더불어 회사는 미국 국방부 및 이스라엘 군과 각각 대규모 클라우드 서비스 계약을 체결한 상태다. 파이낸셜타임스는 "딥마인드 팀원들이 '속았다'고 느끼고 있다"며 "최소 5명의 직원이 이러한 문제를 이유로 퇴사했다"고 보도했다.

2025.04.28 13:59조이환

[AI는 지금] "밤새고 싶어도 장비는 없고"…韓, 글로벌 AI 경쟁서 출발선도 못 선다

미국의 프론티어 인공지능(AI) 기업들이 주 100시간에 가까운 몰입 근무로 주도권 확보에 나선 가운데 한국은 제도 논의만 반복될 뿐 정작 개발자들이 몰입할 수 있는 기본 조건조차 부족하다는 지적이 나온다. 14일 업계에 따르면 미국 실리콘 밸리에서는 지난해부터 주 단위로 신제품을 내놓는 속도전이 이어지고 있는 분위기다. 이에 따라 조직 내부에 '전시체제'에 준하는 몰입 문화가 확산되고 있다. 반대로 국내에서는 최신 그래픽 처리장치(GPU) 등 기초 인프라 부족과 근무 환경의 제약으로 몰입 자체가 어려운 현실이 고착되고 있다. 연구개발 직군에 자율성과 유연성을 부여하려는 시도가 이어지고 있지만 제도 논의가 반복되는 사이 실질적인 개선은 이뤄지지 않고 있다는 지적이다. "몰입, 선택이 아닌 생존"…美 프론티어 AI 기업, 주 '100시간' 근무 테크크런치에 따르면 오픈AI 내부에서는 주 6일 근무와 야간 작업이 사실상 일상화된 상태다. 샘 알트먼 최고경영자(CEO)는 연구 성과를 빠르게 대중에 공개해야 한다며 팀의 집중력을 끌어올리는 방식으로 근무 강도를 높이고 있는 것으로 전해졌다. 실제로 밥 맥그루 오픈AI 전직 최고연구책임자는 "연구 결과가 금세 실험실을 넘어 사용자 앞에 도달한다"며 이전과는 전혀 다른 환경을 언급한 바 있다. 구글 역시 마찬가지다. 구글 딥마인드의 '제미나이' 팀은 지난해 2월에는 주당 근무 시간이 120시간에 달한 것으로 알려졌다. 당시 챗봇이 역사적 인물의 이미지 생성을 회피하거나 왜곡하는 등 결과물의 정확성과 편향성 문제가 불거지며 팀에 가해지는 업무 부담이 전례 없이 커졌기 때문이다. 일론 머스크가 이끄는 xAI 역시 유사한 분위기다. 모델 훈련과 검증 과정에서 야간·새벽 근무는 흔한 일이며 엔지니어들은 SNS에 자발적인 몰입 근무 경험을 공유하고 있다. 실제로 xAI의 엔지니어 벤자민 드 크래커는 지난 2월 중순 자신의 SNS에 "지금은 새벽 3시 12분"이라며 "'그록 3'의 마지막 디버깅을 마쳤다"는 글과 함께 사무실 내부 사진을 올렸다. 이같은 높은 몰입 강도는 상당한 부작용을 낳고 있는 상황이다. 오픈AI의 전직 연구원 다니엘 코코타일로는 "회사는 안전에 대한 구체적인 계획 없이 속도만 추구하고 있다"고 지적하기도 했다. 일부 직원은 비판을 공개적으로 밝히지 못하는 분위기를 내부 고발한 바 있다. 그럼에도 불구하고 이 같은 고강도 몰입 근무는 글로벌 AI 기업들 사이에서 '뉴노멀'로 굳어지고 있다. 가속하는 AI 경쟁 속에서 인재 확보가 어려운 상황이 이어지면서 개발 속도를 맞추기 위해선 누군가가 밤을 새우는 구조가 이미 당연시되고 있는 상황이다. 韓 AI 개발자들 "몰입할래도 못 해요"…현장은 GPU부터 부족 이러한 현실 속에서 국내에서도 AI 산업의 경쟁력이 미래 기술 주도권을 좌우할 핵심이라는 인식이 빠르게 확산되고 있다. 고정된 노동시간 체계로는 글로벌 초격차 경쟁에서 뒤처질 수 있다는 우려가 정치권과 산업계를 중심으로 꾸준히 제기되는 것이다. 일례로 최근 이재명 더불어민주당 대표가 'K-엔비디아'를 육성하겠다고 밝히자 최형두 국민의힘 의원은 "화이트칼라의 주 52시간제 예외 적용도 안 해주면서 무슨 엔비디아를 키우겠냐"고 비판한 바 있다. 최 의원은 IT·연구개발 직군에 있어 유연한 노동시간 적용이 필요하다는 입장을 지속적으로 주장해 왔다. 노동시간 규제 개편에 대한 정치권의 문제 제기는 기업계의 요구와 맞물린다. 주요 산업계와 경영계에서는 반도체 및 AI 분야에서의 초격차 경쟁이 격화되는 상황에서 기존의 주 52시간제가 혁신을 제약할 수 있다는 우려가 꾸준히 제기돼 왔다. 특히 연구개발(R&D) 인력에 한해서는 집중 근무가 가능하도록 법적 유연성을 확대해야 한다는 주장이 힘을 얻고 있다. 한 재계 관계자는 "일본이나 독일 같은 제조 강국들은 핵심 기술 인력에 대해서는 별도의 유연 근무 체계를 운영한다"며 "한국도 혁신 인재들이 글로벌 경쟁에서 밀리지 않도록 제도적 장치를 보완할 필요가 있다"고 밝혔다. 다만 일선 개발자들이 마주한 현실은 이와 다소 온도차가 있다. AI 개발 현장에서는 단순한 시간 총량보다 '몰입 가능성'과 '작업 조건'이 보다 중요하다는 목소리가 나온다. 모델 학습처럼 집중이 필요한 시기에는 밤낮 없이 일하는 경우도 있지만 그래픽 처리 장치(GPU) 운용 특성상 유휴 시간이 발생해 고강도 근무가 항상 이어지는 구조는 아니라는 설명이다. 한 업계 관계자는 "대형 프로젝트나 긴급 대응이 필요할 땐 개발자들이 자발적으로 일정을 몰아가기도 한다"며 "근무시간을 법으로 획일화하기보다 필요할 때 몰입할 수 있도록 자율성과 환경을 조성하는 게 더 중요하다"고 말했다. 이어 "성과가 시간으로 측정되지 않는 만큼 원격 기반의 자율 구조가 성과에 더 직결된다고 생각한다"고 덧붙였다. 모델 학습을 위한 인프라 부족도 국내 개발 환경의 구조적 제약으로 꼽힌다. 고성능 GPU가 절대적으로 부족해 일정 자체가 중단되는 사례가 반복되고 있으며 업계에서는 국내에서 가용한 엔비디아 'H100'급 GPU가 최대 3천장 수준에 불과한 것으로 보고 있다. 이런 상황에서는 미국의 AI 기업들이 전제하고 있는 '풍부한 컴퓨팅 리소스 바탕의 초과 근무'를 그대로 따르기는 사실상 어렵다는 게 중론이다. 또다른 업계 관계자는 "GPU 같은 기반 자원이 부족한 상황에서는 집중하려 해도 흐름이 자주 끊긴다"며 "AI 개발은 정해진 시간보다는 작업이 끊기지 않는 환경이 보다 실효성 있다고 본다"고 말했다. 이어 "사실 개발자라는 직업 자체가 정해진 시간만 일하려고 선택하는 일은 아닌 만큼, 법적 기준보다 실질적인 유연성과 몰입 환경을 어떻게 만들지에 초점을 맞춰야 한다"고 강조했다.

2025.04.14 17:18조이환

구글, AI로 전력망 병목 해소한다…딥마인드도 참여

구글이 인공지능(AI) 기술로 북미 전력 시스템 병목 해소와 공급 효율 높이기에 나섰다. 구글은 북미 전력망 운영사 PJM인터커넥션과 손잡고 AI 기반 전력망 연계 최적화 프로젝트를 진행한다고 11일 공식 홈페이지를 통해 밝혔다. 구글 사내 기업으로 출범한 태피스트리가 기술 개발을 주도한다. 구글클라우드와 딥마인드도 프로젝트에 참여한다. 이번 협력은 미국 13개 주에 위치한 PJM 전력망과 새 발전소 연결에 걸리는 시간을 줄이고 전력 병목을 해소하는 것이 목표다. PJM은 현재 6천700만명에게 전력을 공급하고 있다. 연계 대기 용량은 2천600기가와트(GW)다. 기존 전력 설비 총량보다 2배 많다. 앞서 미국 연방 에너지 규제 위원회는 올해 전력 수요 증가 예측치를 전년 대비 3배 이상 상향 조정했다. 2030년까지 128GW의 전력 수요가 추가 발생할 것이란 전망도 나왔다. 이런 상황에서 발전소 연계 신청은 기존 연 수십 건에서 수천 건으로 늘었다. 태피스트리는 AI 기반 자동화 도구로 연계 검토 과정에서 데이터를 검증할 방침이다. 또 기존 데이터베이스와 시뮬레이션 툴 수십개를 통합 모델로 구성한다. 이를 통해 에너지 개발자와 전력망 설계자가 단일 플랫폼에서 협업할 수 있는 체계를 마련한다. 이번 프로젝트에서 AI는 풍력, 태양광 등 변동성 에너지 자원 통합 관리에도 활용된다. 다양한 에너지원을 기존 전력망에 연계함으로써 신재생 자원의 확대를 도울 방침이다. 이 외에도 구글은 지열, 차세대 원전 등 새로운 전력 생산 기술을 병행 개발하고 있다. 데이터센터 운영에 필요한 전력을 확보하기 위한 조달 방식도 업그레이드하고 있다. PJM인터너켁션 노아 브라이어 디지털 혁신 책임자는 "AI 기술로 기존 방식보다 빠르고 신뢰성 있게 전력망을 확장할 수 있을 것"이라며 "구글과의 협업은 전력망 현대화의 새로운 기준이 될 것"이라고 밝혔다.

2025.04.11 09:34김미정

오픈AI, 챗GPT '기억 기능' 전면 개편…자동화로 진화한 'AI 개인화'

오픈AI가 '챗GPT'의 기억력을 대폭 업데이트했다. 기존처럼 명령을 입력해야 정보를 기억하던 방식에서 벗어나 대화 중 중요한 내용을 인공지능(AI)이 스스로 저장·활용하도록 자동화 수준을 높였다. 11일 테크크런치 등 외신에 따르면 오픈AI는 '챗GPT'의 '메모리 기능' 업데이트를 유료 구독자에게 단계적으로 적용한다. 해당 기능은 텍스트·음성·이미지 생성 전반에 과거 대화 내용을 반영해 문맥을 보완하는 방식이다. 이전에도 메모리 기능은 존재했으나 이번 업데이트를 통해 자동화 수준과 활용성이 크게 강화됐다. 이번 기능은 '참조 저장 메모리즈(reference saved memories)'라는 이름으로 설정 메뉴에 포함된다. 이용자는 이를 통해 '챗GPT'가 자신에 대해 어떤 정보를 기억하고 있는지 직접 확인할 수 있게 된다. 저장된 메모리를 개별 삭제하거나 전체 기능을 끌 수도 있다. 별도 저장을 원치 않을 경우 일시적인 대화 모드를 선택하는 것도 가능하다. 이 기능은 기존 메모리 기능의 확장 버전이다. 지난해 오픈AI는 이용자가 직접 특정 정보를 저장·삭제 요청할 수 있는 기능을 도입한 바 있다. 이번에는 저장·반영 과정이 자동화되면서 대화의 흐름과 자연스러움을 크게 높였다는 설명이다. 기능은 우선 '챗GPT' 프로(Pro) 및 플러스(Plus) 이용자를 대상으로 배포된다. 단 영국·유럽연합·아이슬란드·리히텐슈타인·노르웨이·스위스 지역은 현지 규제에 따른 외부 검토 절차가 남아 있어 도입이 미뤄졌다. 오픈AI는 이들 국가에도 향후 기능을 제공할 계획이라고 밝혔다. 무료 이용자에게 해당 기능이 언제 적용될지에 대해서는 구체적인 일정이 공개되지 않았다. 오픈AI 측은 "현재로선 유료 이용자에 집중하고 있다"는 입장을 밝혔다. 한편 이 같은 기능 강화에 대해 일각에서는 개인정보 수집 확대 우려도 제기된다. 다만 업계에서는 설정을 통해 이용자가 기능을 직접 제어할 수 있다는 점에서 자율성과 투명성 측면은 일정 수준 확보했다는 평가도 이어지고 있다. 테크크런치는 "이번 '메모리 기능'은 '챗GPT' 대화 경험을 더 유기적이고 개인화된 방식으로 바꿀 것"이라며 "구글도 유사한 기능을 자사 '제미나이'에 도입한 만큼 생성형 AI 시장의 차별화 경쟁이 본격화되는 신호"라고 전했다.

2025.04.11 09:33조이환

"2030년까지 인간 상위 1% AI 등장 가능"…딥마인드, AGI 위협 경고

구글 딥마인드가 향후 10년 안에 인류에게 실존적 위협을 가할 수 있는 범용인공지능(AGI)의 등장 가능성을 경고했다. AGI가 인류 상위 1% 수준의 인지 역량을 확보할 수 있다는 전망 아래 이에 대응할 기술적 안전 전략을 제시하며 위험 최소화에 나선 것이다. 6일 업계에 따르면 딥마인드의 '기술적 AGI 안전과 보안을 위한 접근법(An Approach to Technical AGI Safety and Security)' 보고서는 지난 3일 공개된 직후 업계 안팎에서 큰 주목을 받고 있다. 회사는 145페이지 분량의 이 보고서를 통해 오는 2030년까지 딥러닝 기반의 점진적인 기술 발전을 통해 예외적 능력을 지닌 AGI가 등장할 수 있다고 전망했다. 딥마인드는 AGI를 두고 메타인지 능력을 갖추고 인간보다 뛰어난 문제 해결과 개념 학습 역량을 기반으로 광범위한 비물리적 작업을 수행할 수 있는 AI로 정의했다. 회사는 이를 '숙련된 성인 상위 1% 수준의 능력'으로 규정하고 현 추세대로라면 오는 2030년 전후로 현실화될 수 있다고 내다봤다. 딥마인드는 AGI가 야기할 위험을 네 가지로 분류했다. ▲악의적 사용자의 고의적 오용(Misuse) ▲AI의 자율적 비정렬 행동(Misalignment) ▲비고의적 판단 오류(Mistakes) ▲사회·경제적 구조 변화에 따른 시스템 리스크(Structural Risks) 등이다. 보고서는 이 중에서도 특히 '오용'과 '자율적 비정렬 행동'을 중심 위험 요소로 강조했다. AI가 해킹·바이오테러 등 실질적 해악 수단으로 쓰이거나 스스로 목표를 설정하고 인간의 통제를 벗어날 경우를 우려한 것이다. "AI 오용, 실제 공격 견뎌야 안전"…다층 방어체계 구축 제시 우선 딥마인드는 '오용' 방지를 위해 AGI가 '위험 역량'을 보유하고 있는지를 정량적으로 평가해야 한다고 밝혔다. 공격, 해킹, 무기 설계 등 실제 피해를 유발할 수 있는 능력을 사전에 점검하고 일정 기준을 넘을 경우 즉시 보안 및 접근 통제를 포함한 완화 조치를 시행하는 구조다. AI 모델 자체의 내부 작동 원리와 학습 구조에 직접 개입하는 '모델 단계'에서는 위험하거나 불법적인 요청을 거부하도록 학습하는 '사후 훈련(post-training)'이 적용된다. 단순히 보상을 기반으로 한 학습을 넘어 우회 공격(jailbreak)까지 방어할 수 있는 내성을 갖추도록 설계하는 것이 핵심이다. 이와 함께 '기능 억제(capability suppression)' 전략도 병행된다. 모델이 이미 학습한 위험 기술을 제거하거나 무력화하는 방식으로, 다만 이는 정확도 저하 등 기술적 난제를 동반할 수 있다는 한계도 언급됐다. AI 모델을 포함하고 있는 전체 시스템 구조인 '시스템 단계'에서는 보다 포괄적인 방어 전략이 제시된다. 입력과 출력을 실시간으로 감시하는 모니터링 체계를 통해 AI가 위험 징후를 보일 경우 즉각 경고하거나 출력을 차단하는 식이다. AI 내부의 활성화 패턴까지 들여다보는 방식으로 위협 탐지를 고도화하는 것도 제안됐다. 민감한 모델의 경우 인증된 사용자만 접근할 수 있도록 제한하고 가중치 유출이나 탈취를 막기 위한 하드웨어·소프트웨어 보안도 함께 구축해야 한다는 것이다. 보고서는 이러한 전략들을 단순한 예방 차원이 아니라 실질적인 공격에 대비한 검증 프로세스로 확장한다. 내부와 외부 전문가로 구성된 팀이 실제로 모델을 공격해보는 '레드 팀 테스팅(Red Teaming)'을 실시해 방어 체계의 허점을 실험적으로 점검하고 이를 개선하는 방식이다. 딥마인드는 이를 통해 해당 모델이 위험 역량을 보유하지 않았거나 보유했더라도 실질적인 해를 끼치기 어렵다는 점을 정량·정성적으로 입증할 수 있어야 한다고 명시했다. 회사는 이 과정을 '세이프티 케이스(Safety Case)'라고 정의했다. "AI가 인간 의도 벗어나지 않게"…AGI '정렬+통제+검증' 3중 안전체계 구축 딥마인드는 AGI의 '자율적 비정렬 행동(Misalignment)'에 있어 두 가지 방어선을 설정했다. 1차 방어선은 AI 자체를 '정렬된 상태'로 학습시키는 것이다. 이를 위해서는 '증폭된 감독(Amplified Oversight)' 개념이 제시된다. 사람보다 우월한 판단을 내릴 수 있는 AI에 대해 동일 수준의 AI가 상호 비판적 피드백을 제공하며 문제점을 지적하도록 설계한 구조다. 감시자인 인간의 한계를 AI가 스스로 보완하는 방식이다. 이에 더해 AI가 새로운 상황이나 입력에서도 일관되게 안전하게 행동하도록 '견고한 학습(Robust Training)'이 적용된다. 일부러 AI의 약점을 찌르는 방식으로 학습시키는 '적대적 학습', 모델이 스스로 헷갈리는 데이터를 골라 학습을 요청하는 '액티브 러닝', 배포 이후 '실시간 학습' 등 다양한 방식으로 위험 상황에 대한 내성을 강화하는 구조다. 2차 방어선은 AGI가 정렬되지 않았더라도 시스템 차원에서 해를 억제하는 방식이다. 딥마인드는 AI를 '내부 위협자'로 간주하고 보안 체계 전반을 사람 대신 AI에 맞춰 재설계해야 한다고 봤다. 샌드박싱, 접근권 분리, 로그 기록, 이상 행동 탐지 등을 기반으로 위협 행동 발생 시 신속 대응이 가능하도록 했다. 특히 '계층형 모니터링' 구조는 주목할 만하다. 비용이 적게 드는 기본 감시 시스템이 먼저 이상 행동을 선별하고 더 위험하거나 판단이 어려운 경우 고도화된 감시 시스템이나 인간 판단으로 이관하는 식이다. 이러한 기술을 뒷받침할 보조 연구도 병행된다. '해석가능성(Interpretability)'은 AGI의 내부 추론 과정을 가시화하고 그 판단의 근거를 명확히 분석할 수 있도록 해준다. 이는 AI가 거짓말을 하거나 위험 판단을 은폐하는 상황을 막는 핵심 도구다. 또 '안전 설계 패턴(Safer Design Patterns)'을 도입해 AI가 행동 전 사용자의 재확인을 요청하거나 예외 상황에서 보수적으로 작동하도록 만드는 등 구조적 안전 장치를 설계하는 것도 중요한 과제로 꼽힌다. 딥마인드는 이를 단지 설계 차원이 아닌, 실제로 작동 가능한 신뢰 모델로 검증해야 한다고 보고 있다. '정렬 신뢰도 검증(Alignment Assurance)'을 통해 시스템이 정말 인간 의도대로만 동작하는지를 반복 실험하고 실패 가능성을 최소화하는 과학적 기반을 마련하겠다는 방침이다. 여기에는 ▲AI가 감독 시스템을 우회할 수 있는지 확인하는 '스트레스 테스트' ▲해를 끼치도록 유도된 AI가 어느 수준까지 행동을 실행하는지 점검하는 '컨트롤 평가' 등이 포함된다. 딥마인드는 보고서를 통해 "AGI 개발은 빠르게 진행되고 있으며 위험이 현실화된 뒤에는 늦을 수 있다"며 "단순 훈련이나 필터링을 넘는 시스템 수준 설계와 과학적 검증과 보안 대응을 포함한 포괄적 안전 전략이 필요하다"고 강조했다.

2025.04.06 07:57조이환

"제미나이 비판도 금지?"…딥마인드, 논문 발표 제한 논란

구글 딥마인드가 인공지능(AI) 기술 유출을 막기 위해 논문 출판 기준을 강화한 가운데 내부 관계자들이 AI 연구에 타격을 입은 것으로 전해졌다. 2일 파이낸셜타임스(FT) 등 외신에 따르면 딥마인드는 최근 논문 출판을 위한 검토 단계와 유예 절차를 강화했다고 발표했다. 오픈AI 등 경쟁사가 논문을 참고해 AI 기술을 악용하거나 제미나이 모델에 부정적 영향을 줄 수 있는 경우를 막기 위해서다. 딥마인드는 논문 발표까지 최소 6개월의 유예 기간을 적용한다. 이때 연구자는 내부 인사들의 다단계 승인을 받아야 한다. 이런 절차는 주요 연구 성과의 외부 유출과 논문 악용을 막을 수 있다. 일부 연구자들은 논문 발표가 어려워지면서 연구 경력에 직접적 타격을 입고 있다고 지적했다. 실제 일부는 논문 게재를 막는 정책 변화에 반발해 회사를 떠난 것으로 전해졌다. 딥마인드는 여전히 수백 편의 논문을 발표하며 주요 학회에 기여하고 있다고 강조했다. 그러나 내부 소식통들은 "생성형 AI와 관련된 논문은 발표 자체가 사실상 불가능"하다고 FT를 통해 주장했다. 또 제미나이 모델 성능이 경쟁사인 오픈AI의 GPT-4보다 떨어진다는 내용을 담은 논문이나, 오픈AI의 보안 취약점을 분석한 논문 모두 발표가 보류된 사례도 있던 것으로 알려졌다. 후자의 경우는 보복성 해석을 우려한 내부 판단 때문이었다. 딥마인드는 "보안 취약점 관련 논문은 '책임 있는 공개' 정책에 따라 기업 측에 사전 조치 기회를 제공한 뒤 발표한다"며 "실제 일부 보안 논문은 이 같은 방식으로 공개되고 있다"고 설명했다.

2025.04.02 09:19김미정

구글 '제미나이 2.5'로 추론형 AI 전면전…기술 주도권 겨눈다

구글 딥마인드가 추론하는 차세대 인공지능(AI) 모델을 선보였다. 복잡한 문제 해결을 위한 '사고형 AI'로 본격 진화하며 추론 및 코딩 성능을 강화해 오픈AI, 앤트로픽 등 경쟁사에 대응하기 위해서다. 26일 구글 공식 블로그에 따르면 구글의 AI 자회사인 딥마인드는 '제미나이 2.5 프로 익스페리멘털'을 실험적으로 출시했다. 이 모델은 출시 직후 AI 성능을 인간 기준으로 평가하는 벤치마크인 LM아레나(LMArena)에서 1위에 올랐으며 구글 AI 스튜디오와 '제미나이' 앱에서 우선 제공된다. 기업용 플랫폼인 '버텍스' AI에는 추후 탑재될 예정이다. '제미나이 2.5'는 응답 전 사고 과정을 거치는 '생각하는 모델'로 설계됐다. 단순한 분류와 예측을 넘어 맥락 분석과 논리적 판단을 기반으로 복잡한 문제를 풀 수 있는 구조다. 구글은 이를 통해 복합적 상황에서도 에이전트가 자율적으로 판단할 수 있도록 지원할 계획이다. 사고형 AI 기반으로 개발된 이번 2.5 프로는 수학·과학 분야에서도 최고 성능을 기록했다. 특히 'GPQA'와 'AIME 2025' 등의 고난도 벤치마크에서도 테스트 시간 기술 없이도 뛰어난 성과를 냈으며 전문가 집단이 설계한 '휴매니티스 라스트 이그잼'에서도 도구 없이 18.8%의 점수를 기록했다. 코딩 능력도 대폭 향상됐다. 웹 애플리케이션 구현, 에이전트형 코드 작성, 코드 리팩토링 등에서 우수한 성능을 보였다. 실제로 프로그래밍 능력을 평가하는 벤치마크인 'SWE-벤치 베리파이드' 기준 63.8%의 정확도를 기록했다. 이는 맞춤형 에이전트를 활용한 결과로, 실제 개발 환경에 가까운 평가 기준에서의 성과다. 구글은 '제미나이 2.5 이전에도 추론 특화 모델 개발에 힘써왔다. 지난해 12월 공개된 '제미나이 2.0'은 멀티모달 기능과 코드 생성 능력을 강화한 최초의 모델로, 이후 지난 2월에는 '제미나이 2.0 플래시 씽킹'을 단계적 사고 설명이 가능한 추론 특화 모델로서 공개한 바 있다. 경쟁사들의 움직임도 거세다. 오픈AI는 지난해 9월 추론 모델인 'o1' 시리즈를 출시했으며 지난 1월에는 'o3'를 공개했다. 중국 딥시크 역시 같은 달 6천710억 패러미터를 탑재한 'R1'을 내놨고 최근에는 앤트로픽이 '클로드 3.7 소네트'를 공개했다. 이는 업계 최초로 일반형 AI와 추론형 AI를 통합한 하이브리드 모델이다. 이번 '제미나이 2.5 프로'는 사고형 아키텍처에 멀티모달과 긴 맥락 기능까지 결합해 이들과의 경쟁을 본격화한 셈이다. 현재 서비스는 구글 AI 스튜디오에서 제공된다. 고급 이용자라면 제미나이 앱에서도 모델 선택을 통해 접근 가능하다. 코라이 카북추오글루 구글 딥마인드 최고기술책임자(CTO)는 "'제미나이 2.5'는 복잡한 문제를 다루기 위한 사고형 모델로, AI의 새로운 지평을 연다"며 "고객 피드백을 바탕으로 지속적으로 개선할 것"이라고 밝혔다.

2025.03.26 10:40조이환

구글, 제미나이에 '캔버스' 도입…오픈AI·앤트로픽 따라잡기 나섰다

구글이 자사 인공지능(AI) 챗봇에 사용자의 문서·코딩 작업을 지원하는 기능을 선보인다. 오픈AI와 앤트로픽이 먼저 선보인 협업 도구를 뒤따르는 움직임으로, AI 생산성 시장 경쟁이 한층 치열해지고 있다. 19일 테크크런치에 따르면 구글은 '제미나이' 웹·모바일 앱에서 '캔버스' 기능을 새로 추가해 사용자가 AI와 협업해 문서를 작성하고 코드를 편집하는 작업 공간을 마련했다. 오픈AI가 지난해 '챗GPT'에 '캔버스'를, 앤트로픽이 '클로드'에 '아티팩트'를 도입한 데 이어 구글도 같은 기능을 추가하며 경쟁에 뛰어든 모습이다. '캔버스'에서는 문서 초안을 작성한 후 특정 단락을 선택해 '간결하게', '전문적으로', '비공식적으로' 등의 옵션을 통해 수정할 수 있다. 또 구글 문서로 바로 내보낼 수 있어 협업을 원활하게 지원한다. 코딩 기능도 강화됐다. 사용자는 HTML·리액트 등 웹 코드의 실시간 미리보기를 확인하며 수정할 수 있다. 특히 AI가 코드 생성부터 디자인 변경까지 직접 수행해 작업 효율을 높인다. 이와 함께 구글은 '제미나이'에 '오디오 개요' 기능도 추가했다. 이는 AI가 문서·웹페이지 등의 내용을 팟캐스트 스타일의 오디오로 요약해주는 기술로, 기존 '노트북LM'에서 제공되던 기능을 제미나이에서도 활용할 수 있도록 확장했다. 사용자는 문서를 업로드한 후 오디오 개요를 생성하고 이를 다운로드하거나 공유할 수 있다. 다만 현재 오디오 개요 기능은 영어로만 제공된다. '캔버스'와 '오디오 개요' 기능은 전 세계 '제미나이' 사용자에게 무료로 제공된다. 다만 캔버스의 코드 미리보기 기능은 웹 버전에서만 지원된다. 데이브 시트론 구글 제미나이 제품 디렉터는 "캔버스를 통해 제미나이가 더욱 효과적인 협업 도구로 자리 잡을 것"이라며 "사용자의 아이디어를 보다 쉽게 실현할 수 있도록 도울 것"이라고 말했다.

2025.03.19 10:39조이환

구글 딥마인드, 생성형 AI에 손·발 달았다…로보틱스 SW 공개

구글 딥마인드가 인공지능(AI)이 현실 세계에서 사람처럼 추론·행동할 수 있게 돕는 로보틱스 모델을 발표했다. 구글 딥마인드는 차세대 AI 로봇 개발을 위한 '제미나이 로보틱스'와 '제미나이 로보틱스-ER'을 공개했다고 13일 공식 블로그를 통해 밝혔다. 해당 모델은 '제미나이 2.0' 기반으로 작동한다. 제미나이 로보틱스는 비전-언어-행동(VLA) 모델이다. AI가 눈으로 보고, 언어를 이해하고, 행동으로 옮길 수 있도록 설계된 모델이다. 단순히 텍스트나 이미지로만 정보를 처리하는 것이 아니라 직접 로봇을 제어해 움직이게 만드는 기능까지 갖췄다. 제미나이 로보틱스는 로봇 플랫폼에 적용 가능하도록 설계됐다. 현재 '알로하 2' 쌍팔 로봇 플랫폼 데이터로 훈련된 상태다. 학술 연구실에서 사용하는 프랑카 기반 로봇 제어도 가능하다. 특히 앱트로닉과 협력해 휴머노이드 로봇 '아폴로' 개발도 착수했다. 딥마인드는 "제미나이 로보틱스는 인간처럼 일반성과 상호작용성, 기민성을 갖췄다"며 "이전에 경험하지 못한 작업과 환경에서도 스스로 적응해 문제를 해결할 수 있으며, 다양한 자연어 명령을 이해하고 이에 따라 행동을 조정한다"고 강조했다. 또 "정교한 조작 능력으로 복잡한 다단계 작업도 처리할 수 있다"고 덧붙였다. 제미나이 로보틱스-ER은 제미나이 로보틱스 기능에 공간 이해력을 강화한 모델이다. 로봇이 주변 환경을 더 잘 이해하고 어떻게 움직여야 안전하고 효율적으로 작업을 할 수 있을지 스스로 판단할 수 있게 설계됐다. 이를 통해 인식과 상태 추정, 공간 이해, 계획 수립, 코드 생성까지 한 번에 처리할 수 있다. 복잡한 물체를 인식해 적절한 조작 방법을 제시도 가능하다. 소수 인간 시범만으로도 해결책을 도출할 수 있다. 엔드투엔드 테스트에서 기존 모델 대비 2~3배 높은 성공률을 기록했다. 딥마인드는 "AI가 현실 세계에서 실질적인 도움을 주기 위해서는 체화된 추론 능력과 정교한 행동 제어가 필수"라며 "앞으로도 다양한 테스트와 협력을 통해 AI 로봇의 현실 적용성을 확대해 나갈 것"이라고 밝혔다.

2025.03.13 10:43김미정

"AI 영상 생성, 1시간에 250만원"…구글, '비오 2' 초고품질 전략 성공할까

인공지능(AI) 기반 비디오 생성 시장의 경쟁이 본격화되는 가운데 구글이 자사 영상 AI인 '비오 2'의 가격을 공개했다. 4K 초고품질 영상을 지원하나, 오픈AI의 '소라'보다 가격이 높아 비용 대비 경쟁력이 있을지에 대한 의문이 제기되고 있다. 두 모델 모두 환각 및 물리 법칙 구현 등 기술적 한계를 드러내고 있다는 점도 해결 과제다. 24일 테크크런치에 따르면 구글은 AI 비디오 생성 모델 '비오 2'의 가격을 초당 50센트(한화 약 700원)로 책정했다. 이는 시간당 1천800달러(한화 약 250만원), 분당 30달러(한화 약 4만2천원)에 해당하는 수준으로, 구글은 '비오 2'를 통해 고품질 영상 시장을 공략하며 영상 생성의 상업적 활용도를 높이려는 전략을 펼치고 있다. '비오 2'는 최대 4K 해상도를 지원하는 고급형 비디오 생성 모델이다. 구글 클라우드의 '버텍스 AI(Vertex AI)' 플랫폼을 통해 제공되며 고해상도와 정밀한 디테일을 구현하는 데 초점을 맞췄다. 다만 비용이 초당 50센트로 책정되면서 일반 사용자보다는 전문가 및 기업 시장을 겨냥한 서비스로 보인다. 특히 오픈AI의 비디오 생성 AI인 '소라'와의 가격 정책 차이가 주목된다. 오픈AI는 크레딧 기반의 구독 모델을 통해 '소라'를 운영하고 있으며 1천80p 기준 초당 20센트(한화 약 280원)로 '비오 2'보다 상대적으로 저렴한 가격을 제시하고 있다. 오픈AI의 비디오 AI 가격 구조는 이용자의 구독 플랜에 따라 달라지며 저해상도에서는 보다 낮은 비용으로 비디오를 생성할 수 있다. 현재 '소라'는 월 20달러(한화 약 2만8천원)의 챗GPT '플러스'와 월 200달러(한화 약 28만원)의 '프로' 플랜을 통해 제공되며 각각 1천 크레딧과 1만 크레딧을 지급하는 방식이다. 480p 해상도의 경우 초당 4크레딧으로 약 8센트(한화 약 110원), 1천80p 해상도에서는 초당 100크레딧으로 약 20센트(한화 약 280원)이 소모된다. '소라'는 현재 4K 해상도를 지원하지 않지만 비용 효율성 면에서는 '비오 2'보다 경쟁력이 높은 것으로 보인다. 다만 실제 영상 제작 현장에서는 두 모델 모두 완벽하지 않다는 지적이 나온다. 최근 업계 평가에 따르면 '비오 2'는 손가락, 눈동자, 피부 질감 등 세부 표현에서 비현실적인 결과가 발생하며 물리 법칙에 부합하지 않는 액체 유동성 표현 등의 문제가 드러난다. 또 '소라'는 인체 움직임에서 부자연스러운 관절 회전과 신체 비율 왜곡 현상이 잦으며 보행 시 다리 움직임이 로봇처럼 경직되는 문제를 보인다. 이 외에도 장면 전환 시 객체의 색상 및 크기 변화가 불안정해 시간적 일관성을 유지하는 데 어려움을 겪고 있다. 이 같은 기술적 한계는 두 모델이 아직 실제 영상 수준에 미치지 못하는 부분을 여실히 보여준다. 전문가들은 물리 엔진 통합 등 추가 개발이 필요하다고 지적하며 특히 의류 주름 시뮬레이션과 액체-고체 상호작용 구현이 시급한 과제라고 평가한다. 향후 개선된 기술이 도입될 경우 보다 현실적인 AI 영상 제작이 가능할 것으로 기대된다. 디나 베라다 유튜브 제품 담당 이사는 "'비오 2'는 현실 세계의 물리 법칙과 인간의 움직임을 더 잘 이해해 세밀하고 현실적인 결과물을 만든다"며 "스타일, 렌즈, 시네마틱 효과까지 지정할 수 있어 쉽고 재미있게 영상을 표현한다"고 강조했다.

2025.02.24 10:55조이환

구글 딥마인드 "딥시크, 기존 AI 섞은 모델일 뿐"

데미스 하사비스 구글 딥마인드 공동 창업자 겸 최고경영자(CEO)가 중국 인공지능(AI) 기업 딥시크 모델이 우수하지만 기술적 혁신은 부족하다고 평가했다. 10일 테크크런치 등 외신에 따르면 하사비스 CEO는 프랑스 파리에서 열린 AI 액션 서밋에 앞서 '딥시크-R1'에 대해 이같이 언급했다. 그는 "딥시크는 분명히 우수한 결과물이지만 과학적으로 혁신을 보여준 것은 아니다"고 지적했다. 이어 "기존 AI 기술을 융합한 모델에 불과하다"고 덧붙였다. 하사비스 CEO는 딥시크 모델에 대해 “지정학적 측면에서 중요한 영향을 미칠 수 있다”고 평가하면서도, “기존에 알려진 AI 기술을 활용한 모델에 불과하다”고 덧붙였다. 딥시크는 지난해 12월 딥시크-V3(DeepSeek-V3) 출시 후 올해 초 딥시크-R1(DeepSeek-R1), 딥시크-R1-제로(DeepSeek-R1-Zero), 딥시크-R1-디스틸(DeepSeek-R1-Distill) 모델을 공개했다. 비전 기반 야누스-프로 7B(Janus-Pro 7B) 모델도 추가 공개했다. 딥시크는 해당 모델들이 기존 대비 90~95% 비용 절감과 비용 효율성을 제공하며, 강화 학습 기법을 적용해 우수한 추론 능력을 갖췄다고 주장하고 있다. 특히 저사양 칩으로도 오픈AI의 GPT-o1 수준 성과를 냈다고 밝히기도 했다. 이후 업계에서 AI 인프라 구축 비용 적절성에 대한 논의가 이어졌다. 엔비디아 등 주요 AI 기업 주가 하락이 이어지기도 했다. 이에 하사비스 CEO는 딥시크의 저비용 모델 주장에 대해 "실제 개발 비용이 공개된 수치보다 높을 수 있다"고 지적했다. 그는 이날 일반인공지능(AGI) 전망에 대한 의견도 밝혔다. 그는 AGI를 인간의 모든 인지 능력을 가진 프로그램이라고 정의했다. 이어 향후 5년 내 AGI 시스템이 등장할 가능성이 크다고 전마했다. 그러면서 "AGI는 사회 전반에 큰 변화를 가져올 것"이라며 "사회가 이에 대비하고, AI 기술 혜택이 모든 사람에게 돌아가게 만들어야 한다"고 당부했다.

2025.02.10 15:32김미정

구글, '제미나이 2.0' 출시…생성형 AI 시장 재편 나선다

구글이 '제미나이'의 차세대 인공지능(AI) 모델을 다수 공개하며 기술 주도권 확보에 나섰다. 특히 추론 및 경량 모델의 공개는 중국 AI 스타트업 딥시크와의 경쟁에서 우위를 점하려는 전략으로 해석된다. 6일 테크크런치 등 외신에 따르면 구글이 '제미나이 2.0 프로 익스페리멘털(Gemini 2.0 Pro Experimental)'을 포함한 다수의 신형 AI 모델을 공개했다. 이번 발표에는 AI 추론을 위한 '제미나이 2.0 플래시 씽킹(Gemini 2.0 Flash Thinking)'과 비용 효율성을 높인 '제미나이 2.0 플래시 라이트(Gemini 2.0 Flash-Lite)'도 포함됐다. '제미나이 2.0 프로'는 구글이 지난해 2월 선보인 '제미나이 1.5 프로(Gemini 1.5 Pro)'의 후속 모델이다. 구글에 따르면 이번 모델은 자사의 AI 모델군에서 가장 뛰어난 성능을 갖췄다. 특히 코드 실행 및 복잡한 명령어 처리에서 우수한 성능을 발휘하며 보다 정교한 AI 추론과 지식 이해가 가능해졌다. 이 모델은 최대 200만 토큰의 컨텍스트 창을 제공한다. 이는 약 150만 단어를 한 번에 처리할 수 있는 수준으로, 해리 포터 시리즈 7권 전체를 한 번에 분석하고도 40만 단어 이상의 여유가 남는다. 또 사용자의 명령에 따라 구글 검색과 같은 외부 도구를 활용하고, 코드 실행을 자동화하는 기능도 포함됐다. 구글은 '제미나이 2.0 플래시 씽킹' 모델도 정식 출시했다. 이는 지난해 12월 발표된 AI 추론 모델로, 이번에 일반 사용자가 제미나이 앱에서 직접 이용할 수 있도록 했다. 이를 통해 AI의 논리적 사고와 문제 해결 능력을 향상시킬 수 있을 것으로 기대된다. 또 AI 비용 절감과 접근성을 높이기 위한 '제미나이 2.0 플래시 라이트'도 공개됐다. 기존 '제미나이 1.5 플래시(Gemini 1.5 Flash)' 대비 성능을 개선하면서도 동일한 가격과 속도로 운영되도록 설계됐다. 이는 최근 AI 비용 절감을 요구하는 시장의 요구에 대응하기 위한 조치로 보인다. 테크크런치는 "구글의 이번 발표는 중국 AI 스타트업 딥시크와의 경쟁이 본격화되는 상황에서 나왔다"며 "딥시크는 지난해 12월 AI 추론 모델 'R1'을 공개하며 저렴한 접근성과 글로벌 AI 기업에 대등한 성능으로 시장의 주목을 받은 바 있다"고 설명했다.

2025.02.06 09:12조이환

구글 딥마인드 "올해 말 AI 신약 개발·임상실험 목표"

구글이 올해 말 인공지능(AI)으로 신약을 개발해 임상 실험할 계획이다. 23일 파이낸셜타임스(FT) 등 외신에 따르면 데미스 하사비스 구글 딥마인드 공동창업자 겸 최고경영자(CEO)는 알파벳의 신약 개발 스타트업 아이소모픽랩스가 올해 말까지 이같은 목표를 세웠다고 밝혔다. 하사비스 CEO는 "아이소모픽랩스는 현재 종양학을 비롯한 심혈관, 신경퇴행 등 모든 주요 질병 분야를 다루고 있다"며 "올해 말 첫 번째 신약을 갖게 될 것"이라고 내다봤다. 그는 "보통 신약 하나 만들려면 평균적으로 5~10년이 걸린다"며 "AI를 통해 이를 10배나 더 빠르게 단축할 수 있다면, 엄청난 혁명이 될 것"이라고 예측했다. 아이소모픽랩스는 2021년까지 딥마인드 소속에서 분사됐다. 현재 구글 모회사 알파벳 자회사로 남아 있다. 현재 AI로 신약 개발 소요 시간·비용을 낮추는 작업을 진행하고 있다. 또 하사비스 CEO는 구글의 AI 어시스턴트 프로토타입인 '프로젝트 아스트라(Project Astra)'가 올해 말 출시될 가능성이 높다고 말했다. 그는 "앞으로 3년 안에 수십억 개의 AI 에이전트들이 서로 결합해 작동할 것"이라고 덧붙였다. 이 외에도 그는 일반인공지능(AGI) 시대에 대한 견해도 밝혔다. 그는 "진정한 AGI를 위해선 아직 5~10년이 더 필요하다"고 강조했다. 또 AGI 시대가 오기 전 주요 AI 개발자들 사이에서 더 많은 신중함과 협력이 필요하다고 주장했다. 그는 "경쟁적으로 AGI를 개발해선 안 된다"며 "기술이 부정적으로 활용될 경우 인류 문명 자체를 위협할 수 있기 때문"이라고 설명했다.

2025.01.23 08:57김미정

"수명 연장 목표"…오픈AI, 단백질 구조 재설계 돕는 AI 모델 개발

오픈AI가 단백질 구조 재설계를 돕는 인공지능(AI) 모델을 개발했다. 19일 MIT테크놀로지 리뷰는 오픈AI가 'GPT-4b 마이크로'를 만들어 내부적으로 실험 중이라고 이같이 보도했다. GPT-4b 마이크로는 단백질 재설계에 특화된 모델이다. 기존 단백질 설계도를 분석해 더 효율적인 설계법을 텍스트로 제안하는 식이다. 단백질이 체내에서 더 효율성 있게 기능하도록 돕는 목표로 개발됐다. 이 모델은 인간뿐 아니라 다양한 종에서 얻은 단백질 서열 예시를 학습했다. 어떤 단백질끼리 결합해야 시너지 효과를 얻을 수 있는지에 대한 정보로도 훈련받았다. GPT-4b 마이크로는 구글 딥마인드의 알파폴드와 다르다. 일반적으로 알파폴드는 단백질 구조를 3D로 예측해서 시각적으로 보여준다. 단백질이 어떻게 접히고, 어떤 모양인지 미리 알려주는 식이다. 이를 통해 연구자는 해당 단백질이 몸속에서 어떤 역할을 할지 이해할 수 있다. 반면 GPT-4b 마이크로는 단백질 재설계법을 제안하는 모델이다. 기존 단백질 아미노산 서열법 수정법도 알려준다. 이를 통해 단백질이 체내에서 더 효율적으로 작동하거나 특정 기능을 강화하도록 돕는 식이다. 이번 모델 개발은 1년 전 미국 샌프란시스코에 본사를 둔 레트로 바이오사이언스가 오픈AI와 단백질 엔지니어링 협업을 추진하면서 시작된 것으로 전해졌다. 앞서 2023년 샘 알트먼 오픈AI 최고경영자(CEO)는 레트로 바이오사이언스에 1억8천만 달러(약 2천700억원)를 개인 자금으로 투자했다. 레트로 바이오사이언스는 인간 평균 수명을 10년 연장하는 것을 목표로 둔 기업이다. 이를 위해 단백질 세트 '야마나카 인자'를 연구해 왔다. 야마나카 인자가 인간 피부 세포에 들어가면, 피부 세포는 젊은 줄기세포로 변화할 수 있다. 이를 통해 단순 수명 연장뿐 아니라 장기 제작, 대체 세포 공급원 마련을 구현할 계획이었다. 당시 야마나카 인자가 효율성이 낮다는 지적이 이어졌다. 이를 인간 피부 세포에 투입해도 젊은 줄기세포 생성이 원활하지 않았기 때문이다. 이에 레트로 바이오사이언스는 오픈AI와 협력해 'GPT-4b 마이크로' 개발에 착수한 것이다. 오픈AI 존 홀먼, 애런 재이크 연구원과 레트로 바이오사이언스 리코 마인틀 연구원이 협력해 모델을 만들었다. 양사 연구원들은 GPT-4b 마이크로 개발 후 진행한 실험 결과도 공개했다. 모델이 제안한 방법으로 야마나카 인자 설계법을 수정했다. 실험 결과 기존보다 최소 50배 넘는 효능 증가를 보였다고 발표했다. 당시 실험을 진행한 존 홀먼 연구원은 "전반적으로 과학자들이 직접 만들어낸 것보다 더 나은 단백질이 나왔다"며 "실험 결과를 논문으로 발표할 계획"이라고 밝혔다. GPT-4b 마이크로가 실제 의학에 활용될지는 미지수다. 해당 모델이 맞춤형 시연 버전에 가깝고 공식적인 출시도 미정이라서다. 외부 과학자들이 모델 기능을 평가한 사례도 없다. 재이크 연구원은 "이번 프로젝트는 기업들이 과학에 진심으로 기여한다는 것을 보여주기 위함"이라며 "해당 기능이 별도 모델로 공개될지, GPT 제품군에 통합될지는 미정"이라고 말했다.

2025.01.19 17:00김미정

"현실과 똑같은 가상 구현"…구글, '월드 모델' 개발 착수

구글이 현실을 가상 세계에서 예측·시뮬레이션 할 수 있는 인공지능(AI) 모델 개발팀을 꾸렸다. 7일 테크크런치 등 외신에 따르면 구글은 이같은 '월드 모델' 개발에 나섰다. 구글 딥마인드에서 해당 업무를 맡았으며 브룩스 연구원이 팀을 이끌 예정이다. 브룩스는 지난해 10월 오픈AI에서 비디오 생성기 '소라' 개발에 참여했다. 해당 팀은 구글의 제미나이와 비오, 지니 개발 연구 바탕으로 꾸려진다. 제미나이는 구글의 대표 멀티모달 모델이며 비오는 비디오 생성 모델이다. 지니는 게임·3D 환경을 실시간 시뮬레이션할 수 있는 모델로 현실을 3D 세계에 구현할 수 있는 기능을 갖췄다. 구글은 이 모델들을 통합해 기존보다 한 단계 업그레이드한 월드 모델을 구축할 목표다. 월드 모델은 물리·가상 세계의 구조, 동작, 규칙을 학습하고 이를 기반으로 시뮬레이션할 수 있도록 설계된 AI 모델이다. 해당 모델은 환경을 이해하고 그 안에서 일어날 수 있는 상황을 예측하거나 생성할 수 있다. 스타트업과 다른 빅테크도 월드 모델 개발에 뛰어든 바 있다. 페이페이 리 스탠포드대학교 교수는 월드랩스를 설립해 해당 모델 개발에 착수했다. 이스라엘 스타트업 데카르드, 오디세이도 해당 모델을 개발 중이다. 리 교수는 "월드 모델은 AI 능력을 언어 중심적 이해를 넘어 자연과 물리 세계, 우주까지 영역을 확장할 수 있을 것"이라며 "증강현실(AR)·가상현실(VR) 기술 발전에 기여할 수 있을 것"이라고 자신했다. 다만 일반 멀티모달보다 데이터 학습·훈련에 드는 시간이 상당해 구체적 출시 시기는 미정이다. 저작권 문제도 여전히 해결되지 않았다. 테크크런치는 "다수 월드 모델은 비디오 게임 영상 기반으로 훈련됐다"며 "이런 비디오가 허가 없이 사용되면 모델을 개발한 기업이 소송 대상이 될 수 있다"고 분석했다.

2025.01.07 09:41김미정

올해는 AI 혁신 확산의 해…新기술로 새해 투자 '청신호'

한국 경제가 대통령 탄핵정국과 트럼프 2기 정부 출범을 앞두고 을사년 새해를 맞게 됐습니다. 비상계엄 해제 이후에도 환율과 증시가 출렁이는 불확실성 속에 우리 기업들이 새해 사업과 투자 전략을 짜기가 더욱 어려워졌습니다. 정책 혼돈과 시시각각 변화는 글로벌 경제 환경에 어떻게 대처해야 하는지 지디넷코리아가 각 산업 분야별 새해 전망을 준비했습니다. [편집자주] 올 한 해는 인공지능(AI) 기술이 텍스트 생성 중심을 넘어 멀티모달, 고급 추론, 영상 생성 등 다양한 분야에서 비약적 진전을 이루며 산업과 일상에 지대한 영향을 끼쳤다. AI가 단순 도구를 넘어 지능형 조력자로 변모하며 글로벌 기술 기업과 국내 AI 기업들이 이를 중심으로 연구와 투자를 확대하는 가운데 새해에는 본격적인 'AI 에이전트' 시대가 도래할 전망이다. 26일 업계에 따르면 올해는 AI 혁신의 진면목이 가시화된 해로 기록될 전망이다. '챗GPT'가 출시된 지난 2022년 말 이후로 불과 2년도 지나지 않은 사이에 AI가 이미지, 음성, 비디오까지 아우르는 멀티모달 기술로 진전했기 때문이다. 올해부터 오픈AI '챗GPT', 구글 '제미나이', 메타 '라마' 등 주요 생성 AI들은 모두 단순 질의응답을 넘어 다양한 형태의 입력을 자유롭게 넘나들며 처리하는 능력을 각인시켰다. 특히 오픈AI가 지난 9월 정식 출시한 '어드밴스드 보이스 모드'는 음성 기반 상호작용의 새로운 지평을 열었다. 실시간 대화에서 감정을 인식하고 비언어적 신호를 파악해 대화 흐름을 유연하게 조정하는 이 기술은 사용자 말투와 감정 상태에 따라 대응 방식을 달리하며 '인간에 버금가는 대화 파트너'로 자리매김했다. 영상 AI 분야 역시 눈부신 진전을 보였다. 오픈AI가 지난 2월 처음으로 공개하고 이번달에 출시한 '소라'는 최대 20초 길이 영상을 생성해 '챗GPT' 구독자들에게 제공하고 있다. 구글 역시 지난주 유사 서비스인 '비오2(Veo 2)'를 공개했다. '비오 2'는 4K 해상도와 2분 이상 길이의 영상, 물리 법칙 반영, 인간 움직임·표정 이해 등을 통해 사실감 넘치는 가상 세계를 연출해 업계의 찬사를 받았다. 고급추론 능력 역시 크게 발전했다. 지난 9월에는 오픈AI가 'o1'과 'o1 미니'를 출시해 패턴 매칭을 넘어 사고 과정을 모사하는 모델로 과학, 코딩, 수학 영역에서 탁월한 성능을 시연했다. 'o1'은 미국 수학 올림피아드 예선에서 86% 정확도를 기록하고 대학원 수준의 물리·화학·생물학 문제도 소화하는 등 AI가 초고급 인력이 다루는 문제를 해결할 수 있음을 입증했다. 이에 중국 스타트업 딥씨크가 지난달 유사 추론 모델인 'R1'을 공개했으며 구글도 지난 20일 '제미나이 2.0 플래시 사고모드'를 발표해 경쟁에 가세했다. 구글이 최초로 고급 추론 모델을 발표한 당일 오픈AI는 'o1'의 후속작인 초고성능 추론 모델 'o3'와 소형 모델 'o3 미니'를 공개해 경쟁에 불을 지폈다. 'o3'는 국제 코딩 테스트 '코드포스'에서 2천700점을 기록해 세계 상위 0.2%에 해당하는 '인터내셔널 그랜드마스터' 수준을 입증했다. 이는 오픈AI 내부에서도 보기 드문 성과로, 회사는 내년 1월 말 'o3 미니'를 먼저 출시하고 곧이어 'o3'를 정식으로 선보일 예정이다. 기술 발전과 함께 거대언어모델(LLM) 토큰의 가격 하락 흐름도 두드러졌다. 오픈AI의 'GPT-4' 토큰 가격은 출시 당시 100만 개당 36달러(한화 약 5만원)에서 약 1년 반 만에 4달러(한화 약 5천600원) 수준으로 낮아졌고 구글은 제미나이의 토큰 비용을 최대 65% 인하했다. 국내에서도 네이버의 '하이퍼클로바X'가 텍스트·이미지·음성 처리 능력을 고도화하고 LG AI연구원의 '엑사원 3.5'가 광범위한 컨텍스트 처리와 고성능 검색 증강 생성 기술을 선보이는 등 글로벌 흐름에 발맞추고 있다. 이들은 오픈소스 공개, 특화 모델 개발 등을 통해 AI 생태계 확장에 힘쓰는 모습이다. 카카오도 AI 기술 발전에 박차를 가하고 있다. 카카오는 지난 10월 자사 AI 브랜드 '카나나'를 공개하며 AI 네이티브 기업으로의 변화를 선언했다. 현재 사내 베타 테스트 중인 카나나는 내년 1분기 일반 사용자 대상 비공개 베타 테스트(CBT)를 계획하고 있으며 대화 맥락을 기반으로 개인화된 답변과 음성 대화를 지원한다. 업계 관계자는 "올 한 해는 결과적으로 AI가 단순 도구를 넘어 지능형 조력자로 변모한 해"라며 "내년에는 이러한 진전을 바탕으로 한층 정교하고 자율적인 서비스들이 탄생할 것으로 기대된다"고 말했다. 신년에는 'AI 에이전트' 시대 개막…자율적 목표 달성으로 업무·생활 혁신 신년에는 AI가 단순히 '명령에 반응하는 비서'를 넘어 스스로 목표를 설정하고 달성하는 '에이전트'로서 본격적으로 자리 잡을 전망이다. 이러한 에이전트는 여행 일정 수립, 코드 작성, 업무 자동화, 문서 검토, 웹 검색, 양식 작성 등 복잡한 다단계 작업을 스스로 해결한다. 일례로 "다음 주 출장을 준비해줘"라는 명령을 입력하면 항공권 예매, 호텔 예약, 일정 조율까지 모두 처리하는 등 환경을 인식하고 도구를 활용해 문제를 해결한다. 이미 앤트로픽은 지난 10월 '클로드 3.5 소넷'을 발표하며 컴퓨터 제어 기능을 통한 AI 에이전트 기술 경쟁에 최초 진입했다. '소넷'은 AI가 마우스 움직임, 클릭, 키보드 입력 등 실제 PC 사용을 모방하도록 설계돼 복잡한 업무를 자동화 한다. 블룸버그 등 외신에 따르면 오픈AI는 이에 가세해 새해 1월 '오퍼레이터'라는 이름의 AI 에이전트를 출시할 예정이다. 또 마이크로소프트는 '365 코파일럿', 아마존은 '노바', 애플은 '애플 인텔리전스' 제품 군에 각각 AI 에이전트 기능을 추가하며 시장 선점을 위한 경쟁에 나선다. 이들 에이전트는 각각의 강점을 바탕으로 다양한 산업 분야에서 AI 활용을 극대화하며 글로벌 AI 경쟁을 더욱 가속화할 것으로 보인다. 새해 AI 에이전트의 등장은 금융, 소매, 물류, 의료, 제조 등 다양한 산업 분야에서 '에이전트 솔루션'의 확산을 이끌 전망이다. AI가 단순한 지원자에서 독립적인 업무 주체로 자리 잡으며 기업들은 에이전트 기술의 개발과 도입에 더욱 박차를 가할 것으로 전망된다. 업계 관계자는 "올해가 AI 기술 검증과 대중화의 해였다면 새해는 진정한 AI 조력자 시대의 개막"이라며 "에이전트 기술은 AI가 대중에게 보다 직관적으로 다가가는 기회가 될 것"이라고 내다봤다. 투자 확대 '청신호'…국내외 기업, IPO 시동 등 AI에 전폭 베팅 올해 AI 기술의 폭발은 투자 시장에도 강력한 영향을 끼쳤다. 오픈AI는 66억 달러(한화 약 8조6천억원)에 달하는 대규모 자금을 조달하며 기업가치 1천570억 달러(한화 약 205조원)를 인정받았다. 앤트로픽 역시 아마존, 구글, 멘로 벤처스 등 주요 글로벌 투자자들의 지원 속에 40억 달러(한화 약 5조2천억원)을 유치하며 기업가치가 약 300억~400억 달러(한화 약 39조~52조원)로 평가받고 있다. 이러한 대규모 투자는 AI 연구 강화, 컴퓨팅 능력 향상, 복잡한 문제 해결 도구 개발로 이어져 기술 발전을 더욱 가속화하고 있다. 오픈AI는 확보한 자금을 통해 모델 고도화와 인프라 최적화에 나섰으며 앤트로픽은 아마존웹서비스(AWS)의 '트레이니엄'과 '인퍼렌시아' 칩을 활용해 대규모 모델 학습과 배포 효율성을 높일 계획이다. 국내에서도 AI 투자 열기가 뜨겁다. 네이버는 매출의 20~25%를 연구개발(R&D)에 투자할 계획으로, 향후 6년간 1조원 규모의 'AI 임팩트 펀드'를 조성할 예정이다. 또 새해를 'AI 서비스 적용의 해'로 선포하며 검색·쇼핑·지도 등 핵심 서비스에 AI를 연계해 통합 검색 'AI 브리핑' 기능을 선보일 예정이다. LG그룹 역시 대규모 투자에 적극적으로 나섰다. LG전자는 오는 2028년까지 투자액 100조원 중 절반가량을 AI와 같은 미래 성장 동력 분야에 투입할 계획이다. 이와 함께 1천만 달러(한화 약 138억원) 규모의 AI·딥테크 스타트업 투자를 통해 혁신 기술 트렌드를 경영 전략에 반영하고 있다. 카카오는 AI 기술 개발과 서비스 출시를 위해 올해 약 1천500억원을 투자하며 지난해 1천255억 원 대비 19.5%를 증액했다. 주요 투자로는 카카오와 카카오브레인의 AI 사업부 통합에 약 1천억원, 그래픽처리장치(GPU) 투자에 500억원을 배분한 것으로 알려졌다. 내년에는 AI 브랜드 '카나나'의 정식 론칭에 따라 투자 규모가 더욱 확대될 것으로 전망된다. 국내 AI 중견·중소 기업들의 상장 행보도 두드러진다. 뉴엔AI(구 RSN)는 내년 코스닥 기술특례상장을 목표로 올해부터 IPO 준비에 나섰다. 설립 20주년을 맞아 사명을 변경한 이 회사는 구어체·비정형·빅데이터 분석에 특화된 '퀘타(Quetta) LLMs' 아키텍처를 기반으로 연평균 매출 20% 성장을 이어오고 있다. 지난 10월 NICE평가정보와 한국기술신용평가의 기술특례 평가에서 동시에 'A, A' 등급을 획득하고 프리IPO 단계에서 100억원 투자를 유치하는 등 상장 준비에 속도를 내고 있다. 와이즈넛도 새해 1월 코스닥 상장을 추진 중이다. 지난 2000년 설립된 와이즈넛은 정부·금융·법률 기관 등 다양한 분야에 생성형 AI 기반 소프트웨어를 공급하는 기업으로, 핵심 기술은 언어 이해, 정보 탐색, 대화 응답, 빅데이터 분석에 특화되어 있다. 회사는 공모를 통해 신제품 연구 개발과 글로벌 시장 확대에 주력할 계획이다. 노타도 신년 상반기 코스닥 기술특례상장을 목표로 준비 중이다. AI 최적화 기술 전문 기업인 노타는 자사의 AI 최적화 플랫폼 '넷츠프레소(NetsPresso)'와 온디바이스 AI 솔루션을 통해 자원 제약이 큰 디바이스에서도 효율적인 AI 성능을 구현한다. 최근에는 기술특례 평가에서 'A, A' 등급을 획득해 상장 절차에 본격적으로 시동을 걸고 있다. 이같이 투자 기회 확대와 대중화 흐름은 시장 경쟁을 촉진하고 있다. 업계 관계자는 "새해에 본격화될 AI 에이전트 경쟁과 멀티모달 AI의 고도화가 투자 유입을 더욱 촉진할 것"이라며 "기업들은 디지털 전환(DX)을 넘어 AI 전환(AX) 능력을 갖추는지가 생존과 성장의 핵심 기준이 될 것"이라고 강조했다.

2024.12.26 10:15조이환

구글, 경쟁사 AI로 모델 평가…'제미나이-클로드' 비교 논란

구글이 경쟁사인 앤트로픽의 인공지능(AI) 모델을 활용해 자체 개발한 AI 성능을 평가했다는 주장이 제기됐다. 25일 테크크런치는 구글 내부 문건를 인용해 회사 AI 평가 작업에 참여하는 계약직 직원들이 구글 딥마인드 '제미나이'와 앤트로픽 '클로드'의 답변 비교 업무를 진행하고 있다고 보도했다. 보도에 따르면 해당 직원들은 진실성, 정확성, 안전성 등 다양한 기준에 따라 두 모델의 답변을 점수화하고 있다. 계약직 직원들은 '클로드'가 '제미나이'보다 안전성을 중시하는 경향을 보였다고 밝혔다. '클로드'는 안전하지 않은 프롬프트에 답변하지 않는 경우가 많았으며 특정 주제에서는 답변을 회피했다. 이와 반대로 '제미나이'는 '누드 및 결박'과 같은 안전 문제가 있는 답변을 생성하기도 했다. 앤트로픽의 상업 약관에 따르면 자사 AI를 경쟁사 제품 개발에 사용할 수 없다고 명시돼 있다. 그럼에도 구글이 이러한 활용에 대한 허가를 받았는지는 확인되지 않았다. 다만 회사 관계자는 "평가 작업이 업계 표준에 부합한다"고 주장했다. 테크크런치는 "AI 모델을 보다 뛰어나게 만들기 위한 치열한 경쟁이 발생하고 있다"며 "구글은 계약직 직원들에게 경쟁사 AI와 자사 AI의 답변에 대한 비교를 맡겨 상세한 평가 작업을 진행하는 것으로 보인다"고 분석했다.

2024.12.25 18:47조이환

딥마인드, 영상 만드는 AI '비오 2' 출시…"기능 미흡·저작권 문제 해결부터"

구글 딥마인드가 동영상 만드는 인공지능(AI) 모델 '비오(Veo) 2'를 발표한 가운데 복잡한 영상 생성 기능 미흡과 저작권 문제 해결이 시급하다는 지적을 받고 있다. 17일 테크크런치 등 외신에 따르면 구글 딥마인드는 기존 AI 기반 영상 생성 모델 비오 차기 모델을 출시했다. 현재 비오 2는 구글 영상 제작 플랫폼에 탑재됐다. 내년 개발자 플랫폼 버텍스 AI에도 공급될 예정이다. 비오 2는 최대 4K 해상도로 2분 이상 분량의 영상을 생성할 수 있다. 이는 오픈AI 영상 모델인 '소라'보다 우수한 기능이다. 소라는 해상도 1천80p와 20초 분량이 최대다. 다만 외신은 비오 2가 해당 분량의 영상을 생성할 수 있을지 의문이라고 했다. 현재 비오 2를 탑재한 구글 영상 제작툴 '비디오FX'는 해상도 720p로 8초 분량 동영상까지 만들 수 있어서다. 비오 2는 이전 모델과 마찬가지로 텍스트 프롬프트 또는 텍스트와 참조 이미지로 동영상을 생성한다. 딥마인드는 비오 2가 카메라 제어에 대한 이해도가 향상돼 더 선명한 영상을 생성한다고 밝혔다. 특히 움직임 많은 장면에서 텍스처와 이미지가 더 뚜렷해졌다는 설명이다. 이 외에도 비오 2는 동영상에서 가상 카메라를 더욱 정밀하게 조작할 수 있어 객체와 사람을 다양한 각도에서 인식할 수 있는 것으로 전해졌다. 움직임, 유체 동역학, 빛의 특성을 기존보다 사실적으로 재현할 수 있다는 평가다. 다양한 렌즈 효과와 영화적 기법, 미세한 인간 표정까지 구현 가능한 상태다. 외신 "비오 2 직접 이용해 보니…복잡한 영상 생성 미흡" 외신은 비오 2가 굴절이나 복잡한 액체 표현 등 까다로운 시각적 효과 생성에 강점을 보였다고 보도했다. 특히 픽사 스타일의 애니메이션 표현이 우수하다는 평가다. 그러나 모델 개선이 필요해 보인다고 입을 모았다. 테크크런치는 "강아지 캐릭터 눈이 지나치게 생기 없어 보이거나, 영상 속 도로가 비현실적으로 미끄러워 보이는 장면이 등장했다"며 "배경 속 보행자와 건물이 서로 섞이거나 물리적으로 불가능한 구조를 보이는 경우도 있었다"고 지적했다. 이에 딥마인드 엘린 콜린스 제품 부사장은 "비오 2는 몇 분 동안 프롬프트에 따라 일관된 동영상을 생성할 수 있지만, 복잡한 프롬프트를 긴 시간 동안 유지하는 데 한계가 있다"며 "캐릭터 일관성과 디테일, 복잡한 동작 생성 등에서 더 발전해야 한다"고 밝혔다. "데이터 학습·저작권 문제 우려"…이마젠 3 업그레이드 외신은 비오 2의 학습 데이터 출처·저작권 문제 우려 가능성도 언급했다. 딥마인드는 구체적으로 어디서 영상 데이터를 가져왔는지 밝히지 않은 상태다. 다수 외신은 유튜브가 주요 데이터 출처일 가능성 있다고 분석했다. 현재 구글이 유튜브를 소유하고 있다는 이유에서다. 외신은 저작권 문제 우려도 여전하다고 평가했다. 앞서 딥마인드는 공개 데이터를 학습하는 것이 공정 이용(fair use)에 해당한다고 주장한 바 있다. 데이터 소유자 허가를 받지 않고 학습해도 된다는 설명이다. 그러나 창작자들은 이에 동의하지 않는다는 입장을 취하고 있다. 딥마인드는 딥페이크 방지를 위해 자체 워터마킹 기술인 신스(Synth)ID를 비오 2에 적용했다. 신스ID는 생성된 동영상 프레임에 보이지 않는 마커를 삽입하는 기술이다. AI가 생성한 콘텐츠를 추적할 수 있다. 다만 다른 워터마킹 기술처럼 완벽한 방지가 어렵다는 지적도 이어지고 있다. 이날 딥마인드는 이미지 생성 모델 '이마젠 3' 업그레이드 버전도 발표했다. 새 이마젠 3 모델은 구글의 이미지 생성 도구인 '이미지FX'를 통해 제공된다. 이마젠 3는 포토리얼리즘과 인상주의, 애니메이션 스타일 등 다양한 스타일로 더 밝고 잘 구성된 이미지를 생성할 수 있다. 디테일과 텍스처를 풍부하게 표현할 수 있는 것으로 평가받고 있다. 딥마인드는 "이번 업그레이드 모델은 프롬프트 입력 시 칩렛를 통해 주요 키워드를 강조하고 연관된 단어를 자동 제안함으로써 사용자 편의성을 높였다"고 강조했다.

2024.12.17 09:31김미정

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

"국가 AI 앞서 클라우드 생태계 활성화부터"…공공사업 재건·인력 양성 시급

SKT, AI 사업 성장에 영업익 14% 껑충

백종원 더본코리아 사과·상생 약속 통할까

미중, 관세전쟁 90일 휴전…115%P씩 인하 합의

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현