• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
APEC2025
국감2025
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'제미나이 2.5 플래시 이미지'통합검색 결과 입니다. (328건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

구글, 제미나이에 영상 AI 모델 '비오2' 탑재…"현실 이해하는 AI 구현"

구글이 영상 인공지능(AI) 모델 '비오2'를 AI 서비스 '제미나이'에 탑재해 동영상 AI 시장 경쟁력을 높였다. 16일 더버지 등 외신에 따르면 구글은 비오2를 유료 AI 서비스인 '제미나이 어드밴스드' 이용자에게 제공하기 시작했다. 비오는 텍스트를 영상 콘텐츠로 변형할 수 있는 생성형 AI 모델이다. 2023년 5월 처음 소개됐다. 비오2는 같은 해 말 공개된 후 소수 이용자에 한해 시범 운영됐다. 이번 제미나이 통합으로 활용 범위가 넓어졌다. 제미나이 어드밴스드 사용자는 16대9 화면 비율, 720픽셀(p) 해상도, 최대 8초 분량의 짧은 영상 클립을 생성할 수 있다. 완성된 영상은 MP4 형식으로 내려받을 수 있다. 콘텐츠가 AI로 제작된 것임을 알리기 위해 자체 인증 마크 '신스 ID' 워터마크를 영상에 삽입한다. 구글은 "비오2가 실제 촬영한 듯한 정밀한 디테일을 구현할 수 있다"며 "현실적 물리 법칙과 인체 움직임을 이해해 다양한 주제에 맞는 고품질 영상을 만들어낼 수 있다"고 강조했다. 앞서 데미스 허사비스 구글 딥마인드 최고경영자(CEO)도 비오와 제미나이 결합을 통해 AI의 물리 세계 이해력을 강화할 계획이라고 밝힌 바 있다. 앞서 오픈AI는 지난해 12월 최대 1분 분량 영상을 생성하는 '소라'를 공개했다. 메타는 같은 해 텍스트 기반 영상 생성 모델 '무비젠'을 출시했다. AI 스타트업 런웨이는 4세대 동영상 생성 모델을 출시하며 3억 달러(약 4천264억원)넘는 투자 유치를 기록하는 등 기술력과 시장 가능성을 동시에 인정받고 있다. 더버지는 "구글은 오픈AI와 메타, 런웨이 등과 동영상 생성 AI 분야 경쟁에 본격적으로 뛰어들었다"고 평가했다.

2025.04.16 17:43김미정

[AI는 지금] 앤트로픽도 'AI 음성 비서' 경쟁 가세…오픈AI·아마존·애플·삼성 넘을까

'오픈AI 대항마'로 꼽히는 앤트로픽이 자사 인공지능(AI) 챗봇인 '클로드'를 활용한 새로운 음성 비서 제품을 출시한다. 생성형 AI를 탑재한 'AI 음성 비서'가 최근 우후죽순 쏟아지면서 글로벌 빅테크의 새로운 격전지가 된 가운데 앤트로픽이 존재감을 키울 수 있을 지 주목된다. 16일 블룸버그통신에 따르면 앤트로픽은 '음성 모드'라고 불리는 새로운 기능을 이르면 이달 중 출시할 것으로 알려졌다. 음성 지원 기능의 도입으로 텍스트 입력 방식보다 훨씬 자연스럽게 AI와 소통할 수 있을 것으로 보인다. 초기에는 제한적인 서비스만 선보일 예정으로, '에어리'와 '멜로우', 영국식 억양의 '버터리' 등 세 가지 음성을 도입할 것으로 전해졌다. 앞서 앤트로픽은 '클로드'에 음성 기능을 추가하기 위해 음성 AI 스타트업 일레븐랩스, 아마존과 협력 중이란 소식이 전해진 바 있다. 앤트로픽 경영진도 음성 옵션을 개발 중이라고 밝힌 바 있지만, 구체적인 출시 일정과 세부 사항은 알려지지 않았다. 앤트로픽의 '음성 모드' 출시 소식은 앱 연구원 M1아스트라(M1Astra)가 앤트로픽의 코드에서 발견해 블룸버그통신에 공유하며 드러났다. 앤트로픽은 이번 일에 대해 공식 입장을 밝히지 않았다. 업계에선 앤트로픽의 이 같은 행보가 경쟁사인 오픈AI와의 격차를 줄이기 위한 움직임으로 해석했다. 앤트로픽이 최근 '클로드 리서치'란 기능을 추가한 것도 지난 2월 발표된 오픈AI '딥 리서치'를 견제하기 위한 것으로 보는 시각이 많다. 이 외에 구글 '제미나이', 미스트랄 '르샤' 역시 웹 검색 기능을 제공하고 있다. 여기에 앤트로픽은 클로드 이용자가 업무를 간소화할 수 있도록 지메일(Gmail), 구글 캘린더, 구글 문서도구에서 검색할 수 있는 기능도 조만간 추가할 예정으로, 기능 강화를 통해 시장 주도권을 잡겠다는 방침이다. 업계 관계자는 "앤트로픽의 음성 기능 도입은 경쟁사들에 비해 다소 늦은 편"이라며 "오픈AI, 구글, xAI 등은 이미 음성 기능을 공개했고 메타도 음성 모드를 강화한 '라마4'를 준비 중"이라고 말했다. 일각에선 앤트로픽이 경쟁사에 비해 다소 늦게 음성 기능을 도입한 만큼 경쟁사들보다 존재감을 더 드러낼 수 있을지 의문을 드러내기도 했다. 현재 AI 음성 비서 시장은 세계 최대 전자상거래 업체 아마존의 '알렉사 플러스'와 삼성전자 '빅스비', 구글 '제미나이 라이브', 애플 '시리' 등과 함께 오픈AI가 경쟁을 벌이고 있다. 특히 지난해 오픈AI의 GPT-4o 등장 후 AI 음성 비서 시장은 빠르게 기술 고도화가 진행되고 있다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "GPT-4o 이후에는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 AI 비서 시장에서 빅테크들의 경쟁이 치열해지면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 지난해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정됐다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로, 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 블룸버그통신은 "음성 비서는 사람들이 챗봇과 상호작용하는 방식을 바꾸고 사용자의 생산성을 높일 수 있다는 기대와 함께 오픈AI, 구글과 같은 AI 개발 업체의 핵심 기능으로 부상했다"며 "하지만 AI 음성 제품의 등장으로 다른 사람의 말투를 흉내 내는 것에 대한 우려도 커지고 있다"고 지적했다.

2025.04.16 16:12장유미

美 반도체 추가 관세 '초읽기'...年 23조원 수출 타격

도널드 트럼프 미국 행정부가 이르면 다음 주 발표할 수입 반도체 추가 관세에 PC·서버용 D램과 SSD 등을 생산하는 삼성전자와 SK하이닉스 등 국내 업체들이 촉각을 곤두세우고 있다. 과학기술정보통신부가 집계한 연간 정보통신산업(ICT) 수출입 현황에 따르면 지난해 대미 수출액(296억 2천만 달러) 중 반도체 수출액은 107억 5천만 달러(약 15조 3천230원), 컴퓨터 본체와 SSD는 62억 2천만 달러(약 8조 8천660억원)로 전체 금액의 57% 가량을 차지한다. 미국 관세국경보호국(CBP)이 지난 12일 메모리와 SSD, 스마트폰 등 품목에 대한 관세 유예를 발표했지만, 하워드 러트닉 미국 상무부 장관은 13일(미국 현지시간) "관세 유예는 한두 달 내에 발표될 반도체 관세의 일부로 재검토될 것"이라고 밝혔다. 국내 D램·SSD 제조사, 대부분 국내서 최종 조립 PC·서버용 D램은 메모리 반도체와 저항 등 각종 부품을 기판에 부착해 국내에서 조립하는 방식으로 생산된다. 2010년 후반기 들어 PC의 표준 저장장치로 자리잡은 SSD는 낸드 플래시 메모리 기반으로 작동한다. 삼성전자와 SK하이닉스는 낸드 플래시메모리와 컨트롤러, D램 등 국내에서 생산한 부품을 모아 SSD를 완성한다. 이 경우 한국산으로 분류돼 25%의 상호관세가 적용된다. 현재는 90일 관세 유예 조치에 따라 추가 관세 부여는 지연된 상황이다. 외장형 SSD 등 제품은 제조 경로에 따라 생산 국가가 달라진다. 한 국내 저장장치 제조사 관계자는 "국내에서 생산한 낸드 플래시 메모리를 공급받아 동남아시아 등에서 패키징한 후 이를 중국에서 조립해 판매하는 경우도 있다"고 설명했다. 부품으로 공급시 최종 생산 국가 따라 관세 달라 익명을 요구한 대형 제조사 관계자는 "GPU용 고대역폭 메모리(HBM) 등은 GPU 제조사로, 서버용 메모리는 주요 ODM 업체로, PC용 SSD는 주요 제조사에 공급되며 미국 시장에 바로 공급되는 물량은 극소수"라고 설명했다. 이 경우 미국 세관은 GPU 제조사나 ODM 업체, PC 제조사 등에서 조립돼 마지막으로 생산된 나라 국적에 따라 관세를 매긴다. 미국 CBP가 관보에서 밝힌 대로 90일이 지나면 최종 제품의 원가에 더해 베트남(46%), 대만(32%), 중국(125%) 등 생산 국가별 관세가 추가 부과된다. 반도체 추가 관세, 제품 원가 상승→수요 감소 영향 미국 관세국경보호국(CBP)이 지난 9일 메모리와 SSD 등 품목에 대한 관세 유예를 발표했지만 이는 최대 90일만 적용되는 임시 조치다. 도널드 트럼프 미국 대통령은 13일 대통령 전용기 '에어포스원' 안에서 "이르면 다음 주 안에 반도체 관련 추가 관세를 발표할 것"이라고 밝혔다. 반도체 추가 관세가 부가되면 원가는 그만큼 증가하며 수요 감소에 따라 제품에 탑재되는 메모리 및 시스템반도체 출하량도 줄어들 것으로 우려된다. 국내 반도체 업계 관계자들은 "개별 기업이 미국 정부 정책에 대응하는 것은 한계가 있으며 통상 정책에 책임이 있는 국가 차원에서 체계적인 대응이 시급하다"고 입을 모았다.

2025.04.14 16:05권봉석

챗GPT 다음은 '이것'?…구글 멀티모달 AI가 바꿀 로보틱스 혁명

데미스 하사비스 구글 딥마인드 최고경영자(CEO)가 구글의 인공지능(AI) 모델 '제미나이'와 영상 생성 AI '비오2'를 결합한다는 계획을 발표했다. 11일 테크크런치에 따르면 하사비스 CEO는 리드 호프먼 링크드인 공동 창립자가 진행하는 팟캐스트 파서블에 출연해 제미나이에 비오2를 결합해 물리 세계를 이해할 수 있는 AI 모델로 고도화하겠다고 밝혔다. 하사비스 CEO는 "비오2가 많은 유튜브 영상을 학습하는 것만으로도 현실 세계의 물리 법칙을 이해할 수 있다는 것에 놀랐다"며 "이는 로봇 산업에 엄청난 영향을 미칠 수 있다고 생각했다"고 말했다. 이어 "우리가 개발한 멀티모달 파운데이션 모델 제미나이와 비오2를 향후 결합할 계획"이라며 "AI가 단순 챗봇 수준을 넘어 인간이 살고 있는 현실 세계를 이해하고 도움을 줄 수 있도록 할 것"이라고 강조했다. 두 AI 모델을 결합해 유튜브 영상 학습과 같은 기존의 강화 학습만으로 복잡한 인간의 창의성과 행동을 모방할 수 있는 '인공 일반 지능(AGI)'에 도달할 수 있다는 게 구글의 기대다. 특히 로보틱스 산업에서의 활용도 성공적일 것이란 관측이다. 로보틱스 기술에 필요한 물리적 상호작용 없이도 영상 AI를 기반으로 현실 세계를 이해할 수 있다는 것이다. 앞서 구글 딥마인드는 로봇 맞춤형 AI 모델인 '제미나이 로보틱스'와 다른 고급 시각·언어·행동(VLA) 모델 대비 성능이 2배 향상된 벤치마크 결과도 발표한 바 있다. 하사비스 CEO는 "우리 삶에 실질적인 도움을 주는 AI 기술은 로보틱스 영역에도 필요하다"며 "물리 법칙을 이해하는 멀티모달 모델들에 로봇이 필요로 하는 행동, 운동 제어, 계획 수립과 관련된 미세조정을 수행해 이를 성공적으로 구현할 수 있다"고 설명했다. 이어 "범용 AI 모델에 데이터를 추가 학습하거나 특별한 노력 없이도 로보틱스 환경에 알맞은 AI를 개발·이식할 수 있다"며 "이는 5년 전 최고의 로봇공학자들조차 예측하기 어려웠던 결과"라고 덧붙였다. 그러면서 "우리가 만들고 있는 범용 멀티모달 모델들이 충분히 정교해져 로봇에 그대로 탑재될 것"이라며 "언어·과학 분야에 챗GPT·알파고·알파폴드가 가져온 결정적인 순간이 아직 로보틱스 산업에는 오지 않았으나 그 시점이 곧 올 것"이라고 강조했다.

2025.04.11 11:16한정호

"AI도 기업 맞춤형 시대"…구글, 안드로이드 스튜디오에 제미나이 탑재

구글이 기업에서 인공지능(AI)를 보다 자유롭고 안전하게 활용할 수 있는 길을 제시했다. 11일 구글은 기업용 안드로이드 스튜디오에 대규모 언어 모델 제미나이를 통합하는 업데이트를 실시했다고 공식 블로그를 통해 밝혔다. 기존의 AI 보조 도구가 범용 모델을 바탕으로 비교적 단편적인 코딩 지원을 제공했다면 제미나이는 실시간 문맥 파악, 프로젝트 전반의 흐름 인식, 멀티모달 이해 능력을 바탕으로 한 고정밀 개발 지원을 제공한다. 특히 눈에 띄는 점은 기업 고객을 고려한 보안과 통제 기능이다. 제미나이는 사용자 코드와 입력, 생성된 제안들을 외부 학습에 사용하지 않도록 기본 설정되어 있다. 민감한 코드 폴더나 파일 단위까지 AI의 접근을 제한하는 것도 가능하다. 이를 통해 내부 소스 코드 유출을 걱정하던 기업들이 AI를 안전하게 활용할 수 있는 환경을 제공한다. 더불어 구글은 생성형 AI가 제공한 코드와 관련해 저작권 문제가 발생할 경우를 대비해 'AI IP 면책 프로그램'도 도입했다. AI IP 면책 프로그램은 AI가 생성한 코드와 관련해 저작권 침해 주장 등 법적 문제가 발생했을 때 구글이 기업 고객을 보호해주는 제도다. 제미나이가 만든 코드 등으로 저작권 침해 소송이 들어올 경우 구글이 책임을 지고 방어 및 손해배상 책임 일부 또는 전부를 부담한다. 이 밖에도 디자이너가 만든 와이어프레임 이미지나 UI 스케치를 기반으로 실제 안드로이드 UI 코드를 자동 생성하는 프로그래밍뿐만 아니라 디자인 등 다양한 개발 업무를 지원한다. 구글은 이번 기능들이 보안과 규제가 엄격한 헬스케어, 금융, 공공 산업 영역에서 폭넓게 활용될 수 있을 것으로 기대하고 있다. 구글의 산디햐 모한 제품 관리자는 "기업용 안드로이드 스튜디오 제미나이의 새로운 기능은 크고 작은 조직의 개인 정보 보호, 보안 및 관리 요구 사항을 충족하도록 특별히 설계됐다"며 "특히 더욱 민감한 데이터 보호가 필요하다는 기업 의견을 수렴해 기존과 동일한 기능을 제공하면서도 조직에 필요한 추가적인 개인 정보 보호 기능 지원에 집중했다"고 설명했다.

2025.04.11 09:39남혁우

오픈AI, 챗GPT '기억 기능' 전면 개편…자동화로 진화한 'AI 개인화'

오픈AI가 '챗GPT'의 기억력을 대폭 업데이트했다. 기존처럼 명령을 입력해야 정보를 기억하던 방식에서 벗어나 대화 중 중요한 내용을 인공지능(AI)이 스스로 저장·활용하도록 자동화 수준을 높였다. 11일 테크크런치 등 외신에 따르면 오픈AI는 '챗GPT'의 '메모리 기능' 업데이트를 유료 구독자에게 단계적으로 적용한다. 해당 기능은 텍스트·음성·이미지 생성 전반에 과거 대화 내용을 반영해 문맥을 보완하는 방식이다. 이전에도 메모리 기능은 존재했으나 이번 업데이트를 통해 자동화 수준과 활용성이 크게 강화됐다. 이번 기능은 '참조 저장 메모리즈(reference saved memories)'라는 이름으로 설정 메뉴에 포함된다. 이용자는 이를 통해 '챗GPT'가 자신에 대해 어떤 정보를 기억하고 있는지 직접 확인할 수 있게 된다. 저장된 메모리를 개별 삭제하거나 전체 기능을 끌 수도 있다. 별도 저장을 원치 않을 경우 일시적인 대화 모드를 선택하는 것도 가능하다. 이 기능은 기존 메모리 기능의 확장 버전이다. 지난해 오픈AI는 이용자가 직접 특정 정보를 저장·삭제 요청할 수 있는 기능을 도입한 바 있다. 이번에는 저장·반영 과정이 자동화되면서 대화의 흐름과 자연스러움을 크게 높였다는 설명이다. 기능은 우선 '챗GPT' 프로(Pro) 및 플러스(Plus) 이용자를 대상으로 배포된다. 단 영국·유럽연합·아이슬란드·리히텐슈타인·노르웨이·스위스 지역은 현지 규제에 따른 외부 검토 절차가 남아 있어 도입이 미뤄졌다. 오픈AI는 이들 국가에도 향후 기능을 제공할 계획이라고 밝혔다. 무료 이용자에게 해당 기능이 언제 적용될지에 대해서는 구체적인 일정이 공개되지 않았다. 오픈AI 측은 "현재로선 유료 이용자에 집중하고 있다"는 입장을 밝혔다. 한편 이 같은 기능 강화에 대해 일각에서는 개인정보 수집 확대 우려도 제기된다. 다만 업계에서는 설정을 통해 이용자가 기능을 직접 제어할 수 있다는 점에서 자율성과 투명성 측면은 일정 수준 확보했다는 평가도 이어지고 있다. 테크크런치는 "이번 '메모리 기능'은 '챗GPT' 대화 경험을 더 유기적이고 개인화된 방식으로 바꿀 것"이라며 "구글도 유사한 기능을 자사 '제미나이'에 도입한 만큼 생성형 AI 시장의 차별화 경쟁이 본격화되는 신호"라고 전했다.

2025.04.11 09:33조이환

오픈AI 이어 구글도 앤트로픽 기술 'MCP' 채택…AI 에이전트 강화 행보

구글이 인공지능(AI) 에이전트 강화를 위해 앤트로픽이 개발한 오픈소스 AI 에이전트 기술인 '모델 컨텍스트 프로토콜(MCP)'을 채택했다. 10일 테크크런치에 따르면 데미스 하사비스 구글 딥마인드 최고경영자(CEO)는 X(옛 트위터)를 통해 구글이 AI 모델 제미나이와 소프트웨어 개발 킷(SDK)에 MCP 지원을 추가한다고 발표했다. 앤트로픽이 개발·표준화한 MCP는 AI 모델이 비즈니스 툴과 SW뿐만 아니라 콘텐츠 저장소 및 앱 개발 환경 전반에서도 데이터 추출·연결할 수 있는 기술이다. 이를 통해 AI 모델이 더욱 정확하고 풍부한 답변을 제공하며 AI 애플리케이션 간의 양방향 연결을 구축할 수 있다. 이같은 MCP는 고도화된 AI 에이전트를 구현하기 위한 핵심 기술로 주목을 받으며 많은 AI 기업들의 관심을 받는 상황이다. 특히 앤트로픽의 경쟁사인 오픈AI도 챗GPT 서비스 강화를 위해 MCP 기술을 수용한다고 발표한 바 있다. 샘 알트먼 오픈AI CEO는 AI 서비스 전반에 걸쳐 MCP 지원을 추가한다고 밝혔다. 구글은 MCP 기술을 토대로 제미나이 모델의 에이전트 기능을 향상시키는 동시에 MCP 생태계 확장에도 동참한다는 방침이다. 데미스 하사비스 CEO는 "MCP는 우수한 프로토콜이며 AI 에이전트 시대의 개방형 표준으로 빠르게 자리 잡고 있다"며 "MCP 팀, 업계의 파트너들과 함께 MCP를 더욱 발전시켜 나갈 것"이라고 강조했다.

2025.04.10 14:42한정호

"AI, 업무 전반에 녹아든다"…구글, 인프라부터 에이전트까지 '기술 총동원'

구글 클라우드가 인공지능(AI) 전 계층에 걸친 기술 청사진을 공개하며 업무 자동화를 넘어 AI 기반 기업 운영 방식 전반의 전환을 예고했다. 구글 클라우드는 최근 '구글 클라우드 넥스트 25'를 앞두고 회사의 핵심 AI 기능을 미리 소개하는 기자간담회를 진행했다. 라스베이거스에서 열리는 본 행사에 앞서 글로벌 미디어를 대상으로 열린 간담회는 내부 전략 변화와 제품 로드맵이 집약된 자리로, 행사 본무대 발표에 앞서 방향성을 선제적으로 공유한 성격이 짙다. 9일 업계에 따르면 이번 발표는 단순한 기능 소개를 넘어 구글 클라우드의 AI 전략을 총체적으로 드러낸 이정표로 풀이된다. 발표에는 멀티에이전트 시스템 구축 도구는 물론, '제미나이 2.5' 모델과 7세대 텐서플로우 처리장치(TPU) '아이언우드', 생성형 미디어 기술 등 AI 전 계층을 포괄하는 기술이 포함됐다. "누구나 만드는 AI 동료"…전방위 에이전트 생태계 완성한다 가장 주목되는 것은 '에이전트 개발 키트(ADK)'다. ADK는 단 몇 줄의 코드만으로 고도화된 업무 에이전트를 구축할 수 있는 개발 프레임워크다. 추론 범위나 행동 규칙 등을 세밀하게 조정할 수 있으며 자사 AI 플랫폼인 버텍스 AI와 연동돼 확장성과 보안성까지 확보했다. ADK를 통해 기업은 다양한 사내 시스템이나 서비스형 소프트웨어(SaaS)와 연결되는 복수의 에이전트를 동시에 구성할 수 있다. 보고서 생성, 고객 분석, 문서 처리, 일정 조율 등의 업무를 각각의 에이전트에 맡기고 이들을 연계하는 멀티에이전트 구조도 구현 가능하다. 에이전트 상용화를 위한 '마켓플레이스'도 공개됐다. 이곳에서는 계약서 검토, 리스크 분석, 법률 요약, 고객 상담 등에 특화된 사전 제작 에이전트를 선택해 곧바로 업무에 적용할 수 있다. 업무별로 필요한 기능을 조합하는 모듈형 에이전트 전략이다. 에이전트 간 상호작용도 지원한다. 구글은 '에이전트 간 상호운용(A to A)'을 통해 플랫폼, 개발 프레임워크, 클라우드 환경이 달라도 서로 협력할 수 있도록 했다. 추상화된 요청을 공유하고 상황에 맞는 판단을 수행하는 방식으로, 서비스나 기업 경계를 넘는 에이전트 협업이 가능해졌다. 이미 세일즈포스, SAP, 서비스나우 등 50여 곳의 글로벌 벤더가 'A to A'에 참여 중이다. 비개발자용 실무 에이전트 플랫폼 '에이전트 스페이스(Agent Space)'도 처음 공개됐다. 이 공간에서는 기업의 일반 임직원이 사내 데이터를 기반으로 자연어로 에이전트를 생성하고 실행한다. 생성된 에이전트는 사내 시스템에 연결돼 실시간 보고서 작성, 고객 리스크 예측, 일정 예약 등 복잡한 업무를 수행한다. 이날 구글 관계자는 금융 담당자로서 데모를 시연하면서 자연어로 "내 고객 포트폴리오에서 리스크 신호를 찾아줘"라고 요청했다. 이에 에이전트가 사내 데이터에서 이상 거래를 식별하고 예상 시나리오를 분석한 뒤 자동으로 관련 요약 보고서와 이메일을 작성했다. '에이전트 스페이스'에서는 이러한 작업을 반복 자동화하는 '개인 에이전트'도 생성할 수 있다. 매일 아침 고객 현황을 요약하고 예상 리스크를 음성으로 전달하는 알림 기능도 제공된다. 마이크로소프트 원드라이브, 세일즈포스, 빅쿼리, 구글 드라이브 등 다양한 사내외 시스템과 연동돼 실시간 데이터 기반의 맞춤형 업무 수행이 가능하다. 기존의 구글 '워크스페이스' 전반에도 에이전트 개념이 도입된다. 구글 문서 도구에서는 주장의 논리와 구조를 분석해 개선을 제안하는 '헬프 미 리파인' 기능이 추가됐고 스프레드시트에서는 데이터 인사이트를 자동 추출해주는 분석 기능이 적용됐다. 화상회의 플랫폼 구글 미트에서는 실시간 회의 요약 외에도 회의 중 놓친 내용을 AI가 요약해주는 기능이 곧 적용된다. 버티컬 특화 에이전트는 이미 적용이 시작됐다. 미국의 패스트푸드 업체인 웬디스는 드라이브스루에서 다국어 AI 에이전트를 운영 중이며 메르세데스벤츠는 차량 내 음성 비서로 구글의 오토모티브 에이전트를 통합했다. 홈디포는 DIY 고객에게 24시간 전문가 수준의 상담을 제공하는 AI 에이전트를 활용하고 있다. 케이티 왓슨 구글 클라우드 제품 커뮤니케이션 디렉터는 "지금은 단일 질문에 답하는 AI에서 복잡한 문제를 해결하는 에이전트의 시대로 넘어가는 전환점"이라며 "이 에이전트들이 서로 연결되고 확장될 수 있도록 생태계 전체를 준비하고 있다"고 밝혔다. 추론 성능 중심으로…AI 인프라, TPU로 전면적 재설계 이같이 에이전트가 실질적인 업무 수행까지 가능해진 배경에는 이를 뒷받침하는 AI 인프라와 모델, 플랫폼의 전방위적 진화가 있다. 구글은 AI 에이전트를 단순한 인터페이스 수준에서 끝내지 않고 이를 작동시키는 연산 자원, 데이터 연결성, 모델 성능, 멀티모달 대응력 등 모든 층위를 통합적으로 끌어올리고 있다. 실제로 구글은 초대규모 모델 추론(inference) 성능을 획기적으로 끌어올린 7세대 텐서플로우 처리장치(TPU)인 '아이언우드(Ironwood)'를 이날 처음 공개했다. GPU 기반 아키텍처와의 차별화가 두드러지는 이 칩은 구글 내부 대규모 서비스에서 이미 검증됐으며 본격적인 외부 제공을 예고하고 있는 상황이다. '아이언우드'는 추론에 최적화된 설계로, 기존 6세대 TPU '트릴리움' 대비 전력 효율이 두 배 향상됐다. 총 9천개 칩을 하나의 팟(Pod)으로 묶어 슈퍼컴퓨터처럼 사용할 경우 최대 42.5 엑사플롭스 수준의 연산 성능을 제공한다. 이는 미국 정부가 보유한 세계 최대 슈퍼컴퓨터 보다 24배 이상 높은 수준이다. 초거대 모델 시대에서 추론 성능은 AI의 실전화에 직결되는 요소다. 구글은 이번 발표를 통해 학습보다 '서빙'에 특화된 AI 인프라가 새롭게 부상하고 있음을 강조했다. 네트워크 측면에서도 기존 한계를 넘는 구조가 제시됐다. 구글은 이번에 기업 고객을 위한 사설 글로벌 네트워크 서비스 '클라우드 WAN'을 함께 선보였다. 이는 구글이 전 세계에 구축한 사설 광케이블망(200만 마일 이상)을 외부 고객도 이용할 수 있도록 한 것으로, 네트워크 지연을 최소화하면서도 최대 40% 수준의 비용 절감이 가능하다. 특히 다국적 기업의 멀티리전 운영이나 멀티클라우드 환경에서 강점을 지닌다. AI 시스템을 구성하는 소프트웨어 스택의 효율성도 크게 향상됐다. 특히 쿠버네티스 환경에서는 AI 추론 작업에 특화된 자동 확장인 '스케일링'과 작업 분산 인 '로드밸런싱' 기능이 새로 추가됐다. 사용자가 많아져도 안정적으로 대응할 수 있고 최대 30%의 비용 절감, 60%의 응답 지연 감소 효과를 기대할 수 있게 됐다. AI 모델 런타임 영역에서는 구글 딥마인드가 내부에서 사용하던 머신러닝 런타임 '패스웨이(Pathways)'가 클라우드 고객에게 처음 개방됐다. 이 기능은 수백 개의 TPU를 동시에 연결해 초대형 모델의 안정적인 실시간 서빙을 지원한다. 모델은 고도화, 플랫폼은 통합…AI 실전 투입 위한 전열 정비 구글 클라우드는 이날 자사의 차세대 AI 모델 '제미나이 2.5'의 공식 출시를 발표하며 '프로(Pro)'와 '플래시(Flash)' 두 가지 버전을 공개했다. '프로'는 복잡한 추론과 정밀한 문제 해결에 최적화된 모델이며 '플래시'는 속도와 비용 효율성을 중시한 경량형 모델이다. 특히 '플래시'는 프롬프트의 난이도에 따라 자동으로 추론의 깊이를 조절하고 고객 예산에 맞춰 유연하게 운용 가능하도록 설계됐다. 두 모델 모두 '다층적 사고', '자기 반성적 추론' 등 고차원적 사고 능력을 갖추고 있으며 기존 챗봇을 넘어 복합적인 문제 해결까지 가능하다. 텍스트는 물론 이미지, 음성, 영상, 코드 등 다양한 입력을 통합적으로 이해하고 대응하는 멀티모달 처리 능력도 한층 강화됐다. 특히 초거대 AI 중 가장 긴 '컨텍스트 윈도우'를 갖춰 긴 문서나 복잡한 대화 흐름도 놓치지 않고 처리할 수 있다는 점이 강조됐다. 이날 구글은 '제미나이 2.5'의 기반이 되는 '버텍스 AI' 플랫폼도 대폭 확장했다고 밝혔다. '버텍스 AI'는 다양한 생성형 AI 모델을 선택·조합해 구축, 학습, 배포까지 가능한 통합 플랫폼으로, 현재 200개 이상 대형 모델을 제공한다. 여기에는 미스트랄, 라마 등 오픈모델도 포함되며 향후 허깅페이스와의 협업을 통해 수십만 개 오픈소스 모델을 추가할 계획이다. '버텍스 AI'의 생성형 미디어 기능도 대폭 강화됐다. '이마젠(Imagen)', '오디오(Audio)', '비디오(Video)', '리리아(Lyria)' 등 이미지, 음성, 영상, 음악을 생성하는 모델들이 추가됐고 이들을 통합적으로 활용할 수 있는 '버텍스 AI 미디어 스튜디오'가 공개됐다. 이를 통해 텍스트 한 줄로도 고품질 콘텐츠를 자동 제작할 수 있다. 실제 데모에서는 구글 관계자는 라스베이거스의 정적 이미지를 업로드해 드론샷 스타일의 영상으로 자동 변환하고 자동 생성된 음악을 입힌 뒤 특정 인물만 제거하는 '인페인팅' 기능까지 시연했다. 캐리 타프 구글 클라우드 산업·솔루션 부문 부사장은 "이번 발표는 AI 기술력뿐 아니라 실질적인 비즈니스 임팩트를 중시한 결과"라며 "초대형 모델에서 보안, 개발, 콘텐츠 제작까지 AI가 실무에 작동되는 모든 층위를 정비했다"고 말했다.

2025.04.09 21:01조이환

'尹 탄핵심판' AI에게 물었더니…클로드 "인용 가능성 75%"

헌법재판소의 윤석열 대통령 탄핵심판 선고가 하루 앞으로 다가오면서 긴장이 고조되고 있다. 대한민국 헌정사에 중대한 분기점이 될 판결인 만큼 국내 뿐 아니라 전 세계적으로도 많은 관심이 쏠리고 있다. 3일 지디넷코리아는 클로드 소네트, 딥시크 R1, GPT-4o, 퍼플렉시티, 구글 제미나이 등 대표적인 인공지능(AI) 모델들에게 헌재의 탄핵심판 선고 결과를 어떻게 예측하는지 질문했다. 분석 결과 클로드 소네트가 탄핵 인용 가능성을 75%로 가장 높게 예측했다. 반면 퍼플렉시티는 인용 가능성 35%로 비교적 낮게 판단했다. AI 모델들은 ▲헌법 위반의 중대성 ▲재판관 구성 및 성향 ▲절차적 하자 여부 ▲여론 지형 등 여러 요인들을 기반으로 논리적 전망을 제시했다. 다만 이번 결과는 각 AI 모델이 특정 시점에 입력된 프롬프트와 데이터를 바탕으로 생성한 예측이다. 동일한 모델이라 하더라도 입력값과 조건에 따라 수치는 달라질 수 있다. 클로드 소네트 "헌법 위반 중대성 높고 국민 여론도 강력" 탄핵 인용: 75% 탄핵 기각: 24% 탄핵 각하: 1% 클로드 소네트는 인용 가능성을 가장 높게 제시했다. ▲비상계엄 선포 검토 ▲국회 장악 시도 ▲선관위 장악 기도 ▲불법 체포 지시 등 5가지 탄핵 사유 중 하나만 중대한 위헌으로 인정될 경우 파면이 가능하다는 판단이다. 특히 클로드 소네트는 '5분 국무회의'의 절차적 흠결 증언과 중도층 여론(찬성 70% 이상)이 인용 가능성을 높이는 요인으로 작용한다고 보았다. 딥시크 R1 "재판관 구성상 인용 유력, 다만 절차 변수 주의" 탄핵 인용: 65% 탄핵 기각: 25% 탄핵 각하: 10% 딥시크 R1은 헌재 재판관 8인의 성향(보수 3, 중도 2, 진보 3)에 주목했다. 보수 재판관 일부가 사회적 합의를 고려해 찬성표를 던질 가능성이 있다고 분석했다. 또 국회 탄핵소추 과정에서의 절차적 논란이 각하 논의로 번질 수 있다고 판단했다. GPT-4o "정치적 파장과 실행 여부 사이에서 중립적 시각" 탄핵 인용: 50% 탄핵 기각: 30% 탄핵 각하: 20% GPT-4o는 탄핵 인용과 기각(혹은 각하) 가능성을 같은 것으로 분석했다. 비상계엄은 검토 단계에 머물렀고, 직접적 실행은 없었다는 점에서 "위헌 요소는 있지만 직무상 중대 위반은 아님"이라는 판단 여지가 있다고 보았다. 헌재의 보수적 성향과 국정 안정 고려가 기각에 힘을 실을 수 있고, 절차상 흠결 논란으로 각하 가능성도 20%로 제시했다. 퍼플렉시티 "기각 가능성이 현실적으로 가장 높아" 탄핵 인용: 35% 탄핵 기각: 60% 탄핵 각하: 5% 반면 퍼플렉시티는 재판관 간 의견 분열이 인용 가능성을 낮춘다고 분석했다. 과거 박근혜 탄핵은 만장일치였지만, 이번 사건은 헌법 위반의 중대성 해석에 따라 4:4 구도가 될 가능성이 높다고 평가했다. 또한 정치적 판단보다는 법리적 보수주의가 우세할 경우, 기각이 가장 가능성 높은 시나리오로 작용할 것이라 전망했다. 구글 제미나이 "복잡한 변수 많은 만큼 특정 확률 제시는 부적절" 예측 확률: 제시하지 않음 구글 제미나이는 다른 모델과 달리 탄핵 인용·기각·각하에 대해 특정 확률을 제시하지 않았다. 대신, 각 가능성의 논리적 배경과 영향을 미치는 요인을 깊이 있게 분석했다. 인용 여부는 헌법 위반의 중대성 여부, 과거 판례, 국민 여론의 압력 등이 변수이며, 재판관의 독립적 판단이 결정적일 것으로 예측했다. 반면 계엄 선포와 같은 핵심 행위가 실행에 이르지 않았다는 점에서 '직무상 중대성'을 문제 삼아 기각될 가능성도 제기했다. 더불어 절차적 하자가 심판 대상 자체의 부적합성으로 이어질 경우 기각될 수 있을 것으로 언급했지만 실제 실현 가능성은 낮을 것이라고 전망했다. 다수 AI 모델은 탄핵 인용 가능성을 가장 유력한 시나리오로 판단했으나, 재판관 성향 및 절차적 변수 등 불확실성이 여전히 존재한다. 구글 제미나이처럼 확률을 제시하지 않고 해석 중심으로 접근한 시도는 이번 탄핵심판이 단순 예측을 넘어 법리와 헌정 원칙의 정면 충돌이라는 분석이다.

2025.04.03 16:43남혁우

"트래픽 폭주에 발목"…오픈AI, 신규 유저에 '소라' 영상 생성 제한

오픈AI가 자사 멀티모달 생성형 인공지능(AI) 영상 서비스 '소라(Sora)'의 영상 생성 기능을 일부 사용자에 한해 제한했다. 지브리풍 이미지 생성 기능이 화제를 모으며 사용자가 급증한 데 따른 후속 조치다. 1일 테크크런치에 따르면 오픈AI는 최근 소라 영상 생성 기능을 신규 계정에서 사용할 수 없도록 설정했다. 소라에 최초 로그인한 사용자에겐 이미지 생성 기능만 제공되며 영상은 차단된다. 이번 제한 조치는 지난주 소라에 새롭게 추가된 이미지 생성 기능이 공개된 이후 내려졌다. 해당 기능은 미야자키 하야오 감독의 '스튜디오 지브리' 스타일을 재현할 정도로 뛰어난 품질을 자랑하며 소셜미디어를 중심으로 폭발적인 반응을 이끌었다. 다만 예상치를 훌쩍 웃도는 사용자 유입으로 서버 과부하 문제가 불거졌다. 오픈AI는 이에 따라 트래픽 조절이 시급하다고 판단해 신규 계정 중심으로 영상 기능을 잠정 차단한 것으로 보인다. 영상 생성을 차단한 오픈AI의 공식 지원 페이지에는 "현재 트래픽이 급증해 신규 계정에 대해 영상 생성을 임시로 비활성화했다"는 공지가 게재됐다. 기존 사용자 계정은 여전히 영상 생성이 가능하다. 샘 알트먼 오픈AI 최고경영자(CEO)는 지난 주말 X(구 트위터)를 통해 "출시 이후 지금까지 수요를 따라잡지 못하고 있다"며 "서비스 유지를 위해 직원들이 야근과 주말 근무까지 하고 있다"고 밝힌 바 있다.

2025.04.01 12:17조이환

캐논코리아, 대형 잉크젯 프린터 2종 출시

캐논코리아가 31일 A1 출력 가능한 잉크젯 프린터·복합기 신제품을 국내 출시했다. 신제품은 이미지프로그래프(imagePROGRAF) TC-21 잉크젯 프린터, TC-21M 잉크젯 복합기 등 총 2종이다. 용지 설정과 잉크 충전 등 모든 조작을 본체 전면에서 처리할 수 있고 각도를 조절할 수 있는 틸트식 조작 패널을 탑재해 2023년 출시된 전세대 제품 대비 편의성을 강화했다. 자동낱장공급장치(ASF)는 최대 A1(594×841mm) 크기 건축, 설계 도면 등 포스터와 약국 약봉지, 전단지 등 소형 용지 공급이 가능하다. TC-21M은 A4 용지 처리 가능한 평판 스캐너를 탑재해 A4 용지 확대 복사, 스캔 원고 확대·분할로 A0 크기 포스터를 제작할 수 있다. 무료로 제공되는 포스터아티스트 소프트웨어를 이용해 포스터나 전단지를 제작하고 출력 가능하다. 본체 금속의 5%는 재생 철, 본체 플라스틱의 40%는 재생 플라스틱을 적용했고 포장용 완충재는 스티로폼 대신 재활용 골판지를 적용했다. 박정우 캐논코리아 대표이사는 "신제품 2종은 편의성 개선과 함께 뛰어난 출력 품질과 다양한 용지 대응성을 갖춰 소규모 사업자부터 음식점, 건축·설계 분야까지 폭넓은 고객층의 요구를 충족할 수 있도록 설계한 제품"이라고 밝혔다.

2025.03.31 09:51권봉석

[써보고서] 그림도 글도 한 번에…'챗GPT 이미지 생성기' 미래 바꾼다

"이번에 업데이트된 '챗GPT' 이미지 생성기를 확인해봤습니다. 단순히 기존 이미지를 조합하는 수준이 아니라 텍스트의 의미를 더 깊이 이해하고 새로운 스타일과 구성, 언어 표현까지 가능합니다. 한글도 꽤나 잘 표현되고 긴 문장도 잘 소화합니다. 이제 그림과 관련해 뭐가 안 될 거라고 말하기가 무서울 정도네요." 한 국내 인공지능(AI) 전문가는 30일 자신의 소셜미디어를 통해 '챗GPT 이미지 생성기(ChatGPT Image Generator)'의 최신 업데이트 버전을 이같이 평했다. 그만의 생각이 아니다. 실제로 소셜미디어 곳곳에서는 해당 서비스에 대해 수많은 유저들이 뜨겁게 반응하며 새로운 사용사례를 발굴하고 다양한 실험을 이어가고 있다. '챗GPT 이미지 생성기'는 오픈AI가 자사의 거대언어모델(LLM)인 '챗GPT'의 '4o' 버전에 통합한 이미지 생성 기능이다. 지난 25일 기존 '달리' 이미지 생성기에서 새롭게 업데이트된 이번 버전은 기존 대비 뛰어난 언어 이해력과 창의성을 기반으로 훨씬 자연스럽고 풍부한 이미지 생성이 가능해졌다는 평가를 받고 있다. 이번에 공개된 버전은 단순한 그림 제작을 넘어, 사실상 '무엇이든 가능한 수준'에 도달했다는 평가다. ▲텍스트와 그래픽 요소가 결합된 시각자료 제작 ▲기존 이미지의 특정 글자나 오브젝트만 정밀하게 수정하는 리터칭 ▲실사 이미지의 형태를 유지하면서 전혀 다른 테마로 재해석하는 작업까지 대부분 구현이 가능하다. "AI가 만든 인포그래픽"…그림뿐 아니라 '시각 설명'까지 완성 무엇보다 주목할 점은 '그림과 글자 조합'에 대한 처리 능력이다. 우리가 일상적으로 확인하고 처리하는 대부분의 시각 자료는 이미지와 텍스트의 조합으로 구성돼 있다. 이 생성기는 이제 그런 형태의 콘텐츠라면 어지간한 수준까지 대부분 구현할 수 있을 만큼 진화했다. 일례로 최근 기자가 국내 AI 기업인 S2W를 인터뷰한 기사를 준비하며 회사와 밀접히 연관된 개념인 '온톨로지'와 '지식그래프' 같은 개념을 시각적으로 설명할 삽화가 필요했던 사례가 있다. 이 개념들은 본질적으로 매우 추상적이어서 그림으로는 설명이 어려울 수 있다. 그런데 이번 이미지 생성기는 그런 우려를 뛰어넘었다. 기자가 두 개념을 상징하는 그림들을 그려달라고 콘셉트와 설명을 입력하자 개념을 직관적으로 시각화한 고품질 그래픽을 수십 초 만에 생성해냈다. 지식그래프는 '데이터 간의 관계'를 시각적으로 보여주는 구조이고 '온톨로지'는 그 안의 개념과 의미를 정의한 일종의 '표준 사전'이다. 생성된 그림은 이 개념들을 처음 접하는 사람도 쉽게 이해할 수 있을 만큼 명확하게 표현해 줬다. 발표자료나 기사 내 삽화로도 손색이 없을 정도의 직관적 간단함을 보여줬다. 여기에 활용도를 한층 끌어올린 요소는 바로 영어 텍스트 처리 능력이다. 과거 이미지 생성기들은 영어조차 정확히 표현하지 못하는 경우가 많았다. 'AI' 같은 단어는 무난했지만 '국가안보(National Security)'처럼 긴 단어의 경우 알파벳이 일부 누락되거나 다른 글자로 바뀌는 문제가 흔했다. 이번 업데이트 이후에는 영어 문장을 거의 완벽하게 반영해 이제 굳이 외주를 맡기지 않아도 될 정도로 안정적인 결과물을 얻을 수 있다. 이 강점은 인포그래픽 제작에서 빛을 발한다. 예를 들어 앞서 언급한 '지식그래프'와 '온톨로지' 개념을 영어 발표자료로 만드는 실험을 해보기 위해 기자는 '챗GPT'에게 "이 기사 내용을 바탕으로 1슬라이드짜리 인포그래픽을 만들 수 있게 개념을 정리해줘"라고 지시했다. 이에 '챗GPT'는 즉각 구체적인 구성안을 제시했고 "이 구성을 기반으로 텍스트나 디자인 워딩도 만들어줄 수 있다"며 "필요하면 파워포인트, 피그마, 웹용, 포스터 등 포맷에 맞춰 최적화도 가능하다"는 제안까지 곁들였다. 이에 기자는 '스타트업 감성'과 '노랑-하양' 계열 톤을 지정하며 포스터 형태로 직관적으로 이해 가능한 버전을 요청했다. 결과는 기대 이상이었다. 영어 문장 표현이 완벽하게 구현됐고 복잡한 개념도 깔끔하게 시각화됐다. 발표 자료로 바로 활용해도 손색이 없을 만큼의 완성도였고 제작에 걸린 시간은 1분 남짓이었다. 가정용 레이저 컬러 프린터에서 컬러 사진을 출력하는 속도다. 이미지 속 대사·표정·배경까지 자유자재…테마 전환도 '척척' 또 다른 주목할만한 특징은 '기존 이미지를 수정하는 기능'이다. 이제는 '챗GPT 4o'에 그림이나 사진을 입력한 뒤 그 안의 글자나 오브젝트를 일부 수정하는 것도 가능하다. 이는 더 이상 포토샵이나 전문적인 그래픽 디자인 툴 없이도 어느 정도의 시각적 편집 작업을 누구나 할 수 있게 됐다는 의미다. 일례로 기자는 인터넷에서 밈으로 유명한 김성모 화백의 만화 컷에서 등장인물의 대사인 "더이상의 자세한 설명은 생략한다"를 바꾸고 싶었다. '챗GPT'에게 이 이미지를 주고 "이 문장을 '자세한 설명이 필요하므로 다음 컷에 해주겠다'로 바꿔달라"고 요청하자 해당 문장을 깔끔하게 수정한 이미지를 바로 생성해줬다. 캐릭터의 외형은 약간의 차이가 있지만 전체적인 스타일은 거의 완벽하게 재현됐다. 공식 문서나 기획안 등 고해상도 일러스트가 필요한 상황이 아니라면 충분히 활용할 수 있을 정도다. 그림에 대한 소폭 수정도 자연스럽게 처리된다. 기자는 앞선 김성모 캐릭터에서 '목폴라를 벗기고 70년대식 콧수염을 붙여달라'고 요청했는데 역시 기대한 대로 처리됐다. 이외에도 캐릭터의 표정 변화, 옷이나 헤어스타일 교체, 배경 변경 등 다양한 시도가 가능했다. 다만 이 과정에서 한글 텍스트가 처음엔 조금 어색하게 표현되기도 했으나, 다시 "한글 자연스럽게 수정해줘"라고 요청하면 또 문제없이 보완해주는 구조다. 오브젝트의 테마나 분위기를 바꾸는 작업 역시 수준급이다. 최근 소셜미디어를 뜨겁게 달군 '지브리 테마 변환'이 대표적인 사례다. 최근에는 더 락, 백악관 보좌관 등 유명 인사, 인플루언서들이 이 기능을 이용해 카카오톡 프로필이나 SNS 프로필 사진을 새롭게 꾸미는 사례가 확산되고 있다. 이에 동참해 기자는 스스로의 사진을 입력한 뒤 "지브리 애니메이션 분위기로 바꿔달라"고 요청했고 실제로 스튜디오 지브리를 연상시키는 따뜻한 색감과 몽환적인 배경, 부드러운 일러스트 스타일이 적용된 결과물이 나왔다. 또 하나 흥미로운 점은 단순히 캐릭터 스타일을 바꾸는 것을 넘어 이미지의 '전체 테마' 자체를 완전히 변환할 수 있다는 것이다. 단순히 눈이나 옷차림만 바꾸는 수준이 아니라 사진이 지닌 분위기와 배경까지 포함한 '서사적 연출'이 가능해진 셈이다. 최근 오픈AI 아태지역 홍보 담당자인 제이크 윌친스키는 자신의 링크드인에 새로운 사용 사례를 공개했다. 그는 '챗GPT 이미지 생성기'에 "우리 집 강아지를 최대한 나쁜 남자(Bad*ss)처럼 만들어달라"고 요청했고 그 결과 선글라스, 초커, 가죽 재킷을 착용한 터프한 강아지 이미지가 생성됐다. 기존 반려동물의 귀여운 이미지를 완전히 뒤엎는 콘셉트 전환이 구현된 것이다. 기자도 유사한 시도를 했다. 반려견 사진을 입력한 뒤 "이 강아지를 런던 동부의 불량 청소년처럼 바꿔달라"고 프롬프트를 주자 결과물은 놀라웠다. 푸들이었던 강아지는 그대로 유지됐지만 배경은 그래피티가 가득한 동런던 거리로 바뀌었고 모자, 아디다스 재킷, 귀걸이 등 각종 아이템으로 꾸며져 있었다. 한마디로 '코크니 억양으로 밤거리에서 맥주를 흔들며 인사를 건넬 것 같은' 이미지가 완성된 셈이다. 여전히 존재하는 한계…그럼에도 우리 삶 '게임 체인저'로서 잠재력 보여 물론 모든 기능이 완벽하게 구현되는 것은 아니다. 특히 텍스트 표현에서는 일부 한계가 남아 있다. 영어는 대부분 정확하게 처리되지만 문장이 너무 길거나 단어가 복잡할 경우 일부 글자가 누락되는 경우가 종종 발생한다. 기사 한 편 수준의 긴 문장을 이미지에 삽입하는 고난도 작업은 아직 포토샵 등 전문 편집 도구가 더 유리할 수 있다. 한글은 그보다 제약이 크다. 짧은 문장은 비교적 잘 표현되지만 한 문단 이상만 되어도 오타나 띄어쓰기 오류가 생길 가능성이 높다. 수정 요청을 통해 보완은 가능하지만 '한 번에 완성형'을 기대하기는 아직 무리다. 이미지 리터칭 역시 100% 재현이라고 보긴 어렵다. 김성모 화백의 만화 대사를 바꾼 예처럼 스타일과 구도는 거의 흡사하지만 선의 굵기 같은 디테일은 다소 달랐다. 반려견 사례에서도 강아지의 특징은 대부분 반영됐지만 실물과 완벽히 일치하기보다는 유사한 개체의 특징이 혼합된 결과물이었다. 이는 생성형 AI 특유의 '확률적 생성 방식'에 기반한 한계로 기술적으로는 어쩔 수 없는 영역이기도 하다. 다만 이런 단점을 감안하더라도 '챗GPT 4o 이미지 생성기'는 충분히 '게임 체인저'로서의 자격을 갖췄다. 핵심은 글과 그림이라는 인간 커뮤니케이션의 두 축을 AI가 모두 다룰 수 있게 되었다는 점이다. 이미지 속 텍스트를 고치고 그래픽을 새로 생성하며 오브젝트를 주제나 맥락에 맞춰 자연스럽게 변환하는 기능은 산업 전반에 걸쳐 새로운 창작 흐름을 만들어낼 수 있다. 특히 주목할 지점은 이러한 기능이 단지 업무 효율화나 콘텐츠 제작 자동화에만 그치지 않는다는 점이다. 사람들이 일상 속 감정과 기억, 유머와 밈(meme), 일상의 장면들까지도 누구나 이미지로 기록하고 나아가 수십초만에 창작할 수 있는 시대가 열린 것이다. '생활형 창작'의 문턱이 급격히 낮아진 지금 생성형 AI는 이제 단순한 도구가 아니라 삶을 구성하는 도구로 자리매김할 가능성이 보인다. 다만 이 기능은 아직 무료 버전에서는 제공되지 않는다. '챗GPT 4o'의 이미지 생성 기능은 현재 월 20달러(한화 약 2만7000원)의 유료 플랜인 '챗GPT 플러스(Plus)'와 200달러(한화 약 27만원) 플랜인 '챗GPT 프로(Pro)' 구독자에게만 제공된다. 본격적인 대중화는 향후 무료 사용자에게도 기능이 개방되는 시점 이후가 될 전망이다. 샘 알트먼 오픈AI 최고경영자(CEO)는 "'GPT-4o 이미지 생성기'는 현재 유료 사용자에게만 제공된다"며 "향후에는 무료 사용자와 애플리케이션 프로그램 인터페이스(API) 사용자에게도 확장 적용될 예정"이라고 밝혔다.

2025.03.30 14:55조이환

오픈AI 샘 알트먼 "이미지 생성 모델 인기에 서버 과부하"

오픈AI가 출시한 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation) 모델'이 샘 알트먼 최고경영자(CEO)를 난감하게 할 정도로 폭발적인 인기를 얻고 있다. 28일 CNBC에 따르면 샘 알트먼 CEO는 X(옛 트위터) 게시물을 통해 "사용자들이 새로운 챗GPT의 이미지 생성을 좋아하는 것은 정말 즐겁지만 자사 GPU가 녹아내리고 있다"고 밝혔다. 오픈AI가 새로 선보인 이미지 생성 모델은 텍스트와 이미지를 모두 통합할 수 있는 멀티모달 AI 모델인 챗GPT-4o 기반 서비스로 유료 구독자들을 비롯한 무료 사용자들에게도 공개됐다. 샘 알트먼 CEO도 자신의 X 프로필 사진을 챗GPT 이미지 생성 모델로 제작한 일본 지브리 애니메이션 스타일의 캐릭터 이미지로 바꿔 주목받았다. 이후 챗GPT의 이미지 생성 모델을 이용해 제작한 이미지들이 다양한 소셜 미디어에서 빠르게 확산되며 큰 인기를 끌고 있는 상황이다. 이 때문에 오픈AI의 서버조차 과부하가 걸렸다. 이에 샘 알트먼 CEO는 당분간 이미지 생성에 드는 속도와 제작 가능한 이미지 개수를 제한하는 등의 대응조치를 취할 것이라고 설명했다. 이제 무료 사용자들이 생성할 수 있는 이미지 개수는 하루당 3장으로 제한된다. 또 오류 수정 작업도 진행한다. 샘 알트먼 CEO는 "챗GPT가 일부 이미지를 생성하지 못하고 있다"며 "가능한 한 빨리 수정할 것"이라고 말했다.

2025.03.28 15:25한정호

[유미's 픽] 오픈AI 新 무기 출격에 한숨 쉬는 美 기업, 주가 또 흔들릴까

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 오픈AI·구글·xAI 등 인공지능(AI) 기술을 앞세운 새로운 경쟁자들의 등장으로 위기에 몰렸다. 간단한 프롬프트 입력만으로 전문가 못지 않은 퀄리티의 이미지를 쉽게 만들 수 있는 서비스들이 속속 등장하면서 존재감이 점차 희미해지고 있다는 평가가 나온다. 26일 업계에 따르면 어도비의 최근 1년간 주가는 무려 19.98%나 하락해 오후 4시 45분 현재 403.64달러에 머무르고 있다. 한 때 주가가 597.75달러까지 치솟았으나 경쟁사들의 잇따른 등장과 함께 새로운 성장 동력으로 내세운 AI 비즈니스가 시장에서 큰 호응을 얻고 있지 못한 까닭이다. 앞서 어도비는 지난 2023년 오픈AI가 '챗GPT'를 출시한 직후 AI 사진 편집 시장에 진입하기 위해 '파이어플라이'를 출시했다. 이후 어도비 익스프레스를 비롯한 포토샵, 일러스트레이터, 어도비 스톡 등 크리에이티브 클라우드 앱들에 생성형 AI를 탑재했다. 특히 포토샵에는 '제너레이티브 필(Generative Fill)', 어도비 스톡에서는 '텍스트 투 이미지(Text-to-Image)', 일러스트레이터에는 '제너레이티브 리컬러(Generative Recolor)' 등 AI 기반 기능이 출시됐다. 올해 초에는 파이어플레이 비디오 티어 등 새로운 AI 기반 서비스를 발표해 주목 받았다. 이 서비스는 사용자가 제출한 텍스트나 이미지 기반으로 비디오부터 3D 그래픽, 2D 애니메이션을 생성한다. 이를 시장에 확산시키고자 어도비는 서비스 내 생성형 AI 일부 기능을 무료로 제공하는 등 승부수를 걸었다. 확장 기능이나 상업적 사용을 위해서만 유로 플랜을 서비스에 적용한 상태로, 사용자 기반이 넓어지면 서비스 유료 전환을 순차적으로 유도하려는 전략도 세웠다. 최근에는 AI 에이전트가 접목된 새로운 애플리케이션(앱)인 '브랜드 컨시어지'를 선보여 주목을 받았다. 기존 고객 데이터를 바탕으로 맞춤화된 콘텐츠 등을 추천하는 작업을 수행하는 것으로, 어도비가 AI 에이전트 제품을 선보인 것은 이번이 처음이다. 이 같은 어도비의 노력에도 불구하고 시장 내 반응은 뜨뜻미지근하다. 사용자들은 비용을 지불할 정도로 어도비의 AI 기능들이 가치가 있는지 불확실하다는 평가를 내놓고 있다. 경쟁사들의 기술력이 빠른 속도로 발전하고 있어서다. 실제 오픈소스로 제공되는 미드저니나 오픈AI의 '소라'는 텍스트와 사진 몇장 만으로도 AI 기반 이미지 콘텐츠 제작이 가능하도록 지원하고 있다. 해당 서비스 제공자들은 영상과 오디오, 사진 편집 기능까지 추가할 계획이라고 밝힌 상태다. 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 같은 상황에서 오픈AI가 지난 25일 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation) 모델'을 출시해 발등에 불이 떨어졌다. 맥락과 그리는 대상에 대한 이해도가 한층 더 높아져 이전보다 더 정확한 결과를 내놓을 수 있게 돼서다. 새 모델은 오픈AI의 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이다. '그림'만 학습한 기존 이미지 모델에 GPT-4o 언어 모델이 결합하며 목적에 맞는 이미지를 쉽게 생성할 수 있게 됐다. 이 모델은 현재 유료 구독자들은 물론 무료 사용자들도 이용할 수 있다. 오픈AI는 기존에 '달리(DALL·E)'를 앞세워 이미지 생성 AI 시장에서 존재감을 키워왔다. 이를 사용했을 땐 숫자와 문자가 '그림'으로 해석돼 그려져 삐뚤게 이미지에서 표현됐지만, 새 모델은 언어 모델을 이해한 후 그림을 만들어 내 보다 정확한 결과물을 얻어낼 수 있다. '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 기존 모델은 훈련되지 않은 데이터여서 결과물을 내놓는데 어려움을 겪었지만, 새 모델은 가능해졌다. 동영상 생성 AI인 '소라'에도 새 모델의 언어 이해가 적용돼 더 자연스러운 영상을 만들 수 있게 됐다. 이는 서비스 경쟁력 개선에 나선 오픈AI의 노력의 일환이다. 오픈AI 관계자는 "GPT-4o의 언어 지식과 이미지 지능이 결합된 모델"이라며 "기존 모델이 참신했다면 이 모델은 유용하다"고 설명했다. 오픈AI 외에도 구글은 제미나이에서 '이마젠' 이미지 생성 모델을 제공하고 있다. 중국 딥시크도 '야누스'라는 이름의 이미지 생성 모델을 출시했다. 동영상 생성 AI 시장에선 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 서비스를 선보이며 어도비를 위협하고 있다. RBC 애널리스트 매튜 스완슨은 "어도비가 생성형 AI 제품 로드맵을 잘 따라가고 있지만, 명확한 수익화 지표가 부족한 상태"라며 "투자자들이 어도비 진행 상황을 신뢰하기 어려운 상황"이라고 평가했다. 도이치뱅크 브래드 젤닉 애널리스트 역시 "어도비 경영진은 파이어플라이의 가능성을 강조하고 있지만, 아직 재무적 영향은 확인되지 않았다"고 지적했다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2025.03.26 17:21장유미

구글클라우드 품은 韓 기업들…카카오·야놀자, AI 전략 바꾼다

국내 주요 기업들이 구글 클라우드와 손잡고 다양한 산업에 생성형 인공지능(AI)을 도입해 성과를 내고 있다. 단순 기술 적용을 넘어 실질적인 비즈니스 혁신으로 이어지고 있다는 점에서 협업의 전략성이 돋보인다. 26일 구글 클라우드 공식 블로그에 따르면 회사는 현재 국내에서 ▲인덴트코퍼레이션 ▲매스프레소 ▲카카오헬스케어 ▲야놀자 ▲엔씨소프트 등 다양한 국내 고객사들과 협업하고 있다. 커머스, 교육, 헬스케어, 여행, 엔터테인먼트를 포함한 다양한 산업군이 생성형 AI 모델을 활용해 비즈니스 성과를 달성하고 있다는 분석이다. 커머스 부문에서는 인덴트코퍼레이션이 주목을 받았다. 이 회사는 구글 클라우드의 제미나이 모델을 활용해 '브이리뷰'와 '스프레이' 서비스를 고도화했다. '브이리뷰'는 텍스트·이미지 리뷰를 실시간 분석해 브랜드에 고객 인사이트를 제공하고 '스프레이'는 AI 기반 인플루언서 검색 및 캠페인 자동화를 통해 마케팅 효율을 높이고 있다. 인덴트코퍼레이션은 제미나이의 멀티모달 기능을 활용해 페르소나에 맞춘 자동 응대, 부정적 리뷰 선제 대응, 핵심 키워드 추천 기능을 구현했다. AI 기반으로 캠페인 제안서 작성, 성과 추적까지 자동화해 소규모 브랜드의 글로벌 진출까지 지원하고 있다. 교육 부문에서는 매스프레소의 AI 학습 플랫폼 '콴다'가 대표 사례로 소개됐다. 매스프레소는 '제미나이 1.5 프로'와 '2.0 플래시' 모델을 도입해 응답 속도를 대폭 개선하고 맞춤형 실시간 학습 도움 기능을 추가했다. '콴다'는 OCR 기술과 문제 풀이 데이터베이스를 활용해 이용자가 올린 수식이나 문제 사진을 빠르게 분석하고 적절한 풀이를 제공하는 구조다. 매월 1억 건 이상의 문제 풀이가 발생하고 있어 클라우드 SQL을 통해 트래픽 대응과 데이터 확장성도 확보하고 있다. 헬스케어 영역에서는 카카오헬스케어가 두 가지 주요 서비스를 기반으로 AI 도입 성과를 공개했다. AI 기반 혈당 관리 앱 '파스타'와 병원 컨시어지 챗봇 '케어챗'에 '제미나이 2.0'을 적용해 사용자 편의성과 서비스 범위를 확장했다. 카카오헬스케어는 구글 클라우드의 '알로이DB'를 통해 의료 데이터를 안전하게 적재·가공하고 상급종합병원과의 협업을 통해 의료 데이터 네트워크도 구축 중이다. 기업용 플랫폼인 '버텍스 AI'를 활용한 비정형 데이터 표준화와 연합학습, 거대언어모델(LLM) 환각 문제 해결도 주요 협력 과제로 소개됐다. 여행 및 레저 산업에서는 야놀자가 구글 클라우드와 AI 기반 전략적 파트너십을 체결하고 전사적 AI 전환(AX)을 추진 중이다. 제미나이를 포함한 AI 기술과 인프라를 통해 고객 맞춤형 여행 서비스 제공과 기업 고객의 업무 자동화를 동시에 추구하고 있다. 야놀자는 AI 그라운딩 기술로 정보 출처 기반 여행 데이터를 강화하고 있으며 티켓 분류 자동화, AI 고객 커뮤니케이션 등 개념증명(PoC)도 병행 중이다. 안전하고 확장 가능한 구글 클라우드 인프라를 기반으로 여행 산업 전반의 효율성 향상을 목표로 한다. 엔터테인먼트 분야에선 엔씨소프트의 AI 자회사인 NC AI가 자체 언어 모델 '바르코 LLM'을 구글 클라우드 텐서플로어 처리장치(TPU)를 활용해 개발한 사례가 소개됐다. TPU 기반 학습 환경으로 LLM 훈련 시간을 줄이고 버텍스 AI와 제미나이, 젬마 모델을 결합해 모델 성능을 높이고 있다. 엔씨소프트는 게임 개발부터 서비스 운영, 분석, 생산성 향상까지 AI를 활용한 전방위 혁신을 구상 중이다. 구글 클라우드와의 협업은 글로벌 게이밍 생태계 구축의 핵심 전략으로도 자리 잡고 있다. 지기성 구글 클라우드 코리아 사장은 "국내 기업들은 빠른 실행력과 혁신적 아이디어로 전 세계의 주목을 받고 있다"며 "향후에도 국내 기업의 AI 여정을 신뢰할 수 있는 파트너로 적극 지원하겠다"고 밝혔다.

2025.03.26 14:44조이환

구글 '제미나이 2.5'로 추론형 AI 전면전…기술 주도권 겨눈다

구글 딥마인드가 추론하는 차세대 인공지능(AI) 모델을 선보였다. 복잡한 문제 해결을 위한 '사고형 AI'로 본격 진화하며 추론 및 코딩 성능을 강화해 오픈AI, 앤트로픽 등 경쟁사에 대응하기 위해서다. 26일 구글 공식 블로그에 따르면 구글의 AI 자회사인 딥마인드는 '제미나이 2.5 프로 익스페리멘털'을 실험적으로 출시했다. 이 모델은 출시 직후 AI 성능을 인간 기준으로 평가하는 벤치마크인 LM아레나(LMArena)에서 1위에 올랐으며 구글 AI 스튜디오와 '제미나이' 앱에서 우선 제공된다. 기업용 플랫폼인 '버텍스' AI에는 추후 탑재될 예정이다. '제미나이 2.5'는 응답 전 사고 과정을 거치는 '생각하는 모델'로 설계됐다. 단순한 분류와 예측을 넘어 맥락 분석과 논리적 판단을 기반으로 복잡한 문제를 풀 수 있는 구조다. 구글은 이를 통해 복합적 상황에서도 에이전트가 자율적으로 판단할 수 있도록 지원할 계획이다. 사고형 AI 기반으로 개발된 이번 2.5 프로는 수학·과학 분야에서도 최고 성능을 기록했다. 특히 'GPQA'와 'AIME 2025' 등의 고난도 벤치마크에서도 테스트 시간 기술 없이도 뛰어난 성과를 냈으며 전문가 집단이 설계한 '휴매니티스 라스트 이그잼'에서도 도구 없이 18.8%의 점수를 기록했다. 코딩 능력도 대폭 향상됐다. 웹 애플리케이션 구현, 에이전트형 코드 작성, 코드 리팩토링 등에서 우수한 성능을 보였다. 실제로 프로그래밍 능력을 평가하는 벤치마크인 'SWE-벤치 베리파이드' 기준 63.8%의 정확도를 기록했다. 이는 맞춤형 에이전트를 활용한 결과로, 실제 개발 환경에 가까운 평가 기준에서의 성과다. 구글은 '제미나이 2.5 이전에도 추론 특화 모델 개발에 힘써왔다. 지난해 12월 공개된 '제미나이 2.0'은 멀티모달 기능과 코드 생성 능력을 강화한 최초의 모델로, 이후 지난 2월에는 '제미나이 2.0 플래시 씽킹'을 단계적 사고 설명이 가능한 추론 특화 모델로서 공개한 바 있다. 경쟁사들의 움직임도 거세다. 오픈AI는 지난해 9월 추론 모델인 'o1' 시리즈를 출시했으며 지난 1월에는 'o3'를 공개했다. 중국 딥시크 역시 같은 달 6천710억 패러미터를 탑재한 'R1'을 내놨고 최근에는 앤트로픽이 '클로드 3.7 소네트'를 공개했다. 이는 업계 최초로 일반형 AI와 추론형 AI를 통합한 하이브리드 모델이다. 이번 '제미나이 2.5 프로'는 사고형 아키텍처에 멀티모달과 긴 맥락 기능까지 결합해 이들과의 경쟁을 본격화한 셈이다. 현재 서비스는 구글 AI 스튜디오에서 제공된다. 고급 이용자라면 제미나이 앱에서도 모델 선택을 통해 접근 가능하다. 코라이 카북추오글루 구글 딥마인드 최고기술책임자(CTO)는 "'제미나이 2.5'는 복잡한 문제를 다루기 위한 사고형 모델로, AI의 새로운 지평을 연다"며 "고객 피드백을 바탕으로 지속적으로 개선할 것"이라고 밝혔다.

2025.03.26 10:40조이환

"북한 간첩, 한국 정부·방산·반도체·자동차 기밀 노려"

“최근 북한과 관련된 해킹 단체가 한국 방위 산업과 반도체·자동차 산업을 공격했습니다. 돈 벌려고 했다기보다 전통적인 간첩·첩보 활동이었던 것 같아요. 기밀이나 산업 지식을 찾는 듯했어요. 한국 정부를 목표로 한 적도 있습니다.” 루크 맥나마라 구글클라우드 수석연구원은 19일 서울 강남구 구글클라우드 한국지사 사무실에서 열린 기자간담회에서 이같이 밝혔다. 맥나마라 연구원은 “세계적으로 국방비 지출이 늘고 있다”며 “사이버 공격자는 새로운 군사 기술이 어떻게 개발되는지, 누가 쓸지 알려고 한다”고 말했다. 그러면서 “한국 방산의 잠재 구매자가 누군지 북한이 찾고자 할 것”이라며 “방산과 더불어 한국 정부도 목표물”이라고 전했다. 북한 관련 단체가 금전을 갈취할 목적으로 공격하기도 한다. 가상화폐가 생기면서 두드러졌다. 지난해에는 북한 해킹 단체가 이더리움을 2조원어치 훔친 사실이 드러났다. 맥나마라 연구원은 “북한은 암호화폐와 아울러 암호화폐 거래소와 사용자도 표적으로 삼는다”며 “관련 기업이나 거래소는 북한을 주의해야 한다”고 경고했다. 그는 “북한 해커는 암호화폐를 잘 안다”며 “암호화폐가 혁신할 때마다 이해한다”고 평가했다. 북한에서 정보기술(IT)을 공부한 사람이 해커가 되기도 한다. 맥나마라 연구원은 “북한 IT 인력이 해킹하거나 취업해 번 돈을 북한 정권으로 보내는 게 목적”이라며 “중개인(Broker)과 공조한다”고 언급했다. 그는 “브로커는 북한 정권을 위하는 일이라곤 모른 채 가담하는 경우가 많다”며 “북한 IT 인력이 다른 나라에서 취업하게끔 돕거나 은행 계좌 만들기를 돕는다”고 설명했다. 또 “북한 IT 인력은 브로커에게 수수료 주고, 월급은 다른 계좌 통해 받아 돈세탁한다”며 “이들이 방산업체에서 일하면 스파이가 되는 셈”이라고 지적했다. 이어 “북한 IT 인력 정체가 들켜 해고돼도 '비트코인을 주지 않으면 민감한 인터넷프로토콜(IP)을 공개하겠다'고 협박하는 메일을 전 직장에 보낸 사례가 있다”며 “면접에서 카메라 녹화를 거부하거나 회사 공식 메일이 아닌 다른 연락처로 취업 서류를 주고받자는 구직자를 기업 인사 담당자는 의심해야 한다”고 조언했다. 다만 “북한 IT 인력이 한국에서 공격한 일은 아직 없다”고 선을 그었다. 해커는 구글 '제미나이(Gemini)' 같은 생성형 인공지능(AI)으로 생산성을 끌어올리는 것으로 알려졌다. 맥나마라 연구원은 “북한을 비롯해 중국·이란 지능형 지속 공격(APT) 단체들이 제미나이를 악용한다”며 “정보를 모으고, 보안 취약점을 찾고, 피싱하고 개인정보를 탈취할 질문을 하거나, 딥페이크 이미지를 만들 때 쓴다”고 분석했다. 그는 “1년 뒤에도 해커가 AI를 지금과 똑같이 쓸지, 다르게 활용할지 구글클라우드가 연구하겠다”며 “보안 담당자가 생성형 AI로 새로운 전술을 알아채고 빠르게 대응한다면 공격자와 격차를 줄일 수 있지 않겠느냐”고 되물었다.

2025.03.19 15:53유혜진

구글, 제미나이에 '캔버스' 도입…오픈AI·앤트로픽 따라잡기 나섰다

구글이 자사 인공지능(AI) 챗봇에 사용자의 문서·코딩 작업을 지원하는 기능을 선보인다. 오픈AI와 앤트로픽이 먼저 선보인 협업 도구를 뒤따르는 움직임으로, AI 생산성 시장 경쟁이 한층 치열해지고 있다. 19일 테크크런치에 따르면 구글은 '제미나이' 웹·모바일 앱에서 '캔버스' 기능을 새로 추가해 사용자가 AI와 협업해 문서를 작성하고 코드를 편집하는 작업 공간을 마련했다. 오픈AI가 지난해 '챗GPT'에 '캔버스'를, 앤트로픽이 '클로드'에 '아티팩트'를 도입한 데 이어 구글도 같은 기능을 추가하며 경쟁에 뛰어든 모습이다. '캔버스'에서는 문서 초안을 작성한 후 특정 단락을 선택해 '간결하게', '전문적으로', '비공식적으로' 등의 옵션을 통해 수정할 수 있다. 또 구글 문서로 바로 내보낼 수 있어 협업을 원활하게 지원한다. 코딩 기능도 강화됐다. 사용자는 HTML·리액트 등 웹 코드의 실시간 미리보기를 확인하며 수정할 수 있다. 특히 AI가 코드 생성부터 디자인 변경까지 직접 수행해 작업 효율을 높인다. 이와 함께 구글은 '제미나이'에 '오디오 개요' 기능도 추가했다. 이는 AI가 문서·웹페이지 등의 내용을 팟캐스트 스타일의 오디오로 요약해주는 기술로, 기존 '노트북LM'에서 제공되던 기능을 제미나이에서도 활용할 수 있도록 확장했다. 사용자는 문서를 업로드한 후 오디오 개요를 생성하고 이를 다운로드하거나 공유할 수 있다. 다만 현재 오디오 개요 기능은 영어로만 제공된다. '캔버스'와 '오디오 개요' 기능은 전 세계 '제미나이' 사용자에게 무료로 제공된다. 다만 캔버스의 코드 미리보기 기능은 웹 버전에서만 지원된다. 데이브 시트론 구글 제미나이 제품 디렉터는 "캔버스를 통해 제미나이가 더욱 효과적인 협업 도구로 자리 잡을 것"이라며 "사용자의 아이디어를 보다 쉽게 실현할 수 있도록 도울 것"이라고 말했다.

2025.03.19 10:39조이환

"구글 AI, 워터마크 삭제까지"…'제미나이 플래시 2.0'에 저작권 업계 긴장

구글이 자사 인공지능(AI) 이미지 생성·편집 기능을 대폭 강화했다. 멀티모달 처리와 향상된 추론 능력 덕분에 스토리텔링과 창작의 자유는 한층 넓어졌지만 저작권 침해와 콘텐츠 조작 가능성도 커져 우려를 낳고 있다. 17일 테크크런치에 따르면 구글은 최근 자사 '제미나이 플래시 2.0'의 네이티브 이미지 생성 기능을 공개하고 이를 두고 개발자들이 실험할 수 있도록 조치했다. 이번 업데이트는 구글이 실험용 AI들을 공개해 둔 웹사이트인 'AI 스튜디오'와 '제미나이' 애플리케이션 프로그램 인터페이스(API)를 통해 제공된다. 이번에 '플래시 2.0'에 추가된 이미지 생성 및 편집 기능은 텍스트와 이미지를 결합해 일관된 스토리를 생성하는 기능을 지원한다. 사용자가 원하는 스타일에 맞춰 스토리를 변경하거나 그림을 수정할 수도 있다. 대화형 이미지 편집 기능도 추가돼 자연어 명령만으로 이미지의 세부 요소를 조정할 수 있다. 이 모델은 단순한 이미지 생성 기능을 넘어 '세계에 대한 이해' 능력도 탑재했다. 텍스트 렌더링 성능도 개선돼 광고·초대장 제작 등에도 활용 가능할 것으로 보인다. 일례로 사용자는 자연어 프롬프트로 AI에 말을 그리라고 지시한 후 생성된 말의 모양과 외모는 유지하면서 색깔만 바꾸는 것이 가능해진다. 이외에도 캐릭터 일러스트를 삽입한 후 캐릭터가 입고 있는 옷을 바꾸거나 만화 컷에 나온 등장인물의 발언만을 다르게 바꾸는 것도 가능하다. 다만 이같은 AI의 강력한 이미지 편집 기능이 저작권 문제를 일으킬 가능성도 크다. 일부 사용자는 '플래시 2.0'을 이용해 이미지에 삽입된 워터마크를 제거하는 실험을 진행 중이다. 특히 게티이미지와 같은 스톡 이미지 기업의 콘텐츠 보호 장치가 AI에 의해 무력화될 가능성이 제기된다. 이전까지 오픈AI, 앤트로픽 등의 AI 모델들은 워터마크 제거 요청을 명확히 거부해왔다. 반대로 '플래시 2.0'은 별다른 제약 없이 워터마크를 삭제하고 그 자리를 자연스럽게 채우는 기능을 수행하는 것으로 알려졌다. 이러한 현상에 구글 측은 '플래시 2.0'이 아직 실험적 단계에 있으며 상업적 사용이 금지돼 있다고 밝혔다. 다만 AI의 기술적 한계를 실험할 목적으로 접근하는 사용자들이 많아 저작권 업계의 반발이 예상된다. 현재 미국 저작권법에 따르면 원 저작자의 동의 없이 워터마크를 삭제하는 행위는 불법이다. 일부 예외적인 경우를 제외하면 법적 조치가 가능하, 저작권 보호 기관들의 대응이 있을 것으로 보인다. 테크크런치는 "'플래시 2.0'은 유명인과 저작권이 있는 캐릭터의 이미지를 생성할 뿐만 아니라 기존 사진에서 워터마크를 제거하는 기능까지 수행하는 것으로 확인됐다."며 "일부 저작권 소유자들은 이 AI의 사용 제한이 느슨한 점에 대해 강하게 반발할 가능성이 크다"고 분석했다.

2025.03.17 14:53조이환

구글 "안드로이드폰, 어시스턴트 대신 제미나이 탑재"

안드로이드 폰에 탑재돼 있는 구글 어시스턴트가 올 연말부터 제미나이로 바뀌게 된다. 나인투파이브구글 등 외신들에 따르면 구글은 14일(현지시간) “구글 어시스턴트는 대부분의 모바일 기기에서 더 이상 사용하지 못하게 될 것”이라고 공지했다. 또 구글은 '올 하반기'부터 변화된 정책을 적용할 것이라고 덧붙였다. 이번 조치는 구글이 제미나이 기능을 업데이트한 지 하루 만에 나왔다. 구글은 지난 13일 AI 검색 기능인 딥리서치를 무료 제공하기로 했다고 밝혔다. 딥리서치는 웹 사이트를 자동 탐색해 답변을 생성하는 AI 검색 서비스다. 그 동안 구글은 유료 서비스인 제미나이 어드밴스드 사용자들에게만 이 기능을 제공해 왔다. 이 기능을 제미나이 무료 이용자들에게도 확대 적용하기로 한 것이다. 딥러시치를 개방한 구글은 이날 올 하반기부터는 안드로이드 폰에도 구글 어시스턴트 대신 제미나이를 기본 탑재한다고 공지했다. 하지만 구글은 안드로이드9 이전 버전이 사용하거나, 램 용량이 2GB 이하인 스마트폰에서는 제미나이를 쓸 수 없을 것이라고 밝혔다. 구글 픽셀을 비롯해 삼성, 원플러스, 모토로라 등이 최근 출시한 스마트폰에는 구글 어시스턴트 대신 제미나이가 기본 탑재돼 있다.

2025.03.15 09:27김익현

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

대통령실 "한중 관계 전면 복원…한화오션 제재 문제 진전 기대"

환상의 '태양광 드론' 등장…"3개월 비행 가능"

네오위즈 'P의 거짓', K-게임 글로벌 흥행 가능성 증명

경주선언-AI이니셔티브 채택...이 대통령 "내일의 변화 실현해야"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.