• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'구글 지니'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

생성형 AI 패러다임 바뀔까…구글 '지니' 공개에 산업계 지형 변화 예고

구글 딥마인드가 AI 프로젝트 '지니(Genie)'를 공개했습니다. 지니는 텍스트 프롬프트 등을 활용해 가상 환경을 구현할 수 있는 차세대 생성형AI 모델로 요약됩니다. 아직 프로토타입 단계지만, 게임·영화·애니메이션·국방·안보 등 산업에서 큰 영향을 미칠 수 있을지 주목을 받고 있습니다. 이번 이슈진단에서는 총 시리즈 4편으로 지니가 어떤 존재인지, 각 산업에서 실제 활용이 가능한지 등을 살펴봤습니다. 구글이 텍스트·이미지·영상 생성에서 한 걸음 더 나아가 '가상 세계 생성' 영역까지 기술 범위를 넓히면서 생성형 인공지능(AI) 시장의 경쟁 축도 빠르게 이동하고 있다. 지금까지 챗봇 중심 경쟁이 답변 품질을 겨루는 단계였다면, 이제는 사용자가 직접 탐험 가능한 환경을 만들어내는 '월드 모델' 기술이 차세대 경쟁 무대로 떠오른 분위기다. 4일 업계에 따르면 구글이 지난달 29일 미국 내 구글 AI 울트라 유료 구독자를 대상으로 프로젝트 '지니' 접근을 순차 확대키로 한 후 AI 업체들이 긴장감을 드러내고 있다. 이 모델이 텍스트 몇 줄이나 이미지 입력만으로 가상 세계를 생성하고, 사용자가 그 안을 걸어 다니거나 날아다니며 탐험할 수 있는 형태이기 때문이다. '지니'가 주목받는 이유는 월드 모델 기반 기술이란 점에서다. 기존 생성형 AI가 이미지나 영상 같은 정적인 결과물을 만들어내는 데 그쳤다면, 월드 모델 기반 기술은 사용자의 움직임과 상호작용에 따라 다음 장면을 추론하며 환경을 이어붙이는 구조를 갖는다. 미리 제작된 데이터를 불러오는 전통적 가상현실(VR)과 달리 AI가 매 순간 추론을 통해 세계를 생성하는 방식이라는 점에서 산업적 의미도 크다. 특히 게임·콘텐츠 산업에서는 누구나 간단히 자신만의 게임을 만들 수 있는 환경이 만들어졌다는 점에서 위기감이 감지된다. 경쟁자가 급증하는 상황 속에 개별 게임사가 장기간 막대한 개발비를 들여 만들어낸 게임이 수익성 측면에서 도움이 되지 않을 가능성이 높아졌기 때문이다. 게임업계의 콘텐츠 제작 방식에도 변화를 줄 것으로 기대된다. 대규모 개발 인력이 투입되는 기존 게임 제작과 달리 AI가 실시간으로 환경을 생성해 초기 기획과 테스트 과정을 단축할 수 있기 때문이다. 다만 현 단계에서는 완성형 게임 엔진을 대체하기보다는 제작 지원 도구로서의 활용 가능성이 더 크다는 시각이 많다. 영화·애니메이션 산업에서도 월드 모델 기술은 제작 효율을 높일 수 있는 도구가 될 것으로 보인다. 배경 환경이나 장면 구성을 AI가 즉석에서 생성할 수 있게 되면 기존에 수개월이 걸리던 콘셉트 아트와 프리비주얼(Pre-visualization) 과정이 단축될 수 있어서다. 특히 실시간으로 카메라 시점을 이동하며 장면을 탐색할 수 있다는 점에서 영상 제작 과정의 새로운 워크플로가 될 가능성이 거론된다. 교육 분야에서는 역사 체험형 학습과 같은 새로운 형태의 콘텐츠 확장이 가능하다는 전망도 나온다. 예컨대 고대 로마 도시나 조선 시대 한양과 같은 환경을 월드 모델로 재현해 학생들이 직접 탐험하는 방식의 교육 시뮬레이션이 가능해질 수 있다. 기존 텍스트·영상 중심 교육을 넘어 학습자가 '공간 속 경험'을 통해 이해하는 방식으로 발전할 여지가 있다. 국방·안보 분야에서도 시뮬레이션 기술은 중요한 응용처로 꼽힌다. 군사 훈련과 작전 시나리오 검증은 실제 환경에서 실험하기 어렵기 때문에 가상 공간에서 반복적으로 수행되는데, 월드 모델이 보다 현실적인 동적 환경을 생성할 경우 훈련 시뮬레이터 고도화로 이어질 수 있다. 그러나 민감한 기술인 만큼 윤리적·정책적 논의가 병행돼야 한다는 지적도 나온다. 금융권 역시 월드 모델 기반 시뮬레이션 기술이 새로운 응용 분야로 거론된다. 금융기관들은 시장 변동과 리스크 시나리오를 가상 환경에서 반복적으로 실험해야 하는데, 월드 모델이 복잡한 경제 상황과 소비자 행동을 시뮬레이션하는 도구로 발전할 경우 리스크 관리와 의사결정 모델링에 활용될 수 있을 것으로 전망된다. 제조·산업 현장에서도 월드 모델이 활용될 것으로 기대된다. 공장 자동화나 물류 시스템에서는 실제 환경에서 실험하기 어려운 상황을 가상 공간에서 먼저 검증해야 한다. 이 때 월드 모델이 현실과 유사한 시뮬레이션을 제공하면 스마트팩토리와 로봇 운영 효율을 높이는 기반 기술로 자리 잡을 수 있다. 산업적 파급 효과는 반도체 시장으로도 이어질 수 있다. 월드 모델 기반 시뮬레이션은 기존 거대언어모델(LLM)보다 훨씬 높은 추론 연산과 메모리 대역폭을 요구하기 때문에 구글이 개발한 텐서처리장치(TPU) 같은 AI 가속기 경쟁과 함께 HBM3E·HBM4 등 고대역폭 메모리 수요 확대 가능성도 제기된다. 이는 AI 서비스 고도화가 하드웨어 인프라 투자 확대로 연결되는 구조다. 구글은 아직 초기 단계인 만큼 사실성이 완벽하지 않고 생성 지속 시간이 최대 60초로 제한되는 등 기술적 한계가 있다고 함께 밝혔지만, AI 업계는 '월드 모델' 기술 경쟁이 본격화 될 것이란 점에 주목하고 있다. '제미나이'를 앞세운 구글의 AI 시장 내 영향력이 빠른 속도로 커지고 있는 만큼, '월드 모델'이 빠르게 업계 표준으로 올라설 것으로 예상돼서다. 실제로 구글 외 다른 업체들도 발 빠르게 월드 모델 개발 경쟁에 뛰어들었다. 'AI 대모'로 불리는 페이페이 리 교수가 설립한 월드랩스(World Labs)와 영상 생성 스타트업 런웨이, 메타 전 최고과학자 얀 르쿤이 참여한 연구 조직 등이 대표적으로, 이들은 유사한 기술을 주요 목표로 내세우며 차세대 AI 주도권 잡기에 나섰다. 그러나 '지니'가 아직 초기 단계란 점에서 좀 더 상황을 지켜봐야 한다는 의견도 있다. 자동회귀(auto-regressive) 방식 특성상 연산 부담이 크고 조작 안정성이나 환경 일관성 측면에서도 제약이 존재하기 때문이다. 구글 역시 이를 연구용 프로토타입으로 규정하며 한계를 인정하는 듯한 모습이다. 업계 관계자는 "'지니' 공개는 생성형 AI 산업이 '콘텐츠 생성'에서 '세계 시뮬레이션'으로 확장되는 흐름을 보여준 것이란 점에서 의미가 있다"며 "로봇, 제조 시뮬레이션뿐 아니라 반도체 인프라 시장까지 연쇄적으로 영향을 미치며 AI 주도권 경쟁의 무대 자체를 바꿔놓을 가능성이 크다"고 말했다.

2026.02.04 12:39장유미 기자

구글 지니, 상상 넘어 물리적 실체로...AGI 열쇠 '월드 모델' 전쟁 서막

구글 딥마인드가 AI 프로젝트 '지니(Genie)'를 공개했습니다. 지니는 텍스트 프롬프트 등을 활용해 가상 환경을 구현할 수 있는 차세대 생성형AI 모델로 요약됩니다. 아직 프로토타입 단계지만, 게임·영화·애니메이션·국방·안보 등 산업에서 큰 영향을 미칠 수 있을지 주목을 받고 있습니다. 이번 이슈진단에서는 총 시리즈 4편으로 지니가 어떤 존재인지, 각 산업에서 실제 활용이 가능한지 등을 살펴봤습니다. 인공지능(AI)이 텍스트 생성을 넘어 물리적 세계의 동역학을 시뮬레이션하는 '월드 모델' 시대로 진입했다. 구글 딥마인드가 선보인 '지니 3'가 사진 한 장으로 상호작용 가능한 가상 세계를 즉석에서 구축하며 게임 산업에 충격을 준 가운데, 일론 머스크의 xAI와 테슬라 역시 실세계 데이터를 결합한 월드 모델로 범용인공지능(AGI)을 향한 개발 속도를 높이고 있다. 코딩 없이 3D 세계 생성… 구글, 차세대 AI 판을 바꾸다 일찍이 업계는 AI가 텍스트 학습만으로는 인간 수준의 지능에 도달하기 어렵다는 데 의견을 모았다. 'AI의 대모'로 불리는 페이페이 리 스탠퍼드대 교수가 지적했듯, 기존 거대언어모델(LLM)은 방대한 지식을 갖췄으나 물리적 실재에 기반하지 못한 상태를 뜻하는 '어둠 속의 단어들'에 머물러 있어서다. 진정한 AGI는 로봇이나 자율주행차처럼 물리적 세계를 탐색하고 작업을 수행할 수 있어야 한다. 여기에는 시각과 청각 등 감각 정보를 통해 디지털 비트의 세계와 물리적 원자의 세계를 연결하는 '공간 지능'이 필수적이다. 월드 모델이 그 가교 구실을 한다. 이러한 흐름 속에서 구글은 텍스트와 이미지, 영상 생성을 넘어 차세대 시장인 가상 세계 생성으로 영역을 확장하고 있다. 구글의 지니 3는 복잡한 물리 엔진을 설계하거나 코딩하는 전통적인 3차원(3D) 그래픽 엔진의 문법 대신 데이터 주도 픽셀 예측 방식을 택했다. 작동 원리는 클라우드 스트리밍 게임과 유사하지만 그 실체는 이용자의 입력에 따라 다음 프레임을 실시간으로 예측하는 '블랙박스 신경망'이다. 이용자가 텍스트나 이미지를 입력하면 AI가 즉석에서 상호작용 가능한 세계를 생성하고, 사용자의 움직임에 맞춰 다음 프레임을 실시간으로 추론해 이어 붙인다. 이는 미리 제작된 데이터를 불러오는 기존 가상현실(VR)과 달리, 누구나 즉석 생성 가능한 인터랙티브 환경을 소유하게 됨을 의미한다. 구글의 이러한 시도는 로봇 에이전트 훈련 등 다양한 활용 가능성을 제시하기에 산업적 파급력이 상당할 것으로 보인다. xAI·테슬라는 '현실 모사'…왜 월드 모델인가 반면 xAI와 테슬라는 현실 데이터를 정교하게 모사하는 실전형 전략에 집중한다. 테슬라는 '생성형 가우시안 스플래팅' 기술을 활용해 로봇이나 자율주행차가 실제 마주할 시야를 사실적으로 시뮬레이션한다. 특히 '시맨틱 증강' 기술이 핵심이다. 이 기술은 맑은 날씨의 주행 영상에 눈을 내리게 하거나 가상의 보행자를 추가하는 식으로 현실에서 수집하기 어려운 위험 상황 데이터를 생성한다. 로봇이 실제 환경에 배포되기 전 다양한 변수를 안전하게 학습할 수 있는 샌드박스 역할인 셈이다. 업계가 월드 모델을 차세대 AI 표준으로 꼽는 이유는 현실 그 자체가 AGI의 데이터셋이라는 방향성에 공감하기 때문이다. 미국 AI 스타트업 루마 같은 기업들은 인간이 설정한 수식에 의존하는 대신, AI가 방대한 비디오 데이터를 관찰하며 중력이나 관성 같은 물리 법칙을 스스로 깨우치게 하는 방식을 택하고 있다. 월드 모델 시장은 엔터테인먼트와 로봇 공학이라는 두 축을 중심으로 성장할 전망이다. 할리우드나 게임업계는 시각적 개연성이 충분한 시뮬레이션을 요구하는 반면, 로봇 및 자율주행 업계는 현실과 일치하는 사실적 시뮬레이션이 필요하다. 전문가들은 이 두 영역이 결국 동전의 양면과 같다고 분석한다. 가상 세계를 실시간으로 생성하는 파운데이션 모델이 한쪽에서는 창작 도구가 되고, 다른 쪽에서는 로봇을 훈련하는 시뮬레이터가 되기 때문이다. 업계 관계자는 "가상과 현실을 모두 아우르는 강력한 월드 모델을 누가 먼저 선점하느냐가 향후 AI 패권의 향방을 가를 것"이라고 말했다.

2026.02.04 12:38이나연 기자

구글 AI '프로젝트 지니' 등장, 게임계 분위기는

구글 딥마인드가 AI 프로젝트 '지니(Genie)'를 공개했습니다. 지니는 텍스트 프롬프트 등을 활용해 가상 환경을 구현할 수 있는 차세대 생성형AI 모델로 요약됩니다. 아직 프로토타입 단계지만, 게임·영화·애니메이션·국방·안보 등 산업에서 큰 영향을 미칠 수 있을지 주목을 받고 있습니다. 이번 이슈진단에서는 총 시리즈 4편으로 지니가 어떤 존재인지, 각 산업에서 실제 활용이 가능한지 등을 살펴봤습니다. 구글이 지난달 29일(현지시간) 공개한 인공지능(AI) '프로젝트 지니'가 게임 업계에 큰 파장을 일으켰다. 공개 직후 글로벌 대형 게임 엔진 기업 및 국내외 게임사의 주가가 폭락했기 때문이다. 실제 같은 날 글로벌 상장 기업인 유니티의 주가는 24.22%, 로블록스는 13.17%, 넥슨은 10.63%, 테이크투는 7.93% 하락했다. 또 국내 상장사인 웹젠의 주가는 13.4%, 카카오게임즈는 8.16%, 네오위즈는 7.87% 하락하며 충격파를 주기도 했다. 주가 하락에 대한 메시지는 분명했다는 것이 전문가의 대체적인 의견이다. 기존 게임사가 자본과 개발 인력 규모로 절대적인 지휘를 유지했지만, 이같은 AI 기술의 등장이 게임 개발 경쟁 구도를 무너뜨릴 수 있는 촉매제가 될 수 있다는 전망 때문이다. 프로젝트 지니는 지난해 8월 구글이 공개한 AI 범용 월드 모델 '지니3'를 기반으로 한 프로토타입 웹 앱이다. 지니3를 비롯해 나노 바나나 프로, 제미나이 등으로 구동된다. 그동안 일정 규모가 되는 게임사는 개발자 수십 또는 수천명을 투입해 2D·3D 모델을 만들고, 물리 법칙을 코딩하며, 맵을 설계하는 복잡한 공정을 거쳤다. 이와 달리 구글 '프로젝트 지니'는 기존 개발 문법을 무시한다. 지니의 활용 방법은 간단하다. 텍스트와 이미지를 프롬프트(명령어)로 사용해 가상세계를 만들고, 캐릭터 시점만 설정하면 된다. 이용자는 이를 통해 생성된 가상세계를 직접 조작해 탐험할 수 있다. 예를 들어 '미래 가상도시 콘셉트로 설계된 플레이가 가능한 판타지 세계를 만들어줘'를 입력하면 실제 이용자가 접속할 수 있는 게임 환경을 구현해 준다. 해당 프로젝트는 초기 개발 단계로 시각적인 디테일과 물리엔진 등을 아직 완벽하게 구현하지 못했다. 그러나 복수의 전문가는 지니가 완성에 가까워지면 기존 게임 개발의 경쟁 패러다임은 크게 바뀔 수 있다고 내다봤다. 당장 경계할 필요는 없지만, 기술 발전 속도를 예의주시해야 한다는 말이 나온 이유다. 이에 대해 원재호 앵커노드 대표는 "비록 연산 비용 등을 고려하면 이러한 AI 기술이 대중화되기까지 시간이 소요되겠으나, 과거 패키지에서 온라인과 모바일로 시장이 이동하며 제작 문법이 바뀌었듯 미래의 게임 개발 형태가 근본적으로 변화할 것"이라고 말했다. 반면 지니에 대한 공포심은 크게 가질 필요가 없다는 목소리도 있었다. 게임은 기술뿐만 아닌 서사와 기획이 어우러진 '문화예술'인 만큼, 개발 공정 단순화가 게임사의 핵심 경쟁력으로 직결되지 않아서다. 특히 단순 에셋 제작이나 반복적인 코딩 영역은 AI가 대체할 수 있겠지만, 높은 완성도를 요구하는 게임 이용자의 눈높이를 충족하기까지는 상당한 시간이 소요될 것이라는 분석이 지배적이다. 국내 중견 게임사 관계자는 "현재 AI는 개발 효율을 높이는 보조 도구다. 게임은 그래픽과 물리엔진이 전부가 아니다"며 "게임은 세계관과 정교한 밸런스 등 다양한 요소가 결합된 결과물이기 때문에 당장 공포심을 가질 필요는 없다고 생각한다"고 밝혔다. 또 다른 관계자는 "구글의 프로젝트 지니가 시사하는 바는 명확하다. 기술이 상향 평준화 되는 시대에 에셋과 코딩 작업 등 단순 노동은 축소될 가능성이 높아졌다"라며 "단순 제작·구현 능력보다 기획력과 프롬프트 구성력이 중요해질 수 있다. 개발자는 더욱 긴장해야한다. '이제 뭐 먹고살지?'와 같은 걱정은 하지 말고, 스스로 공부하고 변화해야할때"라고 전했다. 기존 대형 게임사도 지니의 등장을 반겨야한다는 의견도 있었다. 조직 효율화에 따른 수익성 개선에 긍정적인 영향을 미칠 수 있다는 기대가 컸다. 중견 게임사 인사 담당자는 "지니와 같은 AI 기술은 오히려 게임업계에 새로운 기회가 될 수 있다. 매년 인력 관리와 인건비 부담이 커지고 있는데, AI가 발전하면 게임사 비용 절감과 운영 부담 등이 줄어들 수 있다"며 "지나친 공포심은 경계해야하면서, 오히려 AI 기술 적용을 더욱 진지하게 고민하고 활용하는 부분 검토해야할 때다. 일부 게임사는 AI 업무 효율 TF 가동하고 있다"고 말했다.

2026.02.04 12:35진성우 기자

"텍스트 한 줄로 '나만의 세상' 창조"…구글의 차세대 AI '지니'

구글 딥마인드가 AI 프로젝트 '지니(Genie)'를 공개했습니다. 지니는 텍스트 프롬프트 등을 활용해 가상 환경을 구현할 수 있는 차세대 생성형AI 모델로 요약됩니다. 아직 프로토타입 단계지만, 게임·영화·애니메이션·국방·안보 등 산업에서 큰 영향을 미칠 수 있을지 주목 받고 있습니다. 이번 이슈진단에서는 총 시리즈 4편으로 지니가 어떤 존재인지, 각 산업에서 실제 활용이 가능한지 등을 살펴봤습니다. 구글이 텍스트 한 줄과 이미지 한 장만으로 사용자가 직접 탐험할 수 있는 가상 세계를 만드는 차세대 AI 프로젝트 '지니(Genie)'를 공개했다. 단순히 고품질 영상을 생성하는 수준을 넘어, 이용자의 조작에 실시간으로 반응하는 '상호작용형 AI' 시대를 열었다는 평가가 나온다. 생성형 AI가 '콘텐츠 생성'에서 '경험 생성'으로 확장되는 흐름이 뚜렷해지고 있다는 분석이다. 구글은 4일 AI 프로토타입 '지니 3(Genie 3)'를 공개했다고 밝혔다. 아직 연구·실험 단계인 만큼 제한된 형태로 공개 중으로 현재 미국 내 구글 AI 울트라 구독자를 중심으로 순차 제공되고 있다. '지니'란?…영상 넘어 '플레이 가능한 세계' 생성하는 월드모델 지니는 구글 딥마인드가 개발한 범용 월드 모델이다. 온라인 등에 공개된 영상 등을 통해 스스로 물리법칙을 학습하고 활용할 수 있는 것이 특징이다. 이를 통해 이용자가 입력한 텍스트 프롬프트를 바탕으로 상호작용 가능한 환경을 생성하고 사용자 행동에 따라 다음 장면을 실시간으로 이어붙일 수 있다. 기존 생성형 AI가 텍스트·이미지·영상 같은 결과물을 만들어냈다면 지니는 사용자가 직접 들어가 움직이며 경험할 수 있는 '환경'을 만든다. 키보드 입력으로 주변을 둘러보거나 이동하는 등 조작이 가능하다는 점에서, 단순 영상 생성을 넘어선 차세대 생성형AI 모델이라는 평이다. 특히 구글은 지니 3가 24프레임 속도로 실시간 탐험 가능한 동적 세계를 생성하며 720p 해상도에서 수분간 일관성을 유지한다고 밝혔다. 이용자가 이동하는 순간마다 세계가 끊기지 않고 이어지는 구조를 만들 수 있다는 설명이다. 업계에서 지니를 주목하는 이유는 생성형 AI의 방향 자체가 바뀌고 있기 때문이다. 그동안 생성형 AI는 텍스트, 이미지, 영상 등 결과물을 만드는 '제작 도구'로 확산됐다. 반면 지니는 사용자 선택을 반영해 다음 장면을 즉시 계산한다. 이용자가 조작하는 순간마다 세계가 새로 생성된다. 게임처럼 플레이되는 환경이 AI에 의해 즉석에서 구성되는 방식이다. 이 변화는 엔터테인먼트 산업뿐 아니라 교육·훈련·시뮬레이션·로봇 연구로까지 확장될 수 있다는 점에서 의미가 크다. 특히 현실에서 반복하기 어려운 상황을 가상 세계에서 무한히 생성할 수 있다는 점이 강점으로 꼽힌다. 구글 슐로미 프럭터 디렉터은 "지니 3는 단순히 이동 가능한 영상을 만드는 것이 아니라, 사용자의 행동을 반영해 세계가 계속 생성되도록 만드는 모델"이라며 "현실에서 일어날 수 있는 수많은 가상 시나리오를 시뮬레이션할 수 있다는 점에서 연구적 가치가 크다"고 설명했다. 딥마인드 '시뮬레이션 연구' 연장선…AGI 핵심 단계로 주목 지니 프로젝트의 기반은 딥마인드가 10년 넘게 이어온 시뮬레이션 연구다. 딥마인드는 실시간 전략 게임을 학습하는 에이전트 개발부터 로봇과 오픈엔디드 학습을 위한 가상 환경 연구를 진행해 왔다. 이 과정에서 등장한 개념이 월드 모델이다. 월드 모델은 환경이 어떻게 변화할지, 사용자의 행동이 세계에 어떤 영향을 미칠지 예측하며 시뮬레이션하는 AI 시스템이다. 구글은 월드 모델을 범용 인공지능(AGI)로 가는 핵심 단계로 보고 있다. 무한히 확장 가능한 시뮬레이션 환경을 만들 수 있다면, AI 에이전트를 현실보다 훨씬 다양한 상황에서 학습시키는 것이 가능해지기 때문이다. 딥마인드는 지니 1·지니 2를 통해 기반 월드 모델을 제시했고, 이후 비디오 생성 모델 '비오(Veo)' 계열을 통해 물리 이해도까지 확장해 왔다. 지니 3는 이 흐름이 '실시간 상호작용'으로 진화한 결과로 정리된다. 지니 3의 핵심은 실시간 상호작용이다. 이용자가 이동할 때마다 AI가 프레임을 자동회귀 방식으로 생성하면서도, 앞서 생성된 장면과 흐름을 계속 참조해 일관성을 유지해야 한다. 예컨대 사용자가 1분 뒤 다시 같은 장소로 되돌아오면, AI는 1분 전의 정보를 끌어와 자연스럽게 연결해야 한다. 구글은 지니 3가 이런 방식으로 세계의 시각적 기억을 유지한다고 설명했다. 또 다른 기능은 텍스트 입력으로 세계 자체를 바꾸는 방식이다. 단순 이동 조작을 넘어 날씨를 바꾸거나 새로운 물체·캐릭터를 등장시키는 등, 세계 변화 이벤트를 프롬프트로 유도할 수 있다. "만약에" 시나리오를 무한히 만들 수 있다는 점에서 시뮬레이션 가치가 커진다는 평가다. 구글 딥마인드에서 오픈 엔디드 팀을 이끄는 잭 파커-홀더 연구원은 "우리는 이제 장면을 완벽하게 기록하는 수준을 넘어 우리가 직접 발을 들여놓을 수 있는 동적인 시뮬레이션 세계를 구축하는 단계로 나아가고 있다"며 "AI 에이전트가 스스로 학습할 수 있는 가상환경은 단순한 콘텐츠 생성 도구를 넘어 범용 인공지능(AGI)을 위한 핵심 훈련장이 될 것"이라고 설명했다. "지니 제대로 쓰려면 영화감독처럼"…프롬프트가 곧 연출 구글은 지니 3의 기술을 이용자가 직접 체험할 수 있도록 별도 프로토타입안 '프로젝트 지니(Project Genie)' 공개했다. 이는 현재 미국 내 구글 AI 울트라 구독자를 중심으로 순차 제공되고 있다. 프로젝트 지니의 핵심 기능은 '월드 스케치(World Sketching)', '월드 탐험(World Exploration)', '월드 리믹스(World Remixing)'다. 월드 스케치는 텍스트와 이미지를 프롬프트에 입력해 세계를 구성하는 단계다. 이용자는 캐릭터와 배경을 설정하고, 걷기·라이딩·비행·운전 등 탐험 방식을 직접 정의할 수 있다. 구글은 이 과정에서 나노 바나나 프로를 연동해 이미지 프리뷰를 제공한다. 이를 통해 미리보기 이미지를 수정하며 세계의 분위기와 디테일을 조정할 수 있다. 1인칭·3인칭 시점도 선택 가능하다. 월드 탐험은 생성된 세계 속을 실제로 이동하는 기능이다. 이용자가 움직이면 그 행동을 기반으로 다음 장면이 실시간 생성된다. 카메라 앵글도 조정할 수 있다. 월드 리믹스는 이미 만든 세계를 다시 재구성하는 기능이다. 기존 프롬프트를 바탕으로 환경이나 캐릭터를 바꿔 새로운 세계로 확장한다. 완성된 탐험 과정은 영상으로 저장할 수 있다. 구글은 월드를 생성할 때 프롬프트를 짧고 직접적으로 쓰는 것을 권장했다. 이용자 입력을 바탕으로 실시간으로 세계를 이어 붙이는 구조인 만큼, 긴 문장으로 서술하는 방식보다 명령형에 가까운 행동 중심 문장이 더 잘 작동한다는 설명이다. 예를 들어 "황혼의 도시를 배경으로 사이버펑크 분위기의 골목을 걷고 싶다"처럼 분위기를 길게 설명하는 문장도 가능하지만 '네온 간판이 있는 좁은 골목', '젖은 아스팔트', '바닥에 깔린 연기', '비가 내림'처럼 핵심 요소를 끊어 적는 방식이 더 정확한 결과로 이어질 수 있다는 설명이다. 이런 짧고 직관적인 설명이 제공되야 모델이 장면을 구성할 때 어떤 요소를 반드시 넣어야 하는지 빠르게 파악하기 때문이다. 특히 캐릭터 조작은 이동 방식이나 행동을 구체적으로 지정할수록 탐험 중 캐릭터가 잘못 움직이거나 제어가 불안정해지는 현상을 줄일 수 있다. 구글 딥마인드 슐로미 프록터 리서치 디렉터는 "지니에게 명령할 때는 영화감독이나 게임 기획자가 되었다고 생각하면 쉽다"며 "카메라 위치, 캐릭터의 구체적인 액션, 화면에 보이는 미장센을 짧고 굵게 명령할 때 지니는 가장 완벽한 세계를 보여줄 것"이라고 조언했다. 아직 초기 연구 모델…완전한 현실 구현은 시간 필요 지니 3는 아직 완성된 서비스가 아닌 실험적 연구 프로토타입인 만큼 한계도 분명하다. 현실 세계의 특정 위치를 지리적으로 완벽하게 재현하지 못하며, 텍스트 렌더링 품질이나 복잡한 다중 에이전트 상호작용은 여전히 해결해야 할 과제로 남아 있다. 연속적인 상호작용 시간도 아직은 '수 분' 수준으로 제한돼 있다. 그럼에도 업계 반응은 긍정적이다. 이미지와 영상을 만드는 도구를 넘어, 사용자가 직접 상호작용할 수 있는 '세계'를 생성할 수 있다는 점에서 새로운 지평을 열었다는 평가가 나온다. 월드 모델이 단순한 연구 개념을 넘어 실제 이용자 체험 단계로 내려왔다는 점이 상징적이라는 분석이다. 기술이 지속적으로 발전할 경우 파급력은 더 커질 것으로 전망된다. 게임은 물론 교육·훈련 시뮬레이션, 로봇 연구 등 다양한 산업에서 활용도가 높아질 수 있기 때문이다. 현실에서 반복하기 어려운 환경을 가상으로 무한히 생성할 수 있다는 점은 AI 학습과 응용 범위를 크게 넓힐 수 있다는 기대감으로 이어진다. 슐로미 프럭터 디렉터는 "지니 3는 월드 모델이 AI 연구와 생성형 미디어 전반에 실질적인 영향을 미치기 시작하는 중요한 순간"이라며 "이용자가 프롬프트로 만든 세계가 곧 콘텐츠가 되고, 그 콘텐츠가 다시 새로운 세계로 이어지는 무한한 확장의 시대가 열릴 것"이라고 강조했다. 잭 파커-홀더 연구원 역시 "지니 3는 단순히 화면을 생성하는 기술이 아니라, 이용자가 탐험하고 경험할 수 있는 환경을 실시간으로 만들어내는 기술"이라며 "월드 모델이 앞으로 교육과 훈련, 에이전트 연구 등 다양한 영역에서 새로운 가능성을 열 것"이라고 말했다. 또한 그는 "우리는 이제 AI가 만들어낸 세계를 바라보는 단계를 넘어, 그 세계 안으로 들어가 상호작용하는 시대로 접어들고 있다"고 덧붙였다.

2026.02.04 12:33남혁우 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

[단독] 삼성 파운드리, 4·8나노 공정 가격 인상 추진

생성형 AI 패러다임 바뀔까…구글 '지니' 공개에 산업계 지형 변화 예고

[신년 인터뷰] 조준희 KOSA 회장 "AI 승부처는 중동·동남아…완제품 풀스택으로 간다"

"국내 가상자산거래소만 묶이면 해외업체만 웃는다"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.