• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
디지털트러스트
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이미지 AI'통합검색 결과 입니다. (50건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"AI 프사, 이 정도였어?"…챗GPT 이미지 2.0, 출시 첫 주부터 난리

오픈AI의 새 이미지 생성 모델 '챗GPT 이미지 2.0'이 출시 첫 주부터 빠르게 이용자를 끌어모으고 있다. 지난해 '지브리풍' 이미지 열풍으로 AI 이미지 생성의 대중성을 확인한 오픈AI가 이번에는 사진 한 장을 화보·애니메이션·캐릭터 이미지로 바꾸는 '사진 변환' 수요를 앞세워 다시 흥행몰이에 나선 모습이다. 1일 오픈AI에 따르면 지난달 26일 기준 챗GPT 이미지 2.0의 일일활성이용자수(DAU)는 전주 대비 60% 이상 증가했다. 같은 기간 신규 이용자 유입은 130% 이상 늘었다. 챗GPT 이미지 2.0은 사용자의 지시를 이미지에 정밀하게 반영하고 이미지 안의 텍스트를 자연스럽게 구현하는 기능을 강화한 것이 특징이다. 특히 한글·일본어·중국어 등 비라틴 문자권 언어의 텍스트 렌더링 정확도가 개선되면서 기존 이미지 생성 AI에서 반복적으로 지적됐던 '글자 깨짐' 문제도 줄었다. 초기 흥행의 중심에는 '사진 변환' 수요가 있다. 오픈AI가 최근 24시간 동안 한국 이용자들의 이미지 활용 사례를 분석한 결과 기존 사진을 기반으로 스타일이나 콘셉트를 바꾸는 요청이 주를 이뤘다. 가장 많이 사용된 프롬프트는 "이 사진을 고급 패션 스튜디오 화보처럼 바꿔줘. 피부 톤이 잘 살아나게 배경도 어울리게 바꿔줘"였다. 이어 "이 사진을 요즘 유행하는 애니메이션 스타일로 바꿔줘", "사진 속 인물을 귀여운 미니미 캐릭터처럼 만들어줘", "이 사진을 활용해서 짧은 코믹 스트립을 만들어줘" 등도 자주 사용됐다. 이는 AI 이미지 활용 방식이 '그림을 만들어주는 도구'에서 '사진을 다시 해석하는 도구'로 넓어지고 있음을 보여준다. 지난해 지브리풍 이미지가 특정 화풍을 따라 하는 놀이로 확산됐다면, 챗GPT 이미지 2.0은 이용자가 가진 사진을 기반으로 화보, 팬아트, 프로필 이미지, 짧은 만화 등으로 재가공하는 데 초점이 맞춰지고 있다. 특히 팬덤 문화와 소셜미디어 소비가 강한 한국 시장에서는 연예인 사진이나 인물 사진을 애니메이션풍으로 바꾸는 활용이 빠르게 확산될 가능성이 크다. 별도 편집 툴을 다루지 않아도 사진 한 장과 간단한 문장만으로 결과물을 만들 수 있다는 점이 진입 장벽을 낮추고 있다. AI 이미지 생성 시장 경쟁도 더 치열해지고 있다. 구글은 '나노바나나' 계열 이미지 생성·편집 모델을 앞세워 제미나이 생태계 안에서 빠른 생성 속도와 편집 성능을 강조하고 있다. 어도비는 포토샵·프리미어·라이트룸 등 크리에이티브 클라우드 앱에 AI 기능을 결합하며 창작자 워크플로 공략에 속도를 내고 있다. 오픈AI는 챗GPT의 대중적 이용자 기반을 바탕으로 이미지 기능을 일상 사용처로 넓히는 데 초점을 맞추고 있다. 구글이 제미나이 생태계 확장과 모델 성능을, 어도비가 전문 창작자용 편집 워크플로를 앞세운다면 오픈AI는 일반 이용자의 반복 사용을 끌어내는 쪽에 무게를 두는 모습이다. 가브리엘 고 오픈AI 챗GPT 이미지 2.0 리드 리서처는 "한국을 포함한 아시아 이용자들이 매우 창의적이고 실용적인 방식으로 빠르게 활용하고 있는 점이 인상적"이라며 "가장 흥미로운 아이디어는 종종 우리가 아니라 사용자들로부터 나온다"고 말했다.

2026.05.01 15:07장유미 기자

"결과만 있고 이유는 없다"...구글 DESIGN.md가 놓친 'AI 디자인' 핵심

구글이 AI 디자인 규격 'DESIGN.md'를 공개하며 표준화 경쟁에 불을 지폈다. 하지만 IBM 리서치 김은수 엔지니어는 "결과(What)는 있지만 이유(Why)는 빠져 있다"고 평가했다. AI의 추론 과정을 인간이 제어하고 검증할 수 있는 '사고의 투명성'이 차세대 디자인 도구의 진정한 승부처가 될 것이라는 설명이다. 구글은 지난 21일 AI 디자인 도구 '스티치(Stitch)'의 핵심 파일 규격인 DESIGN.md를 오픈소스로 공개했다. DESIGN.md는 구글 랩스가 개발한 AI 디자인 도구 '스티치'에서 사용하는 마크다운(markdown) 형식의 파일이다. 제품의 색상, 서체, 컴포넌트 등 디자인 시스템 규칙을 AI 에이전트가 읽을 수 있는 형태로 기록한다. 이에 대해 IBM Research 소속 김은수 UX 엔지니어는 "구글의 이번 발표는 AI를 활용한 디자인 작업에서 각 개인이 각자의 방식으로 풀어오던 숙제를 표준화(standardize)할 수도 있는 중요한 움직임"이라면서도 "그러나 진짜 문제는 아직 풀리지 않았다"는 시각이다. "결과(what)는 기록되지만 이유(because)는 빠져 있다" 김 엔지니어는 지디넷코리아와의 서면 인터뷰에서 "현장에서 디자이너들을 관찰해보면, AI가 만든 결과물이 마음에 들지 않을 때 근본적인 문제는 '결과물의 품질'이 아니라 '바꾸고 싶지 않은 부분까지 함께 바뀌어버리는 것'이었다"고 언급했다. 그는 "예를 들어 AI에게 '사용자 타깃을 초보자로 바꿔달라'고 요청했을 때, 화면 구성만 단순하게 바뀌기를 원했는데 버튼 색상, 레이아웃, 톤앤매너까지 연쇄적으로 달라지는 경우가 많다"며 "AI가 내린 결정들 중 어디까지가 서로 연결돼 있는지가 드러나 있지 않기 때문에, 작은 수정 하나가 예상치 못한 곳에서 문제를 일으킨다"고 지적했다. 이어 "기존 AI 도구들도 중간 과정을 들여다볼 수는 있지만, 그것이 디자인 프로세스 안에 통합돼 있지 않아 '어디까지 바꾸고 어디부터는 지켜야 하는지'를 명시할 방법이 없다"면서 "결국 디자이너는 컨트롤을 포기하고 처음부터 다시 시작하거나, 반대로 AI를 아예 쓰지 않는 쪽을 택하게 된다"고 덧붙였다. DESIGN.md 역시 같은 한계를 공유한다는 것이 김 엔지니어의 분석이다. 그는 "DESIGN.md는 '주요 버튼은 테라코타 색'이라고 기록하지만, 왜 테라코타를 골랐는지, 어떤 조건에서 다시 검토해야 하는지는 담지 않는다"며 "결과는 있지만 이유가 빠져 있는 구조"라고 말했다. "대화는 기록되지만 참조되지 않는다…디자인 결정의 '상시 산출물' 필요" 김 엔지니어는 최근 AI 업계의 움직임 중 앤트로픽의 클로드 디자인 기능을 주목할 만한 진전으로 꼽았다. 디자이너에게 능동적으로 질문을 던지며 중간 결정을 함께 만들어가는 방식이라는 설명이다. 다만 김 디자이너는 "이 대화의 기록이 디자인 프로세스 안에서 언제든 되돌아가 참조하거나 수정할 수 있는 구조화된 산출물로 자리 잡고 있지는 않다"고 첨언했다. 이어 그는 "이러한 중간 결정들이 '상시 참조 가능한 산출물(standing artifact)'로 디자인 프로세스에 자리 잡아야 언제든 되돌아가 읽고 고칠 수 있게 된다"고 설명했다. IBM Research에서 진행해온 멀티 에이전트 기반 디자인 시스템 연구는 이 방향의 한 가지 실마리를 보여준다. 김 엔지니어에 따르면, 여러 AI 에이전트가 사용자 조사, 전략 수립, 시각 디자인, 품질 검토 등을 나눠 맡고 서로 작업을 넘기는 '핸드오프(handoff)' 구간마다, 중간 산출물이 자연스럽게 '인간 개입 지점(human-in-the-loop)'을 만들어낸다. 그는 이를 바탕으로 '읽을 수 있고(legible), 제어 가능하며(controllable), 검증 가능한(verifiable) 추론 체인'이라는 개념을 제시했다. 먼저 ▲인간이 AI의 중간 결정을 읽고 이해할 수 있어야 하고(읽기 가능성) ▲그 결정을 바꾸면 전체 결과물이 재계산돼야 하며(제어 가능성) ▲각 결정이 어떤 근거로 내려졌는지 추적하고 확인할 수 있어야 한다(검증 가능성)는 주장이다. 기존의 human-in-the-loop이 최종 결과물에 대한 검수 단계에 머물렀다면, 이제는 추론 단계 자체를 인간과 AI가 함께 읽고, 제어하고, 검증하는 방향으로 나아가야 한다는 것이다. 김 엔지니어는 이 같은 방향성이 필요한 근본적 이유에 대해 "디자인은 여전히 인간의 의사결정이 필요한 영역이고, 그 판단이 프로세스 곳곳에 영향을 미쳐야 품질 높은 결과물이 나온다"며 "AI를 도입한다고 해서 디자이너의 역할이 줄어드는 것이 아니라, 오히려 어디에서 어떤 판단을 내려야 하는지가 더 명확하게 드러나야 한다"고 강조했다. 그는 구체적 형태에 대한 전망도 내놨다. 김 엔지니어는 "DESIGN.md가 디자인 시스템을 위한 README 파일이라면, 다음에 필요한 것은 '디자인 결정'을 위한 README"라며 "personas.md, journey-map.md 같은 파일들이 인간과 AI의 협업이 수면 위로 드러나는 방식이 될 수도 있다"고 말했다. 이어 "AI 디자인 도구 경쟁의 다음 무대는 더 좋은 픽셀을 만드는 모델이 아니라, 자신의 사고 과정을 읽을 가치가 있게 만드는 도구가 될 것"이라고 내다봤다. ■김은수(Sue Kim) 엔지니어 -現 IBM Research UX 엔지니어 -AI 기반 디자인 도구 및 멀티 에이전트 UX 시스템 연구 -MIT Senseable City Lab 연구 경력 -하버드 디자인 대학원(Harvard GSD) 석사

2026.04.26 09:31백봉삼 기자

클립아트코리아, 'AI 스튜디오' 출시…"AI 이미지 생성부터 편집까지"

스톡 이미지 기업 클립아트코리아가 인공지능(AI) 기반 이미지 생성 및 편집 기능을 결합한 'AI 스튜디오'를 공식 출시했다고 밝혔다. 최근 콘텐츠 제작 과정에서 AI 이미지 생성 수요가 빠르게 증가하고 있지만, 원하는 결과를 얻기 위해 복잡한 프롬프트 작성과 반복적인 수정 작업이 필요하다는 점이 한계로 지적돼 왔다. 클립아트코리아의 'AI 스튜디오'는 이러한 불편을 개선하는 데 초점을 맞췄다. 사용자는 프롬프트 입력을 통해 이미지를 생성하는 동시에, 기존 이미지 편집과 보정 작업까지 하나의 흐름 안에서 처리할 수 있다. 특히 클립아트코리아가 보유한 콘텐츠 라이브러리를 직접 활용할 수 있다는 점이 특징으로 꼽힌다. 일반적인 AI 이미지 생성 서비스가 텍스트 기반으로 결과물을 만드는 것과 달리, 'AI 스튜디오'는 검증된 고품질 이미지를 기반으로 작업이 가능해 보다 안정적이고 완성도 높은 결과물을 빠르게 구현할 수 있다. 이를 통해 사용자는 원하는 구도와 스타일을 보다 정밀하게 반영할 수 있으며, 초기 생성 단계부터 결과물의 품질을 끌어올릴 수 있다. 또한 생성된 이미지에는 이미지 확장, 배경 제거, 화질 개선 등 다양한 편집 기능을 적용할 수 있어 실무 활용도를 높였다. 또한 생성된 이미지에 다양한 편집 기능을 적용할 수 있다. 이미지 확장, 배경 제거, 화질 개선 등의 기능을 통해 결과물을 실무에 바로 활용할 수 있는 수준으로 보완할 수 있다. 해당 서비스는 배너 제작, SNS 콘텐츠, 광고 이미지 제작 등에서 반복적인 작업 시간을 줄이는 데 기여할 것으로 기대되며, 마케팅 담당자와 1인 사업자, 중소기업 등 디자인 리소스가 부족한 사용자에게 특히 유용할 것으로 보인다. 클립아트코리아 관계자는 “AI 스튜디오는 단순 이미지 생성 도구를 넘어 프리미엄 콘텐츠를 기반으로 더 빠르고 안정적인 제작 환경을 제공하는 데 초점을 맞췄다”며 “앞으로도 고품질 콘텐츠와 AI 기술을 결합한 서비스를 지속적으로 확대해 나갈 계획”이라고 밝혔다. 자세한 내용은 클립아트코리아 공식 웹사이트에서 확인할 수 있다.

2026.04.22 09:51이정현 미디어연구소

[AI는 지금] '지브리 풍'이 불붙인 이미지 전쟁…놀이 넘어 비즈니스 격전지로

'덕테이프(Duct Tape)'라는 코드명으로 불린 오픈AI의 새 이미지 생성 모델이 베일을 벗었다. '지브리 풍' 이미지 유행으로 촉발된 인공지능(AI) 이미지 모델 경쟁이 구글 나노바나나, 어도비 서비스 고도화로 이어진 가운데, 오픈AI가 이미지 모델 최초의 '사고(Thinking)' 기능을 탑재한 신모델로 재반격에 나선 모습이다. 오픈AI는 21일(현지시간) AI 이미지 생성 모델의 새 버전 '챗GPT 이미지 2.0'을 출시했다. '이미지젠 2.0' 모델을 기반으로 한 이 서비스는 AI 평가 플랫폼 아레나에서 호평받은 덕테이프의 정식 출시판이다. 핵심 기능은 오픈AI 이미지 모델로선 처음 도입된 사고 기능이다. 이미지 2.0에서 사고 기능을 활성화하면 웹 검색을 통해 최신 정보를 반영하거나 하나의 프롬프트에서 최대 8개의 서로 다른 이미지를 한 번에 생성하고 자체 출력물을 검토하는 것이 가능해진다. 여러 장의 이미지에 걸쳐 인물이나 캐릭터 일관성도 유지할 수 있다. 오픈AI는 연속 만화 페이지, 다양한 종횡비의 소셜 그래픽 세트, 브랜드 포스터 패밀리 등 이전에 번거로웠던 워크플로우를 대폭 간소화할 수 있다고 설명했다. 지식 기준일은 2025년 12월이다. 이미지 2.0은 세밀한 지시 수행, 물체 배치 정확도, 밀집 텍스트 렌더링에서 이전 세대 대비 눈에 띄는 향상을 이뤘다. 응용 프로그램 인터페이스(API) 기준 최대 2K 해상도를 지원하며 3:1에서 1:3까지 다양한 종횡비로 이미지를 생성해 배너·포스터·소셜 그래픽 등 실무 포맷에 바로 적용할 수 있다. 다국어 지원도 강화됐다. 기존 이미지 생성 모델은 영어 및 라틴 문자 계열 언어에선 안정적이었지만 비라틴 문자권 경우 정확도가 떨어진다는 지적을 받아왔다. 이미지 2.0은 일본어·한국어·중국어·힌디어·벵골어 등에서 텍스트가 자연스럽게 흐르는 이미지를 생성할 수 있다고 오픈AI 측은 설명했다. 이미지 2.0은 이날부터 모든 챗GPT 및 코딩 에이전트 코덱스 사용자가 이용할 수 있다. 사고 기능을 활용한 고급 출력은 챗GPT 플러스·프로·비즈니스 사용자에게 제공된다. 개발자는 API를 통해 'gpt-이미지-2' 모델로 동일한 기능을 자사 제품에 적용할 수 있다. 가격은 선택한 품질 및 해상도에 따라 달라진다. AI 이미지 생성 시장 경쟁은 단순한 신모델 출시 경쟁을 넘어 플랫폼 전략 싸움으로 번지고 있다. 지난해 지브리 풍 이미지 열풍이 대중적 관심을 일으키면서 이미지 생성 AI가 놀이 영역을 벗어나 본격적인 제품 경쟁 단계로 접어들면서다. 구글은 지난 2월 나노바나나의 후속작인 나노바나나2(제미나이 3.1 플래시 이미지)를 내놓으며 고품질 추론과 빠른 생성 속도를 결합한 이미지 생성·편집 도구로 밀고 있다. 어도비는 지난달 포토샵 AI 어시스턴트와 파이어플라이 이미지 에디터를 강화한 데 이어, 이달 15일엔 포토샵·프리미어·라이트룸 등 크리에이티브 클라우드 앱 전체를 대화형 인터페이스 하나로 제어하는 '파이어플라이 AI 어시스턴트'를 발표했다. 자체 모델만으로 경쟁하는 대신 경쟁사 모델까지 흡수해 크리에이터 워크플로의 허브가 되겠다는 전략이다. 각사가 지향하는 방향성도 주목된다. 오픈AI는 챗GPT 안에서 바로 쓰는 소비자 경험을, 구글은 빠른 생성 속도와 모델 성능을, 어도비는 크리에이터 친화적 워크플로와 상업적 안전성을 각각 앞세우고 있다. 이미지 품질 경쟁을 넘어 텍스트 정확성, 편집 일관성, 속도, 상업적 활용성을 누가 더 잘 잡느냐의 싸움으로 전선이 확장되는 양상이다. 오픈AI는 공식 페이지를 통해 "이미지는 장식이 아닌 하나의 언어"라며 "아이디어를 이해하고 공유하고 가르치고 구축할 수 있는 결과물로 전환하도록 돕겠다"고 말했다. 이어 "기능과 위험이 진화함에 따라 보호 조치를 지속적으로 강화할 것"이라고 덧붙였다.

2026.04.22 09:47이나연 기자

이미지 번역해도 디자인 안 무너진다…플리토, 원본 살리는 번역 선봬

플리토가 텍스트뿐 아니라 디자인 속성까지 그대로 복원하는 이미지 번역 솔루션을 통해 대량 이미지 번역 시장 공략에 나선다. 플리토는 이미지 내 텍스트를 번역하면서 글씨 색상·테두리 등 디자인 속성까지 복원하는 '이미지 번역 프로'를 출시했다고 20일 밝혔다. 이미지 번역 프로 핵심 기술은 두 가지로 구성된다. 우선 텍스트 속성 인식은 특정 단어에만 적용된 포인트 컬러나 테두리 효과를 정확히 인식해 번역 텍스트에도 동일한 디자인 속성을 복원한다. 스마트 필터링은 제품 용기에 인쇄된 브랜드 로고·텍스트를 OCR 단계에서 자동 제외하고 마케팅 문구만 현지 언어로 번역한다. 브랜드 고유 톤앤매너를 유지하면서 구매 유도 정보만 정확히 전달한다. 처리 속도와 효율도 갖췄다. A4 한 장 분량 기준 약 10초 이내 고품질 번역 이미지를 생성하며, 수동 작업 대비 약 90% 이상의 시간 절감 효과를 제공한다. HTML·JPG·PNG 등 다양한 포맷을 지원해 검색엔진최적화(SEO)에도 활용 가능하다. 플리토는 광학문자인식(OCR)·인페인팅·번역 엔진을 결합한 기술로 대량 이미지 번역 시장을 공략하고 있다. 현재 올리브영·졸스 등 글로벌 뷰티·패션 라이프스타일 플랫폼과 협업 중이다. 최근 중국을 비롯한 크로스보더 전자상거래 기업들의 협업 요청도 급증하고 있다. 이정수 플리토 대표는 "이커머스 브랜드 경쟁력은 미세한 디테일에서 결정되기에 단순 언어 번역을 넘어 브랜드 디자인까지 반영하는 것이 중요하다"며 "문장 속 부분 컬러까지 찾아내는 이미지 번역 프로를 통해 글로벌 셀러들이 언어와 디자인의 장벽 없이 전 세계 고객과 만날 수 있도록 돕겠다"고 말했다.

2026.04.20 16:14이나연 기자

정체불명 이미지 AI '덕테이프'…나노바나나 대항마 될까

오픈AI의 차기 이미지 생성 인공지능(AI) 모델로 추정되는 '덕테이프(Duck-Tape)'가 주목받고 있다. 기존 이미지 생성 AI가 넘지 못했던 한글 렌더링 장벽을 사실상 허문 것으로 평가받으면서다. 19일 업계에 따르면 덕테이프는 AI 블라인드 테스트 플랫폼 '아레나 AI'에서 테스트 중인 이미지 생성 모델이다. 아레나 AI는 이용자가 프롬프트를 입력하면 모델명이 가려진 두 결과물을 비교 평가하는 방식으로 운영된다. 이용자가 선호하는 결과물을 선택한 뒤에야 어떤 모델이었는지 공개된다. 덕테이프가 주목받는 이유는 성능이다. 기존 이미지 생성 AI는 한글이 포함된 이미지를 생성할 때 글자가 깨지거나 뭉개지는 오류가 빈번했다. 덕테이프는 복잡한 한글 문장은 물론 간판, 말풍선, 손글씨 노트까지 오류 없이 구현한다는 평가를 받고 있다. 업계에선 광고 시안 품질이 전문 그래픽 디자이너 수준이라는 반응이 나온다. 업계에선 덕테이프가 오픈AI 차기 이미지 모델의 코드네임일 것으로 확실시하는 분위기다. 오픈AI는 과거에도 새로운 모델을 출시하기 전 아레나 AI 등에 익명으로 모델을 올려 성능을 검증해 왔다. 다만 덕테이프는 코드네임인 만큼 공식 출시 시 실제 모델명은 달라질 수 있다. 이미지 생성 기능은 AI 서비스 점유율 경쟁의 핵심 전선이다. 오픈AI는 지난해 상반기 챗GPT를 활용한 일본 지브리풍 이미지 제작이 온라인을 중심으로 유행하면서 유료 가입자를 단기간에 수백만 명 늘렸다. 구글 딥마인드도 지난해 8월 '나노바나나 프로'를 공개하면서 제미나이 신규 이용자 1000만 명을 끌어모았다. 이후 2억 건 이상의 이미지 편집이 이뤄지며 앱스토어 1위에 오르기도 했다. 오픈AI는 연내 기업공개(IPO)를 앞두고 실적 반등이 절실한 상황이다. 오픈AI는 지난달 AI 영상 생성 도구 '소라' 서비스를 전격 종료했다. 소라는 하루 최대 1500만 달러의 추론 비용을 소진하면서도 전체 서비스 기간 수익은 210만 달러에 그쳤다. 최근엔 소라 팀을 이끌었던 빌 피블스, 최고제품책임자(CPO) 출신의 케빈 웨일 부사장 등 핵심 임원들이 잇따라 이탈하며 내부 불안감도 커지고 있다. 개발자 피터 레벨스는 X(옛 트위터)에 덕테이프 모델이 "세계 지식 이해도가 극히 높고 텍스트 렌더링이 뛰어나다"며 나노바나나 프로를 능가할 수 있다고 말했다.

2026.04.19 20:00이나연 기자

색상 코드·캐릭터 눈 모양까지…알리바바, AI 이미지 정밀도 한 단계 올렸다

알리바바 그룹이 브랜드 색상 코드부터 캐릭터 세부 특징까지 정밀 제어할 수 있는 인공지능(AI) 이미지 모델로 크리에이터 시장을 공략한다. 알리바바 그룹은 이미지 생성 및 편집 기능을 고도화한 통합 AI 모델 '완(Wan)2.7 이미지'를 2일 출시했다고 밝혔다. 이 모델은 기존 AI 이미지 생성 모델의 획일적 스타일과 예측하기 어려운 색상 결과물 문제를 개선한 것이 특징이다. 크리에이터들이 시행착오를 줄이면서 전문적인 맞춤형 결과물을 구현할 수 있도록 설계됐다. 핵심 개선 사항은 개인화와 색상 제어다. 골격 구조나 눈 모양 등 세부 특징을 정밀하게 조정해 프로젝트별로 차별화된 캐릭터를 만들 수 있다. 새로운 '컬러 팔레트' 기능을 통해 프롬프트에 특정 색상 코드와 비율을 입력하는 것만으로 복잡한 예술적 스타일이나 브랜드 고유 색상을 정확하게 반영할 수 있다. 텍스트 렌더링 성능도 강화됐다. 긴 맥락 학습 구조를 기반으로 최대 3000토큰의 텍스트 입력을 지원하며 12개 언어로 인쇄 품질의 학술 텍스트와 복잡한 수식·표 생성이 가능하다. 최대 9개의 레퍼런스 이미지를 활용하고 한 번에 최대 12개의 이미지를 생성해 스토리보드, 건축 렌더링, 이커머스 캠페인 제작에도 쓸 수 있다. 직관적인 '클릭 편집' 인터페이스로 특정 영역을 선택해 픽셀 단위로 요소를 추가·이동·정렬하는 것도 가능하다. 익명으로 진행된 사용자 선호도 테스트에 따르면 시각적 완성도, 텍스트 렌더링, 복잡한 시각 개념 이해도 부문에서 업계 주요 모델들을 앞서는 성능을 보였다고 회사 측은 밝혔다. 함께 공개된 '완2.7 이미지 프로'는 안정적인 이미지 구성과 프롬프트에 대한 정밀한 이해, 고해상도 4K 출력을 지원한다. 두 모델 모두 알리바바클라우드의 AI 개발 플랫폼 모델 스튜디오와 완 공식 웹사이트를 통해 이용·배포할 수 있다. 알리바바의 AI 애플리케이션 큐원 앱에도 통합될 예정이다. 알리바바클라우드는 "완 시리즈는 2023년 첫 공개 이후 지속적인 고도화를 거듭했다"며 "AI 기반 멀티미디어 기술 분야에서 우리 기술 경쟁력과 개발 역량을 잘 보여준다"고 강조했다.

2026.04.02 17:10이나연 기자

[AI는 지금] "이미지도 자체 기술로"…脫 오픈AI 노린 MS, 멀티모달 경쟁 본격화

마이크로소프트(MS)가 자체 개발한 이미지 생성 모델 '마이(MAI)-이미지-2'를 최근 공개하며 인공지능(AI) 시장 주도권 확보 경쟁에 본격적으로 나섰다. 오픈AI 등 외부 모델 의존에서 벗어나 기술 내재화를 추진하는 동시에 코파일럿 중심 생태계를 강화하려는 전략적 행보로 풀이된다. 27일 업계에 따르면 MS는 지난 19일 자사 AI 슈퍼인텔리전스 팀이 개발한 텍스트-이미지 변환 모델 '마이-이미지-2'를 공개했다. 해당 모델은 성능 평가 플랫폼 아레나 리더보드에서 상위권에 오르며 구글, 오픈AI와 함께 글로벌 이미지 생성 경쟁 구도에 진입했다. 이번 모델은 무스타파 술레이먼 MS AI 최고경영자(CEO)가 이끄는 초지능 팀에서 개발됐다. MS는 이를 통해 이미지 생성 분야에서도 독자 기술 기반을 강화하겠다는 방침이다.술레이먼 CEO는 "우리는 이 모델 출시로 세계 3대 텍스트 이미지 변환 연구소로 도약하게 됐다"며 "초지능 팀은 앞으로 더 많은 것을 선보일 예정인 만큼 기대해 달라"고 밝혔다.이처럼 MS가 자체 모델을 전면에 내세운 것은 오픈AI에 대한 의존도를 낮추려는 전략으로 분석된다. MS는 그간 오픈AI에 대규모 투자를 단행하며 협력 관계를 유지해왔지만, 핵심 AI 기능을 외부에 의존할 경우 비용 부담과 서비스 통제력에 한계가 있다는 평가를 받아왔다. 이에 MS는 자체 모델 확보를 통해 비용 구조를 개선하고 기능, 정책, 업데이트 방향을 독자적으로 설계할 수 있는 기반 마련에 본격 나선 것으로 보인다. 기술 경쟁 측면에서는 멀티모달 AI 시장을 겨냥한 행보로 읽힌다. 최근 AI 산업은 빅테크를 중심으로 텍스트에서 이미지, 음성, 영상까지 아우르는 멀티모달로 빠르게 확장되고 있다. 단일 모델이 다양한 형태의 데이터를 이해하고 생성하는 능력도 플랫폼 경쟁력의 핵심 요소로 자리잡고 있다. 시장 성장세도 가파르다. 글로벌 시장조사업체 그랜드뷰리서치는 멀티모달 AI 시장이 2024년 약 17억3000만 달러에서 2030년 108억9000만 달러 규모로 확대될 것으로 내다봤다. 또 콘텐츠 제작, 광고, 게임, 커머스 등 산업 전반에서 시각 콘텐츠 자동화 수요가 급증하고 있어 멀티모달 영역이 향후 핵심 성장 축이 될 것으로 관측됐다. 이 같은 분위기에 맞춰 MS는 '마이-이미지-2'를 앞세워 멀티모달 시장 내 주도권을 잡기 위해 속도를 낼 것으로 보인다. '마이-이미지-2'는 자연광과 질감, 공간감을 정교하게 구현하는 사실감은 물론, 이미지 내 긴 문장과 복잡한 타이포그래피를 안정적으로 생성하는 기능을 핵심 경쟁력으로 내세웠다. 이는 기존 이미지 생성 모델의 한계로 지적되던 텍스트 표현 문제를 개선한 것으로, 디자인·콘텐츠 제작 영역까지 활용 범위를 넓힐 수 있다는 점에서 주목된다. 제품 전략 측면에서는 코파일럿 생태계와의 결합이 눈에 띈다. MS는 해당 모델을 '코파일럿'과 '빙' 이미지 생성기에 단계적으로 적용할 계획이다. 워드, 파워포인트 등 생산성 도구와 연계될 경우 문서 작성 과정에서 이미지 생성이 기본 기능으로 자리잡을 가능성이 높다. 이는 텍스트 중심 생산성 도구를 멀티모달 플랫폼으로 확장하려는 시도다. 기업 시장 공략도 병행된다. MS는 현재 일부 기업 고객을 대상으로 API를 제공하고 있으며 향후 마이크로소프트 파운드리를 통해 개발자 접근성을 확대할 예정이다. 또 광고·마케팅 기업 등 대량 이미지 생성 수요를 겨냥해 이미지 AI를 산업용 생산 도구로 확장하기 위해 적극 나설 것으로 보인다. 다만 현재 서비스는 기능과 정책 측면에서 일부 제약이 있다. 생성 속도 지연과 사용 횟수 제한, 이미지 비율 고정, 편집 기능 부재 등이 대표적이다. 콘텐츠 필터링 기준도 비교적 엄격하게 적용되고 있다. 이는 기업용 서비스에서 요구되는 안정성과 리스크 관리를 반영한 설계로 해석된다. 업계 관계자는 "MS가 이미지 생성까지 자체 모델로 내재화하면서 AI 경쟁의 판이 텍스트에서 멀티모달 전반으로 빠르게 확장되고 있다"며 "향후 플랫폼 주도권은 얼마나 다양한 데이터를 하나의 경험으로 통합하느냐에 달려 있을 것"이라고 말했다.

2026.03.27 15:56장유미 기자

멀티모달 AI '망각 현상' 외부저장법으로 해결했다…성능도 2배 개선

국내 연구진이 AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 문제를 원천적으로 해결했다. 지식 편집 성능도 2배이상 개선했다. 한국전자통신연구원(ETRI)은 임수종 언어지능연구실장 연구팀이 POSTECH(포항공대), 성균관대학교와 공동으로 '연속·복합 지식 편집 원천 기술(MemEIC)'을 개발했다고 24일 밝혔다. 이 기술은 지난해 미국 샌디에이고에서 열린 세계적인 인공지능 학술대회 '뉴립스(NeurIPS) 2025'에 채택, 공개됐다. 최근 챗GPT, 제미나이, 클로드 등 이미지와 텍스트를 동시에 이해하는 멀티모달 AI가 빠르게 확산되고 있다. 그러나 이들에는 맹점이 있다. AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 현상이 발생한다. 특히 시각 정보와 언어 정보를 동시에 수정해야 하는 경우 두 종류의 지식이 서로 섞이면서 AI가 제대로 이해하지 못해 복합적인 질문에 틀린 답을 내놓는 경우가 빈번하게 나타났다. 연구팀이 이 같은 문제를 해결할 지식 편집 AI 기술을 공개했다. 이 기술은 새로운 정보를 AI 내부가 아닌 외부 메모리(보조기억장치)에 저장한다. 필요할 때만 정보를 불러와 사용하기 때문에 기존 모델 안정성을 유지하면서도 새로운 정보를 유연하게 추가할 수 있다. 기존 방식에서는 AI 내부의 핵심 파라미터를 직접 수정해 지식을 바꾸는 방식이 주로 사용됐다. 이로 인해 지식을 수정하는 과정에서 기존에 저장된 정보까지 영향을 받을 수 있다는 한계가 있었다. 논문 주저자인 성진 언어지능연구실 연구원은 "사람의 뇌가 좌우로 나뉘어 서로 다른 역할을 하듯 AI도 지식을 나누어 저장하도록 만든 것"이라고 말했다. 성진 연구원은 상용화 관련 "메믹이 기존 기술 대비 우수한 성능을 나타내지만, 실사용을 위해선 정확도가 90% 정도는 되어야 한다고 본다"며 "올해 말 기술이전이 이루어질 것으로 예상한다"고 덧붙였다. 이미지 관련 시각 정보는 '시각 어댑터'에 저장하고, 텍스트 관련 언어 정보는 '언어 어댑터'에 각각 독립적으로 저장한다. AI가 이미지와 텍스트를 함께 이해해야 하는 복합적인 질문을 받으면 '지식 커넥터'가 두 정보를 문맥에 맞게 연결해 답을 만든다. 연구진은 기술 성능 확인을 위해 1,278개 항목으로 구성된 복합 지식 편집 벤치마크(CCKEB)를 구축하고, 수백 건의 지식을 순차적으로 편집하는 실험을 진행했다. 그 결과 이 기술은 복합 질문 정확도가 70% 수준으로 나타냈다. 이는 기존 기술들이 36~52% 수준이었던 것과 비교하면 두 배 이상 향상된 성능이다. 또한 새로운 지식을 추가한 뒤에도 기존 질문에 대한 답이 변하지 않아 응답 안정성이 유지되는 '지역성(Locality)' 보존 특성도 확인됐다. 임수종 언어지능연구실장은 “향후 산업 현장의 다양한 정보를 안정적으로 반영할 수 있도록 기술을 더욱 고도화할 것"이라고 덧붙였다.

2026.03.24 09:39박희범 기자

트웰브랩스, 게티이미지코리아에 영상 AI 검색 적용

트웰브랩스가 글로벌 스톡 플랫폼에 인공지능(AI) 영상 검색 기술을 제공했다. 트웰브랩스는 게티이미지코리아 게티이미지 뱅크에 영상 이해 AI 모델 '마렝고'를 공급했다고 23일 밝혔다. 이를 통해 약 10만 고객이 AI 기반 검색 기능을 활용할 수 있다. 이번 서비스는 기존 키워드 중심 검색에서 벗어나 영상 맥락과 의미를 이해하는 방식으로 전환된 것이 핵심이다. 이용자는 구체적인 문장 설명만으로 원하는 장면을 검색할 수 있다. 시스템은 시각 정보와 음성, 자막을 종합 분석해 결과를 제시한다. 그동안 게티이미지 등 스톡 미디어 플랫폼은 메타데이터와 태그 기반 검색에 의존했다. 콘텐츠는 급증했지만 검색 방식은 제한적이었고, 반복적인 필터링 작업이 필요했다. 이번 기술 도입으로 검색 구조 자체가 변화하며 제작 과정의 탐색 시간이 줄어들 것으로 예상된다. 마렝고는 영상 내 다양한 정보를 통합 분석하는 멀티모달 AI 모델이다. 단순 객체 인식을 넘어 장면 흐름과 의미를 이해하고 검색, 분류, 요약까지 수행할 수 있다. 글로벌 시장에서도 기술력을 인정받아 아마존웹서비스(AWS) 아마존 베드록에도 공급됐다. 트웰브랩스 이재성 대표는 "우리 영상 이해 AI 기술이 실제 서비스에 적용돼 사용자 가치를 창출하게 된 의미 있는 사례"라며 "앞으로도 미디어 산업에서 AI가 만들어내는 혁신적인 변화를 선도해 나가겠다"고 밝혔다.

2026.03.23 10:13김미정 기자

첫 투어 국가로 韓 낙점한 감마…AI로 데이터 시각화 지원

인공지능(AI) 콘텐츠 플랫폼 감마가 글로벌 사용자 투어 첫 국가로 한국을 점찍고 신규 디자인 서비스 '감마 이매진'을 포함해 다양한 신규 업데이트 서비스를 선보였다. 감마는 지난 17일 서울 강남구에서 미디어 라운드테이블을 열고 신규 업데이트 서비스를 소개했다. 감마는 프레젠테이션, 문서, 웹사이트, 소셜 게시물 등 비주얼 콘텐츠를 AI로 제작할 수 있는 글로벌 플랫폼이다. 사용자가 아이디어나 키워드를 입력하면 AI가 콘텐츠의 구조를 설계하고 시각 디자인까지 생성하는 것이 특징이다. 2020년 설립 이후 전 세계 약 1억 명의 사용자가 이용하고 있으며, 매일 약 100만 개의 콘텐츠가 제작되고 있다. 이번 업데이트는 역대 최대 규모로, 프레젠테이션·문서 제작 서비스에서 로고, 인포그래픽, 소셜 이미지 등 시각 콘텐츠까지 생성 가능한 비주얼 스토리텔링 플랫폼으로 영역을 확장했다. 감마 이매진은 로고, 인포그래픽, 다이어그램, 소셜 게시물 등을 AI로 구현하는 기능이다. 참고 이미지를 기반으로 특정 스타일을 반영할 수 있으며 여러 디자인 시안을 동시에 제공한다. 자연어 입력만으로 수정까지 가능해 별도의 디자인 프로그램이나 전문 인력 없이도 브랜드에 최적화된 결과물을 만들 수 있다고 회사 측은 설명했다. 이번 업데이트에서는 콘텐츠 재구성과 데이터 시각화를 지원하는 기능도 추가됐다. AI 네이티브 리믹스 템플릿은 기존에 만든 감마 콘텐츠나 템플릿을 기반으로 수정 사항을 입력하면 새로운 디자인을 자동으로 제작한다. 스마트 차트는 데이터를 입력하면 막대그래프, 산점도, 퍼널, 히트맵 등 다양한 형태의 시각 자료로 변환한다. 또한 자연어 입력만으로 로고, 마케팅 그래픽, 소설 이미지 등을 생성할 수 있는 AI 일러스트레이션 기능과 인포그래픽이나 다이어그램을 제작할 수 있는 AI 인포그래픽 기능도 제공한다. 생성된 결과물은 단독 이미지로 사용하거나 프레젠테이션과 문서에 바로 활용할 수 있다. 감마는 외부 업무 솔루션과의 연동도 확대했다. 챗GPT, 클로드, 메이크, 재피어(Zapier), 아틀라시안(Atlassian), 엔에잇엔(n8n), 슈퍼휴먼 고(Superhuman Go) 등 주요 AI 및 업무 솔루션과 연결돼 별도의 프로그램을 실행하지 않아도 기존 AI 어시스턴트나 업무 환경에서 바로 콘텐츠 제작이 가능하다. 그랜트 리 감마 대표는 "디자인 전문 지식 없이도 누구나 시각적으로 아이디어를 표현할 수 있도록 하는 것이 감마의 목표"라며 "감마 이매진을 통해 아이디어에서 결과물 도출까지의 시간을 줄이고 완성도를 높일 수 있을 것"이라고 말했다.

2026.03.18 08:30박서린 기자

한국신용데이터 "직접 만든 AI모델, 이미지 제작 일주일→1분"

한국신용데이터가 자체 이미지생성 인공지능(AI) 모델을 개발했다. 약 한 달 반 만에 만든 생성형 AI 모델인 '캐시노트 AI 비주얼 젠'은 기존 서비스처럼 원하는 프롬프트를 입력하면 약 1분 내외로 이미지를 뚝딱 만들어낸다. 단순히 필요한 이미지가 아니라 한국신용데이터의 브랜드 특성과 디자인 정체성이 반영돼 곧바로 업무에 활용할 수 있는 것이 기존 모델과의 차별점이자 특징이다. '캐시노트 AI 비주얼 젠' 개발을 이끈 인물은 이지스 브랜드 디자이너다. 그는 한국신용데이터가 만든 경영 관리 서비스 '캐시노트'의 브랜드 디자인과 자회사 5곳의 기업 브랜드를 맡고 있다. 이지스 한국신용데이터 브랜드 디자이너는 지난 11일 강남구 사무실에서 지디넷코리아와 진행한 인터뷰에서 '캐시노트 AI 비주얼 젠' 개발 과정을 소개했다. “다양한 소상공인들이 캐시노트 서비스를 이용하는 만큼 각 도메인의 특성을 포괄할 수 있는 지식재산권(IP)을 만들고자 했다. 한국신용데이터의 브랜드 특성, 디자인 톤앤매너, 컬러와 형태에 대한 규칙을 시스템화했다.” 캐시노트 AI 비주얼 젠은 주로 캐시노트 앱 서비스에 활용할 수 있는 인물 캐릭터나 음식 등의 이미지를 생성한다. 기존 2D 이미지를 시각적으로 구현한 3D 형태가 특징이다. 예를 들어 “중년 여자 사장님이 꽃을 들고 있는 이미지를 만들어줘”라고 입력하는 방식이다. 캐릭터의 성별과 연령대는 물론 표정이나 앞치마 색깔 등 세부 요소도 추가로 수정할 수 있다. 한국신용데이터가 시중에 나온 생성형 AI를 활용하는 대신 자체 개발을 선택한 이유는 경제성과 효율성 때문이다. 기업이 생성형 AI를 전사적으로 도입하려면 상당한 라이선스 비용이 발생한다. 가령 50명이 서비스형소프트웨어(SaaS) 도구를 사용할 경우 고정 비용이 크게 늘어나지만, 애플리케이션프로그래밍인터페이스(API)를 활용해 자체 구축할 경우 약 95%의 비용 절감 효과를 기대할 수 있다는 설명이다. “범용 모델과 달리, 자체 구축 모델은 디자이너가 아니더라도 프롬프트 입력만으로 실무에 바로 사용할 수 있는 디자인 결과물을 생성할 수 있다. 특히 한국신용데이터만의 정체성이 담긴 이미지를 곧바로 만들어낼 수 있다는 것이 장점이다.” 기존에는 이미지를 하나 제작하기 위해 기획과 리뷰, 피드백 과정을 거쳐 최소 일주일 이상이 소요됐다. 한국신용데이터에는 그래픽 디자이너가 두 명뿐이라 여러 부서에서 이미지 제작 요청이 몰리면 병목 현상이 발생하기도 했다. 그러나 '캐시노트 AI 비주얼 젠'을 활용하면서 복잡한 제작 과정을 거치지 않고 서비스나 광고 배너 등에 활용할 이미지를 약 1분 만에 만들 수 있게 됐다. 이지스 디자이너는 개발 과정에서 동료 개발자의 도움을 받았다. 바이브 코딩 방식으로 다양한 생성형 AI의 API를 활용했다. 그 중에서도 성능과 가격 측면에서 가장 합리적인 GPT-4o를 중심으로 활용하고 있다. “처음 개발에 도전하는 데다 참고할 레퍼런스도 거의 없어 쉽지 않았다. 우리 서비스의 고유 비주얼이 가진 형태적 특징, 컬러 값, 정서적 분위기, 표현 방식 등 디자이너의 감각적인 영역을 기계가 이해할 수 있는 명확한 언어와 수치로 '번역'하는 과정이 가장 중요하면서도 어려운 과제였다. 다행히 회사 동료들이 적극적으로 도와줘 실제 서비스로 실험적인 구현까지 완주할 수 있었다.” 한국신용데이터는 '캐시노트 AI 비주얼 젠'을 점차 고도화할 계획이다. 가령 기획을 입력하면 이에 최적화된 이미지를 자동으로 생성하고 추천하는 방향으로 확장할 예정이다. 나아가 해당 이미지를 접한 사용자의 행동, 구매 전환율, 클릭률 등의 데이터를 기반으로 추천 기능까지 구현한다면 사업 효율성을 높일 수 있을 것으로 기대하고 있다.

2026.03.15 09:15홍하나 기자

"AI와 대화하며 작업"…어도비, AI 이미지 편집 기능 발표

어도비가 포토샵·파이어플라이에 대화형 인공지능(AI) 편집 기능을 확대해 자동화 업무 수준을 높였다. 어도비는 포토샵 웹과 모바일용 'AI 어시스턴트' 공개 베타 버전, '파이어플라이 이미지 에디터'를 11일 발표했다. 이번 기능은 대화형 AI를 통해 복잡한 이미지 편집 작업을 보다 효율적으로 수행하도록 돕는다. 포토샵 AI 어시스턴트는 채팅 기반 인터페이스를 통해 사용자 편집 의도를 이해하고 작업을 자동으로 수행하거나 단계별로 안내한다. 배경 제거·변경, 색상 조정, 조명 보정 등 주요 편집 작업을 자동 적용할 수 있다. 사용자는 음성으로도 편집 요청을 할 수 있다. 이를 통해 이동 중 모바일 환경에서 간편하게 이미지 편집 작업을 수행할 수 있다. 포토샵 웹에서는 'AI 마크업' 기능이 공개 베타로 제공된다. 사용자가 이미지 특정 영역을 표시한 뒤 프롬프트를 입력하면 해당 영역에 원하는 요소를 생성하도록 제어할 수 있다. 예를 들어 이미지 위 특정 영역을 표시한 뒤 '꽃 추가' '산 추가' 같은 프롬프트를 입력하면 해당 위치에 맞춰 새로운 이미지를 생성할 수 있다. 어도비는 파이어플라이 이미지 에디터를 통해 생성형 이미지 편집 기능을 통합했다. AI 생성 이미지와 사용자가 업로드한 이미지를 동일한 편집 환경에서 수정할 수 있도록 설계됐다. 파이어플라이 이미지 에디터는 생성형 채우기, 생성형 제거, 생성형 확장, 생성형 업스케일 배경 제거 등 주요 AI 편집 기능을 제공한다. 사용자는 프롬프트 기반으로 이미지 요소 추가, 교체, 보정, 확장, 해상도 개선 작업을 수행할 수 있다. 파이어플라이는 어도비 파이어플라이 모델 외에도 외부 AI 모델을 선택해 사용할 수 있도록 지원한다. 구글 '나노 바나나 2'를 비롯한 오픈AI 이미지 생성 등 25개 이상 모델을 지원한다.

2026.03.11 12:56김미정 기자

신입구직자는 '삼성', 경력직은 'SK' 선호...왜?

이번 달 삼성과 SK 등 주요 대기업들의 상반기 채용이 본격화되는 가운데, 진학사 캐치가 Z세대가 바라본 삼성과 SK의 기업 이미지를 AI로 시각화해 눈길을 끌고 있다. 캐치는 대학생·취준생·직장인 1만986명을 대상으로 진행한 '상위 그룹사 이미지 및 인식 조사' 결과를 6일 발표했다. 이번 조사는 구직자들이 선택한 기업 이미지 키워드를 AI 모델 '제미나이'에 입력해 각 그룹사를 대표하는 시각 이미지를 생성하는 방식으로 진행됐다. 먼저 구직자가 인식하는 삼성의 1위 키워드는 '글로벌(57%)'이었다. 이어 ▲업무강도 높은(48%) ▲기술주도(45%)가 뒤를 이으며 글로벌 시장을 선도하는 기술 중심 기업이라는 이미지가 구직자들에게 각인된 것으로 분석된다. AI는 이를 세련된 오피스 룩을 입고 태블릿과 캔 음료를 들고 있는 도시적이고 전문적인 여성 이미지로 생성했다. 반면 SK의 경우 '확실한 보상(54%)'이 1위 키워드로 꼽혔다. 뒤이어 ▲업무강도 높은(44%) ▲기술주도(41%) 순으로 나타나며 체감도 높은 보상 시스템이 SK의 대표 이미지로 자리 잡은 것으로 분석된다. AI는 이를 따뜻한 색감의 옷을 입고 카페에서 스마트폰과 커피를 즐기는 편안한 인상의 남성 이미지로 생성했다. 조사 결과에서 눈길을 끄는 부분은 연차에 따른 선호도 차이였다. 신입 구직자의 과반수(56%)는 삼성을 택했지만, 이직을 준비하는 경력직 구직자들은 SK(57%)를 더 선호했다. 사회 초년생은 글로벌 위상과 네임밸류를 중시하는 경향이 강한 반면, 직장 경험이 쌓일수록 실질적인 보상과 성과 시스템을 중요하게 고려하는 것으로 분석된다. 진학사 캐치 김정현 본부장은 “설문 데이터를 넘어 AI 기술로 구직자들의 인식을 시각화해 보니 그룹사별 이미지가 더욱 선명하게 드러났다”며 “채용 시장에서도 일방적인 홍보가 아닌 데이터와 구직자 트렌드에 기반한 타깃 맞춤형 브랜딩이 필수적인 시대”라고 강조했다. 삼성전자와 SK하이닉스는 이달 상반기 채용을 통해 반도체 인재 확보에 나설 예정이다. 삼성전자를 비롯한 삼성디스플레이, 삼성전기, 삼성SDI 등 주요 삼성 계열사는 이달 중순 신입사원 공개 채용을 시작할 것으로 알려졌으며, SK하이닉스 역시 반도체 연구개발(R&D) 등 핵심 분야 중심의 신입 채용을 진행할 계획이다.

2026.03.06 08:54백봉삼 기자

최 고 마크애니 대표 "AI 콘텐츠 워터마크, 국제 규격 C2PA로 가야"

"인공지능(AI) 생성 콘텐츠의 투명성을 확보하기 위해 대한민국이 독자적인 기준을 세우기보다 국제 표준인 C2PA(콘텐츠 출처 및 진위 확인을 위한 연합)를 적극 수용해야 합니다. 국내만의 별도 표준은 자칫 글로벌 흐름에서 뒤처지는 '갈라파고스적 규제'가 될 수 있습니다." 최고 마크애니 대표는 25일 서울 서초구 드림플러스 강남에서 개최된 'AI 투명성 법·제도 세미나'에서 이같이 강조했다. AI 기본법 시행으로 워터마크 부착이 의무화된 가운데, 최 대표는 기술적 파편화를 막고 글로벌 상호운용성을 확보해야 한다고 강조했다. 구글 제미나이, 오픈AI 챗GPT 등 생성형 AI가 생성한 이미지나 영상에는 워터마크가 붙어 있다. 생성형 AI를 통해 생성한 콘텐츠임을 확인시키기 위해 조그맣게 로고를 표시한 것이다. 일종의 증명인 셈이다. 이런 워터마크는 여러 종류가 있다. 먼저 생성형 AI가 생성한 콘텐츠에 붙는 워터마크는 '가시성 워터마크'다. 가령 제미나이를 통해 이미지를 생성하면 반투명한 로고가 우측 하단에 붙는 식이다. 가시성 워터마크는 생성형 AI를 통해 생성한 콘텐츠임을 증명하는 흔적을 누구나 쉽게 지울 수 있다는 단점이 있다. 포토샵으로 워터마크 자체를 지워버릴 수도 있고, 이미지를 조금만 확대해 잘라내도 워터마크를 없앨 수 있다. 이런 한계를 극복한 워터마크가 '비가시성 워터마크'다. 위조가 불가능한 고유한 서명을 이미지나 영상에 보이지 않게 부여한 것이다. 최 대표는 "할리우드 영화를 보면 매 프레임마다 화면 전체에 모두 비가시성 워터마크가 적용돼 있다. 보이지 않기 때문에 워터마크가 없다고 느낄 수 있지만, 고유 ID가 포함돼 있다"며 "예를 들어 네이버 TV를 본다면 네이버 TV라는 서명(ID)이 박혀 있고, 이를 시청하는 사용자의 ID가 포함돼 있다"고 설명했다. C2PA는 어도비, 마이크로소프트, 구글 등이 주도해 만든 개방형 비가시성 워터마크 기술이자 국제 표준이다. 마크애니는 C2PA 기술을 통해 위조가 불가능한 서명을 콘텐츠에 부여해 무결성을 확보한다. 디지털 콘텐츠가 진짜인지 AI가 생성한 것인지 확인할 수 있는 보이지 않는 수단을 제공하고 있는 것이다. 최 대표는 AI 기본법에 한국만의 표준을 적용기 보다는 국제 표준 C2PA를 따르는 방향으로 나아가야 한다고 주장했다. 그는 "삼성전자도 C2PA 메타데이터를 채택하고 있다. 여러 업체들이 C2PA에 올라타야 하는 상황인데, 대한민국만의 기준을 만들면 국제 표준도 준수해야 하고 국내의 기준도 맞춰야 하는 등 혼선만 초래할 수 있다"며 "C2PA는 무료다. 누구나 쓸 수 있는 오픈소스 형태로 돼 있기 때문에 일부 기업에 이권 사업이 될 확률이 매우 적다. 오히려 한국만의 표준을 만들면 이권 사업이 되는 것처럼 비춰질 수 있다"고 우려했다. 최 대표는 "단지 마크애니는 오픈소스인 C2PA를 스타트업 등 사용자가 쓰기 쉬운 형태로 무료배포하고 있을 뿐"이라며 "AI 기본법 준수 과정에서 겪은 어려움을 최소화하기 위해 지속적으로 지원하겠다"고 밝혔다.

2026.02.25 18:39김기찬 기자

컬리, 이미지 생성 서비스 'AI 스튜디오' 출시

리테일 테크 기업 컬리는 인공지능(AI) 이미지 생성 서비스 'AI 스튜디오'를 출시했다고 20일 밝혔다. AI스튜디오는 구글의 생성형 AI만을 활용해 구현됐다. AI 스튜디오는 사진을 업로드하면 ▲인형 ▲영화배우 ▲옛날 캠 ▲한복 등 다양한 테마의 프로필 사진을 만들어 주는 서비스로 컬리 앱에서 이용할 수 있다. AI 스튜디오는 지난 달 중순 ▲기획자 ▲엔지니어 ▲디자이너 ▲마케터 등 컬리 사내 구성원들이 사이드 프로젝트로 시작해 지난 12일 공개됐다. 컬리 고객에게는 AI스튜디오 이용권이 하루 한 장씩 주어진다. 이미지 생성 시 이용권이 차감되며, 친구에게 공유한 링크로 이미지가 생성되면 한 장 더 받을 수 있다. 컬리 AI 스튜디오는 공개 일주일만에 누적 7만여 건의 이미지 생성을 기록했다. 이외에도 그동안 컬리는 고객이 앱에서 즐길 수 있는 다양한 기능을 구현해왔다. 컬리 앱 하단 '라운지'에서는 나만의 컬리 라이프를 소개할 수 있다. 좋아하는 상품을 추천하는 '마이 컬리템'과 투표, 추천 등을 통해 다른 이용자들과 의견을 공유할 수 있는 '커뮤니티' 등이 대표적이다. 컬리는 지난해 하반기 컬리 앱과 연동할 수 있는 AI 식단 관리 앱 '루션'도 선보였다. 컬리 관계자는 “AI 스튜디오는 고객이 앱 내에서 쇼핑뿐 아니라 즐겁게 머물 수 있는 다양한 경험 제공을 고민하다 기획하게 됐다”며 “리테일 테크 기업으로서 앞으로도 AI 기술을 접목해 고객의 라이프스타일을 다양하게 만들 수 있는 시도를 이어갈 계획”이라고 말했다.

2026.01.20 10:06박서린 기자

"큰 모델보다 쓰임새"…네이버클라우드, 옴니모달 AI 전략 승부수

네이버클라우드가 범용 대규모언어모델(LLM) 경쟁을 넘어 텍스트·이미지·음성·도구 활용을 하나의 모델로 통합하는 '옴니모달 인공지능(AI)' 전략을 전면에 내세웠다. 상대적으로 작은 모델부터 시작해 점진적으로 고도화하는 방식으로, 현실 환경을 이해하고 행동하는 AI 에이전트 구현을 목표로 차세대 파운데이션 모델 경쟁에서 기술적 차별화를 강조했다. 네이버클라우드는 30일 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 서울 코엑스에서 개최한 '독자 AI 파운데이션 모델 1차 대국민 발표회'에서 옴니모달 기반 파운데이션 모델과 이를 적용한 다양한 AI 서비스를 공개했다. 이날 네이버클라우드는 옴니 파운데이션 모델 전략을 제시했다. 전시 부스에서는 텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조의 '하이퍼클로바X 시드 8B 옴니'와 복합 추론 능력을 강화한 '하이퍼클로바X 시드 32B 씽크' 두 가지 모델을 공개했다. 8B급 옴니모델은 규모는 비교적 작지만 멀티모달 입력을 단일 모델 구조에서 처리할 수 있도록 설계된 것이 특징이다. 텍스트·이미지·음성을 각각 다른 모델로 처리해 결합하는 기존 방식과 달리, 처음부터 하나의 의미 공간에서 학습해 응답 속도와 효율성을 높였다. 네이버클라우드는 이 모델을 시작점으로 삼아 데이터 확장과 학습 고도화를 통해 단계적으로 스케일업할 계획이다. 함께 공개된 32B급 씽크 모델은 옴니모달 입력을 바탕으로 추론과 문제 해결에 초점을 맞췄다. 이미지 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 요청을 처리하는 에이전트형 AI 경험을 구현하며 수학 문제 풀이나 시각 정보 기반 추론 등 고난도 작업을 수행하는 시연이 이뤄졌다. 부스에서는 이들 모델을 적용한 다양한 체험형 서비스도 공개됐다. 이미지 촬영만으로 문제를 이해하고 풀이 과정을 설명하는 AI 수학 에이전트, 민원 행정 상담을 돕는 AI 아바타, 법률 상담 챗봇, 감정 상담을 지원하는 마음 케어 아바타 등 공공·생활 밀착형 서비스가 관람객의 이목을 끌었다. 네이버클라우드는 이번 독자 AI 파운데이션 모델 프로젝트를 통해 대규모 파라미터 경쟁보다는 작은 모델을 촘촘하게 다져 키운다는 전략이다. 실제 서비스 환경에서 비용과 개발 부담을 줄이기 위해 8B·32B급 모델에서 옴니모달 구조와 추론 성능을 충분히 검증한 뒤 단계적으로 모델 규모를 확대하겠다는 구상이다. 이를 바탕으로 산업 및 공공 영역으로의 확장도 염두에 두고 있다. 네이버클라우드는 농기계와 모빌리티 등 다양한 산업 현장에서 음성·시각·공간 정보를 동시에 이해하는 AI 에이전트 활용 가능성을 제시하며 물리적 환경과 상호작용하는 피지컬 AI로의 진화를 준비 중이라고 설명했다. 네이버클라우드 관계자는 "옴니모달 AI는 단순히 모델을 크게 만드는 문제가 아니라, 현실 세계의 맥락을 얼마나 정교하게 이해하느냐가 핵심"이라며 "8B급 모델부터 차근차근 고도화해 나가며 산업과 일상에서 실제로 쓰이는 옴니 AI 에이전트를 구현해 나가겠다"고 말했다.

2025.12.30 14:40한정호 기자

인포뱅크, AI 오케스트레이션 '오르카' 출시…기업 시장 공략 가속

인포뱅크가 30년간 축적해 온 자체 개발 역량을 기반으로 기업 커뮤니케이션을 넘어 인공지능(AI)·데이터 중심 솔루션 영역으로 사업을 확장한다. 인포뱅크는 자사 AI 협업 플랫폼 '인세븐'에 자체 개발한 AI 오케스트레이션 시스템 '오르카'를 정식 출시했다고 22일 밝혔다. 최근 엔비디아를 비롯한 글로벌 기업들은 '툴오케스트라' 개념을 제시하며 다중 AI 모델 활용을 차세대 핵심 기술 방향으로 제안하고 있다. 그러나 실제 기업 현장에서는 업무별로 서로 다른 AI 모델을 개별 구독해야 하는 구조로 인해 비용 부담과 운영 복잡성이 커지는 상황이다. 이러한 비효율이 AI 전환(AX)을 가로막는 주요 장애 요인으로 지적돼왔다. 이번에 공개된 오르카는 다양한 글로벌 대규모언어모델(LLM)을 자동으로 선택·조합해 업무 상황에 가장 적합한 모델을 실시간으로 적용하는 AI 오케스트레이터로, 다중 모델을 유기적으로 활용하는 글로벌 AI 기술 흐름에 대응해 개발됐다. 업무 목적과 질문 난이도를 분석해 최적의 AI 모델을 자동 라우팅함으로써, 기업이 모델 선택에 대한 부담 없이 성능과 비용을 동시에 최적화할 수 있도록 지원한다. 이번 시스템은 실무 활용 시나리오를 기준으로 총 4종의 라인업으로 구성됐다. ▲반복 업무와 검색·요약에 적합한 경량 모델 '오르카 라이트' ▲번역과 보고서 작성 등 범용 업무를 지원하는 '오르카 플러스' ▲고급 추론과 전략적 의사결정을 돕는 '오르카 프로' ▲개발·코딩 업무에 특화된 '오르카 코더' 등으로 구성돼 직무와 목적에 따라 유연한 활용이 가능하다. 인세븐은 오르카 라인업 내 고사양 모델을 기존 대비 약 10% 낮은 비용으로 제공한다. 자동 라우팅 기능과 비용 최적화 로직을 결합해 기업의 AI 모델 사용 비용을 구조적으로 절감하도록 설계됐다. 또 복수 모델을 개별 구독해야 했던 기존 방식과 달리 오르카 기반의 단일 인터페이스만으로 필요한 모델을 자동 활용할 수 있어 운영 효율성 향상도 돕는다. 아울러 인세븐은 구글 제미나이 기반 이미지 생성 모델 '나노 바나나'의 플래시·프로 버전도 새롭게 선보였다. 사용자는 텍스트 질의만으로 고속 이미지 생성은 물론 장면 재구성이나 기존 이미지 요소를 유지한 편집까지 즉시 수행할 수 있어 마케팅·디자인·기획 등 시각 중심 업무의 효율을 높일 수 있다. 특히 인세븐의 자연어 처리 기능과 결합해 텍스트 분석 결과를 이미지로 바로 구현하는 '텍스트-이미지 통합 워크플로우' 활용도 가능하다. 인세븐은 최신 글로벌 AI 모델을 신속하게 도입하고 산업별 요구에 맞춘 오케스트레이션과 딥리서치 기능을 지속 고도화할 예정이다. 이를 통해 제조·금융·유통·헬스케어 등 다양한 산업 군을 아우르는 기업용 AI 분석 생태계를 단계적으로 확장해 나갈 계획이다. 인포뱅크 강진범 최고기술책임자(CTO)는 "글로벌 AI 기업들이 다중 모델 오케스트레이션을 핵심 경쟁 기술로 제시하고 있는 가운데, 인세븐은 국내에서 가장 빠르게 독자적인 오케스트레이션 시스템을 구축했다"며 "오르카는 기업이 모델 선택을 고민하지 않고도 최고 성능을 최소 비용으로 활용할 수 있게 해주는 출발점이 될 것"이라고 강조했다. 이어 "앞으로 직무별·산업별 특화 모델과 에이전트를 지속 고도화해 단순 답변 생성을 넘어 기업의 실질적인 디지털 전환을 가속화하는 AI 파트너로 자리매김할 것"이라고 덧붙였다.

2025.12.22 16:10한정호 기자

이미지 생성 AI 모델 경쟁 심화…오픈AI, 'GPT 이미지 1.5' 공개

오픈AI가 이미지 생성과 편집 성능을 강화한 새로운 모델을 선보이며 생성형 인공지능(AI) 이미지 시장 경쟁에 다시 불을 지폈다. 기존보다 정교한 지시 수행과 빠른 처리 속도를 앞세워 이미지 생성 도구를 실험 단계를 넘어 실사용 중심의 창작·업무 도구로 끌어올린다는 전략이다. 17일 테크크런치에 따르면 오픈AI는 새로운 이미지 생성 모델 'GPT 이미지 1.5'를 기반으로 한 챗GPT 이미지의 업데이트를 발표했다. 이번 모델은 지시 이행 정확도 향상, 세밀한 이미지 편집, 최대 4배 빠른 이미지 생성 속도가 특징으로, 모든 챗GPT 사용자에 순차적으로 제공된다. GPT 이미지 1.5는 오픈AI가 구글의 제미나이 시리즈와 이미지 생성 모델 경쟁을 본격화하는 과정과 맞물려 공개됐다. 구글이 최신 플래그십 모델과 이미지 생성기 '나노 바나나 프로'로 시장 점유율을 확대하는 가운데, 오픈AI가 이미지 모델 출시 시점을 앞당긴 것으로 풀이된다. 오픈AI의 이전 이미지 모델 출시는 지난 4월이었다. 이번 업데이트의 핵심은 반복 편집과 일관성이다. 기존 생성형 이미지 도구들이 특정 요소만 수정해 달라는 요청에도 이미지 전체를 다시 해석하는 한계가 있었던 반면, GPT 이미지 1.5는 얼굴 생김새, 조명, 구도, 색감 등 핵심 시각 요소를 유지한 채 요청한 부분만 정밀하게 수정할 수 있다. 이를 통해 실용적인 사진 보정은 물론 의상·헤어스타일 시뮬레이션, 원본 이미지를 유지한 스타일 변환 작업이 가능해졌다. 텍스트 렌더링 성능도 개선됐다. 작은 글자나 복잡한 텍스트 배치에서도 가독성이 높아졌으며 다수의 인물이 등장하는 이미지에서 얼굴 표현의 자연스러움도 향상됐다. 오픈AI는 이러한 개선을 통해 단순 이미지 생성뿐 아니라 마케팅·디자인·이커머스·커뮤니케이션 등 비즈니스 워크플로우 전반에서 활용도를 높일 수 있다고 설명했다. 사용자 경험 측면에서도 변화가 있다. 챗GPT 내부에 이미지 전용 공간이 새롭게 마련돼 모바일 앱과 웹 사이드바에서 접근할 수 있다. 사전 설정된 필터와 트렌드 기반 프롬프트를 활용해 보다 직관적인 이미지 탐색과 반복 시도가 가능해졌다. 오픈AI는 이 공간을 '크리에이티브 스튜디오'에 가깝게 설계했다고 밝혔다 . 다만 오픈AI는 이번 업데이트가 의미 있는 진전이지만 완성 단계는 아니라고 평가했다. 다양한 테스트 사례에서 성능 개선이 확인됐으나, 여전히 반복적인 개선이 필요한 영역이 남아 있으며 향후 업데이트를 통해 품질을 지속적으로 끌어올릴 계획이다. 피지 시모 오픈AI 애플리케이션 부문 CEO는 "챗GPT 사용자의 생각과 그것을 현실로 구현하는 능력 사이의 거리를 계속 좁혀 나가겠다"고 강조했다.

2025.12.17 15:04한정호 기자

바이트플러스 "AI, 이제 '사람' 아닌 'AI'가 통제"

바이트플러스가 이제는 사람이 인공지능(AI)을 컨트롤하는 시대가 아닌 'AI가 AI를 컨트롤 하는 시대'가 될 것이란 전망을 내놨다. 이미나 바이트플러스 솔루션즈 아키텍트는 11일 서울 중구 신라호텔에서 열린 'ACC 2025'에서 "이것이 바이트플러스가 제안하는 자동화의 미래"라며 "자사 생성형 AI 솔루션은 단순히 콘텐츠를 만드는 것이 아니라 스스로 검증하고 분석하고 지휘한다"고 강조했다.'ACC 2025'는 지디넷코리아가 주관, 주최하고 과학기술정보통신부, 바이트플러스, 네이버 등이 후원하는 행사다. 먼저 이 솔루션즈 아키텍트는 생성형 AI를 활용한 콘텐츠 제작이 여전히 어려운 이유로 프롬프트 작성의 어려움, 수동 반복 생성, 파편화된 워크 플로우, 일관성의 부재, 부족한 제어 가능성, 수동 후반 작업을 꼽았다. 그는 이같은 문제를 해결하기 위한 방법으로 자사 크리에이티브 에이전트를 제시했다. 바이트플러스의 크리에이티브 에이전트는 AI 에이전트가 초거대 언어모델(LLM) 뿐만 아니라 이미지 생성 모델, 영상 생성 모델, 디지털 휴먼, 3D 모델에 이르기까지 수많은 생성형 AI 솔루션을 통합 지휘하는 것이 특징이다. 이 솔루션즈 아키텍트는 "크리에이티브 에이전트는 생성형 AI 솔루션 뿐만 아니라 기타 솔루션까지 모두 통합 지휘해 고품질 콘텐츠를 순식간에 만들어 주는 멀티모달 자동화 파이프라인"이라고 설명했다. 크리에이티브 에이전트를 구현하는 데는 바이트플러스의 이미지 생성 모델 '씨드림(seedream)' 4.5, 영상 생성 모델 '씨댄스(seedance)' 1.0, 디지털 휴먼 모델 '옴니휴먼(omnihuman) 1.0'이 필요하다. 그는 바이트플러스의 크리에이티브 에이전트의 장점으로 낮은 비용과 빠른 제작속도, 일관성 등을 들었다. 이 솔루션즈 아키텍트는 "비용은 극적으로 낮아지고 또 제작 속도는 혁신적으로 올라간다"며 "이 모든 콘텐츠는 압도적인 일관성을 가지게 되고 누구나 고품질 콘텐츠를 만들 수 있어 (콘텐츠) 제작 장벽 자체가 사라진다"고 말했다. 또 이 솔루션즈 아키텍트는 "더 이상 사람이 AI 컨트롤 하는 시대가 아니다"며 "AI가 AI를 컨트롤함으로써 복잡한 작업 과정을 완벽하게 자동화시킨다"고 마무리했다.

2025.12.11 14:48박서린 기자

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

글로벌 CSP, 투자규모 또 상향…AI 메모리 호황에 힘 싣는다

크림·소다 동반 성장…네이버, 글로벌 C2C ‘아시아 축’ 강화

비행기 결항하니 AI가 먼저 연락…여행업에 부는 '고관여 AI' 바람

[유미's 픽] "신세계도 못 버텼다"…양윤지 대표, EV 충전 접고 AI 올인

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.