검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'이미지 AI'통합검색 결과 입니다. (54건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

[기고] 인간이 직접 만든 콘텐츠입니다

챗GPT 등장 이후 인공지능(AI)과 신기술, 혁신적인 서비스의 개발을 해하지 않으면서도 이용자의 권리와 개인정보를 보호하려면 어떤 것을 고려해야 할 지에 대한 논의가 최근 활발해진 분위기다. 급변하는 정보사회에서 AI와 개인정보 보호에 있어 우리 사회가 취해야 할 균형 잡힌 자세가 어떤 것인지에 대해 법무법인 태평양 AI팀에서 [AI 컨택]을 통해 2주 마다 다뤄보고자 한다. [편집자주] A씨는 건강을 위해 달리기로 결심했다. 혼자 뛰다 보니 여러 명이 함께 달리는 러닝 크루들이 보였고, A씨도 러닝 크루를 만들어 뛰는 것이 더 재미있을 것 같았다. A씨는 달리기 모임을 만들고 신규 회원 모집에 나섰다. 회원을 모집하려니 모임을 상징하는 이미지가 있으면 좋겠다는 생각이 들었다. 아쉽게도 A씨는 상상력은 풍부한 편이지만 그림 그리기에 영 소질이 없다. 하지만 걱정할 필요가 없다. A씨는 머리에 떠오른 이미지를 AI에게 설명하고 이미지를 만들어 보라고 시킨다. AI가 만든 이미지를 보며 A씨가 몇가지 수정 아이디어를 주니 꽤 쓸만한 이미지가 나온다. AI가 발전하면서 흔히 볼 수 있게 된 모습이다. 이미지뿐 아니라 AI를 이용해 프롬프팅으로 영상이나 음악, 애플리케이션을 만들기도 한다. 개인 취미 활동에만 이용되는 것이 아니다. 한국콘텐츠진흥원에 따르면 국내 콘텐츠 산업 종사자들이 생성형 AI를 이용하는 비율이 2025년 상반기에 20%에 달했다. 지난 2024년 하반기보다 약 7% 늘어난 것이라고 하니 1년이 지난 지금은 그 비율이 훨씬 높아졌을 것이다. AI는 콘텐츠 제작에 많은 도움을 주고 있지만 악용되는 사례도 많다. AI를 이용해 마치 진짜인 것처럼 만들어 내는 딥페이크에 대해 일반인들이 조작된 것인지 확인하기는 쉽지 않다. 특정 세력 여론몰이나 트래픽을 늘려 수익을 얻기 위해서 등 다양한 목적으로 딥페이크가 쏟아지고 있다. 최근 중동에서 일어난 이란 전쟁을 예로 들어 보자. 이란 전쟁은 다양한 방향에서 AI가 본격적으로 이용된 전쟁으로 볼 수 있는데, AI로 가짜 사진이나 동영상을 정교하게 생성하여 여론에 혼란을 주기도 했다. 예를 들어 아랍에미리트 두바이에 있는 세계 최고층 건물 부르즈 할리파가 드론 공습을 받는 사진과 동영상이 사회관계망서비스(SNS) 등에 널리 퍼졌지만 AI로 생성되거나 변경된 가짜 이미지로 확인이 됐다. 딥페이크가 광고에 도입되면 더 혼란을 줄 수 있다. 어느 분야의 권위있는 인물 이미지를 활용해 어떤 제품을 권하는 것처럼 합성한다거나, 의약품의 경우 사용 전후 변화 이미지를 AI를 이용해 효과를 과장할 수도 있다. 이런 문제로 인해 AI가 생성한 결과물이라는 사실을 알리도록 하는 방안이 추진되고 있다. 옛 트위터인 엑스(X)는 무력 충돌을 다룬 영상과 이미지를 AI로 생성할 때 AI 생성 결과물임을 밝히지 않고 게시하는 이용자에게 광고 수익 공유를 중단하겠다고 발표했다. AI를 이용해 생성한 실제와 구분하기 어려운 이미지, 영상 등 딥페이크에 대해 'AI를 이용해 생성됐다'는 사실을 이용자가 명확하게 알 수 있도록 표시할 의무를 법제화하려는 움직임도 나타난다. 유럽연합(EU)은 'AI 액트(Act)'에서 AI 시스템 배포자(deployer)에게 딥페이크 콘텐츠가 인위적으로 생성 또는 조작됐다는 것을 공개하도록 정하고 있다. 이에 EU는 실시간 영상, 비(非)실시간 영상, 이미지, 오디오 등 콘텐츠 종류별로 딥페이크임을 표시하는 방법에 대한 가이드라인을 발표했다. 우리나라도 텍스트, 이미지, 동영상, 음성 등 콘텐츠 종류 별로 표시 방법에 대한 가이드라인이 나와 있다. 최근 국회 본회의를 통과한 의료기기법 개정안은 딥페이크를 활용하여 관련 분야 전문가가 의료기기를 보증, 추천 등 하는 것으로 오인하게 할 우려가 있는 광고를 금지했다. 공정거래위원회도 AI로 만든 가상인물을 활용한 광고에 '가상 인물이 포함된 게시물'이라는 사실을 알리도록 한 심사지침 개정안을 행정예고했다. 국회엔 딥페이크를 직접 제작하거나 편집하여 제공하려는 자에게 해당 정보가 AI 생성물임을 나타내는 표시를 하도록 의무화하는 정보통신망법 일부 개정안도 발의돼 있다. 이용자에게 AI를 이용해 만든 결과물이라는 사실을 명확히 알리는 방향으로 제도가 정비되고 있다. 갈수록 우리가 보는 콘텐츠에 'AI를 이용해 만든 결과물'이라는 표시가 많이 보일 것이다. 그렇다면 AI를 이용하지 않고 오직 인간 힘으로 모든 과정을 해 낸 콘텐츠는 수제품과 같은 지위를 갖게 되는 것일까.

2026.05.21 17:31유재규 컬럼니스트

글자만 번역하던 시대 끝…브랜드 감성까지 살리는 AI 뜬다

해외 판매용 상품 상세 페이지를 여러 언어로 바꾸는 작업은 이커머스 업계의 대표적인 수작업 영역으로 꼽힌다. 최근 단순 번역을 넘어 원본 이미지의 글자 색상이나 강조 효과까지 유지하려는 수요가 커지면서, 디자인 보존형 이미지 번역 기술 경쟁도 본격화하는 분위기다. 16일 플리토에 따르면 지난달 '이미지 번역 프로(Image Translation Pro)'를 출시한 이후 중국을 비롯한 해외 크로스보더 이커머스 기업들의 도입 문의가 이어지고 있다. 플리토는 올리브영, 졸스 등 글로벌 뷰티·패션 라이프스타일 플랫폼과 협업하며 국내외 대량 이미지 번역 시장을 공략 중이다. 이미지 번역 프로는 응용 프로그램 인터페이스(API) 기반으로 제공되는 이미지 번역 솔루션으로, 이미지 속 텍스트를 번역하면서도 원본 디자인 요소를 최대한 유지하는 데 초점을 맞췄다. 문장 내 특정 단어에만 적용된 색상이나 강조 효과를 인식해 번역 이후에도 동일한 형태로 복원하는 '텍스트 속성 인식' 기술이 적용됐다. 예를 들어 상품 배너에서 특정 키워드만 빨간색이나 굵은 테두리로 강조된 경우 번역 결과물에서도 같은 위치와 디자인 속성을 유지하는 식이다. 기존 이미지 번역 서비스가 텍스트 변환 자체에 초점을 맞췄다면 플리토는 브랜드 톤앤매너 유지까지 고려했다. 제품 패키지 내부 텍스트를 자동으로 구분하는 '스마트 필터링' 기능도 탑재했다. 인공지능(AI)이 상품 용기에 인쇄된 브랜드 로고나 성분 정보 등은 번역 대상에서 제외하고, 마케팅 문구만 선별적으로 번역해 실제 제품 이미지와의 이질감을 줄이는 방식이다. 플리토는 이런 기능이 글로벌 이커머스 운영 과정에서 반복적으로 발생하는 상세페이지 수정 작업을 줄이는 데 도움이 될 것으로 보고 있다. 회사 측에 따르면 A4 기준 이미지 한 장은 약 5~10초 내 처리 가능하며 수동 편집 대비 작업 시간을 90% 이상 단축할 수 있다. 실제 시장에선 크로스보더 이커머스 확대와 함께 상품 상세페이지 현지화 수요도 꾸준히 증가하는 모습이다. 국가별 언어에 맞춰 대량 이미지를 반복 수정해야 하는 만큼, 디자인 요소를 유지하면서도 작업 효율을 높일 수 있는 자동화 기술 도입이 늘어나는 추세다. 업계 관계자는 "최근 생성형 AI 기반 이미지 제작 기술이 주목받지만 이커머스 현장에선 비용과 처리 속도 부담이 여전히 존재한다"며 "대량 상품 이미지를 빠르게 현지화하면서도 브랜드 디자인을 유지할 수 있는 실무형 AI 수요가 커지고 있다"고 말했다.

2026.05.16 15:22이나연 기자

레드햇, 하드닝 이미지·허밍버드·데스크톱 출시…"AI 개발 속도·보안↑"

[애틀랜타(미국)=김미정 기자] 레드햇이 인공지능(AI) 에이전트 개발 확산에 맞춰 소프트웨어(SW) 공급망 보안과 개발자 작업 속도를 동시에 높이는 통합 전략을 내놨다. 보안이 강화된 컨테이너 이미지부터 최신 운영체제(OS), 샌드박스 기반 개발 환경까지 아우르는 엔터프라이즈 개발 체계를 재정비하겠다는 구상이다. 레드햇은 14일까지 미국 조지아주 애틀랜타에서 열리는 '레드햇 서밋 2026'에서 '레드햇 하드닝 이미지(Red Hat Hardened Images)'와 '페도라 허밍버드 리눅스(Fedora Hummingbird Linux)' '레드햇 데스크톱(Red Hat Desktop)'을 공식 출시했다고 밝혔다. 이를 통해 개발 초기 단계부터 배포 환경까지 신뢰성을 높겠다는 전략이다. 레드햇 하드닝 이미지는 최신 프로그래밍 언어와 런타임, 데이터베이스, 웹 서버 등을 위한 초소형·테스트 완료 컨테이너 이미지다. 현대 클라우드 네이티브 애플리케이션 기반 이미지를 보안 중심으로 재구성한 형태다. 레드햇 엔터프라이즈 리눅스(RHEL)와 오픈시프트 구독 고객에게 추가 비용 없이 제공된다. 이 이미지는 고도로 자동화된 '에이전틱 소프트웨어(SW) 팩토리'를 통해 지속적으로 빌드된다. 레드햇은 자동화 속도를 끌어올리면서도 사람 개입이 포함된 검토 절차를 유지해 거버넌스와 감독 기능까지 확보했다고 설명했다. 기업은 빠르게 업데이트되는 개발 환경에서도 공급망 보안 기준을 일정 수준으로 유지할 수 있는 셈이다. 페도라 허밍버드 리눅스는 롤링 릴리스 방식으로 업스트림 리눅스 커뮤니티가 제공하는 수정 사항과 업데이트를 신속히 반영한다. 레드햇은 허밍버드가 알려진 공통 취약점·노출(CVE) 없는 언어와 런타임, 데이터베이스, 개발 도구를 함께 제공해 AI 에이전트 실험 환경으로 활용될 수 있다고 강조했다. 이날 개발자 작업 환경을 겨냥한 레드햇 데스크톱도 정식 출시됐다. 이는 컨테이너 개발 도구인 포드맨 데스크톱의 레드햇 지원 버전 형태다. 레드햇 하드닝 이미지와 '레드햇 트러스티드 라이브러리'에 직접 연결된다. 개발자는 기업 SW 공급망 기준을 충족하는 이미지와 라이브러리를 개발 단계에서부터 손쉽게 찾을 수 있다. 레드햇 데스크톱에는 로컬 샌드박스 기능도 추가됐다. 이 기능은 에이전트를 개발자 PC와 기업 인프라로부터 분리하는 기능이다. 에이전트가 작업 범위를 잘못 해석하거나 예기치 않은 동작을 수행했을 때 발생할 수 있는 위험을 줄일 수 있다. 레드햇은 엔비디아와의 협업, 오픈소스 프로젝트 '오픈셸(Openshell)' 통합을 통해 개발자 노트북부터 실제 운영 환경까지 샌드박싱 체계를 확장할 방침이다. 아셰시 바다니 레드햇 수석부사장 겸 최고제품책임자(CPO)는 "기업이 더 빠르게 AI 기반 애플리케이션을 실험하고 배포하되, 그 과정에서 이미지 신뢰성·라이브러리 검증·실행 격리 같은 핵심 보안 요소를 놓치지 않도록 개발 체계를 재설계했다"고 강조했다.

2026.05.14 03:05김미정 기자

제논, AI 올인원 포털 '제나' 공개…챗봇·금융 분석 한곳에

제논이 다양한 인공지능(AI) 서비스를 하나로 통합한 AI 에이전트 포털을 공개하며 B2C 시장 공략에 나선다. 흩어진 AI 기능을 단일 인터페이스로 연결해 일반 사용자 중심 AI 플랫폼으로 확장한다는 전략이다. 제논은 AI 에이전트 포털 '제나(GenA)'의 베타 서비스를 오픈한다고 6일 밝혔다. 제나는 챗봇과 슬라이드 제작, 번역, 이미지 생성 등 개별적으로 분산된 AI 서비스를 단일 포털 안에서 통합 제공하는 것이 특징이다. 사용자는 여러 서비스를 오가며 작업할 필요 없이 하나의 인터페이스 안에서 연속적인 AI 작업 환경을 이용할 수 있다. 이번 베타 서비스는 제논이 기존 B2B 중심 사업에서 개인 사용자 대상 B2C 시장으로 사업 영역을 확대하는 첫 단계라고 평가된다. 회사는 일반 사용자 접근성을 고려해 직관적인 UI·UX를 적용하고 실생활 활용도가 높은 기능 중심으로 서비스를 구성했다고 설명했다. 기술 완성도도 강화했다. 제나는 텍스트뿐 아니라 이미지와 PDF, 문서 파일 등 고용량 데이터를 인식하는 멀티모달 AI 기능을 지원한다. 여기에 이전 대화 맥락을 기억하고 세션 제목을 자동 생성하는 맥락 인식 기술도 적용했다. 또 결과물 정확도를 높이기 위해 질문·검증·수정 단계를 거치는 '휴먼 인 더 루프' 구조를 도입했다. AI 결과물을 반복 검증해 보다 신뢰도 높은 응답을 제공한다는 설명이다. 현재 제나에서 제공되는 AI 에이전트는 총 5종이다. ▲통합 리서치 기반 심층 답변을 제공하는 'AI 범용 채팅' ▲자연어 입력만으로 프레젠테이션 자료를 생성하는 'AI 슬라이드 생성' ▲디자인 작업을 지원하는 'AI 이미지 생성' ▲문맥 기반 번역 기능 'AI 번역' ▲실시간 시장 데이터와 ETF 정보를 분석하는 '금융 특화 에이전트' 등이다. 특히 금융 특화 에이전트는 제나에서만 제공되는 서비스로 차별화를 꾀했다. 제논은 베타 서비스 기간 동안 용량 제한 없이 누구나 무료로 이용할 수 있도록 운영할 계획이다. 회사는 6일 개막한 AI 엑스포 코리아 2026 현장에서 제나를 처음 공개했다. 행사에선 시니어 요양 케어 특화 피지컬 AI와 생성형 AI 플랫폼 '제노스 2.0'도 함께 선보였다. 제논은 이번 베타 운영 기간 동안 사용자 피드백을 반영해 서비스 완성도를 높이고 향후 정식 출시로 이어갈 방침이다. 고석태 제논 대표는 "제나는 기업뿐 아니라 개인 사용자까지 고도화된 AI 기술을 일상적으로 활용할 수 있도록 설계된 통합 포털"이라며 "앞으로 피지컬 AI와 제나를 중심으로 일반 사용자 접점을 확장하고 폭넓은 AI 경험을 제공해 나가겠다"고 밝혔다.

2026.05.06 16:45한정호 기자

"AI 프사, 이 정도였어?"…챗GPT 이미지 2.0, 출시 첫 주부터 난리

오픈AI의 새 이미지 생성 모델 '챗GPT 이미지 2.0'이 출시 첫 주부터 빠르게 이용자를 끌어모으고 있다. 지난해 '지브리풍' 이미지 열풍으로 AI 이미지 생성의 대중성을 확인한 오픈AI가 이번에는 사진 한 장을 화보·애니메이션·캐릭터 이미지로 바꾸는 '사진 변환' 수요를 앞세워 다시 흥행몰이에 나선 모습이다. 1일 오픈AI에 따르면 지난달 26일 기준 챗GPT 이미지 2.0의 일일활성이용자수(DAU)는 전주 대비 60% 이상 증가했다. 같은 기간 신규 이용자 유입은 130% 이상 늘었다. 챗GPT 이미지 2.0은 사용자의 지시를 이미지에 정밀하게 반영하고 이미지 안의 텍스트를 자연스럽게 구현하는 기능을 강화한 것이 특징이다. 특히 한글·일본어·중국어 등 비라틴 문자권 언어의 텍스트 렌더링 정확도가 개선되면서 기존 이미지 생성 AI에서 반복적으로 지적됐던 '글자 깨짐' 문제도 줄었다. 초기 흥행의 중심에는 '사진 변환' 수요가 있다. 오픈AI가 최근 24시간 동안 한국 이용자들의 이미지 활용 사례를 분석한 결과 기존 사진을 기반으로 스타일이나 콘셉트를 바꾸는 요청이 주를 이뤘다. 가장 많이 사용된 프롬프트는 "이 사진을 고급 패션 스튜디오 화보처럼 바꿔줘. 피부 톤이 잘 살아나게 배경도 어울리게 바꿔줘"였다. 이어 "이 사진을 요즘 유행하는 애니메이션 스타일로 바꿔줘", "사진 속 인물을 귀여운 미니미 캐릭터처럼 만들어줘", "이 사진을 활용해서 짧은 코믹 스트립을 만들어줘" 등도 자주 사용됐다. 이는 AI 이미지 활용 방식이 '그림을 만들어주는 도구'에서 '사진을 다시 해석하는 도구'로 넓어지고 있음을 보여준다. 지난해 지브리풍 이미지가 특정 화풍을 따라 하는 놀이로 확산됐다면, 챗GPT 이미지 2.0은 이용자가 가진 사진을 기반으로 화보, 팬아트, 프로필 이미지, 짧은 만화 등으로 재가공하는 데 초점이 맞춰지고 있다. 특히 팬덤 문화와 소셜미디어 소비가 강한 한국 시장에서는 연예인 사진이나 인물 사진을 애니메이션풍으로 바꾸는 활용이 빠르게 확산될 가능성이 크다. 별도 편집 툴을 다루지 않아도 사진 한 장과 간단한 문장만으로 결과물을 만들 수 있다는 점이 진입 장벽을 낮추고 있다. AI 이미지 생성 시장 경쟁도 더 치열해지고 있다. 구글은 '나노바나나' 계열 이미지 생성·편집 모델을 앞세워 제미나이 생태계 안에서 빠른 생성 속도와 편집 성능을 강조하고 있다. 어도비는 포토샵·프리미어·라이트룸 등 크리에이티브 클라우드 앱에 AI 기능을 결합하며 창작자 워크플로 공략에 속도를 내고 있다. 오픈AI는 챗GPT의 대중적 이용자 기반을 바탕으로 이미지 기능을 일상 사용처로 넓히는 데 초점을 맞추고 있다. 구글이 제미나이 생태계 확장과 모델 성능을, 어도비가 전문 창작자용 편집 워크플로를 앞세운다면 오픈AI는 일반 이용자의 반복 사용을 끌어내는 쪽에 무게를 두는 모습이다. 가브리엘 고 오픈AI 챗GPT 이미지 2.0 리드 리서처는 "한국을 포함한 아시아 이용자들이 매우 창의적이고 실용적인 방식으로 빠르게 활용하고 있는 점이 인상적"이라며 "가장 흥미로운 아이디어는 종종 우리가 아니라 사용자들로부터 나온다"고 말했다.

2026.05.01 15:07장유미 기자

"결과만 있고 이유는 없다"...구글 DESIGN.md가 놓친 'AI 디자인' 핵심

구글이 AI 디자인 규격 'DESIGN.md'를 공개하며 표준화 경쟁에 불을 지폈다. 하지만 IBM 리서치 김은수 엔지니어는 "결과(What)는 있지만 이유(Why)는 빠져 있다"고 평가했다. AI의 추론 과정을 인간이 제어하고 검증할 수 있는 '사고의 투명성'이 차세대 디자인 도구의 진정한 승부처가 될 것이라는 설명이다. 구글은 지난 21일 AI 디자인 도구 '스티치(Stitch)'의 핵심 파일 규격인 DESIGN.md를 오픈소스로 공개했다. DESIGN.md는 구글 랩스가 개발한 AI 디자인 도구 '스티치'에서 사용하는 마크다운(markdown) 형식의 파일이다. 제품의 색상, 서체, 컴포넌트 등 디자인 시스템 규칙을 AI 에이전트가 읽을 수 있는 형태로 기록한다. 이에 대해 IBM Research 소속 김은수 UX 엔지니어는 "구글의 이번 발표는 AI를 활용한 디자인 작업에서 각 개인이 각자의 방식으로 풀어오던 숙제를 표준화(standardize)할 수도 있는 중요한 움직임"이라면서도 "그러나 진짜 문제는 아직 풀리지 않았다"는 시각이다. "결과(what)는 기록되지만 이유(because)는 빠져 있다" 김 엔지니어는 지디넷코리아와의 서면 인터뷰에서 "현장에서 디자이너들을 관찰해보면, AI가 만든 결과물이 마음에 들지 않을 때 근본적인 문제는 '결과물의 품질'이 아니라 '바꾸고 싶지 않은 부분까지 함께 바뀌어버리는 것'이었다"고 언급했다. 그는 "예를 들어 AI에게 '사용자 타깃을 초보자로 바꿔달라'고 요청했을 때, 화면 구성만 단순하게 바뀌기를 원했는데 버튼 색상, 레이아웃, 톤앤매너까지 연쇄적으로 달라지는 경우가 많다"며 "AI가 내린 결정들 중 어디까지가 서로 연결돼 있는지가 드러나 있지 않기 때문에, 작은 수정 하나가 예상치 못한 곳에서 문제를 일으킨다"고 지적했다. 이어 "기존 AI 도구들도 중간 과정을 들여다볼 수는 있지만, 그것이 디자인 프로세스 안에 통합돼 있지 않아 '어디까지 바꾸고 어디부터는 지켜야 하는지'를 명시할 방법이 없다"면서 "결국 디자이너는 컨트롤을 포기하고 처음부터 다시 시작하거나, 반대로 AI를 아예 쓰지 않는 쪽을 택하게 된다"고 덧붙였다. DESIGN.md 역시 같은 한계를 공유한다는 것이 김 엔지니어의 분석이다. 그는 "DESIGN.md는 '주요 버튼은 테라코타 색'이라고 기록하지만, 왜 테라코타를 골랐는지, 어떤 조건에서 다시 검토해야 하는지는 담지 않는다"며 "결과는 있지만 이유가 빠져 있는 구조"라고 말했다. "대화는 기록되지만 참조되지 않는다…디자인 결정의 '상시 산출물' 필요" 김 엔지니어는 최근 AI 업계의 움직임 중 앤트로픽의 클로드 디자인 기능을 주목할 만한 진전으로 꼽았다. 디자이너에게 능동적으로 질문을 던지며 중간 결정을 함께 만들어가는 방식이라는 설명이다. 다만 김 디자이너는 "이 대화의 기록이 디자인 프로세스 안에서 언제든 되돌아가 참조하거나 수정할 수 있는 구조화된 산출물로 자리 잡고 있지는 않다"고 첨언했다. 이어 그는 "이러한 중간 결정들이 '상시 참조 가능한 산출물(standing artifact)'로 디자인 프로세스에 자리 잡아야 언제든 되돌아가 읽고 고칠 수 있게 된다"고 설명했다. IBM Research에서 진행해온 멀티 에이전트 기반 디자인 시스템 연구는 이 방향의 한 가지 실마리를 보여준다. 김 엔지니어에 따르면, 여러 AI 에이전트가 사용자 조사, 전략 수립, 시각 디자인, 품질 검토 등을 나눠 맡고 서로 작업을 넘기는 '핸드오프(handoff)' 구간마다, 중간 산출물이 자연스럽게 '인간 개입 지점(human-in-the-loop)'을 만들어낸다. 그는 이를 바탕으로 '읽을 수 있고(legible), 제어 가능하며(controllable), 검증 가능한(verifiable) 추론 체인'이라는 개념을 제시했다. 먼저 ▲인간이 AI의 중간 결정을 읽고 이해할 수 있어야 하고(읽기 가능성) ▲그 결정을 바꾸면 전체 결과물이 재계산돼야 하며(제어 가능성) ▲각 결정이 어떤 근거로 내려졌는지 추적하고 확인할 수 있어야 한다(검증 가능성)는 주장이다. 기존의 human-in-the-loop이 최종 결과물에 대한 검수 단계에 머물렀다면, 이제는 추론 단계 자체를 인간과 AI가 함께 읽고, 제어하고, 검증하는 방향으로 나아가야 한다는 것이다. 김 엔지니어는 이 같은 방향성이 필요한 근본적 이유에 대해 "디자인은 여전히 인간의 의사결정이 필요한 영역이고, 그 판단이 프로세스 곳곳에 영향을 미쳐야 품질 높은 결과물이 나온다"며 "AI를 도입한다고 해서 디자이너의 역할이 줄어드는 것이 아니라, 오히려 어디에서 어떤 판단을 내려야 하는지가 더 명확하게 드러나야 한다"고 강조했다. 그는 구체적 형태에 대한 전망도 내놨다. 김 엔지니어는 "DESIGN.md가 디자인 시스템을 위한 README 파일이라면, 다음에 필요한 것은 '디자인 결정'을 위한 README"라며 "personas.md, journey-map.md 같은 파일들이 인간과 AI의 협업이 수면 위로 드러나는 방식이 될 수도 있다"고 말했다. 이어 "AI 디자인 도구 경쟁의 다음 무대는 더 좋은 픽셀을 만드는 모델이 아니라, 자신의 사고 과정을 읽을 가치가 있게 만드는 도구가 될 것"이라고 내다봤다. ■김은수(Sue Kim) 엔지니어 -現 IBM Research UX 엔지니어 -AI 기반 디자인 도구 및 멀티 에이전트 UX 시스템 연구 -MIT Senseable City Lab 연구 경력 -하버드 디자인 대학원(Harvard GSD) 석사

2026.04.26 09:31백봉삼 기자

클립아트코리아, 'AI 스튜디오' 출시…"AI 이미지 생성부터 편집까지"

스톡 이미지 기업 클립아트코리아가 인공지능(AI) 기반 이미지 생성 및 편집 기능을 결합한 'AI 스튜디오'를 공식 출시했다고 밝혔다. 최근 콘텐츠 제작 과정에서 AI 이미지 생성 수요가 빠르게 증가하고 있지만, 원하는 결과를 얻기 위해 복잡한 프롬프트 작성과 반복적인 수정 작업이 필요하다는 점이 한계로 지적돼 왔다. 클립아트코리아의 'AI 스튜디오'는 이러한 불편을 개선하는 데 초점을 맞췄다. 사용자는 프롬프트 입력을 통해 이미지를 생성하는 동시에, 기존 이미지 편집과 보정 작업까지 하나의 흐름 안에서 처리할 수 있다. 특히 클립아트코리아가 보유한 콘텐츠 라이브러리를 직접 활용할 수 있다는 점이 특징으로 꼽힌다. 일반적인 AI 이미지 생성 서비스가 텍스트 기반으로 결과물을 만드는 것과 달리, 'AI 스튜디오'는 검증된 고품질 이미지를 기반으로 작업이 가능해 보다 안정적이고 완성도 높은 결과물을 빠르게 구현할 수 있다. 이를 통해 사용자는 원하는 구도와 스타일을 보다 정밀하게 반영할 수 있으며, 초기 생성 단계부터 결과물의 품질을 끌어올릴 수 있다. 또한 생성된 이미지에는 이미지 확장, 배경 제거, 화질 개선 등 다양한 편집 기능을 적용할 수 있어 실무 활용도를 높였다. 또한 생성된 이미지에 다양한 편집 기능을 적용할 수 있다. 이미지 확장, 배경 제거, 화질 개선 등의 기능을 통해 결과물을 실무에 바로 활용할 수 있는 수준으로 보완할 수 있다. 해당 서비스는 배너 제작, SNS 콘텐츠, 광고 이미지 제작 등에서 반복적인 작업 시간을 줄이는 데 기여할 것으로 기대되며, 마케팅 담당자와 1인 사업자, 중소기업 등 디자인 리소스가 부족한 사용자에게 특히 유용할 것으로 보인다. 클립아트코리아 관계자는 “AI 스튜디오는 단순 이미지 생성 도구를 넘어 프리미엄 콘텐츠를 기반으로 더 빠르고 안정적인 제작 환경을 제공하는 데 초점을 맞췄다”며 “앞으로도 고품질 콘텐츠와 AI 기술을 결합한 서비스를 지속적으로 확대해 나갈 계획”이라고 밝혔다. 자세한 내용은 클립아트코리아 공식 웹사이트에서 확인할 수 있다.

2026.04.22 09:51이정현 미디어연구소

[AI는 지금] '지브리 풍'이 불붙인 이미지 전쟁…놀이 넘어 비즈니스 격전지로

'덕테이프(Duct Tape)'라는 코드명으로 불린 오픈AI의 새 이미지 생성 모델이 베일을 벗었다. '지브리 풍' 이미지 유행으로 촉발된 인공지능(AI) 이미지 모델 경쟁이 구글 나노바나나, 어도비 서비스 고도화로 이어진 가운데, 오픈AI가 이미지 모델 최초의 '사고(Thinking)' 기능을 탑재한 신모델로 재반격에 나선 모습이다. 오픈AI는 21일(현지시간) AI 이미지 생성 모델의 새 버전 '챗GPT 이미지 2.0'을 출시했다. '이미지젠 2.0' 모델을 기반으로 한 이 서비스는 AI 평가 플랫폼 아레나에서 호평받은 덕테이프의 정식 출시판이다. 핵심 기능은 오픈AI 이미지 모델로선 처음 도입된 사고 기능이다. 이미지 2.0에서 사고 기능을 활성화하면 웹 검색을 통해 최신 정보를 반영하거나 하나의 프롬프트에서 최대 8개의 서로 다른 이미지를 한 번에 생성하고 자체 출력물을 검토하는 것이 가능해진다. 여러 장의 이미지에 걸쳐 인물이나 캐릭터 일관성도 유지할 수 있다. 오픈AI는 연속 만화 페이지, 다양한 종횡비의 소셜 그래픽 세트, 브랜드 포스터 패밀리 등 이전에 번거로웠던 워크플로우를 대폭 간소화할 수 있다고 설명했다. 지식 기준일은 2025년 12월이다. 이미지 2.0은 세밀한 지시 수행, 물체 배치 정확도, 밀집 텍스트 렌더링에서 이전 세대 대비 눈에 띄는 향상을 이뤘다. 응용 프로그램 인터페이스(API) 기준 최대 2K 해상도를 지원하며 3:1에서 1:3까지 다양한 종횡비로 이미지를 생성해 배너·포스터·소셜 그래픽 등 실무 포맷에 바로 적용할 수 있다. 다국어 지원도 강화됐다. 기존 이미지 생성 모델은 영어 및 라틴 문자 계열 언어에선 안정적이었지만 비라틴 문자권 경우 정확도가 떨어진다는 지적을 받아왔다. 이미지 2.0은 일본어·한국어·중국어·힌디어·벵골어 등에서 텍스트가 자연스럽게 흐르는 이미지를 생성할 수 있다고 오픈AI 측은 설명했다. 이미지 2.0은 이날부터 모든 챗GPT 및 코딩 에이전트 코덱스 사용자가 이용할 수 있다. 사고 기능을 활용한 고급 출력은 챗GPT 플러스·프로·비즈니스 사용자에게 제공된다. 개발자는 API를 통해 'gpt-이미지-2' 모델로 동일한 기능을 자사 제품에 적용할 수 있다. 가격은 선택한 품질 및 해상도에 따라 달라진다. AI 이미지 생성 시장 경쟁은 단순한 신모델 출시 경쟁을 넘어 플랫폼 전략 싸움으로 번지고 있다. 지난해 지브리 풍 이미지 열풍이 대중적 관심을 일으키면서 이미지 생성 AI가 놀이 영역을 벗어나 본격적인 제품 경쟁 단계로 접어들면서다. 구글은 지난 2월 나노바나나의 후속작인 나노바나나2(제미나이 3.1 플래시 이미지)를 내놓으며 고품질 추론과 빠른 생성 속도를 결합한 이미지 생성·편집 도구로 밀고 있다. 어도비는 지난달 포토샵 AI 어시스턴트와 파이어플라이 이미지 에디터를 강화한 데 이어, 이달 15일엔 포토샵·프리미어·라이트룸 등 크리에이티브 클라우드 앱 전체를 대화형 인터페이스 하나로 제어하는 '파이어플라이 AI 어시스턴트'를 발표했다. 자체 모델만으로 경쟁하는 대신 경쟁사 모델까지 흡수해 크리에이터 워크플로의 허브가 되겠다는 전략이다. 각사가 지향하는 방향성도 주목된다. 오픈AI는 챗GPT 안에서 바로 쓰는 소비자 경험을, 구글은 빠른 생성 속도와 모델 성능을, 어도비는 크리에이터 친화적 워크플로와 상업적 안전성을 각각 앞세우고 있다. 이미지 품질 경쟁을 넘어 텍스트 정확성, 편집 일관성, 속도, 상업적 활용성을 누가 더 잘 잡느냐의 싸움으로 전선이 확장되는 양상이다. 오픈AI는 공식 페이지를 통해 "이미지는 장식이 아닌 하나의 언어"라며 "아이디어를 이해하고 공유하고 가르치고 구축할 수 있는 결과물로 전환하도록 돕겠다"고 말했다. 이어 "기능과 위험이 진화함에 따라 보호 조치를 지속적으로 강화할 것"이라고 덧붙였다.

2026.04.22 09:47이나연 기자

이미지 번역해도 디자인 안 무너진다…플리토, 원본 살리는 번역 선봬

플리토가 텍스트뿐 아니라 디자인 속성까지 그대로 복원하는 이미지 번역 솔루션을 통해 대량 이미지 번역 시장 공략에 나선다. 플리토는 이미지 내 텍스트를 번역하면서 글씨 색상·테두리 등 디자인 속성까지 복원하는 '이미지 번역 프로'를 출시했다고 20일 밝혔다. 이미지 번역 프로 핵심 기술은 두 가지로 구성된다. 우선 텍스트 속성 인식은 특정 단어에만 적용된 포인트 컬러나 테두리 효과를 정확히 인식해 번역 텍스트에도 동일한 디자인 속성을 복원한다. 스마트 필터링은 제품 용기에 인쇄된 브랜드 로고·텍스트를 OCR 단계에서 자동 제외하고 마케팅 문구만 현지 언어로 번역한다. 브랜드 고유 톤앤매너를 유지하면서 구매 유도 정보만 정확히 전달한다. 처리 속도와 효율도 갖췄다. A4 한 장 분량 기준 약 10초 이내 고품질 번역 이미지를 생성하며, 수동 작업 대비 약 90% 이상의 시간 절감 효과를 제공한다. HTML·JPG·PNG 등 다양한 포맷을 지원해 검색엔진최적화(SEO)에도 활용 가능하다. 플리토는 광학문자인식(OCR)·인페인팅·번역 엔진을 결합한 기술로 대량 이미지 번역 시장을 공략하고 있다. 현재 올리브영·졸스 등 글로벌 뷰티·패션 라이프스타일 플랫폼과 협업 중이다. 최근 중국을 비롯한 크로스보더 전자상거래 기업들의 협업 요청도 급증하고 있다. 이정수 플리토 대표는 "이커머스 브랜드 경쟁력은 미세한 디테일에서 결정되기에 단순 언어 번역을 넘어 브랜드 디자인까지 반영하는 것이 중요하다"며 "문장 속 부분 컬러까지 찾아내는 이미지 번역 프로를 통해 글로벌 셀러들이 언어와 디자인의 장벽 없이 전 세계 고객과 만날 수 있도록 돕겠다"고 말했다.

2026.04.20 16:14이나연 기자

정체불명 이미지 AI '덕테이프'…나노바나나 대항마 될까

오픈AI의 차기 이미지 생성 인공지능(AI) 모델로 추정되는 '덕테이프(Duck-Tape)'가 주목받고 있다. 기존 이미지 생성 AI가 넘지 못했던 한글 렌더링 장벽을 사실상 허문 것으로 평가받으면서다. 19일 업계에 따르면 덕테이프는 AI 블라인드 테스트 플랫폼 '아레나 AI'에서 테스트 중인 이미지 생성 모델이다. 아레나 AI는 이용자가 프롬프트를 입력하면 모델명이 가려진 두 결과물을 비교 평가하는 방식으로 운영된다. 이용자가 선호하는 결과물을 선택한 뒤에야 어떤 모델이었는지 공개된다. 덕테이프가 주목받는 이유는 성능이다. 기존 이미지 생성 AI는 한글이 포함된 이미지를 생성할 때 글자가 깨지거나 뭉개지는 오류가 빈번했다. 덕테이프는 복잡한 한글 문장은 물론 간판, 말풍선, 손글씨 노트까지 오류 없이 구현한다는 평가를 받고 있다. 업계에선 광고 시안 품질이 전문 그래픽 디자이너 수준이라는 반응이 나온다. 업계에선 덕테이프가 오픈AI 차기 이미지 모델의 코드네임일 것으로 확실시하는 분위기다. 오픈AI는 과거에도 새로운 모델을 출시하기 전 아레나 AI 등에 익명으로 모델을 올려 성능을 검증해 왔다. 다만 덕테이프는 코드네임인 만큼 공식 출시 시 실제 모델명은 달라질 수 있다. 이미지 생성 기능은 AI 서비스 점유율 경쟁의 핵심 전선이다. 오픈AI는 지난해 상반기 챗GPT를 활용한 일본 지브리풍 이미지 제작이 온라인을 중심으로 유행하면서 유료 가입자를 단기간에 수백만 명 늘렸다. 구글 딥마인드도 지난해 8월 '나노바나나 프로'를 공개하면서 제미나이 신규 이용자 1000만 명을 끌어모았다. 이후 2억 건 이상의 이미지 편집이 이뤄지며 앱스토어 1위에 오르기도 했다. 오픈AI는 연내 기업공개(IPO)를 앞두고 실적 반등이 절실한 상황이다. 오픈AI는 지난달 AI 영상 생성 도구 '소라' 서비스를 전격 종료했다. 소라는 하루 최대 1500만 달러의 추론 비용을 소진하면서도 전체 서비스 기간 수익은 210만 달러에 그쳤다. 최근엔 소라 팀을 이끌었던 빌 피블스, 최고제품책임자(CPO) 출신의 케빈 웨일 부사장 등 핵심 임원들이 잇따라 이탈하며 내부 불안감도 커지고 있다. 개발자 피터 레벨스는 X(옛 트위터)에 덕테이프 모델이 "세계 지식 이해도가 극히 높고 텍스트 렌더링이 뛰어나다"며 나노바나나 프로를 능가할 수 있다고 말했다.

2026.04.19 20:00이나연 기자

색상 코드·캐릭터 눈 모양까지…알리바바, AI 이미지 정밀도 한 단계 올렸다

알리바바 그룹이 브랜드 색상 코드부터 캐릭터 세부 특징까지 정밀 제어할 수 있는 인공지능(AI) 이미지 모델로 크리에이터 시장을 공략한다. 알리바바 그룹은 이미지 생성 및 편집 기능을 고도화한 통합 AI 모델 '완(Wan)2.7 이미지'를 2일 출시했다고 밝혔다. 이 모델은 기존 AI 이미지 생성 모델의 획일적 스타일과 예측하기 어려운 색상 결과물 문제를 개선한 것이 특징이다. 크리에이터들이 시행착오를 줄이면서 전문적인 맞춤형 결과물을 구현할 수 있도록 설계됐다. 핵심 개선 사항은 개인화와 색상 제어다. 골격 구조나 눈 모양 등 세부 특징을 정밀하게 조정해 프로젝트별로 차별화된 캐릭터를 만들 수 있다. 새로운 '컬러 팔레트' 기능을 통해 프롬프트에 특정 색상 코드와 비율을 입력하는 것만으로 복잡한 예술적 스타일이나 브랜드 고유 색상을 정확하게 반영할 수 있다. 텍스트 렌더링 성능도 강화됐다. 긴 맥락 학습 구조를 기반으로 최대 3000토큰의 텍스트 입력을 지원하며 12개 언어로 인쇄 품질의 학술 텍스트와 복잡한 수식·표 생성이 가능하다. 최대 9개의 레퍼런스 이미지를 활용하고 한 번에 최대 12개의 이미지를 생성해 스토리보드, 건축 렌더링, 이커머스 캠페인 제작에도 쓸 수 있다. 직관적인 '클릭 편집' 인터페이스로 특정 영역을 선택해 픽셀 단위로 요소를 추가·이동·정렬하는 것도 가능하다. 익명으로 진행된 사용자 선호도 테스트에 따르면 시각적 완성도, 텍스트 렌더링, 복잡한 시각 개념 이해도 부문에서 업계 주요 모델들을 앞서는 성능을 보였다고 회사 측은 밝혔다. 함께 공개된 '완2.7 이미지 프로'는 안정적인 이미지 구성과 프롬프트에 대한 정밀한 이해, 고해상도 4K 출력을 지원한다. 두 모델 모두 알리바바클라우드의 AI 개발 플랫폼 모델 스튜디오와 완 공식 웹사이트를 통해 이용·배포할 수 있다. 알리바바의 AI 애플리케이션 큐원 앱에도 통합될 예정이다. 알리바바클라우드는 "완 시리즈는 2023년 첫 공개 이후 지속적인 고도화를 거듭했다"며 "AI 기반 멀티미디어 기술 분야에서 우리 기술 경쟁력과 개발 역량을 잘 보여준다"고 강조했다.

2026.04.02 17:10이나연 기자

[AI는 지금] "이미지도 자체 기술로"…脫 오픈AI 노린 MS, 멀티모달 경쟁 본격화

마이크로소프트(MS)가 자체 개발한 이미지 생성 모델 '마이(MAI)-이미지-2'를 최근 공개하며 인공지능(AI) 시장 주도권 확보 경쟁에 본격적으로 나섰다. 오픈AI 등 외부 모델 의존에서 벗어나 기술 내재화를 추진하는 동시에 코파일럿 중심 생태계를 강화하려는 전략적 행보로 풀이된다. 27일 업계에 따르면 MS는 지난 19일 자사 AI 슈퍼인텔리전스 팀이 개발한 텍스트-이미지 변환 모델 '마이-이미지-2'를 공개했다. 해당 모델은 성능 평가 플랫폼 아레나 리더보드에서 상위권에 오르며 구글, 오픈AI와 함께 글로벌 이미지 생성 경쟁 구도에 진입했다. 이번 모델은 무스타파 술레이먼 MS AI 최고경영자(CEO)가 이끄는 초지능 팀에서 개발됐다. MS는 이를 통해 이미지 생성 분야에서도 독자 기술 기반을 강화하겠다는 방침이다.술레이먼 CEO는 "우리는 이 모델 출시로 세계 3대 텍스트 이미지 변환 연구소로 도약하게 됐다"며 "초지능 팀은 앞으로 더 많은 것을 선보일 예정인 만큼 기대해 달라"고 밝혔다.이처럼 MS가 자체 모델을 전면에 내세운 것은 오픈AI에 대한 의존도를 낮추려는 전략으로 분석된다. MS는 그간 오픈AI에 대규모 투자를 단행하며 협력 관계를 유지해왔지만, 핵심 AI 기능을 외부에 의존할 경우 비용 부담과 서비스 통제력에 한계가 있다는 평가를 받아왔다. 이에 MS는 자체 모델 확보를 통해 비용 구조를 개선하고 기능, 정책, 업데이트 방향을 독자적으로 설계할 수 있는 기반 마련에 본격 나선 것으로 보인다. 기술 경쟁 측면에서는 멀티모달 AI 시장을 겨냥한 행보로 읽힌다. 최근 AI 산업은 빅테크를 중심으로 텍스트에서 이미지, 음성, 영상까지 아우르는 멀티모달로 빠르게 확장되고 있다. 단일 모델이 다양한 형태의 데이터를 이해하고 생성하는 능력도 플랫폼 경쟁력의 핵심 요소로 자리잡고 있다. 시장 성장세도 가파르다. 글로벌 시장조사업체 그랜드뷰리서치는 멀티모달 AI 시장이 2024년 약 17억3000만 달러에서 2030년 108억9000만 달러 규모로 확대될 것으로 내다봤다. 또 콘텐츠 제작, 광고, 게임, 커머스 등 산업 전반에서 시각 콘텐츠 자동화 수요가 급증하고 있어 멀티모달 영역이 향후 핵심 성장 축이 될 것으로 관측됐다. 이 같은 분위기에 맞춰 MS는 '마이-이미지-2'를 앞세워 멀티모달 시장 내 주도권을 잡기 위해 속도를 낼 것으로 보인다. '마이-이미지-2'는 자연광과 질감, 공간감을 정교하게 구현하는 사실감은 물론, 이미지 내 긴 문장과 복잡한 타이포그래피를 안정적으로 생성하는 기능을 핵심 경쟁력으로 내세웠다. 이는 기존 이미지 생성 모델의 한계로 지적되던 텍스트 표현 문제를 개선한 것으로, 디자인·콘텐츠 제작 영역까지 활용 범위를 넓힐 수 있다는 점에서 주목된다. 제품 전략 측면에서는 코파일럿 생태계와의 결합이 눈에 띈다. MS는 해당 모델을 '코파일럿'과 '빙' 이미지 생성기에 단계적으로 적용할 계획이다. 워드, 파워포인트 등 생산성 도구와 연계될 경우 문서 작성 과정에서 이미지 생성이 기본 기능으로 자리잡을 가능성이 높다. 이는 텍스트 중심 생산성 도구를 멀티모달 플랫폼으로 확장하려는 시도다. 기업 시장 공략도 병행된다. MS는 현재 일부 기업 고객을 대상으로 API를 제공하고 있으며 향후 마이크로소프트 파운드리를 통해 개발자 접근성을 확대할 예정이다. 또 광고·마케팅 기업 등 대량 이미지 생성 수요를 겨냥해 이미지 AI를 산업용 생산 도구로 확장하기 위해 적극 나설 것으로 보인다. 다만 현재 서비스는 기능과 정책 측면에서 일부 제약이 있다. 생성 속도 지연과 사용 횟수 제한, 이미지 비율 고정, 편집 기능 부재 등이 대표적이다. 콘텐츠 필터링 기준도 비교적 엄격하게 적용되고 있다. 이는 기업용 서비스에서 요구되는 안정성과 리스크 관리를 반영한 설계로 해석된다. 업계 관계자는 "MS가 이미지 생성까지 자체 모델로 내재화하면서 AI 경쟁의 판이 텍스트에서 멀티모달 전반으로 빠르게 확장되고 있다"며 "향후 플랫폼 주도권은 얼마나 다양한 데이터를 하나의 경험으로 통합하느냐에 달려 있을 것"이라고 말했다.

2026.03.27 15:56장유미 기자

멀티모달 AI '망각 현상' 외부저장법으로 해결했다…성능도 2배 개선

국내 연구진이 AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 문제를 원천적으로 해결했다. 지식 편집 성능도 2배이상 개선했다. 한국전자통신연구원(ETRI)은 임수종 언어지능연구실장 연구팀이 POSTECH(포항공대), 성균관대학교와 공동으로 '연속·복합 지식 편집 원천 기술(MemEIC)'을 개발했다고 24일 밝혔다. 이 기술은 지난해 미국 샌디에이고에서 열린 세계적인 인공지능 학술대회 '뉴립스(NeurIPS) 2025'에 채택, 공개됐다. 최근 챗GPT, 제미나이, 클로드 등 이미지와 텍스트를 동시에 이해하는 멀티모달 AI가 빠르게 확산되고 있다. 그러나 이들에는 맹점이 있다. AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 현상이 발생한다. 특히 시각 정보와 언어 정보를 동시에 수정해야 하는 경우 두 종류의 지식이 서로 섞이면서 AI가 제대로 이해하지 못해 복합적인 질문에 틀린 답을 내놓는 경우가 빈번하게 나타났다. 연구팀이 이 같은 문제를 해결할 지식 편집 AI 기술을 공개했다. 이 기술은 새로운 정보를 AI 내부가 아닌 외부 메모리(보조기억장치)에 저장한다. 필요할 때만 정보를 불러와 사용하기 때문에 기존 모델 안정성을 유지하면서도 새로운 정보를 유연하게 추가할 수 있다. 기존 방식에서는 AI 내부의 핵심 파라미터를 직접 수정해 지식을 바꾸는 방식이 주로 사용됐다. 이로 인해 지식을 수정하는 과정에서 기존에 저장된 정보까지 영향을 받을 수 있다는 한계가 있었다. 논문 주저자인 성진 언어지능연구실 연구원은 "사람의 뇌가 좌우로 나뉘어 서로 다른 역할을 하듯 AI도 지식을 나누어 저장하도록 만든 것"이라고 말했다. 성진 연구원은 상용화 관련 "메믹이 기존 기술 대비 우수한 성능을 나타내지만, 실사용을 위해선 정확도가 90% 정도는 되어야 한다고 본다"며 "올해 말 기술이전이 이루어질 것으로 예상한다"고 덧붙였다. 이미지 관련 시각 정보는 '시각 어댑터'에 저장하고, 텍스트 관련 언어 정보는 '언어 어댑터'에 각각 독립적으로 저장한다. AI가 이미지와 텍스트를 함께 이해해야 하는 복합적인 질문을 받으면 '지식 커넥터'가 두 정보를 문맥에 맞게 연결해 답을 만든다. 연구진은 기술 성능 확인을 위해 1,278개 항목으로 구성된 복합 지식 편집 벤치마크(CCKEB)를 구축하고, 수백 건의 지식을 순차적으로 편집하는 실험을 진행했다. 그 결과 이 기술은 복합 질문 정확도가 70% 수준으로 나타냈다. 이는 기존 기술들이 36~52% 수준이었던 것과 비교하면 두 배 이상 향상된 성능이다. 또한 새로운 지식을 추가한 뒤에도 기존 질문에 대한 답이 변하지 않아 응답 안정성이 유지되는 '지역성(Locality)' 보존 특성도 확인됐다. 임수종 언어지능연구실장은 “향후 산업 현장의 다양한 정보를 안정적으로 반영할 수 있도록 기술을 더욱 고도화할 것"이라고 덧붙였다.

2026.03.24 09:39박희범 기자

트웰브랩스, 게티이미지코리아에 영상 AI 검색 적용

트웰브랩스가 글로벌 스톡 플랫폼에 인공지능(AI) 영상 검색 기술을 제공했다. 트웰브랩스는 게티이미지코리아 게티이미지 뱅크에 영상 이해 AI 모델 '마렝고'를 공급했다고 23일 밝혔다. 이를 통해 약 10만 고객이 AI 기반 검색 기능을 활용할 수 있다. 이번 서비스는 기존 키워드 중심 검색에서 벗어나 영상 맥락과 의미를 이해하는 방식으로 전환된 것이 핵심이다. 이용자는 구체적인 문장 설명만으로 원하는 장면을 검색할 수 있다. 시스템은 시각 정보와 음성, 자막을 종합 분석해 결과를 제시한다. 그동안 게티이미지 등 스톡 미디어 플랫폼은 메타데이터와 태그 기반 검색에 의존했다. 콘텐츠는 급증했지만 검색 방식은 제한적이었고, 반복적인 필터링 작업이 필요했다. 이번 기술 도입으로 검색 구조 자체가 변화하며 제작 과정의 탐색 시간이 줄어들 것으로 예상된다. 마렝고는 영상 내 다양한 정보를 통합 분석하는 멀티모달 AI 모델이다. 단순 객체 인식을 넘어 장면 흐름과 의미를 이해하고 검색, 분류, 요약까지 수행할 수 있다. 글로벌 시장에서도 기술력을 인정받아 아마존웹서비스(AWS) 아마존 베드록에도 공급됐다. 트웰브랩스 이재성 대표는 "우리 영상 이해 AI 기술이 실제 서비스에 적용돼 사용자 가치를 창출하게 된 의미 있는 사례"라며 "앞으로도 미디어 산업에서 AI가 만들어내는 혁신적인 변화를 선도해 나가겠다"고 밝혔다.

2026.03.23 10:13김미정 기자

첫 투어 국가로 韓 낙점한 감마…AI로 데이터 시각화 지원

인공지능(AI) 콘텐츠 플랫폼 감마가 글로벌 사용자 투어 첫 국가로 한국을 점찍고 신규 디자인 서비스 '감마 이매진'을 포함해 다양한 신규 업데이트 서비스를 선보였다. 감마는 지난 17일 서울 강남구에서 미디어 라운드테이블을 열고 신규 업데이트 서비스를 소개했다. 감마는 프레젠테이션, 문서, 웹사이트, 소셜 게시물 등 비주얼 콘텐츠를 AI로 제작할 수 있는 글로벌 플랫폼이다. 사용자가 아이디어나 키워드를 입력하면 AI가 콘텐츠의 구조를 설계하고 시각 디자인까지 생성하는 것이 특징이다. 2020년 설립 이후 전 세계 약 1억 명의 사용자가 이용하고 있으며, 매일 약 100만 개의 콘텐츠가 제작되고 있다. 이번 업데이트는 역대 최대 규모로, 프레젠테이션·문서 제작 서비스에서 로고, 인포그래픽, 소셜 이미지 등 시각 콘텐츠까지 생성 가능한 비주얼 스토리텔링 플랫폼으로 영역을 확장했다. 감마 이매진은 로고, 인포그래픽, 다이어그램, 소셜 게시물 등을 AI로 구현하는 기능이다. 참고 이미지를 기반으로 특정 스타일을 반영할 수 있으며 여러 디자인 시안을 동시에 제공한다. 자연어 입력만으로 수정까지 가능해 별도의 디자인 프로그램이나 전문 인력 없이도 브랜드에 최적화된 결과물을 만들 수 있다고 회사 측은 설명했다. 이번 업데이트에서는 콘텐츠 재구성과 데이터 시각화를 지원하는 기능도 추가됐다. AI 네이티브 리믹스 템플릿은 기존에 만든 감마 콘텐츠나 템플릿을 기반으로 수정 사항을 입력하면 새로운 디자인을 자동으로 제작한다. 스마트 차트는 데이터를 입력하면 막대그래프, 산점도, 퍼널, 히트맵 등 다양한 형태의 시각 자료로 변환한다. 또한 자연어 입력만으로 로고, 마케팅 그래픽, 소설 이미지 등을 생성할 수 있는 AI 일러스트레이션 기능과 인포그래픽이나 다이어그램을 제작할 수 있는 AI 인포그래픽 기능도 제공한다. 생성된 결과물은 단독 이미지로 사용하거나 프레젠테이션과 문서에 바로 활용할 수 있다. 감마는 외부 업무 솔루션과의 연동도 확대했다. 챗GPT, 클로드, 메이크, 재피어(Zapier), 아틀라시안(Atlassian), 엔에잇엔(n8n), 슈퍼휴먼 고(Superhuman Go) 등 주요 AI 및 업무 솔루션과 연결돼 별도의 프로그램을 실행하지 않아도 기존 AI 어시스턴트나 업무 환경에서 바로 콘텐츠 제작이 가능하다. 그랜트 리 감마 대표는 "디자인 전문 지식 없이도 누구나 시각적으로 아이디어를 표현할 수 있도록 하는 것이 감마의 목표"라며 "감마 이매진을 통해 아이디어에서 결과물 도출까지의 시간을 줄이고 완성도를 높일 수 있을 것"이라고 말했다.

2026.03.18 08:30박서린 기자

한국신용데이터 "직접 만든 AI모델, 이미지 제작 일주일→1분"

한국신용데이터가 자체 이미지생성 인공지능(AI) 모델을 개발했다. 약 한 달 반 만에 만든 생성형 AI 모델인 '캐시노트 AI 비주얼 젠'은 기존 서비스처럼 원하는 프롬프트를 입력하면 약 1분 내외로 이미지를 뚝딱 만들어낸다. 단순히 필요한 이미지가 아니라 한국신용데이터의 브랜드 특성과 디자인 정체성이 반영돼 곧바로 업무에 활용할 수 있는 것이 기존 모델과의 차별점이자 특징이다. '캐시노트 AI 비주얼 젠' 개발을 이끈 인물은 이지스 브랜드 디자이너다. 그는 한국신용데이터가 만든 경영 관리 서비스 '캐시노트'의 브랜드 디자인과 자회사 5곳의 기업 브랜드를 맡고 있다. 이지스 한국신용데이터 브랜드 디자이너는 지난 11일 강남구 사무실에서 지디넷코리아와 진행한 인터뷰에서 '캐시노트 AI 비주얼 젠' 개발 과정을 소개했다. “다양한 소상공인들이 캐시노트 서비스를 이용하는 만큼 각 도메인의 특성을 포괄할 수 있는 지식재산권(IP)을 만들고자 했다. 한국신용데이터의 브랜드 특성, 디자인 톤앤매너, 컬러와 형태에 대한 규칙을 시스템화했다.” 캐시노트 AI 비주얼 젠은 주로 캐시노트 앱 서비스에 활용할 수 있는 인물 캐릭터나 음식 등의 이미지를 생성한다. 기존 2D 이미지를 시각적으로 구현한 3D 형태가 특징이다. 예를 들어 “중년 여자 사장님이 꽃을 들고 있는 이미지를 만들어줘”라고 입력하는 방식이다. 캐릭터의 성별과 연령대는 물론 표정이나 앞치마 색깔 등 세부 요소도 추가로 수정할 수 있다. 한국신용데이터가 시중에 나온 생성형 AI를 활용하는 대신 자체 개발을 선택한 이유는 경제성과 효율성 때문이다. 기업이 생성형 AI를 전사적으로 도입하려면 상당한 라이선스 비용이 발생한다. 가령 50명이 서비스형소프트웨어(SaaS) 도구를 사용할 경우 고정 비용이 크게 늘어나지만, 애플리케이션프로그래밍인터페이스(API)를 활용해 자체 구축할 경우 약 95%의 비용 절감 효과를 기대할 수 있다는 설명이다. “범용 모델과 달리, 자체 구축 모델은 디자이너가 아니더라도 프롬프트 입력만으로 실무에 바로 사용할 수 있는 디자인 결과물을 생성할 수 있다. 특히 한국신용데이터만의 정체성이 담긴 이미지를 곧바로 만들어낼 수 있다는 것이 장점이다.” 기존에는 이미지를 하나 제작하기 위해 기획과 리뷰, 피드백 과정을 거쳐 최소 일주일 이상이 소요됐다. 한국신용데이터에는 그래픽 디자이너가 두 명뿐이라 여러 부서에서 이미지 제작 요청이 몰리면 병목 현상이 발생하기도 했다. 그러나 '캐시노트 AI 비주얼 젠'을 활용하면서 복잡한 제작 과정을 거치지 않고 서비스나 광고 배너 등에 활용할 이미지를 약 1분 만에 만들 수 있게 됐다. 이지스 디자이너는 개발 과정에서 동료 개발자의 도움을 받았다. 바이브 코딩 방식으로 다양한 생성형 AI의 API를 활용했다. 그 중에서도 성능과 가격 측면에서 가장 합리적인 GPT-4o를 중심으로 활용하고 있다. “처음 개발에 도전하는 데다 참고할 레퍼런스도 거의 없어 쉽지 않았다. 우리 서비스의 고유 비주얼이 가진 형태적 특징, 컬러 값, 정서적 분위기, 표현 방식 등 디자이너의 감각적인 영역을 기계가 이해할 수 있는 명확한 언어와 수치로 '번역'하는 과정이 가장 중요하면서도 어려운 과제였다. 다행히 회사 동료들이 적극적으로 도와줘 실제 서비스로 실험적인 구현까지 완주할 수 있었다.” 한국신용데이터는 '캐시노트 AI 비주얼 젠'을 점차 고도화할 계획이다. 가령 기획을 입력하면 이에 최적화된 이미지를 자동으로 생성하고 추천하는 방향으로 확장할 예정이다. 나아가 해당 이미지를 접한 사용자의 행동, 구매 전환율, 클릭률 등의 데이터를 기반으로 추천 기능까지 구현한다면 사업 효율성을 높일 수 있을 것으로 기대하고 있다.

2026.03.15 09:15홍하나 기자

"AI와 대화하며 작업"…어도비, AI 이미지 편집 기능 발표

어도비가 포토샵·파이어플라이에 대화형 인공지능(AI) 편집 기능을 확대해 자동화 업무 수준을 높였다. 어도비는 포토샵 웹과 모바일용 'AI 어시스턴트' 공개 베타 버전, '파이어플라이 이미지 에디터'를 11일 발표했다. 이번 기능은 대화형 AI를 통해 복잡한 이미지 편집 작업을 보다 효율적으로 수행하도록 돕는다. 포토샵 AI 어시스턴트는 채팅 기반 인터페이스를 통해 사용자 편집 의도를 이해하고 작업을 자동으로 수행하거나 단계별로 안내한다. 배경 제거·변경, 색상 조정, 조명 보정 등 주요 편집 작업을 자동 적용할 수 있다. 사용자는 음성으로도 편집 요청을 할 수 있다. 이를 통해 이동 중 모바일 환경에서 간편하게 이미지 편집 작업을 수행할 수 있다. 포토샵 웹에서는 'AI 마크업' 기능이 공개 베타로 제공된다. 사용자가 이미지 특정 영역을 표시한 뒤 프롬프트를 입력하면 해당 영역에 원하는 요소를 생성하도록 제어할 수 있다. 예를 들어 이미지 위 특정 영역을 표시한 뒤 '꽃 추가' '산 추가' 같은 프롬프트를 입력하면 해당 위치에 맞춰 새로운 이미지를 생성할 수 있다. 어도비는 파이어플라이 이미지 에디터를 통해 생성형 이미지 편집 기능을 통합했다. AI 생성 이미지와 사용자가 업로드한 이미지를 동일한 편집 환경에서 수정할 수 있도록 설계됐다. 파이어플라이 이미지 에디터는 생성형 채우기, 생성형 제거, 생성형 확장, 생성형 업스케일 배경 제거 등 주요 AI 편집 기능을 제공한다. 사용자는 프롬프트 기반으로 이미지 요소 추가, 교체, 보정, 확장, 해상도 개선 작업을 수행할 수 있다. 파이어플라이는 어도비 파이어플라이 모델 외에도 외부 AI 모델을 선택해 사용할 수 있도록 지원한다. 구글 '나노 바나나 2'를 비롯한 오픈AI 이미지 생성 등 25개 이상 모델을 지원한다.

2026.03.11 12:56김미정 기자

신입구직자는 '삼성', 경력직은 'SK' 선호...왜?

이번 달 삼성과 SK 등 주요 대기업들의 상반기 채용이 본격화되는 가운데, 진학사 캐치가 Z세대가 바라본 삼성과 SK의 기업 이미지를 AI로 시각화해 눈길을 끌고 있다. 캐치는 대학생·취준생·직장인 1만986명을 대상으로 진행한 '상위 그룹사 이미지 및 인식 조사' 결과를 6일 발표했다. 이번 조사는 구직자들이 선택한 기업 이미지 키워드를 AI 모델 '제미나이'에 입력해 각 그룹사를 대표하는 시각 이미지를 생성하는 방식으로 진행됐다. 먼저 구직자가 인식하는 삼성의 1위 키워드는 '글로벌(57%)'이었다. 이어 ▲업무강도 높은(48%) ▲기술주도(45%)가 뒤를 이으며 글로벌 시장을 선도하는 기술 중심 기업이라는 이미지가 구직자들에게 각인된 것으로 분석된다. AI는 이를 세련된 오피스 룩을 입고 태블릿과 캔 음료를 들고 있는 도시적이고 전문적인 여성 이미지로 생성했다. 반면 SK의 경우 '확실한 보상(54%)'이 1위 키워드로 꼽혔다. 뒤이어 ▲업무강도 높은(44%) ▲기술주도(41%) 순으로 나타나며 체감도 높은 보상 시스템이 SK의 대표 이미지로 자리 잡은 것으로 분석된다. AI는 이를 따뜻한 색감의 옷을 입고 카페에서 스마트폰과 커피를 즐기는 편안한 인상의 남성 이미지로 생성했다. 조사 결과에서 눈길을 끄는 부분은 연차에 따른 선호도 차이였다. 신입 구직자의 과반수(56%)는 삼성을 택했지만, 이직을 준비하는 경력직 구직자들은 SK(57%)를 더 선호했다. 사회 초년생은 글로벌 위상과 네임밸류를 중시하는 경향이 강한 반면, 직장 경험이 쌓일수록 실질적인 보상과 성과 시스템을 중요하게 고려하는 것으로 분석된다. 진학사 캐치 김정현 본부장은 “설문 데이터를 넘어 AI 기술로 구직자들의 인식을 시각화해 보니 그룹사별 이미지가 더욱 선명하게 드러났다”며 “채용 시장에서도 일방적인 홍보가 아닌 데이터와 구직자 트렌드에 기반한 타깃 맞춤형 브랜딩이 필수적인 시대”라고 강조했다. 삼성전자와 SK하이닉스는 이달 상반기 채용을 통해 반도체 인재 확보에 나설 예정이다. 삼성전자를 비롯한 삼성디스플레이, 삼성전기, 삼성SDI 등 주요 삼성 계열사는 이달 중순 신입사원 공개 채용을 시작할 것으로 알려졌으며, SK하이닉스 역시 반도체 연구개발(R&D) 등 핵심 분야 중심의 신입 채용을 진행할 계획이다.

2026.03.06 08:54백봉삼 기자

최 고 마크애니 대표 "AI 콘텐츠 워터마크, 국제 규격 C2PA로 가야"

"인공지능(AI) 생성 콘텐츠의 투명성을 확보하기 위해 대한민국이 독자적인 기준을 세우기보다 국제 표준인 C2PA(콘텐츠 출처 및 진위 확인을 위한 연합)를 적극 수용해야 합니다. 국내만의 별도 표준은 자칫 글로벌 흐름에서 뒤처지는 '갈라파고스적 규제'가 될 수 있습니다." 최고 마크애니 대표는 25일 서울 서초구 드림플러스 강남에서 개최된 'AI 투명성 법·제도 세미나'에서 이같이 강조했다. AI 기본법 시행으로 워터마크 부착이 의무화된 가운데, 최 대표는 기술적 파편화를 막고 글로벌 상호운용성을 확보해야 한다고 강조했다. 구글 제미나이, 오픈AI 챗GPT 등 생성형 AI가 생성한 이미지나 영상에는 워터마크가 붙어 있다. 생성형 AI를 통해 생성한 콘텐츠임을 확인시키기 위해 조그맣게 로고를 표시한 것이다. 일종의 증명인 셈이다. 이런 워터마크는 여러 종류가 있다. 먼저 생성형 AI가 생성한 콘텐츠에 붙는 워터마크는 '가시성 워터마크'다. 가령 제미나이를 통해 이미지를 생성하면 반투명한 로고가 우측 하단에 붙는 식이다. 가시성 워터마크는 생성형 AI를 통해 생성한 콘텐츠임을 증명하는 흔적을 누구나 쉽게 지울 수 있다는 단점이 있다. 포토샵으로 워터마크 자체를 지워버릴 수도 있고, 이미지를 조금만 확대해 잘라내도 워터마크를 없앨 수 있다. 이런 한계를 극복한 워터마크가 '비가시성 워터마크'다. 위조가 불가능한 고유한 서명을 이미지나 영상에 보이지 않게 부여한 것이다. 최 대표는 "할리우드 영화를 보면 매 프레임마다 화면 전체에 모두 비가시성 워터마크가 적용돼 있다. 보이지 않기 때문에 워터마크가 없다고 느낄 수 있지만, 고유 ID가 포함돼 있다"며 "예를 들어 네이버 TV를 본다면 네이버 TV라는 서명(ID)이 박혀 있고, 이를 시청하는 사용자의 ID가 포함돼 있다"고 설명했다. C2PA는 어도비, 마이크로소프트, 구글 등이 주도해 만든 개방형 비가시성 워터마크 기술이자 국제 표준이다. 마크애니는 C2PA 기술을 통해 위조가 불가능한 서명을 콘텐츠에 부여해 무결성을 확보한다. 디지털 콘텐츠가 진짜인지 AI가 생성한 것인지 확인할 수 있는 보이지 않는 수단을 제공하고 있는 것이다. 최 대표는 AI 기본법에 한국만의 표준을 적용기 보다는 국제 표준 C2PA를 따르는 방향으로 나아가야 한다고 주장했다. 그는 "삼성전자도 C2PA 메타데이터를 채택하고 있다. 여러 업체들이 C2PA에 올라타야 하는 상황인데, 대한민국만의 기준을 만들면 국제 표준도 준수해야 하고 국내의 기준도 맞춰야 하는 등 혼선만 초래할 수 있다"며 "C2PA는 무료다. 누구나 쓸 수 있는 오픈소스 형태로 돼 있기 때문에 일부 기업에 이권 사업이 될 확률이 매우 적다. 오히려 한국만의 표준을 만들면 이권 사업이 되는 것처럼 비춰질 수 있다"고 우려했다. 최 대표는 "단지 마크애니는 오픈소스인 C2PA를 스타트업 등 사용자가 쓰기 쉬운 형태로 무료배포하고 있을 뿐"이라며 "AI 기본법 준수 과정에서 겪은 어려움을 최소화하기 위해 지속적으로 지원하겠다"고 밝혔다.

2026.02.25 18:39김기찬 기자

컬리, 이미지 생성 서비스 'AI 스튜디오' 출시

리테일 테크 기업 컬리는 인공지능(AI) 이미지 생성 서비스 'AI 스튜디오'를 출시했다고 20일 밝혔다. AI스튜디오는 구글의 생성형 AI만을 활용해 구현됐다. AI 스튜디오는 사진을 업로드하면 ▲인형 ▲영화배우 ▲옛날 캠 ▲한복 등 다양한 테마의 프로필 사진을 만들어 주는 서비스로 컬리 앱에서 이용할 수 있다. AI 스튜디오는 지난 달 중순 ▲기획자 ▲엔지니어 ▲디자이너 ▲마케터 등 컬리 사내 구성원들이 사이드 프로젝트로 시작해 지난 12일 공개됐다. 컬리 고객에게는 AI스튜디오 이용권이 하루 한 장씩 주어진다. 이미지 생성 시 이용권이 차감되며, 친구에게 공유한 링크로 이미지가 생성되면 한 장 더 받을 수 있다. 컬리 AI 스튜디오는 공개 일주일만에 누적 7만여 건의 이미지 생성을 기록했다. 이외에도 그동안 컬리는 고객이 앱에서 즐길 수 있는 다양한 기능을 구현해왔다. 컬리 앱 하단 '라운지'에서는 나만의 컬리 라이프를 소개할 수 있다. 좋아하는 상품을 추천하는 '마이 컬리템'과 투표, 추천 등을 통해 다른 이용자들과 의견을 공유할 수 있는 '커뮤니티' 등이 대표적이다. 컬리는 지난해 하반기 컬리 앱과 연동할 수 있는 AI 식단 관리 앱 '루션'도 선보였다. 컬리 관계자는 “AI 스튜디오는 고객이 앱 내에서 쇼핑뿐 아니라 즐겁게 머물 수 있는 다양한 경험 제공을 고민하다 기획하게 됐다”며 “리테일 테크 기업으로서 앞으로도 AI 기술을 접목해 고객의 라이프스타일을 다양하게 만들 수 있는 시도를 이어갈 계획”이라고 말했다.

2026.01.20 10:06박서린 기자

Prev 1 2 3 Next