검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'이미지'통합검색 결과 입니다. (82건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

어도비, 토파즈랩스 인수…'파이어플라이' 경쟁력 강화

어도비가 인공지능(AI) 기반 이미지·영상 보정 기술을 확보해 제품 경쟁력을 강화한다. 25일(현지시간) 테크크런치 등 외신에 따르면 어도비는 토파즈랩스를 인수한다고 밝혔다. 토파즈랩스는 어도비 크리에이티브 사업 부문에 편입될 예정이다. 인수 거래는 올 하반기 마무리된다. 토파즈랩스는 20년 넘게 영상과 이미지 품질을 높이는 도구를 개발해 온 기업이다. 지난해 제작 기술 부문에서 에미상을 받았으며 최근 AI 모델도 공개한 바 있다. 토파즈랩스 대표 제품은 AI 영상 업스케일링 모델 '아스트라'와 이미지 보정·향상 모델 '원더'다. 토파즈랩스는 일반 소비자용 그래픽처리장치(GPU)에서도 대형 영상 모델을 원활히 실행하는 기술도 개발해 왔다. 어도비는 토파즈랩스 모델을 파이어플라이 AI 앱과 이미지·영상 편집 제품군에 통합할 계획이다. 기존 토파즈 제품은 토파즈 웹사이트를 통해 독립형 서비스로도 계속 제공된다. 현재 어도비는 크리에이티브 클라우드 제품군에서 토파즈 일부 도구를 제공하고 있다. 이번 인수로 실제 촬영 영상과 AI 생성 영상을 결합하려는 전문가에게 디테일 선명화와 노이즈 감소, 아카이브 영상 복원 기능을 더 폭넓게 제공할 방침이다. 테크크런치는 어도비가 AI 중심 편집 시장에서 경쟁력을 강화하기 위해 인수를 추진했다고 봤다. 현재 어도비는 캔바와 다빈치 리졸브를 보유한 블랙매직디자인 등과 이미지·영상 편집 시장에서 경쟁하고 있다. 디파 수브라마니암 어도비 크리에이티브 클라우드 제품 마케팅 부문 부사장은 "토파즈랩스는 크고 복잡한 AI 모델을 기기에서 직접 실행할 수 있도록 최적화하는 데 깊은 전문성을 갖고 있다"며 "우리는 고객에게 더 빠르고 반응성이 높은 경험을 제공하고 크리에이터들이 고급 AI를 더 쉽게 접근하고 더 비용 효율적으로 활용할 수 있게 돕기 위해 인수를 추진한 것"이라고 밝혔다.

2026.06.26 10:40김미정 기자

[기고] 인간이 직접 만든 콘텐츠입니다

챗GPT 등장 이후 인공지능(AI)과 신기술, 혁신적인 서비스의 개발을 해하지 않으면서도 이용자의 권리와 개인정보를 보호하려면 어떤 것을 고려해야 할 지에 대한 논의가 최근 활발해진 분위기다. 급변하는 정보사회에서 AI와 개인정보 보호에 있어 우리 사회가 취해야 할 균형 잡힌 자세가 어떤 것인지에 대해 법무법인 태평양 AI팀에서 [AI 컨택]을 통해 2주 마다 다뤄보고자 한다. [편집자주] A씨는 건강을 위해 달리기로 결심했다. 혼자 뛰다 보니 여러 명이 함께 달리는 러닝 크루들이 보였고, A씨도 러닝 크루를 만들어 뛰는 것이 더 재미있을 것 같았다. A씨는 달리기 모임을 만들고 신규 회원 모집에 나섰다. 회원을 모집하려니 모임을 상징하는 이미지가 있으면 좋겠다는 생각이 들었다. 아쉽게도 A씨는 상상력은 풍부한 편이지만 그림 그리기에 영 소질이 없다. 하지만 걱정할 필요가 없다. A씨는 머리에 떠오른 이미지를 AI에게 설명하고 이미지를 만들어 보라고 시킨다. AI가 만든 이미지를 보며 A씨가 몇가지 수정 아이디어를 주니 꽤 쓸만한 이미지가 나온다. AI가 발전하면서 흔히 볼 수 있게 된 모습이다. 이미지뿐 아니라 AI를 이용해 프롬프팅으로 영상이나 음악, 애플리케이션을 만들기도 한다. 개인 취미 활동에만 이용되는 것이 아니다. 한국콘텐츠진흥원에 따르면 국내 콘텐츠 산업 종사자들이 생성형 AI를 이용하는 비율이 2025년 상반기에 20%에 달했다. 지난 2024년 하반기보다 약 7% 늘어난 것이라고 하니 1년이 지난 지금은 그 비율이 훨씬 높아졌을 것이다. AI는 콘텐츠 제작에 많은 도움을 주고 있지만 악용되는 사례도 많다. AI를 이용해 마치 진짜인 것처럼 만들어 내는 딥페이크에 대해 일반인들이 조작된 것인지 확인하기는 쉽지 않다. 특정 세력 여론몰이나 트래픽을 늘려 수익을 얻기 위해서 등 다양한 목적으로 딥페이크가 쏟아지고 있다. 최근 중동에서 일어난 이란 전쟁을 예로 들어 보자. 이란 전쟁은 다양한 방향에서 AI가 본격적으로 이용된 전쟁으로 볼 수 있는데, AI로 가짜 사진이나 동영상을 정교하게 생성하여 여론에 혼란을 주기도 했다. 예를 들어 아랍에미리트 두바이에 있는 세계 최고층 건물 부르즈 할리파가 드론 공습을 받는 사진과 동영상이 사회관계망서비스(SNS) 등에 널리 퍼졌지만 AI로 생성되거나 변경된 가짜 이미지로 확인이 됐다. 딥페이크가 광고에 도입되면 더 혼란을 줄 수 있다. 어느 분야의 권위있는 인물 이미지를 활용해 어떤 제품을 권하는 것처럼 합성한다거나, 의약품의 경우 사용 전후 변화 이미지를 AI를 이용해 효과를 과장할 수도 있다. 이런 문제로 인해 AI가 생성한 결과물이라는 사실을 알리도록 하는 방안이 추진되고 있다. 옛 트위터인 엑스(X)는 무력 충돌을 다룬 영상과 이미지를 AI로 생성할 때 AI 생성 결과물임을 밝히지 않고 게시하는 이용자에게 광고 수익 공유를 중단하겠다고 발표했다. AI를 이용해 생성한 실제와 구분하기 어려운 이미지, 영상 등 딥페이크에 대해 'AI를 이용해 생성됐다'는 사실을 이용자가 명확하게 알 수 있도록 표시할 의무를 법제화하려는 움직임도 나타난다. 유럽연합(EU)은 'AI 액트(Act)'에서 AI 시스템 배포자(deployer)에게 딥페이크 콘텐츠가 인위적으로 생성 또는 조작됐다는 것을 공개하도록 정하고 있다. 이에 EU는 실시간 영상, 비(非)실시간 영상, 이미지, 오디오 등 콘텐츠 종류별로 딥페이크임을 표시하는 방법에 대한 가이드라인을 발표했다. 우리나라도 텍스트, 이미지, 동영상, 음성 등 콘텐츠 종류 별로 표시 방법에 대한 가이드라인이 나와 있다. 최근 국회 본회의를 통과한 의료기기법 개정안은 딥페이크를 활용하여 관련 분야 전문가가 의료기기를 보증, 추천 등 하는 것으로 오인하게 할 우려가 있는 광고를 금지했다. 공정거래위원회도 AI로 만든 가상인물을 활용한 광고에 '가상 인물이 포함된 게시물'이라는 사실을 알리도록 한 심사지침 개정안을 행정예고했다. 국회엔 딥페이크를 직접 제작하거나 편집하여 제공하려는 자에게 해당 정보가 AI 생성물임을 나타내는 표시를 하도록 의무화하는 정보통신망법 일부 개정안도 발의돼 있다. 이용자에게 AI를 이용해 만든 결과물이라는 사실을 명확히 알리는 방향으로 제도가 정비되고 있다. 갈수록 우리가 보는 콘텐츠에 'AI를 이용해 만든 결과물'이라는 표시가 많이 보일 것이다. 그렇다면 AI를 이용하지 않고 오직 인간 힘으로 모든 과정을 해 낸 콘텐츠는 수제품과 같은 지위를 갖게 되는 것일까.

2026.05.21 17:31유재규 컬럼니스트

글자만 번역하던 시대 끝…브랜드 감성까지 살리는 AI 뜬다

해외 판매용 상품 상세 페이지를 여러 언어로 바꾸는 작업은 이커머스 업계의 대표적인 수작업 영역으로 꼽힌다. 최근 단순 번역을 넘어 원본 이미지의 글자 색상이나 강조 효과까지 유지하려는 수요가 커지면서, 디자인 보존형 이미지 번역 기술 경쟁도 본격화하는 분위기다. 16일 플리토에 따르면 지난달 '이미지 번역 프로(Image Translation Pro)'를 출시한 이후 중국을 비롯한 해외 크로스보더 이커머스 기업들의 도입 문의가 이어지고 있다. 플리토는 올리브영, 졸스 등 글로벌 뷰티·패션 라이프스타일 플랫폼과 협업하며 국내외 대량 이미지 번역 시장을 공략 중이다. 이미지 번역 프로는 응용 프로그램 인터페이스(API) 기반으로 제공되는 이미지 번역 솔루션으로, 이미지 속 텍스트를 번역하면서도 원본 디자인 요소를 최대한 유지하는 데 초점을 맞췄다. 문장 내 특정 단어에만 적용된 색상이나 강조 효과를 인식해 번역 이후에도 동일한 형태로 복원하는 '텍스트 속성 인식' 기술이 적용됐다. 예를 들어 상품 배너에서 특정 키워드만 빨간색이나 굵은 테두리로 강조된 경우 번역 결과물에서도 같은 위치와 디자인 속성을 유지하는 식이다. 기존 이미지 번역 서비스가 텍스트 변환 자체에 초점을 맞췄다면 플리토는 브랜드 톤앤매너 유지까지 고려했다. 제품 패키지 내부 텍스트를 자동으로 구분하는 '스마트 필터링' 기능도 탑재했다. 인공지능(AI)이 상품 용기에 인쇄된 브랜드 로고나 성분 정보 등은 번역 대상에서 제외하고, 마케팅 문구만 선별적으로 번역해 실제 제품 이미지와의 이질감을 줄이는 방식이다. 플리토는 이런 기능이 글로벌 이커머스 운영 과정에서 반복적으로 발생하는 상세페이지 수정 작업을 줄이는 데 도움이 될 것으로 보고 있다. 회사 측에 따르면 A4 기준 이미지 한 장은 약 5~10초 내 처리 가능하며 수동 편집 대비 작업 시간을 90% 이상 단축할 수 있다. 실제 시장에선 크로스보더 이커머스 확대와 함께 상품 상세페이지 현지화 수요도 꾸준히 증가하는 모습이다. 국가별 언어에 맞춰 대량 이미지를 반복 수정해야 하는 만큼, 디자인 요소를 유지하면서도 작업 효율을 높일 수 있는 자동화 기술 도입이 늘어나는 추세다. 업계 관계자는 "최근 생성형 AI 기반 이미지 제작 기술이 주목받지만 이커머스 현장에선 비용과 처리 속도 부담이 여전히 존재한다"며 "대량 상품 이미지를 빠르게 현지화하면서도 브랜드 디자인을 유지할 수 있는 실무형 AI 수요가 커지고 있다"고 말했다.

2026.05.16 15:22이나연 기자

레드햇, 하드닝 이미지·허밍버드·데스크톱 출시…"AI 개발 속도·보안↑"

[애틀랜타(미국)=김미정 기자] 레드햇이 인공지능(AI) 에이전트 개발 확산에 맞춰 소프트웨어(SW) 공급망 보안과 개발자 작업 속도를 동시에 높이는 통합 전략을 내놨다. 보안이 강화된 컨테이너 이미지부터 최신 운영체제(OS), 샌드박스 기반 개발 환경까지 아우르는 엔터프라이즈 개발 체계를 재정비하겠다는 구상이다. 레드햇은 14일까지 미국 조지아주 애틀랜타에서 열리는 '레드햇 서밋 2026'에서 '레드햇 하드닝 이미지(Red Hat Hardened Images)'와 '페도라 허밍버드 리눅스(Fedora Hummingbird Linux)' '레드햇 데스크톱(Red Hat Desktop)'을 공식 출시했다고 밝혔다. 이를 통해 개발 초기 단계부터 배포 환경까지 신뢰성을 높겠다는 전략이다. 레드햇 하드닝 이미지는 최신 프로그래밍 언어와 런타임, 데이터베이스, 웹 서버 등을 위한 초소형·테스트 완료 컨테이너 이미지다. 현대 클라우드 네이티브 애플리케이션 기반 이미지를 보안 중심으로 재구성한 형태다. 레드햇 엔터프라이즈 리눅스(RHEL)와 오픈시프트 구독 고객에게 추가 비용 없이 제공된다. 이 이미지는 고도로 자동화된 '에이전틱 소프트웨어(SW) 팩토리'를 통해 지속적으로 빌드된다. 레드햇은 자동화 속도를 끌어올리면서도 사람 개입이 포함된 검토 절차를 유지해 거버넌스와 감독 기능까지 확보했다고 설명했다. 기업은 빠르게 업데이트되는 개발 환경에서도 공급망 보안 기준을 일정 수준으로 유지할 수 있는 셈이다. 페도라 허밍버드 리눅스는 롤링 릴리스 방식으로 업스트림 리눅스 커뮤니티가 제공하는 수정 사항과 업데이트를 신속히 반영한다. 레드햇은 허밍버드가 알려진 공통 취약점·노출(CVE) 없는 언어와 런타임, 데이터베이스, 개발 도구를 함께 제공해 AI 에이전트 실험 환경으로 활용될 수 있다고 강조했다. 이날 개발자 작업 환경을 겨냥한 레드햇 데스크톱도 정식 출시됐다. 이는 컨테이너 개발 도구인 포드맨 데스크톱의 레드햇 지원 버전 형태다. 레드햇 하드닝 이미지와 '레드햇 트러스티드 라이브러리'에 직접 연결된다. 개발자는 기업 SW 공급망 기준을 충족하는 이미지와 라이브러리를 개발 단계에서부터 손쉽게 찾을 수 있다. 레드햇 데스크톱에는 로컬 샌드박스 기능도 추가됐다. 이 기능은 에이전트를 개발자 PC와 기업 인프라로부터 분리하는 기능이다. 에이전트가 작업 범위를 잘못 해석하거나 예기치 않은 동작을 수행했을 때 발생할 수 있는 위험을 줄일 수 있다. 레드햇은 엔비디아와의 협업, 오픈소스 프로젝트 '오픈셸(Openshell)' 통합을 통해 개발자 노트북부터 실제 운영 환경까지 샌드박싱 체계를 확장할 방침이다. 아셰시 바다니 레드햇 수석부사장 겸 최고제품책임자(CPO)는 "기업이 더 빠르게 AI 기반 애플리케이션을 실험하고 배포하되, 그 과정에서 이미지 신뢰성·라이브러리 검증·실행 격리 같은 핵심 보안 요소를 놓치지 않도록 개발 체계를 재설계했다"고 강조했다.

2026.05.14 03:05김미정 기자

소니·TSMC, 이미지 센서 공동개발·제조에 합의

일본 소니 산하 반도체·이미지 센서 기업인 소니세미컨덕터솔루션과 대만 TSMC가 전략적 제휴에 나선다. 양사는 8일 차세대 이미지 센서를 공동 개발하고 제조하는 사안에 대해 법적 의무나 구속력이 없는 기본 합의서를 체결했다고 밝혔다. 양사에 따르면, 소니세미컨덕터솔루션과 TSMC는 이번 합의에 따라 소니 측이 과반 지분을 지니는 합자회사(조인트벤처)를 설립할 예정이다. 일본 쿠마모토 현 코시 시 소재 소니 공장에 개발·생산 라인 설치를 위해 검토중이다. 양사는 "이번 조인트벤처 설립을 통해 이미지 센서의 성능 향상을 위해 소니 측이 가진 이미지 센서 설계 노하우와 TSMC의 강점인 공정 기술과 제조 능력을 활용하게 될 것"이라고 설명했다. 양사는 조인트벤처 설립 이후 추가 투자도 협의중이라고 밝혔다. 소니는 쿠마모토 현 신설 시설 이외에 나가사키 현 기존 공장에도 수요 증가 추이에 따라 단계적으로 투자를 늘릴 예정이다. 또 투자 금액에는 일본 정부 지원을 추가로 받는 것도 검토중이다. 양사는 "오토모티브(자동차)나 로보틱스 등 피지컬 AI 응용 분야에 따라 새로운 사업 기회를 찾고 대응할 예정이며 앞으로 혁신이나 기술 발전을 위한 기초를 마련할 것"이라고 설명했다. 소니세미컨덕터솔루션은 CMOS 소자를 활용한 이미지 센서를 스마트폰·태블릿과 PC, 미러리스 카메라 등 다양한 기기에 공급하고 있다. 지난 해 세계 시장점유율은 약 50% 가량이다. 삼성전자 시스템LSI 사업부 산하 센서사업팀이 공급하는 '아이소셀(ISOCELL)' 센서는 같은 기간 약 20% 가량의 점유율을 확보했다. 삼성전자는 작년 말 애플 등 글로벌 고객사 대응을 위해 '센서전략팀'을 신설하기도 했다.

2026.05.09 10:12권봉석 기자

제논, AI 올인원 포털 '제나' 공개…챗봇·금융 분석 한곳에

제논이 다양한 인공지능(AI) 서비스를 하나로 통합한 AI 에이전트 포털을 공개하며 B2C 시장 공략에 나선다. 흩어진 AI 기능을 단일 인터페이스로 연결해 일반 사용자 중심 AI 플랫폼으로 확장한다는 전략이다. 제논은 AI 에이전트 포털 '제나(GenA)'의 베타 서비스를 오픈한다고 6일 밝혔다. 제나는 챗봇과 슬라이드 제작, 번역, 이미지 생성 등 개별적으로 분산된 AI 서비스를 단일 포털 안에서 통합 제공하는 것이 특징이다. 사용자는 여러 서비스를 오가며 작업할 필요 없이 하나의 인터페이스 안에서 연속적인 AI 작업 환경을 이용할 수 있다. 이번 베타 서비스는 제논이 기존 B2B 중심 사업에서 개인 사용자 대상 B2C 시장으로 사업 영역을 확대하는 첫 단계라고 평가된다. 회사는 일반 사용자 접근성을 고려해 직관적인 UI·UX를 적용하고 실생활 활용도가 높은 기능 중심으로 서비스를 구성했다고 설명했다. 기술 완성도도 강화했다. 제나는 텍스트뿐 아니라 이미지와 PDF, 문서 파일 등 고용량 데이터를 인식하는 멀티모달 AI 기능을 지원한다. 여기에 이전 대화 맥락을 기억하고 세션 제목을 자동 생성하는 맥락 인식 기술도 적용했다. 또 결과물 정확도를 높이기 위해 질문·검증·수정 단계를 거치는 '휴먼 인 더 루프' 구조를 도입했다. AI 결과물을 반복 검증해 보다 신뢰도 높은 응답을 제공한다는 설명이다. 현재 제나에서 제공되는 AI 에이전트는 총 5종이다. ▲통합 리서치 기반 심층 답변을 제공하는 'AI 범용 채팅' ▲자연어 입력만으로 프레젠테이션 자료를 생성하는 'AI 슬라이드 생성' ▲디자인 작업을 지원하는 'AI 이미지 생성' ▲문맥 기반 번역 기능 'AI 번역' ▲실시간 시장 데이터와 ETF 정보를 분석하는 '금융 특화 에이전트' 등이다. 특히 금융 특화 에이전트는 제나에서만 제공되는 서비스로 차별화를 꾀했다. 제논은 베타 서비스 기간 동안 용량 제한 없이 누구나 무료로 이용할 수 있도록 운영할 계획이다. 회사는 6일 개막한 AI 엑스포 코리아 2026 현장에서 제나를 처음 공개했다. 행사에선 시니어 요양 케어 특화 피지컬 AI와 생성형 AI 플랫폼 '제노스 2.0'도 함께 선보였다. 제논은 이번 베타 운영 기간 동안 사용자 피드백을 반영해 서비스 완성도를 높이고 향후 정식 출시로 이어갈 방침이다. 고석태 제논 대표는 "제나는 기업뿐 아니라 개인 사용자까지 고도화된 AI 기술을 일상적으로 활용할 수 있도록 설계된 통합 포털"이라며 "앞으로 피지컬 AI와 제나를 중심으로 일반 사용자 접점을 확장하고 폭넓은 AI 경험을 제공해 나가겠다"고 밝혔다.

2026.05.06 16:45한정호 기자

"AI 프사, 이 정도였어?"…챗GPT 이미지 2.0, 출시 첫 주부터 난리

오픈AI의 새 이미지 생성 모델 '챗GPT 이미지 2.0'이 출시 첫 주부터 빠르게 이용자를 끌어모으고 있다. 지난해 '지브리풍' 이미지 열풍으로 AI 이미지 생성의 대중성을 확인한 오픈AI가 이번에는 사진 한 장을 화보·애니메이션·캐릭터 이미지로 바꾸는 '사진 변환' 수요를 앞세워 다시 흥행몰이에 나선 모습이다. 1일 오픈AI에 따르면 지난달 26일 기준 챗GPT 이미지 2.0의 일일활성이용자수(DAU)는 전주 대비 60% 이상 증가했다. 같은 기간 신규 이용자 유입은 130% 이상 늘었다. 챗GPT 이미지 2.0은 사용자의 지시를 이미지에 정밀하게 반영하고 이미지 안의 텍스트를 자연스럽게 구현하는 기능을 강화한 것이 특징이다. 특히 한글·일본어·중국어 등 비라틴 문자권 언어의 텍스트 렌더링 정확도가 개선되면서 기존 이미지 생성 AI에서 반복적으로 지적됐던 '글자 깨짐' 문제도 줄었다. 초기 흥행의 중심에는 '사진 변환' 수요가 있다. 오픈AI가 최근 24시간 동안 한국 이용자들의 이미지 활용 사례를 분석한 결과 기존 사진을 기반으로 스타일이나 콘셉트를 바꾸는 요청이 주를 이뤘다. 가장 많이 사용된 프롬프트는 "이 사진을 고급 패션 스튜디오 화보처럼 바꿔줘. 피부 톤이 잘 살아나게 배경도 어울리게 바꿔줘"였다. 이어 "이 사진을 요즘 유행하는 애니메이션 스타일로 바꿔줘", "사진 속 인물을 귀여운 미니미 캐릭터처럼 만들어줘", "이 사진을 활용해서 짧은 코믹 스트립을 만들어줘" 등도 자주 사용됐다. 이는 AI 이미지 활용 방식이 '그림을 만들어주는 도구'에서 '사진을 다시 해석하는 도구'로 넓어지고 있음을 보여준다. 지난해 지브리풍 이미지가 특정 화풍을 따라 하는 놀이로 확산됐다면, 챗GPT 이미지 2.0은 이용자가 가진 사진을 기반으로 화보, 팬아트, 프로필 이미지, 짧은 만화 등으로 재가공하는 데 초점이 맞춰지고 있다. 특히 팬덤 문화와 소셜미디어 소비가 강한 한국 시장에서는 연예인 사진이나 인물 사진을 애니메이션풍으로 바꾸는 활용이 빠르게 확산될 가능성이 크다. 별도 편집 툴을 다루지 않아도 사진 한 장과 간단한 문장만으로 결과물을 만들 수 있다는 점이 진입 장벽을 낮추고 있다. AI 이미지 생성 시장 경쟁도 더 치열해지고 있다. 구글은 '나노바나나' 계열 이미지 생성·편집 모델을 앞세워 제미나이 생태계 안에서 빠른 생성 속도와 편집 성능을 강조하고 있다. 어도비는 포토샵·프리미어·라이트룸 등 크리에이티브 클라우드 앱에 AI 기능을 결합하며 창작자 워크플로 공략에 속도를 내고 있다. 오픈AI는 챗GPT의 대중적 이용자 기반을 바탕으로 이미지 기능을 일상 사용처로 넓히는 데 초점을 맞추고 있다. 구글이 제미나이 생태계 확장과 모델 성능을, 어도비가 전문 창작자용 편집 워크플로를 앞세운다면 오픈AI는 일반 이용자의 반복 사용을 끌어내는 쪽에 무게를 두는 모습이다. 가브리엘 고 오픈AI 챗GPT 이미지 2.0 리드 리서처는 "한국을 포함한 아시아 이용자들이 매우 창의적이고 실용적인 방식으로 빠르게 활용하고 있는 점이 인상적"이라며 "가장 흥미로운 아이디어는 종종 우리가 아니라 사용자들로부터 나온다"고 말했다.

2026.05.01 15:07장유미 기자

두산테스나, 1909억원 반도체 테스트 장비 인수...평택 2공장 투자 재개

시스템 반도체 후공정 테스트 업체 두산테스나가 테라다인과 세메스 등 4곳에서 1909억원 규모 반도체 테스트 장비를 양수한다고 28일 밝혔다. 관련 장비는 올해 말까지 순차 도입하고, 반도체 테스트 인프라를 확대할 계획이다. 두산테스나는 지난해 10월 공시했던 반도체 테스트 장비 양수 규모를 기존 1714억원에서 2053억원으로 상향했다. 이에 대해 "해당 제품군 수요 증가로 장비 도입 규모를 확대했다"고 설명했다. 거래 상대는 아드반테스트, 세메스, 인터액션 등 3곳이다. 이들 장비는 2027년 3월까지 차례로 입고할 예정이다. 평택 2공장 신규시설 투자도 집행한다. 두산테스나는 "시장 상황에 따라 착공 시기를 조율해왔던 평택 2공장 신규시설 투자를 재개한다"고 설명했다. 투자금액은 2303억원이다. 2027년 11월 완공이 목표다. 앞서 지난해 10월 두산테스나가 대규모 반도체 테스트 장비 도입 계획을 밝혔을 때, 업계에선 삼성전자의 애플 CMOS 이미지센서(CIS) 수주에 대비한 선제 투자란 풀이가 나왔다. 최근 수년간 애플 아이폰에 탑재하는 이미지센서는 일본 소니가 전량 공급했지만, 삼성전자가 공급망에 다시 진입했다. 삼성전자는 2027년 출시 예정인 애플 아이폰18용 이미지센서 납품이 우선 과제다.

2026.04.29 00:51이기종 기자

"결과만 있고 이유는 없다"...구글 DESIGN.md가 놓친 'AI 디자인' 핵심

구글이 AI 디자인 규격 'DESIGN.md'를 공개하며 표준화 경쟁에 불을 지폈다. 하지만 IBM 리서치 김은수 엔지니어는 "결과(What)는 있지만 이유(Why)는 빠져 있다"고 평가했다. AI의 추론 과정을 인간이 제어하고 검증할 수 있는 '사고의 투명성'이 차세대 디자인 도구의 진정한 승부처가 될 것이라는 설명이다. 구글은 지난 21일 AI 디자인 도구 '스티치(Stitch)'의 핵심 파일 규격인 DESIGN.md를 오픈소스로 공개했다. DESIGN.md는 구글 랩스가 개발한 AI 디자인 도구 '스티치'에서 사용하는 마크다운(markdown) 형식의 파일이다. 제품의 색상, 서체, 컴포넌트 등 디자인 시스템 규칙을 AI 에이전트가 읽을 수 있는 형태로 기록한다. 이에 대해 IBM Research 소속 김은수 UX 엔지니어는 "구글의 이번 발표는 AI를 활용한 디자인 작업에서 각 개인이 각자의 방식으로 풀어오던 숙제를 표준화(standardize)할 수도 있는 중요한 움직임"이라면서도 "그러나 진짜 문제는 아직 풀리지 않았다"는 시각이다. "결과(what)는 기록되지만 이유(because)는 빠져 있다" 김 엔지니어는 지디넷코리아와의 서면 인터뷰에서 "현장에서 디자이너들을 관찰해보면, AI가 만든 결과물이 마음에 들지 않을 때 근본적인 문제는 '결과물의 품질'이 아니라 '바꾸고 싶지 않은 부분까지 함께 바뀌어버리는 것'이었다"고 언급했다. 그는 "예를 들어 AI에게 '사용자 타깃을 초보자로 바꿔달라'고 요청했을 때, 화면 구성만 단순하게 바뀌기를 원했는데 버튼 색상, 레이아웃, 톤앤매너까지 연쇄적으로 달라지는 경우가 많다"며 "AI가 내린 결정들 중 어디까지가 서로 연결돼 있는지가 드러나 있지 않기 때문에, 작은 수정 하나가 예상치 못한 곳에서 문제를 일으킨다"고 지적했다. 이어 "기존 AI 도구들도 중간 과정을 들여다볼 수는 있지만, 그것이 디자인 프로세스 안에 통합돼 있지 않아 '어디까지 바꾸고 어디부터는 지켜야 하는지'를 명시할 방법이 없다"면서 "결국 디자이너는 컨트롤을 포기하고 처음부터 다시 시작하거나, 반대로 AI를 아예 쓰지 않는 쪽을 택하게 된다"고 덧붙였다. DESIGN.md 역시 같은 한계를 공유한다는 것이 김 엔지니어의 분석이다. 그는 "DESIGN.md는 '주요 버튼은 테라코타 색'이라고 기록하지만, 왜 테라코타를 골랐는지, 어떤 조건에서 다시 검토해야 하는지는 담지 않는다"며 "결과는 있지만 이유가 빠져 있는 구조"라고 말했다. "대화는 기록되지만 참조되지 않는다…디자인 결정의 '상시 산출물' 필요" 김 엔지니어는 최근 AI 업계의 움직임 중 앤트로픽의 클로드 디자인 기능을 주목할 만한 진전으로 꼽았다. 디자이너에게 능동적으로 질문을 던지며 중간 결정을 함께 만들어가는 방식이라는 설명이다. 다만 김 디자이너는 "이 대화의 기록이 디자인 프로세스 안에서 언제든 되돌아가 참조하거나 수정할 수 있는 구조화된 산출물로 자리 잡고 있지는 않다"고 첨언했다. 이어 그는 "이러한 중간 결정들이 '상시 참조 가능한 산출물(standing artifact)'로 디자인 프로세스에 자리 잡아야 언제든 되돌아가 읽고 고칠 수 있게 된다"고 설명했다. IBM Research에서 진행해온 멀티 에이전트 기반 디자인 시스템 연구는 이 방향의 한 가지 실마리를 보여준다. 김 엔지니어에 따르면, 여러 AI 에이전트가 사용자 조사, 전략 수립, 시각 디자인, 품질 검토 등을 나눠 맡고 서로 작업을 넘기는 '핸드오프(handoff)' 구간마다, 중간 산출물이 자연스럽게 '인간 개입 지점(human-in-the-loop)'을 만들어낸다. 그는 이를 바탕으로 '읽을 수 있고(legible), 제어 가능하며(controllable), 검증 가능한(verifiable) 추론 체인'이라는 개념을 제시했다. 먼저 ▲인간이 AI의 중간 결정을 읽고 이해할 수 있어야 하고(읽기 가능성) ▲그 결정을 바꾸면 전체 결과물이 재계산돼야 하며(제어 가능성) ▲각 결정이 어떤 근거로 내려졌는지 추적하고 확인할 수 있어야 한다(검증 가능성)는 주장이다. 기존의 human-in-the-loop이 최종 결과물에 대한 검수 단계에 머물렀다면, 이제는 추론 단계 자체를 인간과 AI가 함께 읽고, 제어하고, 검증하는 방향으로 나아가야 한다는 것이다. 김 엔지니어는 이 같은 방향성이 필요한 근본적 이유에 대해 "디자인은 여전히 인간의 의사결정이 필요한 영역이고, 그 판단이 프로세스 곳곳에 영향을 미쳐야 품질 높은 결과물이 나온다"며 "AI를 도입한다고 해서 디자이너의 역할이 줄어드는 것이 아니라, 오히려 어디에서 어떤 판단을 내려야 하는지가 더 명확하게 드러나야 한다"고 강조했다. 그는 구체적 형태에 대한 전망도 내놨다. 김 엔지니어는 "DESIGN.md가 디자인 시스템을 위한 README 파일이라면, 다음에 필요한 것은 '디자인 결정'을 위한 README"라며 "personas.md, journey-map.md 같은 파일들이 인간과 AI의 협업이 수면 위로 드러나는 방식이 될 수도 있다"고 말했다. 이어 "AI 디자인 도구 경쟁의 다음 무대는 더 좋은 픽셀을 만드는 모델이 아니라, 자신의 사고 과정을 읽을 가치가 있게 만드는 도구가 될 것"이라고 내다봤다. ■김은수(Sue Kim) 엔지니어 -現 IBM Research UX 엔지니어 -AI 기반 디자인 도구 및 멀티 에이전트 UX 시스템 연구 -MIT Senseable City Lab 연구 경력 -하버드 디자인 대학원(Harvard GSD) 석사

2026.04.26 09:31백봉삼 기자

클립아트코리아, 'AI 스튜디오' 출시…"AI 이미지 생성부터 편집까지"

스톡 이미지 기업 클립아트코리아가 인공지능(AI) 기반 이미지 생성 및 편집 기능을 결합한 'AI 스튜디오'를 공식 출시했다고 밝혔다. 최근 콘텐츠 제작 과정에서 AI 이미지 생성 수요가 빠르게 증가하고 있지만, 원하는 결과를 얻기 위해 복잡한 프롬프트 작성과 반복적인 수정 작업이 필요하다는 점이 한계로 지적돼 왔다. 클립아트코리아의 'AI 스튜디오'는 이러한 불편을 개선하는 데 초점을 맞췄다. 사용자는 프롬프트 입력을 통해 이미지를 생성하는 동시에, 기존 이미지 편집과 보정 작업까지 하나의 흐름 안에서 처리할 수 있다. 특히 클립아트코리아가 보유한 콘텐츠 라이브러리를 직접 활용할 수 있다는 점이 특징으로 꼽힌다. 일반적인 AI 이미지 생성 서비스가 텍스트 기반으로 결과물을 만드는 것과 달리, 'AI 스튜디오'는 검증된 고품질 이미지를 기반으로 작업이 가능해 보다 안정적이고 완성도 높은 결과물을 빠르게 구현할 수 있다. 이를 통해 사용자는 원하는 구도와 스타일을 보다 정밀하게 반영할 수 있으며, 초기 생성 단계부터 결과물의 품질을 끌어올릴 수 있다. 또한 생성된 이미지에는 이미지 확장, 배경 제거, 화질 개선 등 다양한 편집 기능을 적용할 수 있어 실무 활용도를 높였다. 또한 생성된 이미지에 다양한 편집 기능을 적용할 수 있다. 이미지 확장, 배경 제거, 화질 개선 등의 기능을 통해 결과물을 실무에 바로 활용할 수 있는 수준으로 보완할 수 있다. 해당 서비스는 배너 제작, SNS 콘텐츠, 광고 이미지 제작 등에서 반복적인 작업 시간을 줄이는 데 기여할 것으로 기대되며, 마케팅 담당자와 1인 사업자, 중소기업 등 디자인 리소스가 부족한 사용자에게 특히 유용할 것으로 보인다. 클립아트코리아 관계자는 “AI 스튜디오는 단순 이미지 생성 도구를 넘어 프리미엄 콘텐츠를 기반으로 더 빠르고 안정적인 제작 환경을 제공하는 데 초점을 맞췄다”며 “앞으로도 고품질 콘텐츠와 AI 기술을 결합한 서비스를 지속적으로 확대해 나갈 계획”이라고 밝혔다. 자세한 내용은 클립아트코리아 공식 웹사이트에서 확인할 수 있다.

2026.04.22 09:51이정현 미디어연구소

[AI는 지금] '지브리 풍'이 불붙인 이미지 전쟁…놀이 넘어 비즈니스 격전지로

'덕테이프(Duct Tape)'라는 코드명으로 불린 오픈AI의 새 이미지 생성 모델이 베일을 벗었다. '지브리 풍' 이미지 유행으로 촉발된 인공지능(AI) 이미지 모델 경쟁이 구글 나노바나나, 어도비 서비스 고도화로 이어진 가운데, 오픈AI가 이미지 모델 최초의 '사고(Thinking)' 기능을 탑재한 신모델로 재반격에 나선 모습이다. 오픈AI는 21일(현지시간) AI 이미지 생성 모델의 새 버전 '챗GPT 이미지 2.0'을 출시했다. '이미지젠 2.0' 모델을 기반으로 한 이 서비스는 AI 평가 플랫폼 아레나에서 호평받은 덕테이프의 정식 출시판이다. 핵심 기능은 오픈AI 이미지 모델로선 처음 도입된 사고 기능이다. 이미지 2.0에서 사고 기능을 활성화하면 웹 검색을 통해 최신 정보를 반영하거나 하나의 프롬프트에서 최대 8개의 서로 다른 이미지를 한 번에 생성하고 자체 출력물을 검토하는 것이 가능해진다. 여러 장의 이미지에 걸쳐 인물이나 캐릭터 일관성도 유지할 수 있다. 오픈AI는 연속 만화 페이지, 다양한 종횡비의 소셜 그래픽 세트, 브랜드 포스터 패밀리 등 이전에 번거로웠던 워크플로우를 대폭 간소화할 수 있다고 설명했다. 지식 기준일은 2025년 12월이다. 이미지 2.0은 세밀한 지시 수행, 물체 배치 정확도, 밀집 텍스트 렌더링에서 이전 세대 대비 눈에 띄는 향상을 이뤘다. 응용 프로그램 인터페이스(API) 기준 최대 2K 해상도를 지원하며 3:1에서 1:3까지 다양한 종횡비로 이미지를 생성해 배너·포스터·소셜 그래픽 등 실무 포맷에 바로 적용할 수 있다. 다국어 지원도 강화됐다. 기존 이미지 생성 모델은 영어 및 라틴 문자 계열 언어에선 안정적이었지만 비라틴 문자권 경우 정확도가 떨어진다는 지적을 받아왔다. 이미지 2.0은 일본어·한국어·중국어·힌디어·벵골어 등에서 텍스트가 자연스럽게 흐르는 이미지를 생성할 수 있다고 오픈AI 측은 설명했다. 이미지 2.0은 이날부터 모든 챗GPT 및 코딩 에이전트 코덱스 사용자가 이용할 수 있다. 사고 기능을 활용한 고급 출력은 챗GPT 플러스·프로·비즈니스 사용자에게 제공된다. 개발자는 API를 통해 'gpt-이미지-2' 모델로 동일한 기능을 자사 제품에 적용할 수 있다. 가격은 선택한 품질 및 해상도에 따라 달라진다. AI 이미지 생성 시장 경쟁은 단순한 신모델 출시 경쟁을 넘어 플랫폼 전략 싸움으로 번지고 있다. 지난해 지브리 풍 이미지 열풍이 대중적 관심을 일으키면서 이미지 생성 AI가 놀이 영역을 벗어나 본격적인 제품 경쟁 단계로 접어들면서다. 구글은 지난 2월 나노바나나의 후속작인 나노바나나2(제미나이 3.1 플래시 이미지)를 내놓으며 고품질 추론과 빠른 생성 속도를 결합한 이미지 생성·편집 도구로 밀고 있다. 어도비는 지난달 포토샵 AI 어시스턴트와 파이어플라이 이미지 에디터를 강화한 데 이어, 이달 15일엔 포토샵·프리미어·라이트룸 등 크리에이티브 클라우드 앱 전체를 대화형 인터페이스 하나로 제어하는 '파이어플라이 AI 어시스턴트'를 발표했다. 자체 모델만으로 경쟁하는 대신 경쟁사 모델까지 흡수해 크리에이터 워크플로의 허브가 되겠다는 전략이다. 각사가 지향하는 방향성도 주목된다. 오픈AI는 챗GPT 안에서 바로 쓰는 소비자 경험을, 구글은 빠른 생성 속도와 모델 성능을, 어도비는 크리에이터 친화적 워크플로와 상업적 안전성을 각각 앞세우고 있다. 이미지 품질 경쟁을 넘어 텍스트 정확성, 편집 일관성, 속도, 상업적 활용성을 누가 더 잘 잡느냐의 싸움으로 전선이 확장되는 양상이다. 오픈AI는 공식 페이지를 통해 "이미지는 장식이 아닌 하나의 언어"라며 "아이디어를 이해하고 공유하고 가르치고 구축할 수 있는 결과물로 전환하도록 돕겠다"고 말했다. 이어 "기능과 위험이 진화함에 따라 보호 조치를 지속적으로 강화할 것"이라고 덧붙였다.

2026.04.22 09:47이나연 기자

이미지 번역해도 디자인 안 무너진다…플리토, 원본 살리는 번역 선봬

플리토가 텍스트뿐 아니라 디자인 속성까지 그대로 복원하는 이미지 번역 솔루션을 통해 대량 이미지 번역 시장 공략에 나선다. 플리토는 이미지 내 텍스트를 번역하면서 글씨 색상·테두리 등 디자인 속성까지 복원하는 '이미지 번역 프로'를 출시했다고 20일 밝혔다. 이미지 번역 프로 핵심 기술은 두 가지로 구성된다. 우선 텍스트 속성 인식은 특정 단어에만 적용된 포인트 컬러나 테두리 효과를 정확히 인식해 번역 텍스트에도 동일한 디자인 속성을 복원한다. 스마트 필터링은 제품 용기에 인쇄된 브랜드 로고·텍스트를 OCR 단계에서 자동 제외하고 마케팅 문구만 현지 언어로 번역한다. 브랜드 고유 톤앤매너를 유지하면서 구매 유도 정보만 정확히 전달한다. 처리 속도와 효율도 갖췄다. A4 한 장 분량 기준 약 10초 이내 고품질 번역 이미지를 생성하며, 수동 작업 대비 약 90% 이상의 시간 절감 효과를 제공한다. HTML·JPG·PNG 등 다양한 포맷을 지원해 검색엔진최적화(SEO)에도 활용 가능하다. 플리토는 광학문자인식(OCR)·인페인팅·번역 엔진을 결합한 기술로 대량 이미지 번역 시장을 공략하고 있다. 현재 올리브영·졸스 등 글로벌 뷰티·패션 라이프스타일 플랫폼과 협업 중이다. 최근 중국을 비롯한 크로스보더 전자상거래 기업들의 협업 요청도 급증하고 있다. 이정수 플리토 대표는 "이커머스 브랜드 경쟁력은 미세한 디테일에서 결정되기에 단순 언어 번역을 넘어 브랜드 디자인까지 반영하는 것이 중요하다"며 "문장 속 부분 컬러까지 찾아내는 이미지 번역 프로를 통해 글로벌 셀러들이 언어와 디자인의 장벽 없이 전 세계 고객과 만날 수 있도록 돕겠다"고 말했다.

2026.04.20 16:14이나연 기자

정체불명 이미지 AI '덕테이프'…나노바나나 대항마 될까

오픈AI의 차기 이미지 생성 인공지능(AI) 모델로 추정되는 '덕테이프(Duck-Tape)'가 주목받고 있다. 기존 이미지 생성 AI가 넘지 못했던 한글 렌더링 장벽을 사실상 허문 것으로 평가받으면서다. 19일 업계에 따르면 덕테이프는 AI 블라인드 테스트 플랫폼 '아레나 AI'에서 테스트 중인 이미지 생성 모델이다. 아레나 AI는 이용자가 프롬프트를 입력하면 모델명이 가려진 두 결과물을 비교 평가하는 방식으로 운영된다. 이용자가 선호하는 결과물을 선택한 뒤에야 어떤 모델이었는지 공개된다. 덕테이프가 주목받는 이유는 성능이다. 기존 이미지 생성 AI는 한글이 포함된 이미지를 생성할 때 글자가 깨지거나 뭉개지는 오류가 빈번했다. 덕테이프는 복잡한 한글 문장은 물론 간판, 말풍선, 손글씨 노트까지 오류 없이 구현한다는 평가를 받고 있다. 업계에선 광고 시안 품질이 전문 그래픽 디자이너 수준이라는 반응이 나온다. 업계에선 덕테이프가 오픈AI 차기 이미지 모델의 코드네임일 것으로 확실시하는 분위기다. 오픈AI는 과거에도 새로운 모델을 출시하기 전 아레나 AI 등에 익명으로 모델을 올려 성능을 검증해 왔다. 다만 덕테이프는 코드네임인 만큼 공식 출시 시 실제 모델명은 달라질 수 있다. 이미지 생성 기능은 AI 서비스 점유율 경쟁의 핵심 전선이다. 오픈AI는 지난해 상반기 챗GPT를 활용한 일본 지브리풍 이미지 제작이 온라인을 중심으로 유행하면서 유료 가입자를 단기간에 수백만 명 늘렸다. 구글 딥마인드도 지난해 8월 '나노바나나 프로'를 공개하면서 제미나이 신규 이용자 1000만 명을 끌어모았다. 이후 2억 건 이상의 이미지 편집이 이뤄지며 앱스토어 1위에 오르기도 했다. 오픈AI는 연내 기업공개(IPO)를 앞두고 실적 반등이 절실한 상황이다. 오픈AI는 지난달 AI 영상 생성 도구 '소라' 서비스를 전격 종료했다. 소라는 하루 최대 1500만 달러의 추론 비용을 소진하면서도 전체 서비스 기간 수익은 210만 달러에 그쳤다. 최근엔 소라 팀을 이끌었던 빌 피블스, 최고제품책임자(CPO) 출신의 케빈 웨일 부사장 등 핵심 임원들이 잇따라 이탈하며 내부 불안감도 커지고 있다. 개발자 피터 레벨스는 X(옛 트위터)에 덕테이프 모델이 "세계 지식 이해도가 극히 높고 텍스트 렌더링이 뛰어나다"며 나노바나나 프로를 능가할 수 있다고 말했다.

2026.04.19 20:00이나연 기자

에이수스, 소니 이미지 갤러리에 전문가용 모니터 출품

에이수스코리아는 21일까지 진행되는 '소니 이미지 갤러리 ' 전시회에 전문가용 프로아트 모니터를 출품한다고 밝혔다. '소니 이미지 갤러리 '는 작년 7월 이후 소니코리아가 진행하는 세 번째 전시회다. 서울 한강 노들섬 소재 '노들갤러리' 내 공간에서 국내 사진·영상 작가 작품 활동 지원 프로그램 '소니 아티잔' 소속 작가 10명이 고성능 풀프레임 미러리스 카메라인 알파1 Ⅱ·알파7 Ⅴ로 촬영한 사진을 볼 수 있다. 에이수스코리아는 작년 첫 전시에 이어 올해도 전시회 내 체험공간에서 전문가용 모니터인 프로아트 PA278CFRV 시연과 할인판매를 진행한다. 프로아트 PA278CFRV는 27인치 QHD(2560×1440 화소) 디스플레이 패널에 안티글레어·저반사 필름을 적용해 장시간 작업시 눈 피로를 줄였다. 최대 화면주사율은 100Hz이며 색상 정확도를 높이기 위해 생산 과정에서 색 편차를 보정했다. sRGB 색공간은 100%, DCI-P3 색공간은 95% 충족한다. 에이수스코리아 관계자는 "소니코리아와 지속적인 협업으로 프로아트 모니터가 다양한 전문 분야 종사자들에게 인지도를 얻고 가치가 확산될 것으로 기대한다"고 밝혔다.

2026.04.09 08:56권봉석 기자

색상 코드·캐릭터 눈 모양까지…알리바바, AI 이미지 정밀도 한 단계 올렸다

알리바바 그룹이 브랜드 색상 코드부터 캐릭터 세부 특징까지 정밀 제어할 수 있는 인공지능(AI) 이미지 모델로 크리에이터 시장을 공략한다. 알리바바 그룹은 이미지 생성 및 편집 기능을 고도화한 통합 AI 모델 '완(Wan)2.7 이미지'를 2일 출시했다고 밝혔다. 이 모델은 기존 AI 이미지 생성 모델의 획일적 스타일과 예측하기 어려운 색상 결과물 문제를 개선한 것이 특징이다. 크리에이터들이 시행착오를 줄이면서 전문적인 맞춤형 결과물을 구현할 수 있도록 설계됐다. 핵심 개선 사항은 개인화와 색상 제어다. 골격 구조나 눈 모양 등 세부 특징을 정밀하게 조정해 프로젝트별로 차별화된 캐릭터를 만들 수 있다. 새로운 '컬러 팔레트' 기능을 통해 프롬프트에 특정 색상 코드와 비율을 입력하는 것만으로 복잡한 예술적 스타일이나 브랜드 고유 색상을 정확하게 반영할 수 있다. 텍스트 렌더링 성능도 강화됐다. 긴 맥락 학습 구조를 기반으로 최대 3000토큰의 텍스트 입력을 지원하며 12개 언어로 인쇄 품질의 학술 텍스트와 복잡한 수식·표 생성이 가능하다. 최대 9개의 레퍼런스 이미지를 활용하고 한 번에 최대 12개의 이미지를 생성해 스토리보드, 건축 렌더링, 이커머스 캠페인 제작에도 쓸 수 있다. 직관적인 '클릭 편집' 인터페이스로 특정 영역을 선택해 픽셀 단위로 요소를 추가·이동·정렬하는 것도 가능하다. 익명으로 진행된 사용자 선호도 테스트에 따르면 시각적 완성도, 텍스트 렌더링, 복잡한 시각 개념 이해도 부문에서 업계 주요 모델들을 앞서는 성능을 보였다고 회사 측은 밝혔다. 함께 공개된 '완2.7 이미지 프로'는 안정적인 이미지 구성과 프롬프트에 대한 정밀한 이해, 고해상도 4K 출력을 지원한다. 두 모델 모두 알리바바클라우드의 AI 개발 플랫폼 모델 스튜디오와 완 공식 웹사이트를 통해 이용·배포할 수 있다. 알리바바의 AI 애플리케이션 큐원 앱에도 통합될 예정이다. 알리바바클라우드는 "완 시리즈는 2023년 첫 공개 이후 지속적인 고도화를 거듭했다"며 "AI 기반 멀티미디어 기술 분야에서 우리 기술 경쟁력과 개발 역량을 잘 보여준다"고 강조했다.

2026.04.02 17:10이나연 기자

소니코리아, 8일부터 2주간 노들섬서 사진전 진행

소니코리아가 오는 8일부터 21일까지 2주간 서울 한강 노들섬 소재 '노들갤러리'에서 '소니 이미지 갤러리 ' 전시회를 진행한다. 소니코리아는 작년 7월 '풀프레임으로 담은 세상'을 주제로 첫 전시회를 개최한 바 있다. 이어 11월에는 '단 하나의 카메라'를 주제로 풀프레임 하이엔드 카메라 RX1R Ⅲ로 기록한 사진을 소개했다. 올해 3회를 맞은 소니 이미지 갤러리에는 국내 사진·영상 작가 작품 활동 지원 프로그램 '소니 아티잔' 소속 작가 10명이 알파1 Ⅱ·알파7 Ⅴ로 촬영한 사진을 전시한다. 참여 작가가 각자의 언어로 기록한 10개 작품을 통해 작가들의 섬세한 시선과 영감을 확인할 수 있다. 행사장에서는 소니코리아 공식 인스타그램에서 진행한 사진전 '마이알파365' 선정작으로 구성된 2026년 일력을 전시한다. 현장 참관객 대상으로 직접 찍은 사진을 엡손 고화질 포토프린터로 인쇄해 직접 전시할 수 있는 기회도 제공한다. 9일부터는 한윤승 작가를 시작으로 소니 아티잔 소속 작가들이 하루에 두 번, 최대 30명 대상으로 사진 여정을 공개하는 토크쇼도 진행된다. 소니 이미지 갤러리 은 노들갤러리 2관에서 8일부터 21일까지 진행된다. 운영시간은 오전 10시부터 오후 8시까지이며 매주 월요일은 휴관한다. 행사 개요는 소니 알파 웹사이트에서 확인할 수 있다.

2026.04.01 11:27권봉석 기자

클립아트코리아, PSD 변환 번거로움 없앤 '피그마 전용 템플릿' 공개

스톡 이미지 기업 클립아트코리아가 디자인 워크플로우 효율을 높이는 '피그마(Figma) 전용 디자인 템플릿'을 공식 출시했다고 1일 밝혔다. 그동안 디자이너들은 기존 스톡 업체들이 제공하는 PSD 형식의 아이콘 및 그래픽 소스를 피그마로 옮기는 과정에서 불편을 겪어왔다. 포토샵에서 파일을 열어 개별 아이콘을 추출하거나, 피그마로 불러온 뒤 깨진 레이어를 정리하는 등 번거로운 수작업이 필요했기 때문이다. 클립아트코리아가 이번에 선보인 서비스는 이런 비효율적인 과정을 없앤 것이 특징이다. 기존 PSD 형태로 제공되던 프리미엄 콘텐츠를 피그마 전용 파일 형식(.fig)으로 제공해 별도의 변환 과정 없이 복사•붙여넣기만으로 즉시 실무에 활용할 수 있도록 했다. 특히 이번 서비스는 피그마 활용도가 높은 모바일 UI 콘텐츠를 중심으로 구성됐다. 실무에서 바로 적용 가능한 모바일 페이지 단위의 UI 키트(UI Kit)를 제공함으로써 기획자와 디자이너 간 협업 효율을 높이는 데 중점을 뒀다. 클립아트코리아는 이번 출시를 시작으로 아이콘, 팝업 디자인, 웹 템플릿 등 피그마 전용 에셋 라인업을 순차적으로 확대할 계획이다. 클립아트코리아 관계자는 “기존에는 스톡 소스를 활용하기 위해 여러 툴을 오가야 했지만, 이제는 피그마 환경 내에서 모든 작업을 완료할 수 있다”며 “앞으로도 디자이너들이 현장에서 겪는 불편을 세심하게 반영해 누구나 쉽고 편리하게 창작할 수 있는 서비스를 선보이겠다”고 말했다. 자세한 내용은 클립아트코리아 공식 웹사이트에서 확인할 수 있다.

2026.04.01 10:49이정현 미디어연구소

[AI는 지금] "이미지도 자체 기술로"…脫 오픈AI 노린 MS, 멀티모달 경쟁 본격화

마이크로소프트(MS)가 자체 개발한 이미지 생성 모델 '마이(MAI)-이미지-2'를 최근 공개하며 인공지능(AI) 시장 주도권 확보 경쟁에 본격적으로 나섰다. 오픈AI 등 외부 모델 의존에서 벗어나 기술 내재화를 추진하는 동시에 코파일럿 중심 생태계를 강화하려는 전략적 행보로 풀이된다. 27일 업계에 따르면 MS는 지난 19일 자사 AI 슈퍼인텔리전스 팀이 개발한 텍스트-이미지 변환 모델 '마이-이미지-2'를 공개했다. 해당 모델은 성능 평가 플랫폼 아레나 리더보드에서 상위권에 오르며 구글, 오픈AI와 함께 글로벌 이미지 생성 경쟁 구도에 진입했다. 이번 모델은 무스타파 술레이먼 MS AI 최고경영자(CEO)가 이끄는 초지능 팀에서 개발됐다. MS는 이를 통해 이미지 생성 분야에서도 독자 기술 기반을 강화하겠다는 방침이다.술레이먼 CEO는 "우리는 이 모델 출시로 세계 3대 텍스트 이미지 변환 연구소로 도약하게 됐다"며 "초지능 팀은 앞으로 더 많은 것을 선보일 예정인 만큼 기대해 달라"고 밝혔다.이처럼 MS가 자체 모델을 전면에 내세운 것은 오픈AI에 대한 의존도를 낮추려는 전략으로 분석된다. MS는 그간 오픈AI에 대규모 투자를 단행하며 협력 관계를 유지해왔지만, 핵심 AI 기능을 외부에 의존할 경우 비용 부담과 서비스 통제력에 한계가 있다는 평가를 받아왔다. 이에 MS는 자체 모델 확보를 통해 비용 구조를 개선하고 기능, 정책, 업데이트 방향을 독자적으로 설계할 수 있는 기반 마련에 본격 나선 것으로 보인다. 기술 경쟁 측면에서는 멀티모달 AI 시장을 겨냥한 행보로 읽힌다. 최근 AI 산업은 빅테크를 중심으로 텍스트에서 이미지, 음성, 영상까지 아우르는 멀티모달로 빠르게 확장되고 있다. 단일 모델이 다양한 형태의 데이터를 이해하고 생성하는 능력도 플랫폼 경쟁력의 핵심 요소로 자리잡고 있다. 시장 성장세도 가파르다. 글로벌 시장조사업체 그랜드뷰리서치는 멀티모달 AI 시장이 2024년 약 17억3000만 달러에서 2030년 108억9000만 달러 규모로 확대될 것으로 내다봤다. 또 콘텐츠 제작, 광고, 게임, 커머스 등 산업 전반에서 시각 콘텐츠 자동화 수요가 급증하고 있어 멀티모달 영역이 향후 핵심 성장 축이 될 것으로 관측됐다. 이 같은 분위기에 맞춰 MS는 '마이-이미지-2'를 앞세워 멀티모달 시장 내 주도권을 잡기 위해 속도를 낼 것으로 보인다. '마이-이미지-2'는 자연광과 질감, 공간감을 정교하게 구현하는 사실감은 물론, 이미지 내 긴 문장과 복잡한 타이포그래피를 안정적으로 생성하는 기능을 핵심 경쟁력으로 내세웠다. 이는 기존 이미지 생성 모델의 한계로 지적되던 텍스트 표현 문제를 개선한 것으로, 디자인·콘텐츠 제작 영역까지 활용 범위를 넓힐 수 있다는 점에서 주목된다. 제품 전략 측면에서는 코파일럿 생태계와의 결합이 눈에 띈다. MS는 해당 모델을 '코파일럿'과 '빙' 이미지 생성기에 단계적으로 적용할 계획이다. 워드, 파워포인트 등 생산성 도구와 연계될 경우 문서 작성 과정에서 이미지 생성이 기본 기능으로 자리잡을 가능성이 높다. 이는 텍스트 중심 생산성 도구를 멀티모달 플랫폼으로 확장하려는 시도다. 기업 시장 공략도 병행된다. MS는 현재 일부 기업 고객을 대상으로 API를 제공하고 있으며 향후 마이크로소프트 파운드리를 통해 개발자 접근성을 확대할 예정이다. 또 광고·마케팅 기업 등 대량 이미지 생성 수요를 겨냥해 이미지 AI를 산업용 생산 도구로 확장하기 위해 적극 나설 것으로 보인다. 다만 현재 서비스는 기능과 정책 측면에서 일부 제약이 있다. 생성 속도 지연과 사용 횟수 제한, 이미지 비율 고정, 편집 기능 부재 등이 대표적이다. 콘텐츠 필터링 기준도 비교적 엄격하게 적용되고 있다. 이는 기업용 서비스에서 요구되는 안정성과 리스크 관리를 반영한 설계로 해석된다. 업계 관계자는 "MS가 이미지 생성까지 자체 모델로 내재화하면서 AI 경쟁의 판이 텍스트에서 멀티모달 전반으로 빠르게 확장되고 있다"며 "향후 플랫폼 주도권은 얼마나 다양한 데이터를 하나의 경험으로 통합하느냐에 달려 있을 것"이라고 말했다.

2026.03.27 15:56장유미 기자

멀티모달 AI '망각 현상' 외부저장법으로 해결했다…성능도 2배 개선

국내 연구진이 AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 문제를 원천적으로 해결했다. 지식 편집 성능도 2배이상 개선했다. 한국전자통신연구원(ETRI)은 임수종 언어지능연구실장 연구팀이 POSTECH(포항공대), 성균관대학교와 공동으로 '연속·복합 지식 편집 원천 기술(MemEIC)'을 개발했다고 24일 밝혔다. 이 기술은 지난해 미국 샌디에이고에서 열린 세계적인 인공지능 학술대회 '뉴립스(NeurIPS) 2025'에 채택, 공개됐다. 최근 챗GPT, 제미나이, 클로드 등 이미지와 텍스트를 동시에 이해하는 멀티모달 AI가 빠르게 확산되고 있다. 그러나 이들에는 맹점이 있다. AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 현상이 발생한다. 특히 시각 정보와 언어 정보를 동시에 수정해야 하는 경우 두 종류의 지식이 서로 섞이면서 AI가 제대로 이해하지 못해 복합적인 질문에 틀린 답을 내놓는 경우가 빈번하게 나타났다. 연구팀이 이 같은 문제를 해결할 지식 편집 AI 기술을 공개했다. 이 기술은 새로운 정보를 AI 내부가 아닌 외부 메모리(보조기억장치)에 저장한다. 필요할 때만 정보를 불러와 사용하기 때문에 기존 모델 안정성을 유지하면서도 새로운 정보를 유연하게 추가할 수 있다. 기존 방식에서는 AI 내부의 핵심 파라미터를 직접 수정해 지식을 바꾸는 방식이 주로 사용됐다. 이로 인해 지식을 수정하는 과정에서 기존에 저장된 정보까지 영향을 받을 수 있다는 한계가 있었다. 논문 주저자인 성진 언어지능연구실 연구원은 "사람의 뇌가 좌우로 나뉘어 서로 다른 역할을 하듯 AI도 지식을 나누어 저장하도록 만든 것"이라고 말했다. 성진 연구원은 상용화 관련 "메믹이 기존 기술 대비 우수한 성능을 나타내지만, 실사용을 위해선 정확도가 90% 정도는 되어야 한다고 본다"며 "올해 말 기술이전이 이루어질 것으로 예상한다"고 덧붙였다. 이미지 관련 시각 정보는 '시각 어댑터'에 저장하고, 텍스트 관련 언어 정보는 '언어 어댑터'에 각각 독립적으로 저장한다. AI가 이미지와 텍스트를 함께 이해해야 하는 복합적인 질문을 받으면 '지식 커넥터'가 두 정보를 문맥에 맞게 연결해 답을 만든다. 연구진은 기술 성능 확인을 위해 1,278개 항목으로 구성된 복합 지식 편집 벤치마크(CCKEB)를 구축하고, 수백 건의 지식을 순차적으로 편집하는 실험을 진행했다. 그 결과 이 기술은 복합 질문 정확도가 70% 수준으로 나타냈다. 이는 기존 기술들이 36~52% 수준이었던 것과 비교하면 두 배 이상 향상된 성능이다. 또한 새로운 지식을 추가한 뒤에도 기존 질문에 대한 답이 변하지 않아 응답 안정성이 유지되는 '지역성(Locality)' 보존 특성도 확인됐다. 임수종 언어지능연구실장은 “향후 산업 현장의 다양한 정보를 안정적으로 반영할 수 있도록 기술을 더욱 고도화할 것"이라고 덧붙였다.

2026.03.24 09:39박희범 기자

트웰브랩스, 게티이미지코리아에 영상 AI 검색 적용

트웰브랩스가 글로벌 스톡 플랫폼에 인공지능(AI) 영상 검색 기술을 제공했다. 트웰브랩스는 게티이미지코리아 게티이미지 뱅크에 영상 이해 AI 모델 '마렝고'를 공급했다고 23일 밝혔다. 이를 통해 약 10만 고객이 AI 기반 검색 기능을 활용할 수 있다. 이번 서비스는 기존 키워드 중심 검색에서 벗어나 영상 맥락과 의미를 이해하는 방식으로 전환된 것이 핵심이다. 이용자는 구체적인 문장 설명만으로 원하는 장면을 검색할 수 있다. 시스템은 시각 정보와 음성, 자막을 종합 분석해 결과를 제시한다. 그동안 게티이미지 등 스톡 미디어 플랫폼은 메타데이터와 태그 기반 검색에 의존했다. 콘텐츠는 급증했지만 검색 방식은 제한적이었고, 반복적인 필터링 작업이 필요했다. 이번 기술 도입으로 검색 구조 자체가 변화하며 제작 과정의 탐색 시간이 줄어들 것으로 예상된다. 마렝고는 영상 내 다양한 정보를 통합 분석하는 멀티모달 AI 모델이다. 단순 객체 인식을 넘어 장면 흐름과 의미를 이해하고 검색, 분류, 요약까지 수행할 수 있다. 글로벌 시장에서도 기술력을 인정받아 아마존웹서비스(AWS) 아마존 베드록에도 공급됐다. 트웰브랩스 이재성 대표는 "우리 영상 이해 AI 기술이 실제 서비스에 적용돼 사용자 가치를 창출하게 된 의미 있는 사례"라며 "앞으로도 미디어 산업에서 AI가 만들어내는 혁신적인 변화를 선도해 나가겠다"고 밝혔다.

2026.03.23 10:13김미정 기자

Prev 1 2 3 4 5 Next