• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이미지'통합검색 결과 입니다. (90건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

삼성전자, 애플에 이미지센서 첫 공급…美 오스틴 팹서 양산

삼성전자가 미국 오스틴 파운드리 팹에서 애플의 차세대 이미지센서를 양산할 계획이다. 삼성전자가 이미지센서를 애플에 공급하는 것은 이번이 처음으로, 그간 일본 소니가 독점해 온 공급망 구도를 깬다는 점에서 의미가 있다는 평가가 나온다. 6일(현지시간) 애플은 공식 보도자료를 통해 "텍사스 오스틴에 있는 삼성전자 파운드리 팹에서 세계 최초로 적용되는 신기술 기반의 반도체 생산을 위해 협력하고 있다"고 밝혔다. 이번 발표는 애플이 미국 내 1천억 달러 규모의 신규 투자 계획을 설명하는 가운데 나온 것이다. 애플은 "이 기술을 미국에 먼저 도입함으로써 전 세계에 출하되는 아이폰을 포함한 애플 제품의 전력 소비 및 성능을 최적화하는 반도체를 공급하게 될 것"이라고 밝혔다. 애플이 언급한 반도체는 CIS(CMOS 이미지센서)로 분석된다. CIS는 렌즈를 통해 들어오는 빛을 전기적인 영상 신호로 바꿔 주는 시스템 반도체로, 스마트폰의 핵심 요소 중 하나다. 그간 애플은 일본 소니로부터 CIS를 전량 수급해 왔다. 그러나 내년, 혹은 내후년께 양산되는 차세대 아이폰부터는 CIS 공급망이 소니와 삼성전자로 이원화될 전망이다. 반도체 업계 관계자는 "삼성전자와 애플이 지난해부터 CIS 공급과 관련해 긴밀히 협의해왔다"며 "당장의 공급량은 크지 않을 것으로 보이나, 이르면 내년부터 양산을 시작할 수 있을 것"이라고 밝혔다. 이에 대해 삼성전자 측은 "고객사와 관련된 사항은 확인해줄 수 없다"고 밝혔다.

2025.08.07 08:23장경윤

네이버, 이미지 검색에 AI 적용..."핵심 내용만 알려드려요"

네이버는 스마트렌즈에 이미지와 텍스트를 함께 이해하는 인공지능(AI)을 적용한 '렌즈 x AI 브리핑'을 지난 31일 출시했다고 1일 밝혔다. 해당 기능은 사용자가 스마트렌즈로 ▲식물 ▲와인 ▲패션 아이템 등 이미지를 입력하면 AI가 이를 분석해 관련성 높은 문서를 찾고 핵심 내용을 요약해 제공한다. 기존에는 이미지 검색 결과를 유사 이미지나 지식백과 위주로 제공했었다. 예를 들어 스마트렌즈로 꽃을 촬영하면 다양한 출처의 콘텐츠들을 분석해 ▲꽃의 이름 ▲개화 시기 ▲특징 ▲꽃말 ▲관리법 등 핵심 정보들을 제공한다. 와인 라벨을 촬영하면 ▲품종 ▲생산지 ▲페어링 등 다양한 정보를 한눈에 확인할 수 있고 코디나 패션 아이템 이미지도 AI 브리핑을 통해 ▲제품 정보 ▲브랜드 ▲스타일 특징 등의 정보를 확인할 수 있다. 네이버는 기존 텍스트 중심의 AI 브리핑을 이미지 검색까지 확장하는 동시에 AI 브리핑 적용 범위를 지속 확대하며 일상 속 정보 탐색을 더욱 편리하게 발전시켜 나갈 계획이다. 김상범 네이버 검색 플랫폼 리더는 “렌즈 x AI 브리핑은 사용자가 이미지만 촬영해도 AI가 관심 있는 정보를 빠르게 요약해주는 것이 핵심이며 기존 텍스트 중심의 AI 브리핑이 이미지 검색으로도 확장한 사례”라며 “앞으로도 다양한 탐색 상황에서 네이버 검색이 'AI 에이전트'로써 편리함을 제공할 수 있도록 지속적으로 고도화해 나가겠다”고 말했다.

2025.08.01 10:57박서린

네이버, 플레이스에 AI 접목한 이미지 필터 적용

네이버(대표 최수연)는 플레이스에 인공지능(AI)을 접목한 이미지 필터를 새롭게 선보인다고 18일 밝혔다. 네이버는 플레이스 상세페이지의 사진 탭에 AI 기술을 도입해 하위 이미지 필터를 고도화했다. 이미지 필터는 ▲내부 ▲외부 ▲음식·음료 등 장소의 세부 주제에 대한 이미지들을 분류해 노출하는 기능이다. AI 기술이 활용돼 더욱 정확도 높고 세분화된 이미지 탐색이 가능해졌다고 네이버는 설명했다. 장소의 업종에 따라 사용자들이 자주 찾는 정보를 반영한 맞춤형 필터들이 적용된다. 식당의 경우 ▲음식·음료 ▲메뉴 ▲풍경 등의 하위 필터가 적용되며, 숙박 시설은 ▲객실 ▲전망 ▲수영장 등의 테마, 미용실의 경우 ▲커트 ▲펌 ▲염색 ▲남성 등 테마에 따라 AI가 이미지를 분류해 제공한다. 이외에도 네일샵, 골프장 등 업종에 대해 맞춤 테마가 노출된다. 또 새롭게 업데이트된 필터에서는 AI가 이미지의 특성을 분석해 테마별로 적합한 이미지들을 분류해 제공한다. 최지훈 네이버 플레이스 검색&콘텐츠 총괄 리더는 “업종에 따라 맞춤형으로 제공되는 다양한 테마를 AI가 학습해 이미지 분류의 정확도를 향상했다”며 “향후에도 서비스 전반에 AI 기술을 접목해 더욱 고도화된 장소 탐색 경험을 제공할 것”이라고 말했다.

2025.07.18 10:13박서린

소니코리아 노들섬 사진전 개막 "전문 작가·일반인 작품 한 곳에"

17일 오후 서울 노들섬 노들갤러리 1관. 전시장 입구를 들어서자마자 눈에 띄는 것은 소니 풀프레임 미러리스 카메라의 진화사다. 2013년 출시한 '알파7/7R'부터 2021년 출시한 5천만 화소 미러리스 카메라 '알파1'까지 주요 제품이 출시 순으로 전시됐다. 이 전시물은 소니코리아가 오늘(17일)부터 30일까지 14일간 진행하는 '소니 이미지 갤러리 ' 전시 중 하나다. 소니코리아가 일반 소비자 대상 오프라인 행사를 진행하는 것은 코로나19 범유행 이후 5년만에 처음이다. 전문 작가 작품 16점 대형 패널로 전시 이번 전시회는 노들갤러리 1관 공간을 총 세 구역으로 나눠 활용했다. 존1과 존2에는 소니 풀프레임 미러리스 카메라의 해상력과 신규 렌즈로 촬영한 전문 작가 작품, 일상과 여행을 주제로 한 사진 등 전문 작가 작품 16점을 배치했다. 존1과 존2 감상을 마치면 일반 이용자가 직접 찍은 사진을 볼 수 있다. 이 사진은 소니코리아 공식 인스타그램이 매달 진행하는 사진전 '마이알파365'에서 당선된 작품이다. 사진전에 전시된 모든 사진에는 촬영 카메라 본체(바디)와 렌즈 정보, 조리개값과 셔터 속도, ISO 감도 등 촬영 정보도 제시했다. 엡손 포토프린터로 스마트폰 사진 고화질 인쇄 전시회 출구에는 소니 알파 미러리스 카메라 체험 코너, 현장에서 소니코리아 공식 유튜브 채널을 팔로우한 관람객 대상으로 전문가용 포토프린터를 활용한 인화 서비스가 운영된다. 카카오톡을 이용한 연동 인쇄 서비스 '엡손 프린톡' 채널을 추가한 다음 스마트폰 사진을 보내면 현장 PC와 연결된 6색 염료잉크 탑재 포토 프린터 'L18050'으로 인쇄한다. 출력물 두 장 중 한 장은 '모두의 소니 이미지 갤러리'에 전시한다. 지난 3월 말 출시된 사진·영상 제작자를 위한 에이수스 모니터 '프로아트 PA278CFRV'도 전시됐다. 안티글레어·저반사 필름을 적용한 27인치 QHD(2560×1440 화소) 패널 기반 제품으로 공장 출하시 색 보정을 마쳤다. "주말마다 전시 참여 작가 강연도 진행 예정" 이날 현장에서 만난 에이수스코리아 관계자는 "프로아트 모니터는 다양한 색공간 지원, 공장 출하시 색 조정 등 여러 특징을 지녔지만 국내 시장 인지도가 낮다. 올 4분기 이후 소니 이외 다른 카메라 제조사와 비슷한 방식으로 협업 기회를 늘릴 것"이라고 말했다. 소니코리아 관계자는 "최근 글로벌 공개된 6천100만 화소 풀프레임 콤팩트 카메라 'RX1R M3'를 내일(18일)부터 현장에 전시하는 한편 매 주말마다 전시 참여 작가의 강연을 진행 예정"이라고 설명했다.

2025.07.17 15:46권봉석

EUV 공정서 수천억 손실 막는다...반도체 '톱5' 중 4곳이 쓴다는 '이것'

반도체 공정이 2나노미터(nm) 수준까지 미세화되면서, 기존 공정 제어로는 해결할 수 없는 '스토캐스틱(Stochasitcs)' 문제가 대두되고 있다. 해당 오류는 EUV(극자외선) 공정 팹(Fab) 당 수천억원 규모의 수율 손실을 일으킬 수 있는 것으로 알려졌다. 미국 소프트웨어 기업 프랙틸리아는 독자 알고리즘을 기반으로 스토캐스틱 문제를 해결할 수 있는 솔루션을 보유하고 있다. 실제로 현재 상위 5대 반도체 기업 중 4곳이 프랙틸리아의 솔루션을 도입한 상황이다. High-NA(고개구수) EUV 등 차세대 공정에도 이미 활용되고 있다. 프랙틸리아는 16일 국내에서 기자간담회를 열고 반도체 수율 혁신을 위한 기술 로드맵을 발표했다. 스토캐스틱 못 잡으면 EUV 공정서 '수천억원' 손실 스토캐스틱은 원자 수준의 미세한 패터닝 오류를 뜻한다. 노광 공정(반도체에 회로를 새기는 공정)에 활용되는 광자·감광액(PR) 등 여러 소재를 완벽하게 정밀 제어할 수 없기 때문에, 실제 양산 과정에서 무작위적으로 발생하게 된다. 스토캐스틱은 특히 EUV 등 초미세 공정에서 심각한 문제로 떠오르고 있다. 반도체 회로 선폭이 최소 3~2나노미터까지 줄어들면서, 미세한 결함으로도 반도체 수율이 저하되는 현상이 대두됐기 때문이다. 이로 인해 팹당 수천억원 규모의 수율 손실, 초미세 공정 전환의 지연 등이 발생하고 있다는 게 프랙틸리아의 입장이다. 에드웨드 샤리에 프랙틸리아 최고경영자(CEO)는 "연구개발 단계에서는 최소 12나노의 피처(웨이퍼 상의 미세한 구조물) 구현이 가능하나, 실제 양산에서는 보통 16~18나노 수준의 피처만 안정적으로 생산할 수 있어 스토캐스틱의 해상도 격차 문제가 발생하게 된다"며 "만약 스토캐스틱을 줄이고자 피처 사이즈를 키우면, 칩 면적이 2배까지 증가해 제품 생산성이 떨어지게 된다"고 설명했다. 독자 알고리즘으로 스토캐스틱 정밀 측정 이에 프랙틸리아는 주사전자현미경(SEM) 이미지에서 고정밀 데이터를 추출해 스토캐스틱을 정확히 측정할 수 있는 소프트웨어 'FAME(Fractilia Inverse Linescan Model)를 개발해냈다. 일반 SEM은 노이즈(잡음) 현상이 발생해, 정밀한 이미지를 얻을 수 없다는 단점이 있다. 예를 들어 SEM 이미지 상에 검은 반점이 보이는 경우 이것이 실제 패터닝 오류인지, SEM에서 발생한 노이즈인지 구분하기가 어렵다. 반면 프랙틸리아의 FAME은 SEM 이미지에서 고정밀 데이터를 추출하는 물리 기반 알고리즘을 활용해, 실제 피처(웨이퍼 상의 미세한 구조물)와 노이즈를 정확히 구분 및 제거할 수 있다. 해당 알고리즘은 프랙틸리아의 독자적인 특허 기술이다. 이를 통해 반도체 제조업체들은 보다 정확한 공정 진단 및 개선이 가능해진다. 상위 5대 반도체 기업 중 4곳 채택…"High-NA EUV서도 활용" 이 같은 장점 덕분에, 프랙틸리아의 FAME 솔루션은 상위 5대 반도체 소자업체 중 4곳, 5대 부품업체 중 4곳, 12개 이상의 감광액 제조사, 유럽 주요 반도체연구소인 아이멕(Imec)에 도입되고 있다. 구체적인 고객사 명을 밝히지는 않았으나, 국내 반도체 기업들과도 긴밀한 협의를 진행 중인 것으로 관측된다. 현재 국내 삼성전자, SK하이닉스 등 주요 반도체 기업들은 EUV를 활용해 첨단 시스템반도체 및 메모리반도체를 제조하고 있다. 향후 High-NA EUV가 도입되는 시점에서 프랙틸리아 솔루션의 중요도는 더욱 높아질 전망이다. High-NA EUV는 EUV에서 성능을 한 차례 더 끌어 올린 기술이다. NA는 렌즈 수차로, 해당 수치를 높일 수록 해상력이 향상된다. 기존 EUV의 렌즈 수차는 0.33로, High-NA EUV는 0.55로 더 높다. 덕분에 High-NA EUV는 2나노 이하의 차세대 파운드리 공정에 적용될 것으로 기대되고 있다. 크리스 맥 프랙틸리아 최고기술책임자(CTO)는 "스토캐스틱은 High-NA EUV에서 더 중대한 문제가 될 수 있다"며 "해당 기술을 도입하려는 고객사들이 프랙틸리아의 솔루션에 많은 관심을 가지고 있고, 실제로 이를 도입해 활용 중"이라고 말했다.

2025.07.16 15:38장경윤

텍스트 입력만으로 3차원 영상 분할·편집 가능해져

건국대학교 공과대학 김원준 교수(전기전자공학부) 연구팀이 개발한 '고성능 개방형 어휘 3차원 영상 분할 알고리즘'이 컴퓨터 비전·인공지능(AI) 분야 세계 최고 권위 학술대회 중 하나인 국제 컴퓨터 비전학회(ICCV 2025)에서 공개된다고 9일 밝혔다. 연구팀은 텍스트 입력만으로 3차원 영상 내에서 사용자가 원하는 객체를 정밀하게 분할하고 편집할 수 있는 개방형 어휘 기반 3차원 영상 분할 기술을 구현했다. 논문은 오는 10월 미국 하와이에서 열리는 'ICCV 2025'에서 소개될 예정이다. 이번 연구는 서로 다른 시점에 존재하는 객체에 대한 언어 임베딩의 일관성을 유지하면서, 새로운 시점의 이미지를 생성할 수 있도록 언어 임베딩과 가우시안 스플래팅 파라미터를 동시에 학습하는 전략을 새롭게 제안한 것이 핵심이다. 또 대조적 학습 기법을 접목해 새로운 시점 이미지 내 객체 검출 성능을 향상시켰다. 연구팀은 정밀한 3차원 장면 렌더링은 물론, 생성된 이미지 상에서 텍스트 명령어를 기반으로 사용자 지정 객체 분할과 편집이 가능해졌다고 전했다. 이 기술은 앞으로 3D 콘텐츠 생성, 3차원 장면 이해, 이머시브 서비스 분야 등에서 활용할 수 있다. 이번 논문 제1저자는 건국대학교 장성민 석사과정생이며, 교신저자는 김원준 교수다. 연구는 과학기술정보통신부의 연구비 지원을 받아 수행됐다. 논문 제목은 'Identity-aware language Gaussian splatting for open-vocabulary 3D semantic segmentation'이다.

2025.07.09 08:04주문정

클립아트코리아, 디자인 편집툴 '에디터' 출시

국내 최대 스톡 이미지 기업 통로이미지가 이미지 플랫폼 '클립아트코리아'에 디자인 편집툴 '에디터(Editor)'를 1일 출시했다. '에디터'는 클립아트코리아의 방대한 고퀄리티 콘텐츠와 직관적인 디자인 기능을 결합한 것이 강점이다. 국내 1위 이미지 플랫폼의 운영 노하우와 1천만여 컷에 달하는 콘텐츠 자산을 기반으로, 누구나 손쉽게 고퀄리티 디자인을 제작할 수 있는 콘텐츠 중심의 편집 환경을 제공한다. 클립아트코리아만의 프리미엄 사진, 일러스트, PNG, 아이콘 등을 에디터 내에서 바로 활용 및 편집할 수 있으며, 30년 디자인 전문 기업의 노하우를 반영한 에디터 전용 템플릿도 제공한다. 또한, 다양한 활용 목적에 맞춘 맞춤형 캔버스를 제공해 편의성을 높였다. 파워포인트, 인스타그램 피드, 유튜브 썸네일, 웹 배너, 상세페이지 등 다양한 플랫폼별 포맷을 제공해 별도의 리사이징 없이 콘텐츠를 즉시 적용할 수 있다. 사용자는 '좋아요' 기능을 통해 즐겨찾는 콘텐츠를 저장할 수 있으며, 태그를 활용해 프로젝트별로 효율적으로 관리가 가능하다. 디자인 퀄리티 향상을 위한 고급 기능도 탑재됐다. 상세 검색과 유사 콘텐츠 검색 기능을 통해 정교한 이미지 검색이 가능하며, 이미지 크기와 위치는 수치 입력 방식으로 정밀하게 조정할 수 있다. 클립아트코리아 에디터는 회원이라면 누구나 이용할 수 있으며, 멤버십 회원은 이용 기간 내에서 이미지 및 소스를 무제한으로, 무료 회원은 30일간 최대 100컷까지 사용할 수 있다. 한편, 에디터 출시를 기념해 7월 한 달간 클립아트코리아 사이트 내에서 '에디터 템플릿 공모전'도 진행된다. 에디터를 활용해 제작한 콘텐츠를 제출하면 내부 심사를 통해 우수작을 선정하고 소정의 경품을 제공할 예정이다. 통로이미지 관계자는 "클립아트코리아 에디터 서비스는 디자인 효율성을 극대화 할 수 있는 혁신적인 도구"라며, "앞으로도 고객 중심의 서비스를 지속적으로 확장해 나갈 것"이라고 밝혔다. 자세한 정보는 클립아트코리아 공식 웹사이트에서 확인할 수 있다.

2025.07.01 09:41이정현

KAIST-네이버AI랩, 창의성 강화한 AI 기술 개발..."뻔한 건 안그려"

KAIST(총장 이광형)는 김재철AI대학원 최재식 교수 연구팀이 네이버 AI 랩과 공동으로 추가 학습 없이 인공지능(AI) 생성 모델의 창의적 생성을 강화하는 기술을 개발했다고 19일 밝혔다. 이 기술은 '뻔한' 이미지는 절대 그리지 않는다. 텍스트 기반 이미지 생성 모델의 내부 특징 맵을 증폭해 창의적 생성을 강화하는 식이다. 연구팀은 모델 내부의 얕은 블록들이 창의적 생성에 중요한 역할을 한다는 것을 발견하고, 특징 맵을 주파수 영역으로 변환 후 높은 주파수 영역에 해당하는 부분의 값을 증폭했다. 이 결과 연구팀은 노이즈나 작게 조각난 색깔 패턴의 형태가 유발되는 것을 확인했다. 권다희 연구생(박사과정, 공동제1저자)은 "얕은 블록의 낮은 주파수 영역을 증폭했더니 창의적 생성이 강화됐다"고 설명했다. 연구팀은 또 생성 모델 내부 각 블록 별로 최적의 증폭 값을 자동으로 선택하는 알고리즘도 개발했다. 이 알고리즘은 사전 학습된 스테이블 디퓨전 모델의 내부 특징 맵을 적절히 증폭해 추가적인 분류 데이터나 학습 없이 창의적 생성을 강화한다. 한지연 연구생(박사과정, 공동제1저자)은 "SDXL-터보 모델에서 발생하는 모드 붕괴 문제를 완화, 이미지 다양성이 증가한 것을 확인했다"고 말했다. 최재식 교수(교신저자)는 "생성 모델을 새로 학습하거나 미세조정 학습하지 않고 생성 모델의 창의적인 생성을 강화하는 최초의 방법론ˮ이라며 "학습된 인공지능 생성 모델 내부에 잠재된 창의성을 특징 맵 조작을 통해 강화할 수 있게 됐다"고 덧붙였다. 최 교수는 또 “이번 연구는 기존 학습된 모델에서도 텍스트만으로 창의적 이미지를 손쉽게 생성할 수 있게 됐으며, 이를 통해 창의적인 상품 디자인 등 다양한 분야에서 새로운 영감을 제공하고, 인공지능 모델이 창의적 생태계에서 실질적으로 유용하게 활용될 수 있도록 기여할 것"으로 기대했다. 연구결과는 국제 학술지 `국제 컴퓨터 비전 및 패턴인식 학술대회(CVPR)'에서 지난 15일 발표됐다. 연구는 KAIST-네이버 초창의적 AI 연구센터, 과학기술정보통신부의 재원으로 수행됐다.

2025.06.19 11:37박희범

디즈니·유니버설, 'AI 표절'에 칼 빼들었다…미드저니에 IP 침해 소송

생성형 인공지능(AI)이 창작하는 이미지가 기존 인기 콘텐츠의 저작권을 침해한다는 논란이 불거지며 AI 기업과 엔터테인먼트 산업 간 충돌이 본격화되고 있다. 13일 BBC 등 외신에 따르면 디즈니와 유니버설이 이미지 생성 AI 스타트업 미드저니를 저작권 침해 혐의로 미국 연방법원에 제소했다. 디즈니와 유니버설은 미드저니의 생성형 AI 도구가 스타워즈의 다스베이더, 겨울왕국 엘사, 슈퍼배드의 미니언즈 등 자사 인기 캐릭터를 무단으로 복제하고 있다고 주장했다. 이번 소송은 AI 기술을 둘러싼 엔터테인먼트 업계의 복합적인 태도를 보여준다. 업계는 AI의 창작 보조 가능성에는 기대하면서도 자사 지식재산(IP)이 무단 도용되는 데는 강경한 입장을 취하고 있다. 소장에 따르면 미드저니는 텍스트 프롬프트만으로 캐릭터 외형과 스타일을 정교하게 모방한 이미지를 무수히 생성해 왔으며 스타워즈의 요다, 마블의 스파이더맨·헐크·아이언맨 등도 저작권 침해 사례에 포함됐다. 디즈니의 호라시오 구티에레즈 법무 책임자는 "AI가 인간 창의성을 증진시키는 책임 있는 도구가 될 수 있다는 점에 낙관적이지만, 표절은 AI 기업이라 해도 예외가 아니다"라고 밝혔다. 소장에 따르면 미드저니는 지난해에만 약 3억 달러(한화 약 4천100억원)를 벌었으며 영상 생성형 서비스 출시도 준비 중이다. 이에 대해 시러큐스대 슈바 고시 법학 교수는 "미드저니 이미지들은 기존 캐릭터를 새로운 배경에만 배치한 경우가 많아 창의적 변형이라 보기 어렵다"고 지적했다. 다만 미국 홀 에스틸 로펌의 랜디 맥카시 IP 전문 변호사는 "소송 결과를 예단할 수 없다"며 "미드저니 이용 약관과 공정 이용 여부 등 다양한 쟁점이 법원에서 다뤄져야 한다"고 말했다.

2025.06.13 14:50한정호

캐논코리아, 차세대 A3 컬러 복합기 '이미지포스 C7165' 출시

캐논코리아가 2일 화질과 출력 속도를 강화하고 AI 기반 보안 기능을 탑재한 A3 컬러 복합기 '이미지포스 C7165'를 국내 출시했다. '이미지포스'(imageFORCE)는 캐논이 글로벌 출시하는 사무용 복합기 새 브랜드로 지금까지 쓰였던 '이미지러너'(imageRUNNER)를 대체한다. 이미지포스 C7165는 라인업 첫 제품으로 생산성 향상과 고품질 출력을 목표로 개발됐다. 이미지포스 C7165는 감광용 광원으로 기존에 활용하던 레이저 대신 유기발광다이오드(OLED)를 이용하는 'D2 익스포저' 기술을 적용했다. 드럼과 광원 사이 거리를 줄이고 색 틀어짐이나 왜곡을 막으며 해상도는 4800×2400dpi까지 향상됐다. 출력 속도는 흑백/컬러 모두 분당 65장이며 양면 스캔은 분당 최대 270장 가능하다. 급지 용량은 기본 1천200장이며 옵션 트레이 추가시 최대 6천350장까지 적재 가능하다. 급지 가능한 용지 두께는 최저 52gsm(0.05mm)에서 최대 300gsm(0.34mm)이며 수동 급지대에는 공기를 불어넣어 용지가 달라 붙는 것을 막는다. AI를 이용해 보안 설정을 자동 최적화하는 '보안 환경 추정 기술'이 탑재됐고 내부 부품 상태와 수명을 실시간으로 예측해 수리나 교체 등으로 소요되는 다운타임을 최소화했다. 박정우 캐논코리아 대표이사는 "이미지포스 C7165는 고화질 출력부터 보안, 유지보수, 친환경 기능까지 모두 갖춘 프리미엄 복합기이며 다양한 산업 현장의 업무 혁신을 이끄는 고성능 솔루션을 지속 확대해 나가겠다"고 밝혔다.

2025.06.02 09:51권봉석

'문서 AI'가 더 똑똑해졌다…"서류 속 문맥·구조까지 파악"

문서 인공지능(AI) 기술이 단순 텍스트 인식을 넘어 문맥·구조까지 이해하는 방향으로 진화했다. 복잡한 문서에서도 주요 정보를 자동 식별하고 고도화된 자동화 처리까지 가능해졌다. 11일 IT 업계에 따르면 최근 문서 처리 시장에서는 비전언어모델(VLM) 기반 광학 문자 인식(OCR) 기술이 주목받고 있다. 이 기술은 계약서, 보고서 등 여러 형식과 맥락으로 이뤄진 문서 속 표, 조항, 제목, 본문을 AI로 식별해 구조화된 데이터로 변환할 수 있다. VLM은 이미지와 언어 정보를 동시에 이해하는 AI 모델이다. 일종의 '이미지 전문가'와 '언어 전문가'가 한 팀처럼 협업하는 방식으로 작동한다. 우선 이 모델은 문서에서 표, 문장, 도장, 손글씨 등 다양한 이미지 요소를 구분한다. 이후 각 영역의 텍스트를 분석해 의미를 파악하고, 이를 종합적으로 해석한다. 이 과정에서 시각 정보와 언어 정보가 실시간으로 상호작용하며 정답을 조율한다. 정보 하나가 잘못 인식되면 다른 정보가 이를 보완하고, 누락된 부분은 이미지 단서를 활용해 추론하는 식이다. 예를 들어, 사용자가 계약서에 VLM 기반 OCR을 적용하면 '계약 당사자'와 '계약 기간' '주요 조항' '서명란' 등을 자동으로 식별해 체계적으로 정리할 수 있다. 이를 통해 문서 처리 자동화 수준을 높이고 반복 작업과 인적 오류를 줄일 수 있다. 기존 OCR은 이미지 속 텍스트를 디지털 문자로 바꾸는 데만 초점 맞췄다. 문서 레이아웃이나 의미적 맥락은 이해하지 못해 데이터 활용에 한계가 있었다. 이에 추가 인력이 이를 수작업으로 정리해야만 했다. VLM OCR, 정확도·사업성 모두 잡아 한국딥러닝은 '딥 OCR 플러스' 출시로 VLM OCR 서비스를 이미 상용화했다. 이 솔루션은 별도 학습 없이 여러 형식 문서를 처리할 수 있다. 한국어·영어·숫자·특수문자가 섞인 복잡한 구조도 정확하게 인식할 수 있도록 설계됐다. 딥 OCR 플러스는 문서의 표나 문단을 자동 분석해 핵심 정보를 요약하고, 추출 데이터를 표준 포맷으로 제공해 업무 시스템과 연동된다. 한국딥러닝은 이 솔루션으로 문서 검토 시간을 최대 80% 줄이고, 일관된 데이터 품질을 유지할 수 있다고 강조했다. 앞서 업스테이지도 AI 기반 문서 구조화 솔루션 '다큐먼트 파스'를 출시해 보험, 금융, 의료 등 산업 현장에서 문서 자동화를 지원하고 있다. 고정밀 벤치마크에서 아마존·마이크로소프트 모델보다 높은 정확도를 기록한 것으로 전해졌다. 올해 6월 모델 '솔라'를 결합한 '솔라 다큐브엘엠'도 출시한다. 솔라 타큐브엘엠은 시각 정보와 언어 정보 통합 처리 역량을 강화해 문서 기반 요약, 질의응답, 자동 분류까지 수행할 수 있도록 구성됐다. 특히 비정형 문서나 복잡한 레이아웃 문서에서도 높은 인식률을 보일 것이란 평가를 받고 있다. 김지현 한국딥러닝 대표는 "비전 OCR은 돈 버는 AI"라며 "정확도와 사업성을 모두 잡을 수 있는 실용 기술"이라고 강조했다.

2025.05.11 14:40김미정

피규어·지브리 프사 만들기?…"챗GPT 개인정보 유출 위험"

인공지능(AI) 챗봇 '챗GPT'로 유행 따라 사진을 피규어나 일본 지브리스튜디오 애니메이션처럼 만들다가는 개인정보를 털릴 수 있다고 미국 잡지 와이어드는 1일(현지시간) 보도했다. 운영사 오픈AI는 새로운 GPT-4o 기반 이미지 생성기로 챗GPT의 사진 편집, 텍스트 렌더링 기능을 키웠다고 와이어드는 평가했다. 챗GPT 무료 계정과 사진만 있으면 재미있고 쉽게 이미지를 만들 수 있다. 그러나 피규어나 지브리 같은 그림을 만들려면 오픈AI에 많은 정보를 넘겨야 한다고 와이어드는 지적했다. 오픈AI는 이 정보로 인공지능을 학습시킬 수 있다. 유럽 OPIT(Open Institute of Technology)의 톰 바즈다 사이버보안학과장는 “챗GPT에 사진을 올릴 때마다 메타데이터 덩어리를 넘겨주는 셈”이라며 “사진 촬영 시간, 촬영 장소의 (GPS) 좌표 등 그림 파일에 첨부된 정보가 포함된다”고 말했다. 메타데이터(Metadata)란 다른 정보를 나타내는 정보를 뜻한다. 오픈AI는 챗GPT에 접속하는 기기 정보도 모으는 것으로 알려졌다. 기기 유형, 운영 체제, 브라우저 버전, 고유 식별자 등이다. 바즈다 학과장은 “챗GPT는 대화하듯 작동하기에 입력한 내용, 요청한 그림 종류, 인터페이스와의 상호 작용 방식, 동작 빈도와 같은 행동 정보도 수집한다”며 “생성형 AI를 훈련하는 금광”이라고 표현했다. 얼굴만 그런 게 아니다. 위험 관리 회사 GRC인터내셔널그룹의 캠든 울븐 AI제품 마케팅 책임자는 “고해상도 사진을 올리면 피사체뿐 아니라 배경, 다른 사람, 방 안의 물건, 문서처럼 읽을 수 있는 모든 것을 오픈AI에 주는 격”이라고 설명했다. 오픈AI는 생성형 AI를 학습시키려고 개인정보를 적극적으로 수집하지 않으며 인터넷 공개 정보로 사용자 프로필을 구축하고 광고하거나 정보를 팔지 않는다고 와이어드에 밝혔다. 그러나 오픈AI의 개인정보 보호 정책에 따라 챗GPT로 올라온 이미지는 보관되고, 생성형 AI를 개선하는 데 쓰일 수 있다고 와이어드는 비판했다. 챗GPT에서 정보를 지킬 가장 효과적인 방법은 채팅 기록을 끄는 일이라고 와이어드는 소개했다. 파일에서 메타데이터를 지우고 올려도 좋다. 사진 편집 도구를 쓰면 된다. 바즈다 학과장은 “사용자는 민감한 개인정보를 챗GPT에 쓰지 말고 정보를 알 수 있는 배경이 있는 사진이나 단체 사진은 올리지 말아야 한다”며 “이렇게 하면 내 정보가 챗GPT 훈련에 쓰이지 않도록 할 수 있다”고 조언했다.

2025.05.03 07:48유혜진

"글로벌 수준"...카카오, 멀티모달 언어모델 'Kanana-o' 성능 공개

카카오가 새로운 인공지능 모델을 통해 기술 경쟁력 강화를 이어간다. 카카오(대표 정신아)는 공식 테크블로그를 통해 통합 멀티모달 언어모델 'Kanana-o'와 오디오 언어모델 'Kanana-a'의 성능과 개발 후기를 1일 공개했다. 통합 멀티모달 언어모델인 Kanana-o는 텍스트와 음성, 이미지까지 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 모델이다. 텍스트, 음성, 이미지 중 어떠한 조합으로 질문을 입력하더라도 처리 가능하며, 상황에 맞는 텍스트나 자연스러운 음성으로 응답 가능한 구조로 설계됐다. 카카오는 '모델 병합' 기술을 기반으로 이미지 처리에 특화된 모델 'Kanana-v'와 오디오 이해 및 생성에 특화된 'Kanana-a' 모델을 통합, 단기간 내 효율적으로 Kanana-o를 개발했다. 통합 후에는 이미지, 오디오, 텍스트 데이터를 동시에 학습하는 '병합 학습'을 통해 시각과 청각 정보를 동시에 이해하고, 텍스트와 연결 지을 수 있도록 통합 훈련을 거쳤다. 이런 과정을 통해 기존 LLM 구조에서 이미지 이해 능력과 음성 인식과 합성, 감정 이해 등 고도화된 오디오 능력을 확장시킨 통합 멀티모달 언어모델이 구현됐다. Kanana-o는 음성 감정 인식 기술을 통해 사용자의 의도를 올바르게 해석하고, 상황에 맞는 적절한 반응과 답변을 제공해준다. 억양, 말투, 목소리 떨림 등 비언어적 신호를 분석하고, 대화 맥락에 맞는 감정적이고 자연스러운 음성의 응답을 생성하는 것이 특징이다. 대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조, 억양, 어미 변화 등을 정밀하게 반영하기도 했다. 특히 제주도, 경상도 등 지역 방언을 인식하고 이를 표준어로 변환해 자연스러운 음성을 생성할 수 있다. 지속적인 성능의 고도화를 위해 카카오는 현재 독자적인 한국어 음성 토크나이저(오디오 신호를 일정 단위로 작게 분해하는 도구) 개발을 진행 중이다. 스트리밍 방식의 음성합성 기술을 적용해 사용자가 긴 대기 시간 없이 응답을 제공하는 강점도 보유했다. 예를 들어, 이미지와 함께 "이 그림에 어울리는 동화를 만들어 줘"라고 입력하면, Kanana-o는 해당 음성을 이해하고 사용자의 억양과 감정 등을 분석해 자연스럽고 창의적인 이야기를 실시간으로 생성해 들려준다. Kanana-o는 한국어 및 영어 벤치마크에서 글로벌 최고 모델들과 유사 수준을 기록했으며, 한국어 벤치마크에서는 높은 우위를 보였다. 특히, 감정인식 능력에서는 한국어와 영어 모두에서 큰 격차를 기록하며, 감정까지 이해하고 소통할 수 있는 AI 모델의 가능성을 입증했다. 이미지와 음성을 통합적으로 이해해야 하는 '이미지-음성 QA(질의응답)' 태스크에서도 강력한 성능을 달성하며, 통합 멀티모달 언어모델로서의 글로벌 경쟁력을 확인했다. 카카오는 향후 Kanana-o를 통해 ▲다중 턴 대화 처리 ▲양방향 데이터 동시 송수신 기술 대응 능력 강화 ▲부적절한 응답 방지를 위한 안전성 확보 등을 목표로 연구 개발을 지속해 갈 계획이다. 이를 통해 다중 음성 대화 환경에서의 사용자 경험을 혁신하고, 실제 대화에 가까운 자연스러운 상호작용을 실현해가는 것이 목표다. 카카오 김병학 카나나 성과리더는 "카나나 모델은 복합적인 형태의 정보를 통합적으로 처리함으로써 기존의 텍스트 중심 AI를 넘어 사람처럼 보고 듣고 말하며 공감하는 AI로 진화하고 있다"며 "독자적인 멀티모달 기술을 바탕으로 자사의 인공지능 기술 경쟁력을 강화하는 한편, 지속적 연구 결과 공유를 통해 국내 AI 생태계 발전에 꾸준히 기여할 계획"이라고 말했다.

2025.05.01 10:13백봉삼

플리토, AI로 이미지 속 문자 번역…콘텐츠 품질 강화

플리토가 인공지능(AI) 기반 이미지 번역 서비스를 출시해 글로벌 시장을 노리는 기업 경쟁력 강화에 나섰다. 플리토는 이미지 내 텍스트를 번역하는 '이미지 번역' 서비스를 출시했다고 28일 밝혔다. 이번 서비스는 이미지 속 텍스트를 번역하면서 글자 배치와 배경, 색감 등 원본 디자인 요소를 유지하는 것이 특징이다. 특히 HTML 포맷은 검색 엔진 최적화(SEO) 효과를 통해 검색 노출을 높일 수 있어 고객사의 디지털 마케팅 경쟁력 제고에 기여할 것으로 기대된다. 플리토는 고객 전용 모니터링 시스템을 통해 번역과 디자인 최적화 과정을 한 번에 관리할 수 있도록 했다. 수작업이나 반복적 커뮤니케이션 없이 실시간 진행 상황을 확인할 수 있어 로컬라이제이션 업무 효율이 크게 향상될 전망이다. 플리토는 AI 번역 엔진, 광학문자인식(OCR), 인페인팅 기술을 결합해 이커머스 기업들의 이미지 기반 콘텐츠 수요를 적극 대응하고 있다. 자체 플랫폼의 1천400만 유저 언어 데이터를 활용해 도메인 맞춤형 고품질 번역을 제공하고 있으며 올리브영, 졸스 등 글로벌 뷰티 플랫폼에 서비스를 공급 중이다. 이정수 플리토 대표는 "AI 이미지 번역은 고품질 번역과 고객사의 브랜드 감성까지 그대로 살리는 맞춤 현지화 서비스"라며 "디지털 환경에서 이미지 기반 콘텐츠의 중요성이 커지는 만큼 이번 서비스가 이커머스 기업들의 글로벌 경쟁력 강화에 기여하길 바란다"고 밝혔다.

2025.04.28 15:09김미정

포바이포-미리디, 콘텐츠 제휴 업무협약 체결

콘텐츠 AI 솔루션 기업 포바이포(대표 윤준호)가 디자인 플랫폼 기업 미리디와 초고화질 영상 및 이미지 스톡 콘텐츠 제휴에 대한 전략적 업무협약을 체결했다고 23일 밝혔다. 포바이포와 이번 업무협약을 체결한 미리디는 약 53만개 이상의 템플릿을 보유해 누구나 고품질 디자인 결과물을 만들 수 있는 디자인 올인원 플랫폼 '미리캔버스'와, 온라인 인쇄 서비스 및 소상공인 브랜드, 홍보까지 아우르는 '비즈하우스' 등을 운영하고 있다. 최근 ▲AI 프레젠테이션 ▲AI 라이팅 ▲AI 이미지 생성 ▲AI 이미지 편집 기능을 새롭게 도입하며 AI 컴퍼니로 거듭나고 있는 업계 선도 기업이다. 이번 협약을 통해 포바이포는 회사에서 운영하는 스톡 플랫폼 '키컷스톡'에서 유통하는 4K 이상 초고화질 영상 및 이미지, 미디어아트, 그래픽, 영상 템플릿, 썸네일 스톡 등을 미리디가 제공하는 다양한 디자인 플랫폼에 활용할 수 있도록 제공하게 된다. 또 초고화질 영상 콘텐츠로 특화된 기업 답게 미리디가 운영 중인 플랫폼과 자체 제작하는 마케팅 콘텐츠가 최상의 효과를 낼 수 있도록 자체 AI솔루션을 활용, 영상의 화질 및 용량 최적화 방법을 지속적으로 제안해 나갈 예정이다. 향후 포바이포의 콘텐츠 전문성과 미리디의 광범위한 플랫폼 및 고객들을 결합해 디지털 사이니지 전용 영상 디자인, 글로벌 마케팅 콘텐츠 제작 등 새로운 시장 진출도 공동 추진하기로 약속했다. 강창석 미리디 대표는 "포바이포와의 협력을 통해 미리디는 고객들에게 초고화질의 영상 스톡을 제공할 수 있게 됐다"며 "양사의 시너지를 통해 새로운 시장을 개척하고 고객 만족도를 극대화할 수 있기를 기대한다"고 말했다. 키컷스톡 서희환 팀장은 "미리디의 비즈니스 모델과 포바이포 키컷스톡의 서비스가 결합되면 분명 높은 시너지를 만들어 낼 것"이라며 "이번 업무협약은 서로에게 필요한 기술과 상품을 상호 교환함으로써 양사 모두에게 더욱 차별화된 서비스로 발돋움할 수 있는 기회가 될 것으로 기대하고 있다"고 밝혔다.

2025.04.23 08:51백봉삼

캐럿, LG유플러스에 기업용 AI 영상 제작 서비스 '캐럿 Biz' 공급

인공지능(AI) 영상 생성 플랫폼 '캐럿' 운영사 패러닷(대표 장진욱)이 LG유플러스에 기업용 AI 영상 제작 솔루션 '캐럿 Biz'를 공급한다고 21일 밝혔다. 캐럿 Biz는 기업을 대상으로 세계적인 이미지·영상 생성 모델을 실행 횟수 제한 없이 제공한다. 구글 이마젠3, 런웨이, 플럭스 등 각종 AI모델을 개별 구독하는 경우와 비교해 최소 약 75% 저렴한 가격에 이용할 수 있다. 인물이 등장하는 영상에 더빙 음성 및 입 움직임을 더하는 '영상 립싱크', 특정 인물 및 사물을 학습해 콘텐츠에 반영시켜주는 '이미지 학습' 등 제작자 친화적인 기능까지 탑재했다. 앞으로 LG 유플러스는 캐럿을 활용해 직접 광고 및 마케팅 영상을 제작할 계획이다. 인공지능 중심 사업 전환(AX)을 위한 전략 일환이다. 운영사 패러닷은 LG유플러스 실무자들이 AI 창작을 신속히 익힐 수 있도록 라이언오슬링, 연신내호랭이, 김땡땡 등 유수 AI 크리에이터를 배치해 멘토링 서비스를 지원한다. 장진욱 패러닷 대표는 “어느 분야에서든 AI는 실무자 업무 역량을 10배 이상 성장시킬 수 있는 '생산성 혁신'을 일으킬 가능성이 충분하다”며 “캐럿은 앞으로 콘텐츠 및 엔터테인먼트 업계에서 유용하게 활용할 수 있는 기능을 다수 탑재한 AI 에이전트를 개발하고 제공할 계획”이라고 말했다.

2025.04.21 09:04백봉삼

미리캔버스, AI 디자인 툴 '미리클' 글로벌 동시 출시

미리디(대표 강창석)에서 운영하는 비주얼 커뮤니케이션 플랫폼 '미리캔버스'가 디자인 맞춤 AI 기술을 탑재한 '미리클'을 국내와 글로벌에 동시 출시했다고 17일 밝혔다. 미리클은 미리캔버스와 기적을 뜻하는 미라클이 결합한 이름으로 미리캔버스의 새로운 AI 기술 브랜드다. 미리캔버스가 구축해 온 디자인 혁신에 AI 기술력을 더해 지금까지와 전혀 다른 새로운 형태의 디자인 작업물을 만들 수 있다는 의미를 담았다. 미리클의 핵심 기능은 ▲AI 프레젠테이션 ▲AI 라이팅 ▲AI 이미지 생성 ▲AI 이미지 편집으로, AI 기술을 통해 누구나 손쉽고 빠르게 전문가급 결과물을 만들어 주는 것이 특징이다. 'AI 프레젠테이션'은 이용자들이 주제와 내용을 입력하면 3분 이내에 프레젠테이션 초안을 만들고 콘텐츠 내용에 따라 자동으로 페이지 구성까지 제안한다. 뿐만아니라 자료 성격에 맞춰 디자인 추천 및 내용 수정·보완 등의 피드백도 제공한다. 여기에 간단한 키워드 또는 짧은 문장 입력으로 원하는 글을 생성해 주는 'AI 라이팅'까지 사용하면 프레젠테이션의 완성도를 한층 더 높일 수 있다. 'AI 이미지 생성'은 이용자 요청에 따라 초고화질의 결과물을 제작하고, 작업 중인 디자인에 어울리는 이미지를 추천한다. 특히 현재 글로벌 시장에서 주목받고 있는 멀티 모달 AI 대비 동양인 인물 표현에서는 수준 높은 결과물을 보여준다. 'AI 이미지 편집'은 간단한 조작으로 화질 개선 등의 편집이 가능한 것은 물론 인물과 사물 등을 정밀하게 분리해 준다. 따라서 배경 제거 작업 시 더욱 섬세한 결과물을 얻을 수 있다. 미리캔버스는 미리클 출시에 앞서 2023년 2월부터 1년 반 동안 AI 기능을 서비스에 탑재, 글로벌 이용자를 대상으로 테스트를 진행했다. 그 결과 별도의 홍보·마케팅 없이도 496만 명 이상의 고객이 미리캔버스의 AI 기능을 적극 활용했으며, 매월 이용자가 꾸준히 증가하는 추세다. 이에 미리캔버스는 글로벌 AI 비주얼 커뮤니케이션 플랫폼으로 해외 시장 진출을 본격화하며, 현재 서비스 되고 있는 미국, 영국, 유럽, 일본 등에 미리클을 동시 공개했다. 한국어, 일어, 영어 등의 언어를 지원하며, 향후 서비스 언어는 계속해서 늘려갈 계획이다. 강창석 미리디 대표는 "미리클은 누구나 간편하게 고퀄리티 결과물을 얻도록 디자인에 맞춤 설계된 AI 기술 서비스"라며 "이용자 친화적인 국내 대표 디자인 플랫폼으로서 미국, 유럽, 일본 등 해외 디자인 강국에서도 미리캔버스가 안착할 수 있도록 서비스 경쟁력을 더욱 강화하겠다"고 말했다.

2025.04.17 18:19백봉삼

"트래픽 폭주에 발목"…오픈AI, 신규 유저에 '소라' 영상 생성 제한

오픈AI가 자사 멀티모달 생성형 인공지능(AI) 영상 서비스 '소라(Sora)'의 영상 생성 기능을 일부 사용자에 한해 제한했다. 지브리풍 이미지 생성 기능이 화제를 모으며 사용자가 급증한 데 따른 후속 조치다. 1일 테크크런치에 따르면 오픈AI는 최근 소라 영상 생성 기능을 신규 계정에서 사용할 수 없도록 설정했다. 소라에 최초 로그인한 사용자에겐 이미지 생성 기능만 제공되며 영상은 차단된다. 이번 제한 조치는 지난주 소라에 새롭게 추가된 이미지 생성 기능이 공개된 이후 내려졌다. 해당 기능은 미야자키 하야오 감독의 '스튜디오 지브리' 스타일을 재현할 정도로 뛰어난 품질을 자랑하며 소셜미디어를 중심으로 폭발적인 반응을 이끌었다. 다만 예상치를 훌쩍 웃도는 사용자 유입으로 서버 과부하 문제가 불거졌다. 오픈AI는 이에 따라 트래픽 조절이 시급하다고 판단해 신규 계정 중심으로 영상 기능을 잠정 차단한 것으로 보인다. 영상 생성을 차단한 오픈AI의 공식 지원 페이지에는 "현재 트래픽이 급증해 신규 계정에 대해 영상 생성을 임시로 비활성화했다"는 공지가 게재됐다. 기존 사용자 계정은 여전히 영상 생성이 가능하다. 샘 알트먼 오픈AI 최고경영자(CEO)는 지난 주말 X(구 트위터)를 통해 "출시 이후 지금까지 수요를 따라잡지 못하고 있다"며 "서비스 유지를 위해 직원들이 야근과 주말 근무까지 하고 있다"고 밝힌 바 있다.

2025.04.01 12:17조이환

캐논코리아, 대형 잉크젯 프린터 2종 출시

캐논코리아가 31일 A1 출력 가능한 잉크젯 프린터·복합기 신제품을 국내 출시했다. 신제품은 이미지프로그래프(imagePROGRAF) TC-21 잉크젯 프린터, TC-21M 잉크젯 복합기 등 총 2종이다. 용지 설정과 잉크 충전 등 모든 조작을 본체 전면에서 처리할 수 있고 각도를 조절할 수 있는 틸트식 조작 패널을 탑재해 2023년 출시된 전세대 제품 대비 편의성을 강화했다. 자동낱장공급장치(ASF)는 최대 A1(594×841mm) 크기 건축, 설계 도면 등 포스터와 약국 약봉지, 전단지 등 소형 용지 공급이 가능하다. TC-21M은 A4 용지 처리 가능한 평판 스캐너를 탑재해 A4 용지 확대 복사, 스캔 원고 확대·분할로 A0 크기 포스터를 제작할 수 있다. 무료로 제공되는 포스터아티스트 소프트웨어를 이용해 포스터나 전단지를 제작하고 출력 가능하다. 본체 금속의 5%는 재생 철, 본체 플라스틱의 40%는 재생 플라스틱을 적용했고 포장용 완충재는 스티로폼 대신 재활용 골판지를 적용했다. 박정우 캐논코리아 대표이사는 "신제품 2종은 편의성 개선과 함께 뛰어난 출력 품질과 다양한 용지 대응성을 갖춰 소규모 사업자부터 음식점, 건축·설계 분야까지 폭넓은 고객층의 요구를 충족할 수 있도록 설계한 제품"이라고 밝혔다.

2025.03.31 09:51권봉석

[써보고서] 그림도 글도 한 번에…'챗GPT 이미지 생성기' 미래 바꾼다

"이번에 업데이트된 '챗GPT' 이미지 생성기를 확인해봤습니다. 단순히 기존 이미지를 조합하는 수준이 아니라 텍스트의 의미를 더 깊이 이해하고 새로운 스타일과 구성, 언어 표현까지 가능합니다. 한글도 꽤나 잘 표현되고 긴 문장도 잘 소화합니다. 이제 그림과 관련해 뭐가 안 될 거라고 말하기가 무서울 정도네요." 한 국내 인공지능(AI) 전문가는 30일 자신의 소셜미디어를 통해 '챗GPT 이미지 생성기(ChatGPT Image Generator)'의 최신 업데이트 버전을 이같이 평했다. 그만의 생각이 아니다. 실제로 소셜미디어 곳곳에서는 해당 서비스에 대해 수많은 유저들이 뜨겁게 반응하며 새로운 사용사례를 발굴하고 다양한 실험을 이어가고 있다. '챗GPT 이미지 생성기'는 오픈AI가 자사의 거대언어모델(LLM)인 '챗GPT'의 '4o' 버전에 통합한 이미지 생성 기능이다. 지난 25일 기존 '달리' 이미지 생성기에서 새롭게 업데이트된 이번 버전은 기존 대비 뛰어난 언어 이해력과 창의성을 기반으로 훨씬 자연스럽고 풍부한 이미지 생성이 가능해졌다는 평가를 받고 있다. 이번에 공개된 버전은 단순한 그림 제작을 넘어, 사실상 '무엇이든 가능한 수준'에 도달했다는 평가다. ▲텍스트와 그래픽 요소가 결합된 시각자료 제작 ▲기존 이미지의 특정 글자나 오브젝트만 정밀하게 수정하는 리터칭 ▲실사 이미지의 형태를 유지하면서 전혀 다른 테마로 재해석하는 작업까지 대부분 구현이 가능하다. "AI가 만든 인포그래픽"…그림뿐 아니라 '시각 설명'까지 완성 무엇보다 주목할 점은 '그림과 글자 조합'에 대한 처리 능력이다. 우리가 일상적으로 확인하고 처리하는 대부분의 시각 자료는 이미지와 텍스트의 조합으로 구성돼 있다. 이 생성기는 이제 그런 형태의 콘텐츠라면 어지간한 수준까지 대부분 구현할 수 있을 만큼 진화했다. 일례로 최근 기자가 국내 AI 기업인 S2W를 인터뷰한 기사를 준비하며 회사와 밀접히 연관된 개념인 '온톨로지'와 '지식그래프' 같은 개념을 시각적으로 설명할 삽화가 필요했던 사례가 있다. 이 개념들은 본질적으로 매우 추상적이어서 그림으로는 설명이 어려울 수 있다. 그런데 이번 이미지 생성기는 그런 우려를 뛰어넘었다. 기자가 두 개념을 상징하는 그림들을 그려달라고 콘셉트와 설명을 입력하자 개념을 직관적으로 시각화한 고품질 그래픽을 수십 초 만에 생성해냈다. 지식그래프는 '데이터 간의 관계'를 시각적으로 보여주는 구조이고 '온톨로지'는 그 안의 개념과 의미를 정의한 일종의 '표준 사전'이다. 생성된 그림은 이 개념들을 처음 접하는 사람도 쉽게 이해할 수 있을 만큼 명확하게 표현해 줬다. 발표자료나 기사 내 삽화로도 손색이 없을 정도의 직관적 간단함을 보여줬다. 여기에 활용도를 한층 끌어올린 요소는 바로 영어 텍스트 처리 능력이다. 과거 이미지 생성기들은 영어조차 정확히 표현하지 못하는 경우가 많았다. 'AI' 같은 단어는 무난했지만 '국가안보(National Security)'처럼 긴 단어의 경우 알파벳이 일부 누락되거나 다른 글자로 바뀌는 문제가 흔했다. 이번 업데이트 이후에는 영어 문장을 거의 완벽하게 반영해 이제 굳이 외주를 맡기지 않아도 될 정도로 안정적인 결과물을 얻을 수 있다. 이 강점은 인포그래픽 제작에서 빛을 발한다. 예를 들어 앞서 언급한 '지식그래프'와 '온톨로지' 개념을 영어 발표자료로 만드는 실험을 해보기 위해 기자는 '챗GPT'에게 "이 기사 내용을 바탕으로 1슬라이드짜리 인포그래픽을 만들 수 있게 개념을 정리해줘"라고 지시했다. 이에 '챗GPT'는 즉각 구체적인 구성안을 제시했고 "이 구성을 기반으로 텍스트나 디자인 워딩도 만들어줄 수 있다"며 "필요하면 파워포인트, 피그마, 웹용, 포스터 등 포맷에 맞춰 최적화도 가능하다"는 제안까지 곁들였다. 이에 기자는 '스타트업 감성'과 '노랑-하양' 계열 톤을 지정하며 포스터 형태로 직관적으로 이해 가능한 버전을 요청했다. 결과는 기대 이상이었다. 영어 문장 표현이 완벽하게 구현됐고 복잡한 개념도 깔끔하게 시각화됐다. 발표 자료로 바로 활용해도 손색이 없을 만큼의 완성도였고 제작에 걸린 시간은 1분 남짓이었다. 가정용 레이저 컬러 프린터에서 컬러 사진을 출력하는 속도다. 이미지 속 대사·표정·배경까지 자유자재…테마 전환도 '척척' 또 다른 주목할만한 특징은 '기존 이미지를 수정하는 기능'이다. 이제는 '챗GPT 4o'에 그림이나 사진을 입력한 뒤 그 안의 글자나 오브젝트를 일부 수정하는 것도 가능하다. 이는 더 이상 포토샵이나 전문적인 그래픽 디자인 툴 없이도 어느 정도의 시각적 편집 작업을 누구나 할 수 있게 됐다는 의미다. 일례로 기자는 인터넷에서 밈으로 유명한 김성모 화백의 만화 컷에서 등장인물의 대사인 "더이상의 자세한 설명은 생략한다"를 바꾸고 싶었다. '챗GPT'에게 이 이미지를 주고 "이 문장을 '자세한 설명이 필요하므로 다음 컷에 해주겠다'로 바꿔달라"고 요청하자 해당 문장을 깔끔하게 수정한 이미지를 바로 생성해줬다. 캐릭터의 외형은 약간의 차이가 있지만 전체적인 스타일은 거의 완벽하게 재현됐다. 공식 문서나 기획안 등 고해상도 일러스트가 필요한 상황이 아니라면 충분히 활용할 수 있을 정도다. 그림에 대한 소폭 수정도 자연스럽게 처리된다. 기자는 앞선 김성모 캐릭터에서 '목폴라를 벗기고 70년대식 콧수염을 붙여달라'고 요청했는데 역시 기대한 대로 처리됐다. 이외에도 캐릭터의 표정 변화, 옷이나 헤어스타일 교체, 배경 변경 등 다양한 시도가 가능했다. 다만 이 과정에서 한글 텍스트가 처음엔 조금 어색하게 표현되기도 했으나, 다시 "한글 자연스럽게 수정해줘"라고 요청하면 또 문제없이 보완해주는 구조다. 오브젝트의 테마나 분위기를 바꾸는 작업 역시 수준급이다. 최근 소셜미디어를 뜨겁게 달군 '지브리 테마 변환'이 대표적인 사례다. 최근에는 더 락, 백악관 보좌관 등 유명 인사, 인플루언서들이 이 기능을 이용해 카카오톡 프로필이나 SNS 프로필 사진을 새롭게 꾸미는 사례가 확산되고 있다. 이에 동참해 기자는 스스로의 사진을 입력한 뒤 "지브리 애니메이션 분위기로 바꿔달라"고 요청했고 실제로 스튜디오 지브리를 연상시키는 따뜻한 색감과 몽환적인 배경, 부드러운 일러스트 스타일이 적용된 결과물이 나왔다. 또 하나 흥미로운 점은 단순히 캐릭터 스타일을 바꾸는 것을 넘어 이미지의 '전체 테마' 자체를 완전히 변환할 수 있다는 것이다. 단순히 눈이나 옷차림만 바꾸는 수준이 아니라 사진이 지닌 분위기와 배경까지 포함한 '서사적 연출'이 가능해진 셈이다. 최근 오픈AI 아태지역 홍보 담당자인 제이크 윌친스키는 자신의 링크드인에 새로운 사용 사례를 공개했다. 그는 '챗GPT 이미지 생성기'에 "우리 집 강아지를 최대한 나쁜 남자(Bad*ss)처럼 만들어달라"고 요청했고 그 결과 선글라스, 초커, 가죽 재킷을 착용한 터프한 강아지 이미지가 생성됐다. 기존 반려동물의 귀여운 이미지를 완전히 뒤엎는 콘셉트 전환이 구현된 것이다. 기자도 유사한 시도를 했다. 반려견 사진을 입력한 뒤 "이 강아지를 런던 동부의 불량 청소년처럼 바꿔달라"고 프롬프트를 주자 결과물은 놀라웠다. 푸들이었던 강아지는 그대로 유지됐지만 배경은 그래피티가 가득한 동런던 거리로 바뀌었고 모자, 아디다스 재킷, 귀걸이 등 각종 아이템으로 꾸며져 있었다. 한마디로 '코크니 억양으로 밤거리에서 맥주를 흔들며 인사를 건넬 것 같은' 이미지가 완성된 셈이다. 여전히 존재하는 한계…그럼에도 우리 삶 '게임 체인저'로서 잠재력 보여 물론 모든 기능이 완벽하게 구현되는 것은 아니다. 특히 텍스트 표현에서는 일부 한계가 남아 있다. 영어는 대부분 정확하게 처리되지만 문장이 너무 길거나 단어가 복잡할 경우 일부 글자가 누락되는 경우가 종종 발생한다. 기사 한 편 수준의 긴 문장을 이미지에 삽입하는 고난도 작업은 아직 포토샵 등 전문 편집 도구가 더 유리할 수 있다. 한글은 그보다 제약이 크다. 짧은 문장은 비교적 잘 표현되지만 한 문단 이상만 되어도 오타나 띄어쓰기 오류가 생길 가능성이 높다. 수정 요청을 통해 보완은 가능하지만 '한 번에 완성형'을 기대하기는 아직 무리다. 이미지 리터칭 역시 100% 재현이라고 보긴 어렵다. 김성모 화백의 만화 대사를 바꾼 예처럼 스타일과 구도는 거의 흡사하지만 선의 굵기 같은 디테일은 다소 달랐다. 반려견 사례에서도 강아지의 특징은 대부분 반영됐지만 실물과 완벽히 일치하기보다는 유사한 개체의 특징이 혼합된 결과물이었다. 이는 생성형 AI 특유의 '확률적 생성 방식'에 기반한 한계로 기술적으로는 어쩔 수 없는 영역이기도 하다. 다만 이런 단점을 감안하더라도 '챗GPT 4o 이미지 생성기'는 충분히 '게임 체인저'로서의 자격을 갖췄다. 핵심은 글과 그림이라는 인간 커뮤니케이션의 두 축을 AI가 모두 다룰 수 있게 되었다는 점이다. 이미지 속 텍스트를 고치고 그래픽을 새로 생성하며 오브젝트를 주제나 맥락에 맞춰 자연스럽게 변환하는 기능은 산업 전반에 걸쳐 새로운 창작 흐름을 만들어낼 수 있다. 특히 주목할 지점은 이러한 기능이 단지 업무 효율화나 콘텐츠 제작 자동화에만 그치지 않는다는 점이다. 사람들이 일상 속 감정과 기억, 유머와 밈(meme), 일상의 장면들까지도 누구나 이미지로 기록하고 나아가 수십초만에 창작할 수 있는 시대가 열린 것이다. '생활형 창작'의 문턱이 급격히 낮아진 지금 생성형 AI는 이제 단순한 도구가 아니라 삶을 구성하는 도구로 자리매김할 가능성이 보인다. 다만 이 기능은 아직 무료 버전에서는 제공되지 않는다. '챗GPT 4o'의 이미지 생성 기능은 현재 월 20달러(한화 약 2만7000원)의 유료 플랜인 '챗GPT 플러스(Plus)'와 200달러(한화 약 27만원) 플랜인 '챗GPT 프로(Pro)' 구독자에게만 제공된다. 본격적인 대중화는 향후 무료 사용자에게도 기능이 개방되는 시점 이후가 될 전망이다. 샘 알트먼 오픈AI 최고경영자(CEO)는 "'GPT-4o 이미지 생성기'는 현재 유료 사용자에게만 제공된다"며 "향후에는 무료 사용자와 애플리케이션 프로그램 인터페이스(API) 사용자에게도 확장 적용될 예정"이라고 밝혔다.

2025.03.30 14:55조이환

  Prev 1 2 3 4 5 Next  

지금 뜨는 기사

이시각 헤드라인

이재명 대통령 "AI 혁신에만 전념할 환경 만들겠다"

통신사가 직접 'AI 스마트폰' 만들어 판다

"아마존 열대우림, 100년 안에 사라진다"

"AI 챗봇 '과잉 공감' 경계해야"…나르시시즘·망상 키울 수도

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.