• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
스테이블코인
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이미지'통합검색 결과 입니다. (65건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] "이미지도 자체 기술로"…脫 오픈AI 노린 MS, 멀티모달 경쟁 본격화

마이크로소프트(MS)가 자체 개발한 이미지 생성 모델 '마이(MAI)-이미지-2'를 최근 공개하며 인공지능(AI) 시장 주도권 확보 경쟁에 본격적으로 나섰다. 오픈AI 등 외부 모델 의존에서 벗어나 기술 내재화를 추진하는 동시에 코파일럿 중심 생태계를 강화하려는 전략적 행보로 풀이된다. 27일 업계에 따르면 MS는 지난 19일 자사 AI 슈퍼인텔리전스 팀이 개발한 텍스트-이미지 변환 모델 '마이-이미지-2'를 공개했다. 해당 모델은 성능 평가 플랫폼 아레나 리더보드에서 상위권에 오르며 구글, 오픈AI와 함께 글로벌 이미지 생성 경쟁 구도에 진입했다. 이번 모델은 무스타파 술레이먼 MS AI 최고경영자(CEO)가 이끄는 초지능 팀에서 개발됐다. MS는 이를 통해 이미지 생성 분야에서도 독자 기술 기반을 강화하겠다는 방침이다.술레이먼 CEO는 "우리는 이 모델 출시로 세계 3대 텍스트 이미지 변환 연구소로 도약하게 됐다"며 "초지능 팀은 앞으로 더 많은 것을 선보일 예정인 만큼 기대해 달라"고 밝혔다.이처럼 MS가 자체 모델을 전면에 내세운 것은 오픈AI에 대한 의존도를 낮추려는 전략으로 분석된다. MS는 그간 오픈AI에 대규모 투자를 단행하며 협력 관계를 유지해왔지만, 핵심 AI 기능을 외부에 의존할 경우 비용 부담과 서비스 통제력에 한계가 있다는 평가를 받아왔다. 이에 MS는 자체 모델 확보를 통해 비용 구조를 개선하고 기능, 정책, 업데이트 방향을 독자적으로 설계할 수 있는 기반 마련에 본격 나선 것으로 보인다. 기술 경쟁 측면에서는 멀티모달 AI 시장을 겨냥한 행보로 읽힌다. 최근 AI 산업은 빅테크를 중심으로 텍스트에서 이미지, 음성, 영상까지 아우르는 멀티모달로 빠르게 확장되고 있다. 단일 모델이 다양한 형태의 데이터를 이해하고 생성하는 능력도 플랫폼 경쟁력의 핵심 요소로 자리잡고 있다. 시장 성장세도 가파르다. 글로벌 시장조사업체 그랜드뷰리서치는 멀티모달 AI 시장이 2024년 약 17억3000만 달러에서 2030년 108억9000만 달러 규모로 확대될 것으로 내다봤다. 또 콘텐츠 제작, 광고, 게임, 커머스 등 산업 전반에서 시각 콘텐츠 자동화 수요가 급증하고 있어 멀티모달 영역이 향후 핵심 성장 축이 될 것으로 관측됐다. 이 같은 분위기에 맞춰 MS는 '마이-이미지-2'를 앞세워 멀티모달 시장 내 주도권을 잡기 위해 속도를 낼 것으로 보인다. '마이-이미지-2'는 자연광과 질감, 공간감을 정교하게 구현하는 사실감은 물론, 이미지 내 긴 문장과 복잡한 타이포그래피를 안정적으로 생성하는 기능을 핵심 경쟁력으로 내세웠다. 이는 기존 이미지 생성 모델의 한계로 지적되던 텍스트 표현 문제를 개선한 것으로, 디자인·콘텐츠 제작 영역까지 활용 범위를 넓힐 수 있다는 점에서 주목된다. 제품 전략 측면에서는 코파일럿 생태계와의 결합이 눈에 띈다. MS는 해당 모델을 '코파일럿'과 '빙' 이미지 생성기에 단계적으로 적용할 계획이다. 워드, 파워포인트 등 생산성 도구와 연계될 경우 문서 작성 과정에서 이미지 생성이 기본 기능으로 자리잡을 가능성이 높다. 이는 텍스트 중심 생산성 도구를 멀티모달 플랫폼으로 확장하려는 시도다. 기업 시장 공략도 병행된다. MS는 현재 일부 기업 고객을 대상으로 API를 제공하고 있으며 향후 마이크로소프트 파운드리를 통해 개발자 접근성을 확대할 예정이다. 또 광고·마케팅 기업 등 대량 이미지 생성 수요를 겨냥해 이미지 AI를 산업용 생산 도구로 확장하기 위해 적극 나설 것으로 보인다. 다만 현재 서비스는 기능과 정책 측면에서 일부 제약이 있다. 생성 속도 지연과 사용 횟수 제한, 이미지 비율 고정, 편집 기능 부재 등이 대표적이다. 콘텐츠 필터링 기준도 비교적 엄격하게 적용되고 있다. 이는 기업용 서비스에서 요구되는 안정성과 리스크 관리를 반영한 설계로 해석된다. 업계 관계자는 "MS가 이미지 생성까지 자체 모델로 내재화하면서 AI 경쟁의 판이 텍스트에서 멀티모달 전반으로 빠르게 확장되고 있다"며 "향후 플랫폼 주도권은 얼마나 다양한 데이터를 하나의 경험으로 통합하느냐에 달려 있을 것"이라고 말했다.

2026.03.27 15:56장유미 기자

멀티모달 AI '망각 현상' 외부저장법으로 해결했다…성능도 2배 개선

국내 연구진이 AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 문제를 원천적으로 해결했다. 지식 편집 성능도 2배이상 개선했다. 한국전자통신연구원(ETRI)은 임수종 언어지능연구실장 연구팀이 POSTECH(포항공대), 성균관대학교와 공동으로 '연속·복합 지식 편집 원천 기술(MemEIC)'을 개발했다고 24일 밝혔다. 이 기술은 지난해 미국 샌디에이고에서 열린 세계적인 인공지능 학술대회 '뉴립스(NeurIPS) 2025'에 채택, 공개됐다. 최근 챗GPT, 제미나이, 클로드 등 이미지와 텍스트를 동시에 이해하는 멀티모달 AI가 빠르게 확산되고 있다. 그러나 이들에는 맹점이 있다. AI가 새로운 정보를 배우거나 기존 정보를 수정하면, 예전에 배운 지식까지 함께 잊어버리는 '치명적 망각' 현상이 발생한다. 특히 시각 정보와 언어 정보를 동시에 수정해야 하는 경우 두 종류의 지식이 서로 섞이면서 AI가 제대로 이해하지 못해 복합적인 질문에 틀린 답을 내놓는 경우가 빈번하게 나타났다. 연구팀이 이 같은 문제를 해결할 지식 편집 AI 기술을 공개했다. 이 기술은 새로운 정보를 AI 내부가 아닌 외부 메모리(보조기억장치)에 저장한다. 필요할 때만 정보를 불러와 사용하기 때문에 기존 모델 안정성을 유지하면서도 새로운 정보를 유연하게 추가할 수 있다. 기존 방식에서는 AI 내부의 핵심 파라미터를 직접 수정해 지식을 바꾸는 방식이 주로 사용됐다. 이로 인해 지식을 수정하는 과정에서 기존에 저장된 정보까지 영향을 받을 수 있다는 한계가 있었다. 논문 주저자인 성진 언어지능연구실 연구원은 "사람의 뇌가 좌우로 나뉘어 서로 다른 역할을 하듯 AI도 지식을 나누어 저장하도록 만든 것"이라고 말했다. 성진 연구원은 상용화 관련 "메믹이 기존 기술 대비 우수한 성능을 나타내지만, 실사용을 위해선 정확도가 90% 정도는 되어야 한다고 본다"며 "올해 말 기술이전이 이루어질 것으로 예상한다"고 덧붙였다. 이미지 관련 시각 정보는 '시각 어댑터'에 저장하고, 텍스트 관련 언어 정보는 '언어 어댑터'에 각각 독립적으로 저장한다. AI가 이미지와 텍스트를 함께 이해해야 하는 복합적인 질문을 받으면 '지식 커넥터'가 두 정보를 문맥에 맞게 연결해 답을 만든다. 연구진은 기술 성능 확인을 위해 1,278개 항목으로 구성된 복합 지식 편집 벤치마크(CCKEB)를 구축하고, 수백 건의 지식을 순차적으로 편집하는 실험을 진행했다. 그 결과 이 기술은 복합 질문 정확도가 70% 수준으로 나타냈다. 이는 기존 기술들이 36~52% 수준이었던 것과 비교하면 두 배 이상 향상된 성능이다. 또한 새로운 지식을 추가한 뒤에도 기존 질문에 대한 답이 변하지 않아 응답 안정성이 유지되는 '지역성(Locality)' 보존 특성도 확인됐다. 임수종 언어지능연구실장은 “향후 산업 현장의 다양한 정보를 안정적으로 반영할 수 있도록 기술을 더욱 고도화할 것"이라고 덧붙였다.

2026.03.24 09:39박희범 기자

트웰브랩스, 게티이미지코리아에 영상 AI 검색 적용

트웰브랩스가 글로벌 스톡 플랫폼에 인공지능(AI) 영상 검색 기술을 제공했다. 트웰브랩스는 게티이미지코리아 게티이미지 뱅크에 영상 이해 AI 모델 '마렝고'를 공급했다고 23일 밝혔다. 이를 통해 약 10만 고객이 AI 기반 검색 기능을 활용할 수 있다. 이번 서비스는 기존 키워드 중심 검색에서 벗어나 영상 맥락과 의미를 이해하는 방식으로 전환된 것이 핵심이다. 이용자는 구체적인 문장 설명만으로 원하는 장면을 검색할 수 있다. 시스템은 시각 정보와 음성, 자막을 종합 분석해 결과를 제시한다. 그동안 게티이미지 등 스톡 미디어 플랫폼은 메타데이터와 태그 기반 검색에 의존했다. 콘텐츠는 급증했지만 검색 방식은 제한적이었고, 반복적인 필터링 작업이 필요했다. 이번 기술 도입으로 검색 구조 자체가 변화하며 제작 과정의 탐색 시간이 줄어들 것으로 예상된다. 마렝고는 영상 내 다양한 정보를 통합 분석하는 멀티모달 AI 모델이다. 단순 객체 인식을 넘어 장면 흐름과 의미를 이해하고 검색, 분류, 요약까지 수행할 수 있다. 글로벌 시장에서도 기술력을 인정받아 아마존웹서비스(AWS) 아마존 베드록에도 공급됐다. 트웰브랩스 이재성 대표는 "우리 영상 이해 AI 기술이 실제 서비스에 적용돼 사용자 가치를 창출하게 된 의미 있는 사례"라며 "앞으로도 미디어 산업에서 AI가 만들어내는 혁신적인 변화를 선도해 나가겠다"고 밝혔다.

2026.03.23 10:13김미정 기자

첫 투어 국가로 韓 낙점한 감마…AI로 데이터 시각화 지원

인공지능(AI) 콘텐츠 플랫폼 감마가 글로벌 사용자 투어 첫 국가로 한국을 점찍고 신규 디자인 서비스 '감마 이매진'을 포함해 다양한 신규 업데이트 서비스를 선보였다. 감마는 지난 17일 서울 강남구에서 미디어 라운드테이블을 열고 신규 업데이트 서비스를 소개했다. 감마는 프레젠테이션, 문서, 웹사이트, 소셜 게시물 등 비주얼 콘텐츠를 AI로 제작할 수 있는 글로벌 플랫폼이다. 사용자가 아이디어나 키워드를 입력하면 AI가 콘텐츠의 구조를 설계하고 시각 디자인까지 생성하는 것이 특징이다. 2020년 설립 이후 전 세계 약 1억 명의 사용자가 이용하고 있으며, 매일 약 100만 개의 콘텐츠가 제작되고 있다. 이번 업데이트는 역대 최대 규모로, 프레젠테이션·문서 제작 서비스에서 로고, 인포그래픽, 소셜 이미지 등 시각 콘텐츠까지 생성 가능한 비주얼 스토리텔링 플랫폼으로 영역을 확장했다. 감마 이매진은 로고, 인포그래픽, 다이어그램, 소셜 게시물 등을 AI로 구현하는 기능이다. 참고 이미지를 기반으로 특정 스타일을 반영할 수 있으며 여러 디자인 시안을 동시에 제공한다. 자연어 입력만으로 수정까지 가능해 별도의 디자인 프로그램이나 전문 인력 없이도 브랜드에 최적화된 결과물을 만들 수 있다고 회사 측은 설명했다. 이번 업데이트에서는 콘텐츠 재구성과 데이터 시각화를 지원하는 기능도 추가됐다. AI 네이티브 리믹스 템플릿은 기존에 만든 감마 콘텐츠나 템플릿을 기반으로 수정 사항을 입력하면 새로운 디자인을 자동으로 제작한다. 스마트 차트는 데이터를 입력하면 막대그래프, 산점도, 퍼널, 히트맵 등 다양한 형태의 시각 자료로 변환한다. 또한 자연어 입력만으로 로고, 마케팅 그래픽, 소설 이미지 등을 생성할 수 있는 AI 일러스트레이션 기능과 인포그래픽이나 다이어그램을 제작할 수 있는 AI 인포그래픽 기능도 제공한다. 생성된 결과물은 단독 이미지로 사용하거나 프레젠테이션과 문서에 바로 활용할 수 있다. 감마는 외부 업무 솔루션과의 연동도 확대했다. 챗GPT, 클로드, 메이크, 재피어(Zapier), 아틀라시안(Atlassian), 엔에잇엔(n8n), 슈퍼휴먼 고(Superhuman Go) 등 주요 AI 및 업무 솔루션과 연결돼 별도의 프로그램을 실행하지 않아도 기존 AI 어시스턴트나 업무 환경에서 바로 콘텐츠 제작이 가능하다. 그랜트 리 감마 대표는 "디자인 전문 지식 없이도 누구나 시각적으로 아이디어를 표현할 수 있도록 하는 것이 감마의 목표"라며 "감마 이매진을 통해 아이디어에서 결과물 도출까지의 시간을 줄이고 완성도를 높일 수 있을 것"이라고 말했다.

2026.03.18 08:30박서린 기자

한국신용데이터 "직접 만든 AI모델, 이미지 제작 일주일→1분"

한국신용데이터가 자체 이미지생성 인공지능(AI) 모델을 개발했다. 약 한 달 반 만에 만든 생성형 AI 모델인 '캐시노트 AI 비주얼 젠'은 기존 서비스처럼 원하는 프롬프트를 입력하면 약 1분 내외로 이미지를 뚝딱 만들어낸다. 단순히 필요한 이미지가 아니라 한국신용데이터의 브랜드 특성과 디자인 정체성이 반영돼 곧바로 업무에 활용할 수 있는 것이 기존 모델과의 차별점이자 특징이다. '캐시노트 AI 비주얼 젠' 개발을 이끈 인물은 이지스 브랜드 디자이너다. 그는 한국신용데이터가 만든 경영 관리 서비스 '캐시노트'의 브랜드 디자인과 자회사 5곳의 기업 브랜드를 맡고 있다. 이지스 한국신용데이터 브랜드 디자이너는 지난 11일 강남구 사무실에서 지디넷코리아와 진행한 인터뷰에서 '캐시노트 AI 비주얼 젠' 개발 과정을 소개했다. “다양한 소상공인들이 캐시노트 서비스를 이용하는 만큼 각 도메인의 특성을 포괄할 수 있는 지식재산권(IP)을 만들고자 했다. 한국신용데이터의 브랜드 특성, 디자인 톤앤매너, 컬러와 형태에 대한 규칙을 시스템화했다.” 캐시노트 AI 비주얼 젠은 주로 캐시노트 앱 서비스에 활용할 수 있는 인물 캐릭터나 음식 등의 이미지를 생성한다. 기존 2D 이미지를 시각적으로 구현한 3D 형태가 특징이다. 예를 들어 “중년 여자 사장님이 꽃을 들고 있는 이미지를 만들어줘”라고 입력하는 방식이다. 캐릭터의 성별과 연령대는 물론 표정이나 앞치마 색깔 등 세부 요소도 추가로 수정할 수 있다. 한국신용데이터가 시중에 나온 생성형 AI를 활용하는 대신 자체 개발을 선택한 이유는 경제성과 효율성 때문이다. 기업이 생성형 AI를 전사적으로 도입하려면 상당한 라이선스 비용이 발생한다. 가령 50명이 서비스형소프트웨어(SaaS) 도구를 사용할 경우 고정 비용이 크게 늘어나지만, 애플리케이션프로그래밍인터페이스(API)를 활용해 자체 구축할 경우 약 95%의 비용 절감 효과를 기대할 수 있다는 설명이다. “범용 모델과 달리, 자체 구축 모델은 디자이너가 아니더라도 프롬프트 입력만으로 실무에 바로 사용할 수 있는 디자인 결과물을 생성할 수 있다. 특히 한국신용데이터만의 정체성이 담긴 이미지를 곧바로 만들어낼 수 있다는 것이 장점이다.” 기존에는 이미지를 하나 제작하기 위해 기획과 리뷰, 피드백 과정을 거쳐 최소 일주일 이상이 소요됐다. 한국신용데이터에는 그래픽 디자이너가 두 명뿐이라 여러 부서에서 이미지 제작 요청이 몰리면 병목 현상이 발생하기도 했다. 그러나 '캐시노트 AI 비주얼 젠'을 활용하면서 복잡한 제작 과정을 거치지 않고 서비스나 광고 배너 등에 활용할 이미지를 약 1분 만에 만들 수 있게 됐다. 이지스 디자이너는 개발 과정에서 동료 개발자의 도움을 받았다. 바이브 코딩 방식으로 다양한 생성형 AI의 API를 활용했다. 그 중에서도 성능과 가격 측면에서 가장 합리적인 GPT-4o를 중심으로 활용하고 있다. “처음 개발에 도전하는 데다 참고할 레퍼런스도 거의 없어 쉽지 않았다. 우리 서비스의 고유 비주얼이 가진 형태적 특징, 컬러 값, 정서적 분위기, 표현 방식 등 디자이너의 감각적인 영역을 기계가 이해할 수 있는 명확한 언어와 수치로 '번역'하는 과정이 가장 중요하면서도 어려운 과제였다. 다행히 회사 동료들이 적극적으로 도와줘 실제 서비스로 실험적인 구현까지 완주할 수 있었다.” 한국신용데이터는 '캐시노트 AI 비주얼 젠'을 점차 고도화할 계획이다. 가령 기획을 입력하면 이에 최적화된 이미지를 자동으로 생성하고 추천하는 방향으로 확장할 예정이다. 나아가 해당 이미지를 접한 사용자의 행동, 구매 전환율, 클릭률 등의 데이터를 기반으로 추천 기능까지 구현한다면 사업 효율성을 높일 수 있을 것으로 기대하고 있다.

2026.03.15 09:15홍하나 기자

"AI와 대화하며 작업"…어도비, AI 이미지 편집 기능 발표

어도비가 포토샵·파이어플라이에 대화형 인공지능(AI) 편집 기능을 확대해 자동화 업무 수준을 높였다. 어도비는 포토샵 웹과 모바일용 'AI 어시스턴트' 공개 베타 버전, '파이어플라이 이미지 에디터'를 11일 발표했다. 이번 기능은 대화형 AI를 통해 복잡한 이미지 편집 작업을 보다 효율적으로 수행하도록 돕는다. 포토샵 AI 어시스턴트는 채팅 기반 인터페이스를 통해 사용자 편집 의도를 이해하고 작업을 자동으로 수행하거나 단계별로 안내한다. 배경 제거·변경, 색상 조정, 조명 보정 등 주요 편집 작업을 자동 적용할 수 있다. 사용자는 음성으로도 편집 요청을 할 수 있다. 이를 통해 이동 중 모바일 환경에서 간편하게 이미지 편집 작업을 수행할 수 있다. 포토샵 웹에서는 'AI 마크업' 기능이 공개 베타로 제공된다. 사용자가 이미지 특정 영역을 표시한 뒤 프롬프트를 입력하면 해당 영역에 원하는 요소를 생성하도록 제어할 수 있다. 예를 들어 이미지 위 특정 영역을 표시한 뒤 '꽃 추가' '산 추가' 같은 프롬프트를 입력하면 해당 위치에 맞춰 새로운 이미지를 생성할 수 있다. 어도비는 파이어플라이 이미지 에디터를 통해 생성형 이미지 편집 기능을 통합했다. AI 생성 이미지와 사용자가 업로드한 이미지를 동일한 편집 환경에서 수정할 수 있도록 설계됐다. 파이어플라이 이미지 에디터는 생성형 채우기, 생성형 제거, 생성형 확장, 생성형 업스케일 배경 제거 등 주요 AI 편집 기능을 제공한다. 사용자는 프롬프트 기반으로 이미지 요소 추가, 교체, 보정, 확장, 해상도 개선 작업을 수행할 수 있다. 파이어플라이는 어도비 파이어플라이 모델 외에도 외부 AI 모델을 선택해 사용할 수 있도록 지원한다. 구글 '나노 바나나 2'를 비롯한 오픈AI 이미지 생성 등 25개 이상 모델을 지원한다.

2026.03.11 12:56김미정 기자

신입구직자는 '삼성', 경력직은 'SK' 선호...왜?

이번 달 삼성과 SK 등 주요 대기업들의 상반기 채용이 본격화되는 가운데, 진학사 캐치가 Z세대가 바라본 삼성과 SK의 기업 이미지를 AI로 시각화해 눈길을 끌고 있다. 캐치는 대학생·취준생·직장인 1만986명을 대상으로 진행한 '상위 그룹사 이미지 및 인식 조사' 결과를 6일 발표했다. 이번 조사는 구직자들이 선택한 기업 이미지 키워드를 AI 모델 '제미나이'에 입력해 각 그룹사를 대표하는 시각 이미지를 생성하는 방식으로 진행됐다. 먼저 구직자가 인식하는 삼성의 1위 키워드는 '글로벌(57%)'이었다. 이어 ▲업무강도 높은(48%) ▲기술주도(45%)가 뒤를 이으며 글로벌 시장을 선도하는 기술 중심 기업이라는 이미지가 구직자들에게 각인된 것으로 분석된다. AI는 이를 세련된 오피스 룩을 입고 태블릿과 캔 음료를 들고 있는 도시적이고 전문적인 여성 이미지로 생성했다. 반면 SK의 경우 '확실한 보상(54%)'이 1위 키워드로 꼽혔다. 뒤이어 ▲업무강도 높은(44%) ▲기술주도(41%) 순으로 나타나며 체감도 높은 보상 시스템이 SK의 대표 이미지로 자리 잡은 것으로 분석된다. AI는 이를 따뜻한 색감의 옷을 입고 카페에서 스마트폰과 커피를 즐기는 편안한 인상의 남성 이미지로 생성했다. 조사 결과에서 눈길을 끄는 부분은 연차에 따른 선호도 차이였다. 신입 구직자의 과반수(56%)는 삼성을 택했지만, 이직을 준비하는 경력직 구직자들은 SK(57%)를 더 선호했다. 사회 초년생은 글로벌 위상과 네임밸류를 중시하는 경향이 강한 반면, 직장 경험이 쌓일수록 실질적인 보상과 성과 시스템을 중요하게 고려하는 것으로 분석된다. 진학사 캐치 김정현 본부장은 “설문 데이터를 넘어 AI 기술로 구직자들의 인식을 시각화해 보니 그룹사별 이미지가 더욱 선명하게 드러났다”며 “채용 시장에서도 일방적인 홍보가 아닌 데이터와 구직자 트렌드에 기반한 타깃 맞춤형 브랜딩이 필수적인 시대”라고 강조했다. 삼성전자와 SK하이닉스는 이달 상반기 채용을 통해 반도체 인재 확보에 나설 예정이다. 삼성전자를 비롯한 삼성디스플레이, 삼성전기, 삼성SDI 등 주요 삼성 계열사는 이달 중순 신입사원 공개 채용을 시작할 것으로 알려졌으며, SK하이닉스 역시 반도체 연구개발(R&D) 등 핵심 분야 중심의 신입 채용을 진행할 계획이다.

2026.03.06 08:54백봉삼 기자

최 고 마크애니 대표 "AI 콘텐츠 워터마크, 국제 규격 C2PA로 가야"

"인공지능(AI) 생성 콘텐츠의 투명성을 확보하기 위해 대한민국이 독자적인 기준을 세우기보다 국제 표준인 C2PA(콘텐츠 출처 및 진위 확인을 위한 연합)를 적극 수용해야 합니다. 국내만의 별도 표준은 자칫 글로벌 흐름에서 뒤처지는 '갈라파고스적 규제'가 될 수 있습니다." 최고 마크애니 대표는 25일 서울 서초구 드림플러스 강남에서 개최된 'AI 투명성 법·제도 세미나'에서 이같이 강조했다. AI 기본법 시행으로 워터마크 부착이 의무화된 가운데, 최 대표는 기술적 파편화를 막고 글로벌 상호운용성을 확보해야 한다고 강조했다. 구글 제미나이, 오픈AI 챗GPT 등 생성형 AI가 생성한 이미지나 영상에는 워터마크가 붙어 있다. 생성형 AI를 통해 생성한 콘텐츠임을 확인시키기 위해 조그맣게 로고를 표시한 것이다. 일종의 증명인 셈이다. 이런 워터마크는 여러 종류가 있다. 먼저 생성형 AI가 생성한 콘텐츠에 붙는 워터마크는 '가시성 워터마크'다. 가령 제미나이를 통해 이미지를 생성하면 반투명한 로고가 우측 하단에 붙는 식이다. 가시성 워터마크는 생성형 AI를 통해 생성한 콘텐츠임을 증명하는 흔적을 누구나 쉽게 지울 수 있다는 단점이 있다. 포토샵으로 워터마크 자체를 지워버릴 수도 있고, 이미지를 조금만 확대해 잘라내도 워터마크를 없앨 수 있다. 이런 한계를 극복한 워터마크가 '비가시성 워터마크'다. 위조가 불가능한 고유한 서명을 이미지나 영상에 보이지 않게 부여한 것이다. 최 대표는 "할리우드 영화를 보면 매 프레임마다 화면 전체에 모두 비가시성 워터마크가 적용돼 있다. 보이지 않기 때문에 워터마크가 없다고 느낄 수 있지만, 고유 ID가 포함돼 있다"며 "예를 들어 네이버 TV를 본다면 네이버 TV라는 서명(ID)이 박혀 있고, 이를 시청하는 사용자의 ID가 포함돼 있다"고 설명했다. C2PA는 어도비, 마이크로소프트, 구글 등이 주도해 만든 개방형 비가시성 워터마크 기술이자 국제 표준이다. 마크애니는 C2PA 기술을 통해 위조가 불가능한 서명을 콘텐츠에 부여해 무결성을 확보한다. 디지털 콘텐츠가 진짜인지 AI가 생성한 것인지 확인할 수 있는 보이지 않는 수단을 제공하고 있는 것이다. 최 대표는 AI 기본법에 한국만의 표준을 적용기 보다는 국제 표준 C2PA를 따르는 방향으로 나아가야 한다고 주장했다. 그는 "삼성전자도 C2PA 메타데이터를 채택하고 있다. 여러 업체들이 C2PA에 올라타야 하는 상황인데, 대한민국만의 기준을 만들면 국제 표준도 준수해야 하고 국내의 기준도 맞춰야 하는 등 혼선만 초래할 수 있다"며 "C2PA는 무료다. 누구나 쓸 수 있는 오픈소스 형태로 돼 있기 때문에 일부 기업에 이권 사업이 될 확률이 매우 적다. 오히려 한국만의 표준을 만들면 이권 사업이 되는 것처럼 비춰질 수 있다"고 우려했다. 최 대표는 "단지 마크애니는 오픈소스인 C2PA를 스타트업 등 사용자가 쓰기 쉬운 형태로 무료배포하고 있을 뿐"이라며 "AI 기본법 준수 과정에서 겪은 어려움을 최소화하기 위해 지속적으로 지원하겠다"고 밝혔다.

2026.02.25 18:39김기찬 기자

비즈하우스, 소상공인 브랜드 조사 선호도·이용 의향 1위

미리디(대표 강창석)가 운영하는 온라인 디자인 인쇄 커머스 '비즈하우스'가 소상공인 대상 브랜드 인식 조사에서 선호도와 이용 의향 모두 1위를 기록했다고 25일 밝혔다. 비즈하우스가 리서치 전문 기관 마켓링크에 의뢰해 진행한 이번 조사는 지난 12월 1일부터 12일까지 전국 20~59세 소상공인 500명을 대상으로 실시됐다. 비즈하우스를 포함한 국내 주요 온라인 인쇄 플랫폼 6개 브랜드의 선호도, 이용 의향, 브랜드 이미지 등을 평가했다. 조사 결과, 비즈하우스는 최초 상기도가 2024년 대비 약 2배 상승했으며 브랜드 인지자 대상 선호도 1위(54.2%)를 차지했다. 향후 이용 의향 역시 65.3%로 가장 높았고, 브랜드 친숙도(55.6%)와 관심도(59.0%)에서도 긍정적인 평가를 받았다. 실제 서비스 이용자 평가에서도 강세를 보였다. 인쇄 서비스 이용 만족도와 추천 의향 모두 83.3%로 1위를 기록했다. 회사 이미지 평가의 경우, '디자인이 좋음'(83.3%), '회사의 신뢰성'(82.6%), '편리한 이용 가능'(80.6%) 등 주요 항목에서 높은 점수를 얻었다. '합리적인 가격' 항목에서 56.9%를 받으며, 가격 경쟁력과 품질 신뢰도를 동시에 인정받았다. 브랜드 이미지에서는 '세련되고 스타일리시함'(81.9%), '전문적인 이미지'(81.9%), '실용적인 이미지'(78.5%) 등에서 우수한 평가를 받아, 소상공인들에게 전문성과 실용성을 갖춘 브랜드로 인식되는 것으로 나타났다. 비즈하우스 관계자는 “이번 조사를 통해 비즈하우스가 합리적인 가격과 믿을 수 있는 품질을 원하는 소상공인의 니즈를 충족하고 있음을 확인했다”며 “앞으로도 소상공인의 사업 성장을 돕는 파트너로서 서비스를 강화해 나가겠다”고 말했다.

2026.02.25 14:00백봉삼 기자

클립아트코리아, 브랜딩 디자인 패키지 '컴퍼니 애니버서리 킷' 출시

스톡 이미지 기업 클립아트코리아가 창립 기념일을 기념하기 위해 브랜딩 디자인 패키지인 '컴퍼니 애니버서리 킷(Company Anniversary Kit)'을 2월 2일에 출시했다. 클립아트코리아는 사진, 일러스트, 영상, 아이콘 등 139만 건 이상의 저작권 안정성이 확보된 콘텐츠를 제공하는 스톡 이미지 플랫폼으로, 기업•공공기관•디자이너를 중심으로 다양한 비즈니스 현장에서 활용되고 있다. 컴퍼니 애니버서리 킷은 클립아트코리아가 30년간 축적한 콘텐츠 자산과 디자인 노하우를 바탕으로, 기업의 연혁과 성과, 미래 비전을 하나의 시각적인 메시지로 제공하는 올인원 브랜딩 디자인 패키지다. 기념 엠블럼 기획을 비롯해 포스터, 기업&브랜드 영상, 기념 캘린더 등 다양한 디자인을 온•오프라인 전반에서 활용할 수 있도록 제공한다. 클립아트코리아는 ▲30년간 축적된 디자인 제작 경험 ▲다양한 사업군에서 활용 가능한 대규모 콘텐츠 라이브러리 ▲한국저작권위원회 인증 콘텐츠 기반으로 기업이 안심하고 활용할 수 있는 완성도 높은 디자인을 제공한다. 클립아트코리아 관계자는 “컴퍼니 애니버서리 킷은 일회성 기념일 디자인에 그치지 않고, 기업의 핵심 메시지를 장기적으로 활용할 수 있는 브랜드 자산”이라며 “기업의 정체성과 스토리를 효과적으로 전달할 수 있도록 기획된 패키지”라고 말했다. 자세한 정보는 클립아트코리아 공식 웹사이트에서 확인할 수 있다.

2026.02.03 08:49이정현 미디어연구소

라이온하트스튜디오 '발할라서바이벌', 프로필 이미지 콘테스트 개최

라이온하트 스튜디오(의장 김재영)는 핵앤슬래시 로그라이크 '발할라 서바이벌'에서 프로필 이미지 콘테스트를 개최한다고 27일 밝혔다. 이번 행사는 다음달 9일까지 '2026년 새해'를 주제로 한다. 공식 라운지와 디스코드에서 실시하며, JPG와 PNG 등 자유로운 파일 형식으로 제출하면 된다. 1위 수상작은 게임 내 프로필 이미지로 제작된다. 다이아와 영광의 보석 1회 소환권 50개도 보상으로 지급된다. 콘테스트에 참여한 모든 이용자에게는 영광의 무기 1회 소환권 50개와 영광의 보석 1회 소환권 50개가 제공된다. 이와 함께 오는 29일까지 스크린샷 이벤트가 진행된다. 참여자 전원에게는 축복의 무기 소환권 25장, 영광의 무기 소환권 15장, 골드 주머니 10개가 보상으로 주어진다. 라이온하트 스튜디오 관계자는 "이번 이벤트를 통해 게임 세계관과 캐릭터에 대한 애정을 자유롭게 표현하고, 커뮤니티 내에서 소통을 즐길 수 있는 계기가 되기를 바란다"고 전했다.

2026.01.27 14:23진성우 기자

컬리, 이미지 생성 서비스 'AI 스튜디오' 출시

리테일 테크 기업 컬리는 인공지능(AI) 이미지 생성 서비스 'AI 스튜디오'를 출시했다고 20일 밝혔다. AI스튜디오는 구글의 생성형 AI만을 활용해 구현됐다. AI 스튜디오는 사진을 업로드하면 ▲인형 ▲영화배우 ▲옛날 캠 ▲한복 등 다양한 테마의 프로필 사진을 만들어 주는 서비스로 컬리 앱에서 이용할 수 있다. AI 스튜디오는 지난 달 중순 ▲기획자 ▲엔지니어 ▲디자이너 ▲마케터 등 컬리 사내 구성원들이 사이드 프로젝트로 시작해 지난 12일 공개됐다. 컬리 고객에게는 AI스튜디오 이용권이 하루 한 장씩 주어진다. 이미지 생성 시 이용권이 차감되며, 친구에게 공유한 링크로 이미지가 생성되면 한 장 더 받을 수 있다. 컬리 AI 스튜디오는 공개 일주일만에 누적 7만여 건의 이미지 생성을 기록했다. 이외에도 그동안 컬리는 고객이 앱에서 즐길 수 있는 다양한 기능을 구현해왔다. 컬리 앱 하단 '라운지'에서는 나만의 컬리 라이프를 소개할 수 있다. 좋아하는 상품을 추천하는 '마이 컬리템'과 투표, 추천 등을 통해 다른 이용자들과 의견을 공유할 수 있는 '커뮤니티' 등이 대표적이다. 컬리는 지난해 하반기 컬리 앱과 연동할 수 있는 AI 식단 관리 앱 '루션'도 선보였다. 컬리 관계자는 “AI 스튜디오는 고객이 앱 내에서 쇼핑뿐 아니라 즐겁게 머물 수 있는 다양한 경험 제공을 고민하다 기획하게 됐다”며 “리테일 테크 기업으로서 앞으로도 AI 기술을 접목해 고객의 라이프스타일을 다양하게 만들 수 있는 시도를 이어갈 계획”이라고 말했다.

2026.01.20 10:06박서린 기자

"성착취물 생성 멈춰"...美 검찰, 일론머스크 'xAI' 경고

일론 머스크가 이끄는 인공지능(AI) 스타트업 xAI가 생성형 챗봇 '그록(Grok)'을 둘러싼 성적 딥페이크 논란으로 미국 사법당국의 직접 제재에 직면했다. 17일(현지시간) 테크크런치 등 외신에 따르면 캘리포니아주 검찰총장실은 최근 xAI에 시정명령 서한을 발송하고, 비동의 성적 이미지와 아동 성착취물(CSAM) 생성 행위를 즉각 중단하라고 요구했다. 앞서 검찰총장실은 그록이 여성과 미성년자를 대상으로 한 비동의 성적 이미지 제작에 활용되고 있다는 신고를 접수하고 조사에 착수했다. 롭 본타 캘리포니아주 검찰총장은 “딥페이크 기반 비동의 친밀 이미지와 아동 성착취물의 제작은 명백한 불법”이라며 “캘리포니아는 해당 행위에 대해 무관용 원칙을 적용한다”고 강조했다. 검찰은 xAI가 비동의 누드 이미지의 대량 생산을 사실상 가능하게 하고 있으며, 이 콘텐츠가 온라인에서 여성과 소녀를 괴롭히는 수단으로 활용되고 있다고 지적했다. xAI에는 향후 5일 이내에 구체적인 개선 조치를 입증하라는 요구도 전달됐다. 이번 논란의 핵심은 그록의 '스파이시 모드'다. 해당 기능은 노골적인 콘텐츠 생성을 허용하도록 설계돼, 비동의 성적 이미지 제작에 악용될 소지가 크다는 비판을 받아왔다. 이런 문제는 미국을 넘어 글로벌 이슈로 확산되고 있다. 일본, 캐나다, 영국은 관련 조사에 착수했으며, 말레이시아와 인도네시아는 그록 접근을 일시적으로 차단했다. xAI는 지난 15일 이미지 편집 기능에 일부 제한을 추가했지만, 캘리포니아주 검찰은 이를 충분한 조치로 보지 않고 시정명령을 강행했다. X 안전 관련 계정은 “불법 콘텐츠를 제작하거나 이를 유도하는 이용자는 직접 불법 콘텐츠를 업로드한 것과 동일한 처벌을 받게 될 것”이라고 밝힌 바 있다.

2026.01.18 08:57안희정 기자

"큰 모델보다 쓰임새"…네이버클라우드, 옴니모달 AI 전략 승부수

네이버클라우드가 범용 대규모언어모델(LLM) 경쟁을 넘어 텍스트·이미지·음성·도구 활용을 하나의 모델로 통합하는 '옴니모달 인공지능(AI)' 전략을 전면에 내세웠다. 상대적으로 작은 모델부터 시작해 점진적으로 고도화하는 방식으로, 현실 환경을 이해하고 행동하는 AI 에이전트 구현을 목표로 차세대 파운데이션 모델 경쟁에서 기술적 차별화를 강조했다. 네이버클라우드는 30일 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 서울 코엑스에서 개최한 '독자 AI 파운데이션 모델 1차 대국민 발표회'에서 옴니모달 기반 파운데이션 모델과 이를 적용한 다양한 AI 서비스를 공개했다. 이날 네이버클라우드는 옴니 파운데이션 모델 전략을 제시했다. 전시 부스에서는 텍스트·이미지·오디오 등 서로 다른 형태의 데이터를 단일 모델에서 처음부터 함께 학습하는 네이티브 옴니모달 구조의 '하이퍼클로바X 시드 8B 옴니'와 복합 추론 능력을 강화한 '하이퍼클로바X 시드 32B 씽크' 두 가지 모델을 공개했다. 8B급 옴니모델은 규모는 비교적 작지만 멀티모달 입력을 단일 모델 구조에서 처리할 수 있도록 설계된 것이 특징이다. 텍스트·이미지·음성을 각각 다른 모델로 처리해 결합하는 기존 방식과 달리, 처음부터 하나의 의미 공간에서 학습해 응답 속도와 효율성을 높였다. 네이버클라우드는 이 모델을 시작점으로 삼아 데이터 확장과 학습 고도화를 통해 단계적으로 스케일업할 계획이다. 함께 공개된 32B급 씽크 모델은 옴니모달 입력을 바탕으로 추론과 문제 해결에 초점을 맞췄다. 이미지 이해, 음성 대화, 도구 활용 능력을 결합해 복합적인 요청을 처리하는 에이전트형 AI 경험을 구현하며 수학 문제 풀이나 시각 정보 기반 추론 등 고난도 작업을 수행하는 시연이 이뤄졌다. 부스에서는 이들 모델을 적용한 다양한 체험형 서비스도 공개됐다. 이미지 촬영만으로 문제를 이해하고 풀이 과정을 설명하는 AI 수학 에이전트, 민원 행정 상담을 돕는 AI 아바타, 법률 상담 챗봇, 감정 상담을 지원하는 마음 케어 아바타 등 공공·생활 밀착형 서비스가 관람객의 이목을 끌었다. 네이버클라우드는 이번 독자 AI 파운데이션 모델 프로젝트를 통해 대규모 파라미터 경쟁보다는 작은 모델을 촘촘하게 다져 키운다는 전략이다. 실제 서비스 환경에서 비용과 개발 부담을 줄이기 위해 8B·32B급 모델에서 옴니모달 구조와 추론 성능을 충분히 검증한 뒤 단계적으로 모델 규모를 확대하겠다는 구상이다. 이를 바탕으로 산업 및 공공 영역으로의 확장도 염두에 두고 있다. 네이버클라우드는 농기계와 모빌리티 등 다양한 산업 현장에서 음성·시각·공간 정보를 동시에 이해하는 AI 에이전트 활용 가능성을 제시하며 물리적 환경과 상호작용하는 피지컬 AI로의 진화를 준비 중이라고 설명했다. 네이버클라우드 관계자는 "옴니모달 AI는 단순히 모델을 크게 만드는 문제가 아니라, 현실 세계의 맥락을 얼마나 정교하게 이해하느냐가 핵심"이라며 "8B급 모델부터 차근차근 고도화해 나가며 산업과 일상에서 실제로 쓰이는 옴니 AI 에이전트를 구현해 나가겠다"고 말했다.

2025.12.30 14:40한정호 기자

알리·테무 초저가 브랜드상품, 알고보니 '가짜'

알리익스프레스·테무 등 해외 온라인플랫폼에서 정상 판매가 대비 최대 10분의 1 이상 저렴하게 판매되던 일부 브랜드 제품 중 전체가 가품으로 판명됐다. 서울시는 24일 해외 플랫폼에서 판매 중인 8개 브랜드의 10개 제품을 대상으로 국가공인시험 기관인 카트리(KATRI)시험연구원에 분석을 진행한 결과, 전부 정품과 일치하지 않았다고 밝혔다. 점검 대상은 화장품 5개, 주방용품 3개, 소형가전·패션잡화 각각 1개다. 이들은 정상 가격보다 평균 65%, 최대 91% 낮은 가격에 판매됐다. 화장품은 4개 브랜드 5개 제품 모두 용기 디자인과 색상이 달랐고, 로고 위치와 표시 사항도 일치하지 않은 것으로 확인됐다. 향수 2개는 정품과 향이 구별됐고, 기초와 색조 화장품 3개는 성분 구성이 정품과 차이 났다. 주방용품 분석 대상은 수세미·정수기·정수필터 각각 1개로, 이들은 전체적으로 외관 디자인과 색상이 달랐고 제품 로고가 없었다. 그 중에서도 정수기 필터는 정품과 설계 구조가 차이를 보였다. 소형가전은 헤드폰 1개를 분석했으며 제품 색상과 로고 글씨체 등 세부 디자인이 정품과 달랐다. 가죽 커버의 봉제 마감이 정밀하지 않았고 가죽 성분도 정품과 일치하지 않았다. 패션 잡화인 핸드폰 케이스는 정품 라벨이 없었고 제품 색상과 디자인도 정품과 달랐다. 제품 하단의 저작권 표시 문구 글씨체도 정품과 차이를 보였다. 온라인 플랫폼 판매자가 브랜드명 또는 정품 이미지를 무단 사용하는 사례가 많아 위조 여부를 판단하기 어렵다는 것이 서울시 측 설명이다. 그러면서 지식재산처 키프리스(KIPRIS)를 통해 등록된 상표와 로고 디자인을 확인하고 제품 설명과 후기, 공식 홈페이지 상품 이미지와 비교한 후 구매할 것을 당부했다. 또 서울시는 이번 조사 결과를 기반으로 해외 온라인플랫폼에 해당 제품의 판매 중단을 요청했다. 앞으로도 안전성 검사와 위조 상품 유통 실태 점검을 통해 소비자 피해를 예방한다는 계획이다. 김명선 서울시 공정경제과장은 “가격만 보고 구매할 경우 안전성이나 품질 측면에서 큰 피해로 이어질 수 있음을 확인한 사례”라며 “화장품과 주방용품처럼 인체와 밀접한 제품은 가격보다 안전성을 우선해 공식 판매처 여부와 제품 정보를 꼼꼼히 확인한 뒤 구매하길 바란다”고 강조했다.

2025.12.24 09:04박서린 기자

인포뱅크, AI 오케스트레이션 '오르카' 출시…기업 시장 공략 가속

인포뱅크가 30년간 축적해 온 자체 개발 역량을 기반으로 기업 커뮤니케이션을 넘어 인공지능(AI)·데이터 중심 솔루션 영역으로 사업을 확장한다. 인포뱅크는 자사 AI 협업 플랫폼 '인세븐'에 자체 개발한 AI 오케스트레이션 시스템 '오르카'를 정식 출시했다고 22일 밝혔다. 최근 엔비디아를 비롯한 글로벌 기업들은 '툴오케스트라' 개념을 제시하며 다중 AI 모델 활용을 차세대 핵심 기술 방향으로 제안하고 있다. 그러나 실제 기업 현장에서는 업무별로 서로 다른 AI 모델을 개별 구독해야 하는 구조로 인해 비용 부담과 운영 복잡성이 커지는 상황이다. 이러한 비효율이 AI 전환(AX)을 가로막는 주요 장애 요인으로 지적돼왔다. 이번에 공개된 오르카는 다양한 글로벌 대규모언어모델(LLM)을 자동으로 선택·조합해 업무 상황에 가장 적합한 모델을 실시간으로 적용하는 AI 오케스트레이터로, 다중 모델을 유기적으로 활용하는 글로벌 AI 기술 흐름에 대응해 개발됐다. 업무 목적과 질문 난이도를 분석해 최적의 AI 모델을 자동 라우팅함으로써, 기업이 모델 선택에 대한 부담 없이 성능과 비용을 동시에 최적화할 수 있도록 지원한다. 이번 시스템은 실무 활용 시나리오를 기준으로 총 4종의 라인업으로 구성됐다. ▲반복 업무와 검색·요약에 적합한 경량 모델 '오르카 라이트' ▲번역과 보고서 작성 등 범용 업무를 지원하는 '오르카 플러스' ▲고급 추론과 전략적 의사결정을 돕는 '오르카 프로' ▲개발·코딩 업무에 특화된 '오르카 코더' 등으로 구성돼 직무와 목적에 따라 유연한 활용이 가능하다. 인세븐은 오르카 라인업 내 고사양 모델을 기존 대비 약 10% 낮은 비용으로 제공한다. 자동 라우팅 기능과 비용 최적화 로직을 결합해 기업의 AI 모델 사용 비용을 구조적으로 절감하도록 설계됐다. 또 복수 모델을 개별 구독해야 했던 기존 방식과 달리 오르카 기반의 단일 인터페이스만으로 필요한 모델을 자동 활용할 수 있어 운영 효율성 향상도 돕는다. 아울러 인세븐은 구글 제미나이 기반 이미지 생성 모델 '나노 바나나'의 플래시·프로 버전도 새롭게 선보였다. 사용자는 텍스트 질의만으로 고속 이미지 생성은 물론 장면 재구성이나 기존 이미지 요소를 유지한 편집까지 즉시 수행할 수 있어 마케팅·디자인·기획 등 시각 중심 업무의 효율을 높일 수 있다. 특히 인세븐의 자연어 처리 기능과 결합해 텍스트 분석 결과를 이미지로 바로 구현하는 '텍스트-이미지 통합 워크플로우' 활용도 가능하다. 인세븐은 최신 글로벌 AI 모델을 신속하게 도입하고 산업별 요구에 맞춘 오케스트레이션과 딥리서치 기능을 지속 고도화할 예정이다. 이를 통해 제조·금융·유통·헬스케어 등 다양한 산업 군을 아우르는 기업용 AI 분석 생태계를 단계적으로 확장해 나갈 계획이다. 인포뱅크 강진범 최고기술책임자(CTO)는 "글로벌 AI 기업들이 다중 모델 오케스트레이션을 핵심 경쟁 기술로 제시하고 있는 가운데, 인세븐은 국내에서 가장 빠르게 독자적인 오케스트레이션 시스템을 구축했다"며 "오르카는 기업이 모델 선택을 고민하지 않고도 최고 성능을 최소 비용으로 활용할 수 있게 해주는 출발점이 될 것"이라고 강조했다. 이어 "앞으로 직무별·산업별 특화 모델과 에이전트를 지속 고도화해 단순 답변 생성을 넘어 기업의 실질적인 디지털 전환을 가속화하는 AI 파트너로 자리매김할 것"이라고 덧붙였다.

2025.12.22 16:10한정호 기자

이미지 생성 AI 모델 경쟁 심화…오픈AI, 'GPT 이미지 1.5' 공개

오픈AI가 이미지 생성과 편집 성능을 강화한 새로운 모델을 선보이며 생성형 인공지능(AI) 이미지 시장 경쟁에 다시 불을 지폈다. 기존보다 정교한 지시 수행과 빠른 처리 속도를 앞세워 이미지 생성 도구를 실험 단계를 넘어 실사용 중심의 창작·업무 도구로 끌어올린다는 전략이다. 17일 테크크런치에 따르면 오픈AI는 새로운 이미지 생성 모델 'GPT 이미지 1.5'를 기반으로 한 챗GPT 이미지의 업데이트를 발표했다. 이번 모델은 지시 이행 정확도 향상, 세밀한 이미지 편집, 최대 4배 빠른 이미지 생성 속도가 특징으로, 모든 챗GPT 사용자에 순차적으로 제공된다. GPT 이미지 1.5는 오픈AI가 구글의 제미나이 시리즈와 이미지 생성 모델 경쟁을 본격화하는 과정과 맞물려 공개됐다. 구글이 최신 플래그십 모델과 이미지 생성기 '나노 바나나 프로'로 시장 점유율을 확대하는 가운데, 오픈AI가 이미지 모델 출시 시점을 앞당긴 것으로 풀이된다. 오픈AI의 이전 이미지 모델 출시는 지난 4월이었다. 이번 업데이트의 핵심은 반복 편집과 일관성이다. 기존 생성형 이미지 도구들이 특정 요소만 수정해 달라는 요청에도 이미지 전체를 다시 해석하는 한계가 있었던 반면, GPT 이미지 1.5는 얼굴 생김새, 조명, 구도, 색감 등 핵심 시각 요소를 유지한 채 요청한 부분만 정밀하게 수정할 수 있다. 이를 통해 실용적인 사진 보정은 물론 의상·헤어스타일 시뮬레이션, 원본 이미지를 유지한 스타일 변환 작업이 가능해졌다. 텍스트 렌더링 성능도 개선됐다. 작은 글자나 복잡한 텍스트 배치에서도 가독성이 높아졌으며 다수의 인물이 등장하는 이미지에서 얼굴 표현의 자연스러움도 향상됐다. 오픈AI는 이러한 개선을 통해 단순 이미지 생성뿐 아니라 마케팅·디자인·이커머스·커뮤니케이션 등 비즈니스 워크플로우 전반에서 활용도를 높일 수 있다고 설명했다. 사용자 경험 측면에서도 변화가 있다. 챗GPT 내부에 이미지 전용 공간이 새롭게 마련돼 모바일 앱과 웹 사이드바에서 접근할 수 있다. 사전 설정된 필터와 트렌드 기반 프롬프트를 활용해 보다 직관적인 이미지 탐색과 반복 시도가 가능해졌다. 오픈AI는 이 공간을 '크리에이티브 스튜디오'에 가깝게 설계했다고 밝혔다 . 다만 오픈AI는 이번 업데이트가 의미 있는 진전이지만 완성 단계는 아니라고 평가했다. 다양한 테스트 사례에서 성능 개선이 확인됐으나, 여전히 반복적인 개선이 필요한 영역이 남아 있으며 향후 업데이트를 통해 품질을 지속적으로 끌어올릴 계획이다. 피지 시모 오픈AI 애플리케이션 부문 CEO는 "챗GPT 사용자의 생각과 그것을 현실로 구현하는 능력 사이의 거리를 계속 좁혀 나가겠다"고 강조했다.

2025.12.17 15:04한정호 기자

통로이미지, 적십자 회비모금유공 '서울시장표창' 수상

대한적십자사 서울특별시지사(회장 권영규)는 통로이미지(대표 이철집)가 대한적십자사 회비모금 유공 기업으로 '서울특별시장 표창'을 수상했다고 밝혔다. 이번 표창은 대한적십자의 인도주의 활동을 위한 회비모금에 기여한 단체 또는 개인에게 수여되는 상으로, 통로이미지는 2014년도 적십자회비 납부를 시작으로 2018년부터 매월 정기기부를 이어오며 지역사회복지 증진을 위한 지속적인 나눔을 실천해왔다. 적십자사 서울지사는 서울 중구에 위치한 통로이미지에 방문해 이철집 통로이미지 대표에게 서울특별시장 표창장을 전달했다. 이철집 통로이미지 대표는 “지역사회에 보탬이 되고자 시작한 나눔 활동이 도움이 되어 표창을 받게 되어 뜻 깊다”며, “주변의 어려움을 적극적으로 살피며 사회적 책임을 다하는 기업이 되겠다”고 말했다. 한편, 통로이미지는 정기적으로 지역사회를 위한 나눔활동을 실천하는 대한적십자사 '씀씀이가 바른기업 캠페인'에 참여하고 있으며, 코로나 19 회복 성금, 우크라이나 긴급구호 성금, 독거노인 겨울나기 성금 등 다양한 기부 활동을 통해 꾸준한 사회공헌 활동을 이어가고 있다.

2025.12.12 10:59이정현 미디어연구소

바이트플러스 "AI, 이제 '사람' 아닌 'AI'가 통제"

바이트플러스가 이제는 사람이 인공지능(AI)을 컨트롤하는 시대가 아닌 'AI가 AI를 컨트롤 하는 시대'가 될 것이란 전망을 내놨다. 이미나 바이트플러스 솔루션즈 아키텍트는 11일 서울 중구 신라호텔에서 열린 'ACC 2025'에서 "이것이 바이트플러스가 제안하는 자동화의 미래"라며 "자사 생성형 AI 솔루션은 단순히 콘텐츠를 만드는 것이 아니라 스스로 검증하고 분석하고 지휘한다"고 강조했다.'ACC 2025'는 지디넷코리아가 주관, 주최하고 과학기술정보통신부, 바이트플러스, 네이버 등이 후원하는 행사다. 먼저 이 솔루션즈 아키텍트는 생성형 AI를 활용한 콘텐츠 제작이 여전히 어려운 이유로 프롬프트 작성의 어려움, 수동 반복 생성, 파편화된 워크 플로우, 일관성의 부재, 부족한 제어 가능성, 수동 후반 작업을 꼽았다. 그는 이같은 문제를 해결하기 위한 방법으로 자사 크리에이티브 에이전트를 제시했다. 바이트플러스의 크리에이티브 에이전트는 AI 에이전트가 초거대 언어모델(LLM) 뿐만 아니라 이미지 생성 모델, 영상 생성 모델, 디지털 휴먼, 3D 모델에 이르기까지 수많은 생성형 AI 솔루션을 통합 지휘하는 것이 특징이다. 이 솔루션즈 아키텍트는 "크리에이티브 에이전트는 생성형 AI 솔루션 뿐만 아니라 기타 솔루션까지 모두 통합 지휘해 고품질 콘텐츠를 순식간에 만들어 주는 멀티모달 자동화 파이프라인"이라고 설명했다. 크리에이티브 에이전트를 구현하는 데는 바이트플러스의 이미지 생성 모델 '씨드림(seedream)' 4.5, 영상 생성 모델 '씨댄스(seedance)' 1.0, 디지털 휴먼 모델 '옴니휴먼(omnihuman) 1.0'이 필요하다. 그는 바이트플러스의 크리에이티브 에이전트의 장점으로 낮은 비용과 빠른 제작속도, 일관성 등을 들었다. 이 솔루션즈 아키텍트는 "비용은 극적으로 낮아지고 또 제작 속도는 혁신적으로 올라간다"며 "이 모든 콘텐츠는 압도적인 일관성을 가지게 되고 누구나 고품질 콘텐츠를 만들 수 있어 (콘텐츠) 제작 장벽 자체가 사라진다"고 말했다. 또 이 솔루션즈 아키텍트는 "더 이상 사람이 AI 컨트롤 하는 시대가 아니다"며 "AI가 AI를 컨트롤함으로써 복잡한 작업 과정을 완벽하게 자동화시킨다"고 마무리했다.

2025.12.11 14:48박서린 기자

"3개월 만에 기업가치 3배"…멀티모달 AI 열풍 주역 美 스타트업, 투자자도 반했다

최근 생성형 인공지능(AI)이 텍스트 기반 거대언어모델(LLM)을 넘어 이미지·영상·오디오·3D까지 아우르는 멀티모달로 빠르게 확장되면서 미국 AI 스타트업 팔(Fal)에 대한 투자자들의 관심이 급증하고 있다. 멀티모달 활용 시 기업들의 복잡한 운영 부담을 덜어준다는 점에서 향후 성장성이 높다고 평가 받고 있어서다. 10일 블룸버그통신에 따르면 팔은 최근 세쿼이아캐피털이 주도한 시리즈D 투자를 통해 1억4천만 달러(약 2천16억원) 규모의 신규 투자 유치에 성공했다. 올 들어 세 번째 시리즈 투자로, 이번 투자에는 안데르센 호로위츠, 엔비디아, 세일즈포스, 쇼피파이 등 기존 투자자들도 참여했다. 이번 투자로 팔의 기업가치는 45억 달러로 평가됐다. 올해 7월 1억2천500만 달러 규모의 시리즈C 투자를 받을 당시 평가액의 약 3배에 달한다. 이곳은 올해 10월에도 세콰이아캐피털 등을 통해 시리즈D 투자 전 '브릿지격'으로 약 2억5천만 달러의 자금을 조달 받는데 성공했다. 이는 회사가 조달한 1억4천만 달러와 기존 투자자들의 지분 매각을 합산한 금액이다. 2021년 설립된 팔은 이미지, 비디오, 오디오, 3D 등에 쓰이는 여러 AI 모델들을 개발자가 쉽게 쓰도록 '호스팅과 API(application Programming Interface), 추론 인프라'를 제공하는 기업이다. 코인베이스 머신러닝 리더 출신 버르카이 구르와 AWS 개발자였던 고르켐 유르트세벤이 세운 곳으로, 어도비, 쇼피파이, 캔바 등 굵직한 기업들을 고객으로 확보하는 데 성공하며 빠른 속도로 덩치를 키우고 있다. 실제 이곳의 올해 매출은 지난 10월 기준 2억 달러를 이미 돌파한 상태다. 팔의 클라우드 플랫폼은 600개 이상의 이미지, 오디오, 영상 생성 AI 모델을 제공한다는 점이 강점이다. 오픈AI의 소라2, 구글이 최근 출시한 나노 바나나 프로와 같은 대표 모델뿐 아니라 다수의 오픈소스 알고리즘도 포함돼 있다. 이 모든 기능은 단일 API를 통해 접근 가능하다는 점에서 개발자들의 진입 장벽을 확 낮췄다는 평가를 받는다. 또 팔은 사용자 정의 모델을 실시간으로 구동할 수 있는 팔 서버리스(fal Serverless) 서비스도 운영 중이다. 이는 수천 개의 그래픽처리장치(GPU) 클러스터를 거의 즉시 가동할 수 있는 확장성을 지원하며, 엔비디아 H200, H100과 같은 최신 GPU에 대한 고속 접근성과 모니터링 도구도 제공한다. 보다 전문적인 요구사항을 가진 기업을 위해서는 전용 GPU 자원을 제공하는 팔 컴퓨트(fal Compute)도 마련돼 있다.자체 모델 개발에도 적극 나서고 있다는 점도 매력 요소다. 팔은 최근 이미지 생성 모델 오라플로우 v0.3을 공개했는데, 속도 중심의 '플로우 매칭' 구조를 적용해 보다 빠른 추론 성능을 실현했다는 평가를 받았다. 이는 기존 확산 모델 기반 생성 AI보다 효율성을 높였다는 점에서 개발자와 연구자 모두의 관심을 받고 있다. 이 같은 분위기 속에 팔은 투자자들로부터 유례없는 관심을 받고 있다. 멀티모달 AI 모델을 실제 서비스에서 운영하려는 수요가 폭발적으로 늘어나면서 이를 안정적으로 처리할 수 있는 인프라 시장의 가치가 급격히 커지고 있기 때문이다. 이에 텍스트 생성에서 이미지·영상·오디오로 확장되는 AI 경쟁이 본격화되자, 자체 인프라 구축 대신 즉시 적용 가능한 플랫폼을 찾기 시작한 기업들이 팔을 대안으로 선택하고 있다는 분석이 나온다. 업계 관계자는 "생성형 AI를 실시간 서비스 수준으로 끌어올리기 위해서는 대규모 GPU 자원과 높은 수준의 최적화가 필요하다"며 "팔은 이를 전적으로 맡아 처리함으로써 기업이 겪는 기술적 장벽을 크게 낮췄다"고 설명했다. 이어 "그 결과 사용자는 다양한 AI 모델을 단순 API 호출만으로 활용할 수 있게 됐다"며 "고비용 인프라 투자 없이도 빠르게 AI 기반 서비스를 추가할 수 있게 됐다"고 덧붙였다. 이 같은 확장성과 효율성은 팔의 기업가치를 단기간에 끌어올린 요인으로 평가된다. 멀티모달 AI가 산업 전반에서 필수 기술로 자리잡는 가운데 더 많은 기업이 팔의 AI 생성 기능을 기본 요소로 채택할 것으로 평가되는 것도 한 몫 했다. 업계 관계자는 "팔에 대한 투자는 멀티모달 AI 전환을 둘러싼 '인프라 전쟁'의 전선을 보여주는 사례"라며 "투자자들이 텍스트 중심 LLM 이후의 시대를 준비하는 상황에서 팔이 앞으로 빅테크와 경쟁 스타트업들 사이에서 얼마나 경쟁력을 보여줄 수 있을지가 관건이 될 것"이라고 분석했다.

2025.12.10 18:03장유미 기자

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

[디지털자산법 표류①] 금융위에 물거품된 민주당TF 노력, 업계 반발은 여전

7년차 공무원이 만든 AI 도구, 국회서 극찬… "이것이 진짜 국가 AI 혁신"

백종원 더본코리아 "잃어버린 1년...음해·공격 법적 책임 묻겠다"

테슬라 FSD 무단 활성화 '불법'…국토부 "2년 이하 징역"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.