• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
국감2025
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이미지 AI'통합검색 결과 입니다. (60건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

오픈AI 샘 알트먼 "이미지 생성 모델 인기에 서버 과부하"

오픈AI가 출시한 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation) 모델'이 샘 알트먼 최고경영자(CEO)를 난감하게 할 정도로 폭발적인 인기를 얻고 있다. 28일 CNBC에 따르면 샘 알트먼 CEO는 X(옛 트위터) 게시물을 통해 "사용자들이 새로운 챗GPT의 이미지 생성을 좋아하는 것은 정말 즐겁지만 자사 GPU가 녹아내리고 있다"고 밝혔다. 오픈AI가 새로 선보인 이미지 생성 모델은 텍스트와 이미지를 모두 통합할 수 있는 멀티모달 AI 모델인 챗GPT-4o 기반 서비스로 유료 구독자들을 비롯한 무료 사용자들에게도 공개됐다. 샘 알트먼 CEO도 자신의 X 프로필 사진을 챗GPT 이미지 생성 모델로 제작한 일본 지브리 애니메이션 스타일의 캐릭터 이미지로 바꿔 주목받았다. 이후 챗GPT의 이미지 생성 모델을 이용해 제작한 이미지들이 다양한 소셜 미디어에서 빠르게 확산되며 큰 인기를 끌고 있는 상황이다. 이 때문에 오픈AI의 서버조차 과부하가 걸렸다. 이에 샘 알트먼 CEO는 당분간 이미지 생성에 드는 속도와 제작 가능한 이미지 개수를 제한하는 등의 대응조치를 취할 것이라고 설명했다. 이제 무료 사용자들이 생성할 수 있는 이미지 개수는 하루당 3장으로 제한된다. 또 오류 수정 작업도 진행한다. 샘 알트먼 CEO는 "챗GPT가 일부 이미지를 생성하지 못하고 있다"며 "가능한 한 빨리 수정할 것"이라고 말했다.

2025.03.28 15:25한정호

[유미's 픽] 오픈AI 新 무기 출격에 한숨 쉬는 美 기업, 주가 또 흔들릴까

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 오픈AI·구글·xAI 등 인공지능(AI) 기술을 앞세운 새로운 경쟁자들의 등장으로 위기에 몰렸다. 간단한 프롬프트 입력만으로 전문가 못지 않은 퀄리티의 이미지를 쉽게 만들 수 있는 서비스들이 속속 등장하면서 존재감이 점차 희미해지고 있다는 평가가 나온다. 26일 업계에 따르면 어도비의 최근 1년간 주가는 무려 19.98%나 하락해 오후 4시 45분 현재 403.64달러에 머무르고 있다. 한 때 주가가 597.75달러까지 치솟았으나 경쟁사들의 잇따른 등장과 함께 새로운 성장 동력으로 내세운 AI 비즈니스가 시장에서 큰 호응을 얻고 있지 못한 까닭이다. 앞서 어도비는 지난 2023년 오픈AI가 '챗GPT'를 출시한 직후 AI 사진 편집 시장에 진입하기 위해 '파이어플라이'를 출시했다. 이후 어도비 익스프레스를 비롯한 포토샵, 일러스트레이터, 어도비 스톡 등 크리에이티브 클라우드 앱들에 생성형 AI를 탑재했다. 특히 포토샵에는 '제너레이티브 필(Generative Fill)', 어도비 스톡에서는 '텍스트 투 이미지(Text-to-Image)', 일러스트레이터에는 '제너레이티브 리컬러(Generative Recolor)' 등 AI 기반 기능이 출시됐다. 올해 초에는 파이어플레이 비디오 티어 등 새로운 AI 기반 서비스를 발표해 주목 받았다. 이 서비스는 사용자가 제출한 텍스트나 이미지 기반으로 비디오부터 3D 그래픽, 2D 애니메이션을 생성한다. 이를 시장에 확산시키고자 어도비는 서비스 내 생성형 AI 일부 기능을 무료로 제공하는 등 승부수를 걸었다. 확장 기능이나 상업적 사용을 위해서만 유로 플랜을 서비스에 적용한 상태로, 사용자 기반이 넓어지면 서비스 유료 전환을 순차적으로 유도하려는 전략도 세웠다. 최근에는 AI 에이전트가 접목된 새로운 애플리케이션(앱)인 '브랜드 컨시어지'를 선보여 주목을 받았다. 기존 고객 데이터를 바탕으로 맞춤화된 콘텐츠 등을 추천하는 작업을 수행하는 것으로, 어도비가 AI 에이전트 제품을 선보인 것은 이번이 처음이다. 이 같은 어도비의 노력에도 불구하고 시장 내 반응은 뜨뜻미지근하다. 사용자들은 비용을 지불할 정도로 어도비의 AI 기능들이 가치가 있는지 불확실하다는 평가를 내놓고 있다. 경쟁사들의 기술력이 빠른 속도로 발전하고 있어서다. 실제 오픈소스로 제공되는 미드저니나 오픈AI의 '소라'는 텍스트와 사진 몇장 만으로도 AI 기반 이미지 콘텐츠 제작이 가능하도록 지원하고 있다. 해당 서비스 제공자들은 영상과 오디오, 사진 편집 기능까지 추가할 계획이라고 밝힌 상태다. 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 같은 상황에서 오픈AI가 지난 25일 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation) 모델'을 출시해 발등에 불이 떨어졌다. 맥락과 그리는 대상에 대한 이해도가 한층 더 높아져 이전보다 더 정확한 결과를 내놓을 수 있게 돼서다. 새 모델은 오픈AI의 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이다. '그림'만 학습한 기존 이미지 모델에 GPT-4o 언어 모델이 결합하며 목적에 맞는 이미지를 쉽게 생성할 수 있게 됐다. 이 모델은 현재 유료 구독자들은 물론 무료 사용자들도 이용할 수 있다. 오픈AI는 기존에 '달리(DALL·E)'를 앞세워 이미지 생성 AI 시장에서 존재감을 키워왔다. 이를 사용했을 땐 숫자와 문자가 '그림'으로 해석돼 그려져 삐뚤게 이미지에서 표현됐지만, 새 모델은 언어 모델을 이해한 후 그림을 만들어 내 보다 정확한 결과물을 얻어낼 수 있다. '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 기존 모델은 훈련되지 않은 데이터여서 결과물을 내놓는데 어려움을 겪었지만, 새 모델은 가능해졌다. 동영상 생성 AI인 '소라'에도 새 모델의 언어 이해가 적용돼 더 자연스러운 영상을 만들 수 있게 됐다. 이는 서비스 경쟁력 개선에 나선 오픈AI의 노력의 일환이다. 오픈AI 관계자는 "GPT-4o의 언어 지식과 이미지 지능이 결합된 모델"이라며 "기존 모델이 참신했다면 이 모델은 유용하다"고 설명했다. 오픈AI 외에도 구글은 제미나이에서 '이마젠' 이미지 생성 모델을 제공하고 있다. 중국 딥시크도 '야누스'라는 이름의 이미지 생성 모델을 출시했다. 동영상 생성 AI 시장에선 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 서비스를 선보이며 어도비를 위협하고 있다. RBC 애널리스트 매튜 스완슨은 "어도비가 생성형 AI 제품 로드맵을 잘 따라가고 있지만, 명확한 수익화 지표가 부족한 상태"라며 "투자자들이 어도비 진행 상황을 신뢰하기 어려운 상황"이라고 평가했다. 도이치뱅크 브래드 젤닉 애널리스트 역시 "어도비 경영진은 파이어플라이의 가능성을 강조하고 있지만, 아직 재무적 영향은 확인되지 않았다"고 지적했다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2025.03.26 17:21장유미

"구글 AI, 워터마크 삭제까지"…'제미나이 플래시 2.0'에 저작권 업계 긴장

구글이 자사 인공지능(AI) 이미지 생성·편집 기능을 대폭 강화했다. 멀티모달 처리와 향상된 추론 능력 덕분에 스토리텔링과 창작의 자유는 한층 넓어졌지만 저작권 침해와 콘텐츠 조작 가능성도 커져 우려를 낳고 있다. 17일 테크크런치에 따르면 구글은 최근 자사 '제미나이 플래시 2.0'의 네이티브 이미지 생성 기능을 공개하고 이를 두고 개발자들이 실험할 수 있도록 조치했다. 이번 업데이트는 구글이 실험용 AI들을 공개해 둔 웹사이트인 'AI 스튜디오'와 '제미나이' 애플리케이션 프로그램 인터페이스(API)를 통해 제공된다. 이번에 '플래시 2.0'에 추가된 이미지 생성 및 편집 기능은 텍스트와 이미지를 결합해 일관된 스토리를 생성하는 기능을 지원한다. 사용자가 원하는 스타일에 맞춰 스토리를 변경하거나 그림을 수정할 수도 있다. 대화형 이미지 편집 기능도 추가돼 자연어 명령만으로 이미지의 세부 요소를 조정할 수 있다. 이 모델은 단순한 이미지 생성 기능을 넘어 '세계에 대한 이해' 능력도 탑재했다. 텍스트 렌더링 성능도 개선돼 광고·초대장 제작 등에도 활용 가능할 것으로 보인다. 일례로 사용자는 자연어 프롬프트로 AI에 말을 그리라고 지시한 후 생성된 말의 모양과 외모는 유지하면서 색깔만 바꾸는 것이 가능해진다. 이외에도 캐릭터 일러스트를 삽입한 후 캐릭터가 입고 있는 옷을 바꾸거나 만화 컷에 나온 등장인물의 발언만을 다르게 바꾸는 것도 가능하다. 다만 이같은 AI의 강력한 이미지 편집 기능이 저작권 문제를 일으킬 가능성도 크다. 일부 사용자는 '플래시 2.0'을 이용해 이미지에 삽입된 워터마크를 제거하는 실험을 진행 중이다. 특히 게티이미지와 같은 스톡 이미지 기업의 콘텐츠 보호 장치가 AI에 의해 무력화될 가능성이 제기된다. 이전까지 오픈AI, 앤트로픽 등의 AI 모델들은 워터마크 제거 요청을 명확히 거부해왔다. 반대로 '플래시 2.0'은 별다른 제약 없이 워터마크를 삭제하고 그 자리를 자연스럽게 채우는 기능을 수행하는 것으로 알려졌다. 이러한 현상에 구글 측은 '플래시 2.0'이 아직 실험적 단계에 있으며 상업적 사용이 금지돼 있다고 밝혔다. 다만 AI의 기술적 한계를 실험할 목적으로 접근하는 사용자들이 많아 저작권 업계의 반발이 예상된다. 현재 미국 저작권법에 따르면 원 저작자의 동의 없이 워터마크를 삭제하는 행위는 불법이다. 일부 예외적인 경우를 제외하면 법적 조치가 가능하, 저작권 보호 기관들의 대응이 있을 것으로 보인다. 테크크런치는 "'플래시 2.0'은 유명인과 저작권이 있는 캐릭터의 이미지를 생성할 뿐만 아니라 기존 사진에서 워터마크를 제거하는 기능까지 수행하는 것으로 확인됐다."며 "일부 저작권 소유자들은 이 AI의 사용 제한이 느슨한 점에 대해 강하게 반발할 가능성이 크다"고 분석했다.

2025.03.17 14:53조이환

사진 몇 장만으로도 3D 영상 만드는 AI 알고리즘 개발

건국대학교 김원준 교수(전기전자공학부) 연구팀이 적은 수의 이미지 입력만으로 특정 장면의 모든 시점 이미지를 생성할 수 있는 인공지능(AI) 알고리즘을 개발했다. 이번 연구 성과는 오는 6월 미국 내슈빌에서 열리는 '컴퓨터 비전 및 패턴 인식 학술대회(IEEE/CVF CVPR·Conference on Computer Vision and Pattern Recognition)'에서 발표될 예정이다. CVPR은 컴퓨터 비전·AI 분야에서 권위 있는 학술대회 중 하나다. 연구팀은 3차원 장면을 표현하는 핵심 기술인 'Gaussian Splatting' 기법을 보다 적은 입력 데이터만으로도 정밀하게 수행할 수 있도록 'Dropping 기반 학습 전략'을 새롭게 제안했다. 연구팀 관계자는 “이 방법은 특정 신경망 구조에 종속되지 않으면서 추가 메모리 사용 없이 적용할 수 있어 범용성이 높다”며 “기존 기술보다 적은 수의 입력 이미지만으로도 높은 정밀도의 3차원 장면 렌더링이 가능해졌다”고 설명했다. 이번 연구는 3차원 장면 이해 및 콘텐츠 생성, 이머시브(Immersive) 서비스 등 다양한 분야에서 핵심적으로 활용될 전망이다. 논문 제1저자는 박현우 석사과정 학생이며, 김원준 교수가 교신저자로 참여했다.

2025.03.13 12:42주문정

SK하이닉스, CIS 사업서 철수…"AI 메모리에 역량 집중"

SK하이닉스가 회사의 비주력인 CMOS 이미지센서(CIS) 사업에서 손을 뗀다. 관련 시장의 수요 감소, 중국 후발주자들의 진입 등으로 사업성이 미미하다는 분석이 작용한 것으로 관측된다. SK하이닉스는 6일 CIS 사업부문 구성원 소통 행사에서 "글로벌 AI 중심 기업으로서의 입지를 굳건히 하기 위해 동 사업부문이 지닌 역량을 AI 메모리 분야로 전환한다"고 밝혔다. SK하이닉스는 이날 "CIS 사업부문은 2007년 출범한 이후 여러 어려움을 극복하고 모바일 시장에 진입해 소기의 성과를 달성했다"며 "여기서 우리는 메모리만으로는 경험할 수 없는 로직 반도체 기술과 커스텀(Custom) 비즈니스 역량을 얻게 됐다"고 말했다. 이어 "최근 AI 시대가 도래하며 회사는 AI 메모리 분야에서 큰 성과를 거뒀고, 현재는 AI 산업의 핵심 기업으로 거듭나기 위한 대전환기를 맞이했다"고 강조하며 "CIS 사업부문이 보유한 기술과 경험은 회사의 AI 메모리 경쟁력을 강화하는데 꼭 필요한 만큼 전사의 역량을 한데 모으기 위해 이번 결정을 했다"고 설명했다. 앞서 SK하이닉스는 2008년 CIS 개발업체 실리콘화일을 인수하면서 이미지센서 시장에 진출한 바 있다. 2019년에는 일본에 CIS 연구개발(R&D) 센터를 개소하고, 같은해 이미지센서 브랜드 '블랙펄'을 출시했다. 이후 삼성전자의 폴더블폰 시리즈인 '갤럭시Z3'와 중국 스마트폰에 CIS를 납품하는 등 성과를 거뒀으나, 사업을 크게 확장시키지는 못했다. 스마트폰 시장의 수요 감소, 중국 후발주자들의 추격 등이 작용한 것으로 풀이된다. SK하이닉스는 "이번 결정이 회사의 AI 메모리 경쟁력을 한단계 성장시키며 '풀 스택 AI 메모리 프로바이더(Full Stack AI Memory Provider)'로서 회사의 위상을 공고히 하는데 기여할 것으로 기대한다"며 "또한 이를 통해 주주 가치도 극대화하고자 한다"고 밝혔다. 임직원들의 전환 과정에서 대해서는 "기존 CIS 소속 구성원들이 새로운 조직으로 이동하는 데 있어 각 개인의 전문 역량을 충분히 발휘할 수 있도록, '원팀 마인드' 차원에서 지원을 아끼지 않을 방침"이라고 설명했다.

2025.03.06 15:06장경윤

한국딥러닝 "문맥까지 이해하는 OCR 시대 왔다…업무 자동화 핵심 될 것"

"광학문자인식(OCR) 성장 잠재력은 무궁무진합니다. 문서 디지털화로 OCR 역할이 늘어날 것이기 때문입니다. 이럴수록 정확하면서도 안전한 OCR 서비스가 필요합니다. 한국딥러닝은 자체 모델 '딥 이미지'를 통해 이런 OCR 서비스를 맞춤형으로 공급하고 있습니다. OCR을 단순히 문서 인식하는 기술이 아닌 업무 자동화 핵심으로 만들 것입니다." 김지현 한국딥러닝 대표는 지디넷코리아 인터뷰에서 자사 OCR 서비스 특장점을 소개하며 이같이 밝혔다. 김지현 대표는 2019년 한국딥러닝을 설립했다. 22세 대학생이던 때다. 학창 시절부터 개발자 부모 영향으로 자연스럽게 코딩을 접했다. 스타트업에서 대학생 인턴으로 근무하며 창업을 결심했다. 그는 "당시 딥러닝 기술이 확산하던 때"였다며 "AI 기술이 다양한 산업에 스며들 것으로 판단해 회사를 설립했다"고 밝혔다. 김 대표는 창업 전부터 텍스트와 이미지, 영상, 음성 데이터를 수집했다. 이를 통해 자체 거대비전언어모델(LVLM) 딥 이미지를 내놨다. 딥 이미지는 텍스트와 이미지를 동시에 처리·생성할 수 있다. 텍스트·이미지 데이터가 상호작용하며 분석을 수행한다는 점에서 멀티모달 모델과 다르다. 이 모델은 현재 1억 장 넘는 이미지를 학습했다. 이를 기반으로 광학문자인식(OCR)을 비롯한 객체 검출, 영상 이해, 이미지 생성, 3D 모델 생성 등 다양한 비전 AI 솔루션을 제공한다. 한국딥러닝은 모델 개발과 운영을 위해 자체 그래픽처리장치(GPU) 서버와 분산처리시스템을 온프레미스 형태로 갖췄다. 김 대표는 "모델 초기 투자비와 유지비 부담이 컸다"며 "고효율 분산 학습 알고리즘을 통해 비용을 줄였다"고 설명했다. 이어 "서버는 스케일아웃 방식으로 확장 가능하도록 설계했다"며 "비용 문제는 고객사와 기술협력·장기계약을 통해 해결했다"고 덧붙였다. "기업 맞춤형으로 제공…정확도·보안·유연성 높아" 김지현 대표는 자사 OCR 특장점으로 높은 정확도, 유연성, 보안성을 꼽았다. 한국딥러닝은 각 태스크와 프로젝트 특성을 반영한 맞춤형 OCR을 제공한다. 단순히 글자를 인식하는 데 그치지 않고, 문서 맥락과 레이아웃을 고려해 필요한 정보를 정확히 추출하는 것이 강점이다. 김 대표는 "문서 폼이 다양하면 OCR 인식 정확도가 떨어진다"며 "이는 OCR 기술이 주로 정형화된 폼에만 최적화됐기 때문"이라고 설명했다. 그는 "딥이미지의 OCR은 다양한 폼의 문서 수십만 건을 분석하고 필요한 데이터를 일관성 있게 정리할 수 있다"고 말했다. 김 대표는 자사 OCR이 높은 보안성을 갖췄다고 강조했다. 현재 온프레미스 형태로 OCR 서비스를 제공하고 있어서다. 이에 문서 데이터가 외부로 나가지 않고 기업 내부에서 처리된다. 반면 타사 OCR 서비스는 인터넷 기반의 클라우드 환경에서 작동한다. 사용자가 문서 파일을 외부 서비스에 올려야 한다는 의미다. 이 과정에서 민감 정보가 외부로 전송될 수 있다. 한국딥러닝은 온프레미스 외에도 프라이빗 클라우드와 가상 프라이빗 클라우드(VPC)상에서 서비스를 지원한다. 김 대표는 OCR 서비스가 키-밸류 추출과 맞춤형 폼 변환 기능을 통해 높은 유연성을 갖췄다고 설명했다. 키-밸류 추출은 문서에서 중요한 정보(키)와 그에 해당하는 값(밸류)을 자동으로 찾아내는 기능이다. 예를 들어 신청서에서 이름과 생년월일, 전화번호가 키다. 여기에 입력된 내용이 밸류다. 김지현 대표는 "보통 OCR은 문서 속 텍스트만 인식한다"며 "필요한 정보를 찾기 위해 추가 작업이 필요하다"고 말했다. 이어 "자사 OCR은 문서 구조를 분석해 필요한 정보만 정확히 추출한다"며 "고객은 원하는 데이터를 빠르게 찾을 수 있다"고 강조했다. "OCR 잠재력 무한대"…이미지 분석으로 해외 공략 김지현 대표는 OCR 사업 확장 가능성이 더 커질 것이라고 내다봤다. 그는 "앞으로 문서는 디지털 데이터로 변환될 것"이라며 "OCR이 이 부분에서 큰 역할을 할 것"이라고 예측했다. 또 "거대언어모델(LLM) 기술이 발전하면서 OCR과 챗봇, 에이전트 연계 활용도 가능해질 것"이라며 "이에 따른 OCR 사업 확장 가능성도 높다"고 덧붙였다. 김 대표는 솔루션을 해외 시장에 적극 공급할 예정이다. 현재 인도네시아 건설사에 도로와 터널 균열을 감지하는 이미지 분석 솔루션을 제공하고 있다. 그는 "언어 장벽이 있는 OCR 대신 이미지 디텍션, 세그멘테이션, 분류 서비스로 해외 시장을 노릴 것"이라고 말했다. 한국딥러닝은 올해 OCR 기반 데이터 수집·정제 작업에 집중할 계획이다. 김 대표는 "OCR로 변환한 문서를 디지털화한 후 챗봇이나 전사적자원관리(ERP) 시스템에 적용할 수 있도록 가공하는 것이 목표"라며 "OCR을 단순히 문서를 인식하는 기술이 아닌 업무 자동화 핵심 요소로 만들 것"이라고 강조했다.

2025.02.07 15:07김미정

"AI로 부진한 실적 회복"…게티이미지, 셔터스톡 인수

인공지능(AI)과 스마트폰 등장으로 이미지 콘텐츠 제공사 영향력이 약화했다는 지적이 나오는 가운데 게티이미지가 셔터스톡을 인수해 성장 동력 확보에 나섰다. 8일 CNBC 등 외신에 따르면 게티이미지가 경쟁사인 셔터스톡를 인수한다고 발표했다. 합병회사 규모는 부채를 포함해 37억 달러(약 5조3천900억원)다. 게티이미지는 이번 거래에서 셔터스톡에 현금 3억3천100만 달러(약 4천800억원)와 주식 3억1천940만주를 지급하는 데 합의했다고 밝혔다. 게티이미지는 셔터스톡 주주에게 1주당 약 28.88달러를 배당한다. 주주들은 이를 전액 현금으로 받거나 현금과 게티 주식을 혼합해 수령할 수 있다. 게티이미지 주주는 거래 후 합병 회사 약 54.7%를 보유한다. 나머지는 셔터스톡 주주 몫이다. 합병 회사의 최고경영자(CEO)는 크레이그 피터스 게티이미지 CEO가 맡는다. 다수 외신은 두 기업이 합병을 통해 콘텐츠 제작 서비스를 확대하고 비용을 절감해 수익성을 높일 것으로 봤다. 최근 AI가 콘텐츠 생성 시장을 장악하고 휴대전화 카메라 사용 증가가 스톡 사진 가치를 떨어뜨렸다는 이유에서다. 전날 종가 기준 게티이미지 주가는 2022년 7월 상장 이후 약 73% 떨어졌다. 같은 기간 셔터스톡 주가는 약 50% 하락했다. CNBC는 "이번 합병 건이 도널드 트럼프 미국 대통령 당선인의 첫 심사 대상이 될 것"이라며 "새 정부가 기업 인수합병에 어떤 입장을 보일지 확인할 수 있는 사례"라고 평했다.

2025.01.08 11:11김미정

오픈AI 견제 나선 일론 머스크, X서 AI 챗봇 '그록2' 무료 배포로 승부수

일론 머스크 테슬라 최고경영자(CEO)가 만든 인공지능(AI) 기업 xAI가 이미지 생성 기능이 포함된 최신 AI 챗봇 '그록2(Grok-2)'를 무료로 이용할 수 있게 했다. 이용자를 많이 늘려 AI 시장에서 주도권을 확보함과 동시에 오픈AI가 만든 '챗GPT'를 견제하려는 의도로 분석된다. 16일 테크크런치 등 일부 외신에 따르면 xAI는 최근 소셜미디어 플랫폼 X(옛 트위터)에서 '그록2'를 무료로 제공하기 시작했다. '그록2'는 지난 8월 중순 처음 출시됐으나, 그간 월 7달러인 X의 프리미엄 이상 구독자만 이용할 수 있었다. 그러나 이번에 무료로 서비스를 풀면서 이용자 범위는 대폭 확대될 것으로 보인다. 이용자는 메뉴 줄에서 그록 아이콘을 눌러 그록2 페이지에 접속할 수 있으며 '무엇이든 물어보세요'라고 쓰인 대화창에서 챗봇을 이용할 수 있다. xAI는 "그록이 이제 모두에게 무료"라며 "더 빠르고 더 날카롭고 완전히 새로운 이미지 생성기를 포함하고 있다"고 밝혔다. 다만 오픈AI의 챗GPT 등과 마찬가지로 이용 한도가 있다. 무료 이용자는 2시간마다 최대 10개 질문을 할 수 있다. xAI는 "지난 8월 '그록2' 출시 이후 성능을 개선하기 위해 노력해 왔고 웹 검색과 인용, 최근에 추가된 이미지 생성기 오로라(Aurora) 같은 새 기능을 추가했다"며 "창의적 사진과 재미있는 밈(meme)을 만드는데 탁월하다"고 밝혔다. 이어 "(이전 버전보다) 3배 더 빠르고 정확성과 다국어 기능이 개선됐다"고 덧붙였다. 또 xAI는 기업용 API(응용프로그램 인터페이스)로 '그록2-1212'와 '그록2-비전-1212'도 추가했다. 이를 통해 고도로 조정 가능하고 지능적인 모델을 찾는 개발자들에게 우수한 옵션을 제공한다는 방침이다. 더불어 효율성 개선에 따라 이 기업용 모델의 용량당 가격도 전보다 인하했다. xAI가 이처럼 나선 것은 머스크가 오픈AI를 견제하기 위한 것으로 분석된다. 앞서 머스크는 지난 2015년 오픈AI 설립에 참여했다가 2018년 이 회사의 이사직을 사임하고 투자 지분도 모두 처분했다. 이후 오픈AI가 '챗GPT'를 내놓자 이 챗봇이 정치적으로 편향돼 거짓말을 하고 있다고 비판하며 그 대항마로 AI 개발 스타트업 xAI를 지난해 7월 설립했다. 또 최근에는 오픈AI의 영리 법인 전환 추진에도 반발하며 여론 조성에 힘쓰고 있다. 오픈AI는 영리 법인 전환을 추진하고 있는 상태로, 이를 위해 캘리포니아주 당국과 초기 논의를 진행하고 있다. 앞서 머스크는 샘 올트먼 오픈AI CEO가 오픈AI를 비영리 단체로 운영하겠다는 약속을 위반하고 영리를 추구해 투자자 등과 한 계약을 위반했다고 주장한 바 있다. 또 오픈AI의 영리 법인 전환을 중단시켜달라는 소송도 제기했다. 머스크는 오픈AI가 영리 법인으로 전환되면 AI 시장에서 위협적인 경쟁자가 될 것이라고 우려하고 있다. 업계 관계자는 "머스크가 외부 자본 조달을 통해 대규모 데이터센터를 구축하는 등 AI 개발에 박차를 가하고 있다"며 "xAI가 향후 선두 주자인 오픈AI를 머지않아 위협할 것으로 보인다"고 말했다.

2024.12.16 11:12장유미

덱스터크레마, 'AI 서밋 서울'서 인페인팅 모델 개발 성과 발표

덱스터크레마가 최근 영상 제작 분야에서 활발히 논의되는 인공지능(AI) 활용 방안과 향후 발전 방향에 대한 인사이트를 제시했다. 덱스터스튜디오의 자회사인 AI 디지털 마케팅 전문기업 덱스터크레마(대표 손동진·송경운)가 지난 10일 열린 글로벌 인공지능 컨퍼런스 'AI 서밋 서울 2024'에 초청 연사로 참여했다고 밝혔다. 글로벌 AI 컨퍼런스 'AI 서밋 서울'은 최신 기술 트렌드와 각 산업별 AI 적용 사례를 공유하기 위해 마련된 행사다. 올해로 7회째를 맞은 이번 행사에는 메타, 캔바, LG전자, 엔씨소프트 등 글로벌 빅테크 기업의 전문가들이 패널로 참여해 AI와 산업 간 연계에 대한 심도 있는 논의를 나눴다. 덱스터크레마는 행사 첫날 'AI, 영상 제작의 경계를 허물다: AI가 열어가는 새로운 가능성'이라는 주제로 발표를 진행했다. 연사로 나선 이창범 AI R&D 연구소장은 ▲영상 제작 분야의 실제 AI 활용 사례 ▲인페인팅(In-painting) 모델의 발전 ▲전문가 맞춤형 AI 모델의 필요성 등 AI가 불러온 영상 제작 과정의 변화를 분석하고, 이에 따른 미래 대응 방안을 모색했다. 특히 인페인팅 모델(이미지 내 특정 객체를 인식해 지울 수 있는 AI)을 활용한 16비트 및 32비트 이미지 처리에 대한 국내 최초의 연구 성과를 발표해 주목받았다. 이창범 연구소장은 "기존 8비트 인페인팅 모델을 확장시켜 16비트와 32비트 이상의 고해상도 이미지 또한 처리할 수 있는 모델"이라며 "원하는 색 영역으로 출력이 가능할 뿐 아니라 원본 대비 픽셀 손실이 없다는 것이 차별점"이라고 설명했다. 이어 "영상 제작 분야에서 AI가 더욱 발전하기 위해서는 전문가 집단을 위한 특화 AI 모델 개발이 무엇보다 필요한 시점"이라면서 "당사는 전문 인력을 통해 전문가용 AI 모델 개발은 물론, 고품질 데이터의 지속적인 확보 및 제공을 위해 노력 중"이라고 덧붙였다. 이와 함께 행사 현장에는 덱스터크레마의 초개인화 AI 마케팅 원스톱 솔루션 '애드플로러'의 시연 부스가 운영돼 업계 관계자 및 방문객들의 이목을 끌었다. 생성형 AI 기반 초개인화 광고 자동화 솔루션 애드플로러는 대규모 데이터에 기반한 마켓 분석과 전략 추출, 최적의 타깃팅 및 광고 매체 선택, 콘텐츠 제작 등 맞춤형 마케팅 전략을 제공하는 서비스다. 손동진 덱스터크레마 대표는 "이번 행사를 통해 당사가 다년간 축적해온 연구 성과와 새로운 솔루션을 선보일 수 있게 돼 뜻깊다"며 "앞으로도 지속적인 연구 개발을 통해 급변하는 미디어 상황에 유연하게 대응하는 혁신적인 대안을 제시할 수 있도록 노력하겠다"고 말했다.

2024.12.11 09:00백봉삼

픽셀플러스 "고성능 이미지센서 내년 양산 목표…전장·AI 시장 공략"

픽셀플러스가 주력 제품인 이미지센서의 사업 영역을 확장한다. 기존 대비 해상도를 높이고, '글로벌셔터' 등 첨단 기술을 적용한 신규 차량용 이미지센서를 이르면 내년 중반부터 양산할 계획이다. 나아가 드론·로보틱스·스마트 가전 등 AI 응용 산업에 진출하기 위한 준비에도 나섰다. 이서규 픽셀플러스 대표는 최근 경기 판교 소재의 본사에서 기자들과 만나 회사의 향후 사업 방향성에 대해 이같이 밝혔다. "1.3M 신규 이미지센서, 내년 중·하반기 성과" 픽셀플러스는 차량용 CIS(CMOS 이미지센서) 및 CIS의 핵심 요소인 ISP(이미지신호처리장치)를 전문으로 개발하는 팹리스다. CIS는 카메라렌즈를 통해 들어오는 빛을 전기적인 영상 신호로 바꿔 주는 시스템반도체로, 자율주행 등 첨단 오토모티브 기술의 발달로 향후 수요가 증가할 것으로 기대된다. 현재 픽셀플러스의 핵심 제품은 VGA(640x480)급 해상도의 이미지센서다. 주로 차량 후방에서 차량의 주변 360도 상황을 모니터링 할 수 있는 SVM(서라운드 뷰 모니터) 분야에 적용되고 있다. 나아가 픽셀플러스는 1.3M(1280x720) 해상도의 이미지센서를 개발해, SVM 및 DMS(운전자 모니터링 시스템) 등으로 공급을 추진하고 있다. 현재 잠재 고객사에 샘플을 공급해 퀄(품질) 테스트를 진행하고 있는 것으로 알려졌다. 3M 등 해상도를 더 높은 제품도 개발 중에 있다. 이 대표는 "1.3M 이미지센서는 내년 중후반 정도면 양산에 들어갈 수 있을 것으로 기대한다"며 "이미 1.3M 이미지센서가 시장에 상용화돼 있으나, 당사 제품의 특성이 더 좋기 때문에 잠재 고객사들로부터 좋은 평가를 받고 있다"고 밝혔다. 올해 공개한 '포토닉 칩렛' 기반의 신규 이미지센서도 주목할 만하다. 포토닉 칩렛은 이미지센서와 ISP, AI 칩 등을 수직으로 쌓는 첨단 패키징 기술로, 기존 패키징 대비 뛰어난 데이터 처리 효율성 및 방열 특성을 구현다는 데 용이하다. 이를 통해 이미지센서 내에서 일부 데이터를 실시간으로 처리하는 '온센서 AI'를 효과적으로 구현할 수 있다는 게 픽셀플러스의 설명이다. 이 대표는 "이미지센서가 필요한 데이터만을 미리 처리해 AP(애플리케이션 프로세서), NPU(신경망처리장치) 등으로 보내면 고객사들은 더 강력한 성능을 구현할 수 있을 것"이라며 "때문에 전문적인 센싱 기술이 필요한 기업들을 대상으로 비즈니스 초점을 맞추고 있다"고 설명했다. "글로벌 셔터·포토닉 칩렛 등 첨단 기술로 'AI' 공략" 중장기적으로 픽셀플러스는 자동차 분야에 집중된 사업구조에서 벗어나, 드론·로봇·스마트가전 등 다양한 산업으로 확장해나가겠다는 비전을 가지고 있다. 이들 산업은 AI와의 접목을 통해 높은 성장성이 예상되는 분야로, 고도화된 센싱 기술을 요구한다. 이 대표는 "AI가 인간처럼 사물을 인지하고 움직이기 위해서는 고성능 센서 및 이미지센서가 필요하다"며 "센서에서 AI 기능을 지원할 수 있는 프로세스가 어떠한 것이 있을지에 대해 고민하고 있다"고 말했다. 픽셀플러스가 국내에서 유일하게 독자 상용화한 글로벌셔터 기술도 신시장 진출에 힘을 보탤 것으로 전망된다. 기존 이미지센서는 전체 이미지를 여러 행으로 나누고, 위에서부터 순차적으로 스캔하는 '롤링 셔터' 방식을 채용한다. 반면 글로벌 셔터는 짧은 순간에 전체 이미지를 한 번에 스캔한다. 때문에 사람, 혹은 사물의 동작을 정밀하게 인식해야 하는 센서 분야에서 각광받고 있다. 이 대표는 "글로벌 셔터를 활용하면 빠르게 움직이는 물체여도 1만분의 1초 단위로 정지화면을 깔끔하게 도출할 수 있다"며 "운전자의 눈 깜빡임을 인식해 졸음 운전을 판단하는 인-캐빈(In-cabin) 등과 같은 AI 기능에 꼭 필요한 기술"이라고 강조했다.

2024.10.30 12:00장경윤

스태빌리티AI, '스테이블디퓨전3.5' 출시…창작자 지원 강화

스태빌리티AI가 이미지 생성 모델 '스테이블디퓨전'의 차기 버전을 공개했다. 사용자의 요구 사항에 맞춰 모델을 더욱 세밀하게 조정할 수 있도록 사용자 정의 기능을 확대하는 등 이미지 전문가를 위한 지원을 확대한 것이 특징이다. 23일 실리콘앵글 등 외신에 따르면 스태빌리티AI는 스테이블디퓨전 3.5를 허깅 페이스를 통해 출시했다. 스테이블디퓨전3.5는 지난 6월 출시한 스테이블디퓨전3의 개선 버전으로 창의적인 프로젝트와 전문적인 작업을 위해 모델을 더욱 세밀하게 조정할 수 있는 옵션을 제공한다. 빈티지한 사진 효과나 특정 시대의 화풍을 연출하는 등 다양한 스타일이나 텍스처를 지정해 원하는 시각적 표현을 생성할 수 있다. 또 이 제품은 대량의 이미지를 신속하게 생성해야 하는 이미지 전문가와 기업을 위해 더 빠르게 고품질의 이미지를 생성할 수 있도록 처리 속도가 향상됐다. 더불어 모델 개선을 통해 이미지 품질을 전반적으로 향상시키고 사용자가 요구하는 바를 더 정확하게 반영할 수 있도록 프롬프트 명령 이해도를 높였다. 공개한 AI 모델은 스테이블디퓨전3.5 라지와 스테이블디퓨전3.5 라지 터보 2종이다. 80억 개의 매개변수를 기반으로 학습한 스테이블디퓨전3.5 라지는 전문적인 고품질 이미지 생산에 초점을 맞춰 설계된 모델로 1메가픽셀 해상도를 지원한다. 스테이블디퓨전3.5 라지 터보는 라지 모델보다 이미지를 더 빠르게 생성할 수 있도록 알고리즘 최적화 및 하드웨어 지원 기능이 적용됐다. 스태빌리티AI는 보다 효율적인 이미지 생성 모델을 원하는 사용자를 위한 스테이블디퓨전3.5 미디엄도 오는 29일 선보일 예정이다. 스테이블디퓨전3.5 미디엄은 26억 개의 매개변수 기반으로 일반 PC나 노트북에서도 활용할 수 있는 수준의 컴퓨팅 파워를 요구한다. 스태빌리티AI 측은 "스테이블디퓨전3는 우리의 기준이나 커뮤니티의 기대에 충분히 부응하지 못했다"며 "이에 커뮤니티 피드백을 듣고 우리의 사명을 발전시키는 버전을 추가로 개발하기 위해 노력했다"고 설명했다. 이어 "이번에 선보이는 AI모델은 개발자와 제작자들이 손쉽게 비용 부담 없이 사용할 수 있는 도구를 제공하려는 우리의 의지를 반영한다"며 "상업적, 비상업적 사용 모두 무료로 제공되는 만큼 이를 활용해 원하는 목표를 달성하길 바란다"고 덧붙였다.

2024.10.23 10:31남혁우

"AI로 손쉽게 이미지 수정"…미드저니, 新 그림 편집 기능 출시

미드저니가 인공지능(AI) 기반 이미지 편집 도구를 출시해 웹에서 자유롭게 수정할 수 있는 기능을 제공한다. 21일 테크크런치에 따르면 미드저니는 다음 주부터 AI를 활용해 이미지를 편집하고 재텍스처링하는 웹 도구를 선보일 예정이다. 이 도구는 이미지의 색상과 세부 사항을 재구성하는 기능도 포함하고 있어 많은 주목을 받고 있다. 이번 업데이트는 기존 그림 생성 기능을 넘어 사용자가 직접 이미지를 업로드하고 이를 편집할 수 있는 수준으로 확대된다. 초기에는 커뮤니티의 일부 사용자에게만 제한적으로 제공되나 지속적으로 접근성을 확대할 예정이다. 특히 이번 기능은 기존 AI의 자동 생성에서 벗어나 사용자가 세부적으로 이미지를 조정할 수 있다는 점에서 차별화된다. 이를 통해 사용자들은 더욱 창의적이고 맞춤형 작업을 할 수 있어 다양한 분야에서 활용도가 높아질 것으로 보인다. 미드저니 측은 기술 도입에 따른 저작권 침해나 허위 정보 확산의 위험성을 인식하고 이를 방지하기 위해 AI 감독 시스템과 인간 모니터링을 도입할 계획이다. 특히 정치인 그림 생성 필터링과 같은 예방 조치도 강화할 예정이다. 미드저니 관계자는 "커뮤니티 피드백을 기반으로 기능을 점진적으로 확장할 계획"이라고 밝혔다.

2024.10.21 10:24조이환

"미드저니 넘볼까?"…월간 이용자 1억5천만 '프리픽' AI로 디자인 혁신 가속화

"지난 5월 이후 우리는 글로벌 디자인 혁신을 위한 파트너로서 적극적으로 협력하고 있습니다. 프리픽은 약 700만 장 이상의 이미지 데이터베이스와 광범위한 사용자 기반을 보유하고 있으며 매그니픽AI는 혁신적인 인공지능 통합도구(AI Suite) 기술을 제공합니다. 이번 '젠AI 이노베이션 2024' 행사에는 한국 시장에 우리 기술의 우수성을 소개하기 위해 참가했습니다." 하비 로페즈 매그니픽AI 공동 창업자는 4일 양재 aT센터에서 열린 '젠AI 이노베이션 2024'에서 기자와 만나 이같이 밝혔다. 이 행사에는 에밀리오 니콜라스 리켈메 매그니픽 AI 공동 창업자와 파울라 비바스 프리픽 미국 마케팅 헤드도 함께 참석해 생성형 AI 기술과 이미지·디자인 업계의 미래에 대해 논의했다. 프리픽은 지난 2010년에 설립된 세계 최대의 그래픽 리소스 플랫폼으로, 7백만 개 이상의 이미지 파일을 제공해 디자이너와 크리에이티브 전문가들에게 필수적인 리소스로 통한다. 월간 사용자 수는 1억5천만명 이상에 도달했으며 미국 시장에서만 월 800만명의 사용자를 확보하고 있다. 지난 5월 프리픽은 매그니픽AI를 인수 합병했다. 매그니픽은 사용자 프롬프트에 따라 저해상도 이미지를 고해상도로 업스케일링하고 원래 존재하지 않았던 세부 사항을 이미지에 추가하는 혁신적인 AI 플랫폼이다. 프리픽의 매그니픽AI 인수는 디지털 디자인 시장에서의 경쟁력 강화를 위한 전략적 선택이었다. 비바스 프리픽 마케팅 헤드는 "최근 우리는 몇 년간 급속도로 성장해 왔지만 스톡 이미지만으로는 장기적으로 생존하기 어렵다는 것을 알고 있었다"며 "이제 게티 이미지 같은 이미지 플랫폼만이 아니라 미드저니·캔바와 같이 AI 기능을 갖춘 회사들과 경쟁하기 위해 기술 분야에 집중하고 있다"고 설명했다. 실제로 프리픽은 매그니픽AI 인수 후 '미스틱(Mystic)'이라고 불리는 기능을 서비스 내에 출시했다. '미스틱'은 프리픽 구독 시 사용 가능한 AI 통합도구다. 스케치에서 이미지로의 변환, 텍스트에서 이미지로의 변환, 리터치, 리메이크 등 다양한 창의적인 작업을 지원한다. 리켈메 매그니픽AI 공동 창업자는 "매그니픽이 최초로 개발한 기능은 저화질 해상도의 그림을 고화질로 바꾸는 업스케일링이었다"며 "지금은 더 많은 혁신적인 도구들을 도입해 이를 영어로 마법을 뜻하는 '미스틱'이라고 부르기로 했다"고 설명했다. 리켈메 공동 창업자의 말처럼 '미스틱'은 하나의 그림을 생성하고 이를 같은 구도에서 다르게 변형할 수 있는 것이 특징이다. 프롬프트를 입력하면 여러 구도로 이미지를 생성할 수 있으며 동일한 인물의 사진을 다른 인종으로 변환하는 것도 가능하다. 실제로 리켈메 공동 창업자는 강연 세션에서 '미스틱'의 기능을 시연했다. 그가 음성으로 입력한 "한복을 입고 뉴욕에 내려오는 에일리언"이라는 프롬프트에 '미스틱'은 다양한 외계인들이 한복을 입고 낙하하는 이미지를 같은 구도로 생성해 관객의 환호를 받았다. 언어 표기의 정확도도 높다. 로페즈 공동 창업자는 "다른 생성형 AI가 그림 속에 알파벳을 제대로 표현하지 못하는 것과 달리 우리 모델은 영어, 스페인어, 프랑스어, 이탈리아어에서 90% 이상의 정확도를 보인다"며 "한국어와 일본어 지원도 확대하기 위해 노력하고 있다"고 밝혔다. 두 회사의 주요 고객층은 이미지 작업을 하는 모든 사람들이다. 주로 B2C를 타겟으로 하지만 건축사·게임회사와 같은 전문적인 기업 사용자들을 위한 고급 기능도 제공한다. 리켈메 공동 창업자는 "우리 목표는 개인 사용자부터 소규모 비즈니스, 전문 디자이너까지 모두가 사용할 수 있는 도구를 제공하는 것"이라고 강조했다. 이번 '젠AI 이노베이션 2024' 행사 참여도 그 일환이다. 프리픽과 매그니픽은 국내 AI 전문가들과의 교류를 통해 한국 시장에서의 입지를 강화하고자 하기 때문이다. 왜 일본이나 싱가포르보다 한국을 먼저 선택했는지 묻는 기자의 질문에 비바스 헤드는 "왜 한국이 먼저가 되면 안 되냐"며 "아시아에서 AI 기술이 가장 빠르게 성장하는 시장인 한국은 우리가 커뮤니티를 형성하기에 아주 좋은 장소"라고 강조했다. 이어 "행사를 개최한 'AI 커뮤니티 코리아' 관계자와 라스베이거스 컨퍼런스에서 만난 후 참가에 많은 도움을 받았다"고 설명했다. 두 회사는 앞으로도 AI 기술을 바탕으로 전 세계의 콘텐츠 크리에이터들과 협업하며 자체 플랫폼을 지속적으로 발전시킬 예정이다. 이를 통해 사용자 참여를 통한 AI 기술의 성공 사례로 자리매김하고자 한다. 비바스 헤드는 "우리 목표는 아이디어의 힘을 표현하는 데 필요한 솔루션, 콘텐츠, 영감을 제공하는 원스톱 플랫폼이 되는 것"이라며 "앞으로도 더 많은 사용자들에게 다가가고 혁신적인 도구를 제공하기 위해 노력하겠다"고 강조했다.

2024.10.04 15:46조이환

옴니어스, SDC24서 생성형 AI 의상 착용 서비스 '벨라' 공개

초개인화 커머스 AI 기업 옴니어스(대표 전재영)가 3일(현지시간) 미국 캘리포니아에서 열린 '삼성 개발자 콘퍼런스 2024(이하 SDC24)에서 생성형 AI 의상 착용 서비스 '벨라'를 공개한다고 4일 밝혔다. 2013년부터 삼성전자에서 매년 주최해 온 SDC는 전 세계 유수의 개발자들이 한데 모여 소프트웨어·서비스·플랫폼 분야의 비전과 혁신을 공유하고 소통하는 글로벌 행사다. '모두를 위한 AI-10년의 개방적 혁신과 미래'를 주제로 열리는 이번 SDC24에서 옴니어스는 삼성전자의 사외 스타트업 육성 프로그램 C-Lab Outside의 참여 자격으로 벨라를 소개할 예정이다. 옴니어스 전재영 대표는 현지시간 오후 2시 10분부터 30분간 SDC24 오픈 스테이지에서 ▲가상 의류 착장 ▲AI 휴먼 모델 생성 등 벨라의 기술 전반을 발표한다. 벨라는 의류의 스타일, 색상은 물론 무늬·질감·주름·장식 등 세부 특징까지 학습해 기존 이미지 생성 AI 모델보다 한 단계 더 진화된 기술로 더 섬세한 이미지를 표현한다. 옴니어스는 관람객들이 벨라의 기능을 직접 시연할 수 있는 부스를 행사장 내 마련, 다양한 포즈의 모델 이미지에 여러 패션 아이템을 가상으로 적용해볼 수 있는 체험존도 운영한다. 현재 옴니어스는 연내 벨라 출시를 목표로 개발을 진행 중에 있으며, 국내 패션 브랜드와 쇼핑 커머스 등을 중심으로 도입한 이후 내년부터는 본격적으로 글로벌 파트너 확보에도 나설 계획이다. 벨라는 원본 옷의 디테일을 보존하는 동시에 모델의 체형, 포즈, 인종 등을 고려해 자연스러운 착용 이미지를 구현하는데 특화돼 있다"며 "기업 고객들이 보다 경제적이고 효율적으로 모델 착용 이미지를 제작할 수 있도록 연내 SaaS 형태로 벨라를 선보이겠다"고 말했다. 옴니어스는 이베이, 롯데온, CJ온스타일, W컨셉, 브랜디 등 국내외 커머스사들의 상품 검색과 개인화 추천 서비스를 제공하고 있다. 최근에는 B tv와 연동해 드라마, 예능 영상 기반 AI 쇼핑도 구현했다.

2024.10.04 15:35백봉삼

루카스메타-게티이미지코리아, AI 협업 솔루션 위해 '맞손'

루카스메타와 게티이미지코리아가 인공지능(AI) 서비스 혁신을 위해 손을 맞잡았다. 루카스메타는 게티이미지코리아와 AI 기반의 협업 솔루션 공동 개발을 위한 전략적 업무협약(MOU)을 체결했다고 24일 밝혔다. 업무협약을 통해 양사는 상업적 활용이 가능한 AI 기반 이미지 및 협업 서비스를 구축할 예정이다. 루카스메타는 생성 AI 기술을 활용해 이미지 생성 및 편집기 커스텀 솔루션을 개발할 계획이다. 게티이미지코리아는 이를 위해 회사가 보유한 1억7천300만개의 비주얼 콘텐츠를 제공한다. 이번 협력은 금융 분야를 포함한 다양한 분야에의 AI 솔루션 개발에 초점을 맞추고 있다. 양사는 금융권을 시작으로 다양한 B2B 및 B2G 시장에 진출할 계획이다. 현재 글로벌 기업 캔바와 국내의 미리캔버스, 망고보드 등이 유사한 서비스를 제공하고 있어 경쟁이 치열하게 진행 중이다. 이번 협약을 통해 루카스메타와 게티이미지코리아는 차별화된 기술력과 방대한 콘텐츠를 바탕으로 시장에서의 경쟁력을 강화할 전망이다. 한예원 루카스메타 대표는 "이번 협약을 통해 AI 기술과 저작권 이미지 자산의 결합으로 혁신적인 서비스를 제공하게 됐다"며 "특히 금융 분야에서의 혁신 서비스 개발에 주력할 것"이라고 말했다. 박건원 게티이미지코리아 대표는 "이번 협력을 통해 국내 AI 서비스 시장에서의 입지를 더욱 강화할 수 있을 것으로 기대한다"고 강조했다.

2024.09.24 17:37조이환

이미지 AI 발전 가속…전문가들 "포르노·가짜 뉴스 남용 막아야"

생성 인공지능(AI)의 그림이 정교해지고 이미지 편집 기능이 추가돼 실제 사진과 구분이 점점 어려워지고 있다. 이를 남용하는 사례가 늘면서 윤리적 해결책과 법제화의 필요성이 커지고 있다. 19일 미국의 테크 전문지 벤처비트에 따르면 구글은 최근 미국 시장에서 '이마젠3'를 출시했다. 이는 지난 5월 구글이 해당 모델을 최초로 발표한 후 3개월 만이다. 이에 따라 '이마젠' 사용자들은 텍스트를 입력해 그림을 마음껏 그릴 수 있게 됐다. 업계는 이를 오픈AI의 이미지 생성 모델인 '달리'에 대항하려는 움직임으로 보고 있다. 구글보다 앞서 지난해 10월 오픈AI는 '챗GPT'에 '달리3'를 통합한 멀티모달 모델을 도입했다. 이는 지금까지 유료 이용자들에게만 제공됐던 모델이었지만 지난 15일부터 무료 사용자에게도 하루 최대 2건씩 제공되고 있다. 일론 머스크 엑스(X) 대표의 챗봇 '그록'도 이에 가세했다. 지난 13일 X는 프리미엄 사용자들에게 '그록-2'의 베타 버전을 제공하기 시작했고, 여기에는 이미지 생성 기능도 포함돼 있다. 이들 이미지가 점점 실제와 구분이 안 되는 수준으로 진화하고 있다는 것이 업계 전문가들의 의견이다. 실제로 루르 대학교가 올해 5월 실시한 조사에 따르면 3천명의 연구 참가자 대부분이 AI가 생성한 이미지를 실제 사진으로 착각한 것으로 나타났다. 이제 생성 AI가 단순히 그림을 생성하는 것뿐만 아니라 편집까지 할 수 있어 더 많은 우려를 낳고 있다. 샌프란시스코에 위치한 그림 AI 스타트업인 미드저니는 지난 15일 웹브라우저 이미지 편집기를 공개했는데 이 서비스는 이미지 일부를 다시 칠하거나 경계를 늘리는 등의 아웃페인팅 및 캔버스 확장 기능을 지원한다. 이렇게 이미지 생성 및 편집 AI가 급속도로 발전하면서 가짜 이미지 남용 가능성에 대한 우려가 커지고 있다. 실제로 머스크의 '그록'은 '이마젠'이나 '달리'와 달리 크게 검열되지 않고 있다. 머스크 X 대표가 '세상에서 가장 재미있는 AI'라고 표현한 그록은 프롬프트에 따라 대부분의 이미지를 생성할 수 있다. 외신에 따르면 '그록'은 프롬프트를 따라 테일러 스위프트· 카멀라 해리스 후보의 노골적 성적 대상화 이미지와 911 테러를 저지르는 트럼프 전 대통령의 사진 등을 생성한 바 있다. 전문가들은 검열되지 않는 이미지에 편집 기능까지 더해지면 문제가 더 심각해질 수 있다고 분석한다. AI는 아직도 영어를 제외한 글자들을 제대로 표시하지 못하고 사람의 손가락 같은 복잡한 형태를 그리지 못하지만 기술이 발전할수록 이러한 문제도 해결될 전망이기 때문이다. 이미 유사 기술인 딥페이크의 경우 기술이 고도화되면서 여러 문제가 발생했다. 지난 15일 샌프란시스코시 변호국은 딥페이크 포르노를 생성할 수 있는 사이트들의 폐쇄 조치를 요구하는 소송을 제기했다. 이 사이트들은 오픈소스 생성 AI를 사용해 피해자들의 동의 없이 얼굴을 포르노 영상과 합성하는 등의 문제를 초래했다. 이는 딥페이크 기술이 극도로 고도화되고 상용화가 가능한 수준에 이르렀음에도 관련 규제가 따라오지 못했음을 보여준다. 전문가들은 딥페이크와 마찬가지로 점점 고도화되고 있는 이미지 생성 및 편집 AI에도 신속히 규제를 마련해야 한다고 입을 모은다. 이미지 AI들이 고도의 편집 기능을 통해 성적 대상화 및 가짜뉴스 이미지를 대량생산할 가능성이 크기 때문이다. 이러한 폐해를 방지하기 위해 규제뿐만 아니라 기업들의 기술 개발도 필요하다고 전문가들은 분석한다. 하디 살만 오픈AI 연구원은 "기업들은 AI 도구의 잠재적 위협에 대한 방어 수단을 구축하는 데 투자해야 한다"며 "이를 위해 모델 개발자, 정책 입안자, 소셜미디어 플랫폼 간의 적극적 협력이 필요하다"고 강조했다.

2024.08.19 17:52조이환

머스크, AI 챗봇 '그록2' 출시…도 넘은 이미지 생성 논란

일론 머스크가 최근 출시한 인공지능(AI) 챗봇 '그록2가' 폭력적이고 선정적인 이미지를 제한 없이 생성하면서 논란을 빚고 있다. 가디언 등 외신은 16일 그록2가 이미지 생성 기능을 탑재했다고 일제히 보도했다. 다만 이 기능은 부적절한 콘텐츠를 자동으로 차단하는 기능을 갖추지 않은 것으로 확인됐다. 현재 오픈AI의 '달리3'나 스태빌리티의 '스테이블 디퓨전'은 해당 시스템을 추가한 상태다. 실제 가디언이 직접 확인한 결과 그록2는 공인 대상으로 부적합한 이미지를 손쉽게 생성했다. 이 챗봇은 카멀라 해리스 미국 부통령과 가수 테일러 스위프트를 노골적으로 성적 대상화한 이미지를 만들어 냈다. 또 도널드 트럼프 전 미국 대통령이 쌍둥이 빌딩에 비행기를 몰고 가는 장면이나 폭탄을 들고 있는 이슬람 창시자 무함마드 등의 이미지도 생성해 냈다. 반면 오픈AI의 '달리3'는 같은 명령어에 '폭력적이거나 불쾌감을 주는 이미지 생성은 불가능하다'고 답변했다. 이런 상황에도 머스크는 그록을 '세상에서 가장 재미있는 AI'로 칭하며 정렬(Alignment) 조치가 없는 AI 사용을 옹호하는 듯한 모습을 보였다. 다수 외신은 이번 그록의 사례가 AI 도구 사용 규제 논의 필요성을 촉진할 것이라 봤다. 가디언은 "이번 사건은 구글 제미나이가 출시 직후 사실을 오도하는 그림을 생성한 것과 마찬가지로 이미지 생성 AI의 부작용을 드러내는 사례"라며 "이미지 생성 AI가 가짜뉴스뿐 아니라 차별과 혐오를 촉발할 위험이 있음을 보여준다"고 분석했다.

2024.08.16 10:09조이환

키컷스톡, 필요한 영상·이미지 말하듯이 찾는다

콘텐츠 AI 솔루션 기업 포바이포(대표 윤준호)가 운영하는 고화질 영상·이미지 스톡 플랫폼 '키컷스톡'이 플랫폼 이용자의 편의성을 극대화하기 위해 다양한 AI 기능을 도입했다고 6일 밝혔다. 키컷스톡이 이번 새롭게 도입한 AI 기능은 총 두 가지로, '자연어 문장 검색' 기능과 '화질 고도화 AI도구'다. 자연어 문장 검색 기능은 문맥의 이해와 다의어 처리가 모두 가능한 거대 언어 모델(LLM)을 활용해 찾으려는 대상과 무관한 검색 결과가 도출되는 것을 방지하고 사용자의 의도를 정확히 반영한 검색 결과를 제공, 이용 편의성을 높인다. 대부분의 스톡 플랫폼은 기본적으로 등록된 이미지 및 영상들의 키워드 매칭을 통해 검색 결과를 보여준다. 이런 검색 방식은 키워드 간 맥락은 고려하지 않고 각 키워드를 포함한 결과를 모두 보여주기 때문에 검색의 정교함과 정확도가 떨어질 수밖에 없다. 예를 들어 '장난감을 가지고 노는 고양이' 영상을 찾기 위해 '장난감'과 '고양이' 등의 키워드를 함께 검색하면 의도와는 전혀 다른 '물고기 모양 장난감'이나 '고양이 캐릭터 장난감' 등이 검색 결과에 뒤섞이게 되는 식이다. 반면 이번 도입한 자연어 문장 검색 기능은 AI 기반 이미지 캡셔닝(Image Captioning) 과정을 통해 이미지와 영상에 대한 설명을 문장 형태로 추출해 '장난감을 가지고 노는 고양이'와 같이 맥락을 포함한 문장 형태로 검색해도 정확한 결과물을 찾아 낼 수 있다. 한층 정교해진 검색 기능을 통해 플랫폼 사용자들은 구체적으로 원하는 이미지나 영상을 빠르고 편리하게 찾을 수 있을 것으로 기대를 모으고 있다. 또 AI도구 기능은 플랫폼 내에서 구입한 영상 및 이미지를 대상으로 빠르게 해상도를 높이거나 노이즈를 제거할 수 있도록 마련한 기능이다. 필요한 스톡 영상이나 이미지가 원하는 화질 사양으로 존재하지 않는 경우, 스톡을 구입한 후 해당 기능을 통해 초고화질로 고도화해 사용할 수 있어 편의성을 높이고 이용자들의 선택 폭을 크게 넓힐 수 있게 됐다. 해당 기능은 키컷스톡 운영사인 포바이포가 자체 개발한 화질 개선 AI 솔루션 '픽셀'의 일부 기능을 키컷스톡 플랫폼을 통해 제공하는 방식으로 이뤄진다. 해상도 높이기와 노이즈 제거 두 가지 효과를 적용할 수 있고 플랫폼에서 구입한 스톡 영상 및 이미지를 AI센터에 이메일로 보내면 개선된 결과물을 추가 비용 없이 받아 볼 수 있다. 키컷스톡 운영을 총괄하는 최인호 부문장은 "이미지 내 피사체를 정확하게 인식하고 문장 형태로 바꿔 표현해주거나 해상도, 노이즈를 최적화해 화질을 극대화해주는 기능들은 다양한 AI모델이 등장하기 전에는 상상도 하지 못했던 기술들"이라며 "다양한 AI 기능들을 적극 도입한만큼 더 많은 제작자들이 키컷스톡 플랫폼을 통해 다양한 콘텐츠를 보다 쉽고 편리하게 제작할 수 있길 기대한다"고 말했다.

2024.08.06 11:11백봉삼

메타, 'AI 셀카' 생성 서비스 '이매진미' 소개

메타가 생성형 인공지능(AI)을 활용한 새 창작 도구를 소개했다. 테크크런치 등 외신에 따르면, 메타는 AI를 활용해 사용자의 얼굴이 들어간 '셀카 이미지' 생성 기능 '이매진미(Imagine Me)'를 선보였다. 사용자는 자신의 얼굴 사진을 AI에게 학습시킨 뒤 왕, 우주비행사, 힙합 가수 등 다양한 직업을 가진 자신의 모습을 만들어낼 수 있다. 메타 블로그에 따르면, 이매진미는 미국에서 베타 버전으로 출시된 뒤 22개국에서 왓츠앱·인스타그램 메신저 페이스북을 통해 서비스될 예정이다. '이매진미'의 서비스 대상 언어는 ▲프랑스어 ▲독일어 ▲힌디어 ▲힌디어-로마자 문자 ▲이탈리아어 ▲포르투갈어 ▲스페인어이며 앞으로 더 많은 언어가 추가될 예정이다. 사용자는 메타의 AI 채팅에 "이매진미(Imagine me)"라고 입력해 서비스를 시작한 다음 "왕이 된 나를 상상해봐(Imagine me as royal)"같은 명령어를 추가해 이미지를 생성한다. 메타 관계자는 "슈퍼히어로, 록스타 또는 프로 운동선수가 되는 꿈을 꾼 사람들이 이제 꿈을 이룬 자신의 모습을 볼 수 있다"며 "이매진미 덕분에 메타 AI로 이상적인 이미지를 만드는 것도 더 쉬워질 것이다. 앞으로 다양한 기능을 이매진미에 추가하겠다"고 말했다.

2024.07.25 10:00정석규

게임업계, 생성 AI 도입 활발…올해 1만1천명 '해고'

생성 인공지능(AI) 도입이 비디오 게임 분야의 일자리를 위협하고 있다. 주요 게임개발사들이 이 기술을 통해 게임개발을 자동화하고 있기 때문이다. 24일 와이어드에 따르면 작년에만 게임 산업에서 1만500명이 해고됐고 올해 1만1천명 이상의 추가 해고가 예상된다. 외신은 이러한 상황이 생성 AI 도입으로 인해 촉발된 것이라고 분석했다. 특히 액티비전 블리자드(Activision Blizzard)는 지난해 봄 내부 이메일을 통해 생성 AI 도입 계획을 발표한 후 콘셉트아트 제작에 '미드저니(Midjourney)'와 '스테이블디퓨전(Stable Diffusion)' 등의 그림생성 AI를 사용하기 시작했다. 이에 따라 콘셉트 아티스트, 그래픽 디자이너, 일러스트레이터 등 2D 이미지 관련 직종이 주로 직격탄을 맞은 것으로 전해졌다. 이는 최근 출시된 그림 AI들이 이미지를 생성하는 능력이 인간 2D 일러스트레이터보다는 조금 낮지만 비용 대비 성능이 우수하기 때문이다. 반면 3D 애니메이션 작업이나 프로그래밍은 아직 완전히 자동화되기 어렵고 비용이 많이 든다. 이에 따라 2D 관련 아티스트들의 인력 대체가 빠르게 진행되는 반면 3D 작업·프로그래밍 분야는 아직 영향을 덜 받고 있다. 관련 연구 결과는 추후 다른 분야에서도 상황이 악화될 것임을 시사한다. 컨설팅 업체 CVL 이코노믹스(CVL Economics)는 최근 보고서를 통해 향후 5~10년 내 게임 개발의 절반 이상을 자동화할 것이라고 추정하며 이미 게임 회사의 약 90%가 생성 AI에 작업을 위임하고 있다고 발표했다. AI 도입으로 인한 저작권 문제도 심각하다. 일부 스튜디오는 법 위반을 걱정하며 생성 AI 사용을 지양하나 대부분의 게임 회사가 비용 문제로 저작권 문제를 무시하며 AI 도입을 강행하고 있다고 외신은 보도했다. 한 게임업계 관계자는 "AI 자체는 나쁘지 않지만 최종 목표가 수익을 극대화하는 것이라면 문제가 있다"며 "기술이 일자리를 대체하지 않으면서도 세상의 문제를 해결하는 데 도움 되는 방식으로 사용돼야 한다"고 강조했다.

2024.07.24 10:23조이환

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

美 재무장관 "한국과 무역협상 마무리 중"…현대차, 관세 손실 줄일까

마이크론은 어떻게 HBM4 속도를 빠르게 구현했을까

오픈AI는 왜 오라클과 '스타게이트' 함께 했나

[속보] 대법, 최태원·노소영 1조3800억원 재산분할 파기 환송

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.