• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
스테이블코인
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이미지'통합검색 결과 입니다. (65건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"구글 AI, 워터마크 삭제까지"…'제미나이 플래시 2.0'에 저작권 업계 긴장

구글이 자사 인공지능(AI) 이미지 생성·편집 기능을 대폭 강화했다. 멀티모달 처리와 향상된 추론 능력 덕분에 스토리텔링과 창작의 자유는 한층 넓어졌지만 저작권 침해와 콘텐츠 조작 가능성도 커져 우려를 낳고 있다. 17일 테크크런치에 따르면 구글은 최근 자사 '제미나이 플래시 2.0'의 네이티브 이미지 생성 기능을 공개하고 이를 두고 개발자들이 실험할 수 있도록 조치했다. 이번 업데이트는 구글이 실험용 AI들을 공개해 둔 웹사이트인 'AI 스튜디오'와 '제미나이' 애플리케이션 프로그램 인터페이스(API)를 통해 제공된다. 이번에 '플래시 2.0'에 추가된 이미지 생성 및 편집 기능은 텍스트와 이미지를 결합해 일관된 스토리를 생성하는 기능을 지원한다. 사용자가 원하는 스타일에 맞춰 스토리를 변경하거나 그림을 수정할 수도 있다. 대화형 이미지 편집 기능도 추가돼 자연어 명령만으로 이미지의 세부 요소를 조정할 수 있다. 이 모델은 단순한 이미지 생성 기능을 넘어 '세계에 대한 이해' 능력도 탑재했다. 텍스트 렌더링 성능도 개선돼 광고·초대장 제작 등에도 활용 가능할 것으로 보인다. 일례로 사용자는 자연어 프롬프트로 AI에 말을 그리라고 지시한 후 생성된 말의 모양과 외모는 유지하면서 색깔만 바꾸는 것이 가능해진다. 이외에도 캐릭터 일러스트를 삽입한 후 캐릭터가 입고 있는 옷을 바꾸거나 만화 컷에 나온 등장인물의 발언만을 다르게 바꾸는 것도 가능하다. 다만 이같은 AI의 강력한 이미지 편집 기능이 저작권 문제를 일으킬 가능성도 크다. 일부 사용자는 '플래시 2.0'을 이용해 이미지에 삽입된 워터마크를 제거하는 실험을 진행 중이다. 특히 게티이미지와 같은 스톡 이미지 기업의 콘텐츠 보호 장치가 AI에 의해 무력화될 가능성이 제기된다. 이전까지 오픈AI, 앤트로픽 등의 AI 모델들은 워터마크 제거 요청을 명확히 거부해왔다. 반대로 '플래시 2.0'은 별다른 제약 없이 워터마크를 삭제하고 그 자리를 자연스럽게 채우는 기능을 수행하는 것으로 알려졌다. 이러한 현상에 구글 측은 '플래시 2.0'이 아직 실험적 단계에 있으며 상업적 사용이 금지돼 있다고 밝혔다. 다만 AI의 기술적 한계를 실험할 목적으로 접근하는 사용자들이 많아 저작권 업계의 반발이 예상된다. 현재 미국 저작권법에 따르면 원 저작자의 동의 없이 워터마크를 삭제하는 행위는 불법이다. 일부 예외적인 경우를 제외하면 법적 조치가 가능하, 저작권 보호 기관들의 대응이 있을 것으로 보인다. 테크크런치는 "'플래시 2.0'은 유명인과 저작권이 있는 캐릭터의 이미지를 생성할 뿐만 아니라 기존 사진에서 워터마크를 제거하는 기능까지 수행하는 것으로 확인됐다."며 "일부 저작권 소유자들은 이 AI의 사용 제한이 느슨한 점에 대해 강하게 반발할 가능성이 크다"고 분석했다.

2025.03.17 14:53조이환 기자

사진 몇 장만으로도 3D 영상 만드는 AI 알고리즘 개발

건국대학교 김원준 교수(전기전자공학부) 연구팀이 적은 수의 이미지 입력만으로 특정 장면의 모든 시점 이미지를 생성할 수 있는 인공지능(AI) 알고리즘을 개발했다. 이번 연구 성과는 오는 6월 미국 내슈빌에서 열리는 '컴퓨터 비전 및 패턴 인식 학술대회(IEEE/CVF CVPR·Conference on Computer Vision and Pattern Recognition)'에서 발표될 예정이다. CVPR은 컴퓨터 비전·AI 분야에서 권위 있는 학술대회 중 하나다. 연구팀은 3차원 장면을 표현하는 핵심 기술인 'Gaussian Splatting' 기법을 보다 적은 입력 데이터만으로도 정밀하게 수행할 수 있도록 'Dropping 기반 학습 전략'을 새롭게 제안했다. 연구팀 관계자는 “이 방법은 특정 신경망 구조에 종속되지 않으면서 추가 메모리 사용 없이 적용할 수 있어 범용성이 높다”며 “기존 기술보다 적은 수의 입력 이미지만으로도 높은 정밀도의 3차원 장면 렌더링이 가능해졌다”고 설명했다. 이번 연구는 3차원 장면 이해 및 콘텐츠 생성, 이머시브(Immersive) 서비스 등 다양한 분야에서 핵심적으로 활용될 전망이다. 논문 제1저자는 박현우 석사과정 학생이며, 김원준 교수가 교신저자로 참여했다.

2025.03.13 12:42주문정 기자

SK하이닉스, CIS 사업서 철수…"AI 메모리에 역량 집중"

SK하이닉스가 회사의 비주력인 CMOS 이미지센서(CIS) 사업에서 손을 뗀다. 관련 시장의 수요 감소, 중국 후발주자들의 진입 등으로 사업성이 미미하다는 분석이 작용한 것으로 관측된다. SK하이닉스는 6일 CIS 사업부문 구성원 소통 행사에서 "글로벌 AI 중심 기업으로서의 입지를 굳건히 하기 위해 동 사업부문이 지닌 역량을 AI 메모리 분야로 전환한다"고 밝혔다. SK하이닉스는 이날 "CIS 사업부문은 2007년 출범한 이후 여러 어려움을 극복하고 모바일 시장에 진입해 소기의 성과를 달성했다"며 "여기서 우리는 메모리만으로는 경험할 수 없는 로직 반도체 기술과 커스텀(Custom) 비즈니스 역량을 얻게 됐다"고 말했다. 이어 "최근 AI 시대가 도래하며 회사는 AI 메모리 분야에서 큰 성과를 거뒀고, 현재는 AI 산업의 핵심 기업으로 거듭나기 위한 대전환기를 맞이했다"고 강조하며 "CIS 사업부문이 보유한 기술과 경험은 회사의 AI 메모리 경쟁력을 강화하는데 꼭 필요한 만큼 전사의 역량을 한데 모으기 위해 이번 결정을 했다"고 설명했다. 앞서 SK하이닉스는 2008년 CIS 개발업체 실리콘화일을 인수하면서 이미지센서 시장에 진출한 바 있다. 2019년에는 일본에 CIS 연구개발(R&D) 센터를 개소하고, 같은해 이미지센서 브랜드 '블랙펄'을 출시했다. 이후 삼성전자의 폴더블폰 시리즈인 '갤럭시Z3'와 중국 스마트폰에 CIS를 납품하는 등 성과를 거뒀으나, 사업을 크게 확장시키지는 못했다. 스마트폰 시장의 수요 감소, 중국 후발주자들의 추격 등이 작용한 것으로 풀이된다. SK하이닉스는 "이번 결정이 회사의 AI 메모리 경쟁력을 한단계 성장시키며 '풀 스택 AI 메모리 프로바이더(Full Stack AI Memory Provider)'로서 회사의 위상을 공고히 하는데 기여할 것으로 기대한다"며 "또한 이를 통해 주주 가치도 극대화하고자 한다"고 밝혔다. 임직원들의 전환 과정에서 대해서는 "기존 CIS 소속 구성원들이 새로운 조직으로 이동하는 데 있어 각 개인의 전문 역량을 충분히 발휘할 수 있도록, '원팀 마인드' 차원에서 지원을 아끼지 않을 방침"이라고 설명했다.

2025.03.06 15:06장경윤 기자

한국딥러닝 "문맥까지 이해하는 OCR 시대 왔다…업무 자동화 핵심 될 것"

"광학문자인식(OCR) 성장 잠재력은 무궁무진합니다. 문서 디지털화로 OCR 역할이 늘어날 것이기 때문입니다. 이럴수록 정확하면서도 안전한 OCR 서비스가 필요합니다. 한국딥러닝은 자체 모델 '딥 이미지'를 통해 이런 OCR 서비스를 맞춤형으로 공급하고 있습니다. OCR을 단순히 문서 인식하는 기술이 아닌 업무 자동화 핵심으로 만들 것입니다." 김지현 한국딥러닝 대표는 지디넷코리아 인터뷰에서 자사 OCR 서비스 특장점을 소개하며 이같이 밝혔다. 김지현 대표는 2019년 한국딥러닝을 설립했다. 22세 대학생이던 때다. 학창 시절부터 개발자 부모 영향으로 자연스럽게 코딩을 접했다. 스타트업에서 대학생 인턴으로 근무하며 창업을 결심했다. 그는 "당시 딥러닝 기술이 확산하던 때"였다며 "AI 기술이 다양한 산업에 스며들 것으로 판단해 회사를 설립했다"고 밝혔다. 김 대표는 창업 전부터 텍스트와 이미지, 영상, 음성 데이터를 수집했다. 이를 통해 자체 거대비전언어모델(LVLM) 딥 이미지를 내놨다. 딥 이미지는 텍스트와 이미지를 동시에 처리·생성할 수 있다. 텍스트·이미지 데이터가 상호작용하며 분석을 수행한다는 점에서 멀티모달 모델과 다르다. 이 모델은 현재 1억 장 넘는 이미지를 학습했다. 이를 기반으로 광학문자인식(OCR)을 비롯한 객체 검출, 영상 이해, 이미지 생성, 3D 모델 생성 등 다양한 비전 AI 솔루션을 제공한다. 한국딥러닝은 모델 개발과 운영을 위해 자체 그래픽처리장치(GPU) 서버와 분산처리시스템을 온프레미스 형태로 갖췄다. 김 대표는 "모델 초기 투자비와 유지비 부담이 컸다"며 "고효율 분산 학습 알고리즘을 통해 비용을 줄였다"고 설명했다. 이어 "서버는 스케일아웃 방식으로 확장 가능하도록 설계했다"며 "비용 문제는 고객사와 기술협력·장기계약을 통해 해결했다"고 덧붙였다. "기업 맞춤형으로 제공…정확도·보안·유연성 높아" 김지현 대표는 자사 OCR 특장점으로 높은 정확도, 유연성, 보안성을 꼽았다. 한국딥러닝은 각 태스크와 프로젝트 특성을 반영한 맞춤형 OCR을 제공한다. 단순히 글자를 인식하는 데 그치지 않고, 문서 맥락과 레이아웃을 고려해 필요한 정보를 정확히 추출하는 것이 강점이다. 김 대표는 "문서 폼이 다양하면 OCR 인식 정확도가 떨어진다"며 "이는 OCR 기술이 주로 정형화된 폼에만 최적화됐기 때문"이라고 설명했다. 그는 "딥이미지의 OCR은 다양한 폼의 문서 수십만 건을 분석하고 필요한 데이터를 일관성 있게 정리할 수 있다"고 말했다. 김 대표는 자사 OCR이 높은 보안성을 갖췄다고 강조했다. 현재 온프레미스 형태로 OCR 서비스를 제공하고 있어서다. 이에 문서 데이터가 외부로 나가지 않고 기업 내부에서 처리된다. 반면 타사 OCR 서비스는 인터넷 기반의 클라우드 환경에서 작동한다. 사용자가 문서 파일을 외부 서비스에 올려야 한다는 의미다. 이 과정에서 민감 정보가 외부로 전송될 수 있다. 한국딥러닝은 온프레미스 외에도 프라이빗 클라우드와 가상 프라이빗 클라우드(VPC)상에서 서비스를 지원한다. 김 대표는 OCR 서비스가 키-밸류 추출과 맞춤형 폼 변환 기능을 통해 높은 유연성을 갖췄다고 설명했다. 키-밸류 추출은 문서에서 중요한 정보(키)와 그에 해당하는 값(밸류)을 자동으로 찾아내는 기능이다. 예를 들어 신청서에서 이름과 생년월일, 전화번호가 키다. 여기에 입력된 내용이 밸류다. 김지현 대표는 "보통 OCR은 문서 속 텍스트만 인식한다"며 "필요한 정보를 찾기 위해 추가 작업이 필요하다"고 말했다. 이어 "자사 OCR은 문서 구조를 분석해 필요한 정보만 정확히 추출한다"며 "고객은 원하는 데이터를 빠르게 찾을 수 있다"고 강조했다. "OCR 잠재력 무한대"…이미지 분석으로 해외 공략 김지현 대표는 OCR 사업 확장 가능성이 더 커질 것이라고 내다봤다. 그는 "앞으로 문서는 디지털 데이터로 변환될 것"이라며 "OCR이 이 부분에서 큰 역할을 할 것"이라고 예측했다. 또 "거대언어모델(LLM) 기술이 발전하면서 OCR과 챗봇, 에이전트 연계 활용도 가능해질 것"이라며 "이에 따른 OCR 사업 확장 가능성도 높다"고 덧붙였다. 김 대표는 솔루션을 해외 시장에 적극 공급할 예정이다. 현재 인도네시아 건설사에 도로와 터널 균열을 감지하는 이미지 분석 솔루션을 제공하고 있다. 그는 "언어 장벽이 있는 OCR 대신 이미지 디텍션, 세그멘테이션, 분류 서비스로 해외 시장을 노릴 것"이라고 말했다. 한국딥러닝은 올해 OCR 기반 데이터 수집·정제 작업에 집중할 계획이다. 김 대표는 "OCR로 변환한 문서를 디지털화한 후 챗봇이나 전사적자원관리(ERP) 시스템에 적용할 수 있도록 가공하는 것이 목표"라며 "OCR을 단순히 문서를 인식하는 기술이 아닌 업무 자동화 핵심 요소로 만들 것"이라고 강조했다.

2025.02.07 15:07김미정 기자

"AI로 부진한 실적 회복"…게티이미지, 셔터스톡 인수

인공지능(AI)과 스마트폰 등장으로 이미지 콘텐츠 제공사 영향력이 약화했다는 지적이 나오는 가운데 게티이미지가 셔터스톡을 인수해 성장 동력 확보에 나섰다. 8일 CNBC 등 외신에 따르면 게티이미지가 경쟁사인 셔터스톡를 인수한다고 발표했다. 합병회사 규모는 부채를 포함해 37억 달러(약 5조3천900억원)다. 게티이미지는 이번 거래에서 셔터스톡에 현금 3억3천100만 달러(약 4천800억원)와 주식 3억1천940만주를 지급하는 데 합의했다고 밝혔다. 게티이미지는 셔터스톡 주주에게 1주당 약 28.88달러를 배당한다. 주주들은 이를 전액 현금으로 받거나 현금과 게티 주식을 혼합해 수령할 수 있다. 게티이미지 주주는 거래 후 합병 회사 약 54.7%를 보유한다. 나머지는 셔터스톡 주주 몫이다. 합병 회사의 최고경영자(CEO)는 크레이그 피터스 게티이미지 CEO가 맡는다. 다수 외신은 두 기업이 합병을 통해 콘텐츠 제작 서비스를 확대하고 비용을 절감해 수익성을 높일 것으로 봤다. 최근 AI가 콘텐츠 생성 시장을 장악하고 휴대전화 카메라 사용 증가가 스톡 사진 가치를 떨어뜨렸다는 이유에서다. 전날 종가 기준 게티이미지 주가는 2022년 7월 상장 이후 약 73% 떨어졌다. 같은 기간 셔터스톡 주가는 약 50% 하락했다. CNBC는 "이번 합병 건이 도널드 트럼프 미국 대통령 당선인의 첫 심사 대상이 될 것"이라며 "새 정부가 기업 인수합병에 어떤 입장을 보일지 확인할 수 있는 사례"라고 평했다.

2025.01.08 11:11김미정 기자

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

KT 조직개편...박윤영號 첫날 '본질·성장' 속도전

[현장] 조항 손질 나선 AI 기본법…"미래 세대 보호·신뢰 회복까지 담아야"

백종원 더본코리아 "잃어버린 1년...음해·공격 법적 책임 묻겠다"

테슬라 FSD 무단 활성화 '불법'…국토부 "2년 이하 징역"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.