• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'스테이블디퓨전'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

스태빌리티AI, '스테이블디퓨전3.5' 출시…창작자 지원 강화

스태빌리티AI가 이미지 생성 모델 '스테이블디퓨전'의 차기 버전을 공개했다. 사용자의 요구 사항에 맞춰 모델을 더욱 세밀하게 조정할 수 있도록 사용자 정의 기능을 확대하는 등 이미지 전문가를 위한 지원을 확대한 것이 특징이다. 23일 실리콘앵글 등 외신에 따르면 스태빌리티AI는 스테이블디퓨전 3.5를 허깅 페이스를 통해 출시했다. 스테이블디퓨전3.5는 지난 6월 출시한 스테이블디퓨전3의 개선 버전으로 창의적인 프로젝트와 전문적인 작업을 위해 모델을 더욱 세밀하게 조정할 수 있는 옵션을 제공한다. 빈티지한 사진 효과나 특정 시대의 화풍을 연출하는 등 다양한 스타일이나 텍스처를 지정해 원하는 시각적 표현을 생성할 수 있다. 또 이 제품은 대량의 이미지를 신속하게 생성해야 하는 이미지 전문가와 기업을 위해 더 빠르게 고품질의 이미지를 생성할 수 있도록 처리 속도가 향상됐다. 더불어 모델 개선을 통해 이미지 품질을 전반적으로 향상시키고 사용자가 요구하는 바를 더 정확하게 반영할 수 있도록 프롬프트 명령 이해도를 높였다. 공개한 AI 모델은 스테이블디퓨전3.5 라지와 스테이블디퓨전3.5 라지 터보 2종이다. 80억 개의 매개변수를 기반으로 학습한 스테이블디퓨전3.5 라지는 전문적인 고품질 이미지 생산에 초점을 맞춰 설계된 모델로 1메가픽셀 해상도를 지원한다. 스테이블디퓨전3.5 라지 터보는 라지 모델보다 이미지를 더 빠르게 생성할 수 있도록 알고리즘 최적화 및 하드웨어 지원 기능이 적용됐다. 스태빌리티AI는 보다 효율적인 이미지 생성 모델을 원하는 사용자를 위한 스테이블디퓨전3.5 미디엄도 오는 29일 선보일 예정이다. 스테이블디퓨전3.5 미디엄은 26억 개의 매개변수 기반으로 일반 PC나 노트북에서도 활용할 수 있는 수준의 컴퓨팅 파워를 요구한다. 스태빌리티AI 측은 "스테이블디퓨전3는 우리의 기준이나 커뮤니티의 기대에 충분히 부응하지 못했다"며 "이에 커뮤니티 피드백을 듣고 우리의 사명을 발전시키는 버전을 추가로 개발하기 위해 노력했다"고 설명했다. 이어 "이번에 선보이는 AI모델은 개발자와 제작자들이 손쉽게 비용 부담 없이 사용할 수 있는 도구를 제공하려는 우리의 의지를 반영한다"며 "상업적, 비상업적 사용 모두 무료로 제공되는 만큼 이를 활용해 원하는 목표를 달성하길 바란다"고 덧붙였다.

2024.10.23 10:31남혁우

[현장] '99년생' 딥마인드 前 연구원 "AI 시대, 창작자 보호 없으면 미래도 없다"

"인공지능(AI) 기술이 발전함에 따라 창작자들의 지적재산권(IP)이 끊임없이 위협받고 있습니다. 기존 법률 시스템만으로는 이 문제를 효과적으로 해결하기 어렵습니다. 이 문제를 해결하고자 스토리 프로토콜(Story Protocol)을 공동창업했습니다. 이번 행사도 창작자 보호와 공정한 보상을 위해 마련됐습니다." 제이슨 자오 스토리 최고 프로토콜 책임자(CPO)는 2일 성동스페이스 에스원에서 개최된 '프로그래머블한 지적재산권(PIP) 서울' 행사에 참가한 후 기자와 만나 이같은 포부를 밝혔다. 스토리는 창작자들이 자신의 작품을 보호하고 수익을 내도록 돕는 웹3(Web3) 기반 플랫폼이다. 지난 2022년 옥스포드 대학 출신의 이승윤 대표가 웹소설 플랫폼 '래디시(Radish)'를 약 5천억원에 카카오엔터테인먼트에 매각한 다음 창업한 이 플랫폼은 창작물의 소유권과 사용 기록을 투명하게 관리한다. 스토리 공동창업자로서 이번 행사의 전반적 기획과 운영을 총괄한 자오 CPO는 1999년생으로, 지난 4년간 AI 업계의 최전선에서 프로젝트들을 주도해왔다. 스탠포드 대학교 시절 컴퓨터 비전 선구자인 페이페이 리 교수의 랩에서 연구했으며 이후 딥마인드에서 거대언어모델(LLM) 개발에 앞장섰다. 자오 CPO는 딥마인드에서의 경험이 창업의 주요 원인이 됐다고 밝혔다. 초창기 LLM을 연구하며 AI가 IP에 미칠 수 있는 심각한 파급력을 목격한 것이 영향을 줬다. 생성 AI가 그림을 그리거나 텍스트를 창작하는 것을 보며 그는 이 기술이 창작자의 권리를 위협할 수 있다는 점을 가장 빠르게 인지했다. 그는 "기술이 창작업계에 미칠 엄청난 파급력에도 불구하고 당시 딥마인드에서는 이 문제에 크게 주목하지 않았던 것으로 기억한다"며 "이 때 느낀 문제의식으로 창작자들을 보호할 방법에 대해 고민하게 됐다"고 밝혔다. 그의 걱정은 선견지명이었다. 지난 2022년 11월 '챗GPT'가 출시되고 이후 그림·영상 생성 AI가 등장하면서 많은 창작업계 종사자들이 실질적인 두려움을 느끼기 시작했기 때문이다. 실제로 지난해 할리우드에서 벌어진 대규모 파업은 AI 기술의 창작물을 무단 사용에 대한 항의에 의해 촉발됐다. 상황의 심각성에도 이러한 문제는 기존의 법률적 접근만으로 해결하기 어렵다는 것이 점점 명확해졌다. 법적 절차가 디지털 시대의 빠른 정보 확산 속도를 따라가지 못했기 때문이다. 자오 CPO는 "트럼프 후보의 암살 시도 사진은 단 1초 만에 찍혔지만 삽시간에 인터넷으로 퍼져나가 밈, 뉴스, 심지어는 티셔츠 로고가 됐다"며 "이런 시대에 변호사가 한 명이 아니라 1천 명이 붙는다고 해도 기존의 법률적 방식만으로는 재빠른 IP 확산에 대응하기 힘들다"고 설명했다. 디지털 시대의 정보 확산 속도와 복잡성에 대응하기 위한 방안으로 블록체인 기술을 꼽았다. 이 기술은 자동화된 권리 집행과 투명한 기록을 제공하기 때문이다. 자오 CPO는 "기술과 법률을 통합해 창작자들이 자신의 IP를 주도적으로 관리하고 수익을 창출하도록 하는 것이 목적"이라며 "다양한 플랫폼과 협력해 창작자들이 더 쉽게 IP를 보호하고 수익을 극대화하도록 지원하겠다"고 밝혔다. 이번 행사도 이러한 기조를 따라 마련됐다. 'PIP 서울' 행사에는 에마드 모스타크 스테이블 디퓨전 창업자 외에도 오픈소스 운영체제 개발사인 아나콘다의 피터 왕 대표와 아카시 산지 월드코인 제품 총괄 등 저명한 AI·IP 업계 인사들이 참석해 탈중앙화된 AI 생태계와 창작자 보호를 위한 방안을 논의했다. 자오 CPO는 "이번 행사에 참여한 AI 기업들은 오픈 소스와 같은 열린 방식의 생태계를 지향하며 창작자 보호와 공정한 보상을 추구하고 있다"고 밝혔다. 그러면서 "물론 구글과 오픈AI와 같은 폐쇄형 생성 AI 기업들과 경쟁하는 것은 쉽지 않은 과제"라면서도 "창작자 보호의 중요성이 부각되고 이를 위한 기반이 형성된다면 결국 빅테크에게도 도움이 되는 공생형 생태계가 구축될 것"이라고 강조했다.

2024.09.02 16:12조이환

스태빌리티AI "스테이블디퓨전3, 일부 개발자에 공개"

스태빌리티AI가 이미지 생성 인공지능(AI) 모델 '스테이블디퓨전 3' 접근 범위를 늘렸다. 17일(현지시간) 더버지 등 IT 외신은 일부 개발자가 스태빌리티AI 개발자 플랫폼 API에서 스테이블디퓨전 3와 스테이블디퓨전 3 터보에 접속할 수 있다고 보도했다. 스태빌리티AI는 2월 스테이블디퓨전 3를 미리보기 버전으로 출시하고 대기자 명단을 받았다. 현재 신청자들부터 해당 모델에 접근할 수 있다. 회사는 "이 모델은 오픈AI '달리 3'보다 이미지 내 문자 인식, 배열 등에서 더 나은 성능을 보인다"고 밝혔다. 스테이블디퓨전3가 멀티모달 디퓨전 트랜스포머 아키텍처를 통해 이미지 내 텍스트 오탈자 가능성을 줄였다는 이유에서다. 이 회사는 '스테이블 어시스턴트 베타'도 발표했다. 스테이블디퓨전 3와 외부 모델로 콘텐츠를 제작할 수 있는 플랫폼이다. 이를 통해 개발자는 단순 이미지 생성뿐 아니라 콘텐츠까지 작성할 수 있다. 현재 소수 개발자만 플랫폼에 접근할 수 있다. 스태빌리티AI는 "그동안 스테이블디퓨전 3 오용을 방지하기 위해 합리적인 테스트와 조치를 취했다"며 "오픈소스 커뮤니티를 비롯한 다양한 이해관계자들과 모델 개선에 지속적으로 힘쓰겠다"고 했다.

2024.04.18 10:31김미정

스테이블디퓨전3 미리보기 공개

텍스트-이미지 모델 '스테이블 디퓨전'의 세번째 버전이 초기 미리보기로 공개됐다. 품질 및 철자 기능 향상, 다중 주제 프롬프트 등이 특징이다. 22일(현지시간) 스태빌리티AI는 차세대 텍스트-이미지 모델 '스테이블디퓨전 3' 초기 미리보기를 발표했다. 사용을 원하는 경우 미리보기 대기자명단에 등록해 이용할 수 있다. 접근권한을 얻게 되면 디스코드 서버 초대 메일을 받게 된다. 스테이블디퓨전은 2022년 2.0 버전 공개로 이미지 생성 AI 모델의 획기적 진보를 보여줬다. 세번째 버전은 기존 아키텍처와 달리 디퓨전 트랜스포머 아키텍처와 플로우 매칭을 결합했다. 디퓨전 트랜스포머 아키텍처는 일반적으로 사용되는 U-Net 백본을 트랜스포머로 대체해 이미지 디퓨전 모델을 훈련한다. 이 방식은 효율적으로 확장하고 더 높은 품질의 이미지를 생성할 수 있다. 플로우 매칭은 랜덤 노이즈에서 구조화된 이미지로 원환하게 전환하는 방법을 학습해 이미지를 생성하는 AI 모델을 만드는 기술이다. 스테이블디퓨전3는 이전 모델보다 더 나은 성능과 품질로 이미지를 만들어낸다. 한 프롬프트에 여러 주제를 넣을 수 있다. 철자 생성의 정확도도 더 높아졌다. 스테이블디퓨전3의 크기는 다양하다. 8억에서 80억개의 매개변수를 제공한다. 스테이블디퓨전은 기본적으로 오픈소스 라이선스를 따른다. 모델의 소스코드에 접근할 수 있고 미세조정이 가능하다. 현재 스테이블디퓨전3의 소스코드와 기술문서는 공개돼 있지 않다. 회사측은 미리보기 단계에서 성능과 안정성을 개선할 것이라고 밝혔다.

2024.02.23 10:43김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

"북한 해커, 위장취업해 北 송금"…메일 1천개 적발

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현