• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'스테이블 디퓨전'통합검색 결과 입니다. (5건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

스태빌리티AI 새 CEO로 프렘 아카라주 물망

스태빌리티AI가 새 최고경영자(CEO)를 선임할 것으로 전해졌다. 22일 미국 디인포메이션은 프렘 아카라주 전 웨타디지털 CEO가 스태빌리티AI 운영을 맡는다고 내부 소식통을 인용해 보도했다. 웨타디지털은 시각 효과와 애니메이션 제작을 하는 뉴질랜드 회사다. 아카라주는 2020년 1월부터 웨타디지털 CEO로 근무해 왔다. 외신은 새 CEO가 비즈니스 안정화를 우선 추진해야 한다고 분석했다. 지난해부터 실적 부진을 극심히 겪었기 때문이다. 올해 회사 1분기 매출액은 500만 달러(약 69억5천만원)에 미치지 못한 것으로 알려졌다. 적자도 3천만 달러(약 417억3천만원)를 넘어섰다. 당시 로이터가 공개한 보고서에 따르면, 이 기업은 외부 투자자도 찾고 있다. 실적 부진은 날이 갈수록 치열해지는 생성형 AI 사업 경쟁 때문이다. 스태빌리티가 제공하는 이미지 생성형 AI 서비스 '스테이블 디퓨전' 경쟁 상대인 오픈AI의 '달리3'와 미즈저니의 '미드저니' 등이 더 많은 사용자를 확보하는 추세다. 과도한 AI 모델 학습 투자도 주요 원인이다. 외신에 따르면, 이 기업은 모델 학습을 위해 매년 약 9천900만 달러(약 1천377억원)를 클라우드 인프라에 투자한 것으로 전해졌다. 인건비와 운영비도 매년 5천400만 달러(약 751억원) 발생했다. 당시 스태빌리티AI는 코드를 생성하는 모델 '스테이블 코드'나 텍스트를 만드는 '스테이블 LM'을 출시하면서 실적 부진을 만회하려 했었다. 올해 4월에는 최대 3분 분량의 오디오를 생성할 수 있는 '스테이블 오디오 2.0'를 공개하기도 했다. 이같은 노력에도 눈에 띄는 수익은 없는 것으로 전해졌다. 스테밸리티AI 측은 "새 CEO 선임에 대해 공식 발표할 내용은 아직 없다"고 디인포메이션과 벤처비트에 답했다.

2024.06.23 11:14김미정

인텔 "루나레이크 NPU 성능 4배 강화... 전력 효율도 개선"

[타이베이(대만)=권봉석 기자] 인텔이 올 3분기부터 주요 PC 제조사에 공급할 모바일(노트북)용 프로세서, 루나레이크(Lunar Lake)는 플랫폼 컨트롤러 타일에 최대 48 TOPS(1초 당 1조 번) AI 연산이 가능한 4세대 NPU(신경망처리장치), NPU 4를 탑재한다. NPU 4는 CPU나 GPU 대비 훨씬 적은 전력으로 CPU(5 TOPS)의 5배 이상, Xe2 GPU(67 TOPS)의 71% 수준 AI 처리를 수행한다. AI 연산 성능만 따지면 코어 울트라 시리즈1(메테오레이크)의 CPU, GPU, NPU를 모두 합친 수치(34 TOPS)를 넘어선다. NPU 4는 PC가 켜져 있을 때 항상 같이 돌아가야 하는 음성 인식, 악성코드 탐지, 카메라를 이용한 사물 인식 등에 적합하다. 스테이블 디퓨전 1.5 기준으로 NPU 3 대비 최대 4배 빠르게 이미지를 생성해 전력 효율도 2.9배 향상됐다. ■ 인텔 NPU, 2018년 첫 출시 이후 올해 4세대 돌입 인텔 NPU는 2016년 인텔이 인수한 스타트업 '모비디우스' 기술력 기반으로 만들어졌다. 2018년 출시된 첫 제품은 별도 칩으로 출시돼 USB 단자 등을 통해 PC에 연결해 작동했다. 연산 성능은 0.5 TOPS로 영상 처리나 사물 인식 등에 적합했다. 2세대 제품인 'NPU 2'는 2021년 출시된 제품이며 IoT(사물인터넷) 기기를 대상으로 했다. 연산 속도는 7 TOPS 수준이며 배경 흐림, 프레임 인물 고정 등 윈도 스튜디오 효과를 지원했다. 지난 주 진행된 '테크투어 타이완' 행사에서 대런 크루스(Darren Crews) 인텔 NPU 수석 아키텍트는 "NPU는 7년 전만 해도 카메라를 통한 사물 인식 등에 주로 쓰였지만 현재는 높은 연산 성능과 함께 전력 효율성 등 두 가지 목표를 모두 달성해야 하는 상황"이라고 설명했다. ■ NPU 4 하나로 메테오레이크 연산 성능 능가 지난 해 출시된 코어 울트라 시리즈1(메테오레이크)는 SOC 타일에 3세대 제품 'NPU 3'를 통합했다. 연산 성능은 11.5 TOPS로 전체 연산 성능(34 TOPS)의 1/3 가량을 차지한다. 반면 후속 제품인 루나레이크에 탑재된 NPU 4의 AI 연산 성능은 최대 48 TOPS로 메테오레이크의 CPU, GPU, NPU를 모두 합친 것보다 더 빠르다. 대련 크루스 수석 아키텍트는 "AI 연산을 실제로 수행하는 엔진 수 증가, 작동 주파수 향상, 내부 아키텍처 개선으로 NPU 4의 성능이 급격히 향상됐다"고 설명했다. ■ "TOPS 수치, 작동 클록과 MAC 연산 능력이 좌우" 최근 PC용 프로세서를 구성하는 CPU와 GPU, NPU의 AI 연산 성능 측정을 위한 기준으로 'TOPS'가 널리 쓰인다. 그러나 이 수치가 정확히 어떤 과정을 거쳐 나오는지 정확히 아는 사람은 드물다. 대런 크루스 수석 아키텍트는 "TOPS는 AI 처리에 주로 쓰이는 연산 속도와 NPU 작동 클록에 크게 영향을 받는다" 고 설명했다. AI 연산에 가장 널리 쓰이는 연산 방식은 큰 수치를 서로 곱해 더하는 행렬 연산인 MAC 연산이다. 메테오레이크의 NPU 3내 연산 엔진은 두 개이며 한 클록당 4천96개의 MAC 연산을 수행한다. 여기에 작동 클록(1.4GHz)을 곱하고 1조 번(10의 12승)으로 나눈 값이 11.5 TOPS다. 같은 방식으로 계산하면 루나레이크 내장 NPU 4의 TOPS는 48 TOPS다. ■ "TOPS는 행렬 연산에 치중... 벡터 계산 성능 향상도 중요" 단 MAC 연산 처리량은 자료형(데이터타입)의 정밀도에 큰 영향을 받는다. 예를 들어 인텔이 기준으로 삼은 자료형은 INT8(정수 8비트)이다. 이를 INT4(정수 4비트)로 바꾸면 MAC 연산량과 TOPS는 각각 두 배로 뛴다. 대런 크루스 수석 아키텍트는 "TOPS 값은 계산으로 얻어진 값이며 주로 행렬 연산에 집중됐다. 그러나 큰 수치를 한꺼번에 처리하는 벡터 연산이 실제 AI 응용프로그램 성능에 더 큰 영향을 미친다"고 설명했다. NPU 4는 벡터 연산을 처리하는 레지스터 크기를 512비트로 확장하고, 대역폭은 전 세대 대비 4배 높였다. 행렬과 수치 연산을 모두 강화해 다양한 AI 연산을 처리할 수 있게 됐다. 양자화 전용 회로도 내장해 INT8, FP16 자료형을 모두 지원한다. ■ "TOPS, 행렬 연산에 치중...벡터 계산 성능 향상도 중요" NPU 4는 뉴럴 연산 엔진을 2개에서 6개로 3배 늘렸다. MAC 연산을 담당하는 어레이도 4천 개에서 1만 2천개로 늘어났다. 같은 소비 전력에서 NPU 3 대비 성능은 두 배 늘어났고 최대 성능은 4배로 뛰어올랐다. 벡터 연산 성능은 최대 12배, TOPS는 4배 이상 향상됐다. LLM(거대언어모델)의 토큰 생성 속도에 영향을 미치는 대역폭도 최대 2배 향상됐다. 오픈소스 그래픽 프로그램 '김프'(GIMP)로 스테이블 디퓨전 1.5 플러그인을 이용해 이미지를 생성하는 테스트에서 메테오레이크는 22.08초, 루나레이크는 5.43초로 실제 처리 시간이 1/4 수준으로 줄었다. 전력 소모는 NPU 3와 NPU 4 사이에 큰 차이가 없다. 메테오레이크 소모전력은 9W, 루나레이크 소모전력은 11.2W다. 대런 크루스 수석 아키텍트는 "소모 전력이 높아졌지만 소요 시간이 크게 줄어 실제 전력 소모는 줄어든다. 이를 통해 전력 효율을 2.9배 높였다"고 밝혔다.

2024.06.04 12:00권봉석

"생성형 AI, 단순 도구 그 이상...영감도 줄 수 있어"

"생성형 인공지능(AI)은 예술계에서 단순 도구 역할을 넘어섰습니다. 작가 대신 그림 구도를 잡아주고 영감을 제공하기 때문입니다. AI 그림은 색다른 특징도 갖고 있습니다. 작가의 이야기가 그림에 스며들었습니다. 작가 문체가 이미지로 구현됐기 때문입니다. 앞으로 AI 그림은 높은 희소성을 가질 것입니다." 김은진 AI 기반 미디어 아티스트는 최근 본지와 인터뷰에서 생성형 AI가 작가의 'AI 비서'로서 중요한 역할을 수행할 것이라며 이같이 밝혔다. 단순 도구가 아닌 작가 그림 제작을 돕고 영감까지 줄 수 있다는 이유에서다. 김은진 아티스트는 미국 뉴욕 티시예술대학에서 인터랙티브 텔레커뮤니케이션 석사 학위를 받았다. 이후 서강대 아트엔테크 박사 수료했다. 현재 AI 기반 미디어 예술가로 활동하고 있다. 김 작가는 그동안 미국에서 기술과 예술을 결합한 작품을 전시하기도 했다. 그는 이달 17일부터 24일까지 서울 종로구 인사동 토포하우스 갤러리에서 전시 'AI가 천국을 그리다'를 열었다. 김 작가가 AI 기반 아티스트로서 처음 선보인 전시다. 생성형 AI를 이용해 천국을 주제로 한 작품을 공개했다. 예술가가 AI와 어떻게 협력해 작품을 그려나가는지 직접 보여줬다. AI, 그림 구도 잡고 영감도 준다…"보조 도구 이상" 김은진 아티스트는 이번 작품 제작에 스태빌리티AI의 오픈소스 AI 모델 '스테이블 디퓨전'과 미드저니의 '미드저니' 유료 모델을 활용했다. 스테이블 디퓨전은 명령어로 이미지를 만들 수 있다. 미드저니 유료 버전은 명령어뿐 아니라 이미지 삽입을 통해 이미지 생성을 한다. 작가는 문자와 이미지 삽입을 통해 지속적으로 작품 수정만 진행하면 된다. 김은진 작가는 작품 하나 제작하는데 약 80시간에서 120시간 걸린다고 말했다. 김 작가는 AI 툴 선택이 최종 결과물을 결정한다고 주장했다. 어떤 AI 툴을 활용하느냐에 따라 다른 이미지를 얻는다는 이유에서다. 그는 "그동안 다양한 생성형 AI 도구를 활용했다"며 "예술적 이미지를 가장 잘 뽑는 툴은 미드저니와 스테이블 디퓨전"이라고 했다. 반면 오픈AI의 '달리3'는 브랜드 로고 제작 등 상업적 용도에 적합한 이미지를 만든다고 설명했다. 미드저니와 스테이블 디퓨전은 오픈소스 AI 모델로 알려져 있다. 이미지만 약 5억장 학습했다. 폐쇄형 AI 모델인 달리3보다 더 많은 이미지 데이터셋을 보유한 셈이다. 김은진 작가는 "오픈소스 AI 모델은 폐쇄형 모델보다 더 풍부한 화풍과 이미지를 표현할 수 있다"며 두 모델을 선택한 이유를 알렸다. 그는 생성형 AI가 예술계에서 단순 도구 역할을 넘어설 것으로 봤다. 김은진 작가는 AI와 사람이 함께 대화하고 맞춰가면서 작품을 만든다고 주장했다. AI가 그림 구도를 잡아주거나 작가에 영감까지 준다는 이유에서다. 예를 들어, 사용자가 '하늘로 올라가는 복숭아, 초현실주의'라고 AI에 입력하면, AI는 하늘에 복숭아가 올라가는 장면만 생성하지 않는다. 우선 복숭아 구도를 보기 좋게 설정한다. 복숭아와 하늘을 연결하는 금속 체인도 생성한다. 사용자가 '금속 체인'을 멸령어에 입력하지 않았는데도 AI가 그림에 맞게 생성한 셈이다. 그는 "생성형 AI는 작가에게 도구일 수 있지만, 영감의 원천이기도 하다"고 설명했다. "AI로 만든 그림, 예술 한 장르 될 것…美선 이미 시작" 김은진 작가는 생성형 AI로 만든 작품이 예술 한 장르로 자리 잡을 것으로 내다봤다. 인간이 직접 그린 작품 못지않게 희소성 있다는 이유에서다. 김 작가는 "작가의 언어와 의도가 이미지에 그대로 묻어난다"며 "이는 단순한 그림이 아니라 작가의 스토리텔링을 이미지로 구현한 것"이라고 강조했다. 그는 "어느 화가는 오일로 그림을 그리고, 어떤 화가는 아크릴 물감으로 그림을 그린다"며 "AI에 자신만의 이야기를 넣어 작품 만드는 것도 이와 같은 이치"라고 덧붙였다. 김은진 작가는 AI 작품 희소성도 높게 봤다. 그는 "생성형 AI 모델에 동일한 명령어를 넣는다고 해서 기존과 똑같은 이미지를 받을 수 없다"고 했다. 그는 "같은 명령어를 몇 시간 있다 똑같이 입력해도 다른 이미지를 생성한다"며 "AI 작품 희소성이 높은 이유다"라고 덧붙였다. 현재 미국에선 AI 작품 전시가 본격 시작하는 추세라고 했다. 'AI 기반 미디어 아티스트'라는 직업도 미국에서 처음 나왔다. 반면 한국은 관련 전시가 활발하지 않다고 설명했다. 그는 "AI 작품에 대한 예술적 가치 논란은 미국에서 이미 해소됐다"고 말했다. "생성형 AI, 한계 분명 있어…데이터셋·UI 더 성장해야" 김은진 작가는 생성형 AI로 모든 작품을 완벽하게 구현할 수는 없다고 했다. 아직 생성형 AI 기술이 초기 수준이라서다. AI 예술 활동에 필요한 유저인터페이스(UI) 부족도 원인으로 꼽았다. 그는 "AI 작가는 정해진 데이터셋으로 결과물을 얻는 식"이라며 "아직은 데이터셋 범위에 한계가 있다"고 말했다. 예를 들어, 생성형 AI가 사람 얼굴 이미지를 생성할 때 서양인을 먼저 내놓는다. 반면 아시아인 이미지 구현은 서툴다. 아시아 이미지를 구현해도 그림 풍채나 이미지는 중국식이다. 김 작가는 "앞으로 더 많은 데이터셋과 업그레이드된 정제 기술이 필요할 것"이라며 "작가는 프롬프트를 활용해 이를 교정하는 작업을 필수로 거쳐야 한다"고 강조했다. 현재 예술가가 생성형 AI로 이미지를 편하게 구현할 수 있는 UI 발전 필요성도 주장했다. 김은진 작가는 "현재 대기업에서는 이같은 UI를 개발한 것으로 안다"며 "아직 완전히 개방되지 않은 상태"라고 했다. 그는 "작품 활동에 필요한 UI가 나오면 현재보다 원활한 작품 제작이 가능할 것"이라고 내다봤다. 김은진 작가는 예술가뿐 아니라 일반 사람들도 생성형 AI를 통해 예술 활동을 이어나갈 것으로 봤다. 그는 "누구나 신기술을 통해 창작 활동할 수 있는 시대가 오길 바란다"며 "이에 필요한 AI 서비스와 UI는 더욱 성장해야 할 것"이라고 강조했다.

2024.05.01 12:00김미정

오픈AI 경쟁자 스태빌리티AI, 과도한 인프라 투자로 자금 고갈

오픈AI의 주요 경쟁자 중 하나로 꼽히는 스테빌리티AI가 과도한 인공지능(AI) 학습 투자로 자금난을 겪고 있다. 최근 더레지스터 등 외신에 따르면 스테빌리티AI는 이미지생성모델 스테이블디퓨젼을 학습시키기 위한 대규모 인프라 투자로 자금이 고갈됐다. 외신에서 확보한 십수명의 정보통에 따르면 극단적인 인프라 투자로 인해 지난해 10월 스테빌리티AI의 잔고는 약 400만 달러 수준에 불과했다. 이 업체는 AI모델 학습을 위해 연간 약 9천900만 달러를 클라우드 인프라에 투자한 것으로 나타났다. 또한 5천400만 달러 규모의 인건비와 기업 운영비도 매년 발생했다. 스태빌리티AI 지난해 매출은 1천100만 달러 규모로 인프라 지출의 9분의 1 수준에 불과했다. 악화되는 재무상황으로 인해 이들은 지난해 7월 발생한 100만 달러 규모의 AWS의 클라우드 비용은 지불하지 못했으며, 8월 청구된 700만 달러에 대해서도 갚을 수 없다고 답했다. 구글 클라우드와 코어위브 역시 160만 달러의 부채가 있는 것으로 알려졌다. 이러한 재정난의 원인으로는 지난달 사임한 에마드 모스타크 최고경영자(CEO)가 수익성 있는 사업을 고안하고 실행하지 못한 것이 주요 요인으로 지목됐다.

2024.04.05 15:17남혁우

생성형 AI로 신년 축하 이미지 만들어 보니

오픈AI의 이미지 생성 도구 '달리3'와 스태빌리티AI의 '스테이블 디퓨전'으로 신년 축하 이미지를 만들어 봤다. 현재 달리3에서 한국어로 이미지를 생성할 수 있지만, 스테이블 디퓨전에선 한국어 패치를 별도로 설치해야 한다. 형평성을 위해 두 도구에 명령어를 영문으로 요청했다. 먼저 달리3에 접속했다. 2024년은 청룡의 해다. 달리3에 '2024년 새해를 축하하기 위해 청룡을 멋있게 그려달라'고 요청했다. 신년인 만큼 이미지에 축제 분위기가 있었으면 좋겠다고도 했다. 이미지를 최대한 알록달록하게 생성해 달라고 명령했다. 달리3는 이를 통해 이미지 여러 컷을 생성했다. 요청 사항을 모두 반영해 이미지를 생성했다. 알록달록한 배경 한가운데에 청룡을 배치했으며, 축제 분위기 나는 분위기를 만들었다. 인간 디자이너가 직접 그린 것처럼 퀄리티도 나쁘지 않았다. 이미지 생성 시간은 약 10초 걸렸다. 달리3는 기존 이미지를 수정할 수도 있다. 달리3에 '해피 뉴 이어(Happy New Year)'와 '2024' 문구를 그림 속에 넣어달라고 했다. 달리3는 이를 반영해 이미지를 업그레이드했다. 해당 이미지를 저장해 지인들에게 축하 메시지를 공유했다. 다만 달리3는 이미지 내 문구 생성 능력을 100% 발휘하지 못할 때도 있었다. Happy New Year 스펠링을 살짝 틀리거나, 2024를 2224로 쓰는 등 문구를 이미지에 완벽하게 새기지 못했다. 이런 현상은 한국어로 명령할 때 나타났다. 문자를 이해·처리하는 GPT 모델의 언어 데이터셋 90% 이상이 영어로 이뤄져 나타나는 현상으로 보인다. 이때 사용자는 해당 문구를 고쳐 달라고 요청하면 된다. 달리3는 올해 10월 챗GPT에 통합됐다. 챗GPT 유료 버전인 프리미엄 개인 고객과 엔터프라이즈 회원만 달리3에 접근할 수 있다. 스태빌리티AI의 이미지 생성기 스테이블 디퓨전에서 동일한 체험을 했다. 명령어에 달리3 명령어와 동일한 프롬프트를 입력했다. 달리3처럼 청룡도 만들어 주고, 축제 분위기를 연상하는 분위기도 조성했다. 다만 2024와 Happy New Year를 삽입해 달라는 명령을 인식하지 못했다. 이미지 생성은 약 1분 걸렸다. 스태빌리티AI는 여러 학술 연구원과 비영리 단체와 손잡고 스테이블 디퓨전을 만들었다. 달리3와 달리 오픈소스로 공개된 상태다. 이미지로 이미지를 생성하거나, 텍스트를 이미지로 바꾸는 기능을 갖췄다.

2024.01.01 12:05김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

대기업 유통·이커머스 뒤바뀐 처지..."규제 풀어야 산다"

[르포] 골프 코치에서 피부 상담까지…일상 파고든 AI, AWS서밋에서 만난다

허희수 SPC "韓서 40년된 배스킨라빈스, 아이스크림 그 이상 브랜드로 도약"

"관광이냐, 안보냐"...'지도 반출' 결정 일시 보류

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현