• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'그래픽'통합검색 결과 입니다. (56건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

엔비디아, 윈도10용 지포스 드라이버 내년 10월까지 제공

엔비디아가 31일(미국 현지시간) 일반 소비자용 지포스(GeForce) GPU용 '게임레디' 드라이버 지원 정책을 밝혔다. 오는 10월 지원이 종료되는 마이크로소프트 윈도10 운영체제용 드라이버는 2026년 10월까지만 제공된다. 시장조사업체 스탯카운터에 따르면 지난 7월 기준 윈도11 점유율은 53.39%, 윈도10 점유율은 42.99%로 여전히 높다. 아직 윈도11로 업그레이드하거나 PC 교체를 고려하지 않는 소비자를 위해 새 게임 최적화나 보안 업데이트 등은 당분간 지속된다. 2015~2017년 경 출시된 지포스 GTX 900 시리즈, 지포스 GTX 10 시리즈 등 구형 GPU용 게임레디 드라이버는 올해 10월까지만 업데이트된다. 이후 출시되는 게임에 대한 최적화와 새 기능 추가는 중단되며 분기별로 보안 취약점 업데이트만 제공된다. 보안 업데이트도 2028년 10월까지만 제공된다. 엔비디아는 지난 5월 이들 구형 GPU의 쿠다(CUDA) 지원도 중단할 예정이라고 밝힌 바 있다. 엔비디아는 GPU를 활용한 연산과 AI 가속 등에 쓰이는 쿠다 12.9 툴킷 출시 당시 릴리스 노트에서 "맥스웰, 파스칼, 볼타 등 아키텍처 기반 GPU의 쿠다 지원은 다음 버전에서 중단할 것"이라고 설명했다.

2025.08.01 09:34권봉석

과기정통부 '장·차관 원팀'…이틀간 '인프라·데이터' 족쇄 풀기 총력전

과학기술정보통신부 새 지도부가 인공지능(AI) 산업 육성을 위해 규제 혁신에 집중하고 있다. AI 3대 강국(G3) 도약을 위해 핵심 기반인 인프라와 데이터 분야의 해묵은 과제를 해결하겠다는 목표를 분명히 한 것이다. 25일 업계에 따르면 과학기술정보통신부는 이틀간 장관과 차관이 연이어 현장을 찾아 업계 의견을 수렴했다. 배경훈 장관은 지난 24일 AI 데이터센터(AIDC) 관련 기업들과, 류제명 제2차관은 이날 데이터 규제 관련 기업 및 전문가들과 각각 간담회를 가졌다. 배경훈 장관은 세종시 네이버 데이터센터에서 열린 간담회에서 AIDC를 '든든한 토양'으로 규정했다. 그는 정부가 '마중물' 역할을 해 가격 경쟁력 확보를 지원하겠다고 밝혔다. 업계는 이 자리에서 전력 공급난, 과도한 건축 규제, 높은 초기 투자 비용 등 현실적 어려움을 건의했다. 류제명 차관은 데이터 규제 혁신 간담회에서 AI 발전의 '원유'가 데이터라고 강조했다. 그는 과거 정부부터 이어진 데이터 규제 문제를 더 이상 미루지 않겠다고 선언하며 규제 샌드박스 활성화 등 구체적인 해결 의지를 보였다. 배경훈 장관, AIDC 현장 직접 찾아…'전력·규제' 문제 해결 약속 배경훈 장관은 'AIDC 현장 간담회'를 주재하며 AIDC 활성화를 가로막는 현실적 과제에 대한 업계의 목소리를 직접 들었다. 참석자들은 AIDC가 국가 경쟁력의 핵심 기반이라는 데 동의하며 전력, 규제, 비용 문제가 시급히 해결돼야 한다고 입을 모았다. 특히 안정적인 전력 공급과 비현실적 규제가 최우선 과제로 꼽혔다. 이준희 삼성SDS 사장은 현장과 맞지 않는 건축 규정과 전력 공급 문제를, 하민용 SK텔레콤 부사장은 전력구매계약(PPA) 허용을 포함한 인허가·세제 혜택 종합 정책 패키지를 요청했다. 막대한 초기 투자 비용과 사업 지연 문제도 도마에 올랐다. 김동훈 NHN클라우드 대표는 정부가 선제적으로 부지와 전력을 확보해 제공하는 모델을 제안했고 최지웅 KT클라우드 대표는 3년 이상 소요되는 구축 기간을 단축할 인허가 간소화와 설비 투자 세제 혜택이 절실하다고 밝혔다. 학계와 협회에서는 더 근본적인 해법이 제시됐다. 박윤규 정보통신산업진흥원장은 AIDC를 사회간접자본(SOC)으로 보고 관련 규제를 일괄 해결할 '특별법' 제정을, 이경무 서울대 교수는 산업계와 학계의 단절 문제 해결을 촉구했다. 이에 배경훈 과기정통부 장관은 현장 건의를 정책에 신속히 반영하겠다고 화답했다. 배 장관은 "취임 후 매일 양복을 입었지만 오늘 운동화를 신고 편하게 왔다"며 "초심을 잃지 않고 AI 문제만큼은 형식에 얽매이지 않고 유연하고 신속하게 접근하겠다는 의지를 보여드리고 싶었다"고 말했다. 류제명 차관, '데이터 족쇄' 직접 푼다…'해묵은 규제' 정면돌파 선언 류제명 제2차관은 AI 발전에 필수적인 데이터 문제를 해결하기 위해 기업 및 법률 전문가들과 머리를 맞댔다. 류 차관은 AI 발전의 '원유'가 데이터라고 강조하며 과거 정부부터 이어진 데이터 규제 문제를 더 이상 미루지 않겠다는 뜻을 분명히 했다. 그는 "이 문제를 계속 끌고 시간을 낭비할 시간이 없다"며 "데이터 규제 분야의 날카로운 비평가로 꼽히는 구태언 변호사에게 발제를 맡긴 것 역시 문제를 회피하지 않고 제대로 부딪쳐 해결하겠다는 의지였다"고 설명했다. 이어 간담회에 참석한 업스테이지, 루닛 등 AI 기업들은 현실적인 어려움을 설명했다. 업계는 혁신적인 아이디어를 사업화하는 과정에서 여전히 데이터 관련 규제가 제약 요인이 되고 있다고 밝히며 공공 데이터 활용을 위한 규제 샌드박스 활성화 등을 제언했다. 이에 류 차관은 이번 간담회가 일회성 행사가 아님을 분명히 했다. 류제명 과기정통부 제2차관은 "데이터 문제는 한두 번의 간담회로 끝낼 문제가 아니고 장애물 제거 작업을 끝낼 때까지 해야 하는 이슈"라며 "국가AI위원회를 중심으로 데이터 규제 혁신이 차질 없이 추진되도록 최선을 다하겠다"고 강조했다.

2025.07.25 11:34조이환

시각효과 '멋집' 덱스터스튜디오..."韓 반지의제왕·아바타 만들고파"

'오징어 게임 시즌3'·'하얼빈'의 디지털색보정·음향뿐 아니라, 최근 tvN 화제의 드라마인 '견우와 선녀' 시각효과(Visual effects, VFX)를 맡아 주목 받는 회사가 있다. 바로 3D VFX 전문 기업 덱스터스튜디오다. 영화 '신과 함께', 넷플릭스 오리지널 '기생수 더 그레이'·'경성 크리처'도 이 회사의 기술이 녹아든 작품이다. 2012년 설립된 덱스터스튜디오는 자체 R&D연구소를 갖추고 있을 만큼, 고품질 영화·온라인동영상플랫폼(OTT) VFX 영역에서 견고한 전문성을 쌓아왔다. 이 회사는 자체 VFX 소프트웨어 80여개를 보유 중이며, 사내에서 연구·개발(R&D)을 전담하는 인력만 약 15명을 갖추고 있다. R&D 연구소의 AI 전담팀은 크게 '아티스트'와 '엔지니어' 그룹으로 나뉘는데, 아티스트는 AI 기술과 노하우를 바탕으로 고품질 이미지와 영상을 만들어낸다. 엔지니어는 최신 AI를 조사·연구하고 기술적인 지원을 통해 아티스트가 원하는 결과물을 구현하는 역할을 한다. 기자는 최근 서울 마포구 상암동에 위치한 덱스터스튜디오와 덱스터 R&D 연구소를 찾아 영상물에 VFX가 어떻게 입혀지는지, 나아가 AI 기술이 영상물 제작에 어떤 도움과 효과를 주는지 직접 살펴봤다. 아울러 버추얼 휴먼 시연도 살펴보고, 직접 포토그래메트리(사진 기반 3D 모델 생성 기술) 3D 스캔 체험까지 해봤다. 이어 송재원 덱스터 R&D 연구소장과의 인터뷰를 통해 덱스터 R&D 연구소의 기술력과 비전 등을 들어봤다. 모션 캡처 스튜디오부터 전신 3D 스캐너까지...영상 기술의 모든 것이 한 곳에 먼저 덱스터스튜디오가 있는 상암 DDMC 1층 한편에는 덱스터 R&D 연구소가 있다. AI 전담팀이 근무하는 이곳에는 몸에 부착된 센서를 활용해 인체의 움직임을 디지털 좌표 형태로 기록하는 모션 캡처 스튜디오가 갖춰져 있다. 현장에서 가장 먼저 기자는 덱스터스튜디오의 AI 리에이징(에이징+디에이징) 기술 시연을 감상했다. PC 모니터 화면에서 한 배우의 얼굴이 분할된 화면에서 동시에 보였는데, 왼편에는 현재의 얼굴이 오른쪽에는 나이든 얼굴이 보였다. 이 기술은 영상 속 인물의 얼굴을 어리게도, 늙게도 할 수 있는데 별도의 학습 데이터를 다량 확보하지 않고도 단 시간 내 4K 영화에 활용가능한 수준의 결과물 도출이 가능하다. AI 기술을 활용해 영화·드라마·뮤직비디오 속 인물의 나이를 손쉽게 바꿀 수 있는 기술이어서 활용도가 높아보였다. 또 위층 덱스터스튜디오 본 사무실에는 ▲인물 얼굴의 3D 스캔을 초당 24~60회 이상까지 수행할 수 있는 고품질 스캔 장비 '페이셜 4D 스캐너'와 ▲인물 전신 3D 스캔 데이터를 얻을 수 있는 '전신 3D 스캐너' ▲인물 얼굴에 대한 상세 3D 스캔 데이터를 얻을 수 있는 '얼굴 3D 스캐너' ▲영화·드라마 등에 필요한 소품의 3D 데이터를 정확하게 획득할 수 있는 '사물 3D 스캐너' 장비 등이 있다. 이 중 기자는 얼굴 3D 스캐너를 직접 체험해봤다. 안경을 벗고 머리띠로 얼굴로 쏟아지는 머리카락을 밀어 올린 후 50여대의 DSLR 카메라로 둘러싸인 의자에 앉았다. 의자 높낮이 조절 후, 하나·둘·셋 소리와 함께 강력한 플래시가 터지며 주변을 둘러싼 모든 카메라의 셔터가 열렸다 닫혔다. 그렇게 촬영된 이미지는 PC를 통해 몇 분만에 3D 모델링 이미지로 변환됐다. 기자의 얼굴이 3D 입체적인 이미지로 꾸밈없이 구현돼 차마 눈뜨고 보기 힘들었는데, 잠시 후 같은 방식으로 촬영된 꽃미남 가수 OOO의 이미지가 비교 샘플로 띄워져 민망함은 배가 됐다. “3D 스캔은 거짓말을 하지 않는다”는 스캔 엔지니어의 멘트가 조용히 가슴에 와 박혔다. '반지의 제왕'·'아바타' 같은 디지털 휴먼을 우리 작품에도 구현할 그 날까지 이런 최신 기술과 노하우가 녹아든 VFX R&D를 진두지휘하는 송재원 소장은 KAIST에서 석·박사를 컴퓨터 그래픽스로 전공하며 디지털 휴먼과 모션 캡처 분야에서 전문성을 높여왔다. 우리나라 작품에는 3D VFX가 부분적으로만 사용되지만, 언젠가는 할리우드 영화처럼 작품 처음부터 끝까지 디지털 휴먼 캐릭터가 등장하는 작품을 만들어 보고 싶다는 게 그의 꿈이다. 현재까지는 기술적 어려움과 자본의 한계가 있었으나, AI 기술의 발달로 이런 문턱이 점차 낮아질 것으로 기대했다. 송 소장은 “디지털 배우가 국내 영화에 주연으로 나온 경우는 없었다. 배우를 잠깐 교체(스왑)한다든지, 잠시 디지털 배우를 사용하는 장면은 만들 수 있었지만 반지의제왕 골룸 같은 캐릭터는 없었다”면서 “덱스터는 이런 한계를 뚫기 위한 시도들을 하고 있으며, 이와 유사한 수준의 프로젝트를 수행하고 있다. 할리우드에서 제안이 들어온다면 바로 착수할 수 있는 파이프라인도 갖추고 있다”고 설명했다. 또 덱스터스튜디오는 대규모 전쟁 장면이라든지 우주와 같은 세트 촬영이 어려운 경우 컴퓨터 그래픽(CG)을 활용해 실감나게 구현할 수 있다고도 강조했다. AI 기술을 활용하면 현실에선 구현이 어려운 배경을 어색하지 않게 고화질 영상으로 만들어낼 수 있다고. 이를 통해 제작사는 제작 단가를 낮춤은 물론, 창작자의 상상을 보다 현실적으로 구현해 낼 수 있게 된다. "고품질 영화·OTT가 주력 시장...AI, 실무와 실전에 잘 녹아들어야" 덱스터스튜디오는 디지털색보정이나 음향과 같은 작업부터, 실제로는 존재하지 않는 인물이나 괴물 등을 CG로 창조해낼 수 있다. 또 이 회사는 생성형 AI 이미지를 VFX에서 활용 가능한 16/32비트 고품질·고색심도 이미지로 변환하는 자체 프로세스를 개발해 제작 파이프 라인에 접목하고 있다. 아울러 이미지에 일부분을 다시 그리는 '인페인팅' 기술과 , 실사 촬영 장면을 분석해 위치·각도 등의 데이터를 가상의 3D 공간으로 추적·복원하는 AI 매치메이션 특허도 보유 중이다. 이 밖에 AI 학습을 통해 촬영된 인물의 얼굴을 다른 인물의 얼굴로 교체하는 'AI 페이스 스왑', 입력된 음성파일을 입모양 움직임으로 AI가 자동 생성하는 기술도 갖고 있다. 특히 더 전문 분야인 SF 또는 크리처 장르인 경우, 덱스터스튜디오는 제작사와 컨셉 아트·캐릭터 스캔 작업을 하는 등 CG VFX 슈퍼바이저 역할을 한다. 촬영 현장에도 출동해 보다 자연스럽고 원활한 CG 작업을 미리 설계하고 조율하기도 한다. 이런 세심한 작업 과정들이 작품의 완성도를 높이고 덱스터를 경쟁사들과 차별화 하는 요소로 보였다. 송재원 소장은 “덱스터의 근본은 고품질을 요구하는 영화 또는 영화급 OTT 시리즈를 주력 시장으로 본다”면서 “미디어 아트 전시 사업도 하는데, 올 10월에는 경주에 신라의 역사와 문화를 체험할 수 있는 상설 미디어 전시관도 문을 열 예정”이라고 소개했다. 10월 말 경주에서 제32차 아시아·태평양 경제협력체(APEC) 정상회의가 예정돼 있어, 회사는 각국 정상을 비롯해 관광객들에게 특별한 경험을 선사한다는 계획이다. 인터뷰 후반부에 송 소장은 AI 기술이 기존 파이프라인에 잘 녹아들어가는 것이 굉장히 중요하다고도 강조했다. AI로 생성된 영상이 기존 촬영분과 이질감 없이 자연스럽게 붙는 기술이 진짜 핵심이란 설명이었다. 송재원 소장은 "단순히 AI를 잘한다고만 되는 것이 아니라, 실무와 실전에 적용될 수 있는 AI와 파이프라인을 갖추는 게 중요하다"면서 "AI 등 기술은 결국 인간의 창작을 돕는 유용한 도구"라고 말했다. 이어 “유명 감독의 고품질 영화를 보고 싶어하고, 감동과 재미를 얻고자 하는 인간의 근본적인 심리는 바뀌지 않는다”며 “이를 위해 덱스터는 기술을 개발하고 계속 차별화를 끌고 나갈 것이다. 반지의 제왕, 아바타급의 디지털 휴먼이 영화 내내 등장하는 작품을 국내에서 꼭 만들어 보고 싶다”고 강조했다. 끝으로 그는 “기술은 어디까지나 아티스들의 창조 역량을 극대화 하는 데 도움을 주는 도구인 만큼, 아티스트들의 창의적인 작업을 지원하는 기술 개발을 이어가겠다”고 다짐했다.

2025.07.16 09:50백봉삼

다나와, AMD 라데온 RX 9060 XT 특가 추첨판매

커넥트웨이브 가격비교서비스 다나와는 7일부터 11일까지 5일간 AMD 라데온 RX 9060 XT 그래픽카드 특가 추첨판매를 진행한다. 행사 기간 중 스마트폰용 다나와 앱으로 '다나와 래플' 게시판에 접속 후 행사 제품을 결제하면 자동 응모된다. 하루 이상 참여한 사람 중 추첨을 통해 당첨자 1명에게 RX 9060 XT 그래픽카드를 제공한다. 제공 제품은 '애즈락 라데온 RX 9060 XT 챌린저 OC D6 8GB'이며 50만원 상당에 판매된다. 다나와 관계자는 "라데온 RX 9060 XT는 RDNA 4 아키텍처 기반 그래픽카드로 풀HD/2K 해상도에서 게임을 즐기려는 소비자들이 많은 관심을 가진 제품"이라고 설명했다. 5일간 모두 참여한 사람 대상으로 별도 추첨을 통해 편의점 상품권과 다나와 포인트를 지급한다. 당첨자는 오는 15일 다나와 당첨자 게시판에 발표하며 미당첨자 결제 금액은 전액 환불된다. 행사 관련 상세 내용은 다나와 앱 설치 후 검색창에 '다나와래플'을 입력하거나 다나와 래플 게시판에서 확인할 수 있다.

2025.07.07 09:20권봉석

한국퀀텀컴퓨팅, 초고성능 AI 데이터센터 구축…GPUaaS 시장 진출

한국퀀텀컴퓨팅(KQC, 대표 김준영)이 초고성능 인공지능(AI) 전용 그래픽처리장치(GPU) 인프라를 구축하고 본격적인 클라우드 기반 고성능 컴퓨팅 서비스(GPUaaS) 시장에 뛰어든다. KQC는 엔비디아(NVIDIA)의 최신 H200 GPU를 기반으로 한 'AI GPU 팜(AI GPU Farm)'을 디지털엣지 부평 데이터센터에 구축한다고 3일 밝혔다. 이와 함께 오는 4일부터 GPU 기반 서비스형 컴퓨팅(GPUaaS)을 정식 출시한다. 이를 통해 생성형 AI, 초거대 언어모델(LLM), 고성능 데이터 분석, 복잡한 시뮬레이션 등 연산 집약형 워크로드를 위한 인프라를 안정적이고 합리적인 가격으로 제공할 계획이다. 김준영 대표는 "KQC의 GPU 팜은 빅테크, AI 스타트업은 물론 복잡한 연산이 필요한 산업계, 국가 연구기관, HPC 센터까지 폭넓은 수요가 기대된다"며 "장기적으로는 양자컴퓨팅 인프라와도 연계한 고도화된 클라우드 서비스를 선보일 것"이라고 밝혔다. 이번에 구축된 AI GPU 팜은 엔비디아의 호퍼(Hopper) 아키텍처 기반 H200 GPU를 병렬로 배치한 클러스터 형태로 구성됐다. H200은 기존 H100 대비 메모리 용량과 속도가 대폭 향상된 제품으로, 특히 내장된 트랜스포머 엔진(Transformer Engine)을 통해 LLM 훈련과 추론 작업의 효율을 극대화할 수 있다. GPUaaS 서비스는 물리서버 수준의 성능을 제공하는 전용 환경에서 GPU를 직접 활용할 수 있으며, LLM, 멀티모달 AI, AI 코파일럿 등 새로운 AI 수요에 맞춰 유연한 자원 할당이 가능하다. GPU 가상화 및 공유 기능도 제공돼 여러 사용자가 동시에 GPU 자원을 효율적으로 사용할 수 있다. 서비스에는 엔비디아 AI Enterprise 소프트웨어 스택이 포함돼 최신 AI 개발 환경도 지원한다. 사용자들은 컴퓨팅, 스토리지, 네트워크 리소스를 필요에 따라 탄력적으로 조정할 수 있으며, 종량제 기반 요금제를 통해 초기 투자 부담 없이 경제적으로 인프라를 활용할 수 있다. 또한 예측 분석 기능과 자동화된 인프라 관리 도구를 통해 운영 효율성과 예산 관리 능력도 강화된다. KQC는 지난 6월 아이티센그룹과 GPUaaS 사업 협력을 위한 업무협약(MOU)을 체결하며 서비스 기반 확대에 나선 바 있다. KQC 김창회 전무는 "이번 GPUaaS 서비스는 안정성과 가격 측면에서 매우 경쟁력 있는 구조"라며 "시장 수요에 맞춰 다양한 시스템을 지속적으로 선보일 계획"이라고 말했다.

2025.07.03 10:18남혁우

정부, '1.6조원' 규모 GPU 대전 시작…"WBL 훈련용 반도체, 민간과 함께 확보"

과학기술정보통신부가 민간 클라우드 기업들과 손잡고 총 1조6천300억원 규모의 그래픽처리장치(GPU) 확보·임차 사업을 추진한다. 세계 최고 수준의 초거대 언어모델 개발과 국내 산학연의 인공지능(AI) 인프라 확충을 위한 행보다. 과기정통부와 정보통신산업진흥원은 29일 서울 강남 코엑스에서 클라우드 기업을 대상으로 GPU 확보·임차 사업 통합설명회를 개최했다. 이달 1차 추가경정예산을 통해 관련 예산을 확정한 이후 다음달 4주차까지 협력 기업 공모에 본격 착수한 상태다. 이번 사업은 ▲총 1조4천600억원 규모의 GPU 확보 사업과 ▲1천723억원 규모의 GPU 임차 사업으로 구성된다. 확보 사업은 정부와 민간이 협력해 첨단 GPU를 직접 구매·구축하는 방식이고 임차 사업은 클라우드 기업이 보유한 GPU를 임차해 활용하는 구조다. 임차된 GPU는 가칭 '월드 베스트 LLM(WBL)' 프로젝트와 국내 산학연 등에 지원될 예정이다. 정부는 국내 고성능 연산 자원 부족 문제를 해소하고 AI 기술의 자립 기반을 확보하는 데 사업의 목적이 있다고 설명했다. 설명회 현장에선 사업 개요와 정책 방향 외에도 공모 절차, 평가 기준, 지원 조건 등의 세부 사항이 구체적으로 안내됐다. 참석자들은 질의응답을 통해 공모 준비에 필요한 사항들을 직접 확인할 수 있었다. 과기정통부와 정보통신산업진흥원(NIPA)은 다음달 4주차까지 공모 접수를 마감하고 오는 7월 중 평가와 협약 체결을 마무리할 계획이다. 이후 GPU 인프라 확보 및 배포를 신속히 추진하겠다는 입장이다. 과기정통부는 "보다 구체적인 공모 내용과 사업 안내는 과기정통부 및 NIPA 홈페이지를 통해 확인할 수 있다"고 밝혔다.

2025.05.29 17:18조이환

"AI가 만든 코드, 기술 발전 가속"…구글 딥마인드, 진화형 알고리즘 '알파이볼브' 개발

구글 딥마인드가 알고리즘을 설계하고 성능까지 개선하는 인공지능(AI)을 선보였다. 언어모델 기반의 코드 생성 능력에 진화적 평가 구조를 결합해 대규모 컴퓨팅 인프라부터 수학적 난제까지 범용 최적화가 가능해진 것이다. 16일 구글 공식 블로그에 따르면 딥마인드는 지난 14일 코드 기반의 알고리즘을 진화시키는 AI 시스템 '알파이볼브'를 발표했다. 이 시스템은 구글의 최신 언어모델 '제미나이' 시리즈에 자동 평가 알고리즘을 접목한 구조로, 구글의 데이터센터·칩 설계·AI 모델 학습 등 실제 운영 환경에 투입돼 성능을 입증했다. '알파이볼브'는 기존의 함수 단위 코드 생성과 달리 수백 줄 규모의 복잡한 알고리즘 전체를 설계할 수 있는 구조다. 속도 중심의 '제미나이 플래시'와 논리 구조를 강화하는 '제미나이 프로'를 병행 활용해 코드 제안을 생성한다. 이렇게 생성된 코드는 자동 평가 시스템이 정확성, 속도, 자원 활용도 등을 따져서 평가하고 성능이 좋은 코드만 다음 세대에 반영된다. 처음 성과를 낸 분야는 구글의 데이터센터 스케줄링이다. 이 시스템은 내부 클러스터 관리 도구인 보그(Borg)에 적용돼 일부 자원만 남은 서버를 더 잘 활용할 수 있도록 새로운 방식의 스케줄링 규칙을 만들어냈다. 사람이 읽고 관리하기 쉬운 단순한 코드 형태로 제공돼 전체 컴퓨팅 자원의 0.7%를 꾸준히 절약할 수 있게 됐다. 칩 설계 영역에서도 적용 사례가 나왔다. '알파이볼브'는 구글 텐서플로우 처리장치(TPU) 내 고성능 산술 연산 회로에서 불필요한 비트를 제거하는 베릴로그(Verilog) 코드를 제안했다. 이는 기능 검증을 거쳐 차세대 설계에 반영된 상태로, AI가 하드웨어 설계 언어 수준에서 의미 있는 구조 개선을 제안할 수 있음을 입증하는 계기가 됐다. 특히 구글 '제미나이' 모델 학습에 쓰이는 행렬 곱셈 연산을 최적화해 속도를 23% 끌어올렸다. 전체 학습 시간도 1% 줄었으며 기존에는 수주가 걸리던 커널 최적화 작업이 수일 내 자동 실험으로 가능해졌다. 반복 작업 부담이 줄어들면서 연구 효율도 함께 높아졌다. 사람이 직접 손대지 않던 그래픽처리장치(GPU) 저수준 명령어 영역에서도 성과가 나왔다. '플래시어텐션' 커널에서 최대 32.5%의 속도 향상을 기록했으며 기존 컴파일러 최적화를 넘어선 성능이라는 평가를 받는다. AI가 병목 지점을 스스로 찾아내고 개선 방향까지 제시한 사례로, 실제 코드 개선 작업의 효율성을 높이는 데 기여하고 있다. 수학 난제를 해결하는데도 기존 한계를 뛰어넘는 성과를 냈다. 일례로 복소수 4×4 행렬 곱셈 문제에서 기존보다 곱셈 횟수를 더 줄인 새로운 알고리즘을 찾아냈는데 이는 지난 1969년 수학자 스트라센이 세운 기록을 처음으로 넘어선 사례다. 수십 년간 누구도 개선하지 못한 수학적 구조 자체를 AI가 새롭게 설계해낸 것이다. 이외에도 이 시스템은 수학 분석, 기하학, 조합론, 수론 등 다양한 미해결 문제 50여 개에 적용됐다. 전체의 약 75%에서 기존 최고 해법을 재현했고 심지어 20%의 경우에는 보다 나은 해법을 제시했다. 구글 딥마인드는 현재 '피플+AI 리서치' 팀과 함께 '알파이볼브'의 사용자 인터페이스를 개발 중으로, 학술 연구자 대상 얼리 액세스 프로그램을 준비하고 있다. 일반 공개 여부는 추후 검토할 예정이나 명확한 평가 구조를 갖는 알고리즘 문제라면 어떤 분야에도 적용 가능한 구조라는 점에서 범용 기술로의 확장 가능성이 거론된다. 소재 개발, 신약 설계, 에너지 최적화, 공정 자동화 등 연산 기반 과학 영역 전반에 대한 활용이 논의되고 있다. 알렉산더 노비코프 딥마인드 연구원은 "우리는 평가자가 명확한 문제에 집중하고 있다"며 "자동화된 피드백 루프를 통해 성능을 지속적으로 개선할 수 있다"고 설명했다. 마테이 벌로그 딥마인드 연구원은 "'알파이볼브'는 일반적 AI 시스템임에도 불구하고 알파텐서보다 더 나은 성과를 냈다"며 "실제 문제에 곧바로 적용 가능한 과학 도구는 연구 현장에서도 드문 경험"이라고 말했다.

2025.05.16 09:58조이환

"지포스 RTX와 쿠다로 무장"…엔비디아 'LM 스튜디오' 성능 폭발

엔비디아가 지포스 그래픽처리장치(GPU)와 쿠다를 기반으로 자체 로컬 거대언어모델(LLM) 실행 도구의 성능을 대폭 강화했다. 로딩·응답 속도 향상과 더불어 개발자 제어 기능을 확장해 로컬 AI 활용 생태계를 본격적으로 견인하는 전략이다. 엔비디아는 최근 'LM 스튜디오' 0.3.15 버전을 발표했다고 12일 밝혔다. 이번 버전은 지포스 '레이 트레이싱 익스피리언스(RTX)' GPU 환경에서 성능을 최대 27%까지 끌어올릴 수 있게 '쿠다' 그래프와 플래시 어텐션 최적화를 적용했다. 지포스 'RTX 20' 시리즈부터 최신 블랙웰 GPU까지 폭넓은 하드웨어 호환성도 확보했다. 'LM 스튜디오'는 고성능 추론과 데이터 보안을 동시에 확보할 수 있는 로컬 LLM 실행 도구다. '라마.cpp(llama.cpp)' 기반 런타임을 바탕으로 오프라인에서도 모델 실행이 가능하고 오픈AI 응용 프로그램 인터페이스(API) 호환 엔드포인트로도 작동해 맞춤형 워크플로우에 쉽게 통합된다. 새 버전은 '툴_초이스(tool_choice)' 패러미터를 도입해 도구 호출 방식에 대한 세밀한 제어를 제공한다. 외부 도구 연동 여부를 개발자가 지정하거나 모델이 동적으로 결정하게 할 수 있어 검색 증강 생성(RAG), 에이전트 파이프라인 등에 최적화된 구조를 제공한다. 시스템 프롬프트 편집기도 새롭게 설계돼 복잡하거나 장문 프롬프트에 대한 대응력이 향상됐다. 프리셋 기반의 다양한 모델과 양자화 방식도 지원되며 '젬마', '라마3', '미스트랄', '오르카' 등 주요 오픈소스 모델이 모두 포함됐다. 이같은 구조는 '옵시디언'과 같은 노트 기반 앱에 플러그인 형태로 연결돼 텍스트 생성, 연구 요약, 노트 검색을 클라우드 없이 수행할 수 있게 한다. 이 모든 과정은 'LM 스튜디오' 내의 로컬 서버를 통해 이뤄져 빠르고 프라이버시 중심의 상호작용이 가능하다. 성능 개선의 핵심은 '라마.cpp' 백엔드에 적용된 쿠다 그래프와 플래시 어텐션이다. 쿠다 그래프는 컴퓨팅처리장치(CPU) 호출 횟수를 줄여 모델 처리량을 최대 35%까지 높였다. 플래시 어텐션은 메모리 부담 없이 긴 컨텍스트 대응 능력을 강화하며 최대 15% 속도 향상을 이끌었다. RTX GPU 사용자라면 별도 설정 없이도 '쿠다 12.8' 기반의 성능 향상을 경험할 수 있다. 드라이버 호환 시 자동 업그레이드가 적용되며 얇은 노트북부터 고성능 워크스테이션까지 전 범위 RTX 인공지능(AI) PC에서 효율적인 추론이 가능하다. 'LM 스튜디오'는 윈도우, 맥OS, 리눅스에서 모두 실행 가능하며 무료로 다운로드해 사용할 수 있다. 데스크톱 채팅, 오픈AI API 개발자 모드 등 다양한 인터페이스도 제공된다. 엔비디아 측은 "'LM 스튜디오' 최신 업데이트는 RTX AI PC에서 최고의 성능과 유연성을 제공한다"며 "로컬 LLM 도입 장벽을 낮추고 사용자의 AI 실험과 배포를 적극 지원할 것"이라고 밝혔다.

2025.05.12 15:33조이환

"화웨이만 키워줄 것"…젠슨 황, 美 수출통제 '직격 비판'

엔비디아 젠슨 황 최고경영자(CEO)가 미국 정부의 대중국 반도체 수출 통제가 자국 기업에 심각한 타격을 줄 수 있다고 경고했다. 중국 인공지능(AI) 칩 시장이 향후 수년 내 수백억 달러 규모로 성장할 것으로 전망되는 가운데 미국 기업이 이 기회를 놓치면 산업 경쟁력 전반에 부정적 영향을 줄 수 있다는 판단이다. 8일 CNBC 등 외신에 따르면 황 CEO는 지난달 30일 중국이 AI 칩 수요 측면에서 거대한 시장이라며 미국 기업이 접근하지 못할 경우 "막대한 손실"이 예상된다고 밝혔다. 인터뷰는 이날 워싱턴 D.C.에서 열린 '힐 앤 밸리 포럼' 직후 진행됐다. 엔비디아는 앞서 미국 정부의 수출 규제로 인해 55억 달러(한화 약 7조7천억원) 규모의 매출 손실을 입었다고 밝힌 바 있다. 이번 제재는 엔비디아가 중국용으로 설계한 'H20' 칩에도 적용돼 판매에 필요한 별도 허가를 요구하고 있다. 황 CEO는 중국 시장을 '핵심'으로 규정하며 AI 칩 접근 제한이 미국 내 일자리 창출 기회까지 제한할 수 있다고 우려했다. 그는 중국과의 기술 경쟁에서 화웨이와 같은 토종 기업들이 부상할 가능성도 경고했다. 중국 정부는 최근 수년간 반도체 자립을 위해 수십억 달러를 투입해 왔다. 화웨이는 AI 칩 공급망을 자체 구축하는 전략의 일환으로 최신 '어센드' 시리즈 칩을 개발 중이다. 이는 미국산 그래픽처리장치(GPU)에 대한 의존도를 낮추기 위한 행보다. 또 미국의 제재가 지속되면 화웨이를 비롯한 로컬 경쟁자들이 오히려 유리해질 수 있다는 분석도 제기된다. 이는 장기적으로 미국 반도체 기업의 글로벌 입지에 악영향을 줄 수 있다. 이 같은 상황에서 AMD 역시 15억 달러(한화 약 2조1천억원) 매출 감소를 발표하며 대중국 수출 통제가 업계 전반에 미치는 영향이 확산되고 있다. 특히 AI 응용에 필수적인 GPU를 생산하는 기업들이 직접적인 타격을 입는 중이다. 미국 워싱턴의 정부 산하 씽크탱크인 전략국제문제연구소(CSIS)는 지난 3월 보고서를 통해 "중국이 AI 기술 격차를 상당 부분 좁혔다"며 "미국이 기술 우위를 2년 이상 유지하는 것이 비현실적으로 보이는 상황"이라고 평가했다.

2025.05.08 15:02조이환

[현장] "HBM, AI 시대의 우라늄"…국회, 초당적 포럼서 반도체 전략 수립 '본격화'

"인공지능(AI) 시대의 진짜 병목은 연산이 아니라 메모리입니다. 그래픽처리장치(GPU)만큼 중요한 건 고대역폭메모리(HBM)이고 이를 못 잡으면 우리는 기술 식민지가 됩니다. HBM은 단순한 메모리가 아니라 설계, 냉각, 패키징, 파운드리까지 연결된 AI 시대의 '고농축 우라늄'입니다. 지금 투자하지 않으면 10년 뒤엔 우리의 미래를 장담할 수 없습니다." 김정호 카이스트 교수는 지난 22일 국회 의원회관에서 열린 'AI G3 강국 신기술 전략 조찬 포럼' 발제에서 이같이 말했다. 이날 김 교수는 'HBM이 대한민국을 살린다'는 제목으로 발표에 나서 반도체 설계 주도권 확보와 생태계 재편의 필요성을 강도 높게 강조했다. 이번 행사는 정동영 더불어민주당 의원과 최형두 국민의힘 의원이 공동 주최하고 산업계·학계·정계 주요 인사들이 대거 참석해 토론을 벌였다. SK하이닉스, 삼성전자, 서울대, 스타트업, 과기부 등 다양한 주체가 모인 현장에서는 AI 반도체 생태계 조성을 위한 현실적 방안들이 논의됐다. 김정호 교수 "HBM은 단순한 메모리가 아니다…AI 패권의 핵심 기술" 김정호 카이스트 교수는 이날 발제에서 HBM을 AI 시대의 '순수 우라늄'으로 간주하며 대한민국 반도체 산업이 생존하기 위해 반드시 확보해야 할 전략 자산이라고 강조했다. 그는 HBM이 단순한 메모리 기술을 넘어 컴퓨팅처리장치(CPU)와 GPU 기능까지 통합하게 될 미래를 예견하며 이를 통해서만 한국이 엔비디아와 같은 글로벌 기업과 대등한 협상력을 가질 수 있다고 주장했다. HBM은 기존 디램(DRAM) 대비 훨씬 빠른 속도로 데이터를 주고받을 수 있는 차세대 메모리 기술이다. 수직으로 여러 층의 메모리를 쌓은 구조 덕분에 같은 면적 안에서 더 많은 데이터를 병렬로 처리할 수 있어 대용량 연산이 요구되는 AI 학습과 추론에 최적화돼 있다. 더불어 HBM은 DRAM, 인터포저, 신호무결성(SIPI), 냉각, 재료, 패키징, 파운드리, GPU 설계, 시스템 아키텍처 등 다양한 기술이 융합돼야 구현 가능한 복합 기술 집합체다. 하나의 부품이 아니라 반도체 시스템 전체를 아우르는 '기술의 총합'인 것이다. 김 교수는 한국이 '챗GPT'와 같은 파운데이션 모델 없이도 AI 경쟁력을 확보하려면 엔비디아의 최신 GPU가 최소 수십만 대 필요하다고 말했다. 다만 현실적으로 현재 한국이 보유한 최신 엔비디아 'H100'은 몇천대 수준으로, 예산을 투입해도 엔비디아가 GPU를 이를 공급할 이유가 부족한 상황이다. 이에 제시할 수 있는 유일한 협상 카드가 HBM으로, 이를 기반으로 기술 주권을 확보해 반도체 글로벌 공급망에서 우위를 점해야 한다는 것이 김 교수의 주장이다. AI 기술이 빠르게 고도화되면서 주목받을 연산 병목의 핵심은 GPU가 아니라 HBM이라는 분석 역시 나왔다. 김 교수는 "'챗GPT'를 구동하는 동안 실제로 열을 받아 녹는 것은 GPU가 아니라 HBM"이라며 "토큰 생성 속도 저하의 주요 원인은 메모리 대역폭의 부족에 있다"고 설명했다. 이어 "기존 컴퓨터 구조에서는 저장은 메모리, 계산은 GPU가 맡았지만 AI 시대에는 이 둘 사이의 데이터 전달 속도에서 한계가 발생한다"고 말했다. 이 같은 구조적 병목은 HBM의 역할을 단순한 '빠른 메모리'를 넘어서는 요소로 만든다. 김 교수는 HBM의 기술적 본질을 '데이터를 얼마나 빠르게 GPU로 보내고 다시 받아올 수 있느냐의 싸움'이라고 정의했다. 그는 이를 100층짜리 고층 건물에 비유하며 층을 높이 쌓을수록 내부에서 데이터를 오가는 '고속 엘리베이터' 같은 통로가 필수라고 설명했다. 현재 개발 중인 'HBM4'까지는 이러한 구조를 일정 수준 유지할 수 있지만 몇년 후 등장할 'HBM7'과 같은 차세대 모델로 갈수록 기술적 부담은 폭발적으로 늘어난다. 특히 기존 본딩 공정에서 사용하는 납이 고온에서 열화되는 문제가 있어 더 높은 집적도와 연산량을 감당하려면 냉각 솔루션과 소재 자체의 혁신이 필수적이다. 이러한 배경에서 전체 시스템을 액체에 담가 냉각하는 '침지 냉각(immersion cooling)'이 유력한 차세대 해법으로 주목받고 있다. 단순히 칩을 잘 만드는 것만으로는 한계가 있는 만큼 냉각 설계, 패키징, 파운드리 공정, 시스템 아키텍처 설계까지 아우르는 통합적 기술 전략이 필요한 단계다. 이같은 급박한 상황 속에서 한국은 반도체 산업의 핵심 가치사슬인 설계와 파운드리에서 모두 취약한 위치에 놓여 있는 상황이라는 것이 김 교수의 설명이다. 일례로 'HBM4'부터는 연산 기능이 메모리 내부, 이른바 '베이스 다이(Base Die)'에서 처리되는 구조로 전환되고 있다. 다만 해당 기술의 설계는 엔비디아가, 제조 공정은 대만 TSMC가 주도하고 있어 국내 기업의 입지는 좁아지고 있는 것이다. 김 교수는 이 같은 글로벌 기술 분업 구조 속에서 한국이 기술 주도권을 잃을 가능성을 경고했다. 특히 SK하이닉스는 '베이스 다이' 설계 경험이 부족하고 삼성전자는 생태계에서 실질적 중심을 잃고 있다고 지적했다. 이에 설계와 파운드리 양쪽 모두에 대한 국가 차원의 역량 집중이 필요하다고 강조했다. 그 역시 자신의 연구실에서 HBM의 병목 문제를 해결하기 위한 다양한 실험을 진행 중이다. 여러 층을 쌓아올리는 '멀티타워 아키텍처'와 연산 기능을 메모리 내부에 넣는 'CPU 내장형 메모리' 구조가 대표적이다. 기존 디램을 보조 메모리로 붙이거나 CPU를 직접 설계하는 방식도 병행하고 있으며 이는 최근 엔비디아가 공개한 '블랙웰 시스템'과 유사한 구조다. 또 김 교수는 AI 기술을 활용한 자동 설계 실험도 병행하고 있다. 자연어로 회로를 설계하는 '바이브 코딩'을 통해 학생이 설계한 HBM과 '챗GPT'가 설계한 결과의 성능이 거의 유사했다는 점을 소개하며 인력 부족 문제를 AI가 보완할 수 있다고 강조했다. 김 교수는 "AI는 죽지도 자지도 않지만 사람은 인건비가 든다"며 "AI 기반의 자동화 기술이 앞으로 산업 경쟁력을 좌우할 핵심 수단이 될 것"이라고 주장했다. 발표를 마치며 김 교수는 AI 생태계의 패권 경쟁이 결국 'HBM 기술력'에 수렴된다고 강조했다. AI가 핵무기, 반도체가 우라늄이라면 HBM은 '순수 우라늄'으로, 한국이 이 기술을 확보하지 못하면 글로벌 기술 질서에서 도태될 수밖에 없다는 것이다. 김정호 카이스트 교수는 "이제는 정부가 나서서 HBM 주도권을 위해 전략적으로 투자해야 한다"며 "기업과 학계도 반도체 전문대학원을 신설하고 고급 인재를 체계적으로 길러낼 수 있는 구조로 과감히 개편해야 한다"고 강조했다. 이어 "과거 박정희 대통령이 고속도로를 깔아 자동차 산업을 열고 김대중 대통령이 인터넷망으로 IT 강국의 기반을 만들었듯 이 위기를 기회로 만들 어야 한다"고 말했다. "HBM만으론 부족하다"…산학연이 말한 'AI 반도체 생태계의 조건은? 이날 김 교수의 발표 이후에는 기술 인프라와 생태계 확장을 놓고 산업계·학계·정부 인사 간에 치열한 논의가 벌어졌다. 이날 토론에서는 'HBM 중심 전략'을 넘어서 설계·파운드리·모델·SW까지 포괄하는 통합 생태계 필요성이 제기됐다. HBM에 대한 전략적 인프라 확충은 대체로 공감대가 형성됐다. 다만 실제 현장에선 정부 지원이 한정돼 있어 기술 주도권 확보엔 한계가 있다는 우려가 나왔다. 정상록 SK하이닉스 부사장은 "지난 2023년 삼성과 각각 500억 원씩 지원받았지만 기술 성장성을 반영할 때 보다 세심한 고려가 필요하다"며 "개인적으로 볼때 정부가 HBM이라는 신기술을 보다 감안해서 장기적인 전략을 짜는 것이 좋은 전략일 것으로 생각한다"고 말했다. 정부 역시 이를 인지하고 전략적 대응에 나섰다는 입장이다. 박윤규 정보통신산업진흥원장은 "향후 정부의 전략 투자 중심축 중 하나가 HBM이 될 것"이라며 "우리는 기업의 고충을 실제로 듣고 지원하는 입장에서 인프라와 설계 R&D를 함께 지원하는 방향으로 갈 것"이라고 밝혔다. 스타트업들은 기술 상용화의 '속도'와 '현실'을 문제 삼았다. HBM을 실제 적용하고 있는 기업들 자본, 인재, 시간 모두에서 한계에 부딪히고 있다는 설명이다. 정영범 퓨리오사AI 상무는 "3년 전 'GPT-3'가 나올 당시 HBM3를 선택했는데 다들 만류했다"며 "그럼에도 우리는 한국도 가능하다는 믿음으로 다소 무리하며 밀어붙였고 결과적으로 현명한 선택이 됐다"고 말했다. 칩 하나를 개발하는 데만 수백억 원이 들어가는 현실에서 스타트업은 생존을 위해 정부의 중장기 지원이 절실하다는 호소도 나왔다. 배유미 리벨리온 이사는 "인재, 자본, 시간을 꾸준히 투입해야 하는데 정부가 이 흐름을 끊지 않도록 지원책을 이어가줬으면 한다"고 말했다. 기술 못지않게 인재 확보도 현장의 핵심 과제로 떠올랐다. 고급 설계인력 수요는 폭증하고 있지만 국내 교육·보상 시스템이 이를 받쳐주지 못한다는 지적이다. 이공계 고급 인력의 산업계 유입을 위한 구체적 유인책도 필요하다는 설명 역시 이어졌다. 김영오 서울대 공대 학장은 "AI와 반도체를 동시에 전공할 수 있는 학생들이 필요하다"며 "상위 10~20% 천재 학생들에게는 파격적 보상과 국가 주도 연구기관이 필요하다"고 제안했다. 이어 현대 조현철 상무는 "카이스트 출신들도 산업계보다 학계나 해외로 빠져나간다"며 "산업계로의 유입을 위한 정부 차원의 가이드라인이 필요하다"고 말했다. AI 생태계의 핵심은 '풀스택 경쟁력'이라는 점도 강조됐다. 송대원 LG 상무는 "구글은 이번 '넥스트' 행사에서 GPU부터 모델, 솔루션까지 전방위 생태계를 발표했다"며 "국내도 인프라만 볼 게 아니라 전체 AI 흐름을 같이 키워야 한다"고 말했다. 정부도 이런 문제의식을 반영해 추경 예산을 마련하고 제도 개선을 시도 중이다. 특히 글로벌 수준 인재 유치를 위한 예산이 신설됐다는 점이 눈에 띈다. 송상훈 과기부 실장은 "최대 40억원까지 매칭 지원이 가능한 고급 인재 유치 프로그램을 새로 만들었다"며 "퓨리오사, 리벨리온 같은 기업들이 공학도들의 꿈이 되도록 하겠다"고 말했다. 정동영 더불어민주당 의원은 "HBM 3층 적층 구조를 처음 제안했던 김정호 교수의 주장을 우리 기업들이 진작 받아들였더라면 지금쯤 이들의 국제적 위상이 보다 커졌을 것"이라며 "오늘 산업계, 학계, 정부, 여야가 오늘처럼 한자리에 모인 것 자체가 의미 있고 이 논의가 구체적 실행으로 이어져야 한다"고 말했다. 최형두 국민의힘 의원은 "매주 격주 아침마다 토론을 이어온 것은 각계 리더들이 진심으로 이 문제를 국가 전략으로 보고 있다는 방증"이라며 "AI 추경 예산 반영 여부가 이제 과방위와 예결위 논의에 달려 있는 상황에서 국회 특위 위원으로서 마지막 소위 심사까지 책임지고 반영될 수 있도록 최선을 다하겠다"고 강조했다.

2025.04.23 11:28조이환

[현장] 한국인공지능산업협회 "AI 전환은 생존 문제"…산업 현안 집중 조명

한국인공지능산업협회(AIIA)가 국내 인공지능(AI) 산업계의 현안을 짚고 기술 대응 방향을 모색하는 만남의 장을 열었다. AI 인프라와 소프트웨어(SW) 테스트 분야의 현안을 조명해 업계의 변화 속도를 조명하기 위함이다. AIIA는 15일 서울 양재동 엘타워에서 'AI는 어디에나 있다'를 주제로 '제49회 AIIA 조찬포럼'을 개최했다. 이날 행사에서는 이동기 SK텔레콤 랩장이 AI 인프라 구축과 서비스로서의 그래픽처리장치(GPUaaS)를, 이혜진 티벨 이사가 소프트웨어(SW) 테스트에서의 AI 활용 사례를 주제로 각각 발표했다. 양승현 AIIA 협회장은 "최근 모델 컨텍스트 프로토콜(MCP)과 화웨이 AI 칩의 등장 등 가파른 기술의 발전으로 시장의 방향성이 바뀌고 있다"며 "AI 인프라 전환은 더 이상 선택이 아닌 생존의 문제"라고 말했다. "AI 데이터센터는 새로운 제조업"…SKT 랩장의 경고와 해법은 이날 첫 발표를 맡은 이동기 SK텔레콤 AI 데이터센터랩장은 AI 인프라 구축 프로젝트와 GPU 서비스 전환 흐름을 집중 조명했다. 그는 AI 데이터센터가 전통적인 서버룸 중심의 데이터센터 개념에서 탈피한 근본적 전환이 이뤄지고 있다고 진단했다. 발표에 따르면 AI 데이터센터는 네 가지 축을 중심으로 구체화된다. ▲GPU 서버로 구성된 고성능 컴퓨팅 인프라 ▲액체 냉각 기반의 첨단 쿨링 시스템 ▲분산형 친환경 에너지 설비 ▲자원·비용·성능을 통합 관리하는 최적화 소프트웨어가 핵심이다. 이 랩장은 AI 데이터센터의 등장을 '토큰 공장' 개념으로 비유했다. 단순한 컴퓨팅 자원이 아닌 AI 추론과 학습을 통해 대규모 토큰을 실시간 생산해내는 AI 팩토리로 진화하고 있다는 설명이다. 실제로 젠슨 황 엔비디아 CEO도 "AI 데이터센터는 새로운 종류의 제조업이 되고 있다"고 강조한 바 있다. 이 과정에서 가장 큰 변화를 맞는 영역은 냉각과 전력 인프라다. 기존 공랭 방식은 고집적 GPU 서버를 감당할 수 없기 때문이다. 냉각 방식도 지속적으로 진화하고 있다. 단순히 직접 냉각 뿐만 아니라 서버 자체를 냉각장치 안에 넣는 '침수형'과 '정밀 액체분사형' 냉각 기술도 함께 발전 중이다. 다만 침수 방식은 물의 무게 탓에 상면당 하중이 기존 대비 최대 4배까지 증가할 수 있어 구조 설계부터 다시 짜야 한다는 부담이 뒤따른다. 이러한 흐름은 글로벌 무대에서도 극단적으로 전개되고 있다. 일론 머스크는 xAI의 파운데이션 모델인 '그록3' 개발을 위해 폐공장을 매입해 10만 장 규모의 GPU 팩토리를 구축하려다 전력과 냉각 시스템 병목에 부딪힌 바 있다. 결국 전국에서 발전기를 조달하고 미국 내 이동식 냉각 장비의 4분의 1을 임대해 대응하는 방식으로 급조된 데이터센터를 운영한 바 있다. GPU 장비의 고가·단명화 추세에 대한 우려도 제기됐다. 이동기 랩장은 "직접 센터를 지어도 몇 달 만에 장비가 구형이 될 수 있다"며 "GPU 인프라의 진화 속도를 감안할 때 이를 보유하는 것보다 서비스 형태로 이용하는 쪽이 현실적인 선택이 되고 있다"고 말했다. SK텔레콤은 이를 해결하기 위해 GPUaaS 모델을 도입하고 있다. 미국 람다랩스와의 협력을 통해 최신 GPU 클러스터를 국내 기업들에게 제공 중이며 연내 온디맨드 상품도 출시할 계획이다. 람다는 '인피니밴드' 기반의 대형 클러스터를 동적으로 나눠 쓰는 '원클릭 클러스터' 기술을 강점으로 내세우고 있다. 이 랩장은 "AI 데이터센터 구축에 필요한 총비용의 약 70%가 GPU 인프라에 투입된다"며 "GPUaaS는 전력, 공간, 업그레이드 리스크를 모두 분산시킬 수 있는 해법"이라고 강조했다. "AI가 SW 테스트하는 시대"…티벨, 자동화 넘어 '테스트옵스'로 간다 이날 두 번째 발표자로 나선 이혜진 티벨 이사는 SW 테스트 분야에서 AI 기술이 어떻게 활용되고 있는지를 소개했다. 그는 "테스트는 기술이 아니라 신뢰"라는 격언을 강조하며 자동화와 AI 기반 도구들이 궁극적으로 확보해야 할 목표는 '품질에 대한 신뢰'라고 밝혔다. 티벨은 금융, 교육, 전자상거래 등 다양한 분야의 품질 보증 서비스를 제공하는 테스트 전문 기업이다. 이 회사는 기존 수작업 기반의 테스트를 넘어 자동화 테스트, AI 기반 검증 기술, 테스트 운영 환경 설계까지 사업 영역을 확대하고 있다. 특히 음성 기반 테스트 자동화, 대규모 고객민원(VOC) 처리 시스템, 거대언어모델(LLM) 결과 신뢰성 검증 등 다양한 R&D 성과도 함께 공개했다. 이 이사는 먼저 테스트의 부재가 초래한 사고들을 사례로 제시하며 테스트의 중요성을 강조했다. 그는 나사의 화성 기후 탐사선 폭발 사고, 아마존웹서비스(AWS)의 대규모 장애, 영국 은행 시스템 마비 등의 사례를 언급하며 테스트 실패는 곧 신뢰 손실로 직결된다는 점을 보였다. 이러한 상황에 대응해 티벨이 제시한 테스트 기술의 진화는 다음과 같다. ▲사람이 직접 케이스를 설계하는 매뉴얼 테스트 ▲반복 작업과 지속적 통합(CICD) 연동 중심의 자동화 테스트 ▲AI 기반의 시나리오 생성, 이상 탐지, 유저 인터페이스(UI) 변경 인식이 가능한 지능형 테스트 ▲자율주행처럼 스스로 복구하고 실행하는 '자율 테스트'가 그것이다. 특히 음성 기반 서비스 검증을 위한 자동화 기술도 소개됐다. 텍스트투사운드(TTS)·사운드투텍스트(STT)·자연어처리(NLP) 기술을 결합해 발화된 음성과 AI의 응답을 비교·분석해 유사도를 측정하고 결과를 자동으로 아틀라시안의 이슈 트래킹 툴인 '지라(JIRA)'에 업데이트하는 구조다. AI 기술을 테스트에 접목한 주요 활용 사례도 다양했다. 머신러닝을 통한 오류 패턴 분석, 테스트 로그 기반의 신규 케이스 추출, NLP 기반 요구사항 문서 분석, UI 탐색 자동화, 테스트 코드 자동 생성 등이다. 이 이사는 테스트 운영 환경을 자동화하는 '테스트옵스'의 중요성도 함께 강조했다. 그는 "단순 자동화 기술이 아니라 테스트 설계부터 실행·결과 관리까지 전체 프로세스를 자동화하는 게 진정한 진화"라며 "이를 위해 우리는 오픈소스 기반 기술을 적극 채택하고 고객사 인프라에 맞춰 유연한 환경을 구현하고 있다"고 밝혔다. 이혜진 티벨 이사는 발표를 마치며 "AI 도구가 아무리 고도화돼도 테스트의 본질은 신뢰이며 그 신뢰는 사람이 만든다"며 "자동화는 도구로, 품질에 대한 맥락 이해와 판단은 여전히 사람의 몫"이라고 강조했다.

2025.04.15 10:06조이환

다나와, 라데온 RX 9070 XT 그래픽카드 추첨 판매

커넥트웨이브 가격비교서비스 다나와는 14일부터 18일까지 5일간 AMD 라데온 9070 XT 그래픽카드 특가 추첨판매를 진행한다. 대상 제품은 '사파이어 RX 9070 XT 게이밍 16GB 펄스'이며 다나와 래플 게시판에서 추첨판매 제품을 1천원에 결제하면 자동으로 응모된다. 응모 기간 중 하루 이상 참여하면 추첨 대상에 포함된다. 당첨자는 오는 22일 다나와 당첨자 발표 게시판에 공지하며 미당첨자 결제 금액은 자동 환불된다. 5일간 모두 응모한 참여자 중 별도 추첨을 통해 총 50명에게 편의점 상품권과 다나와 포인트를 추가 지급한다. 다나와 관계자는 "AMD 라데온 RX 9070 XT 그래픽카드는 지난 3월 출시 이후 판매량이 상승했으며 같은 기간 AMD 그래픽카드 거래액도 전년 대비 2배 이상 늘었다"고 설명했다. 제세공과금은 다나와가 부담하며 당첨자는 발표 후 10일 이내에 당첨후기를 작성해야 한다. 행사 관련 상세 내용은 다나와 검색창에 '다나와래플'을 검색하거나 다나와 래플 게시판에서 확인할 수 있다.

2025.04.14 10:26권봉석

"GPU 72장 돌려야 답 나온다"…엔비디아, AI 추론 '끝판왕' 내놔

엔비디아가 복잡한 사고력 기반 AI 모델 확대에 맞춰 새로운 추론 성능 전략을 공개한다. 점점 더 많은 연산을 요구하는 AI 모델 등장에 따른 글로벌 평가 기준 변화에 선제 대응하려는 조치다. 3일 업계에 따르면 엔비디아는 지난 1일 정오 온라인으로 진행한 프리브리핑에서 AI 성능 벤치마크인 '엠엘퍼프(MLPerf)' 추론 AI 부문의 변화에 대응하기 위한 기술 전략을 공개했다. 이번 행사는 국제 컨소시엄 엠엘커먼스(MLCommons)가 '사고 기반 AI'인 추론 모델을 평가 항목에 포함하려는 움직임에 초점을 맞췄다. 엠엘퍼프는 AI 모델의 훈련(training)과 추론(inference) 성능을 하드웨어·소프트웨어 통합 기준으로 측정하는 글로벌 표준 벤치마크다. 엠엘커먼스가 주도하는 이 평가 항목은 업계 기술 흐름에 따라 주기적으로 갱신된다. 최근에는 단순 예측을 넘어 복잡한 추론과 의사결정을 요구하는 리즈닝 모델이 AI 기술의 중심으로 떠오르면서 해당 항목의 공식 도입 논의가 본격화되고 있다. 엔비디아는 아직 리즈닝 모델 항목이 공식 도입되지는 않았지만 차기 엠엘퍼프 버전에서는 채택 가능성이 높다고 판단하고 있다. 이를 선제적으로 대비하기 위해 회사는 중국의 AI 스타트업인 딥시크가 개발한 생성형 AI 모델을 활용해 복잡한 사고 기반 작업에서의 추론 성능을 시연했다. 이처럼 복잡한 추론 모델이 확산되면서 AI 추론 환경 전반에도 근본적인 변화가 일고 있다. 추론 연산량이 전례 없이 폭증하고 있는 상황에서 과거에는 단일 그래픽처리장치(GPU)나 단일 노드에서 충분했던 작업들이 이제는 다수 GPU를 동시 투입하는 복잡한 병렬 연산 없이는 처리할 수 없다는 것이 엔비디아의 분석이다. 이에 더해 추론 모델의 확산은 AI 개발의 모든 단계에서 연산 자원의 수요를 급격히 증가시키고 있다. 엔비디아는 모델 재학습(retraining), 도메인 맞춤화(post-training), 테스트 시점 확장(test-time scaling) 등에서 연산량이 기하급수적으로 늘고 있다고 분석했다. 특히 테스트 단계에서도 추론 정확도를 높이기 위한 병렬 연산 수요가 계속해서 증가하고 있다는 점을 강조했다. 이에 이날 엔비디아는 고성능 시스템 예시로 'GB200 MBL'을 제시했다. 해당 시스템은 총 72개의 GPU를 동시 연동하며 복잡한 추론을 빠르게 처리할 수 있도록 설계됐다. 회사는 이러한 대규모 병렬 환경이 향후 추론 표준이 될 것으로 보고 있다. 엠엘커먼스 역시 추론 모델을 엠엘퍼프의 공식 평가 항목에 포함하기 위한 논의를 본격적으로 시작한 상황이다. 현재 다양한 기술 커뮤니티와 협업을 통해 평가 기준과 워크로드 확장을 준비하고 있다. 공식 도입 시점은 아직 정해지지 않았으나 실증 사례와 모델 테스트가 계속 이어지고 있어 연내 도입이 확정될 가능성도 있다. 엔비디아 관계자는 "모델의 크기와 지능이 커짐에 따라 연산량이 모든 단계에서 폭증하고 있다"며 "재학습, 도메인 최적화, 테스트 시점 스케일링 모두 고성능 GPU를 요구한다"고 설명했다. 이어 "72개의 GPU처럼 다수의 칩을 동시에 작동시켜야 하는 이유가 바로 이 때문"이라고 덧붙였다.

2025.04.03 01:00조이환

SOOP KBO 그래픽 '입중계' 관심↑

SOOP이 그래픽 입중계 콘텐츠를 통해 KBO 팬들과 소통을 이어가고 있다고 25일 밝혔다. 2024년부터 SOOP은 그래픽 중계를 신속하게 도입하고 고도화해, 스트리머와 팬들이 온라인에서 실시간으로 소통하고 함께 응원할 수 있는 '입중계' 콘텐츠로 색다른 재미를 제공하고 있다. 그래픽 중계는 실시간 경기 상황을 스코어보드, 투타 정보, 라인업 등 주요 데이터를 기반으로 진행된다. 개막전이 펼쳐진 3월 22일에는 약 55명의 스트리머가 각자 다양한 방식으로 KBO리그 입중계를 진행했고, 하루 동안 누적 시청자 수는 약 32만 명을 기록하며 입중계 콘텐츠에 대한 높은 관심을 확인할 수 있었다. SOOP은 사용자 편의를 위한 지속적인 그래픽 중계 기능 고도화를 진행하고 있다. 특히 모바일에 익숙한 유저들이 시의성 있는 정보를 더욱 쉽고 빠르게 얻을 수 있도록 직관적인 환경 구축에 중점을 뒀다. 기존에 한 화면에 일괄적으로 제공됐던 ▲스코어보드 ▲타 구장 정보 ▲그라운드 정보 ▲현재 투타 정보 ▲문자 중계 정보를 각각 4개의 독립된 영역으로 나눠 선택적으로 볼 수 있도록 했다. 스트리머들은 경기 상황이나 유저의 관심사에 따라 원하는 정보만 골라 전달할 수 있어 맞춤형 콘텐츠로 팬들의 만족도를 높이고 있다. 여기에 문자 중계 영역에 각 팀의 최신 라인업 정보를 실시간으로 확인할 수 있는 '라인업' 기능까지 추가돼, 팬들에게 더욱 정확하고 풍성한 정보를 제공하고 있다는 평가다. 특히, 최근에는 버추얼 스트리머들도 야구 중계에 뛰어들며 눈길을 끌고 있다. 사이다(KIA), 드드(NC), 먹체토(LG), 매지_(롯데), 설혜리(한화), 타쵸쵸(삼성), 단즈_(한화) 등 각 구단 특색을 반영한 버추얼 스트리머들은 단순 입중계를 넘어 다양한 협업 콘텐츠까지 직접 기획해 방송하고 있다. 이세계아이돌 소속 버추얼 스트리머 고세구는 KBO리그를 처음 접하는 유저를 위한 입문 콘텐츠인 '한국야구 어필쇼'를 기획해 유저들로부터 좋은 반응을 얻었다. 해당 방송에는 여러 버추얼 스트리머들이 출연해 야구에 얽힌 각 구단의 흥미로운 이야기와 문화를 소개하며 팬들에게 색다른 즐거움을 제공했다. 해당 방송은 최고 동시 접속자 수 2만 명을 기록했다. 또한, 기존 스포츠 중계에 특화된 스트리머뿐 아니라 게임, 먹방, 보이는 라디오 등 다양한 분야에서 활동하던 인기 스트리머들도 야구 콘텐츠에 참여하면서 팬들의 선택 폭이 한층 더 다양해졌다. SOOP은 스트리머들이 안정적으로 야구 콘텐츠를 제작할 수 있도록 다양한 지원책도 운영하고 있다. 2017년부터는 야구가 없는 월요일마다 스트리머와 팬들이 모여 KBO리그 관련 이슈를 이야기하는 자체 제작 예능 콘텐츠 '야자타임'을 진행 중이며, 버추얼 스트리머들과 함께 야구 상식을 겨루는 'KBO 야구 퀴즈쇼'도 큰 호응을 얻고 있다. 해당 콘텐츠는 상금 지원을 통해 스트리머들의 자발적인 참여를 유도하고 있으며, 입문자부터 열성 팬까지 폭넓은 관심을 받고 있다. 최근에는 현직 야구 기자들과 함께 이슈를 다루는 토론형 프로그램 '두리쥬와 야구 TALK'도 선보였으며, 유저들이 주요 경기를 놓치지 않도록 '오늘의 이슈 매치' 배너도 운영 중이다.

2025.03.25 19:38안희정

"삼성SDS도 신뢰한 AI 팩토리"…델-엔비디아, 기업용 AI 시장 공략 '박차'

델 테크놀로지스가 엔비디아와 손잡고 인공지능(AI) 인프라를 전면 업그레이드한다. 기업들의 AI 도입 장벽을 낮추고 혁신 속도를 끌어올려 시장 경쟁력을 강화하려는 행보다. 델 테크놀로지스는 18일 온라인 미디어 브리핑에서 '엔비디아 기반 델 AI 팩토리'의 최신 포트폴리오를 공개했다. 엔비디아의 'GTC 2025'와 동시에 열린 이번 간담회에서는 엔비디아와 델의 협력 성과가 집중 조명됐다. 델은 AI PC, 서버, 스토리지, 네트워킹 등 AI 인프라 전반을 아우르는 신제품을 대거 선보였다. 이날 발표를 진행한 바룬 차브라 델 인프라 및 텔레콤 마케팅 수석 부사장은 AI의 본격적인 산업 적용이 시작되면서 기업들은 AI 도입에 있어 여러 장애물을 마주하고 있는 점을 지적했다. 차브라 부사장에 따르면 현재 기업들은 ▲비용 통제 ▲데이터 관리 ▲기존 시스템과의 통합 ▲전문 인력 부족을 주요 도전 과제로 직면해 전체 중 77%의 기업이 AI 인프라 구축을 위해 '단일 벤더'를 선호하고 있다. 이에 따라 델은 엔비디아와의 협력을 통해 이 같은 시장 수요를 적극 공략할 계획이다. 실제로 델은 이번 브리핑에서 AI PC 시장 공략을 위한 신제품을 대거 선보였다. '델 프로 맥스 AI PC' 라인업에는 엔비디아의 최신 '그레이스 블랙웰' 아키텍처가 적용됐다. 기존 데이터센터에서만 활용되던 AI 개발용 그래픽처리장치(GPU) 성능을 데스크톱에서도 구현한 것이 특징이다. 연구자와 개발자를 위한 소형 워크스테이션뿐 아니라 784기가바이트(GB) 메모리와 20페타플롭스(PFLOPS) 성능을 갖춘 고성능 AI 개발용 PC도 함께 공개됐다. 데이터센터 부문에서도 델과 엔비디아의 협력은 강화된다. 차브라 부사장에 따르면 델은 엔비디아의 최신 블랙웰 GPU와 커넥트X8 슈퍼닉스를 지원한다. 특히 곧 출시될 '델 파워엣지 XE 8712(PowerEdge XE8712)' 서버는 노드당 2개의 그레이스 CPU와 4개의 블랙웰 GPU를 탑재해 데이터센터 내 AI 성능을 극대화할 것으로 예상된다. 한 랙에 144개의 GPU를 수용할 수 있어 초고밀도 AI 연산 환경을 구축할 수 있다. AI 데이터 관리 역시 델의 핵심 혁신 분야 중 하나다. 이를 위해 '델 AI 데이터 팩토리 위드 엔비디아(Dell AI Factory with NVIDIA)'는 기업들이 AI 데이터를 더 빠르게 처리하고 보다 안전하게 보호할 수 있도록 설계됐다. 이 플랫폼은 대량의 데이터를 실시간으로 받아들이는 데이터 인제스천 기능을 지원하며 GPU 가속 기반 '스파크 쿼리'를 활용해 기존 대비 최대 220% 향상된 속도로 데이터를 분석하고 처리할 수 있다. 차브라 부사장은 "AI의 성능을 극대화하려면 데이터를 빠르게 처리하고 안전하게 보관하는 것이 필수"라며 "우리 AI 데이터 팩토리는 대규모 AI 워크로드를 보다 효율적으로 운영할 수 있도록 설계돼 기업들의 AI 도입 속도를 한층 끌어올릴 것"이라고 설명했다. AI 소프트웨어 분야에서도 델과 엔비디아의 협력은 이어지고 있다. 델은 '에이전트 AI' 시스템 개발을 지원하는 엔비디아의 AI 개발 프레임워크인 '에이전틱 AI'와 이를 위한 AI 최적화 도구를 AI 팩토리에 통합했다. 이에 따라 기업들은 AI가 단순한 질의응답을 넘어 스스로 의사 결정을 내릴 수 있는 시스템을 구축할 수 있게 됐다. 회사는 AI 인프라 구축뿐만 아니라 AI 네트워킹 및 배포 서비스도 강화하고 있다. 네트워크 최적화, GPU 서버 구축, 다중 벤더 환경 통합 등 다양한 AI 전문 서비스를 제공하며 AI 프로젝트의 초기 단계부터 운영까지 전 과정을 지원한다. 이같이 AI 도입이 빠르게 확산되면서 델과 엔비디아의 협력도 지속적인 탄력을 받고 있다. 양사는 지난해 GTC에서 '델 AI 팩토리 위드 엔비디아'를 공개한 이후 지난 1년간 100개 이상의 신규 AI 제품을 출시하고 2천 개 이상의 고객을 확보했다. 특히 삼성SDS는 델과 협력해 AI 팩토리를 구축했으며 이를 통해 모델 정확도를 98%까지 향상시키고 업무 생산성을 70% 이상 개선한 것으로 알려졌다. 스콧 구 삼성SDS 클라우드 서비스 사업부문 부사장은 델-엔비디아 협력을 두고 "우리는 모든 고객을 위한 AI 팩토리를 구축하고 있다"며 "이를 서비스 형태로 안전하게 제공하거나 고객의 자체 환경에 배포할 수 있도록 하고 있다"고 말했다. 향후에도 델은 엔비디아와 협력해 AI 시장에서의 입지를 더욱 강화할 계획이다. 바룬 초프라 델 수석 부사장은 "우리는 엔비디아와 AI 도입을 가속화할 수 있는 완벽한 파트너"라며 "AI 생태계 전반에서 기업들이 혁신을 실현할 수 있도록 지원할 것"이라고 강조했다.

2025.03.19 08:32조이환

AMD, 라데온 RX 9070·9070 XT 그래픽카드 공개

AMD가 28일(미국시간) RDNA 4 아키텍처 기반 새 GPU인 라데온 RX 9070·9070 XT를 공개했다. 라데온 RX 9070·9070 XT는 3세대 레이트레이싱 가속기와 2세대 AI 가속기를 내장했다. AI 가속기는 FP8(부동소수점, 8비트) 등 새로운 자료형 처리를 지원해 생성 AI를 비롯한 응용프로그램 처리 성능을 개선했다. AMD는 주요 게임을 이용해 자체 측정한 결과를 토대로 "1440p 해상도에서 전세대 최상위 GPU인 RX 7900 GRE 대비 RX 9070 XT는 평균 40%, RX 9070은 평균 20% 성능이 향상됐다"고 설명했다. 저해상도 화면을 고해상도로 업스케일해 부하를 줄이면서 초당 프레임 수를 끌어올리는 피델리티FX 슈퍼해상도4 기능은 이전 버전인 3.1 대비 이미지 품질 향상, 머신러닝 기반 알고리듬을 통한 세부 표현력 증가를 지원하며 출시 시점에서 30개 이상의 게임에서 지원될 예정이다. 지원하는 영상 출력 규격은 디스플레이포트 2.1a, HDMI 2.1b를 지원하며 8K 144Hz 고해상도 화면, 12비트 HDR, REC2020 색공간 지원 등을 지원한다. AMD 프리싱크 지원 모니터와 연결하면 화면 잘림이나 끊김을 최소화하며 부드러운 화면을 볼 수 있다. AMD는 라데온 GPU 지원을 위한 소프트웨어인 아드레날린 에디션에 AI를 가미해 챗봇을 통한 고객지원, 텍스트/이미지 생성 기능을 추가했다. RX 9070 XT 탑재 그래픽카드 권장가는 599달러(87만 6천원), RX 9070 탑재 그래픽카드 권장가는 549달러(80만원)이며 에이수스, 기가바이트, 사파이어, XFX 등 주요 제조사를 통해 오는 3월 6일부터 공급된다. 잭 후인 AMD 클라이언트 및 그래픽그룹 수석부사장은 "차세대 AMD RDNA 4 아키텍처를 기반으로 그래픽 성능을 크게 도약시킨 라데온 RX 9000 시리즈는 최신 게임의 요구사항을 충족하며 마니아급 게임 경험과 미래 혁신을 지원할 것"이라고 밝혔다.

2025.03.01 06:00권봉석

엔비디아, AI 네트워크 칩으로 시스코 실리콘 원 선정

시스코(Cisco)와 엔비디아(NVIDIA)가 기업의 인공지능(AI) 도입을 가속화하기 위해 파트너십을 확대한다. 26일 시스코와 엔비디아는 AI 지원 데이터 센터 네트워크 구축을 단순화하기 위해 포트폴리오 간 통합 아키텍처를 구축할 것이라고 밝혔다. 이번 파트너십의 핵심은 시스코의 실리콘 원(Silicon One)과 엔비디아의 스펙트럼-X(Spectrum-X) 이더넷 네트워킹 플랫폼의 결합이다. 엔비디아는 고성능 AI 데이터센터 구축을 위한 네트워킹 플랫폼인 '스펙트럼-X'에 사용할 핵심 네트워크 칩으로 시스코의 실리콘을 선정했다. 이를 통해 시스코가 유일한 네트워크 칩셋 공급업체가 된다는 설명이다. 또한, 시스코는 엔비디아의 스펙트럼 실리콘과 운영체제 소프트웨어를 결합한 시스템을 구축해 고객들이 데이터센터에서 시스코 네트워킹과 엔비디아 기술을 동시에 표준화할 수 있도록 지원할 계획이다. 이번 협력을 통해 두 회사는 AI 워크로드를 위한 고성능, 저지연, 에너지 효율적인 연결을 제공해 데이터센터, 클라우드, 사용자 간의 원활한 통합을 지원한다는 방침이다. 또한, 고객들은 기존 관리 도구와 프로세스를 활용하여 프론트엔드와 백엔드 네트워크를 아우르는 공통 아키텍처로 AI 인프라 투자 최적화에 나선다. 시스코는 2025년 중반까지 실리콘 스위치를 스펙트럼-X 및 엔비디아의 참조 아키텍처와 호환되도록 업데이트할 계획이다. 여기에는 기존 및 향후 출시될 시스코 넥서스, 시스코 하이퍼패브릭, 시스코 UCS 제품이 포함된다. 시스코의 척 로빈스 회장 겸 CEO는 "기업들은 AI를 신속하고 효과적으로 배포해야 하는 압박을 받고 있으며, 많은 리더들이 투자와 위험 간의 균형을 맞추는 데 어려움을 겪고 있다"며 "시스코와 엔비디아는 고객들의 이러한 장벽을 제거하고, 인프라 투자를 최적화하여 AI의 잠재력을 활용할 수 있도록 협력하고 있다"라고 말했다. 엔비디아의 젠슨 황 창립자 겸 CEO는 "AI는 빛의 속도로 발전하며 모든 산업을 혁신할 것"이라며 "엔비디아 스펙트럼-X는 이러한 AI를 위해 강화되고 초고속화된 이더넷"이라고 설명했다. 이어 "시스코의 기업 플랫폼과 글로벌 도달 범위와 함께 우리는 전 세계 기업들이 AI로의 전환을 위해 최첨단 엔비디아 인프라를 구축하도록 도울 것"이라고 말했다.

2025.02.26 16:44남혁우

삼성전자·포스텍, 차세대 '무색수차 메타렌즈' 개발 성과

삼성전자는 포스텍(POSTECH)과 산학협력을 통해 진행한 '무색수차 메타렌즈' 연구 논문이 세계적인 학술지 '네이처 머티리얼스(Nature Materials)'에 게재됐다고 25일 밝혔다. 메타렌즈는 빛의 회절을 제어할 수 있는 나노 크기의 구조체로 구성된 평면 렌즈다. 디스플레이·카메라 등 광학 시스템 분야에서 차세대 소자로 주목받으며 10여 년 전부터 업계에서 다양한 연구가 진행돼 왔다. 특히 기존 볼록 광학 렌즈 대비 크기와 두께를 획기적으로 줄일 수 있는 장점이 있다. 하지만 큰 색수차로 이미지가 심각하게 왜곡되는 기술적 한계가 있어 실제 제품 개발로 이어지는 데 어려움이 있었다. 색수차란 렌즈를 통과하는 빛이 굴절될 때, 서로 다른 파장의 빛들이 굴절률이 달라 각기 다른 방향으로 휘어져 이미지의 색상이 번지는 현상을 뜻한다. 삼성전자와 포스텍 연구팀은 최근 색수차가 없는 '무색수차 메타렌즈' 개발에 성공했다. 또 홀로그래픽 디스플레이와 결합할 경우 다양한 광학 수차의 보완이 가능하다는 것도 증명했다. 향후 '무색수차 메타렌즈'와 '홀로그래픽 디스플레이'를 결합하면 콤팩트하면서도 높은 품질의 이미지를 제공하는 XR 웨어러블 기기 개발이 가능해지고 보다 다양한 카메라 및 센서에 활용할 수 있게 될 전망이다. 이번 프로젝트는 문석일 삼성전자 삼성리서치 박사와 노준석 포스텍 교수가 주도했으며, 포스텍 최민석, 김주훈, 신길수 연구원이 공동 1저자로 참여했다. 삼성전자는 이번 산학협력을 통해 혁신적인 아이디어 착안에서부터 실제 구현까지 검증하며 다양한 미래 광학 시스템 분야 개발과 차세대 디스플레이 기술 확보의 가능성을 확인했다. 삼성전자와 포스텍 연구팀은 기존 메타렌즈의 설계방식을 바꿔 색수차 저감 한계를 해결했다. 기존 연구는 색수차를 없애기 위해 단일 메타 구조체를 독립적으로 설계해 기판에 올려 합치는 방식을 사용했지만, 구조체 사이의 상호 관계를 고려하지 않은 탓에 색수차를 완전히 줄일 수 없었다. 이를 극복하기 위해 연구팀은 모든 메타 구조체 간의 상호 관계를 설계 단계에서부터 고려한 알고리즘을 개발해 색수차를 없애는데 성공했다. 그 결과 연구팀이 개발한 '무색수차 메타렌즈'는 얇은 두께를 유지하면서도 렌즈 크기를 기존보다 3~5배 키울 수 있게 돼, 넓은 시야각을 제공할 수 있게 됐다. 또 메타렌즈의 초점력을 가지면서도 이미지 품질이 더욱 향상되는 결과를 가져왔다. 렌즈는 일반적으로 화면이 커질수록 이미지 왜곡 현상 심해지는데, 이를 해결하기 위해 여러 장의 렌즈를 결합해 보정한다. 하지만, 연구팀은 단 한 장의 무색수차 메타렌즈와 홀로그래픽 디스플레이를 결합해 색수차 외에도 다양한 광학 수차를 해결하고 이미지 왜곡 없는 넓은 시야각의 영상을 확보하는데 성공했다. 특히 무색수차 메타렌즈와 홀로그래픽 디스플레이를 결합하면 일반 광학 렌즈와 디스플레이를 결합했을 때 보다 작고 가벼우면서도 피로도가 적은 가상 영상 제공이 가능하다는 것도 기술 검증을 통해 입증했다. 향후 무색수차 메타렌즈와 홀로그래픽 디스플레이를 결합한 장치는 XR 기기뿐만 아니라 일반 디스플레이, 카메라, 센서 등 다양한 광학 시스템의 성능 향상과 부피 저감에 활용될 전망이다. 삼성전자는 "앞으로도 미래를 선도할 혁신기술 연구를 지속할 계획"이라고 밝혔다.

2025.02.25 09:01장경윤

KT클라우드, 구독형 GPU에 엔비디아 'H200' 적용…고성능 AI 인프라로 고객 확보 가속

KT클라우드가 엔비디아의 최신 그래픽처리장치(GPU)를 인공지능(AI) 인프라에 적용하며 GPU 서비스를 한층 강화한다. AI 학습과 추론 워크로드 최적화를 앞세워 공공기관·스타트업 고객 확보에 나서기 위함이다. KT클라우드는 자사의 AI 훈련 서비스에 엔비디아 'H200'을 도입해 AI 인프라 성능을 개선한다고 24일 밝혔다. 기존 'H100' 기반의 AI 훈련 서비스에 최신 GPU를 추가해 연산 처리 성능과 전력 효율을 향상시키는 것이 이 프로젝트의 핵심이다. KT클라우드는 사용량 기반의 '서비스로의 GPU(GPUaaS)'를 제공하며 AI 학습과 추론 영역에 최적화된 인프라를 구축해왔다. 특히 AI 훈련 서비스는 대규모 GPU 노드 클러스터링과 동적할당 제어 기능을 통해 대량의 연산 작업을 효율적으로 처리할 수 있도록 설계됐다. GPU 노드 클러스터링은 여러 GPU 서버를 하나의 클러스터로 묶어 연산 성능을 극대화하는 기술로, 대규모 AI 학습에서 병렬 연산을 최적화하는 데 핵심적인 역할을 한다. 또 동적할당 제어 기능은 사용자의 작업량에 맞춰 자원을 실시간으로 배분하고 불필요한 자원 낭비를 줄여 최적의 GPU 성능을 유지한다. 이번 'H200' 도입은 이러한 기능을 보다 강화해 고성능 AI 학습 환경을 지원할 것으로 기대된다. 'H200'은 엔비디아 '호퍼(Hopper)' 아키텍처 기반의 최신 GPU로, 이전 모델인 'H100' 대비 연산 처리 능력과 전력 효율성이 개선됐다. 특히 메모리 대역폭이 확대돼 대규모 AI 모델 학습과 추론 성능을 극대화할 수 있는 것이 특징이다. KT클라우드는 GPU뿐만 아니라 신경망 처리 장치(NPU) 기반 AI 인프라도 확장하고 있다. 리벨리온과 협력해 'AI 서브 NPU' 서비스를 운영 중이며 오는 5월 출시될 리벨리온의 '아톰 맥스'를 적용해 소형언어모델(sLM) 성능을 검증할 계획이다. 또 미국 반도체 설계업체 암페어와도 AI 반도체 협력을 논의하며 기술 역량을 강화하고 있다. 공공 분야 대응도 강화한다. 회사는 올해 하반기 공공기관을 대상으로 AI 추론 전용 상품의 클라우드 서비스 보안 인증(CSAP) 절차를 진행할 계획으로 이로써 공공기관에서도 안전하게 AI 추론 서비스를 이용할 수 있도록 지원할 예정이다. 공용준 KT클라우드 클라우드본부장은 "이번 엔비디아 'H200' 도입으로 글로벌 수준의 AI 인프라를 확보하게 됐다"며 "앞으로 AI 인프라뿐만 아니라 AI운영(AIOps) 등 포트폴리오를 확대해 AI 기술 경쟁력을 강화하고 고객의 다양한 니즈에 대응해 나가겠다"고 말했다.

2025.02.24 11:21조이환

전자랜드, 그래픽카드 RTX 50 시리즈 100대 한정 판매

전자랜드는 기가바이트의 인기 그래픽카드 '지포스 RTX 50' 시리즈를 100대 한정으로 판매한다고 20일 밝혔다. 21일 오후 1시까지 전자랜드 공식 온라인몰인 전자랜드쇼핑몰의 이벤트 페이지에서 전자랜드 통합 멤버십 가입 회원 중 오프라인 행사에 참여할 인원을 추첨을 통해 200명 선정한다. 선정된 회원에겐 21일 오후 4시에 오프라인 행사 초대장이 발급된다. 전자랜드는 초대장을 지급한 200명을 대상으로 22일 오전 11시에 서울 용산구 전자랜드 랜드홀에서 기가바이트 그래픽카드 RTX 5090 시리즈와 RTX 5080 시리즈, 공개 예정인 기가바이트 그래픽카드 신제품 등 5개 모델 100대의 구매권 추첨 행사를 진행한다. 판매 가격과 수량, 신제품의 모델명은 행사 당일 공개한다. 전자랜드는 행사에 참여한 모든 참여자에게 전자랜드 포인트 2만 점도 지급하며, IT 가전 관련 각종 사은품을 추가로 증정한다. 전자랜드 관계자는 "소비자들이 최신 그래픽카드뿐만 아니라 CPU, 메모리카드 등 원하는 모든 PC 구성품을 사 갈 수 있도록 재고 확보 및 상품 확대에 힘쓰고 있다"며 "IT 가전 오프라인 행사를 계속 기획 중"이라고 말했다.

2025.02.20 16:48신영빈

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

[ZD브리핑] 美 반도체 관세 여부 주목…23일부터 한일 정상회담

통신사가 직접 'AI 스마트폰' 만들어 판다

이재명 대통령 "AI 혁신에만 전념할 환경 만들겠다"

'GPT-5' 황당 답변, 인력 유출 때문?…'위기' 오픈AI, 특단 대책 마련 급급

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.