• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'DGX-A100 GPU'통합검색 결과 입니다. (220건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

정부, AI바우처·인프라 지원…"기업 경쟁력 강화"

정부가 올해 인공지능(AI)바우처와 고성능컴퓨팅 지원 사업으로 국내 AI 역량 강화에 나섰다. 과학기술정보통신부와 정보통신산업진흥원은 20일 서울 코엑스 아셈볼룸홀에서 열린 '2025년 AI바우처·고성능컴퓨팅 지원사업' 통합 설명회에서 지원 계획을 이같이 밝혔다. 올해 AI바우처 지원 사업은 총 270억원 규모로 130개 내외 과제를 선정·지원한다. AI 솔루션을 보유한 공급기업은 연중 수시 모집한다. 수요기업은 수요처에 따라 일반, AI반도체, 소상공인, 글로벌 4개 분야로 구분해 공모 형태로 과제를 모집한다. 수요기업은 공급기업 중 자사에 적합한 기업과 AI 솔루션을 선택해 사업계획서를 제출하면 된다. 선정 평가를 통해 지원 대상으로 선정될 경우 AI바우처를 지원받을 수 있다. 고성능컴퓨팅 지원 사업은 올해 700개 과제를 목표로 한다. 정부와 민간 클라우드 기업 AI반도체 개발기업이 협력한다. 그래픽처리장치(GPU)와 신경망처리장치(NPU) 등 고성능 AI 연산 인프라를 제공한다. 학습용 GPU는 500개 과제를 지원한다. A100 2장, H100 1장, H100 2장 등으로 구성됐다. 국산 추론용 NPU는 200개 과제에 60탑스(TOPS), 120TOPS, 240TOPS를 제공해 산업 현장 적용성을 높인다. 정부는 기업이 해당 인프라를 통해 연구개발 비용을 줄이고 생산성과 품질을 높일 것으로 기대한다고 밝혔다. AI 솔루션 공급기업은 시장 진출 기회를 넓힐 수 있고 수요기업은 최적의 기술을 도입해 디지털 전환 속도를 끌어올릴 것이란 이유에서다. 과기정통부 김경만 AI기반정책관은 "첨단 AI 기술 확보와 경쟁력 향상을 위해 기업과 연구자가 필요로 하는 AI 컴퓨팅 인프라 공급은 필수"라며 "지원 사업을 통해 기업 생산성과 품질 개선으로 기업의 AI 활용 역량과 경쟁력이 제고되길 바란다"고 강조했다.

2025.02.20 13:30김미정

정부 "GPU 우선 확보…세계 수준 LLM 만든다"

과학기술정보통신부가 인공지능(AI) 컴퓨팅 인프라를 확충하면서 즉시, 단기, 중장기 등 3단계에 걸친 마스터플랜을 가동키로 했다. 20일 열린 국가인공지능위원회 3차 회의에서 과기정통부는 이같은 내용을 담은 'AI컴퓨팅 인프라 확충을 통한 국가 AI역량 강화 방안'을 발표했다. AI컴퓨팅인프라 특별위원회와 당정협의회에서 논의된 내용을 담은 것으로, 새해 경제정책방향에 따라 1분기 내 수립 예정이던 대책을 딥시크 돌풍으로 앞당겨 마련한 방안이다. 내년 상반기까지 GPU 1.8만장 확보...H100 416장 우선 지원 이 방안에 따라, 정부는 인공지능 컴퓨팅 인프라 확충 3단계에 걸친 마스터플랜을 가동한다. 당장 현장에 시급한 AI 컴퓨팅 수요에 대응하기 위해 광주AI데이터센터, 민간 클라우드 등 이미 국내에 보유하고 있는 GPU 자원을 활용해 우선 지원한다. 현재 국내에 있는 엔비디아 H100 880장 가운데 정부가 416장을 확보하고 있는데 이를 지원하겠다는 뜻이다. 이후 2026년 상반기까지 1만8천 장 규모의 첨단 GPU를 확충한다. 그 중 1만 장은 국가 AI컴퓨팅 센터를 중심으로 민관 협력을 통해 연내 확보하고, 나머지 8천여 장도 슈퍼컴퓨터 6호기 구축을 통해 확보할 예정이다. 마지막 중장기 단계로 2030년까지 국가AI컴퓨팅센터 내 국산 AI 반도체 비중을 50%로 끌어올리는 등 저전력 고성능의 국산 AI 반도체 경쟁력 제고도 지원한다. 민간의 AI 컴퓨팅 인프라 투자를 촉진하기 위해 세제지원, 전력 입지 등 제도적 기반도 강화한다. AI를 조세특례제한법 상 국가전략기술로 지정해 첨단 AI R&D 등 우대 공제율 30~50%, AI 통합투자 우대 공제율 15~35% 등에 대한 세제지원을 확대한다. 비수도권에 AI데이터센터 구축 시 전력계통 영향평가 우대를 검토하고, 항만배후단지, 공항지원시설 등으로 입지 다변화, 승강기 미술품 설치 최소기준 적용 등 전력 입지 시설에 관한 제도개선 등도 지속 추진한다. 국산 AI 반도체의 성장도 적극 지원한다. 국산 인공지능 반도체를 토대로 글로벌 수준의 개방형 HW-SW 기술생태계를 조성하여 대규모 고성능 시스템의 최적 운용을 뒷받침한다. 이를 통해 대규모 수요 창출과 동시에 기술개발 성과의 실증과 사업화도 지원한다. WBL 프로젝트 추진...AGI 구현 1조 단위 예타 검토 국가AI컴퓨팅센터 등 인프라 확충을 계기로 독자적 인공지능 모델 경쟁력 확보를 본격 추진한다. AI 국가대표 프로젝트인 가칭 월드베스트LLM(WBL) 프로젝트를 신규 추진할 계획이다. AI 정예팀을 선발하고 단시간에 세계 최고 수준의 대형언어모델을 개발할 수 있도록 필요한 데이터, GPU 등 핵심 인프라를 전폭 지원한다. 또한 AI 분야의 도전적인 문제를 해결하기 위해 국내외 최고 인재가 팀을 이뤄 겨루는 대규모 경진대회인 '글로벌 AI 챌린지'도 개최한다. 세계적인 AI 분야 석학들과 대국민 평가 등을 통해 최고 인재의 참여를 유도하고 입상자에 대해서는 창업 지원이나 WBL 정예팀 기업에 채용을 연계하는 등 파격적인 인센티브를 제공한다. 아울러 장기적으로는 생성형 인공지능을 넘어 범용인공지능(AGI) 구현에 필요한 핵심 원천기술 확보를 위해 1조원 규모에 달하는 기술개발을 추진한다. 고급 AI 인재 양성체계도 고도화한다. 지난해 뉴욕에 개소한 '글로벌 AI 프론티어랩'을 영미권을 넘어 유럽 등으로 확대하는 방안을 추진하여 세계를 선도하는 연구그룹과의 공동연구를 강화한다. 이와 더불어 국내 AI 신진연구자의 창의도전적 연구를 지원하는 프로그램도 신설한다. 기업이 원하는 실전 역량을 갖춘 최고 인재를 양성하기 위해 교사, 교재, 수업 없이 실전형 혁신 교육을 지원하는 '이노베이션 아카데미'를 확대하고, '기업-대학 협력형 AX 대학원' 신설을 추진할 계획이다. 글로벌 우수 인재 유치도 대폭 지원한다. WBL 프로젝트와 연계해 정예팀 기업이 필요로 하는 글로벌 인공지능 핵심 인재를 국내에 유치할 경우 인건비, 연구비, 체재비 등 파격적인 지원방안을 적극 검토할 계획이다. 이밖에 '우리 AI 컴퓨팅 인프라'를 통해 '우리 AI 인재'가 개발한, '우리 AI 모델'로 국가 AI 전환을 가속화한다. 우수한 국산 AI 모델의 초기시장 창출을 위해, 우리의 독자적 특화 데이터를 학습한 생성형 인공지능을 의료(맞춤형 치료 건강관리), 법률(대국민 법률정보 제공), 공공(행정업무 효율화) 등 다양한 분야에 접목하는 부처 협력형 선도 프로젝트를 추진한다. 유상임 과기정통부 장관은 “AI 패권경쟁은 기업 간 대결을 넘어 국가가 전면에 나서는 경쟁으로 변화하고 있다”며 “우리의 대응이 1년 늦어지면 경쟁력은 3년이 뒤처진다는 각오로 AI 컴퓨팅 인프라와 핵심인재 육성 확보에 전폭적이고 속도감 있는 투자를 추진하겠다”고 말했다. 이어, “우리나라가 이미 보유한 잠재력을 최대한 활용하고 부족한 부분은 빠르게 보완하는 등 국가의 인공지능 역량을 강화해 인공지능 3대 강국으로 도약하겠다”고 밝혔다.

2025.02.20 11:30박수형

글로벌 톱수준 LLM 개발 추진...데이터 개방 확대

정부가 세계 최고 수준의 대형언어모델(LLM) 개발을 추진한다. 이를 위해 데이터와 GPU 컴퓨팅 인프라 등 가용 가능한 자원을 집중한다는 방침이다. 국가인공지능위원회는 20일 3차 위원회 회의를 열어 이같은 내용을 담은 'AI컴퓨팅 인프라 확충을 통한 국가AI역량 강화방안' 등을 논의했다. 위원장을 맡고 있는 최상목 대통령 권한대행 부총리는 모두발언을 통해 “글로벌 AI환경이 급변하면서 위기감이 고조되고 있지만 우리에게는 새로운 기회로, AI 3대 강국 도약을 위해 민관이 힘을 모아 국가 AI역량 강화를 빠르게 추진해야 할 중대한 시점”이라며 “정부는 빠른 시일내에 세계 최고수준의 AI모델을 개발할 수 있도록 집중 지원하고, AI 핵심인재 양성과 해외 우수인재 유치를 강화하겠다”고 밝혔다. 이어, “컴퓨팅 자원과 데이터 등 인프라를 확충하고, AI 활용과 산업화에서 세계 1등이 될 수 있도록 AI 스타트업 육성과 시장 창출을 지원하겠다”고 밝혔다. 민간전문가 발제에서는 최수연 네이버 대표가 글로벌 AI현황 및 국내 대응방향을 주제로 트럼프 행정부 AI정책과 중국 딥시크AI 개발이 우리 산업계에 주는 시사점을 소개하고, 민간 AI원천기술 개발을 위한 정부의 인프라 투자와 산업전반의 AI전환 지원을 강조했다. 이날 관계부처에서는 과학기술정보통신부가 'AI컴퓨팅 인프라 확충을 통한 국가AI역량 강화방안', 중소벤처기업부가 'AI스타트업 육성을 통한 AI 활용 확산방안', 개인정보보호위원회가 'AI데이터 확충 및 개방 확대방안' 등의 안건을 발표했다. 월드베스트 LLM 프로젝트 추진 미국과 중국 등 치열한 경쟁이 전개되는 글로벌 AI 생태계에서 우리나라의 AI 경쟁력을 획기적으로 제고할 수 있도록 세계 수준의 AI 모델 개발과 최고급 인재 양성을 추진하고, AI 컴퓨팅 자원 및 데이터 등 인프라를 확충하고 전면적인 AI 산업화와 국가 AI 전환을 가속화한다. 먼저 'AI국가대표 정예팀'을 선발해 글로벌 톱 수준의 LLM 개발을 목표로 데이터, GPU 등 연구자원을 집중 지원하는 가칭 '월드 베스트 LLM 프로젝트'를 추진하기로 했다. 정예팀이 필요한 글로벌 핵심인재를 유치할 수 있도록 연구비 등 지원을 확대한다. 우수 AI 모델은 공공과 민간 영역으로 활용을 확산하고, AI 연구자들과 개방형 혁신을 가속화할 수 있는 공유 체계를 마련한다. 이와 함께 미래 AI 경쟁력 확보를 위해 1조원 규모의 범용 인공지능(AGI, 예타진행) 핵심원천기술 확보에 도전한다. 최고급 AI 인재를 양성 확보하기 위해 AI분야 도전적 문제를 해결하는 '글로벌 AI챌린지'를 개최를 추진하고, 지난해 미국에 개소한 '글로벌 AI 프론티어 랩'을 유럽 등 다른 국가로 확대할 계획이다. 아울러 국내 AI 신진연구자를 집중 지원하는 프로그램을 마련하고 기업이 원하는 AI 융합 인재를 양성하기 위해 산학 협력형 AX 대학원 신설을 추진하고, 혁신형 교육을 강화할 계획이다. 슈퍼컴 6호기에 GPU 1.8만장 확보...학습 데이터 추가 개방 현장의 시급한 AI컴퓨팅 수요에 신속히 대응하기 위해 내년 상반기까지 국가AI컴퓨팅센터, 슈퍼컴 6호기에 총 1.8만장 규모의 컴퓨팅 자원(GPU)을 확보한다. 이와 함께 AI 밸류체인 전반에 세제지원을 강화하고 전력, 입지 관련 제도개선 등으로 AI 데이터센터에 대한 민간투자를 활성화한다. 국가 AI컴퓨팅 센터를 통해 국산 AI반도체와 AI 모델을 패키지로 실증하고, AI반도체 HW-SW기술력 강화를 지원한다. AI 학습을 위한 양질의 공공 민간데이터를 확충하고 개방을 확대한다. 그간 자율주행 분야에만 허용되었던 비정형 원본데이터(영상 등) 활용을 사회적 산업적으로 필요한 분야로 확대하고 AI 연구에 필요한 기간동안 데이터를 안정적으로 활용할 수 있도록 개인정보 활용특례를 마련한다. 또 범죄 예방 등 공익적 AI개발을 위해 개인정보를 활용할 수 있도록 적법 처리근거를 확대한다. 의료, 국방 등 민감분야의 합성데이터와 생성형 AI 고도화를 위한 미디어, 산업 제조, 금융 등 분야별 특화 데이터를 개방한다. 공공데이터 중 AI 수요가 높은 비정형데이터, 합성데이터 등을 국가중점데이터로 적극 개방한다. 공공기관의 가명처리 내부 운영체계를 개선하고, 공공기관 경영평가 등에 가명정보 제공실적을 반영해 공공데이터 개방을 촉진한다. AI 선도 프로젝트 가동...AI 서비스 확산 국내 기업이 개발한 AI 서비스가 국내외 시장에 조기 확산되어 수요 창출과 경쟁력 강화로 이어질 수 있도록 AI 선도 프로젝트를 추진한다. 의료, 법률, 미디어 문화, 재난 안전 등 산업 파급력과 대국민 체감이 높은 분야를 중심으로 부처 협업을 통해 생성형 AI 기반의 서비스를 개발한다. 이와 함께 민관 협력 이노베이션 사업 등을 활용해 대기업과 스타트업이 협업해 특정 산업 문제해결에 특화된 분야별 AI서비스를 개발하고, 산업 업종별 자율제조 선도 프로젝트의 성공 사례를 스마트 공장 구축을 통해 확산할 계획이다. AI 공급 역량 강화를 위해 AI 스타트업의 성장을 지원한다. 기업 간 협력 방식의 AI 모델 개발을 지원해 제조, 금융 등 분야별 AI서비스 전문 스타트업을 육성하고, 제조 AI 전문기업 100개를 지정해 기업당 최대 100억원 규모의 융자 보증 등 자금, 인력, 판로 확대 등을 집중 지원한다. 이와 함께 올해 융자, 보증 등 중소기업 신규 유동성 공급총량의 60%(5.7조원)를 AI 반도체 등 혁신성장 분야에 집중 지원하고, 2027년까지 정부, 민간 자금 등 약 3조원 규모의 AI 집중펀드를 조성해 AI 스타트업에 대한 자금지원을 대폭 확대한다.

2025.02.20 11:30박수형

엘리스클라우드, 오픈소스 AI 생태계 최적화 솔루션 선보여

엘리스그룹(대표 김재원)의 AI 특화 클라우드 '엘리스클라우드'가 오픈소스를 포함한 다양한 범용 AI 모델을 클라우드 환경에서 안전하고 편리하게 사용할 수 있는 솔루션을 20일 공개했다. 엘리스클라우드는 기존 머신러닝(ML) API 기능을 업그레이드해 오픈소스 AI 모델을 맞춤형 AI 인프라에서 활용할 수 있는 'ML API 라이브러리' 기능을 선보였다. 이번 업그레이드의 특징은, 별도의 설치, 설정 없이 다양한 오픈소스 AI 모델도 편리하게 쓸 수 있는 최적화된 GPU·NPU 환경을 제공하는 것이다. API 기반 솔루션이 제공되는 일반 상용 AI 모델과 달리 오픈소스 AI 모델은 사용하는 모델에 따라 환경을 설정해야 하고, 원하는 특정 작업에 맞추는 파인 튜닝과정이 필요하다. 이런 어려움을 해소하기 위해 엘리스클라우드는 GPU·NPU 환경을 각 오픈소스 모델에 최적화하고, 최적화된 API를 제공한다. 딥시크의 R1, 메타의 라마 등 오픈소스를 포함한 다양한 AI 모델에 따라 맞춤형으로 구성한 고성능 AI 인프라 환경에서 AI 챗봇 등을 개발하고 관리, 배포까지 간편히 할 수 있다. 엘리스클라우드가 협약을 맺은 퓨리오사AI, 리벨리온의 최신 NPU를 활용한 고성능 컴퓨팅 서비스도 제공한다. 엣지데이터센터인 엘리스 AI PMDC(Portable Modular Data Center, 이동형 모듈러 데이터 센터) 기반의 프라이빗 클라우드 환경에서 실행돼 민감한 데이터의 외부 유출도 방지한다. 엘리스 AI PMDC는 모듈 단위로 구성이 가능해 물리적 격리가 가능하고, AI 수요 변화에 민첩하게 대응하는 것은 물론 전력효율지수(PUE)를 1.27까지 낮춰 뛰어난 에너지 효율도 갖췄다. 엘리스클라우드는 연내 운영을 목표로 1기당 1MW급 AI PMDC를 설계 및 구축하고 있다. 고밀도 전력과 발열을 안정적으로 관리하기 위해 공간 최적화 설계와 직접액체냉각(DLC) 기술을 도입, 업계 최고 수준인 랙 당 160kW전력으로 엔비디아 B100을 비롯한 최신 고성능 GPU를 지원하도록 설계된다. 김재원 엘리스그룹 대표는 "현재 고성능 GPU H100 5천장까지 수용할 수 있는 AI PMDC 설계·구축했고, 이는 국내 클라우드 기업 중 최대 규모일 것으로 예상한다"며 "엘리스클라우드 사업 본격화를 위해 GPU 확보에 더불어 R&D를 통한 기술 혁신과 투자에 집중하겠다"고 밝혔다.

2025.02.20 11:21백봉삼

정부·여당, AI 경쟁력 확보에 '2조 추경' 운 띄웠다

당정이 인공지능(AI) 인프라 확충을 위해 2조원 규모의 추가경정예산 논의를 띄웠다. 연내 GPU 1만장 확보를 통한 국가AI컴퓨팅센터 개소에 이어 내년 상반기까지 GPU 보유량을 2만장으로 늘린다는 목표다. 18일 오후 국회서 열린 AI 경쟁력 강화 당정협의회가 끝난 뒤 브리핑을 통해 과학기술정보방송통신위원회 여당 간사를 맡고 있는 최형두 의원은 “지난해 여야가 극심한 정쟁 속에서도 상임위에서 합의한 AI 인프라 확충 예산 증액 규모 1조2천억원에 8천억원을 더한 2조원 정도의 인프라 강화 예산에 정부의 큰 결단이 필요하다”고 밝혔다. 김상훈 국민의힘 정책위의장은 “GPU와 같은 첨단반도체 기반 AI 컴퓨팅 인프라는 국가 발전과 산업 경쟁력을 높이는 핵심 성장동력이자 국가 전략자산이라는 측면에서 민관 협력을 통해 국가 AI 인프라 조기 확충을 달성하고 AI 연구개발 환경과 AI 컴퓨팅 생태계 전반의 성장기반 확대가 필요하다는 데 공감했다”고 강조했다. 이어, “국가AI컴퓨팅센터를 통해 구축된 GPU와 멀티모달을 지원하는 다양한 학습데이터를 연구계와 산업계에 지원해 우리나라의 자체 AI기반모델이 GPT와 같은 세계적 수준에 버금가는 AI 모델이 될 수 있도록 집중 지원하겠다”고 덧붙였다. AI와 같은 첨단기술 분야 인재 양성을 위한 무상교육 도입 방안도 논의됐다. 김 의장은 “국가첨단전략기술을 연구하는 청년들이 마음껏 도전할 수 있도록 해당 학과 대학생들에게 획기적인 장학 제도를 도입하겠다”며 “중장기적으로는 무상교육이 실현될 수 있도록 관련 사항을 적극 추진하기로 했다”고 했다. 그러면서 “현재도 국가장학생 제도가 있는데 첨단전략기술 분야에 강화된 국가장학생 제도를 도입하겠다는 뜻이로, 인재 육성이 필요하니 중장기적으로 무상교육을 추진하겠다는 것”이라며 “교육당국 협의가 전제되어야 하는데, 국내 교육기관에서 졸업한 뒤 국내산업에 전제한다는 종사에 따라 무상교육을 제공하고 해외유학도 필요하다면 지원할 수도 있다”고 설명했다.

2025.02.18 17:49박수형

최상목 대행 "연내 GPU 1만장...내년 상반기 GPU 8천장 슈퍼컴 구축"

최상목 대통령 권한대행 부총리가 17일 “연내 고성능 GPU 1만장을 확보해 국가AI컴퓨팅센터 서비스를 조기 개시하고 내년 상반기에는 GPU 8천장 상당의 슈퍼컴 6호기를 구축해 연구계를 지원하겠다”고 밝혔다. 최상목 권한대행은 이날 오후 정부서울청사에서 열린 제3차 AI컴퓨팅인프라특별위원회를 열어 “최근 AI 산업 패권 경쟁이 가열되는 가운데, 경쟁 구도도 기업 간 대결을 넘어 국가가 전면에 나서는 '혁신생태계 간 경쟁'으로 바뀌고 있다”며 이같이 말했다. 그러면서 “정부와 민간이 한 팀이 되어 힘을 모으면 과거 광대역 통신망을 구축해 우리나라가 IT 강국으로 부상하였듯이 AI컴퓨팅 인프라를 기반으로 인공지능 3대 강국으로 도약할 것”이라고 강조했다. 국가AI위원회 산하 AI컴퓨팅인프라특별위원회는 국가AI컴퓨팅센터를 비롯해 정부에서 추진 중인 AI컴퓨팅 인프라 관련 현안을 민관이 함께 논의하고 대응 방안을 모색하기 위해 구성됐다. 이날 회의는 지난달 22일 국정현안관계장관회 후속 조치로 '국가AI컴퓨팅센터 구축(SPC 설립) 실행계획' 관련 현안 점검을 위해 개최됐다. 미국 스타게이트 프로젝트, 프랑스 AI 데이터센터 구축 계획 등에서 보듯 최근 AI컴퓨팅 인프라 역량은 국가별 AI 생태계의 경쟁력을 결정짓는 척도로 부상하고 있으나 첨단 반도체가 집적된 AI컴퓨팅 인프라는 적정 투자 규모를 사전에 예측하기 어려우며, 기술 시장의 변화가 빠르다. 이에 따라, 정부는 앞으로 특별위원회에서 수시로 추진 상황을 점검하고, 각종 현안에 유연하게 밀접 대응할 계획이다. 이날 회의에 참석한 업스테이지의 김성훈 대표는 범용 AI(AGI) 강국으로 가는 길을 주제로 인재, GPU의 중요성과 우리나라가 보유한 역량을 강조하며 AGI 강국으로 도약하는 데 필요한 지원방안에 대해 발표했다. 이어, 배경훈 LG AI연구원장은 최신 AI 기술 동향과 한국형 AI 발전 방향을 주제로 낮은 비용으로 동등 수준의 성능 확보가 가능한 추론 강화 모델에 대해 설명하고, 이를 바탕으로 개발된 LG의 AI모델 엑사원 성과를 소개했다. 민간의 발표와 함께 국가AI컴퓨팅센터 관련 현안으로 사업 공모와 사업설명회 개최 등 사업 추진 경과와 GPU, 서비스, 입지, 전력, 정책금융 프로그램 등 주요 항목별 현안 및 대응 방향에 대해 논의했다. 정부는 이번 특별위원회를 통해 제시된 정책 제언을 바탕으로 AI컴퓨팅 인프라 확충 정책을 보완해나갈 계획이다.

2025.02.17 15:40박수형

AI 인프라 선도 나선 에스넷시스템, GPU 클라우드 서비스 강화

에스넷시스템이 싱가포르의 스카이랩(SkyLab)과 손잡고 국내 인공지능(AI) 및 그래픽카드(GPU) 클라우드 시장 공략에 나선다. 에스넷시스템(대표 박효대, 한상욱)이 싱가포르 스카이랩의 한국법인 샌드힐컨설팅과 GPU클라우드 서비스 'XR클라우드'를 위한 업무협약(MOU)을 체결했다고 14일 밝혔다. 이번 협약을 통해 에스넷시스템과 샌드힐컨설팅은 스카이랩의 클라우드 서비스 'XR클라우드'를 활용해 국내 시장에서 AI 및 GPU 클라우드 서비스를 공동으로 제공할 계획이다. 서비스형 그래픽카드(GPUaaS)는 기업이 AI 서비스 개발이나 활용을 위해 GPU를 직접 구매하지 않고, 클라우드를 통해 필요한 만큼 빌려 쓰는 서비스다. 공급이 부족하고 가격이 높은 GPU를 부담 없이 이용할 수 있어, 대기업뿐만 아니라 중소기업 및 스타트업도 경제적인 비용으로 고성능 컴퓨팅 자원을 활용할 수 있다. XR클라우드는 클라우드 기반으로 엔비디아(NVIDIA)의 최신 GPU, 특히 H100, H200을 활용한 고성능 컴퓨팅 서비스를 제공한다. 이는 AI 연구 및 개발에 필요한 강력한 컴퓨팅 자원을 필요한 만큼 유연하게 사용할 수 있는 서비스로, 기업이나 연구기관들이 AI 관련 프로젝트를 효율적으로 수행할 수 있도록 돕는다. 주요 서비스로는 직접 제어 가능한 GPU 서버, 다양한 GPU 옵션을 제공하는 가상머신 그리고 AI 작업을 쉽게 관리할 수 있는 GPU 지원 매니지드 쿠버네티스 클러스터가 포함되어 있다. 에스넷시스템은 국내 제조, 금융, 교육, 의료, 공공기관 등 다양한 산업을 대상으로 AI 인프라 구축, 운영, 컨설팅 서비스를 성공적으로 제공해왔다. 이를 바탕으로 XR클라우드 서비스 리셀링을 통해 GPU 클라우드 시장을 확대하고, GPUaaS 서비스 모델을 확보하며 경쟁력을 강화할 계획이다. 또한, 엔비디아, 델, 시스코 등 주요 벤더와의 파트너십을 바탕으로 AI 인프라 구축을 지원하고, 하이브리드 환경에서의 운영 및 유지보수 서비스까지 제공함으로써 고객의 AI 솔루션 요구를 종합적으로 충족할 예정이다. 샌드힐컨설팅은 갖고 있는 XR클라우드 서비스를 국내 주요 대기업 연구기관, 대학 및 정부 연구기관, 금융권, AI 서비스 개발사 등 다양한 분야의 고객들에게 제공할 방침이다. 이를 통해 각 산업별 특성에 맞는 맞춤형 서비스와 기술 지원을 제공하며, 국내 시장에 최적화된 GPU 인프라와 종합적인 클라우드 서비스를 제공하여 한국의 AI 혁신을 가속화할 계획이다. 에스넷시스템 유인철 AI/클라우드 센터장은 "XR클라우드 서비스와의 협력을 통해 고객사에게 최적화된 AI 및 GPU 클라우드 서비스를 본격적으로 제공할 수 있게 되었다"며 "에스넷시스템은 주요 IT 벤더들의 넘버원 파트너로서의 기술력과 클라우드허브 연계 서비스, 전문적인 운영 유지보수 역량을 바탕으로 AI인프라·서비스 통합사업자로서 자리매김할 수 있을 것으로 기대되며, 고객별 맞춤형 AI 솔루션을 제공하여 연구개발 및 서비스 구현을 성공적으로 지원할 것"이라고 밝혔다. 김장수 샌드힐컨설팅 대표는 "국내 주요 대기업, 연구기관, 대학 및 정부 연구기관, 금융권, AI 서비스 개발사 등 다양한 분야의 고객들에게 최적화된 GPU 인프라와 종합적인 클라우드 서비스를 제공함으로써 한국의 AI 혁신을 가속화하겠다"며 "각 산업의 특성에 맞는 맞춤형 서비스와 기술 지원을 통해 고객들이 연구개발과 서비스 구현을 성공적으로 이끌어갈 수 있도록 적극 지원할 것"이라고 밝혔다.

2025.02.14 11:32남혁우

김영식 NST 이사장 "올해내 마일스톤형 기술이전 시범사업 2건 추진"

국가과학기술연구회(NST)가 '마일스톤형' 기술이전 지원 사업을 추진한다. 올해 내 시범사업으로 2건을 선정한다. 김영식 NST 이사장은 11일 취임이후 처음으로 기관 중점 업무 방향을 설명하는 기자간담회를 개최했다. 이 자리에서 김 이사장은 "기술 개발이 이루어진 상태에서의 기술이전은 상용화에 시간이 너무 걸린다"며 "원천기술 개발 단계에서 기술이전을 먼저 하는 것"이라고 말했다. '마일스톤'은 이전된 기술로 생산된 제품 매출에 따라 기술료를 받는 계약 형태다. 기술 개발 초기 민간 참여가 가능하고, 매출이 발생해야 기술료를 징수하기 때문에 기업 부담도 줄일 수 있다. 대표적인 사례로 한국과학기술연구원(KIST)이 지난해 치매치료제 후보물질로 기술 이전한 5천억 원 대의 초대박 계약을 꼽았다. 바이오 분야처럼 먼저 기술이전 한 뒤 1상, 2상 등 임상 등을 단계별 패키지 형태(연구비, 법률 지원, 사업화컨설팅 등)로 지원해 대형 기술이전 성과를 내겠다는 것이다. 이날 간담회에서는 ▲임무중심형 글로벌 톱 전략연구단 확대 ▲출연연 정체성 혼란 타개 방안 ▲연구성과중심제(PBS) 개선 방안 ▲기술사업화 방안 ▲출연연 기관장 임기만료 3개월 전 공모 시스템화 ▲딥시크 대응 방안 등이 거론됐다. 이와 함께 출연연 현안으로 꼽히던 ▲기술이전이 어려운 이유 ▲경영진(이사) 여성 비율 ▲감사위원회 전문성 등에 대한 의견이 개진됐다. 김 이사장은 이날 기관운영 방향을 설명하며 'R&D 완결성'을 여러 차례 언급했다. 연구기획 단계부터 연구성과 활용의 최종 목표 달성을 고려하는 완결성 높은 연구개발 지원으로 과학기술 혁신을 끌어내겠다는 것이다. 이를 위해 임무중심형 글로벌 톱 전략연구단 예산을 지난 해 대비 25% 늘린 1천250억 원을 잡아 놨다. 연구단은 국가전략형과 미래도전형으로 나눠 10개 단을 선정한다. 김 이사장은 또 PBS에 대해 "연구원 사이에 찬반이 있다. 문제는 과제 파편화라고 본다"고 말했다. 이에 대해 이진환 정책기획본부장은 "이를 해결하기 위해 예산과 과제 구조를 바꿔 해결하자는 것이 과기정통부 의중"이라고 부연 설명했다. 김 이사장은 또 기관장 선발과 관련 과기정통부와 함께 정상적으로 진행 중이라고 밝혔다. NST는 현재 한국한의학연구원장 후보 선발은 오는 13일 이사회에서 진행한다. 또 한국철도연구원과 한국지질자원연구원은 현재 공모가 진행 중이고, 한국생명공학연구원은 조만간 최종 후보를 선임할 예정이라고 덧붙였다. 이외에 NST는 총괄 TLO 조직 강화를 위해 기술사업화추진단을 최근 신설했다. 출연연 사업화 공동추진 TF도 확대 운영하기로 했다. 한편 딥시크 및 AI 대응과 관련해서는 유상임 과기정통부 장관이 올해 내 H100급 GPU 1만 5천 대를 확보할 계획인 가운데 출연연 내 각 연구자들이 과제를 통해 보유중인 GPU 숫자를 파악 중인 것으로 확인됐다. 김 이사장은 "과학기술은 1등만 살아남는 구조"라며 "해외거점을 8곳 지정할 예정인데, R&D에 대한 충분한 보상과 대우를 할 수 있는 환경을 갖추는 일도 중요하다"고 언급했다.

2025.02.11 21:15박희범

오세훈 서울시장 "5천억 AI 펀드 신설…GPU 지원 확대"

서울특별시가 인공지능(AI) 민간 투자를 위해 5천억원 규모 AI 펀드를 신설한다. 글로벌 AI 경쟁력 강화를 위한 전략적 조치다. AI 개발 핵심 인프라인 그래픽처리장치(GPU) 공급 확대도 추진한다. 11일 오세훈 서울시장은 코엑스 그랜드볼룸에서 열린 'AI 서울 2025' 컨퍼런스에 참석해 이같은 전략을 밝혔다. 그는 모든 산업을 AI 중심으로 재편한다는 정책 기조를 추진하겠다고 재차 강조했다. 오 시장은 "향후 2년간 AI 산업의 민간 투자 활성화를 위해 5조원 투자를 목표로 뒀다"며 "5조원 중 절반을 확보한 상태"라고 설명했다. 이어 "민간에 5천억원을 우선 투입하겠다"며 "이 투자금은 AI 모델 학습과 추론에 필요한 컴퓨팅 자원 확충에 사용될 예정"이라고 말했다. 오 시장은 투자 규모가 충분치 않다는 점을 인정했다. 그는 "미국 투자 규모와 비교하면 약 50배 작은 규모"라며 "이번 투자가 민간기업에 새로운 출발점이 되길 바란다"고 말했다. 서울시는 AI 3대 핵심 요소인 데이터, 알고리즘, 컴퓨팅 관련 기업에 집중 투자할 계획이다. 특히 전 산업에 걸쳐 AI 기술이 융합되는 추세를 지속적으로 모니터링하면서 AI 적용·응용 기업 지원도 강화할 방침이다. 또 오 시장은 GPU 서버 인프라를 확대해 AI 모델 학습 시간을 단축하고, 지속 가능한 연구개발(R&D) 환경을 조성할 방침이라고 강조했다. AI 인재 1만 명 양성…AI 허브 10배 확장 계획 서울시는 매년 AI 인재 1만 명을 양성해 AI 인력 수요에 대응한다고 발표했다. 청년취업사관학교 인재 4천 명과 대학 인재 6천 명 양성을 계획한 상태다. 청년취업사관학교는 2021년부터 영등포 캠퍼스 시작으로 현재 20개소 캠퍼스가 운영 중이다. 그동안 디지털 혁신 인재 7천 명 배출, 누적 취업률 75%를 기록했다. 올해 25개 캠퍼스 조성 완료와 AI 인재 양성을 목표로 교육과정을 재편했다. 서울시는 올해 AI 등 이공계 분야 석사과정 장학금 제도를 신설해 매년 확대한다고 밝혔다. 이를 통해 서울형 인재 발굴 지원체계를 강화할 계획이다. 오 시장은 "그동안 딥테크 분야 등 기업 인재를 육성해 온 서울 대학 캠퍼스타운 사업은 올해부터 캠퍼스타운 창업기업과 연계를 통한 AI 기업 인재 육성 기능을 강화했다"며 "지역혁신중심 대학지원체계(RISE) 사업 연계와 AI 관련 학과 지원으로 연간 6천 명 AI 인재를 양성할 계획"이라고 설명했다. 서울시는 현재 AI 허브보다 규모를 10배 확장한 '서울 AI 테크시티'를 양재 AI 혁신지구에 조성한다고 밝혔다. 2028년 착공을 목표로 뒀다. 국내외 대학원과 연구기관뿐 아니라 문화·주거공간까지 갖춘 복합공간으로 이뤄질 방침이다. 오 시장은 "AI 인재들이 창의적인 연구에만 전념할 수 있는 '서울 속 AI 산업도시'를 만들겠다"고 강조했다. 이 외에도 서울시는 산업 간 융복합, 글로벌화, 시민확산, 행정혁신 등을 핵심 전략 과제로 제시했다. 오 시장은 "서울에서도 오픈AI나 딥시크 수준의 개발이 이뤄질 수 있도록 추격조를 구성하는 전략적 지원을 아끼지 않을 것"이라고 밝혔다.

2025.02.11 10:50김미정

하정우 센터장 "정부 GPU 확보 계획 긍정적…관건은 배분 방식"

"한국에서도 '딥시크-R1'가 나올 수 있습니다. 국내 기업은 이미 우수한 인공지능(AI) 기술을 갖췄기 때문입니다. 이미 딥시크-R1 개발 소스 80%도 공개된 상태입니다. 정부도 연내 그래픽처리장치(GPU) 1만5천장 확보를 약속했습니다. 앞으로 이 자원을 어떻게 배분할지가 관건일 것입니다." 네이버클라우드 하정우 AI혁신센터장은 국회의원회관에서 열린 '2025 디지털 정책포럼: AI 3대 강국 도약을 위한 혁신 생태계 조성 방안' 패널 토론에서 이같이 6일 밝혔다. 그동안 국내 기업이 AI 기술 축적을 이뤘다면 앞으로 정부가 GPU 등 인프라를 효율적으로 분배해야 한국형 딥시크-R1 탄생을 이끌 수 있다는 설명이다. 앞서 정부는 글로벌 인공지능(AI) 개발 트렌드에 맞춰 연내 GPU 1만5천 개를 확보하겠다고 발표했다. 애초 국가AI위원회 출범 당시 2030년까지 GPU 3만 장을 도입할 예정이었지만 최근 중국 딥시크가 AI 생태계에 돌풍을 일으켜 계획을 앞당겼다. 하정우 센터장은 "AI 혁신 핵심은 인프라의 규모 확장에 있다"며 "정부가 GPU를 확보한 후 이를 어떻게 잘 배분할지가 관건"이라고 강조했다. 하 센터장은 GPU를 무조건적으로 모든 기업에게 동일하게 나눠주는 것보다 사용 목적, 기술력 등을 고려해 효율적으로 공급하는 것이 바람직하다고 주장했다. 예를 들어 GPU 2만장을 2만개 기업에게 한 장씩 나눠주는 방식으로는 혁신을 만들 수 없다는 전망이다. 하 센터장은 GPU 배분 방식을 제안했다. 우선 GPU 절반은 네트워크로 연결된 기업·연구기관에 일정 기간 집중 활용되는 식이다. 이를 통해 AI 기술에 필요한 기초 연구들이 활발히 진행될 수 있다는 이유에서다. 나머지 GPU는 AI 스타트업과 학계에 지원하는 방식이다. 기업과 학계가 오픈소스 모델 기반으로 모델의 추가 학습과 파인튜닝을 할 수 있게 돕기 위해서다. 그는 GPU의 안전성도 보장돼야 한다고 강조했다. 사용자들이 쉽고 편리하게 GPU 같은 고성능 인프라를 활용할 수 있는 환경이 조성돼야 국내 AI 생태계 경쟁력을 강화할 수 있다는 이유에서다. 하 센터장은 "GPU는 고장이 잦은 장비"라며 "국가 AI 데이터 센터 같은 대규모 인프라가 구축될 경우 이를 안정적으로 운영할 수 있는 관리 체계가 반드시 마련돼야 한다"고 주장했다. 하 센터장은 AI 인재 양성을 위한 인건비 지원 방안도 제안했다. 기업과 학계, 정부가 협력하는 인재 육성 체계를 구축해야 한다고 말했다. 그는 "기업과 학교가 인건비를 50%씩 분담하고, 정부가 매칭 펀딩을 통해 추가 지원하면 AI 과학자들이 공공 분야에 기여할 수 있는 기반이 마련될 것"이라고 설명했다. 이어 "인건비 외에도 AI 연구자들에게 충분한 컴퓨팅 자원을 지원하는 것이 중요하다"며 "GPU를 적극 지원하면 연구자들의 동기부여와 연구 성과를 동시에 끌어올릴 수 있을 것"이라고 강조했다.

2025.02.06 17:54김미정

에너지기술연구원, 연구지원 부서에서 기술이전 계약따내 '화제'

정부출연연구기관 설립이래 처음으로 연구지원 부서에서 기술이전 계약 성과가 나왔다. 한국에너지기술연구원은 (주)아이티메이트에 'AI 활용 규정 챗봇 시스템'(검색증강생성 기술)을 기술이전하기로 하는 계약을 체결했다고 6일 밝혔다. 이전 기술은 AI를 활용한 채팅형 규정 세부 내용 답변 시스템이다. 사용자가 규정과 관련된 질문을 하면 시스템이 대규모 언어 모델(LLM)과 검색 증강 생성(RAG) 기술을 통해 최적의 답변을 도출하는 방식이다. 에너지연 송영배 지식정보실장은 "이를 이용하면 규정 검색에 들이는 시간을 10분의 1 수준으로 줄일 수 있다"며 ""출연연 연구지원 부서에서 개발한 기술이 기업에 이전되기는 처음"이라고 말했다. 이 AI 챗봇 시스템은 "규정을 속속 들여다본다"는 의미에서 '규봄이'라고 이름 지었다. 미리 학습된 데이터만 활용하는 대규모 언어 모델은 답변이 어려울 때 허위 정보를 제공하는 경우가 있어 이를 보완하기 위해 검색증강 생성 기술을 도입했다는 것이 개발진 설명이다. 규정 전문을 단어 수준으로 쪼개고, 쪼갠 단어를 수치화해 사용자의 질문을 수치화한 값과 가장 근접한 결과를 도출하는 기술이다. 검색 증강 생성 기술이 도출한 결과는 대규모 언어 모델에 전달되고 다시 문장 형태로 변환돼 사용자에게 제공된다. 에너지연은 현재 152개의 규정을 보유하고 있다. 단어 검색을 통해 원하는 정보를 찾고 정확한 의미를 해석하기에는 많은 시간이 소요된다. 반면 해당 시스템을 이용하면 원하는 규정을 즉시 확인할 수 있고 문장의 의미도 함께 해석돼 규정 검색에 들이는 시간을 대폭 줄일 수 있다. 또 검색 증강 생성 기술의 정밀도 평가 지표(RAGAS)를 활용한 결과, 시스템이 도출한 답변은 90% 이상의 높은 정확도를 기록했다. 에너지연은 규정 외에도 내부 게시판, 연구 논문 정보 등 모든 데이터의 적용이 가능해 기업과 기관의 특성에 맞는 다양한 형태로 활용할 수 있을 것으로 내다봤다. 기술을 이전받은 ㈜아이티메이트는 해당 기술과 기업이 보유한 AI 기술을 적용해 공공기관용 전사적 자원 관리 시스템(ERP)의 선진화를 추진할 계획이다. 송영배 실장은 “AI 챗봇 시스템을 통해 규정 검색의 효율성과 정보 접근성이 대폭 향상될 것"으로 기대하며 "향후 출연연 행정 업무의 효율화를 선도할 수 있는 기반이 마련된 것”이라고 밝혔다. ㈜아이티메이트 고재용 대표는 “회사가 보유한 전사적 자원관리 솔루션과 AI 기술을 결합하고 민간기업과 공공기관의 디지털 전환을 지원하는 선도 기업으로 자리매김하겠다”고 전했다. 한편, 에너지연은 AI를 활용 첨단 연구, 행정 효율화를 위해 고성능 그래픽처리장치(GPU)를 포함한 서버를 구축하고 운영 중이다.

2025.02.06 15:04박희범

"GPU 1.5만장 연내 구입"...글로벌 경쟁에 마음 급해진 정부

정부가 연내 국가AI컴퓨팅센터에 구축할 GPU 1만5천 장을 확보하겠다는 뜻을 밝혔다. 당초 GPU 확보 계획은 2030년까지 3만 장이었는데 이 가운데 절반을 조기에 구축하겠다는 뜻이다. 유상임 과학기술정보통신부 장관은 4일 2025년 핵심과제 추진상황 브리핑을 직접 맡아 “국가AI컴퓨팅센터에 올해 GPU 1만5천 장을 구축하면 좋겠다”며 “2027년까지 3만개를 구축하겠다”고 밝혔다. 국가AI위원회 출범 당시 목표로 제시한 3만 장의 GPU 수량은 생성형AI 시장에서 돌풍을 일으킨 오픈AI의 챗GPT 서비스가 쓰고 있는 GPU를 추산한 값이다. 당시 국내에 도입된 GPU는 2천 장 수준으로 파악됐다. 즉, 3만 당의 GPU로 국내에서 민간 기업과 연구기관들이 글로벌 톱티어 서비스에 뒤지지 않은 AI 연구개발 환경을 갖추게 하겠다는 뜻이다. 유 장관은 “국가AI위원회 출범 당시에 3만 장의 GPU를 구입한다고 했는데, GPT-4o가 나오고 또 지금처럼 딥시크가 나오면서 이 변화가 생각보다 굉장히 빠르게 진행되는 상황이 왔다”고 운을 뗐다. 이어, “글로벌에서는 이미 10만 장을 깔고 가는데, 2030년에나 가서 3만 장을 해봐야 의미가 없는 상황이다”며 “가급적 GPU를 2030년이 아니라 2026년 말, 늦어도 2027년 초까지는 3만 장이 마련돼야지만 우리나라도 AI 부분의 연구개발 쪽에 부족함이 없겠다고 생각한다”고 밝혔다. 유 장관은 또 “다른 국가 예산 677조 원의 원예산 중에서 1조 원 정도를 AI에 쓰는 게 그게 무리냐 했을 때 저는 절대 무리라고 생각하지 않는다”며 “최근에 프랑스가 5조 원이라는 돈을 국가 자금으로 썼다”고 했다. 다만 이같은 계획을 실현하기 위해서는 예산 책정을 유연하게 접근할 수밖에 없는 상황이다. 국회 야권에서 AI와 R&D에 최소 5조원 이상의 추경이 필요하다는 뜻을 밝힌 데 대해 구체적인 답을 내놓지는 않았지만, 추경이 이뤄진다면 GPU 확보에 무게를 싣겠다고 했다. 유 장관은 “(추경이 편성된다면) AI GPU 구입은 반드시 이뤄지면 좋겠다”고 밝혔다. 그러면서 “굳이 민간이 하는 일인데 GPU를 국가가 사고, 국가가 컴퓨팅센터를 만들고 이렇게 생각할 수도 있겠지만 국내 기업이 몇 조 원을 들여 막 살수는 없는 상황”이라며 “미국 같은 경우 거대자본이 움직이지만 우리 기업은 그 수준은 아니기 때문에 정부가 마중물이 되어야 한다고 생각한다”고 덧붙였다. AI 외교 행보에도 집중한다. 유 장관은 오는 10일 프랑스에서 열리는 'AI 행동 정상회의' 대표로 참석해 글로벌 AU 규범 논의를 주도한다는 계획이다. 이 자리에서 세계에서 두 번째로 제정한 AI기본법 내용을 공유하고 국제AI안전연구소네트워크 의장국 수임을 제안할 예정이다. 프랑스 일정을 마친 뒤에는 벨기에로 이동해 호라이즌 유럽 본부를 찾은 뒤 오는 13일부터 미국에서 열리는 미국과학진흥협회 연례행사에 참가한다. 한편, 이달 중으로 공정거래위원회가 이동통신 3사를 단말기유통법과 관련해 담합 혐의로 수조원의 과징금 제재 논의를 시작하는 것을 두고 “민간 분야에 대한 정부 부처의 과한 것은 원치 않는다는 입장”이라며 말을 아꼈다.

2025.02.04 18:10박수형

[김미정의 SW키트] 정부, 연내 GPU 1만5000개 확보 공언…업계 "현실성 부족"

정부가 글로벌 인공지능(AI) 개발 트렌드에 맞춰 연내 그래픽처리장치(GPU) 1만5천 개를 확보하겠다고 발표한 가운데 업계에선 실현 가능성이 작다는 지적이 이어지고 있다. 조 단위에 달하는 예산 집행부터 공간 확보, 전력 문제 등 넘어야 할 산이 많다는 이유에서다. 유상임 과학기술정보통신부 장관은 4일 정부서울청사에서 열린 '2025년 핵심과제 추진 상황에 대한 대국민 보고 브리핑'에서 AI 개발 경쟁력인 GPU 확보 계획을 이같이 밝혔다. 정부의 인프라 투자를 통해 국내도 딥시크-R1에 준하는 저비용·고효율 모델을 확보하겠다고 자신감을 내비쳤다. 정부는 애초 국가AI위원회 출범 당시 2030년까지 GPU 3만 장을 도입하겠다고 발표했으나 최근 중국 딥시크가 AI 생태계에 돌풍을 일으켜 이같은 전략을 발표한 것이다. 2030년을 목표로 전략을 추진했다간 뒤처질 수 있다는 판단에서다. 딥시크-R1은 중국 AI 스타트업 딥시크가 지난달 출시한 오픈소스 모델이다. 딥시크는 사전 연구와 실험을 제외한 모델 훈련에 557만6천 달러(약 80억원)들었다고 밝혔다. 이는 메타가 AI 개발에 투입한 비용의 10분의 1 수준이다. R1은 저사양 칩으로도 고성능 기능을 제공한다는 평가를 받고 있다. 같은 날 샘 알트먼 오픈AI 최고경영책임자(CEO)가 방한해 정신아 카카오 대표와 이재용 삼성전자 회장, 최태원 SK그룹 회장, 김창한 크래프톤 대표를 만나 AI 관련 사업 협력 방안을 논의했다. 일각에서는 해외 기업의 협업과 정부의 인프라 투자가 한국 AI 생태계 경쟁력을 끌어올릴 수 있을 것이란 기대감을 내비쳤다. "선언적 발표 가능성"…예산 미확정·물량 확보 이슈 지적 업계에선 정부의 GPU 확보 계획에 현실성이 부족하다고 지적했다. 정부가 충분한 예산과 전략 문제, 공간 확보에 대한 준비를 철저히 하고 이를 발표한 것인지 의문이라는 주장이다. 이번 정부 발표가 선언적 발언에 그칠 수 있다는 가능성에 무게를 두고 있다. 익명을 요청한 한 업계 관계자는 "GPU 1만5천 장을 구입하려면 약 2조가 필요하다"며 "여기에 설치 등 인프라 비용까지 합치면 수조 단위 예산이 들 것"이라고 설명했다. 이어 "GPU 작동 시 발생하는 전력 문제 해결과 공간 확보도 중요하다"며 "철저한 준비 없이 연내 계획 실현은 힘들 것"이라고 말했다. 정부가 GPU 구입을 위한 예산을 확정하지 않은 상태인 것으로 전해졌다. 당초 과기정통부는 국가 AI컴퓨팅센터 구축과 GPU 3만 장 구입을 위해 4조원을 투자하겠다고 발표한 바 있다. 정부와 민간은 2조원씩 마련하기로 했다. 또 다른 업계 관계자는 "현재 이를 위한 예산 배정이 확정되지 않았다"며 "예산 확보가 미정인 상태에서 구입 비용을 어디서 마련할 수 있을지 의문"이라고 지적했다. 예산이 있어도 문제다. 엔비디아가 GPU 물량을 연내 정부에 공급할지 불확실해서다. 그동안 엔비디아는 GPU 물량을 대량 신청하는 기업·정부에 공급 우선권을 주는 사례가 있기는 하다. 다만 100% 장담할 수는 없다. 그는 "정부가 1만5천 장을 한번에 주문한다고 해서 엔비디아가 주문 우선권을 무조건 준다는 보장도 없다"며 "향후 추가 발표를 지켜봐야 할 것"이라고 말했다.

2025.02.04 17:37김미정

엔비디아 "딥시크 AI 혁신, GPU 수요 더 증가시킬 것"

엔비디아가 27일(미국 현지시간) 중국 AI 스타트업 딥시크(DeepSeek)가 공개한 새 AI 모델 'R1'에 대해 긍정적인 평가를 내왔다. 딥시크 R1은 20일 공개된 추론 특화 AI 모델이다. 자체 테스트 결과에 따르면 딥시크 R1은 일부 테스트에서 오픈AI의 추론 특화 모델 'o1'보다 나은 성능을 보였다. 또 2022년 미국 상무부의 수출 통제 조치를 우회하기 위해 엔비디아가 성능을 낮춘 H800 GPU를 이용했다. 모델 훈련에 든 순수 비용은 557만6천달러(약 80억원)이며 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준이다. 지난 주 알렉산더 왕 스케일AI CEO는 미국 CNBC와 인터뷰에서 "딥시크가 미국 정부의 수출 규제를 우회해 고성능 GPU를 썼을 것"이라고 주장했다. 그러나 엔비디아는 "시크가 사용한 GPU가 미국의 수출 규정을 완전히 준수했다"고 확인했다. 27일 미국 증권 시장에서는 딥시크 R1 이후 비교적 성능이 낮은 GPU로 고성능 AI 모델 개발이 활발해질 것이라는 전망에 따라 엔비디아 주가가 크게 하락했다. 1주당 가격은 지난 주 대비 16.86% 하락한 118.58달러(약 17만 2천원)로 마감했고 시가총액은 6천억 달러(약 868조원) 가까이 줄었다. 미국 CNBC에 따르면 엔비디아는 "딥시크는 탁월한 AI 발전의 사례이며, 사용 가능한 모델과 완전한 수출 통제 준수 하에 구축된 컴퓨팅을 활용하여 새로운 모델을 생성하는 방법을 잘 보여준다"고 밝혔다. 엔비디아 관계자는 이어 "추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 전망했다.

2025.01.28 16:22권봉석

엔비디아 '지포스 RTX 5090' 성능 공개... 전작比 최대 40% ↑

엔비디아가 올 초 CES 2025 기조연설에서 공개한 지포스 RTX 5090의 테스트 결과가 국내외 IT 매체를 통해 24일 오전 0시경 일제히 공개됐다. 지포스 RTX 5090은 블랙웰(Blackwell) 아키텍처 기반 PC용 GPU이며 5세대 텐서 코어, 4세대 레이트레이싱(RT) 코어, 최대 GDDR7 32GB 메모리를 활용해 게임 등 3D 성능과 AI 처리 성능을 강화했다. 미국과 일본 등 주요 IT 매체 테스트 결과에 따르면 지포스 RTX 5090은 전세대(RTX 4090) 대비 벤치마크 프로그램에서는 최대 40% 성능 향상을 보였다. 4K(3840×2160 화소) 해상도에서도 전작 대비 30% 성능이 향상됐다. 3D마크 '스틸노매드' 벤치마크에서 51% 점수 향상 일본 PC워치는 24일 "지포스 RTX 5090 파운더스 에디션 그래픽카드와 전세대 제품(RTX 4090 파운더스 에디션) 성능을 비교한 결과 3D마크 등 벤치마크에서 성능 향상이 눈에 띈다"고 밝혔다. 이 매체는 "3D마크에 추가된 다이렉트X 12 기반 '스틸노매드' 실행시 RTX 5090은 14,060점, RTX 4090은 9,301점으로 51% 점수가 높아졌다. 레이트레이싱 성능 테스트인 '포트로얄' 점수 역시 RTX 4090(26,193점) 대비 39% 더 높다"고 밝혔다. 미국 PC 전문매체 톰스하드웨어는 "3D마크 다이렉트X 레이트레이싱 기능 테스트에서 RTX 4090이 초당 137.91 프레임, RTX 5090이 108.64 프레임이 나왔으며 드라이버 튜닝이나 업데이트가 필요한 상황"이라고 설명했다. 4K 해상도 게임에서 평균 30% 가량 성능 향상 톰스하드웨어는 4K 해상도, 그래픽 수준 '울트라'로 설정한 상태에서 16개 게임의 초당 프레임 수 평균을 낸 결과도 공개했다. RTX 5090은 초당 105.6프레임, RTX 4090은 초당 84.4 프레임이었다. 이 매체는 "4K 해상도, 그래픽 수준 '높음'이 RTX 5090의 명확한 소비층이며 적절한 디스플레이가 있다면 더 높은 해상도로 구동하는 것도 가능할 것"이라고 밝혔다. PC워치 역시 4K 해상도의 성능 향상에 주목했다. 이 매체는 "RTX 5090은 마이크로소프트 플라이트 시뮬레이터 2024에서 RTX 4090 대비 48% 성능 향상, F1 24에서는 24-26%, 사이버펑크 2077에서 28-32% 성능 향상이 있었다"고 밝혔다. "4K 해상도서 최대 성능 발휘... 추가 최적화 필요" 톰스하드웨어는 "지포스 RTX 5090은 4K 해상도와 최대 그래픽 설정으로 게임을 즐기려는 소비자에게 가장 적합한 선택이며 모든 게이머가 갖고 싶어하지만 극소수만 살 수 있는 제품"이라고 평가했다. 이어 "이 GPU의 드라이버와 소프트웨어가 아직 완전히 성숙하지 않았으며, 일부 게임과 애플리케이션에서 추가 최적화가 필요한 상황"이라고 덧붙였다. PC워치는 "RTX 5090의 성능은 전작인 RTX 4090을 뛰어넘고 DLSS 4의 멀티프레임 생성 기능은 유용하지만 실제 게임에서 더 폭넓은 검증이 필요하다"고 언급했다. 국내 시장에 2월 초부터 본격 공급 예정 지포스 RTX 5090 탑재 그래픽카드는 오는 1월 말 출시 예정이다. 시장 수요에 비해 적은 초기 물량 탓에 당분간 시장에서 쉽게 구하기 힘들 것으로 보인다. 영국 IT 온라인 유통업체 OCUK는 "지포스 RTX 5090 그래픽카드 재고가 10대 미만이며 출시 시 물량은 두 자릿수에 그칠 것으로 예상된다. 한 단계 아래 제품인 지포스 RTX 5080 재고도 수백 개에 그칠 전망"이라고 밝혔다. 지포스 RTX 5090 그래픽카드는 국내 시장에 2월 초부터 본격 공급 예정이다. 24일 한 제조사 관계자는 "RTX 5090 탑재 그래픽카드 샘플이 23일에야 국내에 들어왔고 제조 시설이 있는 중국도 연휴 기간이 겹쳐 초기 물량은 적을 것"이라고 말했다. 주요 제조사들은 국내 가격에 가장 큰 영향을 미치는 기준 환율 책정에도 고심중이다. 또다른 제조사 관계자는 "현재 원-달러 환율이 1천450원 아래로 떨어졌지만 설 연휴 중 추이를 봐야 하는 상황"이라고 설명했다.

2025.01.24 13:41권봉석

씨이랩, GPU 클러스터 솔루션 '아스트라고' 업데이트…AI 인프라 관리 '혁신'

씨이랩이 인공지능(AI) 인프라 효율성 극대화와 그래픽처리장치(GPU) 관리 혁신을 위한 방안을 제시했다. 씨이랩은 지난 16일 서울 엘타워에서 열린 'HPE 파트너데이'에서 GPU 클러스터 관리 솔루션 '아스트라고'의 신규 기능과 성공 사례를 발표했다고 17일 밝혔다. 이번 행사는 HPE 파트너사를 대상으로 최신 기술 트렌드와 협력 방안을 공유하기 위해 마련됐다. 아스트라고는 쿠버네티스 기반으로 설계돼 AI 워크로드를 효과적으로 관리하며 GPU 자원의 최적화를 지원한다. HPE 원뷰와의 완벽한 연동을 통해 소프트웨어와 하드웨어를 단일 플랫폼에서 관리할 수 있는 것이 강점이다. 이번에 새롭게 추가된 레드피시 연동 기능은 실시간 모니터링과 원격 제어를 제공해 운영 효율성을 높였다. '크레이' 제품과의 간단한 연동 및 베이스보드 관리 컨트롤러(BMC) 포트 활용으로 시스템 로그 확인도 가능하다. 씨이랩은 오픈소스 기반으로 솔루션을 개발해 별도의 라이선스 비용 부담을 없앴다. 또 구독형 모델을 통해 기업과 공공기관이 경제적인 방식으로 AI 인프라를 도입하도록 지원하고 있다. 유진수 씨이랩 매니저는 "'아스트라고'는 고객이 AI 인프라를 효율적으로 운영하며 비용을 절감할 수 있도록 돕는 솔루션"이라며 "HPE 원뷰와 레드피시 연동을 통해 GPU 클러스터 관리의 새로운 표준을 만들어 갈 것"이라고 밝혔다.

2025.01.17 10:23조이환

망고부스트, AI 추론 최적화 소프트웨어 '망고 LLM부스트' 출시

망고부스트는 AI 추론 성능을 향상시키는 시스템 최적화 소프트웨어 '망고 LLM부스트(Mango LLMBoost)'를 공식 출시했다고 16일 밝혔다. 망고 LLM부스트는 시스템 스케줄 조정, 커널 최적화, 독자적인 데이터 프리패칭 기술, 최신 GPU를 최대한 활용한 모델 양자화(Quantization) 기술을 활용한다. 이를 통해 경쟁사 LLM 추론 엔진 대비 최대 12.6배 성능 향상과 92%의 비용 절감을 달성했다. 망고 LLM부스트은 GPU 호환성, 다중 모델 배포 및 관리 기능, 간편한 배포, 오픈 API 호환성이 강점이다. 엔비디아와 AMD의 주요 GPU와 모두 호환되고, Llama, Mixtral, Gemma, Qwen2, Llava, Phi3, Chameleon, MiniCPM, GLM-v4 등 다양한 채팅 및 멀티모달 모델에서 검증됐다. 또 단일 추론 서버에서 자동 리소스 할당을 통한 효율적 배포와 관리를 가능하게 한다. 망고부스트의 웹 서빙 및 스트리밍 API를 포함한 종단 간(End-to-End) 배포 옵션을 제공하며, GPU 및 실행 모델에 따라 최적의 구성을 자동으로 선택한다. OpenAI API를 사용하는 기존 AI 애플리케이션에 손쉽게 통합할 수 있어서 편리하다. 망고부스트 관계자는 "망고 LLM부스트는 경쟁 솔루션 대비 압도적인 성능 향상과 비용 절감 효과를 증명하며, 정식 출시 전부터 강력한 도입 의향을 보인 빅테크 해외 지사에서 도입을 앞두고 있다"고 밝혔다. 김장우 망고부스트 CEO는 "망고 LLM부스트의 출시는 시스템 레벨의 성능과 효율성을 향상시키기 위한 망고부스트의 지속적인 노력을 보여주는 중요한 이정표이다"라며 "당사의 DPU 전문성은 데이터 센터 효율성 개선이라는 사명에 중심 역할을 해왔으며, 망고 LLM부스트는 하드웨어 및 소프트웨어 레이어를 모두 최적화함으로써, AI 추론 워크로드 수행의 성능과 효율성이라는 핵심 과제를 해결한다"고 전했다.

2025.01.16 14:30이나리

김재원 대표 "엘리스그룹, 에듀테크 기업에서 AI 기업으로"

AI 에듀테크 기업으로 잘 알려진 엘리스그룹(대표 김재원)은 인프라·데이터·플랫폼·콘텐츠 등 AI에 필요한 모든 것을 통합 제공하는 'AI 솔루션 기업'으로 자리매김하고 있다. 김재원 엘리스그룹 대표는 본격적인 AI 시대를 맞아 새해 이런 변화에 더욱 속도를 낸다는 계획이다. 엘리스그룹에 따르면, 회사는 AI 교육이 필요한 기업 또는 기관이 몰입도 높은 비대면(가상화) 실습 환경 아래에서 교육생들의 학습 관리를 편리하게 할 수 있는 '엘리스LXP' 플랫폼을 서비스 중이다. 이 플랫폼을 통해 ▲초중고 공교육 ▲취준생 및 재직자 직무교육 ▲산업 맞춤형 디지털 전환 교육 등 다양한 교육 콘텐츠가 제공된다. SK·LG·현대차 등 국내 대기업뿐만 아니라, 서울대·카이스트 등 대학과 정부·공공기관 총 5천300여 곳에서 맞춤형 디지털 전환 교육을 하고 있다. 관리자는 엘리스LXP에서 학습 데이터를 분석하고 시각화한 AI 대시보드를 통해 교육생들을 보다 효율적으로 관리함으로써 이수율을 높일 수 있다. 나아가 거대언어모델(LLM) 기반으로 만들어진 AI 챗봇(AI 헬피)을 통해 학습자들의 질문에 대한 맞춤형 답변도 빠르게 할 수 있다. 아울러 '엘리스테스트'는 개발자 채용 평가부터 재직자 역량 평가, 대규모 경진대회 등 온라인 테스트 환경을 지원한다. 부정행위 방지 기능과 다양한 테스트 콘텐츠, 체계적 온보딩 시스템과 안정적 서버환경 등은 엘리스테스트의 강점이다. 이동형 모듈러 데이터센터 구축...강력한 AI 인프라 제공 엘리스그룹은 다양한 환경의 AI 연구·개발·배포를 위한 안정적인 GPU를 제공하는 '엘리스클라우드' 사업도 키워나가고 있다. 엔비디아의 A100·H100 등 강력한 GPU 서버 스펙을 바탕으로 AI 데이터센터를 구축한 상태다. 회사는 지난해 델 테크놀로지스로부터 엔비디아 H100 텐서코어 GPU를 탑재한 델 파워엣지 서버와 네트워킹 스위치를 도입해 데이터센터 인프라를 업그레이드한 바 있다. 특히 엘리스그룹은 델 테크놀로지스와의 협력을 통해 엘리스클라우드에 모듈 단위로 탄력적인 인프라 확장이 가능한 이동형 모듈러 데이터센터(PMDC) 방식을 적용했다. 엘리스그룹 전력 밀도는 랙당 20~40kW로, 국내 데이터센터 평균(3.3kW)보다 효율성이 높다. 아울러 회사는 GPU·NPU를 효율적으로 이용할 수 있는 동적 할당 기술을 적용해 사용자가 필요로 하는 만큼 실시간으로 컴퓨팅 자원을 할당받을 수 있게 했다. 이를 통해 비용을 낮추면서도 AI·디지털 전환 관련 교육 과정을 원활히 받을 수 있는 환경을 갖추게 됐다. 최근에는 AI 반도체 스타트업 리벨리온과 상호 협력 업무협약을 맺고, 리벨리온 NPU 기반 클라우드 플랫폼 구축을 위한 기술 협력을 진행한 뒤 이를 바탕으로 글로벌 데이터센터 진출에도 힘을 모으기로 했다. 엘리스클라우드 PUE(전력 효율 지수)는 1.27이며, 지난해 8월 정보보안에 대한 글로벌 인증(ISO 27001·27701)을 획득하기도 했다. "엘리스그룹은 AI 기업" 2015년 회사를 창업한 김재원 대표는 엘리스그룹을 'AI 기업'으로 정의했다. 재직자 대상으로 디지털 전환과 AI 교육을 통해 업무 효율성을 높여주고, 취준생들에게는 대학과 산업 간의 격차를 줄여주는 부트캠프를 통해 이들이 AI에 대한 이해도와 전문성을 갖추도록 돕기 때문이다. 특히 엘리스클라우드를 통해 AI 연구팀이나 전문가들이 안정적인 클라우드 및 컴퓨팅 환경에서 AI 모델링 프로젝트를 수행하도록 지원해서다. 재작년과 작년에는 각각 국방부 대규모 AI 해커톤과 한국천문연구원의 태양 흑점 이미지 분석 AI 해커톤에 고성능 GPU 환경을 제공했다. “엘리스클라우드는 AI 전문 인프라입니다. 기존 AI 해커톤의 경우 예산 안에서 진행이 불가능했는데, 저희는 참가자들에게 고성능 환경을 제공하고 적게는 3분의 1, 많게는 10분의 1 예산 안에서 고성능 클라우드 환경을 제공해드리고 있습니다. AI 클라우드 인프라를 구성함에 있어 기존 데이터센터는 고전력이 아니다 보니 어렵고, 그렇다고 고가의 GPU 서버 인프라를 구성하기도 쉽지 않았는데 엘리스클라우드는 PMDC를 통해 비용 단가를 낮추면서도 안정성은 높였습니다. 쓰는 만큼 시간당 과금되기 때문에 효율적 이용도 가능합니다.” 기업 또는 기관들은 업무 생산성 향상을 위해 디지털 전환이 필요할 때 엘리스그룹의 다양한 플랫폼과 콘텐츠, 인프라 등을 취사선택해 사용하면 된다. AI 기업으로서 안정적인 서버가 필요하다면 엘리스클라우드를, AI 등 디지털 전환 교육이 필요하다면 엘리스LXP 플랫폼을 통해 대상에 맞는 엘리스의 콘텐츠를 제공하면 되는 식이다. “모든 정부 기관과 기업들의 AI 디지털 전환이 필요한 때라고 생각합니다. 그렇지 않으면 강대국들에 의해 도태될 수밖에 없겠죠. 저마다 속도는 다를 수 있겠지만, 결국 AI는 전기처럼 쓰게 될 테니, 이런 방향에 필요한 교육과 인프라를 제공하려 합니다.” "클라우드 인프라·기술력에 계속 투자할 것" 엘리스그룹의 올해 목표는 엘리스클라우드를 통한 더 큰 성장이다. 지난해 실적은 전년보다 성장하긴 했지만 기대만큼 크진 않았다고 김 대표는 말했다. AI 도입이 빠르게 확산되는 것은 맞지만, 아직은 기대만큼 그 속도가 빠르지 않은 것 같다고. 그는 AI의 더 빠른 도입을 위해서는 시간과 기술적 요인들이 더 필요하다고 말했다. 김 대표는 앞으로도 클라우드 인프라와 기술력에 계속 투자한다는 방침이다. 또 사내에 AI 전문 연구원들이 다수 있어 경쟁사 대비 AI 교육에 있어서는 훨씬 전문성이 있다고 자부했다. 나아가 AI 밸류 체인이 완성된 만큼, 올해는 클라우드 인프라와 기술력 투자에 집중한다는 방침이다. “약 3년 전 엔비디아 A100을 구매해서 계속 연구하다 2023년부터 내부에서 활용할 수 있게 개발했습니다. 그 후 AI 교육, 해커톤 등에서 활용할 수 있도록 했고, 지난해부터 기능을 강화하면서 외부 세일즈를 진행해 작년 처음으로 클라우드 매출이 발생했습니다. 강의, 콘텐츠 제작, 플랫폼 기능 확대에 이어 AI 인프라 세일즈까지 AI 밸류 체인 전주기를 완성했습니다. 이를 강화하는 것이 올해 목표이고요. 저희는 AI를 통해 실제 매출을 내고, 이를 클라우드 인프라와 기술력에 재투자하고 있습니다.” 김 대표는 앞으로 AI가 사람들의 업무와 실생활에 녹아들며 계속 발전할 것으로 내다봤다. 반면, 글로벌 시장에서는 엄청나게 빠른 속도로 발전하고 활용하는 이런 기술들이 국내 정치적·사회적 이슈들에 뒤처지는 것에는 아쉬움을 표했다. “더 이상 휴대폰 없이 일한다는 건 불가능하듯, AI 없이 일을 하면 비효율이 분명 발생할 겁니다. 앞으로 AI의 실생활 활용에 대한 부분이 강조될 텐데, 이를 지탱할 인프라에 대한 강화도 필요하죠. 어마어마한 속도로 발전될 AI를 활용하게 될 글로벌 경쟁에서 뒤처지지 않게 우리도 정진해야 한다고 생각합니다.”

2025.01.16 14:30백봉삼

SK하이닉스, 엔비디아에 'HBM4' 조기 공급...6월 샘플·10월 양산할 듯

SK하이닉스가 이르면 올해 6월 엔비디아에 HBM4(6세대 고대역폭메모리) 샘플을 출하할 계획인 것으로 파악됐다. 이르면 3분기말께부터 제품 공급이 시작될 것으로 관측된다. 당초 하반기 공급에서 일정을 다소 앞당긴 것으로, SK하이닉스는 차세대 HBM 시장을 선점하기 위해 양산화 준비를 서두르고 있다. 15일 업계에 따르면 SK하이닉스는 오는 6월 HBM4의 첫 커스터머 샘플(CS)을 고객사에 조기 공급하는 것을 목표로 세웠다. HBM4는 HBM은 여러 개의 D램을 수직으로 적층한 차세대 메모리다. 현재 5세대 제품인 HBM3E까지 상용화에 이르렀다. HBM4는 이르면 내년 하반기 양산이 시작될 것으로 전망된다. HBM4는 데이터 전송 통로인 I/O(입출력 단자) 수를 이전 세대 대비 2배 많은 2048개로 집적해 성능을 극대화했다. 엔비디아의 경우 당초 2026년 차세대 고성능 GPU '루빈(Rubin)' 시리즈에 12단 적층 HBM4를 탑재하기로 했었으나, 계획을 앞당겨 올 하반기 출시를 목표로 하고 있다. 이에 따라 SK하이닉스도 HBM4 개발에 속도를 내고 있다. 회사는 엔비디아향 HBM4 공급을 위한 전담 개발팀을 꾸리고, 지난해 4분기 HBM4 테이프아웃을 완료했다. 테이프아웃이란 연구소 수준에서 진행되던 반도체 설계를 완료하고, 도면을 제조 공정에 보내는 과정이다. 이후 SK하이닉스는 HBM4의 샘플을 고객사에 보내는 일정도 당초 올 하반기에서 6월로 앞당겼다. 해당 샘플은 고객사에 제품을 양산 공급하기 전 인증을 거치기 위한 커스터머 샘플로 알려졌다. HBM4 양산화를 위한 마지막 단계에 돌입한다는 점에서 의미가 있다. 사안에 정통한 관계자는 "엔비디아도 올해 하반기로 시험 양산을 당길만큼 루빈에 대한 초기 출시 의지가 생각보다 강한 것으로 보인다"며 "이에 맞춰 SK하이닉스 등 메모리 기업도 샘플의 조기 공급을 추진하고 있다. 이르면 3분기 말께는 제품 공급이 가능할 것"이라고 설명했다. HBM4는 주요 메모리 기업들의 차세대 고부가 메모리 시장의 격전지가 될 전망이다. 삼성전자는 HBM4에 탑재되는 D램에 1c(6세대 10나노급 D램)을 탑재할 계획이다. 경쟁사인 SK하이닉스와 마이크론이 1b D램을 기반으로 하는 것과 달리, 한 세대 앞선 D램으로 성능에서 차별점을 두겠다는 전략으로 풀이된다. 마이크론 역시 최근 진행한 회계연도 2025년 1분기(2024년 9~11월) 실적발표에서 "오는 2026년 HBM4의 본격적인 양산 확대를 진행할 계획"이라고 밝힌 바 있다.

2025.01.15 13:29장경윤

AI칩 주도권 노리는 삼성…"서버·폰·TV용 NPU 모두 개발 중"

"NPU의 성장 가능성은 매우 높다. 삼성에서도 '마하'와 같은 클라우드용 NPU와 스마트폰에서 활용 가능한 온-디바이스용 NPU 등 여러 개발 프로젝트를 가동하고 있다. 특히 삼성리서치는 TV용 NPU를 개발하고 있다." 김대현 삼성리서치 글로벌AI센터장은 14일 여의도 국회의원회관에서 회사의 AI 가속기 발전 동향에 대해 이같이 밝혔다. NPU 성장성 유망…삼성도 서버·폰·TV 등 NPU 전방위 개발 현재 AI 반도체 시장은 글로벌 팹리스인 엔비디아의 고성능 GPU(그래픽처리장치)가 사실상 독과점 체제를 이루고 있다. GPU는 복수의 명령어를 동시에 처리하는 병렬 처리 방식이기 때문에, 방대한 양의 데이터를 반복적으로 연산해야 하는 AI 산업에 적극적으로 채용되고 있다. 김 센터장은 "엔비디아 GPU가 AI 데이터센터를 구축하는 가장 보편적인 반도체가 되면서, 이를 얼마나 확보하느냐가 AI 경쟁력의 바로미터가 됐다"며 "마이크로소프트나 메타가 수십만개를 확보한 데 비해, 삼성의 경우 1만개 내외로 아직 부족한 것이 사실"이라고 말했다. 특히 엔비디아는 자사 GPU 기반의 AI 모델 학습, 추론을 완벽하게 지원하는 소프트웨어 스택 '쿠다(CUDA)'를 제공하고 있다. 덕분에 개발자들은 대규모 AI 모델 학습 및 추론을 위한 다양한 툴을 활용할 수 있다. 다만 향후에는 NPU(신경망처리장치) 등 대체제가 활발히 쓰일 것으로 전망된다. NPU는 컴퓨터가 데이터를 학습하고 자동으로 결과를 개선하는 머신러닝(ML)에 특화된 칩이다. GPU 대비 범용성은 부족하나 연산 효율성이 높다. 김 센터장은 "NPU는 AI만 집중적으로 잘하는 반도체로, GPU가 AI 성능이 100이라면 NPU는 1000정도"라며 "엔비디아의 칩이 너무 비싸기 때문에, 글로벌 빅테크 기업들도 각각 성능과 효율성을 극대화한 맞춤형 AI 가속기를 개발하고 있다"고 설명했다. 삼성전자도 데이터센터, 온-디바이스AI 등 다양한 산업을 위한 NPU를 개발 중인 것으로 알려졌다. 김 센터장은 "삼성에서도 NPU 하드웨어와 소프트웨어, AI 모델에 이르는 전 분야를 개발하고 있고, 내부적으로 여러 개의 NPU 개발 프로젝트를 진행 중"이라며 "마하와 비슷한 또 다른 프로젝트가 있고, 삼성리서치는 TV용 NPU를 개발 중"이라고 설명했다. 앞서 삼성전자는 네이버와 협력해 자체 AI 가속기인 '마하'를 공동 개발해 왔으나, 양사 간 이견이 커져 프로젝트가 무산됐다. 대신 삼성전자는 자체 인력을 통해 AI 가속기 개발을 지속하기로 한 바 있다. 국내 AI칩 생태계 크려면…하드웨어·소프트웨어 균형 지원 필요 리벨리온, 퓨리오사AI 등 국내 스타트업도 데이터센터용 NPU를 자체 설계해 왔다. 각 기업은 국내 및 해외 테크 기업과 활발히 협력하면서 본격적인 시장 진입을 추진하고 있다. 김 센터장은 "국내 AI 반도체 스타트업들이 성공하기 위해서는 하드웨어와 소프트웨어 분야를 균형있게 지원해줄 수 있는 방안이 필요하다"며 "현재 이들 기업이 투자에만 의존하고 있지만, 궁극적으로는 데이터센터 기업과 연동돼 자생할 수 있는 생태계를 조성할 수 있도록 해줘야 한다"고 강조했다. 한편 이번 김 센터장의 발표는 고동진 국회의원이 주최한 '엔비디아 GPU와 함께 이야기되고 있는 TPU와 NPU 기술 등에 대한 현황분석 간담회'에서 진행됐다. 고동진 의원은 "우리나라의 AI 반도체 생태계 강화를 위해서는 국내 기업들을 활용한 데이터센터 인프라 구축이 필요하다"며 "엔비디아, 구글, 아마존 등 기존 주요 기업의 인프라를 쓰는 동시에, 국내 스타트업의 시스템반도체를 테스트베드화해서 1년 반 안에 수준을 끌어올리는 방향으로 가야한다고 생각한다"고 말했다.

2025.01.14 10:53장경윤

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

美, 한국에 상호관세 25%부과…8월 1일부터 적용

GS25 돈키호테 팝업 1200명 운집…"기대 이하" 불만 속출

홈플러스 "실투입금 1조원 이하로 인수 가능"

삼성전자, 반도체 쇼크에 '휘청'…"재고 충당·AI칩 대중 수출 규제 탓"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.