• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI 컴퓨팅 인프라'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

유상임 장관, 엔비디아 찾아 GPU 확보 논의...NIPA 협약 체결

유상임 과학기술정보통신부 장관이 지난 14일부터 미국을 찾아 엔비디아와 AI 인프라 구축을 위한 업무협약을 이끌어냈다. 엔비디아 초청을 받아 미국 본사를 방문한 유상임 장관은 제이 퓨리 총괄 부사장, 칼리스타 레드몬드 부사장 등 엔비디아 주요 임원들과 대한민국 AI 인프라 역량 확충을 비롯해 AI 생태계 역량 강화를 위한 협력방안을 논의했다. 정보통신산업진흥원(NIPA)은 엔비디아와 업무협약을 체결, 연내 원활한 첨단 엔비디아 GPU 확보 등 AI 인프라 구축을 위해 협력하기로 했다. 유 장관은 방미 첫날 브랜던 카 연방통신위원회(FCC) 위원장과 면담을 갖고, 전 세계적인 위협이 되고 있는 통신 해킹에 대한 협력 방안을 찾았다. 이 자리에서 한국의 'IoT 보안인증제도'와 FCC의 '사이버 트러스트 마크'의 추진 현황을 공유하며, 양국의 IoT 기업들이 상대국에서 중복 인증을 받는 부담을 줄이고 국민들도 IoT 기기를 안심하고 사용할 수 있도록 한미 양국이 IoT 보안 기준 등에 대해 공유할 필요성을 공감했다. 아울러 양측의 6G 개발과 표준활동에 대해 공유했다. 또 해저 케이블 보안에 대해 지속적인 협력관계를 이어나가기로 뜻을 모았다. 유 장관은 15일 美 백악관 과학기술정책실(OSTP) 린 파커 부실장을 만나 한미 과학기술 협력에 차질없는 추진 방안에 대해 논의하였다. 유 장관은 먼저 한국의 글로벌 R&D 현황을 공유하며 미국과의 협력 내용을 설명하였다. 아울러 R&D 환경 변화에도 한미 간 차질없는 협력을 강조하였다. OSTP측에서는 한국에서 참고할 수 있도록 이번 트럼프 2기 행정부의 투자 우선순위를 공유하고, 이를 바탕으로 R&D 정책 변화를 강구하고 있음을 밝혔다. 특히 유 장관은 민감국가 지정 등의 상황으로 연구보안의 중요성이 증대되고 있는 상황을 설명하였고, 양측은 현재 연구보안 정책을 공유하고, 상호 긴밀히 협력해나가기로 했다. 미측은 트럼프 행정부 1기 때 발표된 연구보안 관련 대통령 각서를 기반으로 이행을 강화해나갈 것이라는 점을 강조했다. 이밖에 미국 국립과학재단, 에너지부(DOE) 산하 페르미 국립가속기연구소, 미국과학진흥협회(AAAS) 등과 의견을 나눴다. 유 장관은 “한국의 글로벌 공동연구 투자 규모 중 미국과의 협력 비중이 가장 큰 현실에서 트럼프 2기 행정부의 변화된 R&D 정책방향과 연구보안 강화 정책이 우리 R&D에 미치는 영향을 빨리 파악하고 대응하는 것이 중요하다”며 “방미를 계기로 미측과 차질없는 협력을 이어가기로 하였고, 이번에 논의한 내용을 한미 R&D 정책에 반영할 계획”이라고 밝혔다. 그는 또 “엔비디아와의 GPU 협력 모색에 착수한 바, 국내 AI 연구환경이 대폭 개선되기를 기대한다”고 강조했다.

2025.05.18 13:17박수형

정부 "GPU 우선 확보…세계 수준 LLM 만든다"

과학기술정보통신부가 인공지능(AI) 컴퓨팅 인프라를 확충하면서 즉시, 단기, 중장기 등 3단계에 걸친 마스터플랜을 가동키로 했다. 20일 열린 국가인공지능위원회 3차 회의에서 과기정통부는 이같은 내용을 담은 'AI컴퓨팅 인프라 확충을 통한 국가 AI역량 강화 방안'을 발표했다. AI컴퓨팅인프라 특별위원회와 당정협의회에서 논의된 내용을 담은 것으로, 새해 경제정책방향에 따라 1분기 내 수립 예정이던 대책을 딥시크 돌풍으로 앞당겨 마련한 방안이다. 내년 상반기까지 GPU 1.8만장 확보...H100 416장 우선 지원 이 방안에 따라, 정부는 인공지능 컴퓨팅 인프라 확충 3단계에 걸친 마스터플랜을 가동한다. 당장 현장에 시급한 AI 컴퓨팅 수요에 대응하기 위해 광주AI데이터센터, 민간 클라우드 등 이미 국내에 보유하고 있는 GPU 자원을 활용해 우선 지원한다. 현재 국내에 있는 엔비디아 H100 880장 가운데 정부가 416장을 확보하고 있는데 이를 지원하겠다는 뜻이다. 이후 2026년 상반기까지 1만8천 장 규모의 첨단 GPU를 확충한다. 그 중 1만 장은 국가 AI컴퓨팅 센터를 중심으로 민관 협력을 통해 연내 확보하고, 나머지 8천여 장도 슈퍼컴퓨터 6호기 구축을 통해 확보할 예정이다. 마지막 중장기 단계로 2030년까지 국가AI컴퓨팅센터 내 국산 AI 반도체 비중을 50%로 끌어올리는 등 저전력 고성능의 국산 AI 반도체 경쟁력 제고도 지원한다. 민간의 AI 컴퓨팅 인프라 투자를 촉진하기 위해 세제지원, 전력 입지 등 제도적 기반도 강화한다. AI를 조세특례제한법 상 국가전략기술로 지정해 첨단 AI R&D 등 우대 공제율 30~50%, AI 통합투자 우대 공제율 15~35% 등에 대한 세제지원을 확대한다. 비수도권에 AI데이터센터 구축 시 전력계통 영향평가 우대를 검토하고, 항만배후단지, 공항지원시설 등으로 입지 다변화, 승강기 미술품 설치 최소기준 적용 등 전력 입지 시설에 관한 제도개선 등도 지속 추진한다. 국산 AI 반도체의 성장도 적극 지원한다. 국산 인공지능 반도체를 토대로 글로벌 수준의 개방형 HW-SW 기술생태계를 조성하여 대규모 고성능 시스템의 최적 운용을 뒷받침한다. 이를 통해 대규모 수요 창출과 동시에 기술개발 성과의 실증과 사업화도 지원한다. WBL 프로젝트 추진...AGI 구현 1조 단위 예타 검토 국가AI컴퓨팅센터 등 인프라 확충을 계기로 독자적 인공지능 모델 경쟁력 확보를 본격 추진한다. AI 국가대표 프로젝트인 가칭 월드베스트LLM(WBL) 프로젝트를 신규 추진할 계획이다. AI 정예팀을 선발하고 단시간에 세계 최고 수준의 대형언어모델을 개발할 수 있도록 필요한 데이터, GPU 등 핵심 인프라를 전폭 지원한다. 또한 AI 분야의 도전적인 문제를 해결하기 위해 국내외 최고 인재가 팀을 이뤄 겨루는 대규모 경진대회인 '글로벌 AI 챌린지'도 개최한다. 세계적인 AI 분야 석학들과 대국민 평가 등을 통해 최고 인재의 참여를 유도하고 입상자에 대해서는 창업 지원이나 WBL 정예팀 기업에 채용을 연계하는 등 파격적인 인센티브를 제공한다. 아울러 장기적으로는 생성형 인공지능을 넘어 범용인공지능(AGI) 구현에 필요한 핵심 원천기술 확보를 위해 1조원 규모에 달하는 기술개발을 추진한다. 고급 AI 인재 양성체계도 고도화한다. 지난해 뉴욕에 개소한 '글로벌 AI 프론티어랩'을 영미권을 넘어 유럽 등으로 확대하는 방안을 추진하여 세계를 선도하는 연구그룹과의 공동연구를 강화한다. 이와 더불어 국내 AI 신진연구자의 창의도전적 연구를 지원하는 프로그램도 신설한다. 기업이 원하는 실전 역량을 갖춘 최고 인재를 양성하기 위해 교사, 교재, 수업 없이 실전형 혁신 교육을 지원하는 '이노베이션 아카데미'를 확대하고, '기업-대학 협력형 AX 대학원' 신설을 추진할 계획이다. 글로벌 우수 인재 유치도 대폭 지원한다. WBL 프로젝트와 연계해 정예팀 기업이 필요로 하는 글로벌 인공지능 핵심 인재를 국내에 유치할 경우 인건비, 연구비, 체재비 등 파격적인 지원방안을 적극 검토할 계획이다. 이밖에 '우리 AI 컴퓨팅 인프라'를 통해 '우리 AI 인재'가 개발한, '우리 AI 모델'로 국가 AI 전환을 가속화한다. 우수한 국산 AI 모델의 초기시장 창출을 위해, 우리의 독자적 특화 데이터를 학습한 생성형 인공지능을 의료(맞춤형 치료 건강관리), 법률(대국민 법률정보 제공), 공공(행정업무 효율화) 등 다양한 분야에 접목하는 부처 협력형 선도 프로젝트를 추진한다. 유상임 과기정통부 장관은 “AI 패권경쟁은 기업 간 대결을 넘어 국가가 전면에 나서는 경쟁으로 변화하고 있다”며 “우리의 대응이 1년 늦어지면 경쟁력은 3년이 뒤처진다는 각오로 AI 컴퓨팅 인프라와 핵심인재 육성 확보에 전폭적이고 속도감 있는 투자를 추진하겠다”고 말했다. 이어, “우리나라가 이미 보유한 잠재력을 최대한 활용하고 부족한 부분은 빠르게 보완하는 등 국가의 인공지능 역량을 강화해 인공지능 3대 강국으로 도약하겠다”고 밝혔다.

2025.02.20 11:30박수형

최상목 대행 "연내 GPU 1만장...내년 상반기 GPU 8천장 슈퍼컴 구축"

최상목 대통령 권한대행 부총리가 17일 “연내 고성능 GPU 1만장을 확보해 국가AI컴퓨팅센터 서비스를 조기 개시하고 내년 상반기에는 GPU 8천장 상당의 슈퍼컴 6호기를 구축해 연구계를 지원하겠다”고 밝혔다. 최상목 권한대행은 이날 오후 정부서울청사에서 열린 제3차 AI컴퓨팅인프라특별위원회를 열어 “최근 AI 산업 패권 경쟁이 가열되는 가운데, 경쟁 구도도 기업 간 대결을 넘어 국가가 전면에 나서는 '혁신생태계 간 경쟁'으로 바뀌고 있다”며 이같이 말했다. 그러면서 “정부와 민간이 한 팀이 되어 힘을 모으면 과거 광대역 통신망을 구축해 우리나라가 IT 강국으로 부상하였듯이 AI컴퓨팅 인프라를 기반으로 인공지능 3대 강국으로 도약할 것”이라고 강조했다. 국가AI위원회 산하 AI컴퓨팅인프라특별위원회는 국가AI컴퓨팅센터를 비롯해 정부에서 추진 중인 AI컴퓨팅 인프라 관련 현안을 민관이 함께 논의하고 대응 방안을 모색하기 위해 구성됐다. 이날 회의는 지난달 22일 국정현안관계장관회 후속 조치로 '국가AI컴퓨팅센터 구축(SPC 설립) 실행계획' 관련 현안 점검을 위해 개최됐다. 미국 스타게이트 프로젝트, 프랑스 AI 데이터센터 구축 계획 등에서 보듯 최근 AI컴퓨팅 인프라 역량은 국가별 AI 생태계의 경쟁력을 결정짓는 척도로 부상하고 있으나 첨단 반도체가 집적된 AI컴퓨팅 인프라는 적정 투자 규모를 사전에 예측하기 어려우며, 기술 시장의 변화가 빠르다. 이에 따라, 정부는 앞으로 특별위원회에서 수시로 추진 상황을 점검하고, 각종 현안에 유연하게 밀접 대응할 계획이다. 이날 회의에 참석한 업스테이지의 김성훈 대표는 범용 AI(AGI) 강국으로 가는 길을 주제로 인재, GPU의 중요성과 우리나라가 보유한 역량을 강조하며 AGI 강국으로 도약하는 데 필요한 지원방안에 대해 발표했다. 이어, 배경훈 LG AI연구원장은 최신 AI 기술 동향과 한국형 AI 발전 방향을 주제로 낮은 비용으로 동등 수준의 성능 확보가 가능한 추론 강화 모델에 대해 설명하고, 이를 바탕으로 개발된 LG의 AI모델 엑사원 성과를 소개했다. 민간의 발표와 함께 국가AI컴퓨팅센터 관련 현안으로 사업 공모와 사업설명회 개최 등 사업 추진 경과와 GPU, 서비스, 입지, 전력, 정책금융 프로그램 등 주요 항목별 현안 및 대응 방향에 대해 논의했다. 정부는 이번 특별위원회를 통해 제시된 정책 제언을 바탕으로 AI컴퓨팅 인프라 확충 정책을 보완해나갈 계획이다.

2025.02.17 15:40박수형

정부, 1분기 내 'AI컴퓨팅인프라 종합대책' 세운다

정부가 새해 1분기에 'AI 컴퓨팅인프라 종합대책'을 수립한다. AI 3대 선진국 도약을 위해 인프라 확충, 사업화와 상용화 기반 조성에 나선다는 계획이다. 기획재정부를 비롯한 관계부처가 이같은 내용을 담아 2025년 경제정책 방향을 2일 발표했다. AI 컴퓨팅인프라 종합대책에는 국가 AI컴퓨팅센터 구축의 내용이 담긴다. 새해에 4천억 원 규모를 지원해 NPU, PIM 등 AI 반도체 R&D를 지원하며 향후 센터를 구축할 때 국산 AI반도체를 도입한다는 방침이다. 아울러 AGI R&D와 데이터센터 규제 개선 내용이 담긴다. 최근 국회를 통과한 AI 기본법의 신속한 시장 안착을 위해 새해 상반기에 후속조치를 추진한다. 또 AI 관련법의 단계적이고 유기적인 정비체계를 마련한다. 중소기업의 AI 활용을 지원해 AI 기술의 사업화와 상용화를 위한 기반을 조성하고 AI 핵심인재 양성 확보도 추진한다. 특히 AI 투자 활성화를 위해 국가전략기술 분야에 AI와 미래형 운송수단을 추가한다. 이를 통해 세제지원에 나선다. AI와 함께 3대 게임체인저로 꼽히는 바이오와 양자 분야 투자도 집중한다. 상반기 내 AI 기반 바이오 혁신전략을 세운다. 이는 한국형 바이오헬스 클러스터 혁신전략과 디지털바이오 육성을 위한 것이다. 또 공공 바이오파운드리를 구축한다. 아울러 민관합동 양자전략위원회를 출범시켜 양자 산업의 체계적인 육성을 위해 5개년 종합계획을 마련할 계획이다. 한편 단말기유통법 폐지안이 국회를 통과하면서 후속 조치를 추진하고 중고폰 유통 활성화를 위해 새해 상반기 안심거래 사업자 인증제를 시행한다. 또 알뜰폰에 대한 도매대가 인하 등을 포함한 알뜰폰 경쟁력 강화방안을 1월에 마련할 예정이다. 소프트웨어 수출 활성화를 위해 디지털 수출개척단 활동과 함께 SaaS 해외진출을 지원한다. 특히 ICT 수출입 통계에 콘텐츠와 ICT 분야 서비스 수출입 동향도 포함시킨다.

2025.01.02 11:04박수형

정부 AI에 1조 투자한다는데...업계 "AX·컴퓨팅 인프라 지원부터"

최근 정부가 내년도 인공지능(AI) 투자 계획을 발표한 가운데 업계는 다소 아쉽다는 평가다. 이에 예산 규모보다 쓰임에 더 집중해야 한다는 목소리가 이어지고 있다. 산업계는 예산이 AI전환(AX) 확산과 컴퓨팅 인프라 지원 분야에 집중돼야 한다고 입을 모으고 있다. 지난 27일 과학기술정보통신부는 제9회 국가과학기술자문회의 심의회의에서 '내년도 국가R&D사업 예산 배분·조정안'을 확정한 바 있다. 주요 R&D 예산은 이번 과기정통부안 기준 24조8천억원이다. 정부는 AI 분야에 1조1천억원을 투자한다. 올해 8천억원보다 35.5% 늘어 처음으로 1조원을 넘겼다. 예산은 범용인공지능(AGI) 개발과 AI 안전, AI반도체 독자기술 확보에 집중될 계획이다. R&D 예산 부족 지속…"투자 규모보다 쓰임새에 집중해야" AI 산업계는 내년 AI R&D 예산 규모가 여전히 부족하다고 평가하고 있다. 국내에서 AI 서비스를 운영하는 업계 한 관계자는 "정부가 예산을 환골탈태 수준으로 올렸다고 강조했지만 국내 AI 산업계를 일으킬만한 정도는 아니다"고 말했다. 그는 "AI 기술은 무한경쟁이므로 투자 규모를 1년 단위로 쪼개 생각하는 것도 무의미하다"고 주장했다. 정부가 사상 처음으로 AI R&D에 1조원 넘게 투자하지만 해외 정부 투자 단위에 비하면 턱 없이 부족하다는 의견도 나왔다. 생성형 AI 모델과 서비스 연구자 B씨는 "캐나다는 최근 약 2조4천억원 규모의 AI 투자 계획을 발표했다"며 "다른 주요 국가 투자와 비교하면 여전히 아쉽다"고 말했다. 내년 AI R&D 예산 관련해 업계 관계자들은 투자 규모보다는 실행 방안에 더 집중해야 한다고 입을 모았다. 예산이 어떤 사업에 어떤 형태로 들어가는지가 관건이라는 평가다. 이들은 AX 활성화에 투자가 이뤄져야 한다고 기대했다. 업계 관계자는 "다수 산업이 AI 도입을 여전히 꺼리는 상황이다"며 "정부가 AX를 실천하려는 기관, 조직에 인센티브를 부여하는 방식으로 AX 활성화를 이끌어야 한다"고 강조했다. 국내 AI 스타트업 대표 C씨는 "글로벌 기업은 경량화, 산업 융합, 멀티모달 3가지 키워드로 AI를 개발하고 있다"며 "단기적 R&D 투자 방향성을 AX 중심으로 전환해야 한다"고 주장했다. AI 개발에 필요한 고비용 컴퓨팅 인프라 지원에도 투자가 집중돼야 한다는 의견도 나왔다. 업계 또 다른 관계자는 "산업계와 학계를 막론하고 AI 분야에서 고비용 컴퓨팅 인프라 확보에 많은 어려움을 겪고 있다"며 "여기에도 투자 집중이 이뤄져야 한다"고 말했다. AI 기업이나 기관이 컴퓨팅 인프라를 실제 쉽고 저렴하게 사용할 수 있어야 원활한 AI 연구 개발이 가능하다는 의미다. 그는 "그래픽처리장치(GPU)는 정부 자산으로 구입하고, 운영은 경험 많은 민간 전문기업에 위탁하는 형식으로 생태계를 만드는 법도 고려해 볼 수 있다"고 덧붙였다. 정부 관계자는 "기획재정부가 내년 정부 예산안 R&D를 비롯해 전체 정부 예산안을 오는 9월 2일 국회로 넘길 것"이라며 "보통 8월 말 정도 정부 예산안이 확정된다"고 밝혔다. 그는 "이후 모든 건 국회에서 결정될 것"이라며 "여야가 R&D 예산 부분에서 원활히 합의할 경우 예산을 더 증액할 수 있는 가능성도 있다"고 밝혔다.

2024.06.30 08:18김미정

HPE-엔비디아, 생성형 AI 인프라 협업 포트폴리오 출시

HPE는 엔비디아와 공동 개발한 AI 솔루션 'HPE 기반 엔비디아 AI 컴퓨팅(NVIDIA AI Computing by HPE) 포트폴리오'를 19일 출시했다. 이는 HPE가 기업 고객들이 생성형 AI 도입을 가속할 수 있도록 엔비디아와 협력해 개발한 AI 솔루션 및 고투마켓 포트폴리오다. 포트폴리오의 주요 제공 서비스 중 하나는 HPE 프라이빗 클라우드 AI다. HPE 프라이빗 클라우드 AI는 엔비디아의 AI 컴퓨팅, 네트워킹과 소프트웨어를 HPE의 AI 스토리지, 컴퓨팅, 및 HPE 그린레이크 클라우드와 가장 견고하게 통합됐다. IT 운영이 워크로드 및 IT 효율성을 향상시킬 수 있도록 새로운 옵스램프 AI 코파일럿을 제공한다. 전체 수명주기 관리를 포함한 셀프 서비스 클라우드 경험을 제공하며, 다양한 AI 워크로드와 사용 사례를 지원하기 위해 4가지 사이즈의 다른 구성으로 제공된다. HPE가 제공하는 모든 엔비디아 AI 컴퓨팅 제품 및 서비스는 양사의 공통 고투마켓 전략을 기반으로 제공되며, 이 전략에는 판매팀 및 채널 파트너, 교육, 그리고 딜로이트, HCL테크, 인포시스, TCS 및 위프로 등 SI 업체를 아우르는 글로벌 네트워크를 포함한다. HPE 프라이빗 클라우드 AI는 혁신을 가속화하고 투자 수익을 높이는 동시에 AI로 인한 기업의 리스크를 관리할 수 있는 독특한 클라우드 기반 경험을 제공한다. 이 솔루션은 고유 데이터를 활용한 추론, 미세 조정 및 RAG AI 워크로드를 지원한다. 데이터 프라이버시, 보안, 투명성, 거버넌스 요건을 위한 엔터프라이즈급 제어 기능을 제공하며, 생산성 향상을 위한 IT옵스 및 AI옵스 기능을 포함한 클라우드 경험을 갖췄다. AI 및 데이터 소프트웨어 스택의 기반은 엔비디아 NIM 추론 마이크로 서비스를 포함한 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼으로 시작된다. 엔비디아 AI 엔터프라이즈는 데이터 사이언스 파이프라인을 가속하고, 프로덕션급 코파일럿 및 기타 생성형 AI 애플리케이션의 개발 및 배포를 간소화한다. 엔비디아 AI 엔터프라이즈에 포함된 엔비디아 NIM은 최적화된 AI 모델 추론을 위한 사용하기 쉬운 마이크로서비스를 제공하여 다양한 사용 사례에 대해 프로토타입에서 안전한 AI 모델 배포로 원활하게 전환할 수 있도록 한다. 엔비디아 AI 엔터프라이즈 및 엔비디아 NIM을 보완하는 HPE AI 에센셜 소프트웨어는 적응형 솔루션, 지속적인 기업 지원, 안전한 AI 서비스를 제공하는 통합 컨트롤 플레인을 갖춘 준비된AI 및 데이터 기반 툴 세트를 제공하며, 이를 통해 데이터 및 모델 준수, 확장 가능한 기능 등 AI 수명 주기 전반에 걸쳐, AI 파이프라인이 규정을 준수하는 동시에 설명 및 재현이 가능하도록 보장한다. HPE 프라이빗 클라우드 AI는 엔비디아 스펙트럼-X 이더넷 네트워킹, HPE 알레트라 MP 파일 스토리지, 엔비디아 L40S·H100 NVL 텐서코어 GPU·GH200 NVL2 등을 지원하는 HPE 프로라이언트 서버로 구성된다. HPE 프라이빗 클라우드 AI는 HPE 그린레이크 클라우드 기반의 셀프 서비스 클라우드 환경을 제공한다. HPE 그린레이크 클라우드 서비스를 이용하는 고객들은 단일 플랫폼 기반 컨트롤 플레인을 통해 하이브리드 환경 전반에서 엔드포인트, 워크로드 및 데이터를 자동화, 조정 및 관리할 수 있는 관리 기능 및 옵저버빌리티를 제공 받으며, 워크로드 및 엔드포인트의 지속 가능성 관련 지표도 확인할 수 있다. 옵스램프의 IT 운영은 HPE 그린레이크 클라우드와 통합돼 모든 HPE 제품 및 서비스에 대한 통합 옵저버빌리티 및 AI옵스를 제공한다. 또한, 엔비디아 NIM 및 AI 소프트웨어 같은 엔비디아 가속 컴퓨팅 스택과 엔비디아 텐서 코어 GPU, AI 클러스터 및 엔비디아 퀀텀 인피니밴드, 엔비디아 스펙트럼 이더넷 스위치에 대한 엔드투엔드 통합 옵저버빌리티도 제공한다. 옵스램프 운영 코파일럿은 엔비디아의 가속 컴퓨팅 플랫폼을 활용해 대규모 데이터를 대화형 어시스턴트를 통해 분석하고 통찰력을 제공하여 운영 관리의 생산성을 높인다. 옵스램프는 또한 크라우드스트라이크 API와 통합돼 전체 인프라와 애플리케이션 전반에 걸친 엔드포인트 보안 현황을 한눈에 볼 수 있도록 한다. 안토니오 네리 HPE 회장 겸 CEO는 “생성형 AI는 기업 혁신을 위한 엄청난 잠재력을 가지고 있지만, 단편화된 AI 기술의 복잡성은 대규모 기업의 AI 기술 도입을 어렵게 하는 많은 리스크와 장애물을 포함하고 있어 기업의 가장 가치있는 자산인 고유 데이터를 위험에 처하게 할 수 있다”며 “HPE와 엔비디아는 기업에서 생성형 AI의 엄청난 잠재력을 발휘할 수 있도록 하기 위해 AI를 위한 포괄적인 턴키 프라이빗 클라우드를 공동 개발했다”고 말했다. 젠슨 황 엔비디아 참립자 겸 CEO는 “생성형 AI와 가속 컴퓨팅은 모든 산업이 산업 혁명에 동참하기 위해 경쟁하면서 근본적인 변화를 일으키고 있다”며 “엔비디아와 HPE는 우리의 기술을 이렇게 깊게 통합한 적이 없었으며, 엔비디아의 전체 AI 컴퓨팅 스택과 HPE의 프라이빗 클라우드 기술을 결합해 기업 고객과 AI 전문가들에게 AI의 경계를 확장할 수 있는 가장 진보된 컴퓨팅 인프라와 서비스를 제공할 계획”이라고 강조했다.

2024.06.19 15:30김우용

HPE, 생성형 AI용 슈퍼컴퓨팅 포트폴리오 출시

HPE는 지난 18일 엔비디아 연례 컨퍼런스 엔비디아 GTC에서 생성형 AI, 딥러닝, 머신러닝 애플리케이션의 운영 고급화를 위한 업계 가장 통합적인 AI 네이티브 포트폴리오를 새롭게 업데이트 했다고 26일 발표했다. HPE와 엔비디아는 공동 엔지니어링한 풀스택 생성형 AI 솔루션을 선보였다. HPE 머신러닝 추론 소프트웨어 프리뷰 버전과 엔터프라이즈급 검생증강생성(RAG) 레퍼런스 아키텍처 등도 소개됐다. HPE와 엔비디아는 블랙웰 플랫폼 기반 제품 개발을 지원한다. 대규모 AI 모델의 개발 및 훈련을 위해 사전 구성 및 테스트된 풀스택 솔루션을 원하는 기업을 위해 생성형 AI용 HPE 슈퍼컴퓨팅 솔루션이 출시됐다. 고객들이 생성형 AI 및 딥러닝 프로젝트 개발을 가속할 수 있도록 목적 기반의 턴키 솔루션은 엔비디아 칩으로 구동되며 최대 168개의 엔비디아 GH200 그레이스 호퍼 슈퍼칩이 제공된다. 해당 솔루션은 대기업, 연구소 및 정부 기관들이 인공지능 및 머신러닝 소프트웨어 스택을 활용한 모델 개발 과정을 더욱 단순화할 수 있도록 지원한다. 이러한 소프트웨어 스택은 고객들이 대규모 언어 모델(LLM), 추천 시스템, 벡터 데이터 베이스 등 생성형 AI와 딥러닝 프로젝트를 더욱 빠르게 추진할 수 있도록 한다. 설치에서부터 설치까지 모든 서비스가 제공되는 턴키 솔루션을 이용해 AI 연구 센터와 대기업은 가치 창출까지의 시간을 더욱 단축하고 훈련은 2-3배 더욱 신속히 진행할 수 있다. 디스커버 바스셀로나 2023 행사에서 선보였듯 HPE의 생성형 AI용 엔터프라이즈 컴퓨팅 솔루션은 이제 유연하고 확장 가능한 사용량 기반 과금 모델을 제공하는HPE 그린레이크를 통해 이용할 수 있다. 엔비디아와 공동 엔지니어링해 사전 구성된 미세 조정 및 추론 솔루션은 생성형 AI 애플리케이션을 제작하기 위해 필요한 정확한 컴퓨팅, 스토리지, 소프트웨어, 네트워킹 및 컨설팅 서비스를 제공함으로써 소요 시간과 비용을 절감해 준다. 이러한 AI 네이티브 풀스택 솔루션은 프라이빗 데이터 기반의 파운데이셔널 모델을 제작하기 위해 필요한 속도, 규모, 관리 기능을 제공하고 하이브리드 클라우드 모델 내 생성형 AI 애플리케이션을 배포할 수 있도록 지원한다. HPE와 엔비디아의 고성능 AI 컴퓨팅 클러스터 및 소프트웨어를 기반으로 해당 솔루션은 경량 모델 미세조정, RAG, 대규모 추론 등에 이상적이다. 이 솔루션을 실행하는 700억 개의 파라미터를 가진 라마 2 모델의 미세 조정 시간은 노드 수에 따라 선형적으로 감소하여 16노드 시스템에서는 6분이 소요된다. 이러한 속도와 성능 덕분에 고객은 버추얼 어시스턴트, 지능형 챗봇, 기업용 검색과 같은 AI 애플리케이션으로 비즈니스 생산성을 개선하여 가치 실현을 더욱 빠르게 달성할 수 있다. 또한, 해당 솔루션은 HPE 프로라이언트 DL380a Gen11 서버를 기반으로 엔비디아 GPU, 엔비디아 스펙트럼-X 이더넷 네트워킹 플랫폼, 엔비디아 블루필드-3 DPU로 사전 구성됐다. 이에 더해 HPE의 머신러닝 플랫폼과 애널리틱스 소프트웨어, 생성형 AI 모델 추론용으로 최적화된 엔디비아 NIM 마이크로서비스가 제공되는 엔비디아 AI 엔터프라이즈 5.0 소프트웨어뿐만 아니라 엔비디아 네모 리트리버 및 기타 데이터 사이언스와 AI 라이브러리를 이용할 수 있다. 솔루션 도입 시AI 기술 격차를 해소하기 위해서 HPE 서비스 전문가들이 적합한 모델 조정 기술 등을 포함해 솔루션의 설계, 배포부터 관리까지 지원한다. HPE와 엔비디아는 기업들이 AI 및 ML 개념검증 단계에서 실제 애플리케이션 생산으로 넘어갈 수 있는 소프트웨어 솔루션을 제공하기 위해 협업하고 있다. HPE 고객들은 HPE 머신 러닝 추론 소프트웨어 솔루션을 프리뷰 버전으로 이용할 수 있으며 해당 소프트웨어를 이용해 기업들은 빠르고 안전하게 ML 모델을 대규모로 배포할 수 있다. 프라이빗 데이터를 이용하여 생성형 AI 애플리케이션을 빠르게 구축 및 배포해야 하는 기업들을 위해서 HPE는 엔비디아 네모 리트리머 마이크로 서비스 아키텍처에 기반한 엔터프라이즈 RAG용 레퍼런스 아키텍처를 개발했다. 해당 레퍼런스 아키텍처는 HPE 에즈메랄 데이터 패브릭 소프트웨어와 파일스토리지용 HPE 그린레이크로부터 추출한 종합적인 데이터 파운데이션을 기반으로 한다. 이외에도 데이터 준비, AI 훈련 및 추론 등을 지원하기 위해 해당 솔루션은 HPE 에즈메랄 유니파이드 애널리틱스 소프트웨어와 HPE의 AI 소프트웨어에서 모든 오픈소스 툴과 솔루션을 병합하여 사용할 수 있도록 했다. HPE 머신 러닝 데이터 매니지먼트 소프트웨어, HPE 머신 러닝 개발환경 소프트웨어, 신규 HPE 머신러닝 추론 소프트웨어 등도 이에 해당된다. HPE 소프트웨어는 HPE 슈퍼컴퓨팅과 생성형 AI 용 엔터프라이즈 컴퓨팅 솔루션 모두에서 이용가능해 고객은 생성형 AI 워크로드를 일정한 환경에서 관리할 수 있다. HPE는 향후 새롭게 발표된 엔비디아 블랙웰 플랫폼을 기반으로 제품을 개발할 계획이며 이러한 제품은 2세대 트랜스포머 엔진을 통합해 생성형 AI 워크로드를 가속한다. 엔비디아 GB200 그레이스 블랙웰 슈퍼칩, HGX 200, HGXB100 등이 장착된 HPE 제품에 관한 더욱 자세한 정보는 추후 공개될 예정이다. 안토니오 네리 HPE 회장 겸 CEO는 “생성형 AI의 미래를 실현하고 AI 생명주기 전반을 다루기 위한 솔루션은 설계부터 하이브리드로 제작되어야 한다”며 “AI는 하이브리드 클라우드 환경이 필요한 워크로드로, 온프레미스나 코로케이션 시설, 퍼블릭 클라우드에서 AI 모델을 훈련하는 것에서부터 엣지에서의 추론 작업까지 모든 환경에 걸쳐 진행된다”고 설명했다. 그는 “HPE와 엔비디아는 오랫동안 혁신을 위해 협력해왔다. 양사는 공동 설계한 AI 소프트웨어 및 하드웨어 솔루션을 지속적으로 선보이며 고객들이 기획에서부터 제작까지 생성형 AI를 가속해서 개발하고 배포할 수 있도록 도와줄 것”이라고 강조했다. 젠슨 황 엔비디아 창립자 겸 CEO는 “생성형 AI는 커넥티드 디바이스, 데이터 센터 및 클라우드 내 데이터에서 인사이트를 도출해내며 전 산업의 혁신을 일으킬 수 있다”며 “엔비디아와 HPE의 협력 확대를 통해 기업들은 데이터를 활용하여 새로운 AI 애플리케이션을 개발 및 배포함으로써 전례없는 생산성 향상을 경험하고 비즈니스를 새롭게 전환할 수 있을 것”이라고 밝혔다.

2024.03.26 16:44김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"요금 올리거나, 무료 풀거나"…OTT, 전략 분화

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[ZD브리핑] 아시아 IT 박람회 컴퓨텍스 개최...21대 대선 후보 첫 토론회

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현