• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'엔비디아'통합검색 결과 입니다. (663건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'억만장자' 스티브 코헨 "엔비디아 주가 폭락은 잘못된 정보 때문"

미국 유명 헤지펀드 '포인트72'의 설립자이자 억만장자인 스티브 코헨이 중국 인공지능(AI) 스타트업 딥시크(DeepSeek) 쇼크로 엔비디아 등 기술주가 폭락한 것을 두고 잘못된 정보 때문이라고 지적했다. 29일(현지시간) 파이낸셜타임즈에 따르면 스티브 코헨은 미국 마이애미에서 열린 헤지펀드 컨퍼런스에 참석해 “딥시크 AI 그룹의 등장이 이 분야 강세를 불러올 것”이라며 “그것이 인공 초지능으로의 이동을 앞당기고 있다”고 말했다. 이날 그는 최근 있었던 주가 폭락에 대해서도 언급했다. 앞서 딥시크가 공개한 새로운 모델은 엔비디아가 출시한 비교적 낮은 성능의 칩을 활용해 훈련한 것으로 알려졌다. 이에 AI 모델 개발에 필수적인 것으로 여겨졌던 엔비디아의 최첨단 AI 칩이 필요하지 않을 수 있다는 전망이 나오며 엔비디아 주가는 16.97% 급락한 바 있다. 스티브 코헨은 “일을 하지 않고 떠드는 사람들이 많고 그들은 투자자와 대중에게 잘못된 정보를 제공할 수 있다”며 “최근에도 그런 모습을 봤다”고 말했다. 이어, “AI는 엄청난 변화이며 모든 사람과 그들이 삶을 영위하는 방식, 사업을 하는 방식에 영향을 미칠 것”이라며 “사람들이 어제처럼 의심하는 순간이 있을 것이고 주식을 소유한 사람 중에는 자신이 무엇을 소유하고 있는지, 왜 소유하고 있는지를 모르는 사람이 많을 것”이라고 덧붙였다.

2025.01.29 11:39김민아

엔비디아 "딥시크 AI 혁신, GPU 수요 더 증가시킬 것"

엔비디아가 27일(미국 현지시간) 중국 AI 스타트업 딥시크(DeepSeek)가 공개한 새 AI 모델 'R1'에 대해 긍정적인 평가를 내왔다. 딥시크 R1은 20일 공개된 추론 특화 AI 모델이다. 자체 테스트 결과에 따르면 딥시크 R1은 일부 테스트에서 오픈AI의 추론 특화 모델 'o1'보다 나은 성능을 보였다. 또 2022년 미국 상무부의 수출 통제 조치를 우회하기 위해 엔비디아가 성능을 낮춘 H800 GPU를 이용했다. 모델 훈련에 든 순수 비용은 557만6천달러(약 80억원)이며 메타가 라마(LLaMa) 등 AI 모델 개발에 투입한 비용의 10% 수준이다. 지난 주 알렉산더 왕 스케일AI CEO는 미국 CNBC와 인터뷰에서 "딥시크가 미국 정부의 수출 규제를 우회해 고성능 GPU를 썼을 것"이라고 주장했다. 그러나 엔비디아는 "시크가 사용한 GPU가 미국의 수출 규정을 완전히 준수했다"고 확인했다. 27일 미국 증권 시장에서는 딥시크 R1 이후 비교적 성능이 낮은 GPU로 고성능 AI 모델 개발이 활발해질 것이라는 전망에 따라 엔비디아 주가가 크게 하락했다. 1주당 가격은 지난 주 대비 16.86% 하락한 118.58달러(약 17만 2천원)로 마감했고 시가총액은 6천억 달러(약 868조원) 가까이 줄었다. 미국 CNBC에 따르면 엔비디아는 "딥시크는 탁월한 AI 발전의 사례이며, 사용 가능한 모델과 완전한 수출 통제 준수 하에 구축된 컴퓨팅을 활용하여 새로운 모델을 생성하는 방법을 잘 보여준다"고 밝혔다. 엔비디아 관계자는 이어 "추론은 상당히 많은 엔비디아 GPU와 고성능 네트워킹이 필요하다. 이와 같은 딥시크의 혁신이 GPU 수요를 더욱 증가시킬 것"이라고 전망했다.

2025.01.28 16:22권봉석

"엔비디아 'RTX 50' 시리즈 사자"...텐트 치고 대기줄

엔비디아 지포스 RTX 5090 탑재 그래픽카드 출시가 이달 말로 다가온 가운데 미국 PC전문 매장 앞에 벌써부터 텐트를 치고 기다리는 사람들이 나타났다. 미국 소셜미디어 레딧에는 27일(현지시간) PC 전문 대형 매장인 마이크로센터 앞에 설치된 텐트 사진이 올라왔다. 대기자 중 한 사람은 직접 레딧에 글을 올려 "나는 전매상(되팔이)이 아니며 개인 목적으로 그래픽카드를 사려는 것이다. 추가 금액을 내지 않으려고 이렇게 기다리고 있는 것"이라고 밝혔다. 미국과 일본 등 주요 IT 매체 테스트 결과에 따르면 지포스 RTX 5090은 전세대(RTX 4090) 대비 벤치마크 프로그램에서는 최대 40% 성능 향상을 보였다. 4K(3840×2160 화소) 해상도에서도 전작 대비 30% 성능이 향상됐다. 최근 5년간 출시된 엔비디아 그래픽카드는 출시 당일부터 짧으면 한 달, 길면 세 달 이상 극심한 물량 부족 현상을 겪었다. 특히 미국이나 유럽에서는 출시 직후 정가로 산 제품을 중고 거래 플랫폼에서 더 비싼 가격에 되팔아 이익을 챙기는 일이 빈번했다. 국내 시장에서도 해외 시장 가격이나 제조사 권장가 대비 비싼 가격으로 여러 번 논란이 일었다. 지포스 RTX 5090 그래픽카드는 국내 시장에 2월 초부터 본격 공급 예정이다. 엔비디아가 제시한 권장가는 1천999달러(약 290만원)다. 그래픽카드 제조사와 PC 업계 관계자들은 "엔비디아가 직접 제조한 지포스 RTX 5090 파운더스 에디션은 엔비디아가 제시한 가격대로 판매되겠지만 기타 제품은 비싼 가격이 예상된다"고 전망했다.

2025.01.28 14:29권봉석

엔비디아 '지포스 RTX 5090' 성능 공개... 전작比 최대 40% ↑

엔비디아가 올 초 CES 2025 기조연설에서 공개한 지포스 RTX 5090의 테스트 결과가 국내외 IT 매체를 통해 24일 오전 0시경 일제히 공개됐다. 지포스 RTX 5090은 블랙웰(Blackwell) 아키텍처 기반 PC용 GPU이며 5세대 텐서 코어, 4세대 레이트레이싱(RT) 코어, 최대 GDDR7 32GB 메모리를 활용해 게임 등 3D 성능과 AI 처리 성능을 강화했다. 미국과 일본 등 주요 IT 매체 테스트 결과에 따르면 지포스 RTX 5090은 전세대(RTX 4090) 대비 벤치마크 프로그램에서는 최대 40% 성능 향상을 보였다. 4K(3840×2160 화소) 해상도에서도 전작 대비 30% 성능이 향상됐다. 3D마크 '스틸노매드' 벤치마크에서 51% 점수 향상 일본 PC워치는 24일 "지포스 RTX 5090 파운더스 에디션 그래픽카드와 전세대 제품(RTX 4090 파운더스 에디션) 성능을 비교한 결과 3D마크 등 벤치마크에서 성능 향상이 눈에 띈다"고 밝혔다. 이 매체는 "3D마크에 추가된 다이렉트X 12 기반 '스틸노매드' 실행시 RTX 5090은 14,060점, RTX 4090은 9,301점으로 51% 점수가 높아졌다. 레이트레이싱 성능 테스트인 '포트로얄' 점수 역시 RTX 4090(26,193점) 대비 39% 더 높다"고 밝혔다. 미국 PC 전문매체 톰스하드웨어는 "3D마크 다이렉트X 레이트레이싱 기능 테스트에서 RTX 4090이 초당 137.91 프레임, RTX 5090이 108.64 프레임이 나왔으며 드라이버 튜닝이나 업데이트가 필요한 상황"이라고 설명했다. 4K 해상도 게임에서 평균 30% 가량 성능 향상 톰스하드웨어는 4K 해상도, 그래픽 수준 '울트라'로 설정한 상태에서 16개 게임의 초당 프레임 수 평균을 낸 결과도 공개했다. RTX 5090은 초당 105.6프레임, RTX 4090은 초당 84.4 프레임이었다. 이 매체는 "4K 해상도, 그래픽 수준 '높음'이 RTX 5090의 명확한 소비층이며 적절한 디스플레이가 있다면 더 높은 해상도로 구동하는 것도 가능할 것"이라고 밝혔다. PC워치 역시 4K 해상도의 성능 향상에 주목했다. 이 매체는 "RTX 5090은 마이크로소프트 플라이트 시뮬레이터 2024에서 RTX 4090 대비 48% 성능 향상, F1 24에서는 24-26%, 사이버펑크 2077에서 28-32% 성능 향상이 있었다"고 밝혔다. "4K 해상도서 최대 성능 발휘... 추가 최적화 필요" 톰스하드웨어는 "지포스 RTX 5090은 4K 해상도와 최대 그래픽 설정으로 게임을 즐기려는 소비자에게 가장 적합한 선택이며 모든 게이머가 갖고 싶어하지만 극소수만 살 수 있는 제품"이라고 평가했다. 이어 "이 GPU의 드라이버와 소프트웨어가 아직 완전히 성숙하지 않았으며, 일부 게임과 애플리케이션에서 추가 최적화가 필요한 상황"이라고 덧붙였다. PC워치는 "RTX 5090의 성능은 전작인 RTX 4090을 뛰어넘고 DLSS 4의 멀티프레임 생성 기능은 유용하지만 실제 게임에서 더 폭넓은 검증이 필요하다"고 언급했다. 국내 시장에 2월 초부터 본격 공급 예정 지포스 RTX 5090 탑재 그래픽카드는 오는 1월 말 출시 예정이다. 시장 수요에 비해 적은 초기 물량 탓에 당분간 시장에서 쉽게 구하기 힘들 것으로 보인다. 영국 IT 온라인 유통업체 OCUK는 "지포스 RTX 5090 그래픽카드 재고가 10대 미만이며 출시 시 물량은 두 자릿수에 그칠 것으로 예상된다. 한 단계 아래 제품인 지포스 RTX 5080 재고도 수백 개에 그칠 전망"이라고 밝혔다. 지포스 RTX 5090 그래픽카드는 국내 시장에 2월 초부터 본격 공급 예정이다. 24일 한 제조사 관계자는 "RTX 5090 탑재 그래픽카드 샘플이 23일에야 국내에 들어왔고 제조 시설이 있는 중국도 연휴 기간이 겹쳐 초기 물량은 적을 것"이라고 말했다. 주요 제조사들은 국내 가격에 가장 큰 영향을 미치는 기준 환율 책정에도 고심중이다. 또다른 제조사 관계자는 "현재 원-달러 환율이 1천450원 아래로 떨어졌지만 설 연휴 중 추이를 봐야 하는 상황"이라고 설명했다.

2025.01.24 13:41권봉석

에이수스, 상반기 투입할 게이머 겨냥 고성능 제품 공개

에이수스코리아는 23일 오후 서울 삼성동에서 '2025 엣지 오브 이노베이션' 세미나를 진행하고 올 상반기 투입할 PC 하드웨어 신제품을 미디어 관계자와 인플루언서, 일반 소비자에 공개했다. 에이수스는 올 초부터 국내 시장에 AMD 라이젠 9000/7000 등 소켓 AM5 적용 프로세서 대상 보급형 B850 칩셋 메인보드, 인텔 코어 울트라 200S 프로세서용 B860 메인보드를 공급중이다. 이들 제품에는 복잡한 설명서 대신 자연스런 질문을 던져 메인보드에 대한 궁금증을 풀 수 있는 윈도용 소프트웨어 'AI 어드바이저', 메인보드 각 연결부 상태를 점검하고 설정할 수 있는 펌웨어 내장 그래픽 인터페이스 'Q대시보드'가 제공된다. 이날 이수현 에이수스코리아 매니저는 "이들 신제품은 프로세서에 안정적인 전력을 공급할 수 있도록 전원부를 강화하는 한편 그래픽카드 장착과 NVMe M.2 SSD 교체를 돕는 Q릴리즈 장치를 더했다"고 설명했다. 에이수스코리아는 설 연휴가 끝나는 2월 초부터 국내 시장에 엔비디아 지포스 RTX 50시리즈 GPU 탑재 그래픽카드도 공급할 예정이다. 최상위 제품인 'ROG 아스트랄 RTX 5090'은 냉각팬을 4개 탑재해 장시간 구동시 냉각 성능을 개선했다. GPU와 열을 발산하는 금속 소재 히트싱크 사이에는 온도에 따라 고체에서 액체를 오가며 밀착을 극대화한 소재인 형상변환 서멀패드를 적용했다. 이종원 에이수스코리아 매니저는 "GPU 변형을 막는 댐퍼, 특수 PCB 코팅으로 내구도를 높였다"고 설명했다. 에이수스코리아는 지포스 RTX 50 시리즈 그래픽카드 구매자 대상으로 월정액 결제나 인터넷 접속 없이 실시간으로 각종 생성 AI를 구동할 수 있는 소프트웨어 '뮤즈트리'도 제공할 예정이다. 에이수스코리아는 지난 13일 스마트폰과 노트북, 태블릿 등 와이파이7 내장 기기를 겨냥한 고성능 유무선공유기 3종을 국내 출시하기도 했다. 최상위 제품인 ROG 랩처 GT-BE98은 6GHz 대역폭 11.5Gbps, 5GHz 대역폭 11.4Gbps(5.76Gbps×2), 2.4GHz 1.37Gbps 등 최대 25Gbps 대역폭을 지원한다. 고성능 게임PC에 모든 트래픽을 몰아주는 ROG 퍼스트 등 기능도 갖췄다. RT-BE92U는 6GHz 5.76Gbps, 5GHz 2.88Gbps, 2.4GHz 1.03Gbps 등 총 9.7Gbps 대역폭을 지원하며 10Gbps 단자 1개, 2.5G 단자 4개를 탑재했다. RT-BE58U는 5GHz 2.88Gbps, 2.4GHz 688Mbps 등 3.6Gbps 대역폭을 확보한 보급형 제품이다. 세 제품 모두 직관적인 웹 인터페이스를 내장했고 악성코드나 피싱 사이트 접속을 막는 'Ai프로텍션', 네트워크 상태를 진단하는 원터치 보안 스캔, 다중 VPN 접속 기능을 지원한다. 이날 이종혁 에이수스코리아 이사는 "에이수스는 혁신, 품질, 고객 중심, 도전, 지속가능성을 핵심 가치로 삼아 앞으로도 고객의 요구를 반영한 제품 개발과 지속적인 도전을 통해 비즈니스의 지속가능성을 추구할 것"이라고 밝혔다.

2025.01.24 09:29권봉석

SK하이닉스, 작년 영업익 23조원 '역대 최대'…HBM·eSSD 효과

SK하이닉스가 HBM, eSSD 등 AI용 고부가 메모리 사업의 확대로 분기, 연간 모두 최대 실적을 달성하는 데 성공했다. SK하이닉스가 지난해 연 매출액 66조1천930억원, 영업이익 23조 4천673억원(영업이익률 35%), 순이익 19조7천969억원(순이익률 30%)으로 창사 이래 최대 실적을 경신했다고 23일 밝혔다. 매출은 기존 최고였던 2022년(약 44조원)보다 21조원 이상 높은 실적을 달성했고, 영업이익도 메모리 초 호황기였던 2018년(약 20조원)의 성과를 넘어섰다. 특히 4분기 매출은 전 분기 대비 12% 증가한 19조7천670억원, 영업이익 또한 15% 증가한 8조828억원(영업이익률 41%)에 달했다. 순이익은 8조65억원(순이익률 41%)을 기록했다. SK하이닉스는 “AI 메모리 반도체 수요 강세가 두드러진 가운데 업계 선두의 HBM 기술력과 수익성 중심의 경영을 통해 사상 최고의 실적을 달성했다”고 설명했다. 회사는 이어 “4분기에도 높은 성장률을 보인 HBM은 전체 D램 매출의 40% 이상을 차지했고, 기업용 SSD(eSSD, enterprise SSD)도 판매를 지속 확대했다”며 “차별화된 제품 경쟁력을 바탕으로 한 수익성 중심 경영으로 안정적인 재무 상황을 구축했고, 이를 기반으로 실적 개선세가 이어졌다”고 말했다. 회사는 AI 메모리 수요 성장에 따라 고성능, 고품질 중심의 메모리 시장으로 전환되는 상황을 설명하며 “이번 실적은 고객의 요구 수준에 맞는 제품을 적기에 공급할 수 있는 경쟁력을 갖추면 안정적인 이익 창출이 가능하다는 것을 확인했다는 점에서 의미가 있다”고 강조했다. 이 같은 실적을 바탕으로 2024년 말 SK하이닉스의 현금성 자산은 14조2천억원으로 전년 말 대비 5조2천억원 증가했으며, 차입금은 22조7천억원으로 같은 기간 6조8천억원 감소했다. 이에 따라 차입금과 순차입금 비율도 각각 31%와 12%로 크게 개선됐다. SK하이닉스는 빅테크들의 AI 서버 투자가 확대되고 AI 추론 기술의 중요성이 커지면서 고성능 컴퓨팅에 필수인 HBM과 고용량 서버 D램 수요가 계속 확대될 것으로 전망했다. 일부 재고 조정이 예상되는 소비자용 제품 시장에서도 AI 기능을 탑재한 PC와 스마트폰 판매가 확대돼, 하반기로 갈수록 시장 상황이 개선될 것으로 내다봤다. 이에 회사는 올해 HBM3E 공급을 늘리고 HBM4도 적기 개발해 고객 요청에 맞춰 공급할 계획이다. 또, 안정적인 수요가 이어지는 가운데 경쟁력을 보유한 DDR5와 LPDDR5 생산에 필요한 선단 공정 전환을 추진해 나갈 방침이다. 낸드는 작년에 이어 수익성 중심 운영과 수요 상황에 맞춘 유연한 판매 전략으로 시장에 대응해 나갈 계획이다. 한편 SK하이닉스는 연간 고정배당금을 기존 1천200원에서 1천500원으로 25% 상향해 총 현금 배당액을 연간 1조 원 규모로 확대했다. 이에 회사는 향후 배당시 고정배당금만 지급하고, 기존 배당정책에 포함됐던 연간 잉여현금흐름(FCF, Free Cash Flow)의 5%는 재무건전성을 강화하는데 우선 활용할 방침이다. 김우현 SK하이닉스 부사장(CFO)은 “고부가가치 제품 매출 비중을 크게 늘리면서 시황 조정기에도 과거 대비 안정적인 매출과 이익을 달성할 수 있는 사업 체질을 갖췄다”며 “앞으로도 수익성이 확보된 제품 위주로 투자를 이어간다는 원칙을 유지하면서 시장 상황 변화에 맞춰 유연하게 투자를 결정할 것”이라고 말했다.

2025.01.23 08:55장경윤

[미장브리핑] 트럼프 '스타게이트' 관련주 상승…한때 S&P500 최고치

◇ 22일(현지시간) 미국 증시 ▲다우존스산업평균(다우)지수 전 거래일 대비 0.30% 상승한 44156.73. ▲스탠다드앤푸어스(S&P)500 지수 전 거래일 대비 0.61% 상승한 6086.37. ▲나스닥 지수 전 거래일 대비 1.28% 상승한 20009.34. ▲도널드 트럼프 미국 대통령에 대한 기대감과 인공지능(AI) 산업 발전 낙관론이 혼합되면서 증시 상승 마감. S&P500 지수는 이날 장중 6100.81까지 오르며 최고치를 찍기도. 트럼프가 규제를 완화하고 법인세를 인하해 기업 수익이 늘어날 것이라는 예측. 올해 들어 S&P500은 3.5% 상승했으며 다우와 나스닥도 각각 3%대 올라. ▲트럼프 대통령 AI 중요성을 강조하며 오픈AI와 오라클, 소프트뱅크와 합작한 '스타게이트'를 만들고 AI 기반이 되는 데이터센터 등을 미국에 구축하는 투자 계획을 발표. 이들 회사는 1천억 달러를 투입한 뒤 트럼프 대통령 임기 중인 향후 4년간 추가로 4천억 달러를 투자할 예정. 트럼프 대통령은 이날 "새 기업은 최소 5천억달러를 미국 AI 인프라에 투자해 10만개의 일자리를 만들 것"이라고도 말해. 하지만 일론 머스크는 X에 게시한 글에서 '스타게이트'라는 이름의 새로 발표된 프로젝트를 비난하며, 합작 투자사가 5천억달러를 투자하겠다는 약속을 뒷받침할 돈이 없다고 말해. 마이크로소프트 사티아 나델라 최고경영자는 CNBC와의 인터뷰에서 "800억 달러를 쓸 수 있다는 것뿐"이라고 언급. ▲JP모건 체이스 제이미 다이먼 CEO은 스위스 다보스 세계경제포럼에서 "미국 주식 시장이 부풀려졌다"며 "적자 지출, 인플레이션, 지정학적 격변으로 인한 위험이 있으며 역사적 가치 평가에서 상위 10%, 15%에 속한다"고 진단.

2025.01.23 08:19손희연

유영상 SKT "韓, 글로벌 진출 가능한 AI 환경 구축해야"

유영상 SK텔레콤 대표가 "우리나라도 (미국처럼) AI 인프라와 여러 서비스들이 국내뿐 아니라 글로벌 시장에도 진출할 수 있는 환경이 만들어져야 한다"고 밝혔다. 유 대표는 22일 서울 코엑스 그랜드볼룸에서 열린 '2025 방송통신인 신년인사회' 후 기자들과 만나 오픈AI·오라클·소프트뱅크 3사가 합작 형태로 미국 내 AI용 데이터 센터 건설에 최대 5천억 달러(약 718조원)를 투자한다는 소식에 대해 "굉장한 프로젝트"라고 평가했다. 이어 그는 "우리나라에도 그런 프로젝트가 생겨야 될 텐데 한번 노력해 보겠다"고 덧붙였다. 최근 SK텔레콤은 AI 인프라 확충에 속도를 내고 있다. 오는 3월 엔비디아의 최신 그래픽처리장치(GPU) 'H200'을 가산 인공지능(AI) 데이터센터에 도입할 예정이다. 이에 대해 유 대표는 "H100은 이미 도입이 됐고 곧 서비스가 될 것"이라며 "H200도 3월 도입될 예정"이라고 밝혔다. 앞서 SK텔레콤은 지난해 12월 30일 가산 AI 데이터센터를 개소했으며, 이달부터 국내 도입 GPU 중 최고 성능인 엔비디아 'H100' 기반의 '구독형 GPUaaS'를 선보였다. 또한 과학기술정보통신부가 추진 중인 최대 2조원 규모의 국가 AI컴퓨팅 센터 컨소시엄 참가 계획에 대해서는 "아직 보고를 받지 못했지만 전체적인 원칙은 정부와 잘 협력해서 하겠다는 생각"이라고 답했다.

2025.01.22 17:53최지연

화웨이, '추론 특화' AI 칩 개발…엔비디아에 도전

중국 최대 통신장비 업체 화웨이가 추론 작업에 특화한 인공지능(AI) 칩을 만들어 시장을 장악한 엔비디아에 도전한다고 영국 경제일간지 파이낸셜타임스(FT)가 21일(현지시간) 보도했다. 파이낸셜타임스에 따르면 화웨이는 인공지능 훈련 영역에서는 엔비디아 시장점유율을 빼앗기 힘들다고 보고 추론으로 목표를 정했다. 추론은 훈련보다 적은 정보와 자원이 필요한 것으로 평가된다. 훈련은 인공지능을 학습시키는 과정이다. 추론은 이렇게 훈련된 인공지능으로 새로운 결론을 내는 작업이다. 화웨이는 '챗봇' 같은 인공지능 프로그램이 널리 퍼지면 훈련보다 추론 수요가 더 많을 것으로 내다봤다. 조지오스 자카로풀로스 화웨이 연구원은 “훈련은 중요하지만, 몇 번이면 된다”며 “화웨이는 추론에 집중해 더 많은 고객에게 서비스를 제공할 것”이라고 말했다. 중국 정부도 화웨이를 지원한다. 파이낸셜타임스는 중국 정부가 자국 대기업에 '엔비디아에서 벗어나 화웨이 인공지능 반도체를 더 많이 사라'고 촉구했다고 전했다. 중국 반도체 업계 관계자는 “중국에서는 화웨이를 엔비디아의 가장 강력한 경쟁자로 꼽는다”며 “화웨이 칩 설계 역량이 발전했다”고 설명했다.

2025.01.22 11:02유혜진

엔비디아, 애플 꺾고 시총 1위 탈환…"AI 투자 기대"

인공지능(AI) 칩 분야 선두주자 엔비디아가 애플을 제치고 시가총액 1위에 올라섰다고 CNBC 등 외신들이 보도했다. 21일(현지시간) 뉴욕 증시에서 엔비디아 주가는 2.27% 상승한 140.83달러로 마감됐다. 엔비디아는 이 같은 상승세에 힘입어 시총 3조5천억 달러를 기록하면서 애플을 제치고 1위로 올라섰다. 엔비디아의 주가는 2024년에는 171%, 2023년에는 약 239% 상승한 데 이어 올해 들어서도 5% 상승한 상태다. 이는 AI 칩에 대한 끊임없는 수요를 반영하고 있다고 CNBC는 전했다. 반면 애플 주가는 이 날 3% 가량 하락했다. 이는 21일 시장조사업체 카운터포인트가 2024년 4분기 중국 스마트폰 시장에서 아이폰 출하량이 전년 동기 대비 18.2% 감소해 시장 3위로 떨어졌다는 보고서를 반영한 것으로 보인다. 작년 약 30% 상승한 애플 주가는 올해 들어 약 11% 하락한 상태다. 애플은 AI 시스템 '애플 인텔리전스' 기능을 개발했지만, 애플의 사업은 AI 열풍에 대한 노출 수준이 동일하지 않았다고 해당 매체는 평했다. 21일 마감 기준으로 엔비디아의 시총은 약 3조4천500억 달러, 애플은 3조3천500억 달러이며 마이크로소프트는 3조2천억 달러로 3위를 차지했다. 엔비디아는 작년 6월과 11월 애플을 앞지르고 시총 1위에 오른 적도 있다. CNBC는 애플의 경우 중국 시장 부진 소식에 주가가 하락한 반면 엔비디아는 트럼프 2기 행정부의 AI 투자 기대감 속에 강세를 보였다고 분석했다.

2025.01.22 09:02이정현

에이수스, 엔비디아 젯슨 IoT 엣지에 슈퍼 모드 적용

에이수스코리아는 국내 출시한 엔비디아 젯슨 오린 기반 IoT 앳지 컴퓨터에 전력 추가 공급으로 성능을 향상시키는 '슈퍼 모드'가 추가됐다고 밝혔다. 엔비디아는 최근 '젯팩 SDK' 최신 버전에 젯슨 오린 플랫폼의 전력 소모를 25W-40W까지 끌어올려 내장된 CPU와 GPU, 딥러닝 가속기(DLA) 성능을 향상시키는 '슈퍼 모드'를 추가했다. 적용 가능 제품은 스마트 시티, 교통, 주차와 교통 분석, 스마트 물류 등을 위해 개발된 PE1102N, PE1101N, PE1100N 등이다. 에이수스코리아 관계자는 "슈퍼 모드 적용시 별도 업그레이드 없이 AI 연산 성능을 최대 1.7배 높일 수 있으며 거대언어모델(LLM)에 따라 토큰 생성 속도가 최대 2배 향상된다"고 밝혔다. 젯팩 SDK 버전 6.2는 현재 엔비디아 웹사이트에서 제공된다. SDK에 내장된 소프트웨어 도구로 CPU와 GPU 등 젯슨 오린 구성 요소의 최대 작동 주파수와 전력 소모 등을 작동 환경과 용도에 맞게 설정할 수 있다.

2025.01.21 09:51권봉석

엔비디아 "지포스 RTX 50, 게임·콘텐츠 제작 바꿀 것"

엔비디아는 20일 오후 서울 삼성동 스튜디오 159에서 진행된 '엔비디아 RTX AI PC 데이' 행사에서 "곧 출시될 지포스 RTX 50 시리즈는 게임과 콘텐츠 제작, 영상 제작 등 모든 분야에서 활용될 것"이라고 밝혔다. 먼저 주요 게임 개발사들은 생성 AI를 게임 캐릭터에 결합한 '아바타 클라우드 엔진'(ACE)를 도입할 예정이다. 크래프톤은 CES 2025에서 배틀그라운드에 플레이어의 음성을 인식하고 지시를 따르는 AI 기반 전우조인 '펍지 엘라이'(PUBG Ally)를 도입하겠다고 밝혔다. 위메이드가 언리얼엔진5 기반으로 개발중인 오픈월드 게임인 '미르5'에는 엔비디아 ACE 기술 기반으로 플레이어의 패턴을 학습하는 보스 캐릭터가 등장한다. RTX 50 시리즈에 내장된 영상 인코딩/디코딩 엔진인 NVENC는 9세대로 업데이트돼 색상 정보를 보다 풍부하게 담고 계단 현상을 줄일 수 있는 4:2:2 압축 방식을 지원한다. 4K 60p 영상을 최대 9개까지 동시에 처리해 렌더링 시간도 단축한다. 엔비디아는 2월부터 주위 소음을 줄이고 음성을 최적화하는 '스튜디오 보이스', 방송 출연자의 조명을 AI로 최적화하는 '가상 키라이트'를 적용한 방송 애플리케이션을 제공 예정이다. 엔비디아가 제공하는 NIM(엔비디아 추론 마이크로서비스)은 클라우드 뿐만 아니라 RTX GPU에서도 실행될 수 있도록 최적화돼 PC에서도 실행할 수 있다. RTX용 AI 블루프린트는 클라우드나 PC에 최적화된 레퍼런스 디자인을 제공하며, 데모 UI가 내장되어 있고 필요한 경우 미세조정도 가능하다. RTX용 엔비디아 NIM 등 개발 도구는 오는 2월부터 제공 예정이다. 제프 옌 엔비디아 아태지역 기술마케팅 이사는 이날 "게임 개발자, 콘텐츠 크리에이터, AI 개발자들이 RTX 50 시리즈를 통해 새로운 차원의 AI 기능을 구현할 수 있다"고 밝혔다.

2025.01.21 08:47권봉석

엔비디아 "지포스 RTX 50, 최고의 AI PC 솔루션"

"지포스 RTX 50 시리즈 GPU는 게이머와 개발자, 크리에이터를 위한 최고의 AI PC 솔루션이 될 것이다. RTX 5070은 전 세대 최상위 제품인 RTX 4090과 비슷한 성능을 절반 이하 수준인 549달러(약 80만원)에 제공한다." 20일 오후 서울 삼성동 스튜디오 159에서 진행된 '엔비디아 RTX AI PC 데이' 행사에서 제프 옌(Jeff Yen) 엔비디아 아태지역 기술 마케팅 이사가 이렇게 소개했다. 엔비디아는 이날 행사에서, 올 초 CES 2025에서 공개된 블랙웰(Blackwell) 아키텍처 기반 PC용 GPU인 지포스 RTX 50 시리즈의 기술적 특징과 AI PC 활용 방안을 국내 기자단과 인플루언서에게 설명했다. 션 클리블랜드 엔비디아 지포스 기술 마케팅 이사도 "지포스 RTX 50 시리즈는 AI를 셰이더에 도입해 기존 GPU의 한계를 극복한 '뉴럴 셰이더'로 또 다른 혁신을 이뤘다"고 강조했다. 5세대 텐서코어·4세대 RT 코어로 AI·3D 모두 향상 지포스 RTX 50 시리즈는 AI 관련 연산을 처리하는 5세대 텐서코어와 4세대 레이트레이싱(RT) 코어를 내장했다. 텐서코어는 메모리 이용량을 줄이며 AI 처리 속도를 높일 수 있는 FP4(부동소수점, 4비트) 연산을 지원해 전세대 대비 AI 처리 성능을 최대 2배 높였다. 4세대 RT코어는 3D 화면을 구성하는 트라이앵글(삼각형) 수를 최적화해 한 화면당 수 억개까지 구현할 수 있는 메가 지오메트리를 지원한다. 메모리 역시 작동 성능을 높이면서 전력 소모를 줄일 수 있는 GDDR7로 교체됐다. DLSS 4, AI 적용 확대로 한 번에 여러 프레임 생성 엔비디아는 2018년 지포스 RTX 20 시리즈와 함께 '딥러닝 슈퍼 샘플링'(DLSS) 기능을 선보였다. 이용자가 원하는 해상도 대비 한 단계 낮은 해상도로 만든 화면을 AI로 업스케일링해 처리 부담은 줄이면서 초당 프레임을 끌어올렸다. RTX 50 시리즈에 적용되는 DLSS 4는 5세대 텐서코어를 활용해 한 번에 여러 개 프레임을 동시에 생성하는 방법으로 성능을 끌어올렸다. 제프 옌 이사는 "DLSS 4는 DLSS를 쓰지 않는 상태와 비교해 초당 프레임은 최대 9배, 전세대 기술인 DLSS 3.5 대비 두 배 높아진다"고 밝혔다. 출시 시점에 75개 게임과 앱이 DLSS 4를 지원할 예정이다. 노트북용 RTX 50 GPU, 전력 소모 최적화 노트북용 RTX 50 시리즈는 문서 작성이나 웹브라우징 등 일반적인 작업에서 전력 소모를 최적화하는 기술로 전력 소모를 30% 낮췄다. 또 배터리로 작동하는 환경에서 일부 화질을 조절하는 배터리 부스트 기술로 게임 구동 시간을 최대 40% 늘렸다. 주요 PC 제조사는 RTX 5090/5080/5070 Ti/5070 GPU를 탑재한 노트북을 2월 말에서 3월부터 시장에 출시 예정이다. 최상위 제품인 RTX 5090 탑재 노트북 가격은 2천899달러(약 420만원), RTX 5070 탑재 노트북 가격은 1천299달러(약 190만원) 부터 시작할 예정이다. "이번에는 전원 커넥터 문제 없다... 4K는 RTX 5090 추천" 전세대 제품인 지포스 RTX 40 시리즈는 2022년 10월 출시 당시 전원 공급용 커넥터나 케이블이 과열로 녹는 현상으로 문제를 겪기도 했다. 이날 제프 옌 이사는 "당시 발생한 문제를 바탕으로 전원 커넥터를 변경하는 등 대응했으며 이런 문제는 RTX 50 시리즈에서는 발생하지 않을 것"이라고 밝혔다. 션 클리블랜드 이사는 "4K 해상도에 모든 옵션을 켜려면 RTX 5090, QHD(2560×1440 화소) 해상도에서는 RTX 5080, 풀HD(1920×1080 화소) 해상도에서는 RTX 5070이 적합하며 목표로 하는 해상도에 따라 적합한 모델이 달라질 것"이라고 설명했다.

2025.01.21 08:28권봉석

삼성전자, 'HBM 사업 확대' 컨콜 목표 지켰을까

삼성전자가 오는 31일 2024년 4분기 실적발표를 앞둔 가운데, 지난해 제시했던 HBM(고대역폭메모리) 사업 관련 전망치를 얼마나 현실화했을지 귀추가 주목된다. 현재 업계에서 추산하는 삼성전자의 해당 분기 HBM 출하량은 20억Gb(기가비트) 초반 수준으로, 목표치인 30억Gb에는 미치지 못했을 것으로 관측된다. 20일 업계에 따르면 삼성전자는 지난해 목표로 했던 HBM 총 출하량을 달성하지 못했을 가능성이 높은 것으로 분석된다. 지난해 삼성전자는 HBM 사업에서 전반적으로 부진을 면치 못했다. 주요 고객사인 엔비디아에 HBM3E(5세대 HBM) 8단을 늦어도 3분기까지 양산 공급하는 계획을 세웠으나, 실제 뚜렷한 성과를 거두지 못했다. HBM3E 12단 역시 경쟁사 대비 양산화 준비가 더딘 상황이었다. 이에 삼성전자는 지난해 4분기 첨단 제품을 중심으로 HBM 사업을 적극 확대하겠다고 발표한 바 있다. 삼성전자는 지난해 10월 말 진행한 2024년 3분기 실적발표 컨퍼런스콜에서 "3분기 전체 HBM 매출에서 HBM3E의 비중은 10% 초중반 수준까지 증가했다"며 "특히 4분기 HBM3E 비중은 50%가 될 것으로 예상한다"고 밝혔다. 또한 "예상 대비 주요 고객사향 HBM3E 사업화가 지연됐으나, 현재 주요 고객사 퀄 과정상 중요한 단계를 완료하는 유의미한 진전을 확보했다"며 "이에 4분기 중 판매 확대가 가능할 것으로 전망된다"고 강조하기도 했다. ■ 지난해 HBM 사업 목표 미달 가능성 높아 당시 삼성전자의 HBM3E 매출 비중 목표는 엔비디아를 제외한 다른 고객사에 물량을 확대하는 시나리오를 상정한 것으로 알려졌다. 지난해 하반기 반도체 업계에서는 엔비디아를 추격 중인 AMD와 구글·메타 등 거대 CSP(클라우드서비스제공자) 기업들의 칩을 설계해주는 브로드컴, 자체 AI 추론 및 학습용 칩을 개발해 온 AWS(아마존웹서비스) 등이 유망한 HBM 수요처로 떠올랐다. 다만 삼성전자가 이 같은 전망에 부합하는 실적을 달성했을 가능성은 현재로선 낮은 것으로 관측된다. 반도체 산업을 분석하는 국내 한 증권가 연구원은 "삼성전자의 지난해 HBM 목표 판매량은 50억Gb 수준이고, 4분기에만 30억Gb를 출하했어야 했다. 이에 따라 HBM3E 매출 비중도 50%에 이르지는 못했을 것"이라며 "실제로 출하량이 전분기 대비 늘어나기는 했으나, 출하량이 20억Gb 내외 수준으로 제시했던 목표에는 이르지 못한 것으로 분석된다"고 밝혔다. 반도체 업계 관계자는 "삼성전자의 연간 HBM 판매량, HBM3E 매출 비중 확대 등은 하반기 제품 개발 및 사업 현황을 봤을 때 현실적으로 달성이 어려웠던 목표"라며 "엔비디아와 브로드컴 등으로의 HBM 출하가 기대치에 못 미치고, 중국향 HBM 사업도 국제 정세로 인해 목표를 충족하지 못했을 것으로 보인다"고 설명했다. ■ 4분기 컨콜서 확실한 목표·비전 제시해야 삼성전자는 31일 2024년 4분기 실적발표를 앞두고 있다. 지난해 삼성전자가 컨퍼런스콜에서 밝힌 HBM 사업 전망이 대체로 현실화되지 못한 만큼, 이번에는 보다 면밀한 분석을 기반으로 2025년 올 한해 명확한 목표를 제시해야 한다는 지적이 제기된다. 현재 삼성전자는 HBM 사업의 반등을 위한 전략을 다각도로 펼치고 있다. 우선 HBM3E 12단의 경우, 엔비디아향 공급을 위해 제품의 회로를 일부 개조해 성능을 끌어올리는 작업을 진행 중이다. 개선품은 이르면 올 3분기께 양산 공급이 이뤄질 수 있을 것으로 전망된다. 동시에 삼성전자는 브로드컴 등 비(非) 엔비디아 고객사와의 협력 확대를 추진하고 있다. 이들 고객사는 엔비디아만큼 HBM에 하이엔드급 성능을 요구하지 않기 때문에, 삼성전자의 진입이 비교적 수월하다. 다만 현재까지 삼성전자가 이들 고객사에 HBM3E 양산 공급을 확정지었는지는 확인되지 않았다. 차세대 HBM인 HBM4(6세대 HBM)의 상용화도 준비하고 있다. 삼성전자의 HBM4는 1c D램(6세대 10나노급 D램)을 기반으로 한다. SK하이닉스, 마이크론 등은 안정성을 고려해 한 세대 전인 1b D램을 채용한다. 현재 삼성전자는 1c D램의 초도 양산을 위한 투자를 진행 중이며, 수율 향상에 전념하고 있는 것으로 전해진다.

2025.01.20 11:19장경윤

"인텔 통으로 살까"검토 중인 돈 많은 회사 있다

지난해 2분기 이후 실적 부진과 주가 하락, 전임 CEO 팻 겔싱어 퇴임 등을 겪고 있는 인텔을 인수하려는 기업이 있다는 주장이 나왔다. 미국 반도체 전문매체 세미어큐레이트가 지난 17일(현지시간) 이렇게 보도했다. 세미어큐레이트는 "약 2개월 전 특정 기업의 고위 임원진 사이에서 오간 이메일 제보를 통해 해당 사실을 확인했고 최근 다른 고위 관계자를 통해 확신했다"고 설명했다. 이어 "이번에 언급된 이 기업은 지금까지 시장에서 전혀 거론된 적이 없는 곳"이라고 설명했다. 세미어큐레이트는 "기업이 실제로 인수를 추진할 때는 주가 상승을 막기 위해 최대한 정보 유출을 막으려 한다"며 "이번에 입수한 정보는 매우 제한된 범위에만 공개된 이메일"이라고 주장했다. 현재 인텔의 시가총액은 약 927억 달러(약 135조 3천억원) 수준이다. 세미어큐레이트는 "이 기업은 인텔 분할 매각 없이 전체를 인수할 수 있을 만큼의 여력을 가지고 있다"고 설명했다. 다만 지난 해 11월 말 인텔이 최근 미국 상무부와 108억 달러(약 15조 843억원) 규모 반도체지원법(CHIPS Act) 보조금 수령으로 인텔 인수·매각이나 파운드리 분사·상장을 제한하는 조건이 상당 수 포함됐다. 세미어큐레이트가 주장한 인수설이 실현될지는 미지수다.

2025.01.19 08:42권봉석

5년 vs 30년 양자컴퓨팅 실용화 시점, 엇갈리는 기술전망

젠슨 황 엔비디아 최고경영자(CEO)가 양자컴퓨팅 상용화에 대해 "20년 이상 남았다"고 발언한 이후, IT 업계 리더들 사이에서 상용화 시점을 두고 의견이 엇갈리고 있다. 일부는 기술적, 경제적 한계를 들어 상용화까지는 긴 시간이 필요하다고 보고 있으며, 다른 일부는 현재의 기술적 진보와 응용 사례를 들어 상용화가 머지않았다고 주장하고 있다. 19일 관련 업계에 따르면 양자컴퓨팅 관련주가 주요 IT리더의 발언에 따라 큰 폭의 변동이 지속되고 있다. 엔비디아·메타 등 양자컴퓨팅 상용화 아직 멀어 상용화 단계까지 많은 시간이 필요하다는 측은 가장 큰 단점이 높은 오류율 등을 해결하기 위한 기술적 장벽이 존재한다는 지적이다. 젠슨 황 CEO 역시 "양자컴퓨터는 수많은 기술적 도전 과제와 경제적 장벽을 극복해야 한다"며, 고전 컴퓨팅 기술의 발전이 상용화를 지연시킬 가능성이 크다고 지적했다. 마크 저커버그 메타 CEO도 양자컴퓨팅 상용화 시점에 대해 신중한 입장을 보였다. 그는 "기술적 한계와 인프라 구축의 복잡성을 고려할 때 양자컴퓨팅이 일반화되기까지는 상당한 시간이 필요하다"고 말했다. 캘리포니아 공과대학교의 존 프리스킬 교수는 "양자컴퓨팅의 발전은 고무적이지만, 실질적인 상용화를 위해서는 오류 수정과 대규모 양자 프로세서 개발 등 해결해야 할 과제가 여전히 많다"고 지적했다. 존 체임버스 전 시스코 CEO는 "양자컴퓨팅 기술의 진보는 중요하지만, 실질적인 상용화까지는 아직 시간이 필요하다"면서 현재의 AI와 결합된 기존 컴퓨팅 기술이 더 현실적이고 실질적인 영향을 미치고 있다고 언급했다. 대규모 계산 요구되는 분야 선제적 영향 미칠 것 반면 일부는 슈퍼컴퓨터로 계산하기 어려운 복잡한 문제를 해결하는데 이미 양자컴퓨터가 활용되고 있으며 조만간 폭발적인 성과를 낼 것으로 전망했다. 마이크로소프트는 올해를 '양자 준비(Quantum-Ready)'의 해로 설정하며 양자 알고리즘과 하드웨어 개발을 기업 환경에 통합할 수 있는 토대를 마련하는 데 집중할 것임을 선언했다. 머지않은 양자 컴퓨팅 상용화에 앞서 기업들이 기술과 인프라를 준비할 수 있도록 돕기 위한 전략으로, 상용화 초기 단계에서 경쟁력을 확보하려는 노력의 일환이다. 디웨이브 퀀텀의 앨런 바라츠 CEO는 젠슨 황의 발언에 대해 '완전히 틀렸다'고 반박하며 효율적인 계산을 위한 양자 어닐링(annealing) 기술이 이미 상업적으로 활용되고 있다고 강조했다. 더불어 이미 마스터카드와 일본 NTT도코모 등 기업들이 현재 디웨이브의 양자컴퓨터를 사용해 실제 혜택을 보고 있다고 덧붙였다. SAP의 크리스티안 클라인 CEO는 양자컴퓨팅이 대규모 물류 비즈니스 등 기존 컴퓨팅 인프라로 계산이 어려운 프로세스 최적화와 데이터 분석에 혁신적인 변화를 가져올 것이라고 주장했다. 옥스포드 아이노닉스의 크리스 밸런스 CEO는 올해가 양자컴퓨팅의 '챗GPT 순간'이 될 것이라고 전망했다. 그는 "양자컴퓨터가 연구실을 넘어 실제 고객의 네트워크와 데이터 센터에 배치되는 원년이 될 것"이라고 내다봤다. 멀티버스 컴퓨팅의 엔리케 리자소 올모스 CEO는 특정 산업(금융, 물류, 의약품 개발)에서 양자컴퓨팅 파일럿 프로젝트가 이미 진행되고 있으며, 중기적으로는 수천 큐비트 규모의 양자컴퓨터가 상용화될 가능성을 제시했다. 또 아이온큐의 공동 창업자인 듀크대학교 김정상 교수는 양자컴퓨팅 기술이 이미 산업 곳곳에서 활용되고 있다며 상용화 수준의 양자 컴퓨터의 탄생엔 오랜 시간이 걸리지 않을 것으로 예상했다. 양자컴퓨팅 상용화 시점을 두고 글로벌 IT 리더들의 전망이 엇갈리고 있다. 그러나 공통적으로 양자컴퓨팅이 미래 기술 발전에 큰 영향을 미칠 잠재력을 가지고 있다는 점에는 동의하는 상황이다. 관련 업계에선 상용화의 시기와 별도로 양자컴퓨팅이 과학과 산업 전반에 가져올 변화를 주시하며 대비해야 한다는 의견이 제시되고 있다.

2025.01.19 08:38남혁우

젠슨황, 빅테크 다 가는 트럼프 취임식 '안 가거나 못 가거나'

세계 최고 인공지능(AI) 반도체 기업 미국 엔비디아의 젠슨 황 최고경영자(CEO)가 도널드 트럼프 미국 대통령 당선인 취임식에 참석하지 않을 것으로 보인다고 미국 블룸버그통신이 17일(현지시간) 보도했다. 트럼프 당선인은 20일 취임한다. 황 CEO는 이달 초 블룸버그와의 인터뷰에서도 "트럼프 당선인으로부터 미국 플로리다주 팜비치 마러라고리조트에 아직 초대받지 못했다"고 말했다. 트럼프 당선인은 자신이 소유한 마러라고리조트에서 내각을 꾸리며 취임 전 일정을 보냈다. 황 CEO는 엔비디아 신년 행사장 밖에서 기자들에게 "(트럼프) 취임식에 참석하는 대신 가족 및 직원들과 설을 축하하기 위해 이동하고 있을 것"이라면서 "트럼프 행정부가 취임하면 축하할 것"이라고 밝혔다. 다른 기술 기업 경영자가 줄줄이 트럼프 당선인 취임식에 가는 것과 딴판이라고 블룸버그는 설명했다. 일론 머스크 테슬라 CEO는 이번 미국 대통령 선거에서 트럼프 당선인을 적극적으로 도운 뒤로 트럼프 당선인 2기 행정부의 정부효율부(DOGE) 수장으로 뽑혔다. 트럼프 당선인의 최측근이 돼 내각 인사 면접관으로도 참여했다. 팀 쿡 애플 CEO, 제프 베이조스 아마존 창업자, 순다르 피차이 구글 CEO, 마크 저커버그 메타플랫폼 CEO 등도 트럼프 당선인 취임식에 자리하기로 했다. 이들은 한결같이 취임식에 100만 달러(약 14억원)씩 기부했다. 100만 달러 이상 기부하면 취임 행사에서 트럼프 당선인 부부와의 만찬을 비롯해 내각 지명자들과 만날 수 있다.

2025.01.18 08:27유혜진

엔비디아 '네모 가드레일' 공개…에이전트 폭주 방지로 AI 신뢰도 ↑

엔비디아가 생성형 AI 시대를 맞아 '네모 가드레일(NeMo Guardrails)' 솔루션을 통해 거대 언어 모델(LLM) 활용에 필요한 안전성과 신뢰도를 대폭 높이고 있다. 개발자가 직접 AI의 안전장치인 '가드레일'을 프로그래밍해 AI 에이전트(Agentic AI)를 제어·관리할 수 있는 것이 핵심으로, 엔비디아는 이를 오픈소스 형태로 제공해 다양한 서드파티 솔루션·브랜드 정책과 연동할 수 있도록 제공한다. 16일 업계에 따르면 최근 여러 기업들이 LLM 기술을 활용한 에이전트 AI를 경쟁적으로 선보이고 있다. 이러한 초거대 언어 모델이 예기치 않은 발언을 하거나 민감 정보를 노출하는 등 위험 요소가 늘어남에 따라 이를 사전에 제어·차단하는 '가드레일' 수요도 빠르게 증가하는 추세다. 이에 대응해 지난 2023년 4월 출시된 엔비디아 네모 가드레일은 크게 ▲콘텐츠 안전성 ▲주제 제어 ▲탈옥 방지 등 세 가지 주요 가드레일 모델로 구성됐다. 각각 유해·위험 발언 차단, 대화 주제 이탈 방지, 보안 우회 시도 차단에 특화됐다. 엔비디아 측은 이러한 가드레일을 병렬로 적용해도 처리 지연(latency)이 크지 않도록 GPU 최적화를 거쳤다고 강조하고 있다. '네모 가드레일'의 '콘텐츠 안전성(Content Safety)' 기능은 AI 대화나 에이전트가 생성하는 텍스트에서 유해·위험·비윤리적 발언을 사전에 차단한다. 엔비디아의 '이지스 콘텐츠 안전 데이터셋'으로 학습됐으며 3만5천 건 이상의 인공지능 안전성 주석 데이터를 바탕으로 폭넓은 시나리오를 커버한다. 이를 통해 잘못된 정보나 악의적 콘텐츠가 사용자에게 직접 전달되는 상황을 줄일 수 있다는 설명이다. '주제 제어(Topic Control)'는 대화 주제가 시스템 프롬프트나 브랜드 정책에서 벗어나지 않도록 관리한다. 단순 질의응답을 넘어 여러 차례의 대화가 이어질 때 에이전트가 불필요하거나 민감한 영역으로 빠지는 것을 막아주는 역할을 한다. 일례로 자동차 제조사 에이전트의 경우 경쟁사 차량과의 비교 등의 발언을 아예 금지하거나 특정 주제만 다루도록 제한하는 식이다. 복잡한 대화가 진행될수록 브랜드 일관성·규제 준수가 중요해지는 산업군에서 특히 주목받고 있다. '탈옥(Jailbreak) 방지' 모델은 AI 모델이 설정된 보호 장치를 교묘하게 우회해 민감 정보를 드러내거나 부적절한 기능을 수행하지 못하도록 막는다. 엔비디아는 1만7천 개 이상의 악의적 프롬프트 샘플을 통해 모델을 학습시켰으며 내부의 LLM 레드팀 테스트 툴을 활용해 새롭게 등장하는 공격 방식을 지속적으로 탐지·학습한다. 이를 통해 기업들이 실제 환경에서 운영 중인 AI 에이전트의 보안을 한층 더 강화하고 있다. '네모 가드레일'은 엔비디아 AI 엔터프라이즈 라이선스 체계로 운영되며 GPU당 연간 4천500달러(한화 약 630만원) 선의 비용이 소요된다. 실제 사용량과 기업 규모에 따라 차이가 발생할 수 있으나 개발 및 배포 효율성·안정성을 감안하면 비용 대비 효과가 충분하다는 것이 엔비디아 측의 설명이다. 이와 별개로 네모 가드레일 기본 프레임워크 자체는 오픈소스로 무료 제공된다. 이러한 기본 모드의 오픈소스 정책에 따라 기업이 직접 정책을 추가하거나 서드파티 가드레일을 도입하기가 용이하다. 엔비디아 측은 모든 이용 사례와 규정을 자사가 일일이 규정할 수 없으므로 오픈소스·모듈형 설계를 채택해 각 기업이 상황에 맞게 커스터마이징할 수 있게 했다는 입장이다. 업계에서는 특정 산업 규제나 민감 데이터 처리를 위한 맞춤형 가드레일을 구축하기 한층 수월해졌다는 평가를 하고 있다. 실제로 소매업, 통신사, 자동차 산업 등 다양한 분야의 기업들이 이미 '네모 가드레일'을 활용해 에이전트 제어 시스템을 구현하고 있다. 민감한 금융·청구 관련 정보를 다루거나 안전 운행을 보조해야 하는 경우처럼 오류나 부적절한 정보 노출이 절대 불가한 상황에서 가드레일의 역할이 돋보인다는 설명이다. 업계 전문가들은 "에이전틱 AI 시대에 IT 부서들이 AI를 인사·총무처럼 관리할 필요성이 커지는 와중에 이런 역할을 수행하는 솔루션 중 하나가 '네모 가드레일'"이라며 "가드레일 도입을 통해 AI가 사용자에게 줄 수 있는 가치는 키우면서도 위험 요소는 줄이는 길이 열리도록 해야한다"고 평가했다.

2025.01.16 23:05조이환

김재원 대표 "엘리스그룹, 에듀테크 기업에서 AI 기업으로"

AI 에듀테크 기업으로 잘 알려진 엘리스그룹(대표 김재원)은 인프라·데이터·플랫폼·콘텐츠 등 AI에 필요한 모든 것을 통합 제공하는 'AI 솔루션 기업'으로 자리매김하고 있다. 김재원 엘리스그룹 대표는 본격적인 AI 시대를 맞아 새해 이런 변화에 더욱 속도를 낸다는 계획이다. 엘리스그룹에 따르면, 회사는 AI 교육이 필요한 기업 또는 기관이 몰입도 높은 비대면(가상화) 실습 환경 아래에서 교육생들의 학습 관리를 편리하게 할 수 있는 '엘리스LXP' 플랫폼을 서비스 중이다. 이 플랫폼을 통해 ▲초중고 공교육 ▲취준생 및 재직자 직무교육 ▲산업 맞춤형 디지털 전환 교육 등 다양한 교육 콘텐츠가 제공된다. SK·LG·현대차 등 국내 대기업뿐만 아니라, 서울대·카이스트 등 대학과 정부·공공기관 총 5천300여 곳에서 맞춤형 디지털 전환 교육을 하고 있다. 관리자는 엘리스LXP에서 학습 데이터를 분석하고 시각화한 AI 대시보드를 통해 교육생들을 보다 효율적으로 관리함으로써 이수율을 높일 수 있다. 나아가 거대언어모델(LLM) 기반으로 만들어진 AI 챗봇(AI 헬피)을 통해 학습자들의 질문에 대한 맞춤형 답변도 빠르게 할 수 있다. 아울러 '엘리스테스트'는 개발자 채용 평가부터 재직자 역량 평가, 대규모 경진대회 등 온라인 테스트 환경을 지원한다. 부정행위 방지 기능과 다양한 테스트 콘텐츠, 체계적 온보딩 시스템과 안정적 서버환경 등은 엘리스테스트의 강점이다. 이동형 모듈러 데이터센터 구축...강력한 AI 인프라 제공 엘리스그룹은 다양한 환경의 AI 연구·개발·배포를 위한 안정적인 GPU를 제공하는 '엘리스클라우드' 사업도 키워나가고 있다. 엔비디아의 A100·H100 등 강력한 GPU 서버 스펙을 바탕으로 AI 데이터센터를 구축한 상태다. 회사는 지난해 델 테크놀로지스로부터 엔비디아 H100 텐서코어 GPU를 탑재한 델 파워엣지 서버와 네트워킹 스위치를 도입해 데이터센터 인프라를 업그레이드한 바 있다. 특히 엘리스그룹은 델 테크놀로지스와의 협력을 통해 엘리스클라우드에 모듈 단위로 탄력적인 인프라 확장이 가능한 이동형 모듈러 데이터센터(PMDC) 방식을 적용했다. 엘리스그룹 전력 밀도는 랙당 20~40kW로, 국내 데이터센터 평균(3.3kW)보다 효율성이 높다. 아울러 회사는 GPU·NPU를 효율적으로 이용할 수 있는 동적 할당 기술을 적용해 사용자가 필요로 하는 만큼 실시간으로 컴퓨팅 자원을 할당받을 수 있게 했다. 이를 통해 비용을 낮추면서도 AI·디지털 전환 관련 교육 과정을 원활히 받을 수 있는 환경을 갖추게 됐다. 최근에는 AI 반도체 스타트업 리벨리온과 상호 협력 업무협약을 맺고, 리벨리온 NPU 기반 클라우드 플랫폼 구축을 위한 기술 협력을 진행한 뒤 이를 바탕으로 글로벌 데이터센터 진출에도 힘을 모으기로 했다. 엘리스클라우드 PUE(전력 효율 지수)는 1.27이며, 지난해 8월 정보보안에 대한 글로벌 인증(ISO 27001·27701)을 획득하기도 했다. "엘리스그룹은 AI 기업" 2015년 회사를 창업한 김재원 대표는 엘리스그룹을 'AI 기업'으로 정의했다. 재직자 대상으로 디지털 전환과 AI 교육을 통해 업무 효율성을 높여주고, 취준생들에게는 대학과 산업 간의 격차를 줄여주는 부트캠프를 통해 이들이 AI에 대한 이해도와 전문성을 갖추도록 돕기 때문이다. 특히 엘리스클라우드를 통해 AI 연구팀이나 전문가들이 안정적인 클라우드 및 컴퓨팅 환경에서 AI 모델링 프로젝트를 수행하도록 지원해서다. 재작년과 작년에는 각각 국방부 대규모 AI 해커톤과 한국천문연구원의 태양 흑점 이미지 분석 AI 해커톤에 고성능 GPU 환경을 제공했다. “엘리스클라우드는 AI 전문 인프라입니다. 기존 AI 해커톤의 경우 예산 안에서 진행이 불가능했는데, 저희는 참가자들에게 고성능 환경을 제공하고 적게는 3분의 1, 많게는 10분의 1 예산 안에서 고성능 클라우드 환경을 제공해드리고 있습니다. AI 클라우드 인프라를 구성함에 있어 기존 데이터센터는 고전력이 아니다 보니 어렵고, 그렇다고 고가의 GPU 서버 인프라를 구성하기도 쉽지 않았는데 엘리스클라우드는 PMDC를 통해 비용 단가를 낮추면서도 안정성은 높였습니다. 쓰는 만큼 시간당 과금되기 때문에 효율적 이용도 가능합니다.” 기업 또는 기관들은 업무 생산성 향상을 위해 디지털 전환이 필요할 때 엘리스그룹의 다양한 플랫폼과 콘텐츠, 인프라 등을 취사선택해 사용하면 된다. AI 기업으로서 안정적인 서버가 필요하다면 엘리스클라우드를, AI 등 디지털 전환 교육이 필요하다면 엘리스LXP 플랫폼을 통해 대상에 맞는 엘리스의 콘텐츠를 제공하면 되는 식이다. “모든 정부 기관과 기업들의 AI 디지털 전환이 필요한 때라고 생각합니다. 그렇지 않으면 강대국들에 의해 도태될 수밖에 없겠죠. 저마다 속도는 다를 수 있겠지만, 결국 AI는 전기처럼 쓰게 될 테니, 이런 방향에 필요한 교육과 인프라를 제공하려 합니다.” "클라우드 인프라·기술력에 계속 투자할 것" 엘리스그룹의 올해 목표는 엘리스클라우드를 통한 더 큰 성장이다. 지난해 실적은 전년보다 성장하긴 했지만 기대만큼 크진 않았다고 김 대표는 말했다. AI 도입이 빠르게 확산되는 것은 맞지만, 아직은 기대만큼 그 속도가 빠르지 않은 것 같다고. 그는 AI의 더 빠른 도입을 위해서는 시간과 기술적 요인들이 더 필요하다고 말했다. 김 대표는 앞으로도 클라우드 인프라와 기술력에 계속 투자한다는 방침이다. 또 사내에 AI 전문 연구원들이 다수 있어 경쟁사 대비 AI 교육에 있어서는 훨씬 전문성이 있다고 자부했다. 나아가 AI 밸류 체인이 완성된 만큼, 올해는 클라우드 인프라와 기술력 투자에 집중한다는 방침이다. “약 3년 전 엔비디아 A100을 구매해서 계속 연구하다 2023년부터 내부에서 활용할 수 있게 개발했습니다. 그 후 AI 교육, 해커톤 등에서 활용할 수 있도록 했고, 지난해부터 기능을 강화하면서 외부 세일즈를 진행해 작년 처음으로 클라우드 매출이 발생했습니다. 강의, 콘텐츠 제작, 플랫폼 기능 확대에 이어 AI 인프라 세일즈까지 AI 밸류 체인 전주기를 완성했습니다. 이를 강화하는 것이 올해 목표이고요. 저희는 AI를 통해 실제 매출을 내고, 이를 클라우드 인프라와 기술력에 재투자하고 있습니다.” 김 대표는 앞으로 AI가 사람들의 업무와 실생활에 녹아들며 계속 발전할 것으로 내다봤다. 반면, 글로벌 시장에서는 엄청나게 빠른 속도로 발전하고 활용하는 이런 기술들이 국내 정치적·사회적 이슈들에 뒤처지는 것에는 아쉬움을 표했다. “더 이상 휴대폰 없이 일한다는 건 불가능하듯, AI 없이 일을 하면 비효율이 분명 발생할 겁니다. 앞으로 AI의 실생활 활용에 대한 부분이 강조될 텐데, 이를 지탱할 인프라에 대한 강화도 필요하죠. 어마어마한 속도로 발전될 AI를 활용하게 될 글로벌 경쟁에서 뒤처지지 않게 우리도 정진해야 한다고 생각합니다.”

2025.01.16 14:30백봉삼

[현장] "GPU 병목 넘는다"…구글 클라우드 '트릴리움' TPU로 AI 혁신 본격화

"그래픽 처리 장치(GPU)는 그래픽 연산에 특화돼 있지만 텐서 처리 장치(TPU)는 처음부터 인공지능(AI)용으로 설계됐습니다. 거대 언어 모델(LLM) 시대에 필요한 초거대 연산을 효율적으로 처리하는데 있어 우리가 개발한 '트릴리움' TPU는 좋은 답이 될 것입니다." 모한 피치카 구글 클라우드 프로덕트 매니저는 16일 회사가 개최한 '렛츠 토크 AI : 구글 클라우드 트릴리움 교육 세션'에서 이같이 말했다. 이날 온라인으로 진행된 행사에서 피치카 PM은 구글 클라우드가 새롭게 선보인 6세대 텐서 TPU '트릴리움'과 AI 하이퍼컴퓨팅 전략을 설명했다. 피치카 PM에 따르면 GPU가 본래 컴퓨터 그래픽의 병렬 처리를 위해 개발된 것과 달리 TPU는 뉴럴 네트워크 연산에 특화해 처음부터 AI를 염두에 두고 탄생한 장치다. 구글 역시 이러한 트렌드를 감안해 지난 2015년 경부터 TPU를 개발해 왔다. 트릴리움 TPU는 단순히 '칩' 하나만 개선한 것이 아니다. LLM을 학습하려면 네트워킹, 스토리지, 소프트웨어 스택까지 모두 일관성 있게 최적화돼야 하는 것은 필수다. 이에 구글 클라우드 역시 '트릴리움'이 이 모든 구성 요소를 하나의 거대한 슈퍼컴퓨터처럼 움직이도록 설계했다는 것이 피치카 PM의 설명이다. 실제로 구글 클라우드는 저전력 액체 냉각 기술, 3세대 스파스코어(SparseCore), 확장된 고대역폭 메모리(HBM) 등 다양한 요소를 결합해 '트릴리움'의 전력 효율과 확장성을 함께 끌어올렸다. 피치카 PM은 "GPU만 쓰는 환경에서는 분산 처리가 복잡해질 수 있지만 트릴리움 TPU는 칩 수천 개를 유기적으로 연결해 병목 현상을 최소화한다"며 "이런 통합 아키텍처야말로 거대 언어 모델 시대에 꼭 필요한 핵심"이라고 말했다. 행사에서 반복적으로 언급된 또다른 키워드는 'AI 하이퍼컴퓨터'였다. '트릴리움'을 통해 구글이 네트워크, 스토리지, 오픈소스 소프트웨어, 유연한 소비 모델을 통합함으로써 거대 언어 모델을 빠르고 안정적으로 서빙할 수 있는 '슈퍼컴퓨팅 환경'을 구현했다는 것이다. 피치카 PM은 "구글은 이미 검색, 포토, 지도 등 주요 서비스에 TPU를 대규모로 적용해 왔다"며 "이를 통해 얻은 노하우가 글로벌 고객들에게도 곧바로 제공된다"고 밝혔다. 구체적인 활용 사례도 공개됐다. 현재 카카오는 통합 AI 브랜드 '카나나(Kanana)'를 개발하던 중 GPU 자원의 한계를 느껴 트릴리움 TPU를 도입한 바 있다. 이에 따라 70B 파라미터를 지닌 대형 한국어·영어 모델을 빠르게 학습시킬 수 있었다. 글로벌 유즈 케이스 역시 상당하다. 글로벌 제약회사인 바이엘은 신약 개발에, 딥 지노믹스는 RNA 치료제 연구에 '트릴리움'을 적용해 대규모 AI 모델을 효율적으로 구동하고 있다. 피치카 PM은 "노벨상 수상 연구로 주목받은 알파폴드(AlphaFold) 2나 구글의 최신 모델 제미나이(Gemini) 2.0 역시 '트릴리움' TPU를 가속기로 썼다"며 "초거대 모델 시대에 TPU가 점점 더 중요한 위치를 차지할 것"이라고 내다봤다. TPU는 성공적인 AI 연산 뿐만 아니라 지속 가능성 측면에서도 주목할만한 대안이다. 구글에 따르면 지난해 12월 출시된 '트릴리움' 6세대는 이전 세대 대비 전력 효율을 67%까지 끌어올려 에너지 소비를 줄이고 액체 냉각 기술 같은 친환경 기술을 통해 탄소발자국을 최소화한다. 피치카 PM은 "우리는 친환경적인 AI 인프라를 구축하기 위해 TPU 설계와 운영에서 지속 가능성을 핵심 목표로 삼았다"며 "이러한 기술적 혁신은 에너지 효율성 개선과 환경 보호를 동시에 달성하려는 구글의 장기적인 전략에 부합한다"고 덧붙였다. 구글 클라우드는 경쟁사와의 비교에도 자신감을 보였다. '트릴리움'과 엔비디아 'H100' GPU의 차이에 대한 기자의 질문에 피치카 PM은 "칩과 소프트웨어 스택이 서로 달라 단순 비교는 어렵다"면서도 "'트릴리움'은 뉴럴 네트워크 연산에 특화된 구조로 동일 코어 대비 '행렬 곱셈(Matrix multiplication)' 등 AI 핵심 작업에서 높은 효율을 보인다"고 설명했다. 다만 "아키텍처가 다른 칩들을 성능 점수만으로 비교할 수는 없기 때문에 심층적인 분석이 필요하다"고 당부했다. 지난해 12월 정식 출시 이후 전 세계 고객사들은 이미 '트릴리움' TPU를 이용해 대규모 AI 모델을 구동하고 있다. 구글은 이러한 기술을 기반으로 보다 다양한 유즈 케이스를 확보해 글로벌 시장에서 영향력을 확대할 계획이다. 피치카 PM은 "GPU가 이끌던 AI 시대를 이제 TPU가 한 단계 더 진화시키고 있다"며 "'트릴리움'은 고밀도 모델과 초거대 연산에 최적화된 전용 솔루션으로, 누구든 이 'AI 하이퍼컴퓨터' 인프라를 활용해 글로벌 경쟁력을 확보할 수 있을 것"이라고 강조했다.

2025.01.16 12:00조이환

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

LG전자, 2분기 영업이익 반토막...美 트럼프 관세 영향

EU "AI법 유예 없다"…내년까지 전면 시행 방침 유지

삼성 "더 얇게" vs 애플 "더 강하게"…스마트폰 전략 달라질까

LG엔솔, IRA 세액공제 없이 흑자 달성…저점 통과 기대↑

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.