"엔비디아 '블랙웰' 과열 문제 과장됐다...몇 달 전 해결"
최근 불거진 엔비디아의 최신형 인공지능(AI) 가속기 '블랙웰' 과열 문제가 과장됐다는 주장이 나왔다. 리서치 그룹 세미애널리시스의 딜런 파텔(Dylan Patel) 수석 애널리스트는 19일(현지시간) IT매체 비즈니스인사이더와 인터뷰에서 이 같이 주장했다. 보도에 따르면 딜런 파텔은 "블랙웰 생산량이 늘어나며 칩 냉각이 주요 관심사가 되겠지만, 냉각과 관련된 블랙웰의 설계 문제는 대부분 해결됐다"고 말했다. 블랙웰 과열 문제는 지난 여름 처음 대두됐다. 12명 이상의 반도체 산업 전문가로 구성된 세미애널리시스팀은 지난 8월 블랙웰 냉각 시스템에 문제가 발생해 여러 공급업체에서 재작업이 이루어지고 있다고 밝혔다. 보고서를 작성한 분석가들은 이에 대해 사소한 것이라고 말했다. 파텔은 블랙웰 과열 문제가 처음 제기될 때부터 과장된 소문이라고 일축했다. 그는 지난 8월 자신의 엑스를 통해 "과열 문제는 지난 몇 개월 동안 언급됐고 대부분 해결됐다고 생각한다”며, "우리가 추적해 본 결과 그 소문은 과장된 것이었다"고 주장했다. 최근 불거진 문제는 대부분 데이터센터의 새로운 지평을 연 엔비디아의 'GB200 NVL72'에 집중된다. 이 칩은 36개 중앙처리장치(CPU)에 더해 72개의 블랙웰 그래픽처리장치(GPU)를 갖춰 많은 칩이 하나의 슈퍼칩처럼 작동할 수 있도록 했다. 그렇기 때문에 과열을 방지하기 위해 액체 냉각을 할 필요가 있다. 액체 냉각 방식은 새로운 것은 아니지만, 데이터센터에서 사용하는 것은 지금까지는 드문 일이었다. 일부 엔비디아 고객이 올해 후반과 2025년 상반기에 해당 칩을 받기 시작하면 이에 대한 조정이 필요하다고 해당 매체는 전했다. 메타의 경우도, 차세대 AI 칩의 전력 밀도 증가와 냉각 요구 사항을 반영하여 데이터 센터 설계를 재구성한 것으로 알려졌다. 파텔은 비즈니스인사이더와 인터뷰에서 이 같은 전환 과정에서 잡음이 생길 가능성이 있다고 밝혔다. 엔비디아 대변인은 “엔지니어링 반복은 정상적이고 예상되는 일”이라고 말했다. 엔지니어링 및 운영상 어려움 외에도 액체 냉각은 환경 문제를 야기할 가능성이 많다. 때문에 액체 냉각 전환에는 많은 노력과 부담이 따르지만, 그에 따른 인센티브도 강력하다는 게 세미애널리시스의 주장이다. "고밀도 액체 냉각을 원치 않거나 제공할 수 없는 데이터센터는 고객을 위한 엄청난 성능 TCO(총소유비용) 개선을 놓치고 생성형 AI 경쟁에서 뒤처지게 될 것"이라고 회사 측은 밝혔다. 투자은행 모건스탠리도 이번에 불거진 블랙웰 과열 논란이 칩 공급에 미칠 영향은 크지 않을 것이라고 전망했다. 모건스탠리는 “4분기부터 블랙웰 공급이 순조롭게 이뤄져 실적 목표치 달성에 기여할 것”이라며, “내년 1분기부터 생산량이 빠르게 늘어날 것으로 예상된다”고 전했다. 엔비디아의 주가는 블랙웰 과열 보도 여파로 약세를 면치 못했다. 하지만 19일 엔비디아의 주가는 전날보다 4.89%(6.86달러) 상승한 147.01달러로 장을 마치며 애플을 제치고 시총 1위 자리를 되찾았다.