검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'텐서 처리 장치'통합검색 결과 입니다. (3건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

구글, 자체 AI 칩 외부 개방…메타·앤트로픽과 '탈 엔비디아' 가속

구글이 그동안 자체 서비스와 구글 클라우드에서만 제공하던 인공지능(AI) 전용 칩 TPU를 대형 고객 데이터센터에 직접 공급하는 방안을 추진한다. 이를 통해 엔비디아가 사실상 장악해온 AI 칩 시장에 균열이 생길 수 있다는 관측이 나오고 있다. 24일 디인포메이션등 외신에 따르면 구글 모회사 알파벳이 메타와 TPU 기반 AI 칩 공급을 놓고 협의 중인 것으로 알려졌다. 메타는 내년부터 구글 클라우드를 통해 TPU를, 2027년부터는 구글 AI 칩을 직접 구매해 자체 데이터센터에 탑재하는 방안을 검토하고 있다. 계약 규모는 수십억 달러 수준으로 알려졌다. 지금까지 구글 TPU는 구글 내부 데이터센터와 구글 클라우드 고객에게만 제공됐기 때문에 외부 기업 데이터센터에 칩을 직접 납품하는 구조가 현실화되면 사업 모델이 크게 바뀌는 셈이다. 구글은 이미 AI 스타트업 앤트로픽과도 대규모 AI칩 공급 계약을 체결한 상태다. 양사는 앤트로픽이 최대 100만 개 규모의 구글 TPU를 활용하는 다년 계약을 맺었으며 계약 금액은 수십억 달러에서 수백억 달러 후반대까지 거론된다. 이 물량은 내년까지 1기가와트가 넘는 AI 연산 역량을 추가 확보하는 효과를 내는 것으로 추산된다. 메타와의 논의까지 더해지면서 구글이 자체 설계 칩을 전면에 내세워 AI 인프라 시장에서 엔비디아 의존 구조를 정면으로 겨냥하고 있다는 평가가 나온다. AI 칩셋 물량이 확대되는 만큼 구글은 그동안 협력해온 브로드컴과 더불어 대만 미디어텍과도 차기 프로세서인 7세대 TPU 공동 개발에 나설 계획이다. 미디어텍과의 협력을 통해 칩 단가를 낮추고 공급망을 다변화하려는 구상이다. 미디어텍은 파운드리 업체 TSMC와의 긴밀한 협력 관계와 비교적 낮은 설계, 패키징 비용을 강점으로 내세우고 있다. 글로벌 빅테크들은 자체 칩, 엔비디아 GPU, 협력사 칩을 섞어 쓰는 다원화 전략을 본격화하는 흐름이다. 메타는 현재 AI 학습과 서비스 운영에 엔비디아 그래픽처리장치(GPU)를 대규모로 사용하고 있고 자체 AI 칩 개발 프로젝트도 병행하고 있다. 여기에 구글 TPU까지 더하면 엔비디아 한 곳에 집중된 공급 리스크를 줄일 수 있을 것이란 전망이다. 동시에 엔비디아 GPU, 자체 칩, 구글 TPU 등을 조합해 용도별로 성능과 비용을 최적화하는 전략을 펼칠 수 있다. 구글의 AI 칩셋 시장 진출로 단기간에 시장 주도권이 뒤집힐 가능성은 높지 않다는 분석도 나온다. 현재 AI 개발 생태계 상당 부분이 엔비디아 GPU에 맞춰 설계된 소프트웨어 플랫폼 '쿠다(CUDA)'를 중심으로 하기 때문이다. 또 개발자 도구, 라이브러리, 레퍼런스 모델이 모두 엔비디아를 기준으로 하는 만큼 다른 칩으로 전환하는 것이 GPU 도입보다 더 많은 부담이 된다는 점도 문제다. 그럼에도 빅테크 등 구글 칩을 대규모로 도입하는 기업이 들어난다면 엔비디아와의 가격·공급 협상 구도에 적잖은 변화가 생길 것이란 전망이 업계 전반의 공통된 인식이다. 구글 클라우드 임원진들은 "이번 TPU 도입 확대가 최대 엔비디아 연간 매출의 10%에 달하는 수십억 달러의 매출을 확보할 수 있을 것으로 예상된다"고 전망했다.

2025.11.25 18:06남혁우 기자

"AI, 업무 전반에 녹아든다"…구글, 인프라부터 에이전트까지 '기술 총동원'

구글 클라우드가 인공지능(AI) 전 계층에 걸친 기술 청사진을 공개하며 업무 자동화를 넘어 AI 기반 기업 운영 방식 전반의 전환을 예고했다. 구글 클라우드는 최근 '구글 클라우드 넥스트 25'를 앞두고 회사의 핵심 AI 기능을 미리 소개하는 기자간담회를 진행했다. 라스베이거스에서 열리는 본 행사에 앞서 글로벌 미디어를 대상으로 열린 간담회는 내부 전략 변화와 제품 로드맵이 집약된 자리로, 행사 본무대 발표에 앞서 방향성을 선제적으로 공유한 성격이 짙다. 9일 업계에 따르면 이번 발표는 단순한 기능 소개를 넘어 구글 클라우드의 AI 전략을 총체적으로 드러낸 이정표로 풀이된다. 발표에는 멀티에이전트 시스템 구축 도구는 물론, '제미나이 2.5' 모델과 7세대 텐서플로우 처리장치(TPU) '아이언우드', 생성형 미디어 기술 등 AI 전 계층을 포괄하는 기술이 포함됐다. "누구나 만드는 AI 동료"…전방위 에이전트 생태계 완성한다 가장 주목되는 것은 '에이전트 개발 키트(ADK)'다. ADK는 단 몇 줄의 코드만으로 고도화된 업무 에이전트를 구축할 수 있는 개발 프레임워크다. 추론 범위나 행동 규칙 등을 세밀하게 조정할 수 있으며 자사 AI 플랫폼인 버텍스 AI와 연동돼 확장성과 보안성까지 확보했다. ADK를 통해 기업은 다양한 사내 시스템이나 서비스형 소프트웨어(SaaS)와 연결되는 복수의 에이전트를 동시에 구성할 수 있다. 보고서 생성, 고객 분석, 문서 처리, 일정 조율 등의 업무를 각각의 에이전트에 맡기고 이들을 연계하는 멀티에이전트 구조도 구현 가능하다. 에이전트 상용화를 위한 '마켓플레이스'도 공개됐다. 이곳에서는 계약서 검토, 리스크 분석, 법률 요약, 고객 상담 등에 특화된 사전 제작 에이전트를 선택해 곧바로 업무에 적용할 수 있다. 업무별로 필요한 기능을 조합하는 모듈형 에이전트 전략이다. 에이전트 간 상호작용도 지원한다. 구글은 '에이전트 간 상호운용(A to A)'을 통해 플랫폼, 개발 프레임워크, 클라우드 환경이 달라도 서로 협력할 수 있도록 했다. 추상화된 요청을 공유하고 상황에 맞는 판단을 수행하는 방식으로, 서비스나 기업 경계를 넘는 에이전트 협업이 가능해졌다. 이미 세일즈포스, SAP, 서비스나우 등 50여 곳의 글로벌 벤더가 'A to A'에 참여 중이다. 비개발자용 실무 에이전트 플랫폼 '에이전트 스페이스(Agent Space)'도 처음 공개됐다. 이 공간에서는 기업의 일반 임직원이 사내 데이터를 기반으로 자연어로 에이전트를 생성하고 실행한다. 생성된 에이전트는 사내 시스템에 연결돼 실시간 보고서 작성, 고객 리스크 예측, 일정 예약 등 복잡한 업무를 수행한다. 이날 구글 관계자는 금융 담당자로서 데모를 시연하면서 자연어로 "내 고객 포트폴리오에서 리스크 신호를 찾아줘"라고 요청했다. 이에 에이전트가 사내 데이터에서 이상 거래를 식별하고 예상 시나리오를 분석한 뒤 자동으로 관련 요약 보고서와 이메일을 작성했다. '에이전트 스페이스'에서는 이러한 작업을 반복 자동화하는 '개인 에이전트'도 생성할 수 있다. 매일 아침 고객 현황을 요약하고 예상 리스크를 음성으로 전달하는 알림 기능도 제공된다. 마이크로소프트 원드라이브, 세일즈포스, 빅쿼리, 구글 드라이브 등 다양한 사내외 시스템과 연동돼 실시간 데이터 기반의 맞춤형 업무 수행이 가능하다. 기존의 구글 '워크스페이스' 전반에도 에이전트 개념이 도입된다. 구글 문서 도구에서는 주장의 논리와 구조를 분석해 개선을 제안하는 '헬프 미 리파인' 기능이 추가됐고 스프레드시트에서는 데이터 인사이트를 자동 추출해주는 분석 기능이 적용됐다. 화상회의 플랫폼 구글 미트에서는 실시간 회의 요약 외에도 회의 중 놓친 내용을 AI가 요약해주는 기능이 곧 적용된다. 버티컬 특화 에이전트는 이미 적용이 시작됐다. 미국의 패스트푸드 업체인 웬디스는 드라이브스루에서 다국어 AI 에이전트를 운영 중이며 메르세데스벤츠는 차량 내 음성 비서로 구글의 오토모티브 에이전트를 통합했다. 홈디포는 DIY 고객에게 24시간 전문가 수준의 상담을 제공하는 AI 에이전트를 활용하고 있다. 케이티 왓슨 구글 클라우드 제품 커뮤니케이션 디렉터는 "지금은 단일 질문에 답하는 AI에서 복잡한 문제를 해결하는 에이전트의 시대로 넘어가는 전환점"이라며 "이 에이전트들이 서로 연결되고 확장될 수 있도록 생태계 전체를 준비하고 있다"고 밝혔다. 추론 성능 중심으로…AI 인프라, TPU로 전면적 재설계 이같이 에이전트가 실질적인 업무 수행까지 가능해진 배경에는 이를 뒷받침하는 AI 인프라와 모델, 플랫폼의 전방위적 진화가 있다. 구글은 AI 에이전트를 단순한 인터페이스 수준에서 끝내지 않고 이를 작동시키는 연산 자원, 데이터 연결성, 모델 성능, 멀티모달 대응력 등 모든 층위를 통합적으로 끌어올리고 있다. 실제로 구글은 초대규모 모델 추론(inference) 성능을 획기적으로 끌어올린 7세대 텐서플로우 처리장치(TPU)인 '아이언우드(Ironwood)'를 이날 처음 공개했다. GPU 기반 아키텍처와의 차별화가 두드러지는 이 칩은 구글 내부 대규모 서비스에서 이미 검증됐으며 본격적인 외부 제공을 예고하고 있는 상황이다. '아이언우드'는 추론에 최적화된 설계로, 기존 6세대 TPU '트릴리움' 대비 전력 효율이 두 배 향상됐다. 총 9천개 칩을 하나의 팟(Pod)으로 묶어 슈퍼컴퓨터처럼 사용할 경우 최대 42.5 엑사플롭스 수준의 연산 성능을 제공한다. 이는 미국 정부가 보유한 세계 최대 슈퍼컴퓨터 보다 24배 이상 높은 수준이다. 초거대 모델 시대에서 추론 성능은 AI의 실전화에 직결되는 요소다. 구글은 이번 발표를 통해 학습보다 '서빙'에 특화된 AI 인프라가 새롭게 부상하고 있음을 강조했다. 네트워크 측면에서도 기존 한계를 넘는 구조가 제시됐다. 구글은 이번에 기업 고객을 위한 사설 글로벌 네트워크 서비스 '클라우드 WAN'을 함께 선보였다. 이는 구글이 전 세계에 구축한 사설 광케이블망(200만 마일 이상)을 외부 고객도 이용할 수 있도록 한 것으로, 네트워크 지연을 최소화하면서도 최대 40% 수준의 비용 절감이 가능하다. 특히 다국적 기업의 멀티리전 운영이나 멀티클라우드 환경에서 강점을 지닌다. AI 시스템을 구성하는 소프트웨어 스택의 효율성도 크게 향상됐다. 특히 쿠버네티스 환경에서는 AI 추론 작업에 특화된 자동 확장인 '스케일링'과 작업 분산 인 '로드밸런싱' 기능이 새로 추가됐다. 사용자가 많아져도 안정적으로 대응할 수 있고 최대 30%의 비용 절감, 60%의 응답 지연 감소 효과를 기대할 수 있게 됐다. AI 모델 런타임 영역에서는 구글 딥마인드가 내부에서 사용하던 머신러닝 런타임 '패스웨이(Pathways)'가 클라우드 고객에게 처음 개방됐다. 이 기능은 수백 개의 TPU를 동시에 연결해 초대형 모델의 안정적인 실시간 서빙을 지원한다. 모델은 고도화, 플랫폼은 통합…AI 실전 투입 위한 전열 정비 구글 클라우드는 이날 자사의 차세대 AI 모델 '제미나이 2.5'의 공식 출시를 발표하며 '프로(Pro)'와 '플래시(Flash)' 두 가지 버전을 공개했다. '프로'는 복잡한 추론과 정밀한 문제 해결에 최적화된 모델이며 '플래시'는 속도와 비용 효율성을 중시한 경량형 모델이다. 특히 '플래시'는 프롬프트의 난이도에 따라 자동으로 추론의 깊이를 조절하고 고객 예산에 맞춰 유연하게 운용 가능하도록 설계됐다. 두 모델 모두 '다층적 사고', '자기 반성적 추론' 등 고차원적 사고 능력을 갖추고 있으며 기존 챗봇을 넘어 복합적인 문제 해결까지 가능하다. 텍스트는 물론 이미지, 음성, 영상, 코드 등 다양한 입력을 통합적으로 이해하고 대응하는 멀티모달 처리 능력도 한층 강화됐다. 특히 초거대 AI 중 가장 긴 '컨텍스트 윈도우'를 갖춰 긴 문서나 복잡한 대화 흐름도 놓치지 않고 처리할 수 있다는 점이 강조됐다. 이날 구글은 '제미나이 2.5'의 기반이 되는 '버텍스 AI' 플랫폼도 대폭 확장했다고 밝혔다. '버텍스 AI'는 다양한 생성형 AI 모델을 선택·조합해 구축, 학습, 배포까지 가능한 통합 플랫폼으로, 현재 200개 이상 대형 모델을 제공한다. 여기에는 미스트랄, 라마 등 오픈모델도 포함되며 향후 허깅페이스와의 협업을 통해 수십만 개 오픈소스 모델을 추가할 계획이다. '버텍스 AI'의 생성형 미디어 기능도 대폭 강화됐다. '이마젠(Imagen)', '오디오(Audio)', '비디오(Video)', '리리아(Lyria)' 등 이미지, 음성, 영상, 음악을 생성하는 모델들이 추가됐고 이들을 통합적으로 활용할 수 있는 '버텍스 AI 미디어 스튜디오'가 공개됐다. 이를 통해 텍스트 한 줄로도 고품질 콘텐츠를 자동 제작할 수 있다. 실제 데모에서는 구글 관계자는 라스베이거스의 정적 이미지를 업로드해 드론샷 스타일의 영상으로 자동 변환하고 자동 생성된 음악을 입힌 뒤 특정 인물만 제거하는 '인페인팅' 기능까지 시연했다. 캐리 타프 구글 클라우드 산업·솔루션 부문 부사장은 "이번 발표는 AI 기술력뿐 아니라 실질적인 비즈니스 임팩트를 중시한 결과"라며 "초대형 모델에서 보안, 개발, 콘텐츠 제작까지 AI가 실무에 작동되는 모든 층위를 정비했다"고 말했다.

2025.04.09 21:01조이환 기자

[현장] "GPU 병목 넘는다"…구글 클라우드 '트릴리움' TPU로 AI 혁신 본격화

"그래픽 처리 장치(GPU)는 그래픽 연산에 특화돼 있지만 텐서 처리 장치(TPU)는 처음부터 인공지능(AI)용으로 설계됐습니다. 거대 언어 모델(LLM) 시대에 필요한 초거대 연산을 효율적으로 처리하는데 있어 우리가 개발한 '트릴리움' TPU는 좋은 답이 될 것입니다." 모한 피치카 구글 클라우드 프로덕트 매니저는 16일 회사가 개최한 '렛츠 토크 AI : 구글 클라우드 트릴리움 교육 세션'에서 이같이 말했다. 이날 온라인으로 진행된 행사에서 피치카 PM은 구글 클라우드가 새롭게 선보인 6세대 텐서 TPU '트릴리움'과 AI 하이퍼컴퓨팅 전략을 설명했다. 피치카 PM에 따르면 GPU가 본래 컴퓨터 그래픽의 병렬 처리를 위해 개발된 것과 달리 TPU는 뉴럴 네트워크 연산에 특화해 처음부터 AI를 염두에 두고 탄생한 장치다. 구글 역시 이러한 트렌드를 감안해 지난 2015년 경부터 TPU를 개발해 왔다. 트릴리움 TPU는 단순히 '칩' 하나만 개선한 것이 아니다. LLM을 학습하려면 네트워킹, 스토리지, 소프트웨어 스택까지 모두 일관성 있게 최적화돼야 하는 것은 필수다. 이에 구글 클라우드 역시 '트릴리움'이 이 모든 구성 요소를 하나의 거대한 슈퍼컴퓨터처럼 움직이도록 설계했다는 것이 피치카 PM의 설명이다. 실제로 구글 클라우드는 저전력 액체 냉각 기술, 3세대 스파스코어(SparseCore), 확장된 고대역폭 메모리(HBM) 등 다양한 요소를 결합해 '트릴리움'의 전력 효율과 확장성을 함께 끌어올렸다. 피치카 PM은 "GPU만 쓰는 환경에서는 분산 처리가 복잡해질 수 있지만 트릴리움 TPU는 칩 수천 개를 유기적으로 연결해 병목 현상을 최소화한다"며 "이런 통합 아키텍처야말로 거대 언어 모델 시대에 꼭 필요한 핵심"이라고 말했다. 행사에서 반복적으로 언급된 또다른 키워드는 'AI 하이퍼컴퓨터'였다. '트릴리움'을 통해 구글이 네트워크, 스토리지, 오픈소스 소프트웨어, 유연한 소비 모델을 통합함으로써 거대 언어 모델을 빠르고 안정적으로 서빙할 수 있는 '슈퍼컴퓨팅 환경'을 구현했다는 것이다. 피치카 PM은 "구글은 이미 검색, 포토, 지도 등 주요 서비스에 TPU를 대규모로 적용해 왔다"며 "이를 통해 얻은 노하우가 글로벌 고객들에게도 곧바로 제공된다"고 밝혔다. 구체적인 활용 사례도 공개됐다. 현재 카카오는 통합 AI 브랜드 '카나나(Kanana)'를 개발하던 중 GPU 자원의 한계를 느껴 트릴리움 TPU를 도입한 바 있다. 이에 따라 70B 파라미터를 지닌 대형 한국어·영어 모델을 빠르게 학습시킬 수 있었다. 글로벌 유즈 케이스 역시 상당하다. 글로벌 제약회사인 바이엘은 신약 개발에, 딥 지노믹스는 RNA 치료제 연구에 '트릴리움'을 적용해 대규모 AI 모델을 효율적으로 구동하고 있다. 피치카 PM은 "노벨상 수상 연구로 주목받은 알파폴드(AlphaFold) 2나 구글의 최신 모델 제미나이(Gemini) 2.0 역시 '트릴리움' TPU를 가속기로 썼다"며 "초거대 모델 시대에 TPU가 점점 더 중요한 위치를 차지할 것"이라고 내다봤다. TPU는 성공적인 AI 연산 뿐만 아니라 지속 가능성 측면에서도 주목할만한 대안이다. 구글에 따르면 지난해 12월 출시된 '트릴리움' 6세대는 이전 세대 대비 전력 효율을 67%까지 끌어올려 에너지 소비를 줄이고 액체 냉각 기술 같은 친환경 기술을 통해 탄소발자국을 최소화한다. 피치카 PM은 "우리는 친환경적인 AI 인프라를 구축하기 위해 TPU 설계와 운영에서 지속 가능성을 핵심 목표로 삼았다"며 "이러한 기술적 혁신은 에너지 효율성 개선과 환경 보호를 동시에 달성하려는 구글의 장기적인 전략에 부합한다"고 덧붙였다. 구글 클라우드는 경쟁사와의 비교에도 자신감을 보였다. '트릴리움'과 엔비디아 'H100' GPU의 차이에 대한 기자의 질문에 피치카 PM은 "칩과 소프트웨어 스택이 서로 달라 단순 비교는 어렵다"면서도 "'트릴리움'은 뉴럴 네트워크 연산에 특화된 구조로 동일 코어 대비 '행렬 곱셈(Matrix multiplication)' 등 AI 핵심 작업에서 높은 효율을 보인다"고 설명했다. 다만 "아키텍처가 다른 칩들을 성능 점수만으로 비교할 수는 없기 때문에 심층적인 분석이 필요하다"고 당부했다. 지난해 12월 정식 출시 이후 전 세계 고객사들은 이미 '트릴리움' TPU를 이용해 대규모 AI 모델을 구동하고 있다. 구글은 이러한 기술을 기반으로 보다 다양한 유즈 케이스를 확보해 글로벌 시장에서 영향력을 확대할 계획이다. 피치카 PM은 "GPU가 이끌던 AI 시대를 이제 TPU가 한 단계 더 진화시키고 있다"며 "'트릴리움'은 고밀도 모델과 초거대 연산에 최적화된 전용 솔루션으로, 누구든 이 'AI 하이퍼컴퓨터' 인프라를 활용해 글로벌 경쟁력을 확보할 수 있을 것"이라고 강조했다.

2025.01.16 12:00조이환 기자