• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'TPU'통합검색 결과 입니다. (5건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"AI, 업무 전반에 녹아든다"…구글, 인프라부터 에이전트까지 '기술 총동원'

구글 클라우드가 인공지능(AI) 전 계층에 걸친 기술 청사진을 공개하며 업무 자동화를 넘어 AI 기반 기업 운영 방식 전반의 전환을 예고했다. 구글 클라우드는 최근 '구글 클라우드 넥스트 25'를 앞두고 회사의 핵심 AI 기능을 미리 소개하는 기자간담회를 진행했다. 라스베이거스에서 열리는 본 행사에 앞서 글로벌 미디어를 대상으로 열린 간담회는 내부 전략 변화와 제품 로드맵이 집약된 자리로, 행사 본무대 발표에 앞서 방향성을 선제적으로 공유한 성격이 짙다. 9일 업계에 따르면 이번 발표는 단순한 기능 소개를 넘어 구글 클라우드의 AI 전략을 총체적으로 드러낸 이정표로 풀이된다. 발표에는 멀티에이전트 시스템 구축 도구는 물론, '제미나이 2.5' 모델과 7세대 텐서플로우 처리장치(TPU) '아이언우드', 생성형 미디어 기술 등 AI 전 계층을 포괄하는 기술이 포함됐다. "누구나 만드는 AI 동료"…전방위 에이전트 생태계 완성한다 가장 주목되는 것은 '에이전트 개발 키트(ADK)'다. ADK는 단 몇 줄의 코드만으로 고도화된 업무 에이전트를 구축할 수 있는 개발 프레임워크다. 추론 범위나 행동 규칙 등을 세밀하게 조정할 수 있으며 자사 AI 플랫폼인 버텍스 AI와 연동돼 확장성과 보안성까지 확보했다. ADK를 통해 기업은 다양한 사내 시스템이나 서비스형 소프트웨어(SaaS)와 연결되는 복수의 에이전트를 동시에 구성할 수 있다. 보고서 생성, 고객 분석, 문서 처리, 일정 조율 등의 업무를 각각의 에이전트에 맡기고 이들을 연계하는 멀티에이전트 구조도 구현 가능하다. 에이전트 상용화를 위한 '마켓플레이스'도 공개됐다. 이곳에서는 계약서 검토, 리스크 분석, 법률 요약, 고객 상담 등에 특화된 사전 제작 에이전트를 선택해 곧바로 업무에 적용할 수 있다. 업무별로 필요한 기능을 조합하는 모듈형 에이전트 전략이다. 에이전트 간 상호작용도 지원한다. 구글은 '에이전트 간 상호운용(A to A)'을 통해 플랫폼, 개발 프레임워크, 클라우드 환경이 달라도 서로 협력할 수 있도록 했다. 추상화된 요청을 공유하고 상황에 맞는 판단을 수행하는 방식으로, 서비스나 기업 경계를 넘는 에이전트 협업이 가능해졌다. 이미 세일즈포스, SAP, 서비스나우 등 50여 곳의 글로벌 벤더가 'A to A'에 참여 중이다. 비개발자용 실무 에이전트 플랫폼 '에이전트 스페이스(Agent Space)'도 처음 공개됐다. 이 공간에서는 기업의 일반 임직원이 사내 데이터를 기반으로 자연어로 에이전트를 생성하고 실행한다. 생성된 에이전트는 사내 시스템에 연결돼 실시간 보고서 작성, 고객 리스크 예측, 일정 예약 등 복잡한 업무를 수행한다. 이날 구글 관계자는 금융 담당자로서 데모를 시연하면서 자연어로 "내 고객 포트폴리오에서 리스크 신호를 찾아줘"라고 요청했다. 이에 에이전트가 사내 데이터에서 이상 거래를 식별하고 예상 시나리오를 분석한 뒤 자동으로 관련 요약 보고서와 이메일을 작성했다. '에이전트 스페이스'에서는 이러한 작업을 반복 자동화하는 '개인 에이전트'도 생성할 수 있다. 매일 아침 고객 현황을 요약하고 예상 리스크를 음성으로 전달하는 알림 기능도 제공된다. 마이크로소프트 원드라이브, 세일즈포스, 빅쿼리, 구글 드라이브 등 다양한 사내외 시스템과 연동돼 실시간 데이터 기반의 맞춤형 업무 수행이 가능하다. 기존의 구글 '워크스페이스' 전반에도 에이전트 개념이 도입된다. 구글 문서 도구에서는 주장의 논리와 구조를 분석해 개선을 제안하는 '헬프 미 리파인' 기능이 추가됐고 스프레드시트에서는 데이터 인사이트를 자동 추출해주는 분석 기능이 적용됐다. 화상회의 플랫폼 구글 미트에서는 실시간 회의 요약 외에도 회의 중 놓친 내용을 AI가 요약해주는 기능이 곧 적용된다. 버티컬 특화 에이전트는 이미 적용이 시작됐다. 미국의 패스트푸드 업체인 웬디스는 드라이브스루에서 다국어 AI 에이전트를 운영 중이며 메르세데스벤츠는 차량 내 음성 비서로 구글의 오토모티브 에이전트를 통합했다. 홈디포는 DIY 고객에게 24시간 전문가 수준의 상담을 제공하는 AI 에이전트를 활용하고 있다. 케이티 왓슨 구글 클라우드 제품 커뮤니케이션 디렉터는 "지금은 단일 질문에 답하는 AI에서 복잡한 문제를 해결하는 에이전트의 시대로 넘어가는 전환점"이라며 "이 에이전트들이 서로 연결되고 확장될 수 있도록 생태계 전체를 준비하고 있다"고 밝혔다. 추론 성능 중심으로…AI 인프라, TPU로 전면적 재설계 이같이 에이전트가 실질적인 업무 수행까지 가능해진 배경에는 이를 뒷받침하는 AI 인프라와 모델, 플랫폼의 전방위적 진화가 있다. 구글은 AI 에이전트를 단순한 인터페이스 수준에서 끝내지 않고 이를 작동시키는 연산 자원, 데이터 연결성, 모델 성능, 멀티모달 대응력 등 모든 층위를 통합적으로 끌어올리고 있다. 실제로 구글은 초대규모 모델 추론(inference) 성능을 획기적으로 끌어올린 7세대 텐서플로우 처리장치(TPU)인 '아이언우드(Ironwood)'를 이날 처음 공개했다. GPU 기반 아키텍처와의 차별화가 두드러지는 이 칩은 구글 내부 대규모 서비스에서 이미 검증됐으며 본격적인 외부 제공을 예고하고 있는 상황이다. '아이언우드'는 추론에 최적화된 설계로, 기존 6세대 TPU '트릴리움' 대비 전력 효율이 두 배 향상됐다. 총 9천개 칩을 하나의 팟(Pod)으로 묶어 슈퍼컴퓨터처럼 사용할 경우 최대 42.5 엑사플롭스 수준의 연산 성능을 제공한다. 이는 미국 정부가 보유한 세계 최대 슈퍼컴퓨터 보다 24배 이상 높은 수준이다. 초거대 모델 시대에서 추론 성능은 AI의 실전화에 직결되는 요소다. 구글은 이번 발표를 통해 학습보다 '서빙'에 특화된 AI 인프라가 새롭게 부상하고 있음을 강조했다. 네트워크 측면에서도 기존 한계를 넘는 구조가 제시됐다. 구글은 이번에 기업 고객을 위한 사설 글로벌 네트워크 서비스 '클라우드 WAN'을 함께 선보였다. 이는 구글이 전 세계에 구축한 사설 광케이블망(200만 마일 이상)을 외부 고객도 이용할 수 있도록 한 것으로, 네트워크 지연을 최소화하면서도 최대 40% 수준의 비용 절감이 가능하다. 특히 다국적 기업의 멀티리전 운영이나 멀티클라우드 환경에서 강점을 지닌다. AI 시스템을 구성하는 소프트웨어 스택의 효율성도 크게 향상됐다. 특히 쿠버네티스 환경에서는 AI 추론 작업에 특화된 자동 확장인 '스케일링'과 작업 분산 인 '로드밸런싱' 기능이 새로 추가됐다. 사용자가 많아져도 안정적으로 대응할 수 있고 최대 30%의 비용 절감, 60%의 응답 지연 감소 효과를 기대할 수 있게 됐다. AI 모델 런타임 영역에서는 구글 딥마인드가 내부에서 사용하던 머신러닝 런타임 '패스웨이(Pathways)'가 클라우드 고객에게 처음 개방됐다. 이 기능은 수백 개의 TPU를 동시에 연결해 초대형 모델의 안정적인 실시간 서빙을 지원한다. 모델은 고도화, 플랫폼은 통합…AI 실전 투입 위한 전열 정비 구글 클라우드는 이날 자사의 차세대 AI 모델 '제미나이 2.5'의 공식 출시를 발표하며 '프로(Pro)'와 '플래시(Flash)' 두 가지 버전을 공개했다. '프로'는 복잡한 추론과 정밀한 문제 해결에 최적화된 모델이며 '플래시'는 속도와 비용 효율성을 중시한 경량형 모델이다. 특히 '플래시'는 프롬프트의 난이도에 따라 자동으로 추론의 깊이를 조절하고 고객 예산에 맞춰 유연하게 운용 가능하도록 설계됐다. 두 모델 모두 '다층적 사고', '자기 반성적 추론' 등 고차원적 사고 능력을 갖추고 있으며 기존 챗봇을 넘어 복합적인 문제 해결까지 가능하다. 텍스트는 물론 이미지, 음성, 영상, 코드 등 다양한 입력을 통합적으로 이해하고 대응하는 멀티모달 처리 능력도 한층 강화됐다. 특히 초거대 AI 중 가장 긴 '컨텍스트 윈도우'를 갖춰 긴 문서나 복잡한 대화 흐름도 놓치지 않고 처리할 수 있다는 점이 강조됐다. 이날 구글은 '제미나이 2.5'의 기반이 되는 '버텍스 AI' 플랫폼도 대폭 확장했다고 밝혔다. '버텍스 AI'는 다양한 생성형 AI 모델을 선택·조합해 구축, 학습, 배포까지 가능한 통합 플랫폼으로, 현재 200개 이상 대형 모델을 제공한다. 여기에는 미스트랄, 라마 등 오픈모델도 포함되며 향후 허깅페이스와의 협업을 통해 수십만 개 오픈소스 모델을 추가할 계획이다. '버텍스 AI'의 생성형 미디어 기능도 대폭 강화됐다. '이마젠(Imagen)', '오디오(Audio)', '비디오(Video)', '리리아(Lyria)' 등 이미지, 음성, 영상, 음악을 생성하는 모델들이 추가됐고 이들을 통합적으로 활용할 수 있는 '버텍스 AI 미디어 스튜디오'가 공개됐다. 이를 통해 텍스트 한 줄로도 고품질 콘텐츠를 자동 제작할 수 있다. 실제 데모에서는 구글 관계자는 라스베이거스의 정적 이미지를 업로드해 드론샷 스타일의 영상으로 자동 변환하고 자동 생성된 음악을 입힌 뒤 특정 인물만 제거하는 '인페인팅' 기능까지 시연했다. 캐리 타프 구글 클라우드 산업·솔루션 부문 부사장은 "이번 발표는 AI 기술력뿐 아니라 실질적인 비즈니스 임팩트를 중시한 결과"라며 "초대형 모델에서 보안, 개발, 콘텐츠 제작까지 AI가 실무에 작동되는 모든 층위를 정비했다"고 말했다.

2025.04.09 21:01조이환

고동진 의원, 14일 AI 산업 현황 분석 간담회 개최

고동진 국회의원은 14일 오전 9시 국회의원회관 제7간담회실에서 '엔비디아 GPU와 함께 이야기되고 있는 TPU와 NPU 기술 등에 대한 현황분석 간담회'를 개최한다고 13일 밝혔다. '국민의힘 AI 3대 강국 도약 특별위원회' 소속인 고동진 의원의 주재로 열리는 이번 간담회는 김대현 삼성리서치 글로벌 AI센터장을 비롯한 관련 전문가들이 참석해 AI 기술 현황을 점검하고 AI 산업 발전을 위한 방안 등을 논의할 예정이다. 고 의원은 "대한민국 AI 산업의 성공을 위해 관련 전문가들의 의견 수렴은 필수다. AI 산업은 글로벌 경쟁이 치열한 상황이고 기술 발전 속도가 산업의 성패를 결정 짓는다”며 “일회성 간담회가 아닌 정례적인 전문가 간담회를 추진토록해 AI 산업 발전 방안을 마련토록 하겠다”고 밝혔다. 한편 이번 간담회에서 논의된 내용들은 조속히 정리해 'AI 3대 강국 도약 특별위원회'에 소속 의원들과 관련 정부 부처와 공유할 예정이다.

2025.01.13 15:16장경윤

애플, AI 훈련에 엔비디아 GPU 대신 구글 TPU 채택

애플이 구글 클라우드, 인공지능(AI) 제미나이 대한 의존도를 더욱 높이는 분위기다. 이르면 8월 초 iOS 18.1 개발자 베타 테스트에서 공개되는 '애플 인텔리전스'를 위해 엔비디아 대신 구글 텐서 처리 장치(TPU)를 사용하기로 한 것이다. 30일 로이터, CNBC 등 외신에 따르면 애플은 8월 초 출시될 AI 도구 및 기능 제품군을 구동할 새로운 AI 소프트웨어(SW) 기반을 구축하기 위해 구글 인프라를 적극 활용할 계획이다. 애플은 아이폰, 아이패드, 맥북 등에서 작동할 AI 모델을 훈련하기 위해 2천 개가 넘는 TPUv5p 칩을 사용했다. 또 서버 AI 모델을 구축하기 위해 8천192개의 TPUv4 프로세서를 배포했다. 이는 엔비디아가 AI 반도체 시장의 80%를 차지하고 있단 점에서 주목할 만하다. 엔비디아는 주로 그래픽처리장치(GPU)를 이용한 AI칩을 만들고 있다. 하지만 애플은 이를 거부하고 구글 클라우드를 이용한 AI를 만들겠다고 밝혀 주목된다. 외신들은 메타, 아마존 등 다른 빅테크의 엔비디아의 칩 수요가 너무 높아 애플이 원하는 시간에 원하는 양의 칩 조달을 할 수 없다고 판단한 것으로 추정했다. TPU와 GPU의 차이는 작업 능력 및 역할에 있다. TPU는 딥러닝 작업에 특화돼 전력을 효율적으로 사용하고 많은 계산이 필요한 작업을 빠르게 수행한다. 반면 GPU는 다양한 일반적인 컴퓨터 작업 처리를 주로 하며 병렬 처리 능력에 특화돼 TPU보다 높은 계산 능력을 가지고 있지만 대량 연산 처리가 필요할 시 전력 소모가 TPU보다 높다. 칩과 시스템을 독립형 제품으로 판매하는 엔비디아와 달리 구글은 구글 클라우드 플랫폼을 통해 TPU에 대한 액세스를 판매한다. TPU 액세스 권한 구매에 관심 있는 사람은 칩을 사용하려면 구글 클라우드 플랫폼을 통해 SW를 구축해야 한다. 애플은 iOS 18.1부터 탑재되는 애플 인텔리전스를 통해 보다 많은 기능을 선보일 예정이다. 시리의 음성 비서화, 자연어 처리뿐 아니라 이미지 생성, 사용자 정보 활용 앱 내 작업 수행 등이 들어간다. 다만 현재는 애플 개발자들만 쓸 수 있는 iOS 18.1 개발자 베타 버전에서만 쓸 수 있으며 일반 사용자들에게 공개된 iOS 18 베타 버전에는 애플 인텔리전스가 빠져 있다. 당초 애플은 지난 6월 세계개발자회의(WWDC)에서 iOS 18과 애플 인텔리전스를 공개하며 이들을 아이폰 16과 함께 출시한다고 발표했다. 하지만 애플 인텔리전스의 안정성 우려가 나오고 있고 충분한 테스트가 필요하단 지적이 나오면서 공식 출시 시점이 미뤄지는 것으로 보인다. 업계는 애플이 시리 개편 등 정식 버전 출시는 내년 상반기 내 업데이트로 전망하고 있다. 애플 관계자는 보고서에서 "애플 파운데이션 모델(AFM) 서버·AFM 온 디바이스 등 더 큰 모델을 포함해 AFM 모델을 더 효율적이고 많이 훈련할 수 있다"고 밝혔다.

2024.07.30 10:30양정민

구글, 생성형AI 개발 도구 3종 공개...개발 생태계 지원

구글이 생성형 인공지능(AI) 개발을 지원하기 위한 오픈소스 도구 3종을 공개했다. 오픈AI와 달리 자체 AI만으로 경쟁력을 확보하기 어려워지면서 개발자 생태계 지원에 보다 집중하는 모양새다. 9일(현지시간) 인포월드 등 외신에 따르면 구글은 연례 개발자 컨퍼런스인 구글 클라우드 넥스트를 통해 맥스디퓨전, 옵티멈-TPU, 제트스트림을 선보였다. 맥스디퓨전은 이미지와 데이터 생성을 위한 AI도구다. 고성능 수치 컴퓨팅 환경을 염두하고 대규모 기계 학습을 위한 프레임워크인 구글 JAX를 기반으로 개발된 것이 특징이다. 대규모 데이터 셋을 기존보다 빠르게 학습하고 이를 바탕으로 정교한 답변을 제공하거나 복잡하고 큰 이미지를 생성할 수 있도록 지원한다. 옵티멈-TPU는 허깅페이스의 AI모델을 구글의 AI칩인 텐서프로세스유닛(TPU)에서 효과적으로 훈련시키고 실행할 수 있도록 설계된 성능 최적화 패키지다. 오픈소스 기계학습 프레임워크 파이토치의 라이브러리와 도구를 그대로 사용할 수 있어 복잡한 설정이나 최적화 과정 없이 TPU의 능력을 최대한 이용해 빠르게 모델을 훈련시키고 배포할 수 있도록 돕는다. 제트스트림은 TPU와 같은 특정 컴퓨터 장치에서 AI 모델을 더 빠르고 경제적으로 실행할 수 있게 해주는 도구다. 비용을 절약하면서도 많은 양의 데이터를 빠르게 처리할 수 있도록 설계됐다. 구글 JAX나 파이토치, XLA로 훈련된 모델을 모두 지원하며, 라마 2와 젬마 등 오픈 모델에 대한 최적화도 제공한다.

2024.04.10 10:46남혁우

전 구글 개발자, AI 기밀 500건 훔쳐 중국에 넘기다 체포

구글의 전직 소프트웨어 엔지니어가 인공지능(AI) 기업 비밀을 중국 기업에 유출한 혐의로 체포됐다. 최근 더버지 등 외신에 따르면, 연방 대배심은 구글의 전 엔지니어 린웨이 딩을 기업 기밀 유출 혐의로 기소 후 캘리포니아 뉴어크에서 체포했다. 리사 모나코 법무부 차관은 "린웨이 딩은 AI 기술 경쟁에서 우위를 점하려는 중국 기업을 위해 비밀리에 일하며 AI 영업 비밀이 포함된 500개 이상의 기밀 파일을 구글에서 훔쳤다"고 성명을 통해 밝혔다. 현재 그는 영업 비밀 절도 혐의로 4건의 기소를 당했으며 유죄 판결을 받을 경우 각 건당 최대 10년의 징역형과 25만 달러의 벌금형에 처해질 전망이다. 린 웨이딩은 구글에 재직 중이던 2022년 5월부터 2023년 5월 사이에 해당 파일을 개인 클라우드 계정으로 전송한 것으로 나타났다. 데이터 손실 방지 시스템을 피하기 위해 기밀 데이터를 구글에서 지급한 맥북 노트북의 애플 노트에서 PDF로 변환하는 작업을 거친 후 유출한 것으로 확인됐다. 도난당한 데이터는 대부분 구글의 AI전용 프로세서인 텐서처리장치(TPU)와 관련된 것으로 알려졌다. TPU칩은 학습, 미세 조정, 추론 등 다양한 AI 워크로드를 지원하며 엔비디아 GPU와 함께 제미나이와 같은 AI 모델을 훈련하고 실행할 수 있다. 미국 법무부는 그가 파일을 훔치기 시작한 지 한 달도 채 지나지 않은 2022년 6월 중국 베이징에 위치한 AI 스타트업과 만나 최고기술책임자(CTO) 자리를 제안받았다고 밝혔다. 같은 해 10월 중국에 방문해 AI스타트업의 투자자 미팅에 참여해 자신이 해당 기업의 CTO라고 소개한 정황도 확인됐다. 이어서 린웨이 딩은 다음달 대규모 AI학습 가속을 지원하는 AI스타트업을 중국에 설립했다. 해당 기간 그는 아직 구글에 재직 중이었으나 중국 기업과 함께 일한다는 사실을 회사에 알리지 않았으며, 중국에 방문한다는 내용도 알리지 않았다. 린웨이 딩은 중국 기업과 몰래 협업하는 중에도 구글에서 몇 개월간 활동을 이어갔으며, 2023년 12월 퇴사했다. 구글은 린웨이 딩 퇴사 3일 후 다른 직원이 그의 ID 배지를 사용하는 것을 감시 영상을 통해 확인 후 이상함을 느낀 후 조사에 착수했다. 이를 통해 그가 중국 스타트업과 관계가 있다는 것을 파악하고 FBI에 수사를 문의했다. 이에 FBI는 린 웨이딩이 구글 클라우드에 업로드한 500개의 파일을 영장 발부해 그가 살던 캘리포니아주 뉴어크에서 체포했다. 구글의 호세 카스타네다 대변인은 “이 직원이 수많은 문서를 훔친 것을 발견했고, 신속하게 해당 사건을 법 집행 기관에 회부했다”며 “정보를 보호하는 데 도움을 준 FBI에 감사하며 계속해서 긴밀히 협력할 것”이라고 말했다.

2024.03.11 10:51남혁우

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

SKT 유심교체 누적 193만...교체 예약 대기 686만

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현