검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'TPU'통합검색 결과 입니다. (8건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

"AI도 국경 안에서"…구글클라우드, 韓서 추론·데이터 처리 통합 지원

"구글클라우드가 한국 리전 구축 5주년을 맞았습니다. 이에 대한 성과로 '제미나이 2.5 플래시' 모델을 서울 리전에 지난주 정식 출시했습니다. 한국 고객들은 국내에서 인공지능(AI) 추론부터 데이터 처리까지 한 번에 수행할 수 있습니다. 이를 통해 데이터 주권 확보와 생산성 혁신을 동시에 누릴 것입니다." 지기성 구글클라우드코리아 대표는 8일 서울 코엑스 그랜드볼룸에서 열린 '구글클라우드 데이 서울' 기자간담회에서 이같이 밝혔다. 앞서 구글클라우드는 서울 리전에서 제미나이 2.5 플래시 모델을 정식 출시했다. 이를 통해 AI 추론과 머신러닝(ML) 처리까지 국내에서 수행할 수 있게 데이터 레지던시 기능을 강화했다. 제미나이 2.5 플래시는 오픈AI의 GPT-4o 대비 비용당 약 24배, 딥시크 모델보다 약 5배 높은 성능을 제공한다는 평가를 받고 있다. 고객은 서울 리전에서 제미나이 2.5 플래시를 통해 데이터 저장뿐 아니라 모든 ML 처리 과정을 동일 위치에서 한 번에 진행할 수 있다. 새 TPU '아이언우드' 출시 앞둬…"소버린 클라우드 강화" 구글클라우드는 AI 추론 성능을 올린 텐서처리장치(TPU) '아이언우드'를 발표하고, 공공·민간 산업 전반에 걸친 소버린 클라우드 전략을 강화한다고 밝혔다. 고성능 연산 인프라에 대한 투자와 데이터 주권 요구에 대응하는 차세대 클라우드 모델을 전면에 세운 셈이다. 지 대표는 AI 추론에 최적화된 7세대 TPU 아이언우드를 조만간 공식 출시할 예정이라고 발표했다. 아이언우드는 기존 6세대 대비 10배 향상된 에너지 효율과 42.5 엑사플롭스(ExaFLOPS)의 처리 성능을 제공한다. 지 대표는 "아이언우드 성능은 한국 정부가 국가 AI 컴퓨팅 센터 구축 목표로 제시한 1 엑사플롭스의 42배에 달한다"며 "현존하는 슈퍼컴퓨터 대비 약 24배 높은 성능 구현까지 가능하다"고 설명했다. 그러면서 "이 칩은 생성형 AI의 추론 연산에 특화됐다"며 "중앙처리장치(GPU) 대비 목적에 따라 선택 적용 가능하다"고 덧붙였다. 지 대표는 보안·통제가 핵심인 산업군을 겨냥한 '클라우드 에어갭(Cloud Air-gapped)' 모델도 제시했다. 이 모델은 고객 데이터센터 내에서만 작동하며 외부 네트워크 연결 없이 운영되는 소버린 클라우드다. 지 대표는 "보안이 중요한 공공·금융은 물론 반도체와 배터리 등 민감 산업에도 도입 가능한 서비스"라고 강조했다. 이 외에도 구글클라우드는 전사적자원관리(ERP)를 비롯한 고객관계관리(CRM), 이메일, 협업툴 등 다양한 업무 시스템을 하나로 통합하는 에이전트 기반 오피스 자동화에도 시동 걸었다. 음성 명령만으로 흩어진 데이터를 조회하고 실행까지 연결하는 구조다. 예를 들어 사용자가 에이전트에 "최근 주문 상황을 알려줘"라고 말하면, 에이전트가 관련 시스템에서 정보를 자동으로 수집·요약하고, 필요한 조치까지 제안하거나 실행하는 식이다. 사용자는 복잡한 인터페이스를 오갈 필요 없이 업무 생산성과 결정 속도를 동시에 끌어올릴 수 있다. 지 대표는 "우리는 하드웨어(HW)부터 소프트웨어(SW) 서비스까지 모든 기술을 자체 보유하고 있다"며 "한국 고객이 국내에서 AI 추론부터 데이터 통제까지 주도할 수 있는 생태계를 강화할 것"이라고 강조했다.

2025.07.08 14:00김미정

"경쟁사가 파트너로"…오픈AI, 구글 칩으로 챗GPT 돌린다

오픈AI가 챗GPT에 구글 인공지능(AI) 칩셋을 적용해 경쟁사 간 협력을 강화한다. 29일 테크크런치 등 외신은 오픈AI가 구글의 텐서 처리 장치(TPU)를 활용한다고 보도했다. 오픈AI가 그동안 주력해 온 엔비디아 칩셋 외에 다른 하드웨어를 본격적으로 도입한 것은 이번이 처음이다. 외신들은 이번 행보가 오픈AI의 특정 하드웨어·인프라 의존 구조에서 벗어나 보다 유연하고 확장 가능한 컴퓨팅 기반을 마련하려는 전략으로 봤다. 오픈AI는 구글 TPU 활용을 통해 추론 비용 절감 효과를 기대하고 있다. 실제 구글 TPU는 엔비디아 GPU 대비 가격 경쟁력 있다는 평가를 받고 있다. 앞서 오픈AI는 이미 챗GPT와 API 서비스 운영에 구글클라우드 인프라를 도입했다. AI 모델 훈련뿐 아니라 추론 연산에 필요한 컴퓨팅 수요가 급증하면서 단일 인프라에 의존하지 않는 구조가 필요해져서다. 당시 업계에서는 AI 경쟁사 간 협업이라는 점에 주목했고, 이번 TPU 적용으로 이런 협력 관계는 한층 강화할 것으로 보인다. 구글 역시 AI 인프라 개방을 통해 수익을 늘리고 있다. TPU를 외부에 공개한 이후 애플과 앤트로픽 등을 고객으로 유치한 바 있다. 다만 구글은 최상위 TPU 모델 버전을 오픈AI에 제공하지 않고 있는 것으로 알려졌다. 이에 따라 이번 협력은 일부 기능에 한정된 제한적 범위일 수 있다는 분석도 이어지고 있다.

2025.06.29 12:05김미정

오픈AI, 구글클라우드에 챗GPT 올린다…MS 의존 탈피 '시동'

오픈AI가 인공지능(AI) 컴퓨팅 인프라 확대를 위해 구글클라우드와 협력을 체결한 것으로 전해졌다. 이는 마이크로소프트와 맺은 인프라 독점 계약 재조정 논의 후 진행된 것으로 알려졌다. 11일 로이터통신은 오픈AI가 지난 5월 구글클라우드와 AI 컴퓨팅 자원 공급 계약을 체결하고 AI 모델 훈련·인프라 확대에 나섰다고 내부 소식통을 인용해 보도했다. 일각에선 이번 협력이 오픈AI가 마이크로소프트와 맺은 기존 독점적 협약 구조에서 일정 부분 벗어난 결과라는 분위기다. 오픈AI는 그동안 서비스 운영에 필요한 모든 클라우드 인프라를 마이크로소프트 애저에서만 제공받는 구조였다. 이로 인해 구글클라우드 등 경쟁 업체와는 별도 계약을 맺지 않았다. 그러나 최근 오픈AI와 마이크로소프트 간의 수십억 달러 규모 투자 계약 조건을 재조정하는 논의가 진행되면서 변화가 생긴 것으로 전해졌다. 구체적으로는 마이크로소프트가 보유한 오픈AI의 지분 구조와 향후 투자 방식, 인프라 공급 조건 등이 재협의 되면서 오픈AI가 일부 클라우드 자원을 외부에서 조달할 수 있는 여지가 생긴 것이다. 구글도 자체 AI 칩인 텐서처리장치(TPU)를 외부에 개방하며 클라우드 고객을 추가 확보한 셈이다. 이미 애플과 앤트로픽을 고객으로 둔 상태다. 그동안 오픈AI는 챗GPT로 인해 컴퓨팅 수요가 급증하자 다양한 공급처를 확보해 왔다. 소프트뱅크, 오라클과 손잡고 5천억 달러(약 683조6천500억원) 규모 '스타게이트' 프로젝트를 추진하는가 하면 코어위브와도 수십억 달러 규모 계약을 체결했다. 챗GPT는 현재 사용자 규모와 AI 성능 측면에서 구글 챗봇 '제미나이'를 앞서고 있다. 이에 구글 검색 시장 점유율에도 영향을 줄 수 있다는 전망이 나온다. 순다르 피차이 알파벳 최고경영자(CEO)는 해당 위협을 크게 우려하지 않는다는 입장을 보였다. 스코샤은행은 "이번 거래는 양사가 격렬한 경쟁 관계임에도 컴퓨팅 수요 앞에서 현실적인 판단을 내린 사례"라며 "구글클라우드에는 중대한 성과지만 챗GPT가 구글 검색을 위협한다는 우려는 여전하다"고 분석했다.

2025.06.11 08:43김미정

"AI, 업무 전반에 녹아든다"…구글, 인프라부터 에이전트까지 '기술 총동원'

구글 클라우드가 인공지능(AI) 전 계층에 걸친 기술 청사진을 공개하며 업무 자동화를 넘어 AI 기반 기업 운영 방식 전반의 전환을 예고했다. 구글 클라우드는 최근 '구글 클라우드 넥스트 25'를 앞두고 회사의 핵심 AI 기능을 미리 소개하는 기자간담회를 진행했다. 라스베이거스에서 열리는 본 행사에 앞서 글로벌 미디어를 대상으로 열린 간담회는 내부 전략 변화와 제품 로드맵이 집약된 자리로, 행사 본무대 발표에 앞서 방향성을 선제적으로 공유한 성격이 짙다. 9일 업계에 따르면 이번 발표는 단순한 기능 소개를 넘어 구글 클라우드의 AI 전략을 총체적으로 드러낸 이정표로 풀이된다. 발표에는 멀티에이전트 시스템 구축 도구는 물론, '제미나이 2.5' 모델과 7세대 텐서플로우 처리장치(TPU) '아이언우드', 생성형 미디어 기술 등 AI 전 계층을 포괄하는 기술이 포함됐다. "누구나 만드는 AI 동료"…전방위 에이전트 생태계 완성한다 가장 주목되는 것은 '에이전트 개발 키트(ADK)'다. ADK는 단 몇 줄의 코드만으로 고도화된 업무 에이전트를 구축할 수 있는 개발 프레임워크다. 추론 범위나 행동 규칙 등을 세밀하게 조정할 수 있으며 자사 AI 플랫폼인 버텍스 AI와 연동돼 확장성과 보안성까지 확보했다. ADK를 통해 기업은 다양한 사내 시스템이나 서비스형 소프트웨어(SaaS)와 연결되는 복수의 에이전트를 동시에 구성할 수 있다. 보고서 생성, 고객 분석, 문서 처리, 일정 조율 등의 업무를 각각의 에이전트에 맡기고 이들을 연계하는 멀티에이전트 구조도 구현 가능하다. 에이전트 상용화를 위한 '마켓플레이스'도 공개됐다. 이곳에서는 계약서 검토, 리스크 분석, 법률 요약, 고객 상담 등에 특화된 사전 제작 에이전트를 선택해 곧바로 업무에 적용할 수 있다. 업무별로 필요한 기능을 조합하는 모듈형 에이전트 전략이다. 에이전트 간 상호작용도 지원한다. 구글은 '에이전트 간 상호운용(A to A)'을 통해 플랫폼, 개발 프레임워크, 클라우드 환경이 달라도 서로 협력할 수 있도록 했다. 추상화된 요청을 공유하고 상황에 맞는 판단을 수행하는 방식으로, 서비스나 기업 경계를 넘는 에이전트 협업이 가능해졌다. 이미 세일즈포스, SAP, 서비스나우 등 50여 곳의 글로벌 벤더가 'A to A'에 참여 중이다. 비개발자용 실무 에이전트 플랫폼 '에이전트 스페이스(Agent Space)'도 처음 공개됐다. 이 공간에서는 기업의 일반 임직원이 사내 데이터를 기반으로 자연어로 에이전트를 생성하고 실행한다. 생성된 에이전트는 사내 시스템에 연결돼 실시간 보고서 작성, 고객 리스크 예측, 일정 예약 등 복잡한 업무를 수행한다. 이날 구글 관계자는 금융 담당자로서 데모를 시연하면서 자연어로 "내 고객 포트폴리오에서 리스크 신호를 찾아줘"라고 요청했다. 이에 에이전트가 사내 데이터에서 이상 거래를 식별하고 예상 시나리오를 분석한 뒤 자동으로 관련 요약 보고서와 이메일을 작성했다. '에이전트 스페이스'에서는 이러한 작업을 반복 자동화하는 '개인 에이전트'도 생성할 수 있다. 매일 아침 고객 현황을 요약하고 예상 리스크를 음성으로 전달하는 알림 기능도 제공된다. 마이크로소프트 원드라이브, 세일즈포스, 빅쿼리, 구글 드라이브 등 다양한 사내외 시스템과 연동돼 실시간 데이터 기반의 맞춤형 업무 수행이 가능하다. 기존의 구글 '워크스페이스' 전반에도 에이전트 개념이 도입된다. 구글 문서 도구에서는 주장의 논리와 구조를 분석해 개선을 제안하는 '헬프 미 리파인' 기능이 추가됐고 스프레드시트에서는 데이터 인사이트를 자동 추출해주는 분석 기능이 적용됐다. 화상회의 플랫폼 구글 미트에서는 실시간 회의 요약 외에도 회의 중 놓친 내용을 AI가 요약해주는 기능이 곧 적용된다. 버티컬 특화 에이전트는 이미 적용이 시작됐다. 미국의 패스트푸드 업체인 웬디스는 드라이브스루에서 다국어 AI 에이전트를 운영 중이며 메르세데스벤츠는 차량 내 음성 비서로 구글의 오토모티브 에이전트를 통합했다. 홈디포는 DIY 고객에게 24시간 전문가 수준의 상담을 제공하는 AI 에이전트를 활용하고 있다. 케이티 왓슨 구글 클라우드 제품 커뮤니케이션 디렉터는 "지금은 단일 질문에 답하는 AI에서 복잡한 문제를 해결하는 에이전트의 시대로 넘어가는 전환점"이라며 "이 에이전트들이 서로 연결되고 확장될 수 있도록 생태계 전체를 준비하고 있다"고 밝혔다. 추론 성능 중심으로…AI 인프라, TPU로 전면적 재설계 이같이 에이전트가 실질적인 업무 수행까지 가능해진 배경에는 이를 뒷받침하는 AI 인프라와 모델, 플랫폼의 전방위적 진화가 있다. 구글은 AI 에이전트를 단순한 인터페이스 수준에서 끝내지 않고 이를 작동시키는 연산 자원, 데이터 연결성, 모델 성능, 멀티모달 대응력 등 모든 층위를 통합적으로 끌어올리고 있다. 실제로 구글은 초대규모 모델 추론(inference) 성능을 획기적으로 끌어올린 7세대 텐서플로우 처리장치(TPU)인 '아이언우드(Ironwood)'를 이날 처음 공개했다. GPU 기반 아키텍처와의 차별화가 두드러지는 이 칩은 구글 내부 대규모 서비스에서 이미 검증됐으며 본격적인 외부 제공을 예고하고 있는 상황이다. '아이언우드'는 추론에 최적화된 설계로, 기존 6세대 TPU '트릴리움' 대비 전력 효율이 두 배 향상됐다. 총 9천개 칩을 하나의 팟(Pod)으로 묶어 슈퍼컴퓨터처럼 사용할 경우 최대 42.5 엑사플롭스 수준의 연산 성능을 제공한다. 이는 미국 정부가 보유한 세계 최대 슈퍼컴퓨터 보다 24배 이상 높은 수준이다. 초거대 모델 시대에서 추론 성능은 AI의 실전화에 직결되는 요소다. 구글은 이번 발표를 통해 학습보다 '서빙'에 특화된 AI 인프라가 새롭게 부상하고 있음을 강조했다. 네트워크 측면에서도 기존 한계를 넘는 구조가 제시됐다. 구글은 이번에 기업 고객을 위한 사설 글로벌 네트워크 서비스 '클라우드 WAN'을 함께 선보였다. 이는 구글이 전 세계에 구축한 사설 광케이블망(200만 마일 이상)을 외부 고객도 이용할 수 있도록 한 것으로, 네트워크 지연을 최소화하면서도 최대 40% 수준의 비용 절감이 가능하다. 특히 다국적 기업의 멀티리전 운영이나 멀티클라우드 환경에서 강점을 지닌다. AI 시스템을 구성하는 소프트웨어 스택의 효율성도 크게 향상됐다. 특히 쿠버네티스 환경에서는 AI 추론 작업에 특화된 자동 확장인 '스케일링'과 작업 분산 인 '로드밸런싱' 기능이 새로 추가됐다. 사용자가 많아져도 안정적으로 대응할 수 있고 최대 30%의 비용 절감, 60%의 응답 지연 감소 효과를 기대할 수 있게 됐다. AI 모델 런타임 영역에서는 구글 딥마인드가 내부에서 사용하던 머신러닝 런타임 '패스웨이(Pathways)'가 클라우드 고객에게 처음 개방됐다. 이 기능은 수백 개의 TPU를 동시에 연결해 초대형 모델의 안정적인 실시간 서빙을 지원한다. 모델은 고도화, 플랫폼은 통합…AI 실전 투입 위한 전열 정비 구글 클라우드는 이날 자사의 차세대 AI 모델 '제미나이 2.5'의 공식 출시를 발표하며 '프로(Pro)'와 '플래시(Flash)' 두 가지 버전을 공개했다. '프로'는 복잡한 추론과 정밀한 문제 해결에 최적화된 모델이며 '플래시'는 속도와 비용 효율성을 중시한 경량형 모델이다. 특히 '플래시'는 프롬프트의 난이도에 따라 자동으로 추론의 깊이를 조절하고 고객 예산에 맞춰 유연하게 운용 가능하도록 설계됐다. 두 모델 모두 '다층적 사고', '자기 반성적 추론' 등 고차원적 사고 능력을 갖추고 있으며 기존 챗봇을 넘어 복합적인 문제 해결까지 가능하다. 텍스트는 물론 이미지, 음성, 영상, 코드 등 다양한 입력을 통합적으로 이해하고 대응하는 멀티모달 처리 능력도 한층 강화됐다. 특히 초거대 AI 중 가장 긴 '컨텍스트 윈도우'를 갖춰 긴 문서나 복잡한 대화 흐름도 놓치지 않고 처리할 수 있다는 점이 강조됐다. 이날 구글은 '제미나이 2.5'의 기반이 되는 '버텍스 AI' 플랫폼도 대폭 확장했다고 밝혔다. '버텍스 AI'는 다양한 생성형 AI 모델을 선택·조합해 구축, 학습, 배포까지 가능한 통합 플랫폼으로, 현재 200개 이상 대형 모델을 제공한다. 여기에는 미스트랄, 라마 등 오픈모델도 포함되며 향후 허깅페이스와의 협업을 통해 수십만 개 오픈소스 모델을 추가할 계획이다. '버텍스 AI'의 생성형 미디어 기능도 대폭 강화됐다. '이마젠(Imagen)', '오디오(Audio)', '비디오(Video)', '리리아(Lyria)' 등 이미지, 음성, 영상, 음악을 생성하는 모델들이 추가됐고 이들을 통합적으로 활용할 수 있는 '버텍스 AI 미디어 스튜디오'가 공개됐다. 이를 통해 텍스트 한 줄로도 고품질 콘텐츠를 자동 제작할 수 있다. 실제 데모에서는 구글 관계자는 라스베이거스의 정적 이미지를 업로드해 드론샷 스타일의 영상으로 자동 변환하고 자동 생성된 음악을 입힌 뒤 특정 인물만 제거하는 '인페인팅' 기능까지 시연했다. 캐리 타프 구글 클라우드 산업·솔루션 부문 부사장은 "이번 발표는 AI 기술력뿐 아니라 실질적인 비즈니스 임팩트를 중시한 결과"라며 "초대형 모델에서 보안, 개발, 콘텐츠 제작까지 AI가 실무에 작동되는 모든 층위를 정비했다"고 말했다.

2025.04.09 21:01조이환

고동진 의원, 14일 AI 산업 현황 분석 간담회 개최

고동진 국회의원은 14일 오전 9시 국회의원회관 제7간담회실에서 '엔비디아 GPU와 함께 이야기되고 있는 TPU와 NPU 기술 등에 대한 현황분석 간담회'를 개최한다고 13일 밝혔다. '국민의힘 AI 3대 강국 도약 특별위원회' 소속인 고동진 의원의 주재로 열리는 이번 간담회는 김대현 삼성리서치 글로벌 AI센터장을 비롯한 관련 전문가들이 참석해 AI 기술 현황을 점검하고 AI 산업 발전을 위한 방안 등을 논의할 예정이다. 고 의원은 "대한민국 AI 산업의 성공을 위해 관련 전문가들의 의견 수렴은 필수다. AI 산업은 글로벌 경쟁이 치열한 상황이고 기술 발전 속도가 산업의 성패를 결정 짓는다”며 “일회성 간담회가 아닌 정례적인 전문가 간담회를 추진토록해 AI 산업 발전 방안을 마련토록 하겠다”고 밝혔다. 한편 이번 간담회에서 논의된 내용들은 조속히 정리해 'AI 3대 강국 도약 특별위원회'에 소속 의원들과 관련 정부 부처와 공유할 예정이다.

2025.01.13 15:16장경윤

애플, AI 훈련에 엔비디아 GPU 대신 구글 TPU 채택

애플이 구글 클라우드, 인공지능(AI) 제미나이 대한 의존도를 더욱 높이는 분위기다. 이르면 8월 초 iOS 18.1 개발자 베타 테스트에서 공개되는 '애플 인텔리전스'를 위해 엔비디아 대신 구글 텐서 처리 장치(TPU)를 사용하기로 한 것이다. 30일 로이터, CNBC 등 외신에 따르면 애플은 8월 초 출시될 AI 도구 및 기능 제품군을 구동할 새로운 AI 소프트웨어(SW) 기반을 구축하기 위해 구글 인프라를 적극 활용할 계획이다. 애플은 아이폰, 아이패드, 맥북 등에서 작동할 AI 모델을 훈련하기 위해 2천 개가 넘는 TPUv5p 칩을 사용했다. 또 서버 AI 모델을 구축하기 위해 8천192개의 TPUv4 프로세서를 배포했다. 이는 엔비디아가 AI 반도체 시장의 80%를 차지하고 있단 점에서 주목할 만하다. 엔비디아는 주로 그래픽처리장치(GPU)를 이용한 AI칩을 만들고 있다. 하지만 애플은 이를 거부하고 구글 클라우드를 이용한 AI를 만들겠다고 밝혀 주목된다. 외신들은 메타, 아마존 등 다른 빅테크의 엔비디아의 칩 수요가 너무 높아 애플이 원하는 시간에 원하는 양의 칩 조달을 할 수 없다고 판단한 것으로 추정했다. TPU와 GPU의 차이는 작업 능력 및 역할에 있다. TPU는 딥러닝 작업에 특화돼 전력을 효율적으로 사용하고 많은 계산이 필요한 작업을 빠르게 수행한다. 반면 GPU는 다양한 일반적인 컴퓨터 작업 처리를 주로 하며 병렬 처리 능력에 특화돼 TPU보다 높은 계산 능력을 가지고 있지만 대량 연산 처리가 필요할 시 전력 소모가 TPU보다 높다. 칩과 시스템을 독립형 제품으로 판매하는 엔비디아와 달리 구글은 구글 클라우드 플랫폼을 통해 TPU에 대한 액세스를 판매한다. TPU 액세스 권한 구매에 관심 있는 사람은 칩을 사용하려면 구글 클라우드 플랫폼을 통해 SW를 구축해야 한다. 애플은 iOS 18.1부터 탑재되는 애플 인텔리전스를 통해 보다 많은 기능을 선보일 예정이다. 시리의 음성 비서화, 자연어 처리뿐 아니라 이미지 생성, 사용자 정보 활용 앱 내 작업 수행 등이 들어간다. 다만 현재는 애플 개발자들만 쓸 수 있는 iOS 18.1 개발자 베타 버전에서만 쓸 수 있으며 일반 사용자들에게 공개된 iOS 18 베타 버전에는 애플 인텔리전스가 빠져 있다. 당초 애플은 지난 6월 세계개발자회의(WWDC)에서 iOS 18과 애플 인텔리전스를 공개하며 이들을 아이폰 16과 함께 출시한다고 발표했다. 하지만 애플 인텔리전스의 안정성 우려가 나오고 있고 충분한 테스트가 필요하단 지적이 나오면서 공식 출시 시점이 미뤄지는 것으로 보인다. 업계는 애플이 시리 개편 등 정식 버전 출시는 내년 상반기 내 업데이트로 전망하고 있다. 애플 관계자는 보고서에서 "애플 파운데이션 모델(AFM) 서버·AFM 온 디바이스 등 더 큰 모델을 포함해 AFM 모델을 더 효율적이고 많이 훈련할 수 있다"고 밝혔다.

2024.07.30 10:30양정민

구글, 생성형AI 개발 도구 3종 공개...개발 생태계 지원

구글이 생성형 인공지능(AI) 개발을 지원하기 위한 오픈소스 도구 3종을 공개했다. 오픈AI와 달리 자체 AI만으로 경쟁력을 확보하기 어려워지면서 개발자 생태계 지원에 보다 집중하는 모양새다. 9일(현지시간) 인포월드 등 외신에 따르면 구글은 연례 개발자 컨퍼런스인 구글 클라우드 넥스트를 통해 맥스디퓨전, 옵티멈-TPU, 제트스트림을 선보였다. 맥스디퓨전은 이미지와 데이터 생성을 위한 AI도구다. 고성능 수치 컴퓨팅 환경을 염두하고 대규모 기계 학습을 위한 프레임워크인 구글 JAX를 기반으로 개발된 것이 특징이다. 대규모 데이터 셋을 기존보다 빠르게 학습하고 이를 바탕으로 정교한 답변을 제공하거나 복잡하고 큰 이미지를 생성할 수 있도록 지원한다. 옵티멈-TPU는 허깅페이스의 AI모델을 구글의 AI칩인 텐서프로세스유닛(TPU)에서 효과적으로 훈련시키고 실행할 수 있도록 설계된 성능 최적화 패키지다. 오픈소스 기계학습 프레임워크 파이토치의 라이브러리와 도구를 그대로 사용할 수 있어 복잡한 설정이나 최적화 과정 없이 TPU의 능력을 최대한 이용해 빠르게 모델을 훈련시키고 배포할 수 있도록 돕는다. 제트스트림은 TPU와 같은 특정 컴퓨터 장치에서 AI 모델을 더 빠르고 경제적으로 실행할 수 있게 해주는 도구다. 비용을 절약하면서도 많은 양의 데이터를 빠르게 처리할 수 있도록 설계됐다. 구글 JAX나 파이토치, XLA로 훈련된 모델을 모두 지원하며, 라마 2와 젬마 등 오픈 모델에 대한 최적화도 제공한다.

2024.04.10 10:46남혁우

전 구글 개발자, AI 기밀 500건 훔쳐 중국에 넘기다 체포

구글의 전직 소프트웨어 엔지니어가 인공지능(AI) 기업 비밀을 중국 기업에 유출한 혐의로 체포됐다. 최근 더버지 등 외신에 따르면, 연방 대배심은 구글의 전 엔지니어 린웨이 딩을 기업 기밀 유출 혐의로 기소 후 캘리포니아 뉴어크에서 체포했다. 리사 모나코 법무부 차관은 "린웨이 딩은 AI 기술 경쟁에서 우위를 점하려는 중국 기업을 위해 비밀리에 일하며 AI 영업 비밀이 포함된 500개 이상의 기밀 파일을 구글에서 훔쳤다"고 성명을 통해 밝혔다. 현재 그는 영업 비밀 절도 혐의로 4건의 기소를 당했으며 유죄 판결을 받을 경우 각 건당 최대 10년의 징역형과 25만 달러의 벌금형에 처해질 전망이다. 린 웨이딩은 구글에 재직 중이던 2022년 5월부터 2023년 5월 사이에 해당 파일을 개인 클라우드 계정으로 전송한 것으로 나타났다. 데이터 손실 방지 시스템을 피하기 위해 기밀 데이터를 구글에서 지급한 맥북 노트북의 애플 노트에서 PDF로 변환하는 작업을 거친 후 유출한 것으로 확인됐다. 도난당한 데이터는 대부분 구글의 AI전용 프로세서인 텐서처리장치(TPU)와 관련된 것으로 알려졌다. TPU칩은 학습, 미세 조정, 추론 등 다양한 AI 워크로드를 지원하며 엔비디아 GPU와 함께 제미나이와 같은 AI 모델을 훈련하고 실행할 수 있다. 미국 법무부는 그가 파일을 훔치기 시작한 지 한 달도 채 지나지 않은 2022년 6월 중국 베이징에 위치한 AI 스타트업과 만나 최고기술책임자(CTO) 자리를 제안받았다고 밝혔다. 같은 해 10월 중국에 방문해 AI스타트업의 투자자 미팅에 참여해 자신이 해당 기업의 CTO라고 소개한 정황도 확인됐다. 이어서 린웨이 딩은 다음달 대규모 AI학습 가속을 지원하는 AI스타트업을 중국에 설립했다. 해당 기간 그는 아직 구글에 재직 중이었으나 중국 기업과 함께 일한다는 사실을 회사에 알리지 않았으며, 중국에 방문한다는 내용도 알리지 않았다. 린웨이 딩은 중국 기업과 몰래 협업하는 중에도 구글에서 몇 개월간 활동을 이어갔으며, 2023년 12월 퇴사했다. 구글은 린웨이 딩 퇴사 3일 후 다른 직원이 그의 ID 배지를 사용하는 것을 감시 영상을 통해 확인 후 이상함을 느낀 후 조사에 착수했다. 이를 통해 그가 중국 스타트업과 관계가 있다는 것을 파악하고 FBI에 수사를 문의했다. 이에 FBI는 린 웨이딩이 구글 클라우드에 업로드한 500개의 파일을 영장 발부해 그가 살던 캘리포니아주 뉴어크에서 체포했다. 구글의 호세 카스타네다 대변인은 “이 직원이 수많은 문서를 훔친 것을 발견했고, 신속하게 해당 사건을 법 집행 기관에 회부했다”며 “정보를 보호하는 데 도움을 준 FBI에 감사하며 계속해서 긴밀히 협력할 것”이라고 말했다.

2024.03.11 10:51남혁우

Prev 1 Next

ZDNet 검색 페이지

'TPU'통합검색 결과 입니다. (8건)

"AI도 국경 안에서"…구글클라우드, 韓서 추론·데이터 처리 통합 지원

"경쟁사가 파트너로"…오픈AI, 구글 칩으로 챗GPT 돌린다

오픈AI, 구글클라우드에 챗GPT 올린다…MS 의존 탈피 '시동'

"AI, 업무 전반에 녹아든다"…구글, 인프라부터 에이전트까지 '기술 총동원'

고동진 의원, 14일 AI 산업 현황 분석 간담회 개최

애플, AI 훈련에 엔비디아 GPU 대신 구글 TPU 채택

구글, 생성형AI 개발 도구 3종 공개...개발 생태계 지원

전 구글 개발자, AI 기밀 500건 훔쳐 중국에 넘기다 체포

지금 뜨는 기사

이시각 헤드라인

정부, AI 연구에 GPU 1천장 푼다…삼성SDS·KT클라우드·엘리스 선정

스테이블코인 공방…은행 "발행요건 높여야" vs 플랫폼 "개방형 경쟁으로"

SW 수출 '기회의 땅' 베트남…AI·인력·데이터센터 협력 확산

'GPT-5' 황당 답변, 인력 유출 때문?…'위기' 오픈AI, 특단 대책 마련 급급

ZDNet Power Center