• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
CES2026
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'젬마'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"스마트폰 배터리 1%도 안 쓴다"…구글, 초경량 AI '젬마3 270M' 공개

구글이 저전력 환경에서도 작동 가능한 초소형 인공지능(AI) 모델 '젬마3 270M'을 출시했다. 2억7천만 개 파라미터로 구성된 이 모델은 스마트폰, 태블릿, 소형 가전 등에서도 무리 없이 실행 가능하며 각 업무에 따라 빠르고 저렴하게 조정할 수 있는 것이 강점이다. 17일 실리콘앵글 등 외신에 따르면 구글은 젬마3 270M을 AI 오픈소스 플랫폼인 허깅페이스를 통해 공개했다. 젬마3 270M은 작업별 미세 조정을 위해 설계된 경량 AI 모델로 강력한 지침 따르기(instruction following)와 텍스트 구조화 기능을 갖추고 훈련된 것이 특징이다. 총 2억7천만 개의 매개변수 중 약 1억7천만 개는 임베딩 파라미터이며 나머지 1억 개는 트랜스포머 블록으로 구성돼 있다. 이같은 구조는 크기 대비 성능 효율이 뛰어나며 특정 업무 목적에 맞춰 빠르게 훈련할 수 있도록 설계됐다. 이 모델의 가장 큰 장점은 경량성과 에너지 효율성이다. 구글 딥마인드의 엔지니어 오마르 산세비에로는 "이 모델은 토스터에서도 작동할 수 있다"고 X(구 트위터)를 통해 소개했다. 실제로 젬마3 270M은 고성능 GPU나 클라우드 연결이 필요 없는 라즈베리 파이 같은 초소형 컴퓨터나 저사양 임베디드 기기에서도 원활히 작동한다는 것이 구글 측의 설명이다. 성능 면에서도 높은 완성도를 보여줬다. 구글에 따르면 젬마3 270M의 지시 기반 추가 학습(instruction tuning) 버전은 AI 성능 벤치마크인 IFeval에서 51.2%의 정확도를 기록했다. 이는 동급 초경량 모델 중에서도 우수한 수준이며 일부 10억 개 이상의 파라미터를 가진 대형 모델과 비교해도 뒤지지 않는 결과다. 구글은 지시 기반 추가 학습 기반의 AI가 실제 산업 현장에서도 성과를 내고 있다고 설명했다. 대표 사례로 SK텔레콤과 AI 스타트업 어댑티브 ML(Adaptive ML)이 공동 수행한 프로젝트를 들었다. SK텔레콤은 다국어로 구성된 콘텐츠를 정밀하게 관리해야 하는 과제를 안고 있었고 이를 해결하기 위해 대규모 범용 모델이 아닌 구글의 40억 파라미터 모델인 '젬마3 4B'를 특정 업무에 맞춰 미세 조정했다. 그 결과 해당 모델은 SK텔레콤이 기존에 운용하던 더 큰 자체 모델보다 특정 작업에서 더 뛰어난 성능을 보였으며 처리 효율성과 정확도 모두에서 높은 평가를 받았다. 구글은 젬마3 270M을 개발자들이 손쉽게 사용할 수 있도록 다양한 도구와 함께 공개했다. 관련 문서와 파인튜닝 레시피도 함께 제공돼 개발자들은 자신의 환경이나 요구사항에 맞춰 모델을 직접 조정하거나 응용할 수 있다. 전력 소모 측면에서도 실질적인 활용 가능성을 보여줬다. 구글의 내부 테스트 결과에 따르면 INT4 양자화 된 젬마3 270M을 픽셀9 프로 스마트폰에 설치해 25회 이상 대화형 AI를 실행한 결과 배터리 소모는 0.75%에 불과했다. 배터리 수명에 민감한 모바일 환경이나,제한된 전력을 사용하는 사물인터넷(IoT) 기기에서도 효율적으로 구동될 수 있다는 점을 시사한다. 업계에서는 젬마3 270M이 초경량 AI 시장의 전환점을 마련할 수 있을 것으로 보고 있다. 고성능 중심의 대규모 언어 모델(LLM) 흐름에서 벗어나 보다 실용적이고 보편적인 기기에서 AI를 구현할 수 있도록 기반을 제공한다는 점에서 의미가 크다. 특히 네트워크 연결이 어렵거나 데이터 전송 비용이 부담되는 환경에서도 활용 가능성이 높아 개발도상국은 물론 산업 현장, 교육 환경 등 다양한 분야에서 실질적 수요를 충족할 수 있을 것으로 기대된다. 구글은 젬마3 270M을 통해 AI 기술의 접근성을 높이는 동시에 지속가능한 AI 생태계 조성을 위한 기반 기술을 강화하겠다는 계획이다. 구글의 올리비에 라콤브 제품 관리자는 "액자를 거는 데 큰 해머를 쓰지 않듯 엔지니어링에서 성공은 단순한 힘이 아니라 효율성으로 정의되며 이는 AI에도 동일하게 적용된다"고 강조했다. 이어 "젬마3 270M은 그런 철학을 바탕으로 특정 업무에 적합한 실용적인 AI 도구를 구현한 사례"라고 설명했다.

2025.08.17 14:00남혁우

레드햇-구글클라우드, 엔터프라이즈 AI 추론 강화 협력

레드햇이 구글클라우드와 협력을 확대해 인공지능(AI) 추론 성능을 높이고 대규모 배포를 지원하는 환경을 구축한다. 레드햇과 구글클라우드는 레드햇의 오픈소스 기술과 구글클라우드의 맞춤형 인프라 ·구글의 개방형 모델 제품군 '젬마'를 결합해 엔터프라이즈 애플리케이션용 AI를 향상하기 위한 협력을 확대한다고 29일 밝혔다. 레드햇은 구글의 젬마 모델과 가상거대언어모델(vLLM)을 결합해 AI 추론 효율을 높일 방침이다. 대규모언어모델분산(llm-d) 프로젝트 론칭·에이전트투에이전트(A2A) 프로토콜 참여로 에이전틱 AI 확장을 도모할 계획이다. 레드햇은 젬마3 배포판에서 vLLM의 0일차 지원을 제공해 생성형 AI 애플리케이션의 출력 속도를 높인다. vLLM은 오픈소스 추론 서버로 빠르고 비용 효율적인 AI 플랫폼을 제공해 엔터프라이즈 고객의 반응성을 강화한다. 구글클라우드 텐서처리장치(TPU) 및 그래픽처리장치(GPU) 기반 가상머신에서 vLLM 사용이 가능해지면서 개발자는 성능과 효율성을 극대화할 수 있다. 또 레드햇은 llm-d 오픈소스 프로젝트를 통해 이기종 리소스 전반에서 AI 추론의 확장성·비용 최적화·워크로드 효율성을 개선한다. 레드햇 AI 인퍼런스 서버는 구글 클라우드 상에서 최신 커뮤니티 개선 사항을 반영해 기업용 모델 추론 최적화를 지원한다. 이를 통해 기업은 신뢰할 수 있는 인프라에서 대규모 AI 모델을 빠르고 안정적으로 배포할 수 있게 된다. 레드햇 브라이언 스티븐스 AI 부문 수석 부사장 겸 최고기술책임자는 "이번 협력 확대를 통해 획기적 AI 혁신을 주도할 것"이라며 "vLLM과 오픈소스 기술로 개발자는 최적화된 추론 기반의 고성능 AI 솔루션을 구축할 리소스를 확보할 수 있다"고 밝혔다. 구글클라우드 마크 로마이어 AI 및 컴퓨팅 인프라 부문 부사장 겸 총괄은 "이번 협력은 AI 잠재력을 고객에게 제공한다는 양사 비전의 결과"라며 "조직이 AI 추론을 효과적으로 확장하고 고성능 에이전틱 AI를 구현할 길을 열었다"고 말했다.

2025.05.29 14:53김미정

미스트랄AI, 경량 코딩 모델 '데브스트랄' 공개

프랑스의 대표 인공지능(AI) 기업 미스트랄AI가 코딩에 초점을 맞춘 새로운 AI 모델을 공개해 주목받고 있다. 22일 테크크런치 등 외신에 따르면 미스트랄AI는 AI 기업 올 핸즈 AI와 협력해 상업적으로 이용 가능한 코딩 특화 AI인 '데브스트랄(Devstral)'을 개발했다. 데브스트랄은 240억 개의 매개변수를 갖춰 다른 상용 AI 모델 대비 비교적 규모가 작은 편이다. 그럼에도 미스트랄AI는 데브스트랄이 코딩 기술을 측정하는 벤치마크에서 구글의 '젬마3 27B'와 중국 딥시크의 'V3' 등 다른 공개 모델보다 우수한 성능을 보였다고 주장했다. 미스트랄AI는 "데브스트랄은 코드베이스 탐색, 파일 편집, 소프트웨어(SW) 엔지니어링 에이전트 구동을 위한 도구 활용에 우수하다"며 "데브스트랄은 단일 엔비디아 RTX 4090 또는 32GB 램(RAM)이 장착된 맥(Mac)에서도 실행할 수 있을 만큼 가벼워 로컬 배포 및 기기 내 사용에 이상적"이라고 설명했다. 앞서 미스트랄AI는 코드 생성 모델인 '코드스트랄(Codestral)'을 출시하며 보조 프로그래밍 분야에 진출한 바 있다. 다만 코드스트랄은 개발자가 상용 애플리케이션에서 이 모델을 사용할 수 있도록 허용하는 라이선스로 출시되지 않아 사용에 제약이 있었다. 이에 새로운 대중적인 AI 코딩 어시스턴트인 데브스트랄을 출시해 애플리케이션 프로그래밍 작업 최적화를 지원한다는 전략이다. 데브스트랄은 현재 허깅 페이스를 비롯한 AI 개발 플랫폼에서 다운로드할 수 있으며 미스트랄AI의 API를 통해서도 이용할 수 있다. 가격은 입력 토큰 100만 개당 0.1달러, 출력 토큰 100만 개당 0.3달러다. 미스트랄AI는 "향후 몇 주 안에 출시될 더 큰 에이전트 코딩 모델을 구축하는 데 박차를 가하고 있다"고 밝혔다.

2025.05.22 14:03한정호

돌고래 언어도 해독하는 시대…구글, AI 모델 '돌핀젬마' 개발

돌고래의 언어를 해석하고 인간과의 소통을 가능케 하는 인공지능(AI)이 등장해 주목받고 있다. 구글은 15일 기술 블로그를 통해 돌고래의 발성을 해독하는 거대언어모델(LLM)인 '돌핀젬마(DolphinGemma)'를 개발했다고 발표했다. 돌핀젬마는 구글과 조지아 공대 연구진, 야생 돌고래 프로젝트(WDP)의 협력을 통해 개발됐다. 이를 통해 인간과 돌고래 이종 간 소통을 실현해 해양생물학 연구를 진보시킨다는 목표다. 돌핀젬마는 구글의 경량형 오픈소스 AI 모델인 젬마를 기반으로 구축됐다. 4억 개의 매개변수로 구성된 오디오 중심의 AI로, 구글 '픽셀폰'으로 구동할 수 있게 설계됐다. 학습 데이터로는 WDP가 40년간 축적한 대서양 점박이 돌고래 음향 데이터가 활용됐다. 여기에는 돌고래와 해양 포유류의 음성 통신의 음향 신호인 버스트 펄스 소리와 어미 돌고래가 새끼를 부를 때 나오는 휘파람, 먹이를 탐색할 때 활용되는 클릭 버즈 등의 음향 데이터가 담겨있다. 이같은 복잡한 돌고래 음성 구조를 인간이 직접 해석하는 데는 한계가 있었으나, 돌핀젬마는 방대한 데이터 학습을 통해 패턴을 추론할 수 있다. 또 구글이 보유한 사운드스트림 기술을 기반으로 복잡한 고주파 수중음을 효과적으로 표현할 수 있게 구성됐다. 돌핀젬마는 인간 언어 처리와 유사한 방식으로 돌고래 소리를 분석하고 다음에 이어질 소리를 예측하는 시퀀스 기반 학습을 통해 돌고래 발성의 의미 구조를 도출해낸다. 구글 픽셀폰으로 이 기술을 제공해 현장에서 바로 활용할 수 있도록 한 것도 강점이다. 젬마돌핀을 기반으로 구글 픽셀폰에서 작동되는 핵심 시스템은 고래 청각 증강 원격 측정 시스템, 일명 챗(CHAT)이다. 챗은 돌고래의 복잡한 자연어를 직접 해독하는 것이 아니라 인간과 돌고래 사이에서 더 단순하고 공통적인 어휘를 구축하도록 설계된 수중 컴퓨터다. 챗은 분석에 필요한 복잡한 하드웨어 없이 스마트폰과 골전도 헤드폰만으로 실행 가능해 실험 장비 경량화, 유지비 절감, 반응 속도 향상이라는 실용적 측면에서 큰 기대를 받고 있다. WDP 연구진은 돌핀젬마가 돌고래의 자연 발성에서 문법적 패턴과 의미 단위를 더욱 정교하게 추출할 수 있을 것으로 기대하고 있다. 또 인공 휘파람과 실제 행동 간의 연계 실험을 통해 돌고래가 능동적으로 요청·반응·피드백을 반복하는 상호작용 구조를 구축할 방안을 마련 중이다. 연구진은 올여름부터 돌핀젬마와 픽셀폰에 탑재된 챗 시스템을 활용해 돌고래와의 실시간 소통에 착수할 계획이다. 구글은 돌핀젬마를 오픈소스 AI 모델로 공개해 전 세계 연구자들이 다른 고래류 소통 연구에도 활용할 수 있도록 한다는 방침이다. 구글 측은 "WDP는 픽셀 6 스마트폰을 사용해 돌고래 발성 해독과 소통 작업을 수행해 왔다"며 "픽셀 9으로 장비를 업그레이드하면 이 스마트폰 하나로 딥러닝 모델과 음향 패턴 인식 알고리즘을 동시에 실행할 수 있다"고 밝혔다.

2025.04.15 15:56한정호

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

눈앞으로 다가온 '피지컬 AI'…CES 2026이 증명했다

[ZD브리핑] 국가대표 AI 1차 탈락팀 발표 예정...새해 행사·정책 일정 잇따라

[르포] 폭설에 얼어붙는 도시…전기차 보기 힘든 홋카이도 가다

이더리움 창립자 "탈중앙화 스테이블코인, 달러 의존 취약점"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.