• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'트랜스포머'통합검색 결과 입니다. (4건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

'비행기↔자동차' 자유자재 변신…'트랜스포머 로봇' 화제

하늘을 날다가 모양을 바꿔 바퀴 달린 로봇으로 변신하는 신개념 로봇이 개발됐다고 과학전문매체 뉴아틀라스가 최근 보도했다. 보도에 따르면, 미국 캘리포니아공과대학(이하 칼텍) 연구진은 공중에서 모양을 바꾸는 로봇 '애트모(ATMO·Aerially Transforming Morphobot)'를 개발했다. 이번 연구 결과는 최근 국제 학술지 '커뮤니케이션스 엔지니어링(Communications Engineering)'에 실렸다. 애트모 로봇은 공중에 떠 있을 때는 쿼드콥터 드론처럼 덮개형 프로펠러 4개를 수평으로 펼쳐 하늘을 날다가 착륙할 때는 프로펠러를 안쪽으로 접어 바퀴 달린 로봇으로 변신해 지면을 달린다. 무게는 약 5.5kg, 높이 16cm 너비는 65cm다. 애트모는 이전 칼텍이 개발했던 M4 로봇에 탑재된 기술을 기반으로 개발됐다. 기존 M4 로봇은 영리한 디자인을 갖췄으나 착륙 후에야 주행 모드로 변환할 수 있었다. 때문에 착륙 지점에 돌 등의 장애물이 있으면 프로펠러가 완전히 접히지 않는 문제가 있었다. 이번에 나온 애트모 로봇은 이런 단점을 보완해 공중에서 형태를 전환할 수 있는 기술을 적용했다. 또, 연구진은 로봇의 각 프로펠러가 전달하는 추력을 지속적으로 조정해 안정적으로 날 수 있고 지면 가까이서 날 때 공기 흐름이 바뀌는 '지면 효과'를 활용해 안정적인 착륙이 가능한 특수 알고리즘을 개발했다. 연구진은 애트모의 향상된 기동성과 내구성 덕분에 향후 물류 배송이나 재난 구조, 탐사 등 다양한 분야에서 활용될 수 있을 것으로 기대했다.

2025.05.30 14:33이정현

"'카스2' 최적화 시켜줄 수 있어?"...엔비디아 AI 게이밍 시연해보니

[타이베이(대만)=권봉석 기자] 22일 오후(이하 현지시간) 타이베이 그랜드 하이라이 호텔 12층의 한 방. 일반 소비자를 위한 엔비디아 그래픽·AI 기술 시연을 보기 위해 아시아권 기자 여덞 명이 한 방에 모였다. 이들이 모니터에 비친 디지털 휴먼 '아키'를 바라보는 가운데 엔비디아 관계자가 마이크에 "AI 관련 재미있는 영어 슬로건을 만들고 한국어로 번역해서 말해줘"라고 영어로 말했다. 잠시 후 '아키'는 자연스런 억양으로 "미래를 만드는 AI"라고 말했다. 방 안의 유일한 한국어 화자인 기자는 왼손을 들어 다른 나라 기자들에게 '정확하다'는 의미로 OK 신호를 보냈다. 프로젝트 R2X, 코딩 없이 다양한 기능 추가 가능 시연을 진행한 엔비디아 관계자는 "이것은 다음 달 정식 공개될 디지털 휴먼 인터페이스 '프로젝트 R2X'다. 오픈AI 모델과 음성인식, 오디오 투 페이스 모델을 이용해 작동하며 PC에서 에이전틱 AI의 구현 사례를 보여준 것"이라고 설명했다. 프로젝트 R2X는 지난 1월 'CES 2025' 당시 엔비디아가 지포스 RTX 50 시리즈와 함께 공개한 디지털 AI 휴먼 비서다. 음성 인식과 번역은 오픈AI 모델을 활용했고 음성에 맞게 입모양을 맞추는 '오디오 투 페이스' 모델은 엔비디아 GPU로 실행된다. 그는 "이용자가 코딩 없이 다양한 서비스 항목을 드래그 앤 드롭으로 간편히 연결하고 기능을 확장할 수 있다. 현재는 외형을 바꿀 수 없지만 다음 달 정식 공개 이후 취향에 맞게 맞춤형 설정이 가능할 것"이라고 덧붙였다. 게임 실행부터 최적화까지 음성으로 처리하는 'G어시스트' 프로젝트 'G어시스트'(G-Assist)는 지난 해 컴퓨텍스에서 처음 공개된 AI 기반 게임 보조 기술이다. 40억 개 매개변수(패러미터)를 지닌 소형언어모델(SLM)을 엔비디아 그래픽카드에 올려 구동되며 지난 3월 정식 출시됐다. G어시스트가 구동 중인 PC에서 엔비디아 관계자가 "카운터 스트라이크 2를 최적화해줄 수 있어?"라고 말하자, AI가 즉시 게임 설정을 분석하고 최적화를 시작했다. 이어서 "그 게임을 해보자"라고 말하니, AI가 자동으로 게임을 실행했다. "초당 프레임 수를 띄워줘"라고 말하자 AI가 관련 수치를 자동으로 띄웠다. "지난 60초간 CPU와 GPU 사용률을 보여줘"라고 말하니, 실시간 그래프까지 생성해 보여줬다. 엔비디아 관계자는 "G어시스트 구동에 필요한 SLM 용량은 약 3GB이며 그래픽 메모리에 큰 부담을 주지 않는다. 12GB 메모리를 탑재한 지포스 RTX 4070 이상 GPU에서 구동하는 것을 권장한다"고 설명했다. "챗GPT로 플러그인 만들어 G어시스트 기능 확장 가능" G어시스트는 파이썬을 이용해 구동되는 플러그인을 이용해 여러가지 기능을 확장할 수 있다. 시연에 이용된 PC에는 디스코드 플러그인, 자동화 프로그램인 IFTTT 플러그인, 구글 제미나이 플러그인이 연결돼 있다. "디스코드에 5분 후 온라인 상태가 될 거라고 전해줘"라고 말하자 자동으로 메시지가 전송됐다. 구글 제미나이와 연결해 "다음 카운터 스트라이크 2 대회 일정이 언제야?"라고 묻자 최신 정보를 가져와 보여줬다. 엔비디아 관계자는 "파이썬 코딩 방법을 몰라도 챗GPT를 이용하면 G어시스트용 플러그인을 손쉽게 만들 수 있다. AI가 AI를 위한 도구를 만드는 셈"이라고 설명했다.

2025.05.23 08:54권봉석

"챗GPT 만든 논문, 21세기 최다 인용"…AI는 어떻게 과학계 지배했나

글로벌 테크 기업이 발표한 인공지능(AI) 관련 논문이 21세기 과학계를 사실상 점령한 것으로 나타났다. AI 기술의 구조 활용법을 설명한 논문들이 생명과학, 물리학 등 전통 강세 분야를 누르고 피인용 상위권을 싹쓸이한 가운데 업계에서는 도구 중심 연구가 과학 혁신을 실질적으로 이끈 결과라는 분석이 나온다. 17일 네이처에 따르면 지난 20년간 가장 많이 인용된 논문 대부분이 인공지능(AI) 분야에 집중됐다. 대표적 학술 데이터베이스 다섯 곳을 종합 분석해 선정된 인용 상위 25편 가운데 1위를 차지한 논문은 마이크로소프트(MS)가 지난 2016년 발표한 '딥 레지듀얼 러닝(ResNet)' 관련 연구였다. MS의 논문은 구글 학술 기준으로 약 25만회, 웹오브사이언스 기준 약 10만회 인용되며 '21세기 최다 피인용 논문' 타이틀을 차지했다. 피인용 횟수는 후속 논문에서 얼마나 자주 참조됐는지를 의미하며 논문의 영향력을 가늠하는 핵심 지표로 평가된다. AI 분야의 상위권 독주는 여기서 그치지 않는다. 지난 2012년 제프리 힌튼 토론토대 교수가 발표한 이미지 인식 딥러닝 구조 '알렉스넷' 논문은 8위에 올랐고 지난 2017년 구글이 발표한 자연어처리 기반 구조 '트랜스포머'를 설명한 논문 '어텐션 이즈 올 유 니드'는 7위를 기록했다. 이 논문들은 각각 이미지 분석과 언어 생성 기술의 뿌리를 형성한 연구다. 힌튼 교수의 논문은 이미지넷 대회에서 압도적인 성능을 입증하면서 큰 관심을 끌었다. 이 논문은 힌튼 교수가 구글에 입사하고 AI 개발을 주도하는 발판이 됐다. 트랜스포머 구조는 '챗GPT'를 비롯한 거대언어모델(LLM)의 핵심 구조로 문장 간 관계를 스스로 학습하는 '셀프 어텐션' 메커니즘이 중심이다. 네이처는 AI 논문의 피인용 증가 요인으로 다학제 활용성과 오픈소스 문화를 꼽았다. AI 알고리즘 대부분이 무료로 공개돼 의료, 번역, 로봇 등 다양한 분야에 쉽게 적용됐기 때문이다. 또 사전 공개된 프리프린트 형태 논문이 많아 실질적 인용은 공식 수치보다 더 많을 가능성도 제기된다. AI 외에도 분석 소프트웨어와 실험 도구를 다룬 논문들이 순위에 다수 포함됐다. 2위 논문은 유전자 활성 변화를 정량화하는 공식을 설명한 연구다. 5위에는 X선 산란 패턴을 분석하는 구조화 프로그램 '셸렉스(SHELX)'를 소개한 논문이 이름을 올렸다. 네이처 분석에 참여한 미샤 테플리츠키 미시간대 교수는 "과학자들은 혁신이나 이론을 중요하게 생각한다고 말하지만 실제로는 연구에 직접적인 도움을 주는 도구 논문을 더 자주 인용한다"며 "도구 중심의 연구가 과학 발전을 실질적으로 견인하고 있다는 방증"이라고 말했다.

2025.04.17 11:39조이환

스테이블디퓨전3 미리보기 공개

텍스트-이미지 모델 '스테이블 디퓨전'의 세번째 버전이 초기 미리보기로 공개됐다. 품질 및 철자 기능 향상, 다중 주제 프롬프트 등이 특징이다. 22일(현지시간) 스태빌리티AI는 차세대 텍스트-이미지 모델 '스테이블디퓨전 3' 초기 미리보기를 발표했다. 사용을 원하는 경우 미리보기 대기자명단에 등록해 이용할 수 있다. 접근권한을 얻게 되면 디스코드 서버 초대 메일을 받게 된다. 스테이블디퓨전은 2022년 2.0 버전 공개로 이미지 생성 AI 모델의 획기적 진보를 보여줬다. 세번째 버전은 기존 아키텍처와 달리 디퓨전 트랜스포머 아키텍처와 플로우 매칭을 결합했다. 디퓨전 트랜스포머 아키텍처는 일반적으로 사용되는 U-Net 백본을 트랜스포머로 대체해 이미지 디퓨전 모델을 훈련한다. 이 방식은 효율적으로 확장하고 더 높은 품질의 이미지를 생성할 수 있다. 플로우 매칭은 랜덤 노이즈에서 구조화된 이미지로 원환하게 전환하는 방법을 학습해 이미지를 생성하는 AI 모델을 만드는 기술이다. 스테이블디퓨전3는 이전 모델보다 더 나은 성능과 품질로 이미지를 만들어낸다. 한 프롬프트에 여러 주제를 넣을 수 있다. 철자 생성의 정확도도 더 높아졌다. 스테이블디퓨전3의 크기는 다양하다. 8억에서 80억개의 매개변수를 제공한다. 스테이블디퓨전은 기본적으로 오픈소스 라이선스를 따른다. 모델의 소스코드에 접근할 수 있고 미세조정이 가능하다. 현재 스테이블디퓨전3의 소스코드와 기술문서는 공개돼 있지 않다. 회사측은 미리보기 단계에서 성능과 안정성을 개선할 것이라고 밝혔다.

2024.02.23 10:43김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

삼성전자, HBM3E 12단 라인 가동률 축소…엔비디아 공급 논의 길어지나

티메프 사태로 달라진 여행업 생태계...'부익부 빈익빈'

"강남역 사수하라"...350평 올리브영 등장에 시코르 ‘긴장’

KT, 한국적AI '믿음2.0' 오픈소스 공개...국내 AI 대중화

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.