• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
인공지능
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'트랜스포머'통합검색 결과 입니다. (6건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[챗GPT 빅뱅] "세상이 달라졌다"...출시 3년 만에 산업 전반 '지각변동'

챗GPT가 세상에 나온 지 3년이 되었습니다. 짧은 시간 동안 인공지능은 검색과 번역, 코딩과 문서 작성, 고객 상담과 교육 현장까지 우리의 일과 삶 깊숙이 들어왔습니다. 생성형 AI는 더 이상 일부 기술 기업의 실험 도구가 아니라, 산업 구조와 일하는 방식을 바꾸는 플랫폼이 됐습니다.이번 기획에서는 챗GPT가 촉발한 지난 3년의 변화를 산업·노동·교육·미디어 등 전방위에서 짚어보고, 앞으로 인간과 AI가 어떤 방식으로 공존하게 될지 전망합니다. 기술 낙관론과 일자리 불안, 규제와 윤리 논쟁이 교차하는 전환기의 한가운데에서 AI 시대를 바라볼 최소한의 기준점을 함께 고민해보고자 합니다. [편집자 주] 챗GPT가 공개된 지 3년이 지났다. 알파고와 버트(BERT)로 예고됐던 인공지능 혁명이 챗GPT를 기점으로 현실 세계 곳곳에 스며들었고 그 결과 기술의 판도와 산업 경쟁 구도, 일하는 방식이 동시에 뒤집히고 있다. 알파고의 충격, 챗GPT로 일상화된 AI AI가 본격적으로 주목받은 것은 알파고의 등장부터다. 2016년 알파고는 이세돌 9단이 손쉽게 이길 것이라는 대부분의 예상을 뒤엎고 압도적인 승리를 거뒀다. AI가 단순한 연구 성과를 넘어 현실의 특정 영역에서 인간의 능력을 넘어설 수 있다는 사실을 전 세계에 각인시킨 사건이었다. 다만 알파고는 바둑이라는, 규칙과 보상이 명확한 게임판에 종속된다는 한계를 안고 있었다. 이 한계를 넘어선 것이 2017년 구글이 발표한 신경망 아키텍처 트랜스포머(Transformer)다. 구글 연구진은 논문 '어텐션이면 충분하다(Attention Is All You Need)'를 통해 문장 속 단어들의 관계를 한 번에 파악하고, 중요한 맥락에 더 집중하는 자기 어텐션(self-attention) 메커니즘을 제시했다. 이를 통해 기존의 복잡한 순환신경망을 걷어내고, 트랜스포머 구조만으로 언어를 처리하는 방식이 제안됐다. 긴 문장과 대량의 텍스트를 효율적으로 학습할 수 있는 길이 열린 것이다. 이후 등장한 대규모 언어모델 대부분이 이 트랜스포머를 바탕으로 만들어졌다. 대표적인 사례가 트랜스포머를 인코더에만 적용한 버트(BERT)다. 버트는 문맥을 앞뒤 양쪽에서 동시에 고려해 문장을 이해하는 구조 덕분에 질문·답변, 문장 분류, 감성 분석, 검색 등 대부분 자연어 처리 과제에서 기존 모델을 압도했다. 버트가 '읽고 이해하는' 능력을 대표하는 모델로 자리 잡았다면, 이어 등장한 GPT 모델은 이 이해를 바탕으로 자연스럽게 말을 만들어내는 '생성형 AI'의 대표 주자가 됐다. 이해와 생성, 두 축이 합쳐지며 인공지능은 인간 언어를 다루는 새로운 단계에 들어섰다. 챗GPT는 이 기술 계보를 실제 서비스로 완성한 사례다. 오픈AI는 GPT-3.5 기반 모델을 누구나 쓸 수 있는 웹 서비스 형태로 내놓으며, 복잡한 설정이나 프로그래밍 없이도 사람처럼 대화하는 인공지능을 경험하게 했다. 이용자는 검색창이 아닌 대화창에 자연어로 질문을 던지고, 챗GPT는 방대한 텍스트를 바탕으로 논리적인 답변과 요약, 번역, 코드, 글 초안까지 만들어준다. AI가 알고리즘과 논문 속 기술이 아니라, 일상에서 쓰는 도구가 된 순간이었다. 이 과정에서 챗GPT는 '도구를 쓸 줄 아는 AI'라는 새로운 방향을 제시했다. 단순히 텍스트를 내놓는 수준을 넘어, 검색과 코드 실행, 외부 데이터베이스, 각종 소프트웨어와 연결되는 허브로 설계된 것이다. 질문을 받으면 필요한 경우 검색을 호출하고, 계산을 수행하며, 문서와 데이터를 읽고 이해한 뒤 사람의 언어로 결과를 정리한다. 알파고가 특정 게임에서의 초인적인 실력을 보여줬다면, 챗GPT는 현실 업무를 대신 처리하는 범용적인 언어 능력을 보여주며 기술 발전의 무게 중심을 바꿔 놓았다. 챗GPT가 촉발한 글로벌 AI 경쟁, AGI를 향한 레이스 챗GPT 공개 직후 폭발적인 반응이 쏟아지자 글로벌 AI 경쟁이 본격화됐다. 오픈AI에 대한 과감한 투자를 단행한 마이크로소프트는 검색 엔진 빙(Bing)과 오피스 소프트웨어, 클라우드 서비스에 생성형 AI를 발 빠르게 결합하며 시장 선점에 나섰다. 'AI 기술의 종가'를 자처하던 구글도 곧바로 반격에 나섰다. 트랜스포머와 버트 등 원천 기술을 주도했음에도 상용화에서 뒤처졌다는 위기감 속에, 구글은 멀티모달 성능을 극대화한 자체 모델 제미나이(Gemini)를 전격 공개하며 맹추격에 돌입했다. 메타는 판을 흔드는 전략을 택했다. 고성능 모델 라마(Llama)를 오픈소스로 공개해 누구나 가져다 쓸 수 있게 하면서 독자적인 생태계를 구축하고 영향력을 키우는 방식을 선택했다. 여기에 검색 특화 AI 퍼플렉시티(Perplexity), 일론 머스크의 그록(Grok) 등 강력한 경쟁자들이 연달아 참전하며 바야흐로 'AI 전면전'이 펼쳐지고 있다. 이 치열한 경쟁은 전례 없는 속도의 기술 발전으로 이어졌다. 단순히 텍스트로 대화하는 단계를 넘어, 이미지·음성·영상까지 자유자재로 다루는 멀티모달(multimodal) 기능이 수개월 단위로 갱신되며 쏟아져 나오고 있다. 텍스트 기반 챗봇이던 챗GPT는 이제 사진을 보여주며 설명을 요청하거나, 음성으로 대화를 이어가고, 특정 업무를 대신 처리하는 AI 에이전트 기능까지 지원하는 수준으로 확장됐다. 이러한 경쟁의 지향점에는 범용 인공지능(AGI)이 있다. AGI에 대한 명확한 기준과 시점은 여전히 논쟁 중이지만, AI가 스스로 과학적 발견을 주도하고 복잡한 문제를 해결하며 지금과는 또 다른 격차를 만들어낼 수 있다는 전망이 힘을 얻고 있다. 경쟁은 개별 기업을 넘어 국가 단위의 전략 과제로 번진 상태다. 샘 알트먼 오픈AI 최고경영자(CEO)는 최근 블로그 글에서 "우리는 전통적인 의미의 AGI를 어떻게 만드는지에 대해 이제는 확신을 갖게 됐다"고 밝히고, 2025년을 "AI 에이전트가 실제 일터에 합류해 기업의 산출물을 눈에 띄게 바꾸기 시작하는 해"가 될 수 있다고 내다봤다. 구글 딥마인드를 이끄는 데미스 허사비스 CEO 역시 "알파고가 닫힌 세계에서의 승리였다면, 챗GPT는 열린 세계에서 범용적 언어 능력이 가진 힘을 증명한 사례"라며, 향후 수년 안에 인류가 AGI 문턱에 다가설 수 있다는 기대와 함께 안전성과 책임에 대한 사회적 합의가 반드시 동반돼야 한다고 강조해 왔다. 챗봇 넘어 '에이전트'로… 챗GPT가 다시 쓰는 산업 지형도 챗GPT가 바꾼 것은 기술 지표만이 아니다. 실제 산업 현장에서 일하는 방식이 눈에 띄게 달라졌다. 변화는 콜센터와 고객 상담 현장에서 가장 먼저 드러났다. 상담원은 고객 문의 내용을 챗GPT 기반 시스템에 넘기고, 시스템은 관련 매뉴얼과 과거 사례를 바탕으로 최적의 답변 초안을 제시한다. 상담원은 이를 검토해 약간만 수정해 제공한다. 응답 속도는 빨라지고, 숙련도에 따라 들쭉날쭉하던 답변 품질은 일정 수준 이상으로 평준화된다. 단순 문의는 AI 챗봇이 전담하고, 사람은 고난도 상담에 집중하는 구조가 자리잡는 중이다. 마케팅과 홍보, 기획 부서에서는 챗GPT가 일종의 '아이디어 파트너'가 됐다. 신제품 콘셉트 문서, SNS용 짧은 문구, 이메일 캠페인, 보도자료 초안, 내부 공지문, 고객 대상 FAQ까지 텍스트가 필요한 대부분 순간에 초안 작성은 AI 몫이다. 실무자는 그 결과를 검토해 기업 브랜드 톤과 스타일에 맞게 다듬고, 법적·윤리적 문제를 체크하는 쪽으로 역할을 옮기고 있다. 과거에는 '글을 잘 쓰는 사람'이 강점이었다면, 이제는 'AI를 잘 다루며 메시지 전략을 설계하는 사람'이 더 큰 가치를 인정받는 구조로 변하고 있다. 개발 현장에서는 코드 작성과 디버깅 양상이 크게 달라졌다. 함수 목적과 사용 환경을 설명하면 챗GPT가 코드 뼈대를 제안하고, 에러 메시지와 함께 코드를 붙여넣으면 버그 가능성을 추론해 준다. 주니어 개발자는 실시간 튜터를 곁에 둔 것처럼 학습과 실무를 동시에 경험하고, 시니어 개발자는 반복적인 코드 작성 부담을 덜고 설계와 아키텍처, 품질 관리에 더 많은 시간을 쓰게 됐다. 이 과정에서 인력 구조와 교육 방식, 평가 기준까지 재조정이 불가피해지고 있다. 제조·물류·건설 등 전통 산업에서도 변화는 빠르게 번지고 있다. 현장의 작업자는 스마트폰이나 태블릿으로 설비 사진과 경고등 상태를 보여주며 "이런 경우 점검 순서를 알려줘"라고 묻는다. 챗GPT 기반 시스템은 내부 매뉴얼과 정비 이력을 조회해 점검 절차를 단계별로 안내하고, 필요한 부품 목록과 예상 소요 시간까지 정리한다. 여기에 센서 데이터와 예지보전 시스템이 결합하면, 고장 징후를 미리 감지하고 정비 일정을 제안하는 '에이전트 AI 유지보수 관리자'도 가능해진다. 이 과정에서 경쟁의 무게 중심도 바뀌고 있다. 단순히 더 큰 규모의 AI 모델을 내놓는 경쟁에서 벗어나, 얼마나 적은 연산 자원으로 더 나은 성능을 내느냐, 얼마나 안전하고 통제 가능한 형태로 서비스를 설계하느냐가 핵심 과제가 됐다. 같은 모델이라도 클라우드, 온프레미스, 온디바이스 등 어디에 어떻게 배치할지, 어떤 데이터를 학습에 쓸지에 따라 기업의 경쟁력이 갈리는 국면이다. 결국 챗GPT가 촉발한 글로벌 AI 경쟁은 특정 회사 간 점유율 다툼을 넘어, 앞으로의 지식 노동이 어떤 모습이 될지, 사람과 기계가 어디서 역할을 나눌지에 대한 거대한 실험으로 번지고 있다. 누가 가장 강력한 모델을 갖고 있느냐 못지않게 누가 이 기술을 가장 안정적으로 효율적으로 쓰는지에 따라 다음 단계의 승자가 가려질 전망이다. 샘 알트먼 CEO는 최근 한 인터뷰에서 "우리는 이제 전통적인 의미의 AGI를 어떻게 만드는지 자신 있게 말할 수 있게 됐다"며, 2025년을 'AI 에이전트가 실제 일터에 합류해 기업 성과를 눈에 띄게 바꾸기 시작하는 해"라고 평가했다.

2025.11.30 09:51남혁우

[인터뷰] '로봇 페퍼'의 아버지 "현재 AI는 가짜…韓과 손잡고 美·中 넘겠다"

"현재의 인공지능(AI)는 막대한 데이터와 에너지에 의존하는 통계 기계일 뿐 진정한 지능이 아닙니다. 우리는 인간의 뇌처럼 적은 에너지로 스스로 학습하고 '이해'하는 차세대 AI, '오가닉 AI'를 통해 이 한계를 넘어서고자 합니다. 한국과 같은 기술 강국과 손잡고 미국과 중국이 주도하는 현 AI 경쟁의 판도를 바꾸고 싶습니다." 브루노 메조니에 어나더브레인 최고경영자(CEO)는 9일 서울 종로구 락고재에서 열린 '오가닉 AI' 출간 기념 기자간담회에서 이같이 말했다. 그는 이날 인간의 뇌 구조에서 영감을 받은 차세대 AI 모델 '오가닉 AI'를 국내에 처음 소개했다. 메조니에 CEO는 휴머노이드 로봇의 세계적인 선구자로 꼽힌다. 그는 지난 2005년 알데바란 로보틱스를 설립해 세계적으로 유명한 휴머노이드 로봇 '나오'와 '페퍼'를 탄생시켰다. 이후 회사를 일본 소프트뱅크 그룹에 매각하기까지 서비스 로봇 시장을 개척하며 '페퍼의 아버지'라는 별칭을 얻었다. 메조니에 CEO는 현재 주류인 딥러닝과 거대언어모델(LLM)이 막대한 데이터와 전력을 소모하는 통계 모델에 불과하며 진정한 지능이 아니라고 선을 그었다. 그는 과거 자신이 개발한 로봇들이 주변 상황을 이해하지 못했던 한계를 지적하며 기존 AI 기술의 근본적인 문제점을 극복하기 위해 오가닉 AI를 개발했다고 강조했다. "통계뿐인 AI는 가라"…뇌처럼 '생각'하는 오가닉 AI 온다 어나더브레인의 오가닉 AI는 기존 AI가 1960년대 이론에 기반한 '인공신경망'을 모방한 것과 근본부터 다르다. 실제 인간의 뇌가 정보를 처리하는 핵심 영역인 대뇌피질의 에서 영감을 받아 설계됐기 때문이다. 그는 실제 뇌는 뉴런이 스파게티처럼 얽힌 구조가 아니라고 단언했다. 대신 110여 개 뉴런으로 구성된 초소형 정보처리 단위 '마이크로컬럼(Microcolumn)'이 네트워크처럼 연결돼 지능을 발현한다고 설명했다. 이 구조는 1981년 노벨상 수상 연구를 통해 입증된 과학적 사실이다. 이 '마이크로컬럼'은 뇌의 모든 영역에서 동일하게 발견된다. 시각 정보가 입력되면 시각을 처리하고 청각 신호가 들어오면 소리를 인지하는 식이다. 이는 단 하나의 알고리즘이 모든 종류의 정보를 이해하고 처리하는 '스위스 군용 칼(Swiss Army Knife)' 같은 역할을 할 수 있다는 의미다. 메조니에 CEO가 이 같은 확신을 얻게 된 계기는 한국과 인연이 깊다. 그는 과거 한 콘퍼런스에서 만난 김대식 카이스트 교수의 추천으로 세계적인 AI 연구자인 제프 호킨스의 저서 '지능에 대해서(On Intelligence)'를 접한 뒤 인생이 바뀌었다고 회고했다. 이를 통해 인간 뇌 지능의 작동 원리에 대한 깊은 통찰을 얻었다. 이러한 뇌 구조의 장점은 압도적인 효율성이다. 오가닉 AI는 수십억 개 이상의 데이터를 요구하는 기존 AI와 달리 소량의 데이터만으로도 즉각적인 학습이 가능하다고 메조니에 CEO는 설명했다. 그는 "외계인이 등장하는 영화를 처음 볼 땐 놀라지만 두 번째부터는 바로 알아본다"며 "뇌는 그렇게 작동한다"고 말했다. 오가닉 AI가 실현될 경우 AI의 전력 소모량 역시 혁신적으로 절감될 것으로 기대된다. 인간의 뇌가 지능 활동에 단 5와트(W)의 에너지를 사용하는 것처럼 오가닉 AI는 메가와트(MW)가 아닌 밀리와트(mW) 단위의 초저전력으로 구동된다는 설명이다. 어나더브레인은 이 기술을 클라우드 연결 없이 독립적으로 작동하는 반도체 칩 형태로 구현할 계획이다. 이 칩이 상용화되면 인터넷 연결이 없는 환경에서도 기기 스스로 생각하고 판단하는 진정한 '자율 AI' 시대가 열린다는 것이다. 회사는 이론을 현실로 증명하기 위한 데모 개발에 박차를 가하고 있다. 지난 7월 이미 절반을 완성했으며 연말까지 최종 버전을 선보이는 것이 목표다. 향후 스마트 센서를 비롯해 자율주행차, 드론, 위성 등 다양한 산업 분야에 오가닉 AI 칩이 탑재될 것으로 기대된다. 한 번도 겪어보지 못한 돌발 상황에서도 스스로 최적의 결정을 내리는 것이 핵심 경쟁력이라는 설명이다. 어나더브레인은 이를 위해 내년을 중요한 변곡점으로 삼고 있다. 본격적인 투자 유치와 함께 칩 생산 및 센서 분야의 글로벌 대기업과 파트너십을 구축해 시장을 선점하겠다는 것이 회사의 전략이다. 메조니에 CEO "최종 목표는 AGI…결과로 증명할 것" 이어진 기자와의 질의응답에서는 오가닉 AI의 실체와 미래에 대한 질문이 쏟아졌다. 특히 현재까지의 개발 성과를 묻는 말에 메조니에 CEO는 강한 자신감을 내비쳤다. 그는 "현재 결과물에 매우 만족하기에 이 자리에 올 수 있었다"며 "우리 이사회조차 결과에 놀라워했다"고 밝혔다. 메조니에 CEO에 따르면 현재까지 완성된 데모는 두 가지 핵심 성과를 입증했다. 기존 거대언어모델(LLM)이 수많은 데이터를 사전학습해야 하는 것과 달리 ▲실시간 학습이 가능하다는 점과 ▲하나의 시스템으로 시각과 청각 정보를 동시에 처리할 수 있다는 점이다. 그는 "투자자들이 '너무 아름다워서 사실 같지 않다'고 말해 증명이 필요했다"며 "연말까지 선보일 데모의 목표는 명확하다"고 설명했다. 어나더브레인은 올해 하반기에 최종 데모를 통해 단순히 사람을 인식하는 것을 넘어 '두 사람이 발표하고 있다'는 식의 상황의 맥락과 목적까지 이해하는 추상적 사고 능력을 가진 아키텍처를 선보일 예정이다. 시장 선두주자인 엔비디아의 로봇 칩 출시 등 빅테크와의 경쟁 구도에 대한 질문도 나왔다. 이에 메조니에 CEO는 데모가 아직 개발 중이라 상용 계약은 없다고 인정하면서도 오가닉 AI만이 가질 수 있는 경쟁력을 피력했다. 일례로 프랑스 국방부는 현재 어나더브레인의 위성 방어 시스템 기술에 큰 관심을 보이고 있다. 기존에 없던 새로운 방식의 공격에 계속 노출되는 국방 분야에서는 과거 데이터에 의존하는 딥러닝 AI가 명확한 한계를 드러내기 때문이다. 오가닉 AI는 데이터가 거의 없는 미지의 상황에서도 스스로 판단하고 대응할 수 있어 현재 트랜스포머 기술과는 달리 독자적인 시장을 공략할 수 있다는 설명이다. 어나더브레인의 장기적인 목표는 범용인공지능(AGI)이다. 메조니에 CEO는 "작은 칩은 진공청소기에, 크고 밀도 높은 칩은 자율주행차에 탑재하는 등 확장 가능한 형태가 될 것"이라고 강조했다. 미래 로봇의 기능에 대해서는 '유추 기반 의사결정'이 핵심이 될 것이라고 내다봤다. 인간의 뇌는 항상 다음에 일어날 일을 예측하고 예측이 빗나갈 때 주의를 기울이는데 오가닉 AI가 과거 경험과 유사성을 바탕으로 미래를 예측하고 스스로 행동하는 것이 가능해질 것이라는 설명이다. 메조니에 CEO는 마지막으로 한국 시장의 중요성을 거듭 강조했다. 그는 "한국과 프랑스는 미국과 중국에 뒤처진 AI 경쟁에서 같은 상황에 놓여있다"며 "이 레이스에서 다시 승리하려면 차세대 기술로 바로 점프해야만 한다"고 말했다.

2025.09.09 14:49조이환

'비행기↔자동차' 자유자재 변신…'트랜스포머 로봇' 화제

하늘을 날다가 모양을 바꿔 바퀴 달린 로봇으로 변신하는 신개념 로봇이 개발됐다고 과학전문매체 뉴아틀라스가 최근 보도했다. 보도에 따르면, 미국 캘리포니아공과대학(이하 칼텍) 연구진은 공중에서 모양을 바꾸는 로봇 '애트모(ATMO·Aerially Transforming Morphobot)'를 개발했다. 이번 연구 결과는 최근 국제 학술지 '커뮤니케이션스 엔지니어링(Communications Engineering)'에 실렸다. 애트모 로봇은 공중에 떠 있을 때는 쿼드콥터 드론처럼 덮개형 프로펠러 4개를 수평으로 펼쳐 하늘을 날다가 착륙할 때는 프로펠러를 안쪽으로 접어 바퀴 달린 로봇으로 변신해 지면을 달린다. 무게는 약 5.5kg, 높이 16cm 너비는 65cm다. 애트모는 이전 칼텍이 개발했던 M4 로봇에 탑재된 기술을 기반으로 개발됐다. 기존 M4 로봇은 영리한 디자인을 갖췄으나 착륙 후에야 주행 모드로 변환할 수 있었다. 때문에 착륙 지점에 돌 등의 장애물이 있으면 프로펠러가 완전히 접히지 않는 문제가 있었다. 이번에 나온 애트모 로봇은 이런 단점을 보완해 공중에서 형태를 전환할 수 있는 기술을 적용했다. 또, 연구진은 로봇의 각 프로펠러가 전달하는 추력을 지속적으로 조정해 안정적으로 날 수 있고 지면 가까이서 날 때 공기 흐름이 바뀌는 '지면 효과'를 활용해 안정적인 착륙이 가능한 특수 알고리즘을 개발했다. 연구진은 애트모의 향상된 기동성과 내구성 덕분에 향후 물류 배송이나 재난 구조, 탐사 등 다양한 분야에서 활용될 수 있을 것으로 기대했다.

2025.05.30 14:33이정현

"'카스2' 최적화 시켜줄 수 있어?"...엔비디아 AI 게이밍 시연해보니

[타이베이(대만)=권봉석 기자] 22일 오후(이하 현지시간) 타이베이 그랜드 하이라이 호텔 12층의 한 방. 일반 소비자를 위한 엔비디아 그래픽·AI 기술 시연을 보기 위해 아시아권 기자 여덞 명이 한 방에 모였다. 이들이 모니터에 비친 디지털 휴먼 '아키'를 바라보는 가운데 엔비디아 관계자가 마이크에 "AI 관련 재미있는 영어 슬로건을 만들고 한국어로 번역해서 말해줘"라고 영어로 말했다. 잠시 후 '아키'는 자연스런 억양으로 "미래를 만드는 AI"라고 말했다. 방 안의 유일한 한국어 화자인 기자는 왼손을 들어 다른 나라 기자들에게 '정확하다'는 의미로 OK 신호를 보냈다. 프로젝트 R2X, 코딩 없이 다양한 기능 추가 가능 시연을 진행한 엔비디아 관계자는 "이것은 다음 달 정식 공개될 디지털 휴먼 인터페이스 '프로젝트 R2X'다. 오픈AI 모델과 음성인식, 오디오 투 페이스 모델을 이용해 작동하며 PC에서 에이전틱 AI의 구현 사례를 보여준 것"이라고 설명했다. 프로젝트 R2X는 지난 1월 'CES 2025' 당시 엔비디아가 지포스 RTX 50 시리즈와 함께 공개한 디지털 AI 휴먼 비서다. 음성 인식과 번역은 오픈AI 모델을 활용했고 음성에 맞게 입모양을 맞추는 '오디오 투 페이스' 모델은 엔비디아 GPU로 실행된다. 그는 "이용자가 코딩 없이 다양한 서비스 항목을 드래그 앤 드롭으로 간편히 연결하고 기능을 확장할 수 있다. 현재는 외형을 바꿀 수 없지만 다음 달 정식 공개 이후 취향에 맞게 맞춤형 설정이 가능할 것"이라고 덧붙였다. 게임 실행부터 최적화까지 음성으로 처리하는 'G어시스트' 프로젝트 'G어시스트'(G-Assist)는 지난 해 컴퓨텍스에서 처음 공개된 AI 기반 게임 보조 기술이다. 40억 개 매개변수(패러미터)를 지닌 소형언어모델(SLM)을 엔비디아 그래픽카드에 올려 구동되며 지난 3월 정식 출시됐다. G어시스트가 구동 중인 PC에서 엔비디아 관계자가 "카운터 스트라이크 2를 최적화해줄 수 있어?"라고 말하자, AI가 즉시 게임 설정을 분석하고 최적화를 시작했다. 이어서 "그 게임을 해보자"라고 말하니, AI가 자동으로 게임을 실행했다. "초당 프레임 수를 띄워줘"라고 말하자 AI가 관련 수치를 자동으로 띄웠다. "지난 60초간 CPU와 GPU 사용률을 보여줘"라고 말하니, 실시간 그래프까지 생성해 보여줬다. 엔비디아 관계자는 "G어시스트 구동에 필요한 SLM 용량은 약 3GB이며 그래픽 메모리에 큰 부담을 주지 않는다. 12GB 메모리를 탑재한 지포스 RTX 4070 이상 GPU에서 구동하는 것을 권장한다"고 설명했다. "챗GPT로 플러그인 만들어 G어시스트 기능 확장 가능" G어시스트는 파이썬을 이용해 구동되는 플러그인을 이용해 여러가지 기능을 확장할 수 있다. 시연에 이용된 PC에는 디스코드 플러그인, 자동화 프로그램인 IFTTT 플러그인, 구글 제미나이 플러그인이 연결돼 있다. "디스코드에 5분 후 온라인 상태가 될 거라고 전해줘"라고 말하자 자동으로 메시지가 전송됐다. 구글 제미나이와 연결해 "다음 카운터 스트라이크 2 대회 일정이 언제야?"라고 묻자 최신 정보를 가져와 보여줬다. 엔비디아 관계자는 "파이썬 코딩 방법을 몰라도 챗GPT를 이용하면 G어시스트용 플러그인을 손쉽게 만들 수 있다. AI가 AI를 위한 도구를 만드는 셈"이라고 설명했다.

2025.05.23 08:54권봉석

"챗GPT 만든 논문, 21세기 최다 인용"…AI는 어떻게 과학계 지배했나

글로벌 테크 기업이 발표한 인공지능(AI) 관련 논문이 21세기 과학계를 사실상 점령한 것으로 나타났다. AI 기술의 구조 활용법을 설명한 논문들이 생명과학, 물리학 등 전통 강세 분야를 누르고 피인용 상위권을 싹쓸이한 가운데 업계에서는 도구 중심 연구가 과학 혁신을 실질적으로 이끈 결과라는 분석이 나온다. 17일 네이처에 따르면 지난 20년간 가장 많이 인용된 논문 대부분이 인공지능(AI) 분야에 집중됐다. 대표적 학술 데이터베이스 다섯 곳을 종합 분석해 선정된 인용 상위 25편 가운데 1위를 차지한 논문은 마이크로소프트(MS)가 지난 2016년 발표한 '딥 레지듀얼 러닝(ResNet)' 관련 연구였다. MS의 논문은 구글 학술 기준으로 약 25만회, 웹오브사이언스 기준 약 10만회 인용되며 '21세기 최다 피인용 논문' 타이틀을 차지했다. 피인용 횟수는 후속 논문에서 얼마나 자주 참조됐는지를 의미하며 논문의 영향력을 가늠하는 핵심 지표로 평가된다. AI 분야의 상위권 독주는 여기서 그치지 않는다. 지난 2012년 제프리 힌튼 토론토대 교수가 발표한 이미지 인식 딥러닝 구조 '알렉스넷' 논문은 8위에 올랐고 지난 2017년 구글이 발표한 자연어처리 기반 구조 '트랜스포머'를 설명한 논문 '어텐션 이즈 올 유 니드'는 7위를 기록했다. 이 논문들은 각각 이미지 분석과 언어 생성 기술의 뿌리를 형성한 연구다. 힌튼 교수의 논문은 이미지넷 대회에서 압도적인 성능을 입증하면서 큰 관심을 끌었다. 이 논문은 힌튼 교수가 구글에 입사하고 AI 개발을 주도하는 발판이 됐다. 트랜스포머 구조는 '챗GPT'를 비롯한 거대언어모델(LLM)의 핵심 구조로 문장 간 관계를 스스로 학습하는 '셀프 어텐션' 메커니즘이 중심이다. 네이처는 AI 논문의 피인용 증가 요인으로 다학제 활용성과 오픈소스 문화를 꼽았다. AI 알고리즘 대부분이 무료로 공개돼 의료, 번역, 로봇 등 다양한 분야에 쉽게 적용됐기 때문이다. 또 사전 공개된 프리프린트 형태 논문이 많아 실질적 인용은 공식 수치보다 더 많을 가능성도 제기된다. AI 외에도 분석 소프트웨어와 실험 도구를 다룬 논문들이 순위에 다수 포함됐다. 2위 논문은 유전자 활성 변화를 정량화하는 공식을 설명한 연구다. 5위에는 X선 산란 패턴을 분석하는 구조화 프로그램 '셸렉스(SHELX)'를 소개한 논문이 이름을 올렸다. 네이처 분석에 참여한 미샤 테플리츠키 미시간대 교수는 "과학자들은 혁신이나 이론을 중요하게 생각한다고 말하지만 실제로는 연구에 직접적인 도움을 주는 도구 논문을 더 자주 인용한다"며 "도구 중심의 연구가 과학 발전을 실질적으로 견인하고 있다는 방증"이라고 말했다.

2025.04.17 11:39조이환

스테이블디퓨전3 미리보기 공개

텍스트-이미지 모델 '스테이블 디퓨전'의 세번째 버전이 초기 미리보기로 공개됐다. 품질 및 철자 기능 향상, 다중 주제 프롬프트 등이 특징이다. 22일(현지시간) 스태빌리티AI는 차세대 텍스트-이미지 모델 '스테이블디퓨전 3' 초기 미리보기를 발표했다. 사용을 원하는 경우 미리보기 대기자명단에 등록해 이용할 수 있다. 접근권한을 얻게 되면 디스코드 서버 초대 메일을 받게 된다. 스테이블디퓨전은 2022년 2.0 버전 공개로 이미지 생성 AI 모델의 획기적 진보를 보여줬다. 세번째 버전은 기존 아키텍처와 달리 디퓨전 트랜스포머 아키텍처와 플로우 매칭을 결합했다. 디퓨전 트랜스포머 아키텍처는 일반적으로 사용되는 U-Net 백본을 트랜스포머로 대체해 이미지 디퓨전 모델을 훈련한다. 이 방식은 효율적으로 확장하고 더 높은 품질의 이미지를 생성할 수 있다. 플로우 매칭은 랜덤 노이즈에서 구조화된 이미지로 원환하게 전환하는 방법을 학습해 이미지를 생성하는 AI 모델을 만드는 기술이다. 스테이블디퓨전3는 이전 모델보다 더 나은 성능과 품질로 이미지를 만들어낸다. 한 프롬프트에 여러 주제를 넣을 수 있다. 철자 생성의 정확도도 더 높아졌다. 스테이블디퓨전3의 크기는 다양하다. 8억에서 80억개의 매개변수를 제공한다. 스테이블디퓨전은 기본적으로 오픈소스 라이선스를 따른다. 모델의 소스코드에 접근할 수 있고 미세조정이 가능하다. 현재 스테이블디퓨전3의 소스코드와 기술문서는 공개돼 있지 않다. 회사측은 미리보기 단계에서 성능과 안정성을 개선할 것이라고 밝혔다.

2024.02.23 10:43김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

LPDDR 공급난…삼성·SK, 中업체 '장기계약' 요청받아

이마트24, 점포 줄고 적자 커져 이중고...'반전 카드' 통할까

"딸기 폭탄 맞아?"…파리바게뜨 ‘베리밤’ 케이크 논란 왜

비트코인 4년 주기론 깨졌나...가상자산업계 '갑론을박'

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.