• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'강화학습'통합검색 결과 입니다. (5건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[영상] 사람처럼 움직이는 로봇…AI로 배웠다

휴머노이드(인간형) 로봇 '아틀라스'가 인공지능(AI)으로 한층 더 자연스러운 움직임을 구사하고 있다. 보스턴다이내믹스는 로보틱스·AI연구소(RAI)와 지난달 시작한 강화학습 연구 성과를 담은 영상을 20일 공개했다. 영상 속 아틀라스는 팔로 땅을 딛고 일어서거나, 물구나무를 서는 등 사람의 움직임을 빼닮은 모습을 보여준다. 보스턴다이내믹스는 ▲시뮬레이션과 현실 간 간극 해소 ▲운동 중 조작능력 개선 ▲전신 연결을 통한 고성능 운동 탐구 등을 목표로 강화학습 훈련을 수행하고 있다.

2025.03.20 08:28신영빈

[영상] "넘어져도 괜찮아"…끝없이 일어나는 中 휴머노이드 로봇

한번 넘어지면 일어나기 힘들었던 휴머노이드 로봇이 인공지능(AI) 기술로 사람처럼 일어나는 법을 배웠다. 과학전문매체 라이브사이언스는 4일(현지시간) 중국 상하이 자오퉁대학, 홍콩 대학 등 공동 연구진이 휴머노이드 로봇이 위치나 지형에 상관없이 복잡한 환경에서 일어설 수 있도록 해주는 AI 학습 프레임워크를 개발했다고 보도했다. 연구진은 중국 로봇사 유니트리의 G1 휴머노이드 로봇에 해당 프레임워크를 적용했다. 공개된 영상에서 두 발로 걷는 로봇이 바닥에 누워 있다가 벌떡 일어나고 벽이나 의자에 기대어 있다 일어나는 등의 다양한 동작을 취하는 것을 볼 수 있다. 또, 이 로봇은 돌길이나 나무 바닥, 경사면 등에 상관없이 부드럽고 안정적인 자세를 취했다. (▶영상 자세히 보기) 연구진들은 일어나려고 하는 로봇을 밀거나 발로 차는 등의 동작을 취해 일어서지 못하게 하기도 했다. 하지만 로봇은 이런 방해에도 불구하고 가뿐히 일어나는 데 성공했다. 이 로봇이 쓰러졌다가 다시 일어나는 이 놀라운 능력은 'HoST'(Humanoid Standing-up Control)이라는 시스템 덕분이다. 어떤 행동을 취하고 긍정적인 피드백을 받으면 추후 비슷한 상황에 처했을 때 다시 그 행동을 취하는 '강화학습'을 통해 훈련 받았다. 연구진은 더 구체적인 피드백을 주기 위해 4개의 별도 보상 그룹을 사용했고 불규칙하거나 격렬한 움직임을 막기 위해 속도 제한 등 동작 제약을 걸기도 했다. HoST 프레임워크는 엔비디아에서 개발한 물리 시뮬레이션 환경 '아이작 짐'(Isaac Gym) 시뮬레이터를 사용해 훈련됐다. 해당 프레임워크를 시뮬레이션에서 충분히 훈련시킨 후 유니트리 G1 휴머노이드 로봇에 배포시킨 후 테스트를 진행했다. "로봇은 다양한 실제 상황에서 부드럽고 안정적이며 견고한 기립 동작을 보여준다”며, "향후 이 연구는 스탠딩 컨트롤을 기존 휴머노이드 시스템에 통합해 실제 적용 가능성을 확대할 수 있는 길을 열어줄 것"이라고 연구진은 밝혔다. 해당 연구 결과는 지난 달 논문 공개 사이트인 '아카이브'(arxiv)에 공개됐다.

2025.03.05 14:52이정현

공중제비 도는 로봇 '아틀라스', AI로 더 똑똑해진다

뛰어난 운동신경으로 업계를 놀라게 한 휴머노이드 로봇 '아틀라스'가 인공지능(AI)을 품으면서 기능을 한층 강화한다. 현대차그룹 로봇 계열사인 미국 보스턴다이내믹스는 로보틱스·AI연구소(RAI)와 강화 학습을 통해 휴머노이드 로봇을 발전시키기 위한 파트너십을 체결했다고 5일(현지시간) 밝혔다. 이번 협력은 기존 사족보행 로봇 '스팟'을 대상으로 하던 협력을 이족보행 로봇으로 확장한 것이다. 양 기관은 지난해 스팟의 강화학습 연구 키트를 개발해 초속 5.2m 속도로 주행하는 성과를 거둔 바 있다. 아틀라스는 강화학습 훈련으로 새로운 기능을 탑재할 예정이다. 크게 ▲시뮬레이션과 현실 간 간극 해소 ▲운동 중 조작능력 개선 ▲전신 연결을 통한 고성능 운동 탐구 등을 목표로 협력한다. 보스턴다이내믹스는 현대차가 지난 2020년에 인수한 미국 로봇 업체다. 메사추세츠 공과대학(MIT) 교수 출신인 마크 레이버트 박사가 1992년 설립했다. 이족보행 로봇 '아틀라스'와 '펫맨' 등을 만들고 2020년에는 사족보행 로봇 '스팟'을 상품화했다. RAI 연구소는 현대차그룹이 출자해 설립한 AI 연구소다. 보스턴 다이내믹스 창업자이자 전 회장인 마크 레이버트 박사가 연구소장을 맡았다. 연구소는 로보틱스와 자율주행 등 미래 사업 경쟁력 강화를 목표로 연구를 수행해왔다. 로버트 플레이터 보스턴다이내믹스 최고경영자(CEO)는 "휴머노이드가 유용하려면 다양한 종류의 환경에서 작업하고 다양한 애플리케이션에서 작업을 수행할 수 있을 만큼 유연해야 한다"며 "아틀라스와 같은 로봇을 사람들의 삶에 유용한 도구로 만들 수 있도록 필요한 핵심 기능을 가속화할 것"이라고 말했다. 마크 레이버트 RAI 연구소장은 "가장 정교한 휴머노이드 로봇에 대한 강화 학습을 발전시킬 수 있게 됐다"며 "휴머노이드의 기능을 확장할 뿐만 아니라 새로운 기술을 습득하는 과정을 간소화함으로써 휴머노이드의 역량을 발전시키는 데 중요한 역할을 할 것"이라고 밝혔다.

2025.02.06 09:46신영빈

"추론하는 법 배웠다"…오픈AI 'o1' 출시에 국내 업계 반응은?

오픈AI가 데이터 기반으로 답하는 것을 넘어 실제 추론까지 하는 생성형 인공지능(AI) 모델을 공개한 가운데, 생각의 사슬(CoT) 기법을 통한 추론 기술 고도화가 AI 업계에 필수 역량으로 자리할 것이라는 주장이 나왔다. 13일 오픈AI는 AI 추론 능력을 대폭 강화한 새로운 모델 'o1' 프리뷰 버전과 미니 버전을 블로그를 통해 공개했다. o1은 과거 오픈AI 내부에서 '스트로베리'라는 암호명으로 불렸던 모델이기도 하다. 이전 모델보다 더 복잡한 문제를 처리할 수 있으며 수학과 코딩 등 기술적 문제 해결에 강점을 보인다. 국제 수학 올림피아드 예선에서 'GPT-4o'는 13%의 문제를 해결했으나 'o1'은 83%의 문제를 정확히 풀어냈다. 현재 챗GPT 플로스 고객과 챗GPT 팀즈 고객만 o1을 이용할 수 있다. 이 모델은 챗GPT 기업 고객 대상으로는 제공되지 않는다. 질문 가능 횟수는 사용자당 일주일에 30회까지다. "생각의 사슬 필수요소...강화학습 뜬다" 전문가들은 AI 업계가 CoT를 필수 패러다임으로 갖출 것이라고 입을 모았다. 해당 과정에 포함된 강화학습(RL)방법이 재주목받을 것이라는 의견도 나왔다. 업스테이지 박찬준 수석연구원은 "앞으로 CoT를 다양하게 구성하고 이를 학습 과정에 잘 녹여내는 패러다임이 필수일 것"이라며 "이로 인해 강화학습이 다시 떠오를 것"고 강조했다. CoT는 생성형 AI가 복잡한 문제를 세분화해 오류를 수정하고 실수를 인정하며 해답 찾는 과정을 뜻한다. 복잡한 문제를 낱개로 잘라 하나씩 답을 푸는 형태다. 이를 통해 복잡한 문제도 차근차근 해결한다. 이는 마치 사람이 어려운 질문에 답하기 위해 오랫동안 생각하는 것처럼 생각의 꼬리를 무는 형식이다. 챗GPT-4o 등 기존 챗봇보다 답변 시간이 오래 걸리지만 더욱 자세하고 정확한 답변을 얻을 수 있는 이유다. CoT 기법에 RL방법론이 적용된 것으로 알려졌다. AI가 복잡한 문제를 세분화해 하나하나 차근차근 풀면서 최종 정답과 가장 가까운 방향으로 간다는 이유에서다. RL방법은 CoT을 통해 AI에 생산적으로 사고하는 방법을 모델에 가르치는 셈이다. 오픈AI는 RL을 통해 o1 성능이 지속적으로 향상되는 것을 발견했다고 설명했다. 오픈AI 미라 무라티 최고기술책임자(CTO)는 "o1의 추론 과정을 개선하기 위해 RL을 선택했다"며 "모델이 정답을 맞히면 긍정적인 피드백을, 틀릴 경우 부정적인 피드백을 주는 식으로 기능을 개선했다"고 설명했다. 김동환 포티투마루 대표는 "o1이 CoT 기법을 활용한 복합 추론 기술의 고도화를 통해 수학을 비롯한 과학, 생명공학 분야에서의 난제 해결에 기여할 것"이라고 밝혔다. 국내서 LLM을 개발하는 한 업계 관계자도 "생성형 AI가 CoT와 RL로 사람처럼 생각하는 법을 학습했다"며 "기존 데이터 기반으로 답변을 찾아내는 것에서 실제 추론 단계로 넘어갔는지에 대한 평가가 이어질 것"이라고 내다봤다. "B2B·B2C 사업 전략 뚜렷...상용화에 GPU 확보 관건" 업계 관계자들은 기업용 o1 정식 버전 가격이 상당할 것이라고 내다봤다. 이에 오픈AI B2C와 B2B 비즈니스에 대한 경계가 뚜렷해지면서 수익화에 다양성을 줄 것이라고 분석했다. 국내서 LLM 사업하는 한 관계자는 "앞으로 오픈AI 고객은 기존 비용으로 챗GPT-4o까지 사용하는 부류와 높은 비용으로 좋은 결과물을 얻고자 하는 부류로 나뉠 것"이라고 언급했다. 이어 "오픈AI 서비스가 다양화돼서 B2B·B2C 비즈니스 전략에 차별화가 생길 것"이라고 밝혔다. 최근 외신은 오픈AI가 o1 모델을 기업용으로 출시할 경우 가격을 매월 2천 달러(약 266만원)로 책정할 것이란 소식을 내부 관계자 말을 인용해 보도한 바 있다. 오픈AI가 모델 상용화를 위해 중앙처리장치(GPU) 확보에 혈안일 것이라는 분석도 나왔다. 박찬준 수석연구원은 "고도화된 추론으로 GPU 추가 확보가 불가피할 것"이라며 "샘 알트먼 오픈AI 최고경영자(CEO)가 GPU를 더 확보하려는 이유가 o1 상용화에 있을 것으로 본다"고 예측했다.

2024.09.13 14:39김미정

GPT-4, 게임실력은 어떨까...둠 실행시켜보니

사전학습 없이 GPT-4로 1인칭 슈팅 게임인 둠을 플레이하는 연구가 진행됐다. 연구 결과 기존 강화학습에 비해 낮은 성능을 기록했지만 추가 학습 없이도 스스로 게임을 진행하는 등 잠재적인 발전 가능성을 확인했다. 11일(현지시간) 더레지스터 등 외신에 따르면 마이크로소프트의 수석 응용 과학자이자 영국 요크 대학의 연구원인 아드리안 드 윈터는 연구 논문 'GPT-4가 둠을 플레이할 수 있을까(Will GPT-4 Run DOOM?)'를 아카이브를 통해 공개했다. 이번 연구는 GPT-4가 둠을 실행하고 플레이할 수 있는지에 대해 조사한 것이다. 대규모 언어 모델(LLM)이 복잡한 환경과 상호작용하며 계획하고 추론할 수 있는지를 탐구하기 위해 수행됐다. 고전 게임인 둠을 선택한 이유는 소스코드가 공개되어 활용이 쉽고, 다양한 분야에서 테스팅 툴로 사용되는 등 개발분야에서 널리 쓰이기 때문이다. 이에 연구팀은 GPT-4가 둠을 플레이하는 능력을 수치화해 이를 LLM의 추론 및 계획 능력을 측정하는 비공식 벤치마킹 수치로 활용하는 방안도 제시했다. 연구팀은 테스트를 진행하기전 GPT-4에 별도의 학습 등은 진행하지 않았다. 대신 GPT-4가 게임의 시각적 상태를 이해할 수 있도록, 게임의 이미지나 스크린샷을 텍스트 설명으로 변환했다. 텍스트 설명은 게임 내의 객체, 상황, 적의 위치 등 게임 상태에 대한 정보를 제공한다. 또한 GPT-4에서 생성한 텍스트가 게임 내 액션으로 변환할 수 있도록 별도의 툴을 개발해 적용했다. 조사 결과 연구팀은 GPT-4의 추론 및 계획 능력이 둠을 실행하고 몇 가지 기본 지침과 게임 상태에 대한 텍스트 설명만으로 게임을 플레이할 수 있음을 발견했다. GPT-4는 게임을 클리어하진 못했지만 문을 열고, 적과 싸우며, 경로를 따라 목표를 찾아갈 수 있었다. 게임 실행 중 보다 복잡한 목표를 수행할 수 있도록 프롬프트를 입력한 결과 이를 상당 부분 수행할 수 있는 것도 확인했다. 연구팀은 게임에 주로 활용하던 강화 학습에 비해 GPT-4가 더 나은 결과를 기록하진 못했지만 몇 가지 잠재적 이점을 가지고 있다고 밝혔다. 사전 훈련된 지식을 기반으로 행동하는 만큼 새로운 작업이나 도메인에 빠르게 적용할 수 있으며 프롬프트를 이용한 미세조정으로 목표를 조정하거나 성능을 유지할 수 있다는 장점이 있다. 또한 복잡한 문제 상황에서 추론을 수행하고, 여러 단계에 걸쳐 목표를 달성하기 위한 계획을 세울 수 있어 전략적 사고나 장기 계획이 요구되는 분야에 유리할 것으로 연구팀은 분석했다. 아드리안 드 윈터 연구원은 “강화학습에 비해 성능이 다소 낮게 나왔지만 GPT-4가 사전 교육 없이도 자체 추론 및 관찰 능력만으로 둠을 플레이할 수 있다는 점이 놀랍다”며 “이를 활용한다면 강화학습과 LLM의 방식을 보완하거나 향상시킬 수 있을 것으로 기대된다”고 말했다.

2024.03.12 10:16남혁우

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

대기업 유통·이커머스 뒤바뀐 처지..."규제 풀어야 산다"

[르포] 골프 코치에서 피부 상담까지…일상 파고든 AI, AWS서밋에서 만난다

허희수 SPC "韓서 40년된 배스킨라빈스, 아이스크림 그 이상 브랜드로 도약"

"관광이냐, 안보냐"...'지도 반출' 결정 일시 보류

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현