• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'표현'통합검색 결과 입니다. (3건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

ETRI, 절차 생성 AI 벤치마크 기술 첫 개발

대형언어모델(LLM)을 기반으로 만들어진 절차 성능을 자동 평가하는 기술이 세계 처음 개발했다. 한국전자통신연구원(ETRI)은 사람이 말로 작업을 명령하면 스스로 작업 절차를 이해하고 계획을 수립해 수행하는 절차 생성 인공지능(AI)의 성능을 자동 평가할 수 있는 로타벤치마크(LoTa-Bench) 기술을 개발했다고 7일 밝혔다. 기존에는 절차 이해 성능 평가를 자동으로 할 수 있는 벤치마크 기술이 없어서 사람이 직접 평가함으로써 손이 많이 갈 수밖에 없었다. 구글 세이캔(SayCan)을 비롯한 기존 연구에서는 여러 사람이 직접 작업 수행 결과를 관찰하고 성공 실패 여부를 투표하는 방법을 채택했다. 이는 성능 평가에 매우 긴 시간과 노력이 들어 번거로울 뿐 아니라 평가 결과에 주관적 판단이 개입하는 문제가 있다. 반면 ETRI가 개발한 로타벤치마크 기술은 사용자의 명령에 따라 대형언어모델이 생성한 작업 절차를 실행하고, 결과가 지시한 목표와 같은지 자동으로 비교해 성공 여부를 판단한다. 평가 시간과 비용을 최소화할 수 있고, 결과가 객관적인 이유다. 연구진은 알프레드(ALFRED) 기반 벤치마크 결과, 오픈AI(OpenAI)의 GPT-3는 21.36%, GPT-4는 40.38%, 메타(Meta)의 라마2(LLaMA 2)-70B 모델은 18.27%, 모자이크엠엘(MosaicML)의 MPT-30B 모델은 18.75% 성공률을 보였다고 밝혔다. 규모가 클수록 절차 생성 능력도 우수했다. 성공률이 20%면 100개의 절차 중 20개를 성공한 셈이다. 성능 평가는 로봇과 체화 에이전트 지능의 연구개발 목적으로 개발된 미국 알렌인공지능연구소(AI2-THOR)와 미국 MIT(버츄얼홈, VirtualHome) 가상 시뮬레이션 환경에서 이뤄졌다. “전자레인지에 차갑게 식힌 사과를 넣어라.”라는 일상적인 가사 작업 지시 명령을 내리고 각 작업 절차를 포함하는 데이터셋으로 평가했다. 또한, 연구진은 새로운 절차 생성 방법을 쉽고 빠르게 검증할 수 있는 로타벤치마크 기술의 이점을 활용해 데이터를 통한 훈련으로 절차 생성 성능을 개선할 수 있는 두 가지 전략도 발견했다. 컨텍스트 내 예제 선별법(In-Context Example Selection)과 피드백 기반 재계획(Feedback and Replanning)이다. 이와함께 파인튜닝을 통한 절차 생성 성능 개선 효과도 확인했다. 소프트웨어 오픈소스로 공개 기업·학교 활용 가능 연구진은 이 기술 개발로 대형언어모델을 이용한 로봇 작업계획 기술의 성능평가 시간과 비용을 대폭 줄일 수 있을 것으로 전망했다. 연구진은 또 관련 소프트웨어를 오픈소스로 공개했다. 기업, 학교 등에서 이 기술을 자유롭게 활용할 수 있다. 최근 대형언어모델은 언어처리, 대화, 수학 문제 풀이, 논리 증명 외에 사람 명령을 이해해 하위 작업을 스스로 선택하고 순서대로 수행해 목표를 달성하는 절차 이해 영역에서도 우수한 성능을 나타내고 있다. 이에 따라 대형언어모델을 로봇 응용과 서비스 구현에 적용하려는 시도가 폭넓게 이뤄지고 있다. 연구진은 국제 인공지능 학술대회인 표현학습국제학회(ICLR)에 논문을 발표하고, 이 기술을 이용한 대형언어모델 총 33종의 절차 생성 성능 평가 결과를 깃허브를 통해 공개했다. 장민수 소셜로보틱스연구실 책임연구원은 “로타벤치마크는 절차 생성 AI 개발의 첫걸음”이라며 “향후 불확실한 상황에서 작업 실패를 예측하거나 사람에게 질문하며 도움을 받아 작업 생성 지능을 지속 개선하는 기술을 개발할 계획”이라고 말했다. 장 책임연구원은 또 “1가구 1로봇 생활 시대의 구현을 위해서는 이 기술이 반드시 필요하다”고 덧붙였다. 김재홍 소셜로보틱스연구실장은 “ETRI는 실세계에서 각종 임무 계획을 생성하고 실행할 수 있는 로봇을 실현하기 위해 파운데이션 모델을 활용한 로봇 지능 고도화 연구개발에 매진하고 있다”고 밝혔다. 이 기술은 과학기술정보통신부와 정보통신기획평가원(IITP)의 “사람중심 인공지능 핵심원천기술 개발 사업”의 일환으로 '스스로 불확실성을 자각하며 질문하면서 성장하는 에이전트 기술 개발' 과제를 통해 수행됐다.

2024.03.07 10:55박희범

복지부 차관, 집단행동 의사들·의협 비대위 국민 비판받아야

박민수 보건복지부 제2차관이 근무지를 이탈한 전공의와 이를 지지하고 있는 의사단체 지도부를 향해 “비판받아야 한다”고 말했다. 특히 의사단체 지도부 인사의 의사면허 자격정지 처분에 대해 “법은 법대로 집행된다”며 강경 대응을 예고했다. 박 제2차관은 22일 오전 정부세종청사에서 개최된 브리핑에서 “법은 본인이 받아들일 수 있나 없나에 따라 집행되는 것이 아니다”라며 “객관적인 요건과 성립 조건에 따라서 집행이 되는 것으로, 법은 법대로 원칙대로 진행이 된다”고 밝혔다. 이는 지난 20일 대한의사협회 비상대책위원회의 김택우 위원장과 박명하 조직위원장에게 송달된 의사면허 자격정지 행정처분 사전통지에 대한 입장을 밝힌 것이다. 복지부는 이들이 의료법 제66조 제1항 제10호에 따른 단체행동 교사금지명령을 위반했다고 보고 있다. 관련해 의협 비대위는 “면허정지처분이 위법부당하고 이를 근거로 한 행정처분 역시 위법부당하다”며 “법적 절차에 따라 행정소송 등을 통해 끝까지 다툴 것”이라는 점을 분명히 했다. 그러면서 “14만 의사회원과 2만 의대생들의 자발적이고 정당한 의사표현을 조기 차단하기 위해 정부는 전 방위적으로 법률상 근거도 없는 무리한 겁박을 감행하고 있다”며 “면허정지처분은 우리의 투쟁의지를 더욱 견고히 하고, 발생하는 어떠한 희생도 감수할 것”이라고 밝혔다. 또한 박 제2차관은 “현장을 박차고 나온 불법을 저지른 의사와 이를 부추기고 또 자금까지 모아서 불법을 지원하는 이런 (의협 비대위) 지도부의 의사들이 비난받아야 되고 비판받아야 한다”라고도 말했다. 관련해 “대한의사협회가 활동을 그렇게 하면 국민들은 모든 의사들이 다 그런 줄 안다”고 지적했다. 그는 “이번 사태를 통해서 국민들이 의사들에 대한 인식이 굉장히 지금 나빠지고 있다”라며 “의협의 지도부들은 전체 의사의 명예를 훼손하는 발언은 자제하라”고 요구했다.

2024.02.22 11:50김양균

[기자수첩] 그쪽도 '판교 사투리'를 아세요?

바야흐로 '대 사투리' 시대다. 정치인들의 모호한 화법인 '여의도 사투리', 법조인 특유의 화법인 '서초동 사투리'가 그렇다. 기자가 취재하는 IT 업계도 고유의 사투리가 존재한다. 이른바 '판교 사투리'다. 예컨대 "내일까지 이번 이슈(issue) 디밸롭(Develop)해서 사전 컨펌(confirm)받고 저한테 메일 샌드(send) 해주세요"와 같은 식이다. 굳이 쓰지 않아도 될 단어를 영어로 표현하면서 자신의 지적 고상함을 표현한다. IT업계 간담회라도 가는 날이면 머리가 아파온다. 그레이존(Gray zone)이 어떻고 데모데이(Demo day)가 어떻고 인큐베이팅(incubating)이 어떻고 발표의 7,80%가 불필요한 영어다. 500년전 돌아가신 세종대왕은 이 세태를 보며 무슨 생각을 할까. 물론 '말의 맛'이 있는 건 동의한다. 영어를 사용하지 않고는 표현할 수 없는 미묘한 뉘앙스가 있을 것이다. 하지만 앞서 열거한 영어 표현들은 얼마든지 한국어로도 표현이 가능하다. 그들은 자신의 '스마트'함을 뽐낸다고 생각할지 모르겠지만 적어도 내가 느끼기엔 '엣지'도 없고 '스마트'함도 없다. 더욱이 IT업계의 불필요한 영어 남발 배경엔 영어에 대한 맹목적인 숭앙, 사대주의도 숨어있다. '갭차이'라는 해괴망측한 단어가 파생된 것 역시 이런 이면에 기인한다. 미국 국적을 취득하기 위해 원정출산을 하는 나라라는 것을 상기해보면 이런 업계의 관행이 더 슬프게 다가온다. 앞서 법조계는 판결문 쉽게쓰기 운동을 시행한 바 있다. '소훼하다'를 불에 탔다로 '금원'을 돈으로 대체해 표현하는 등 일반인들과는 괴리되는 법조 언어를 친숙하게 바꾸려는 노력이었다. 언론 사례 역시 좋다. 기자들은 처음 입사해 교육 받을 때 중학교 2학년도 이해할 수준으로 글을 쓰라고 배운다. 쉬운 문장, 간결한 언어 사용을 강박적으로 교육한다. IT 업계는 이같은 사례를 곱씹어 보길 요청드린다. 불통은 결국 소통하지 못하는 데서 온다. 국가 전반에 뿌리 내린 IT를 자신들의 언어로만 향유하지 않기를 강권해본다.

2024.02.21 16:47이한얼

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

‘블록버스터’ 국산 신약 개발하려면 ‘통큰’ 정부 지원 필요하다

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

SKT 감염서버 23대 확인...자료유출 확인 안돼

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현