• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이벨버스'통합검색 결과 입니다. (1건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

업스테이지 "누구나 쉽게 LLM 평가·테스트 무료로 하세요"

업스테이지(대표 김성훈)가 누구나 쉽게 거대언어모델(LLM)을 평가, 테스트할 수 있는 플랫폼으로 LLM 생태계 확산에 앞장선다. 업스테이지는 노코드 LLM 종합 평가 플랫폼 '이벨버스' 무료로 공개했다고 3일 밝혔다. 오픈소스 형태로 깃허브에서 접근 가능하다. 통상 LLM 성능 평가에는 특정 데이터셋을 기준으로 응답 정확도를 기록한 벤치마크 지표를 활용한다. 모델의 추론, 상식, 언어 이해 능력 등 6가지 부문을 측정하는 허깅페이스 'H6' 지표를 포함, 대화 능력 지표 'MT-벤치', 감성 평가 지표 'EQ-벤치', 지시 이행 능력 지표 'IFeval' 등이 주요 벤치마크로 꼽힌다. 이에 업스테이지는 이러한 주요 벤치마크를 한군데 통합해, 언어모델 성능을 종합적으로 테스트할 수 있는 자체 평가 플랫폼을 개발했다. 기존에는 특정 벤치마크를 테스트하려면 해당 플랫폼에 모델을 제출해야 하는 번거로움이 있었지만, 이벨버스를 활용하면 여러 벤치마크 테스트를 동시에 진행할 수 있다. 업스테이지 이벨버스는 업무용 메신저 '슬랙'에 API 챗봇 형태로 연동해 사용성을 확대했다. 사용자는 슬랙에서 이벨버스 챗봇과 1:1 대화를 통해 모든 평가 과정을 수행할 수 있다. 이용자들은 "호출"이나 "평가" 등 채팅창에 2개의 명령어만 입력하면 바로 원하는 모델을 호출해 테스트할 수 있다. 벤치마크 별 점수에 대한 종합 리포트까지 확인할 수 있어 모델 간 비교 평가도 가능하다. 김성훈 업스테이지 대표는 "누구나 자신이 개발한 LLM을 쉽게 테스트해 볼 수 있는 이벨버스 플랫폼을 무료로 공개할 수 있어 기쁘다"며 "앞으로 업스테이지는 LLM 생태계 발전과 확산을 위해 다양한 노력을 지속해 나갈 것"이라고 밝혔다.

2024.04.03 10:12김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

삼성전자, 브로드컴과 HBM3E 12단 공급 추진…ASIC서 기회 포착

메타의 공격적 AI 인재 사냥, 핵심은 '데이터 전쟁'

입점하면 서로 이득…유통가, ‘올다무’ 유치 경쟁 치열

이재명 대통령 "AI·반도체·재생에너지·문화 투자 아끼지 않겠다"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.