• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
CES2026
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'오피스QA'통합검색 결과 입니다. (1건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"암기력보다 실무 추론"…데이터브릭스, 기업용 AI 벤치마크 공개

데이터브릭스가 기업 환경에서 인공지능(AI) 추론 능력을 평가하는 플랫폼을 공개했다. 6일 테크크런치 등 외신에 따르면 데이터브릭스는 미국 재무부 공보 기반으로 구축된 오픈 벤치마크 '오피스QA'를 지난달 출시했다. 오피스QA는 짧은 지문이나 상식 평가에 치중했던 기존 벤치마크와 달리 8만9천 쪽 분량 문서를 평가 대상으로 삼는다. 수십 년에 걸친 문서 속에서 정보를 탐색하거나 표와 스캔 된 PDF를 해석하는 등 실제 사무 환경과 유사한 과제를 부여하는 것이 특징이다. 데이터브릭스는 오피스QA가 단순 질의응답이 아닌 문서 전반을 이해하고 명확한 근거를 바탕으로 추론하는 능력을 검증하는 데 초점을 맞췄다고 밝혔다. 이를 통해 AI가 실제 업무 현장에서 겪는 기술적 한계를 보다 정확하게 드러내려는 전략이다. 기존 학술적 성과 위주 평가 체계를 넘어 실질적인 비즈니스 업무 수행력을 검증하려는 취지다. 데이터브릭스는 오피스QA의 벤치마크를 오픈소스로 공개해 학계와 산업계 참여를 유도하고 기업용 AI 성능 기준 형성에 대한 영향력을 확보할 방침이다. 다수 외신은 기존 평가 방식이 AI의 일반 상식이나 암기력 중심이었다면 오피스QA는 문서 전반을 관통하는 맥락 이해와 근거 기반의 추론 능력에 집중한다는 점에 집중했다. 데이터브릭스는 "금융과 규제처럼 높은 정확도가 요구되는 실제 자료를 활용함으로써 AI가 실무에서 맞닥뜨리는 기술적 한계를 구체적으로 짚을 수 있을 것"이라고 강조했다.

2026.01.06 13:37김미정

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

삼성전자가 돌아왔다...1년 만에 글로벌 D램 1위 탈환

"수익성은 부담, 상징성은 호감"…인천공항 면세점 입찰 딜레마

라스베이거스서 'K-뷰티테크' 알리다...에이피알 CES 전시 가보니

경찰, 쿠팡 로저스 대표 소환 통보…조사 일정 조율 중

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.