• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
6.3 대선
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'수능수학'통합검색 결과 입니다. (1건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

KAIST 석·박사 15명, 챗GPT와 딥시크로 수능 미적분 풀어보니…

올해 수능 수학 30번 문항을 챗GPT와 딥시크에게 물었다. 30번은 미적분 문제다. 전국 수험생들의 14%만이 맞췄다. 과연 어느 생성형 인공지능(AI)이 올바른 답을 제시했을까. KAIST 테라랩(지도교수 김정호)이 지난 주 챗GPT와 딥시크의 성능과 활용성, 경쟁력의 비밀을 공개하는 세미나를 개최했다. 이 세미나에는 테라랩 소속 석·박사과정생 15명이 참여했다. 이날 서은지 연구생(전기및전자공학과 석사과정)이 딥시크를 활용해 테스트한 결과를 공개해 눈길을 끌었다. 이 시험에서 서 연구생은 리즈닝(추론가능 LLM) 모델로 챗GPT-o1과 딥시크-R1(1.5B)을 썼다. 이 결과 GPT-o1은 7분 40초만에 정답 17을 제시했다. 반면 R1은 정답 도출에 실패했다. 서 연구생은 이외에도 수리1, 추리2, 코딩1문제를 각각 테스트한 결과도 공개했다. 이 결과에 따르면 단순 수리 문제는 양쪽 AI 모두 맞췄다. 이어 진행한 숫자 야구 게임에서는 GPT-o1의 경우 18분간 10번의 시도로 정답을 냈고, R1은 55분간 15번을 시도했으나 갈피를 잡지 못했다. 삼성이 시행하는 직무적성검사(GSAT)도 테스트했다. 3단 논법에서 전제1과 결론을 제시한 뒤 전제2를 묻는 질문이다. 이 질문에 GPT-o1은 25초만에 정답을 도출했다. 반면 R1은 1분 동안 리즈닝까지 했지만, 답을 맞히지 못했다. 그러나 코딩의 2가지 오류 탐지에서는 GPT-o1이 46초간 한 개의 오류만 해결한 반면, R1은 몇 초 동안 2가지를 모두 해결했다. 서 연구생은 "GPT-o1이 고난도 수리나 추론해결이 정확한 반면 R1은 코딩 오류 탐지가 정확했다"며 "제품 출시 2개월 된 R1이 이 같은 성능을 보인다는 측면에서 대단하다"고 평가했다. 언어와 수학에선 R1, 프로그래밍에선 오픈AI-o1이 강력 이어 김지훈 연구생(전기및전자공학과 박사과정)은 AI 벤치마크별 성능 비교 자료를 공개해 관심을 끌었다. 미국고교수학경시대회(AIME2024) 문제로는 R1이 79.8점, 오픈AI-o1은 79.2점으로 R1이 미세하게 앞섰다. MATH-500(고급수학문제)이나 소프트웨어 엔지니어링 벤치마크(SWE-벤치)에서도 0.3~0.9점 가량 R1이 좋은 점수를 받았다. 그러나 검색없이 해결하는 대학원 수준 문제(GPQA)에서는 오픈AI-o1가 75.7점으로, 71.5점을 받은 R1보다 4.2점이 높게 나왔다. 또 영어나 수학, 중국어 등의 문제에서는 R1이, 프로그래밍 최적화에서는 오픈AI-o1이 강력했다. 최성욱 연구생(전기및전자공학과 박사과정)은 딥시크의 기업 전반을 공개하며 "딥시크는 연구자와 엔지니어 150명과 데이터 자동화 연구팀 31명만으로 개발했고, 오픈AI는 1천200명의 인력이 투입됐다"고 설명했다. 최 연구생은 또 딥시크 서비스 차단 이슈를 거론하며 "우리나라를 포함해 미국, 일본, 호주, 이탈리아, 대만이 접속을 차단하거나 사용금지, 앱 다운로드 금지 등으로 규제 중"이라고 덧붙였다. LLM이 기초..."우리나라 GPU 10만장정도 보유 희망" 김근우 연구생(전기및전자공학과 박사과정)은 딥시크 R1-제로의 학습 방법론(GRPO)으로 주목 받았다. 김 연수생은 이 방법론에서 R1-제로의 특징을 가치평가 모델과 보상인공지능 모델을 사용하지 않는 경량화된 강화학습으로 분석했다. 이외에 이들은 △딥시크-V3의 기본 아키텍처 △R1-제로에서의 강화학습 △오픈소스 생태계 △기업소개 및 기술적 배경 등을 주제로 자료를 공개했다. 김정호 교수는 "딥시크 R1 등장이 경쟁 체제 문제를 넘어, 결국 전의 전쟁으로 발전하고 있다"며 "지금은 거대언어모델(LLM)에 머물지 않고 미디어 LLM, 멀티모달 에이전트, AI로봇, 피지컬 AI를 넘어 범용인공지능(AGI), 초인공지능(ASI) 시대로 가는 시작점"이라고 말했다. 김 교수는 또 "이 가운데 LLM이 기초"라며 "정부도 K-LLM 개발하겠다고 한다. 우리나라 GPU 보유숫자가 10만장까지 갔으면 좋겠다"라고 덧붙였다. 김 교수는 "딥시크가 주목받는 이유로 저비용, 자체 개발, 챗GPT 동급성능, 1년만에 개발 등을 꼽을수 있다"며 "딥시크 AI에는 학습코드와 학습 데이터가 공개되지 않는 등 비밀이 많이 숨어 있는 것 같다"고 평가했다.

2025.02.26 17:16박희범

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

삼성전자, 1c D램 상용화에 '올인'…성과와 과제는

bhc, 가격 결정권 가맹점에 넘긴다…이중가격제 도미노 되나

美·韓 통신망, 中 해커에 발칵 뒤집혔다…태양광도 '백도어' 위협에 불안

李·金의 AI 공약…100조 투자 한 목소리, 방식은 딴 판

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현