검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'수능수학'통합검색 결과 입니다. (1건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

KAIST 석·박사 15명, 챗GPT와 딥시크로 수능 미적분 풀어보니…

올해 수능 수학 30번 문항을 챗GPT와 딥시크에게 물었다. 30번은 미적분 문제다. 전국 수험생들의 14%만이 맞췄다. 과연 어느 생성형 인공지능(AI)이 올바른 답을 제시했을까. KAIST 테라랩(지도교수 김정호)이 지난 주 챗GPT와 딥시크의 성능과 활용성, 경쟁력의 비밀을 공개하는 세미나를 개최했다. 이 세미나에는 테라랩 소속 석·박사과정생 15명이 참여했다. 이날 서은지 연구생(전기및전자공학과 석사과정)이 딥시크를 활용해 테스트한 결과를 공개해 눈길을 끌었다. 이 시험에서 서 연구생은 리즈닝(추론가능 LLM) 모델로 챗GPT-o1과 딥시크-R1(1.5B)을 썼다. 이 결과 GPT-o1은 7분 40초만에 정답 17을 제시했다. 반면 R1은 정답 도출에 실패했다. 서 연구생은 이외에도 수리1, 추리2, 코딩1문제를 각각 테스트한 결과도 공개했다. 이 결과에 따르면 단순 수리 문제는 양쪽 AI 모두 맞췄다. 이어 진행한 숫자 야구 게임에서는 GPT-o1의 경우 18분간 10번의 시도로 정답을 냈고, R1은 55분간 15번을 시도했으나 갈피를 잡지 못했다. 삼성이 시행하는 직무적성검사(GSAT)도 테스트했다. 3단 논법에서 전제1과 결론을 제시한 뒤 전제2를 묻는 질문이다. 이 질문에 GPT-o1은 25초만에 정답을 도출했다. 반면 R1은 1분 동안 리즈닝까지 했지만, 답을 맞히지 못했다. 그러나 코딩의 2가지 오류 탐지에서는 GPT-o1이 46초간 한 개의 오류만 해결한 반면, R1은 몇 초 동안 2가지를 모두 해결했다. 서 연구생은 "GPT-o1이 고난도 수리나 추론해결이 정확한 반면 R1은 코딩 오류 탐지가 정확했다"며 "제품 출시 2개월 된 R1이 이 같은 성능을 보인다는 측면에서 대단하다"고 평가했다. 언어와 수학에선 R1, 프로그래밍에선 오픈AI-o1이 강력 이어 김지훈 연구생(전기및전자공학과 박사과정)은 AI 벤치마크별 성능 비교 자료를 공개해 관심을 끌었다. 미국고교수학경시대회(AIME2024) 문제로는 R1이 79.8점, 오픈AI-o1은 79.2점으로 R1이 미세하게 앞섰다. MATH-500(고급수학문제)이나 소프트웨어 엔지니어링 벤치마크(SWE-벤치)에서도 0.3~0.9점 가량 R1이 좋은 점수를 받았다. 그러나 검색없이 해결하는 대학원 수준 문제(GPQA)에서는 오픈AI-o1가 75.7점으로, 71.5점을 받은 R1보다 4.2점이 높게 나왔다. 또 영어나 수학, 중국어 등의 문제에서는 R1이, 프로그래밍 최적화에서는 오픈AI-o1이 강력했다. 최성욱 연구생(전기및전자공학과 박사과정)은 딥시크의 기업 전반을 공개하며 "딥시크는 연구자와 엔지니어 150명과 데이터 자동화 연구팀 31명만으로 개발했고, 오픈AI는 1천200명의 인력이 투입됐다"고 설명했다. 최 연구생은 또 딥시크 서비스 차단 이슈를 거론하며 "우리나라를 포함해 미국, 일본, 호주, 이탈리아, 대만이 접속을 차단하거나 사용금지, 앱 다운로드 금지 등으로 규제 중"이라고 덧붙였다. LLM이 기초..."우리나라 GPU 10만장정도 보유 희망" 김근우 연구생(전기및전자공학과 박사과정)은 딥시크 R1-제로의 학습 방법론(GRPO)으로 주목 받았다. 김 연수생은 이 방법론에서 R1-제로의 특징을 가치평가 모델과 보상인공지능 모델을 사용하지 않는 경량화된 강화학습으로 분석했다. 이외에 이들은 △딥시크-V3의 기본 아키텍처 △R1-제로에서의 강화학습 △오픈소스 생태계 △기업소개 및 기술적 배경 등을 주제로 자료를 공개했다. 김정호 교수는 "딥시크 R1 등장이 경쟁 체제 문제를 넘어, 결국 전의 전쟁으로 발전하고 있다"며 "지금은 거대언어모델(LLM)에 머물지 않고 미디어 LLM, 멀티모달 에이전트, AI로봇, 피지컬 AI를 넘어 범용인공지능(AGI), 초인공지능(ASI) 시대로 가는 시작점"이라고 말했다. 김 교수는 또 "이 가운데 LLM이 기초"라며 "정부도 K-LLM 개발하겠다고 한다. 우리나라 GPU 보유숫자가 10만장까지 갔으면 좋겠다"라고 덧붙였다. 김 교수는 "딥시크가 주목받는 이유로 저비용, 자체 개발, 챗GPT 동급성능, 1년만에 개발 등을 꼽을수 있다"며 "딥시크 AI에는 학습코드와 학습 데이터가 공개되지 않는 등 비밀이 많이 숨어 있는 것 같다"고 평가했다.

2025.02.26 17:16박희범 기자