검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'고니'통합검색 결과 입니다. (1건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

KISTI 고니팀, 한국어 추론 모델·환각 억제 기술 확보…"업데이트 언제할까"

한국과학기술정보연구원(KISTI)이 과학기술 특화 생성형 거대 언어 모델(LLM) 고니(KONI)와 관련한 ▲한국어 특화 추론 모델과 ▲환각 억제 기술을 각각 확보했다고 31일 발표했다. 고니는 배경훈 부총리 겸 과학기술정보통부 장관이 신년 업무보고에서 독자 파운데이션 모델(독파모) 기반 고니 업데이트를 당부할 정도로 관심을 갖는 LLM이다. 고니는 지난 2023년 12월 처음 공개됐다. 2024년 7월 신규버전이 공개된 이후 지금까지 업데이트는 이루어지지 않았다. 이번에 KISTI가 확보한 인공지능(AI) 분야 국제 학술대회인 국제표현학습학회(ICLR)에 채택돼 논문으로 공개됐다. ICLR은 신경정보처리시스템학회(NeurIPS) 및 국제머신러닝학회(ICML)와 함께 세계 3대 AI 학회로 꼽힌다. 딥러닝과 표현 학습 분야에서 최정상급 학술대회로 인정받고 있다. 구글이나, 메타, 오픈AI 등 글로벌 빅테크 기업들이 주목하는 학회다. 고니는 KISTI가 개발한 LLM으로, 지난 2024년 과학기술 분야 추론, 글쓰기, 이해 등 다양한 작업에서 성능을 크게 향상 시킨 새 버전 2종을 허깅 페이스와 KISTI 에이아이다에 공개한 바 있다. 이번에 공개한 한국어 특화 추론 모델은 고니 연구팀이 비영리 오픈소스 연구단체 해례(HAERAE)팀(팀장 손규진)과 협력으로 개발했다. 579만 건의 한국어 네이티브 프롬프트와 370만 건의 장문 추론 경로를 포함한 '이상(Yi-SANG)' 학습 데이터세트를 구축했다. 이는 공개된 한국어 사후 학습 데이터자원 중 최대 규모다. 고니팀은 또 이 모델에서 사고 과정은 영어로, 최종 답변은 한국어로 도출하는 '혼합 언어 단계적 사고 기법도 개발, 적용했다. 한국어 전용 모델의 논리적 한계를 극복하고, 번역 어투를 최소화하면서도 추론 효율을 극대화했다는 것이 연구진 설명이다. 이경하 초거대AI연구센터장은 "이 기술을 이용해 학습된 모델은 딥시크(DeepSeek)-R1-32B 등 유사 규모 글로벌 모델을 제치고 최고 수준의 한국어 추론 성능을 기록했다"고 말했다. 이와함께 고니팀은 특정 언어나 도메인에 AI모델을 적응시킬 때 기존 지식을 잊어버리는 '치명적 망각' 문제를 해결하는 '저계층 적응 기반 대조 보정' 기술도 개발했다. 이 기술은 추가 모델 훈련 없이 추론 시점에만 작동하며, 모델 내부 지식을 동적으로 추출해 사실 관계를 보정한다. 고도의 정확성이 요구되는 전문 분야에서 환각 현상을 억제하는 데 도움을 줄 수 있다. 고니팀은 이 연구를 바탕으로 연구자 파트너로서 가설을 세우고 실험 데이터를 분석하는 'AI 연구동료(AI Co-Scientist)' 기술 개발을 추진할 계획이다. 복잡한 과학적 난제를 함께 해결할 수 있는 지능형 연구 에이전트 시스템을 구축해 국가 AI 주권을 확보하고, 대한민국 연구 현장을 '과학을 위한 AI(AI for Science)' 체제로 전환하는 데 기여할 방침이다. 이식 KISTI 원장은 “이번 성과는 한국어 AI 기술의 글로벌 경쟁력을 입증한 것”이라며, “KONI 고도화를 지속 추진해 AI 연구동료 개발과 과학을 위한 AI 혁신을 선도하겠다”고 밝혔다.

2026.01.31 19:36박희범 기자