업스테이지-NIA, 한국어 언어모델 평가 플랫폼 만든다
업스테이지가 한국지능정보사회진흥원(NIA)과 한국형 오픈 거대언어모델(LLM) 리더보드 구축을 위해 손잡았다. 양사는 서울 광화문 NIA 서울사무실에서 '인공지능(AI) 허브' 데이터 활용 업무협약을 체결했다고 5일 밝혔다. 이번 협약에 따라 업스테이지는 AI 허브에서 한국어 데이터를 활용해 '오픈-Ko LLM 리더보드'를 이달 내 구축할 계획이다. AI 허브는 NIA의 AI 학습용 데이터 제공 플랫폼이다. 오픈-Ko LLM 리더보드는 한국어 LLM 성능을 평가하고 순위를 매기는 플랫폼이다. 기존의 추론과 상식 능력, 언어 이해 종합능력 및 환각 현상 방지 등 4가지 지표에 NIA와 학계 등 신뢰할 만한 데이터를 기반으로 윤리, 전문가 지식 등 추가 기준을 개설, 모델을 평가한다. 업스테이지는 NIA와 협력을 통해 공동으로 리더보드를 구축할 방침이다. 업스테이지는 AI 허브 데이터를 바탕으로 한국 문화 정서를 담아낼 수 있는 고품질 LLM을 개발할 방침이다. 이를 통해 국내 AI 주권을 위한 생태계 조성에 기여할 계획이다. NIA는 이번 협력을 통해 업스테이지 '1T 클럽'에도 가입해 양질의 데이터를 제공키로 약속했다. 업스테이지의 1T 클럽은 지난달 출범해 텍스트, 책, 기사 등 다양한 형태의 1억 단어 이상의 한국어 데이터를 기여하는 파트너 집합체다. 김성훈 업스테이지 대표는 "NIA와 한국어 데이터 부족 문제를 해결하고, 국내외 시장에서 경쟁력 있는 AI 플랫폼을 제공할 것"이라며 "한국형 오픈 LLM 리더보드를 통해 국내 LLM 성능과 혁신성을 증명하도록 노력하겠다"고 말했다. 황종성 NIA 원장은 "업스테이지와의 협약을 통해 AI 허브 데이터가 국내외 AI 시장에서 활용될 수 있게 됐다"며 "한국형 오픈 LLM 리더보드를 통해 국내 LLM 수준과 다양성을 높이고, AI 생태계 구축에 더욱 힘쓰겠다"고 전혔다. NIA는 AI Hub를 통해 다양한 분야의 데이터를 수집하고 가공하여 인공지능 개발자들에게 무료로 제공하고 있다. NIA는 2025년까지 1천300여 종의 데이터를 구축할 계획이다.