나라지식정보, 민원 상담용 원천데이터 만든다
나라지식정보가 정부 사업을 통해 분류, 요약, 질의응답에 활용할 민원상담용 원천데이터를 구축한다. 나라지식정보는 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 '2024년 초거대 인공지능(AI) 확산 생태계 조성사업' 수행기관으로 선정됐다고 25일 밝혔다. 사업 수행을 위해 나라지식정보는 본사 회의실에서 전담기관인 NIA를 비롯한 품질검증기관 한국정보통신기술협회(TTA), 참여기관 리스트, 디그랩 관계자들이 참석한 가운데 컨소시엄 구성 및 청렴실천 결의식을 진행했다. 나라지식정보컨소시엄은 이 사업을 통해 한국어 대화를 기반으로 하는 거대언어모델(LLM) 성능 향상을 위한 인스트럭션 튜닝 데이터를 구축한다. 민원 상담을 필요로 하는 기업·단체·기관의 상담 지원 업무, AI 자동 상담 서비스 품질 향상에 기여하는 AI 알고리즘도 개발한다. 컨소시엄은 연말까지 민간 분야 1만 건, 공공 분야 1만 건 등 총 2만 건의 원천데이터를 구축할 예정이다. 분류·요약·질의응답 등 라벨링 가공 유형별로 20만 건의 민원 상담용 인스트럭션 듀닝 데이터를 구축할 방침이다. 손영호 나라지식정보 대표는 "과제를 성공적으로 수행하기 위해 AI 학습용 데이터 구축에 경험이 많은 기업, LLM 활용 및 연구 성과를 갖고 있는 기업, 음성 데이터 처리에 높은 기술력을 보유한 기업으로 컨소시엄을 구성했다"며 "이번 사업을 통해 LLM 성능 향상에 필요한 고품질 데이터를 구축하고 이를 활용한 향상된 성능의 LLM 기반 AI 상담서비스와 맞춤형 솔루션 개발을 할 것"이라고 말했다.