무하유, 법률 AI 학습 데이터셋 구축
무하유(대표 신동호)가 법률 인공지능(AI) 학습 데이터셋을 구축, 운영한다고 20일 밝혔다. 무하유는 '국회도서관 융복합서비스 데이터셋 구축 사업'의 주관 사업자로 선정됐다. 이를 통해 국내 법률 관련 AI 학습용 데이터셋을 구축할 방침이다. 또 법률 용어를 대화형 문답으로 설명할 수 있게 지원한다. 무하유는 이번 사업을 통해 국회도서관의 '인공지능 법률 Q&A' 서비스에서 자연어 질의응답 서비스를 실현하기 위한 질의 답변 등의 데이터셋을 구축한다. 법률에 해당하는 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보뿐 아니라 통계표의 제목 및 매칭 키워드 등을 만든다. 무하유는 이를 데이터 관리 플랫폼 '데이터 팩토리'로 진행할 방침이다. 이 플랫폼은 AI 적용 솔루션을 운영하는 과정에서 필요한 데이터를 자체적으로 구축한 후 정제·가공할 수 있다. 인력 조달, 계약, 데이터 구축, 품질관리, 저작권 관리까지 가능하다. 데이터 팩토리는 AI와 인간 협업을 통해 데이터셋을 구축하는 휴먼인더루프 프로세스로 업무 자동화를 지원한다. AI를 활용해 추출한 데이터를 사람이 직접 검증하고 수정할 수 있는 시스템을 추가해 데이터 품질을 보장한다. 작업자별 품질 관리가 가능하고, 저작권 관계를 명확히 할 수 있다. 신동호 무하유 대표는 "AI 학습 데이터 시장은 더 세분화될 것으로 본다"며 "데이터 팩토리로 기업체 데이터 구축 욕구를 해소하겠다"고 전했다.