"관세·지식재산 데이터 연계하면 특허·상표권 침해 사전예방"
관세 데이터와 지식재산 데이터를 연계해 활용하면 국내 특허권, 상표권, 저작권, 디자인권 등의 지식재산권 침해를 사전에 예방하고 국내 산업을 보호할 수 있는 인공지능(AI) 활용 연구가 가능하다는 보고서가 나왔다. 26일 한국지식재산연구원(원장 손승우)은 '지식재산 분야의 빅데이터 및 초거대 AI 기술 활용 방안에 관한 보고서'를 발간, 이같이 밝혔다. 보고서는 글로벌 빅테크 기업이 주도하고 있는 초거대 언어 모델은 개발에 천문학적인 비용과 자원이 필요하고, 또 학습 데이터와 관련해 분쟁과 소송이 제기되고 있으며, 특히 국내의 경우 해외 기업 서비스를 이용하는 과정에서 보안 데이터가 유출될 수 있어 초거대 AI 개발과 활용에 어려움이 있다면서 "초거대 AI언어 모델 경량화 연구를 통해 국내 대학·연구소·중소기업이 컴퓨팅 파워와 리소스 한계를 극복하고 초거대 AI 인공지능과 유사한 수준의 모델을 개발할 수 있다"고 진단했다. 학습 데이터 저작권 침해 이슈와 관련해서는 "지식재산 관련 데이터를 학습 데이터로 활용하면 국가기술 경쟁력 핵심요소인 지식재산 분야에서 심사·심판 행정 업무 효율성 증진과 중소기업 출원인 비용 절감, 지식재산 침해 예방 및 보호 등에 인공지능 기술을 활용할 수 있을 것"이라고 짚었다. 이어 초거대 AI 및 멀티모달(Multi-modal) 기반 인공지능 기술이 발전함에 따라 학습·분석 데이터 범위를 확장해 다양한 영역의 데이터를 연결하는 유연한 사고 확장이 필요하다면서 "지식재산 분야도 기업 재무정보, 경제 지표, 관세 데이터, 각종 이미지, 동영상, 소셜 미디어 및 온라인 커뮤니티 데이터, 설문 결과 등 타 분야의 정형(structured)·비정형(unstructured) 데이터를 기존의 전통적인 지식재산 데이터와 연계해 학습하고 분석하면 더 다양한 생성형 인공지능 서비스를 개발할 수 있다"고 내다봤다. 또 데이터 활용과 관련해 정부의 경직된 조직문화 개선이 인공지능 기술 활용에 필수적이라면서 "타 분야의 정형·비정형 데이터 및 공공데이터를 효과적으로 연계하고 분석하기 위해서는 데이터를 소유한 각 부처 간에 데이터 수집, 전처리, 공유, 활용에 있어 효율적이고 통일된 프로세스를 확립하고, 데이터 분야 전문가 양성 또는 데이터 관련 교육을 체계적으로 제공해야 한다"고 밝혔다. 보고서는 초거대 AI 모델은 방대한 양의 학습 데이터로 수천억 개의 파라미터 연산을 수행하기 위해 천문학적인 비용과 자원이 필요하므로 글로벌 빅테크 기업과의 기술 격차를 줄이기 위해 정부가 지속적으로 관심을 가지고 적극적으로 투자해야 한다면서 "공공부문에서 보유하고 있는 알고리즘, 데이터, 컴퓨팅 리소스를 공유할 수 있는 플랫폼을 구축하고, 정부의 AI 인프라 지원 및 AI 생태계 조성 등의 역할 수행이 시급하다"고 지적했다.