자율주행차 학습에 영상 원본데이터 사용 가능해진다
자율주행차나 보건의료 부문서 인공지능(AI) 학습서 필요할 경우 원본 데이터를 사용 가능하게 하는 방안이 추진된다. 또 공공기관이 민간 기업이나 연구자 등에게 더 많은 가명정보 제공하도록, 공공기관 평가기준에 가명정보 제공·활용 관련 지표가 신설된다. 21일 개인정보보호위원회(개인정보위)는 정부서울청사에서 가명정보 활용 확대 방안을 발표했다. 가명정보는 개인 정보 일부를 삭제, 대체해 추가 정보 사용과 결합없이는 특정 개인을 알아볼 수 없는 정보다. 2020년 데이터 3법(개인정보보호법·신용정보법·정보통신망법)이 통과되면서 정보 주체 동의 하에 데이터를 자유롭게 옮기고, 개인정보를 가명화 처리(가명정보)한 후 데이터 결합이 가능해졌다. 이날 개인정보위 양청삼 개인정보정책국장은 "개인정보위와 기획재정부, 과학기술정보통신부 등 관계부처 합동으로 가명정보 활용 확대 방안을 마련했다"며 "가명정보의 제공을 확대하는 유인을 강화하고 안전 관리 강화 등 가명정보 제도를 근본적으로 개선하기 위해 만들었다"고 설명했다. 일단 가장 눈에 띄는 부분은 가명정보로 활용하기 어려웠던 자율주행과 의료 부문서 원본 데이터를 쓸 수 있게 허용한 점이다. 우선 AI 및 자율주행 기술 개발을 위해 영상과 이미지 등 비정형데이터를 안전하게 가명처리해 활용할 수 있는 기준을 마련하되, 가명처리 시 영상 정보 활용이 곤란한 경우 영상데이터 원본을 활용할 수 있게 한다는 것이 개보위 설명이다. 원본데이터는 규제 특례를 통해 이뤄질 것으로 보이며, 사용 기업의 경우 안전 조치를 강화해야 한다. 보건의료 데이터의 경우 씨티(CT)·엠알아이(MRI) 촬영 결과와 같은 비정형 데이터에 대한 가명처리 기준이 제시될 계획이다. 개보위 태현수 데이터안전정책과장은 "보건의료 데이터를 안전하게 가명 처리하는 기준이 그동안 조금 명확하게 제시되지 못했다"며 "다양한 형태의 데이터들이 안전하게 활용되려면 어떻게 가명 처리돼서 될 수 있는지를 보건복지부 등 관계부처와 명확한 기준을 제시해서 활용이 안 되는 부분을 개선해 나가겠다"고 말했다. 또 가명정보 결합전문기관 자체적으로 결합한 정보를 활용할 수 있는 길도 열렸다. 가명정보 결합전문기관은 개인정보 가명화 및 결합 업무를 지원하는 곳으로 행정기관·공공기관·민간기업 34곳이 지위를 얻었다. 건강보험심사평가원·통계청·국민건강보험공단·삼성SDS·SK·롯데정보통신 등이다. 양청삼 국장은 "자체 결합 허용에 따른 부작용 방지를 위해 자체 결합 적정성 평가시 경쟁기관 참여 의무 등 다양한 보완 장치를 마련하겠다"고 강조했다. 공공기관 정부 업무평가와 공공기관 경영평가에 얼마나 많은 공공데이터를 제공했는지를 반영한다. 양 국장은 "내년 공공데이터 제공 운영실태평가와 데이터 기반 행정 실태점검이 실시되는데, 공공기관 평가 기준에 가명정보 제공·활용 관련 평가 항목이 신설된다"며 "정부 업무평가와 공공기관 경영평가에도 반영된다"고 부연했다. 현재 공공기관은 가명정보 제공 시 내부 절차 및 담당인력 부재 등으로 소극적으로 대응해왔다는게 정부 자체적 평가다. 양 국장은 "가명정보 특례 제도가 2020년 8월에 도입됐고 지금 약 3년이 지났는데, 결합케이스는 300여 건"이라고 설명했다. 이밖에 개인정보위는 합성데이터 활용을 지원하겠다는 방침이다. 합성데이터는 원본데이터의 통계적 특성 및 분포와 표본을 이용해 만들어진 원본과 유사한 인공데이터로 재현데이터라고도 불린다. 원본데이터는 실존하는 인물의 데이터라면 합성데이터는 이 세상에 존재하지 않는 가상인물에 대한 데이터인 것이다. 특히 합성데이터는 AI 학습데이터가 없거나 부족할 때나 개인정보 등을 포함하고 있어 직접 확보하거나 접근하기 어려운 데이터에 대한 대체 데이터로 활용된다. 양 국장은 "합성데이터도 과학기술정보통신부와 함께 안전한 생성 절차 및 기준을 마련해 민간서 합성데이터를 적극적으로 생성해 활용할 수 있도록 지원하겠다"고 언급했다.