검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'공개데이터'통합검색 결과 입니다. (2건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

"사업 하기 리스크 커"…개보위 공개 데이터 가이드라인에 AI 업계 '우려'

국내 인공지능(AI) 업계가 공개 데이터 처리 기준의 모호성으로 인해 기술 발전이 지연되고 있다고 호소하고 있다. 명확한 사용 기준이 없어 혼란이 가중되면서 AI 기술 및 서비스 개발에 직접적인 지장을 주고 있다는 지적이다. 2일 업계에 따르면 개인정보보호위원회(개보위)는 지난 7월 AI 개발 및 서비스에 활용되는 '공개 데이터 처리 기준'을 제시한 바 있다. 공개 데이터란 인터넷에서 누구나 합법적으로 접근할 수 있는 정보를 의미한다. 이는 생성 AI의 학습에 있어 핵심적인 역할을 하지만 주소와 고유식별번호 등 개인정보가 포함될 수 있어 개인정보 침해 우려가 있다. 개보위가 발표한 '공개 데이터 처리 기준'에 따르면 개인정보보호법 제15조 제1항 제6호에 명시된 개인정보처리자의 '정당한 이익'은 공개 데이터 사용의 법적 근거가 될 수 있다. 개보위는 이를 적용하기 위해서는 '목적의 정당성', '처리의 필요성', '구체적 이익형량' 등 세 가지 요건을 충족해야 한다고 설명했다. AI 기업들과 전문가들은 이러한 처리 기준이 지나치게 모호하며 구체적인 지침이 부족하다고 입을 모으고 있다. 업계 전문가들은 구체적인 가이드가 부재한 상황에서 각 AI 기업에게 강제된 자율성으로 인해 불필요한 추가 개발 및 비용이 발생함을 지적했다. 이에 따른 리스크 역시 기업이 부담하고 있는 상황이기 때문이다. IT 중소기업 B사 관계자는 "모호한 가이드만 있는 상황에서 자율적인 판단을 내리는 것은 원해서 하는 것이 아니라 거의 강제적으로 이뤄지는 것"이라며 "그 리스크도 어쩔 수 없이 각 회사가 지고 있다"고 토로했다. B사 관계자에 따르면 이러한 '자율성'은 스타트업과 중소기업에 특히 치명적이다. 회사가 자율적으로 판단해 데이터를 수집하고 모델 학습에 활용했다가 법적인 리스크를 져 발생하는 잠재적인 비용이 수십억 원에 달할 수도 있는 상황이기 때문이다. 대기업은 감당할 수 있겠지만 규모가 작은 기업에게는 큰 부담이 된다는 설명이다. 그는 "개발을 완료한 후 개인정보보호법에 따라 사용 불가 판정이 나오면 막대한 비용을 들여 다시 개발해야 하는 상황"이라며 "하루라도 빨리 명확한 가이드라인을 제공해 사업을 빠르게 진행할 수 있도록 해주면 좋겠다"고 강조했다. 또 다른 IT 대기업 R사 관계자는 AI 학습 데이터에 대한 처리 기준이 전 세계 차원에서도 명확한 규칙이 정해지지 않은 상황임을 지적했다. 그는 "해외 모델도 국내 공개 데이터를 이미 학습에 활용하고 있는 것으로 추정되는데 국내 기업에 더 강한 규제가 적용된다면 역차별이 될 수 있다"며 "AI 모델 경쟁이 심화되는 가운데 그래픽처리장치(GPU)와 학습 데이터 등 인프라 자원 확보가 기술 경쟁력으로 직결되기 때문에 신중한 규제나 가이드라인 제정이 필요하다"고 밝혔다. 그러면서 "단순히 빠르게 규칙을 정하는 데만 치중하지 말고 콘텐츠 기업·창작자·AI 기업이 함께 성장할 수 있는 방향으로 의견을 모아가면서 룰을 만들어가는 것이 필요하다"고 강조했다. 이러한 업계의 우려에 대해 개보위는 이날 저녁 공식적으로 반박했다. 우선 '정당한 이익'이라는 개념이 이미 전 세계적으로 확립된 적법 처리 근거로, 해외에서도 공개 데이터 처리에 법적으로 인정되고 있다는 것이다. 개보위 측은 "현재 프랑스에서는 지난해 10월부터 AI 학습 목적으로 개인정보 처리 시 '정당한 이익'이 인정되기 위한 기준을 제시한 바 있다"며 "마찬가지로 영국도 웹 스크래핑 수집 데이터를 생성 AI 학습에 사용하는 것을 두고 '정당한 이익'으로 인정된다고 밝혔다"고 주장했다. 또 개보위 측에 따르면 개인정보 처리의 목적·필요성·안전조치를 마련하는 것은 개인정보처리자의 기본 의무다. 이에 따라 안내서는 단순히 기업들이 '정당한 이익'을 적법 근거로 사용할 수 있도록 구체적 기준과 사례를 제시하는 목적으로 제작됐다는 것이다. 개보위 측은 "기업이 이를 준수하는 과정에서 일정 시간이 걸릴 수 있다"면서도 "그럼에도 이는 개인정보 보호의 기본적인 책임"이라고 강조했다. 개보위는 인허가 과정에 대한 우려도 일축했다. 기업들이 제기한 '인허가 과정'에 대한 우려는 사실과 다르며 정부는 어떠한 인허가 절차도 운영하지 않고 있다는 것이다. 이와 동시에 개보위는 AI 시대에 원칙 중심의 규율 체계를 정립하기 위해 노력 중이라는 점을 덧붙였다. 개보위 측은 "신기술 분야는 기술 발전 속도가 빠르기 때문에 안내서를 지속적으로 수정·보완할 예정"이라며 "그 과정에서 구속력 있는 법규의 필요성이 구체화되면 법 개정도 병행할 예정"이라고 밝혔다.

2024.10.02 19:08조이환

'챗GPT' 등 AI 개발엔진, '공개 데이터' 처리 기준 나왔다

정부가 생성형 인공지능(AI) 개발에 활용할 '인터넷상 공개 데이터'를 안전하게 처리할 수 있는 기준을 마련했다. 개인정보보호위원회는 AI 개발에 필수적인 공개 데이터가 현행 개인정보 규율체계 내에서 적법하고 안전하게 처리될 수 있도록 'AI 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 내놨다고 17일 밝혔다. 공개 데이터는 인터넷상 누구나 합법적으로 접근할 수 있는 데이터다. 오픈AI 챗GPT 등 생성형 AI 서비스 개발을 위한 엔진 역할을 맡는다. AI 기업들은 커먼크롤를 비롯한 위키백과, 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 방식으로 수집해 AI 학습데이터로 활용하고 있다. 이런 공개 데이터에는 주소, 고유식별번호, 신용카드번호 등 여러 개인정보가 포함될 수 있어 개인 프라이버시가 침해될 가능성이 있다. 그러나 현행 개인정보 보호법에는 공개된 개인정보 처리에 적용될 수 있는 명확한 기준이 없다. 예를 들어 AI 학습에 공개 데이터가 대규모 처리되는 상황에서 현행 보호법 상의 정보주체 개별 동의나 계약 체결 등의 조항을 적용하는 것은 어렵다. AI 학습이 전통적인 개인정보 처리방식과 다르기 때문이다. 이에 보호법상 안전성 확보조치 등 규정도 그대로 적용하는 것에 한계가 있다. 이로 인해 개인정보위는 공개된 개인정보 수집‧활용의 법적기준을 명확화하고 AI 개발 및 서비스 단계에서 어떤 안전조치를 취하는 것이 적정한지에 대해 기업이 참고할 수 있는 최소한의 기준을 제시하는 안내서를 이번에 마련했다. 공개된 개인정보를 활용하는 기업들이 개인정보 침해 이슈를 최소화하는 동시에 법적 불확실성을 해소할 목적이다. "공개 데이터 처리 기준, EU GDPR 등과 상호운용↑" 개인정보위는 국제적으로 상호운용성 있는 기준 마련에 집중했다는 입장이다. 유럽연합(EU)이나 미국 등 해외 주요국에서 공개 데이터 처리 기준에 대해 개인정보 보호 규율체계를 형성해 나가는 추세에 발맞추기 위해서다. 보호법 제15조에 따른 '정당한 이익' 조항에 의해 공개된 개인정보를 AI 학습·서비스 개발에 활용할 수 있다는 점도 분명히 했다. 또 이런 정당한 이익 조항이 적용되려면 AI 개발 목적의 정당성, 공개된 개인정보 처리의 필요성, 구체적 이익형량이라는 세 가지 요건을 충족해야 한다. 이번 안내서는 세 가지 요건과 적용사례도 포함했다. 개인정보위는 정당한 이익 조항의 합리적 해석기준을 마련하는 것은 EU 일반 개인정보보호법(EU GDPR)이나 AI 안전성 규범 논의 등 글로벌 기준과의 상호 운용성을 높이는 기회라고 강조했다. "기준 유연성도 높아…기업 정보보호책임자 역할 중요" 개인정보위는 안내서를 통해 AI 기업이 정당한 이익으로 공개된 개인정보를 처리할 때 필요한 기술적‧관리적 안전성 확보조치와 정보주체 권리보장 방안도 안내했다. 또 빠른 AI 기술변화 등을 고려해 세부적 안전조치 등을 유연하게 도입·시행할 수 있도록 설명했다. 다만 AI 기업이 모든 안전조치를 의무적으로 시행해야 하는 것은 아니다. 안내서에 제시된 여러 안전조치 순기능과 AI 성능저하, 편향성 등 부작용과 기술 성숙도를 고려함으로써 기업 특성에 맞는 '안전조치의 최적 조합'에 맞게 이행할 수 있다. 개인정보위는 안내서를 통해 AI 개발을 위한 학습데이터 처리와 관련한 AI 기업과 개인정보보호책임자(CPO) 역할을 강조했다. CPO를 구심점으로 하는 'AI 프라이버시 담당조직(가칭)'을 자율적으로 구성·운영하고 안내서에 따른 기준 충족 여부를 평가함으로써 그 근거를 작성‧보관하도록 권고했다. AI 성능 개선 등 중대한 기술적 변경이나 개인정보 침해 발생 우려 등 위험 요인을 주기적으로 모니터링하고, 개인정보 유·노출 등 침해사고 발생 시 신속한 권리구제 방안도 마련하도록 했다. 이번 안내서 관련 논의에 참여한 김병필 카이스트 교수 겸 민·관 정책협의회 데이터 처리기준 분과장은 "AI 기술이 빠르게 변화하는 만큼 향후 본 안내서에 포함된 내용도 지속적으로 발전해 나갈 것"이라고 강조했다. 민·관 정책협의회의 공동의장인 배경훈 LG AI연구원장은 "안내서가 AI 기술 개발 중 발생할 수 있는 법적 불확실성이 낮아졌다"며 "모두가 신뢰할 수 있는 데이터 처리 환경에서 AI 기술 혜택을 누릴 수 있을 것"이라고 전망했다. 고학수 개인정보위 위원장은 "AI 기술 진보가 빠르게 이뤄지고 있지만 AI 개발 핵심 관건인 공개 데이터 학습이 보호법에 적법하고 안전한지 확인할 수 없었다"며 "이번 안내서를 통해 모두 신뢰하는 AI·데이터 처리 관행을 기업 스스로 만들어 나가길 바란다"고 말했다.

2024.07.17 14:00김미정