• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'익명'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"익명성 없으면 데이터는 언제 터질지 모르는 시한폭탄"

"익명성이 없다면 데이터는 언제 터질지 모르는 시한폭탄일 뿐입니다. 대한민국이 AI 강국과 데이터 강국이 되려면 국가익명정보 인증센터를 세워 익명정보를 활성화해야 합니다. 금모으기를 한 것처럼 국가가 나서 익명데이터를 모으면 세계적인 데이터강국이 될 수 있습니다." 이원석 연세대 교수(인공지능대학 컴퓨터과학과)는 2일 국회서 열린 AI강국을 위한 개인정보 활용 방안 세미나에서 기조연설자로 나와 "데이터는 21세기의 원유고 미래 경쟁 우위를 좌우한다. 그런데 우리나라에서는 지난 15년간 이 말이 유효하지 않았다"며 이 같이 주장했다. 이날 행사는 국민의힘 최보윤 의원과 김장겸 의원이 주최하고 의원연구단체인 AI와 우리 미래가 주관했다. 후원은 미디어미래비전포럼이 했다. 이 교수는 중국AI 딥시크 거론으로 강연을 시작했다. 중국 AI스타트업이 만든 딥시크는 중국의 AI굴기를 잘 보여준 사건으로, 중국 개발자들은 우리와 달리 데이터 활용이 무제한으로 알려져 있다. 우리나라는 데이터 경제 활성화를 위해 지난 2020년 1월 데이터 3법을 국회서 통과시켰고, 공공데이터 개방도 2013년부터 10여년간 추진하고 있지만 이걸로는 역부족이라는게 이 교수 진단이다. 특히 그는 정부가 확산을 추진하고 있는 가명정보에 대해 우려를 표명하며 한계점을 지적했다 . "가명정보는 거의 원본이랑 똑같다. 그래서 많은 보호를 해야 쓸 수 있다. 데이터간 결합이 안돼 융합 데이터를 만들 수도 없다. 여기에 결합 이슈로 들어가면 개인정보보호가 튀어나오게 돼있다. 또 활용을 하려면 비용이 많이 들고, 기간도 3개월에서 12개월이 걸린다. 여기에 가명데이터 결합은 5년 이내에 폐기를 해야 한다. 이러니 가명데이터는 상업적 목적의 데이터가 될 수 없고 활성화에 한계가 있다. 최근 몇년간 정부가 경진대회를 여는 등 가명정보 확산을 위해 노력해 왔지만 아직도 자리를 못잡은 이유"라고 짚었다. 가명정보는 개인을 직접 식별할 수 없게 처리된 정보이지만, 다른 정보와 결합하면 식별이 가능한 정보를 말한다. 예를 들어, 이름이나 주민등록번호 등 특정한 식별 요소는 삭제하거나 수정했지만, 특정 알고리즘을 통해 원래 상태로 복원이 가능한 데이터가 여기에 해당한다. 가명정보는 통계 작성, 과학적 연구, 공익적 기록 보존 등의 목적을 위해서는 정보 주체 동의 없이도 사용할 수 있다. 반면 익명정보는 어떠한 경우도 특정 개인을 식별할 수 없게 완전히 비식별화한 정보를 말한다. 가명정보와 달리, 다른 정보와 결합해도 재식별이 불가능하다. 이에, 익명정보는 개인정보 보호법의 적용을 받지 않으며, 자유롭게 활용할 수 있다. 이 교수는 미국, 중국과 달리 우리나라는 원본데이터 이용이 불가능하다면서 "그래서 개인정보보호위원회에서 관리를 하고 있고, 사전동의를 받아야 하고 이를 어기면 형사 처리 대상이다. 그런데 누가 쓰려하겠나. 미국은 그렇지 않다. 시장에서 데이터를 거래하고, 또 위반해도 형사가 아닌 민사 사범"이라고 들려줬다. 이어 우리나라 데이터 정책에 대해 "미국과 중국의 길이 아닌 우리만의, 제 3의 길을 가야한다"면서 그 길이 가명데이터와 함께 익명데이터를 사용하는 것이라고 강조했다. 모 언론이 2024년 10월 보도한 바에 따르면, 가명정보 결합 전문기관 취소가 잇달았는데, 그 이유는 복잡한 과정과 규제로 가명정보를 결합할 수요가 없었기 때문이다. 이를 예로든 이 교수는 "이처럼 가명정보는 한계가 있다. 이제는 익명데이터도 쓸 수 있게 정부가 나서야 한다"고 제안했다. 이어 우리나라는 산업 목적의 데이터가 없다면서 "이를 해결하는 유일한 방법이 익명 정보고, 기술은 이미 다 있다. 우리가 알을 깨고 나가는 강심장만 있으면 된다. 여태 미국걸 벤치마킹하고 따라갔는데, 이 길만은 우리가 스스로 가야한다"고 목소리를 높였다. 이 교수는 데이터를 산업목적에 자유롭게 쓰려면 딱 두 가지 조건만 있으면 된다고 밝혔다. 하나는 익명성을 검증하는 거고, 다른 하나는 결합이 가능해야 한다. 검증과 관련 이 교수는 "국가가 해야 한다"면서 국가익명정보인증센터 설립 필요성을 재차 강조하며 "익명기술을 열면 우리가 세계 1등 익명 정보 기술국가가 될 수 있다"고 역설했다. 익명데이터 검증 필요성을 그는 복어로 비유했다. 복어는 잘못 먹으면 죽는 어종인데, 장기 내부의 독소 부분만 빼내면 맛있는 요리가 된다. 마찬가지로 익명데이터가 안전하다는 검증을 국가가 인증센터를 설립해 해주면 이 데이터가 산업으로 흘러들어가 데이터 강국, AI강국이 될 수 있다는 것이다. 독을 빼내는 것과 관련해서는 "이미 유럽이 만든 지표(GDPR 4대 익명서 검증)가 있다. 이걸 차용하면 된다"면서 "유럽은 법은 있지만 IT가 뒤져 잘 안되다. 우리와 반대다"고 덧붙였다.

2025.04.02 23:58방은주

업무 시간에 골프, 익명제보 할까 말까...백팀 답은?

직장 내에는 세대·가치관·입장 차 등 다양한 이유로 갈등이 발생합니다. 그 때 그 때 멘토가 필요한 순간들이 많습니다. 이에 '흑백HRer: 오피스 멘토 대전' 코너를 통해 국내 HR 전문 기업 내 멘토들이 하나의 질문을 두고 각자의 '특급 솔루션'을 제안합니다. 흑vs백 2명의 전문가 의견을 꼼꼼히 비교해본 뒤, 더 와닿는 글에 추천과 댓글로 응원해주세요. 가장 많은 공감을 받은 우승 기업에게는 '최고의 HRer' 수상의 영예가 주어집니다.[편집자 주] □ 멘티가 멘토에게 ☞회사 동료가 회사 시스템의 허점을 이용해 근무시간에 2~3시간 정도 외부에서 운동을 하는 것을 우연히 목격했습니다. 이 같은 문제가 1년 이상 지속되고 있습니다. 상대적 박탈감(?)에 익명 제보 할까 합니다. 그런데 우선 사내 제보 시스템의 익명 유지가 보장될지 걱정이고, 한편으론 그래도 동료를 제보한다는 껄끄러운 마음이 듭니다. 어떻게 하는 게 좋을까요. □ 백팀(인크루트) 멘토가 멘티에게 ☞'조용한 휴가'란 정상 근무일이지만 일하는 시늉만 하고 업무 시간에 몰래 개인 볼일을 보면서 소극적인 업무 태도를 취하는 것을 말합니다. 지난해 인크루트가 직장인 851명을 대상으로 '조용한 휴가'에 대한 설문 조사를 한 결과, 절반 이상인 56.3%가 '조용한 휴가를 활용한 적이 있다'고 응답했습니다. 또 '조용한 휴가'를 활용했다는 응답자들의 32.4%는 독서, 운동 등 취미 생활을 했다고 말했습니다. 근무 시간임에도 불구하고 회사의 눈을 피해 개인 볼일을 보는 직장인들이 꽤 있는 것으로 나타났는데요. 사연 속의 동료분도 자체적으로 '조용한 휴가'를 즐기고 있는 듯합니다. 회사 동료가 근무 시간에 개인 볼일을 보는 것을 우연히 알게 됐고, 심지어 그게 1년이나 지속됐다면 문제 제기의 필요성이 들 것입니다. 제보를 하기 전 몇 가지 점검해야 할 사안이 있습니다. 첫째로 제보에 대한 동기입니다. 언급하신 '상대적 박탈감'은 제보를 시작하기엔 감정 중심의 동기입니다. 특히 익명 유지 여부와 향후 껄끄러워질 대인 관계를 걱정한다면 말이죠. 당연히 '조용한 휴가'에 대한 인식은 좋지 않습니다. '조용한 휴가'를 활용하지 않은 직장인의 47%가 '부정적'이라 답했습니다. 특히 전체 응답자의 53.9%는 회사의 생산성 하락에 영향이 있을 것이라 답했습니다. 이처럼 근무 시간에 집중하지 않는 행위는 조직의 기강 해이와 함께 더 나아가 회사의 생산성 하락까지 영향을 미칠 수 있는 사안입니다. 따라서 감정적인 동기보다 동료분의 일탈이 회사 전체에 미칠 부정적 영향을 객관적으로 파악해 보세요. 이에 인사팀이나 관리자들이 얼마만큼 이해할 것인가를 생각해본다면 제보에 힘이 더 실릴 것입니다. 둘째는 정확한 상황 파악입니다. 동료가 2~3시간 동안 업무시간에 자신의 개인적 볼일을 보는 일이 과연 개인의 일탈인지, 아님 사측과 협의가 된 상황인지 파악하는 겁니다. 혹은 공식적인 협의는 아니지만 직무의 성향에 따라 근무 시간임에도 어느 정도의 일탈은 눈 감아 주는 분위기인지를 파악해 보세요. 회사 내부 규정, 팀의 특성, 조직의 분위기 등을 살펴봤을 때 개인의 일탈이 확실하다면, 그 때 움직이는 것이 좋습니다. 셋째는 사연자분이 언급하신 사내의 '시스템의 허점'이 무엇인지 파악하는 것입니다. 만약 '시스템의 허점'이 사연자분에게 악영향을 주는 사안이라면, 이 점을 지적할 필요가 있습니다. 예를 들어 동료의 부재로 인해 사연자분에게 과도한 업무가 부담이 된다면, 팀 내 관리자에게 R&R 조정을 요구하는 겁니다. 동료와 협업하는 팀이라면 소통이 잘 되지 않는다는 점을 어필할 필요가 있습니다. 즉 '00팀 A씨가 근무 시간에 운동을 하더라' 보다는 동료의 업무 중 일탈이 사연자님에게 미치는 부정적 영향을 판단, 그것을 해결해 줄 수 있는 쪽으로 접근하는 것을 추천합니다. 타인의 행동을 지적하는 대신, 현재 내가 처한 상황의 불합리함을 지적하면서 사내 시스템의 허점을 고칠 수 있는 쪽으로 유도하는 거죠. 그렇다면 자연스럽게 동료의 개인 일탈이 멈추게 될지도 모릅니다. 마지막으로 그럼에도 불구하고 제보를 하시겠다면 사내 제보 시스템의 익명성 여부는 믿되, 동료와의 관계가 변할 수도 있다는 점을 명심하세요. 일단 표면상은 '익명'이니, 혹시나 사연자님의 면담 과정에서 동료의 일탈 여부가 도마에 오르더라도 모르는 척 하시는 게 좋습니다. 그럼에도 불구하고 제보 사실이 알려진다면, 안타깝지만 동료와의 관계 악화는 피할 수 없을 것 같습니다. 이 과정에서 얻는 것과 잃는 것에 대한 균형을 잘 생각해 보세요. 얻고 싶은 것이 있다면, 그 과정에서 잃어야 할 것이 있으니깐요. ■ 같은 질문에 대한 흑팀(진학사 캐치) 솔루션 보러 가는 법 네이버 뉴스일 경우 본문 하단 'ZDNET KOREA 주요뉴스' 목록 중 흑팀 기사 클릭 지디넷코리아 기사일 경우 위 '관련 기사' 목록 중 흑팀 기사 클릭 Daum 뉴스일 경우 본문 하단 '지디넷코리아에서 직접 확인하세요' 중 흑팀 기사 클릭 이 글은 회사가 아닌 개인의 의견입니다. 기획 취지를 고려한 긍정적인 피드백(추천/댓글) 부탁드립니다. HR전문가들의 멘토링이 필요한 직장 내 고민(사연)은 paikshow@zdnet.co.kr로 보내주세요.

2025.02.22 08:00정화식

美 청소년, 익명 질문 앱 'NGL' 이용 못 한다

익명 질문 앱 NGL이 미국 미성년자를 대상으로 서비스를 운영하지 못하게 됐다. 10일(현지시간) 테크크런치 등 외신에 따르면, 미국 연방거래위원회(FTC)는 NGL에게 18세 미만 이용자를 대상으로 한 서비스 제공 및 앱 광고를 금지했다. 연방거래위원회가 앱에게 미성년자 서비스 금지 조치를 내린 첫 사례다. NGL은 이용자가 인스타그램 스토리 등 소셜 미디어 플랫폼에 자신의 링크를 게시하면 다른 이용자들이 접속해 익명의 질문을 보낼 수 있는 시스템이다. 익명의 힘을 빌려 솔직한 의견을 공유하고 싶어 하는 미성년자들에게 인기를 얻어 왔다. 이번 조치는 NGL이 미성년자 사이 발생하는 사이버 폭력을 방관한다는 문제 제기에서 비롯됐다. NGL은 일부 미성년자들이 괴롭힘 표적인 또래 이용자의 NGL 링크에 접속해 비속어 질문을 보내는 등 사이버 폭력의 수단으로 악용돼왔다. NGL 제작사 NGL랩스는 인공지능(AI)를 통해 콘텐츠를 검토하고 사이버 폭력을 방지했다고 주장했지만, FTC는 이를 인정하지 않았다. 리나 칸 FTC 위원장은 이날 보도자료를 통해 "NGL은 사이버 폭력이 발생한다는 사실을 알면서도 어린이와 청소년에게 앱을 마케팅했다"며 "NGL이 미성년자의 안전을 무모하게 무시했기 때문에, FTC는 NGL이 미성년자에게 앱을 마케팅하거나 제공하는 것을 금지할 것"이라고 밝혔다.

2024.07.11 10:44조수민

[이원석 교수의 익명정보 ⑤끝] '데이터 트윈' 기반 '지능화 사회' 구현해야

증기기관 발명으로 시작한 산업화가 불러온 풍경이 있다. 모두가 같은 대중 방송을 보고 기성복을 입는다. 소위 대중사회를 만들었다. 반면 컴퓨터 발명으로 시작한 정보화는 개인이 모든 생활과 업무를 가상공간에서 시간과 공간 제약 없이 영위하는 정보사회를 실현했다. 스마트 폰 보편화로 개인 가치와 개성을 중시하는 개인 사회가 됐다. 컴퓨터는 개인의 모든 행적을 가상공간에 데이터로 기록한다. 이 기록이 21세기 원유인 원천데이터 자원이다. 개인이나 국가 모두 이 원천데이터를 잘 활용해야 인공지능(AI)이 주도하는 지능화 시대의 승자가 될 수 있다. 지능화란 무엇일까? 산업화는 형체가 있는 물체를 만들고, 정보화는 형체가 없는 알고리듬을 만든다. 컴퓨터 하드웨어는 형체가 있는 고체고, 소프트웨어는 형체가 없는 유체다. 데이터는 개인이 생활이나 업무에 컴퓨터를 이용하면서 남긴 기체다. 즉 데이터는 유리컵에 담긴 콜라를 마신 개인의 느낌이다. 대부분 시원하다고 하지만 탄산이 싫다고 하는 개인도 있다. 같은 개인이라도 콜라를 마신 상황에 따라 다르게 느낀다. 느낌에 정답이 없듯이 지능화는 데이터로 개인 상황과 취향에 따라 최적의 초개인화 서비스를 제공해야 한다. ■ "지능화는 연구개발 및 업무 적용(R&DB) 방식으로 수행해야" 산업화와 정보화는 연구개발(R&D)로 대중을 위한 기술을 만들었다. 반면 지능화는 개인의 생활과 업무 데이터를 AI 빅데이터 기술로 학습해 개인 취향에 가장 적합한 최적 서비스를 자율 지능사물을 통해 전달해야 한다. 따라서 지능화 연구개발은 실제 개인 업무와 생활 데이터를 결합해야 하고, 또 서비스가 얼마나 유용한지 실제 환경에 적용해야 한다. 즉, 지능화는 연구개발 및 업무 적용(R&DB) 방식으로 수행해야 하는 것이다. 우리는 개인 업무나 생활 데이터를 이용할 수 없다. 이에, 지난 10년간 개인정보보호법에 막혀 우리는 미국 및 중국과의 지능화 연구 경쟁에 뒤져 있다. 그래서 우리나라에서는 '축구의 손흥민'에 비교할 수 있는 '국제 데이터 분석가'가 나올 수 없다. 동네 축구가 없어서다. 21세기 원유인 방대한 원천데이터 자원을 창고 깊이 숨겨 놓고 우리는 책으로 배운 이론만 연구실에서 연마하고 있다. 어렵게 구한 가명정보만 이용하는 우리 현실이 안타까울 뿐이다. 현재 우리가 개인 동의 없이 합법적으로 이용할 수 있는 데이터는 가명정보 외에 익명정보도 있다. 이 두 정보를 상호 보완적으로 이용하는 '데이터 트윈' 체계가 필요하다. 즉, 먼저 고순도 익명정보로 자유롭게 이용할 수 있는 '공연계'에서 분석 목표를 기획해 빠르게 1단계 분석 모델을 만들고 데이터 R&DB로 검증한다. 이어 이 분석 결과가 성공적일 때 가명정보를 이용해 최종적으로 이 분석 모델을 검증하는 식이다. 야구 선수가 타율 3할이면 잘한다고 한다. 분석가도 마찬가지다. 10번 익명정보로 분석해 성공한 3개의 분석 모델만 가명정보로 검증하는 '데이터 트윈' 방식은 비용과 시간, 불필요한 서약 등을 최소화하는 우리 현실에 가장 적합한 분석 체계다. ■ "90년대 구축 국가 정보고속도로 정보화 강국 만들어...국가 차원 익명정보 기술 개발 주도해야" 경부고속도로는 빠른 물류 유통으로 우리 산업화를 성공시켰다. 또 90년대 구축한 국가 정보고속도로는 우리를 정보화 강국으로 만들었다. 이제 뒤처진 AI 국가경쟁력을 되찾기 위해서는 국가 데이터고속도로를 구축해야 한다. 국가 차원에서 익명정보 기술 개발을 주도해 개인정보를 완벽히 보호하면서 사회 모든 분야에서 활용성이 높은 고순도 익명정보를 양산해 신속히 결합하는 것이다. 5차원 데이터 고속도로라면 가장 안쪽 1차선은 공익 목적의 가명정보를 결합하는 버스전용차선이다. 나머지 차선은 저순도와 고순도 익명정보를 익명결합하는 차선이다. 최근 챗GPT와 휴머노이드 자율로봇 등 인간을 대체하는 AI 기술이 인간의 직업을 뺏어간다고 우려한다. 하지만 우려하지 않아도 된다. 합계 출산율 0.7인 우리에겐 오히려 축복이다. 국가 데이터고속도로를 구축하려면 데이터 트윈 체계, 데이터 R&DB에 관련한 다양한 직무와 직종이 필요하기 때문이다. 예를 들면 데이터 상품 기획, 익명정보 가공 & 생산, 데이터 정밀지도, 자율사물 강습자 등이다. 과거 정보고속도로로 생긴 정보화 일자리를 생각하면 된다. 산업화와 정보화를 성공적으로 실현한 우리는 지능화에도 막대한 잠재력이 있다. 지금의 어려움을 현명하게 돌파해 지능화까지 성공하면 다양한 자율 지능사물이 언제 어디서나 모든 개인에게 초개인화 서비스를 실시간으로 제공하는 최적화 사회를 세계서 우리나라가 가장 먼저 실현할 것이다. ◆필자 이원석 연세대 컴퓨터과학과 교수는... 미국 보스턴대학(Boston University)에서 컴퓨터공학 학사를 받고 미국 퍼듀대에서 컴퓨터공학 석사, 박사 학위를 받았다. 삼성전자에서 1년간 선임연구원으로 일했고, 1993년부터 현재까지 연세대학교 컴퓨터과학과 교수로 근무하고 있다. 연세대 교수로 재직한 지난 30년간 데이터 분야에서 활발한 교육과 첨단 연구를 해왔다. 80여건의 데이터 관련 첨단 연구과제를 수행을 하면서 데이터 분야에서 54건의 SCI급 국제 논문을 발표했다. 또 57편의 국내 논문과 174편의 국내 학술대회 논문도 발표했다. 연세대에 재직하며 170명의 석사와 22명의 박사를 배출했다. 2005년에는 산업자원부 지정 최우수실험실로 선정됐다. 1년 뒤인 2006년에는 과학기술정보통신부지정 국가지정연구실(NRL)에도 이름을 올렸다. 2011년에는 대통령소속 국가정보화 전략위원회 실무위원으로 활동했고, 이 해 11월 국가정보화위원회의 청와대 보고에서 국가차원의 빅데이터 활용을 담은 공공 빅데이터 기본계획을 수립하고 발표하는데 큰 역할을 했다. 2012년부터 한국빅데이터포럼 운영위원장을 맡아 민간 빅데이터 활용을 위한 다양한 활동을 했고, 2013년부터 공공데이터 전략위원회의 빅데이터 전문위원장으로 6년간 일했다. 최근에는 개인정보보호위원회의 제도발전위원으로도 활동했다.

2024.03.30 18:38이원석

[이원석 교수의 익명정보④] 현업에 데이터 이용 날개 달아주려면

예전엔 정보화가 유행이였다. 정보화란 무엇일까. 산업화 시대의 업무처리 방식을 컴퓨터로 개선하는 과정이다. 업무프로세스 재설계(BPR)라는 것도 있다. 이는 기관의 과거 업무 흐름을 컴퓨터로 할 수 있는 방식으로 재설계한 걸 말한다. 또 BPR과 연관성이 높은 정보화전략계획(ISP)은 재설계한 업무 흐름을 구동할 수 있는 정보시스템 구축 방법과 예산을 산정하는 것이다. 이 둘을 기반으로 기관의 정보화 청사진을 완료한 후 실제 정보시스템을 구축한다. 우리나라는 모든 업무를 인터넷으로 수행하는 성숙한 정보사회를 실현했다. '육지'에서만 살던 국민이 정보화를 통해 가상공간인 '하늘'을 만들었다. 업무를 수행하는 정보시스템을 운영계라 한다. 운영계에는 매일 많은 양의 이용 내역 원천데이터가 쌓인다. 이들 과거 원천데이터를 모아 놓은 곳을 데이터 창고라 한다. 이 데이터 창고를 이용해 기업 전략이나 업무 효과를 분석하는 정보시스템을 분석계라하고, '지능화'는 분석계 시스템에서 AI와 빅데이터 기술을 적용해 새로운 인사이트를 찾거나 AI 자율 지능사물을 만드는 걸 말한다. 정보화와 지능화는 과정과 지향점이 다르다. 정보화는 명확한 목표를 먼저 세우고 전체 업무를 대상으로 진행한다. 반면 지능화는 개별 업무의 과거 데이터에 AI와 빅데이터 기술을 적용해 더 좋은 업무 방식을 찾아 개선하는 것이다. 이 둘을 미술에 비유하면, 정보화는 전체를 한꺼번에 만드는 조각이고, 지능화는 부분을 따로 만들어 취합하는 소조다. 우리나라는 법으로 원천데이터 접근을 엄격히 제한한다. 이에, IT 운영부서는 운영계와 데이터 창고에 있는 원천데이터를 보호할 책임을 갖는다. 현업 담당자는 데이터 창고에 직접 접근할 수 없다. 데이터가 있는 '하늘'을 한번 보려면 보안 서약을 하고 IT 운영부서와 법무팀 등 여러 단계의 결재를 거쳐 가명정보를 받아 사용한다. 이 부분이 우리 지능화의 동맥경화 지점이다. 데이터가 있는 '하늘'을 직접 못 보는데 어디에 '별'이 있는지 알 수 있을까? 지능화 시대에서는 협업 등 모든 직원이 데이터를 활용해야 한다. 이 구조적인 문제를 해결하지 않고는 우리 지능화의 미래는 없다. 하늘을 직접 보는 것이 위험해 불가능하다면 안전한 '보안경'을 쓰고 보자. 그 것이 바로 익명정보다. 데이터 창고에서 핵심 원천데이터를 뽑아 고순도 익명정보로 만들어 모든 직원이 서약 없이 자유롭게 접근할 수 있는 익명정보 창고에 넣자. 이 창고가 '공연계'이다. 이렇게 하면 현업 담당자는 잠재적 범죄자가 될 각오로 보안 서약을 할 필요가 없어진다. 자신의 데이터 활용 결과가 꼭 성공해야 한다는 부담 없이 데이터 창고에 자유롭게 접근할 수 있는 것이다. 고순도 익명정보 재료의 재질을 만져보고 붙이면서 다양한 시도를 통해 창의적인 소조 조형물을 만드는 곳이다. 과거 AI 빅데이터 분석 보고서와 결과를 참고해 담당 업무의 지능화를 지속해서 향상시키는 장소이기도 하다. 산업화 시대의 지식 공유 공간은 도서관이다. 하지만 정보화 시대는 정보포털이고, 지능화 시대에서는 회사의 핵심 데이터를 공유하는 데이터관이 필요하다. 이곳이 '공연계'다. 정보화 시대에는 컴퓨터를 쓰지 못하면 '컴맹'이라 불렸다. 지능화 시대에 데이터를 활용하지 못하면 '데맹'이다. 디지털 전환 작업의 시작은 모든 현업 담당자에게 데이터 활용 교육을 제공하는 것이다. 비전공자에게 분석 기술 이론만 교육하는 건 효과가 떨어진다. 업무 도메인을 잘 이해하는 현업 담당자에게는 '공연계'에 있는 회사의 익명정보를 이용해 교육하는 것이 매우 효과적이다. 교육후에는 '공연계' 업무 데이터를 계속 이용해 지속해서 활용 능력을 향상할 수 있다. '지능화'는 컴퓨터를 이용한 혁신이 아니라 데이터를 이용한 혁신이다. 개별 업무에서 발생한 과거 데이터를 이용해 현업 담당자가 해당 업무를 AI/빅데이터 기술로 지능화하면서 회사 전체 업무를 최적화하는 과정이다. 세계 최강인 미국은 우리와 데이터 환경이 다르다. 현업 담당자의 데이터에 대한 법적 접근성이 높아 '공연계'가 필요 없다. 데이터가 중심이 아닌 BPR과 ISP는 '반쪽'이다. 지능화 시대를 제대로 설계하지 못하기 때문이다. 우리의 '지능화' 설계도는 국내 개인정보보호법을 중심으로 개인정보 보호와 활용을 엄격히 구분해야 한다. '운영계'와 데이터 창고에 있는 원천데이터를 완벽히 보호하는 한편 '공연계'를 중심으로 AI 학습용과 분석용 익명정보 활용성을 높이는 전사 차원의 데이터 거버넌스 체계를 확립하는 '데이터전략계획(DSP)'이 현재 우리에게 필요하다. DSP가 없는 현재의 데이터 정책으로는 데이터와 AI강국이 될 수 없다. 익명 정보 기반의 DSP가 있어야 현업 담당자와 지능 자율사물간 최적 협업 방식을 자유롭게 설계하는 업무프로세스 최적화(BPO) 과정이 가능하다. ◆필자 이원석 연세대 컴퓨터과학과 교수는... 미국 보스턴대학(Boston University)에서 컴퓨터공학으로 학부를 졸업했다. 석사와 박사는 미국 퍼듀대학에서 컴퓨터공학으로 학위를 받았다. 삼성전자에서 1년간 선임연구원으로 일했고 1993년부터 현재까지 연세대학교 컴퓨터과학과 교수로 재직하고 있다. 지난 30년간 대학에 있으며 80여건의 데이터 관련 첨단 연구과제를 수행하며 데이터 분야에서 54건의 SCI급 국제 논문을 발표했다. 또 57편 국내 논문과 174편 국내 학술대회 논문도 발표했다. 그동안 170명의 석사와 22명의 박사를 배출했다. 2005년 산업자원부 지정 최우수실험실로 뽑혔고, 2006년에는 과학기술부지정 국가지정연구실(NRL)에도 선정됐다. 2011년에는 대통령소속 국가정보화 전략위원회 실무위원으로 활동했고 같은 해 11월 국가정보화위원회의 청와대 보고에서 국가 차원의 빅데이터 활용을 담은 공공 빅데이터 기본계획을 수립하는데 기여했다. 2012년 한국빅데이터포럼 운영위원장을 맡아 민간 빅데이터 활용을 위한 다양한 활동을했고, 2013년에는 공공데이터 전략위원회 빅데이터 전문위원장에 선임돼 6년간 활동했다. 최근에는 개인정보보호위원회의 제도발전위원으로 일했다.

2024.03.23 15:54이원석

[이원석 교수의 익명정보③] 복어와 익명정보···신기술로 신세계 열어야

아직 일반인에 생소한 '익명정보'를 개인정보보호위원회(개보위)는 어떻게 생각할까. 개보위는 '익명정보'를 '시간·비용·기술 등을 합리적으로 고려할 때 다른 정보를 사용해도 더 이상 개인을 알아볼 수 없는 정보'라고 정의한다. 유럽 개인정보보호법(GDPR)은 보다 구체적이다. 익명정보 요건으로 ➀개별화 배제 ②구별 가능성 배제 ③추론 가능성 배제 ④연결 가능성 배제를 제시했다. 이 요건을 모두 만족하는 익명정보는 개인 동의 없이 법적으로 자유롭게 제 3자에게 제공할 수 있다. 필자는 익명정보가 기업의 기밀정보 유출이나 저작권 문제를 해소할 수 있다고 생각한다. 통계데이터는 순도가 매우 낮은 익명정보다. 통계처리 기준 범위를 작게 할수록 순도가 높은 익명정보로 가공된다. 그 기준을 계속 작게 하면 어느 순간 대상 원천데이터에 있는 개인이 식별되는 임계점에 도달한다. 이 임계점이 가명정보와 익명정보의 경계선이다. 이 선에 가장 근접한 익명정보가 순도가 가장 높다. 따라서 모든 원천데이터는 예외 없이 고순도 익명정보로 가공할 수 있다. AI·빅데이터 산업을 주도하는 미국과 중국은 원천데이터를 그대로 사용해 고순도 익명정보 기술을 개발할 필요가 없다. 우리는 그렇지 않기에 우리 스스로 고순도 익명정보를 만들어야 한다. 이미 고순도 익명정보를 만드는 기술은 존재한다. 복어는 독을 제거하지 않고 먹을 때 사망할 수 있는 무서운 먹거리다. 복어를 데이터와 비교하면, 원천데이터에 있는 민감한 개인정보는 복어의 독과 같다. 또 복어 내장은 주민번호나 전화번호같은 개인식별자로 이는 개인의 본명에 해당한다. 복어 살은 개인의 정보시스템 이용 내역이다. 학급의 중간고사 성적표를 복어에 비유하면 학번은 복어 내장인 개인식별자이고, 점수는 복어 살에 해당하는 정보시스템 이용 내역이다. 익명처리 기본 원칙은 원본 값에 대한 중복성과 상이성을 보장하는 것이다. 홍길동을 포함해 여러 학생들의 사회 점수가 중복해서 모두 75점이라면, 성적표에서 사회 점수로만으로는 홍길동 레코드를 구별할 수 없다. 만약 홍길동만 혼자 75점이라면 이 정보를 이미 알고 있는 사람은 성적표에서 홍길동의 레코드을 특정할 수 있다. 이런 경우가 GDPR의 개별화다. 개별화 배제를 위해 홍길동의 점수를 원래 성적과 상이하게 73점으로 가공하면 홍길동 레코드를 특정할 수 없지만 추론할 수 있다. 만약 70점으로 가공하면 홍길동 레코드로 추론하는 강도는 낮게 된다. 이렇게 인위적으로 원본 이용 내역과 상이한 값으로 정밀하게 가공하면 복어 살에서 피를 제거한 것과 같은 고순도 익명정보를 만들 수 있다. 복어 내장인 개인식별자를 가명으로 작명하면 가명식별자가 되고, 익명으로 작명하면 익명식별자가 된다. 한 개인식별자 값에 대해 많은 수의 상이한 익명식별자 값을 만들면 개별화 배제를 보장할 수 있다. 또 2명 이상의 다른 개인식별자 값들에 대해 하나의 익명식별자 값을 중복시켜 구별 가능성 배제를 보장하기도 한다. 이에, 익명식별자 값만으로는 해당 개인을 특정할 수 없다. 익명결합은 두 익명식별자 값 쌍에서 동일인일 신뢰도가 높을 때 두 익명식별자 값 쌍을 결합한다. 이때 서로 다른 두 익명식별자 값으로 결합하므로 GDPR의 연결 가능성 배제 원칙을 충족한다. 뿐만아니라 익명식별자 값은 데이터 판매자가 독자적으로 생성해 가명을 작명하지 않기 때문에 공인 결합 전문기관이 필요 없다. 판매자는 하나의 원천데이터를 중복성과 상이성 정도를 다르게 가공해 익명성과 활용성 수준을 차별화한 익명정보 제품군을 매장에 전시한다. 구매자는 여러 판매자의 다양한 제품을 실제로 보고 익명결합을 통해 비교, 자신에게 효용성이 높은 제품을 구매한다. 선진 데이터 유통 체계를 실현하는 것이다. 그럼 복어의 피를 얼마나 빼야 안전한 고순도 익명정보일까? 개인정보보호위원회는 익명정보는 개인정보가 아니므로 자유롭게 사용할 수 있다고만 한다. 익명정보에 대한 정확한 기준을 정해주지 않는다. 이미 국내 기술로 고순도 익명처리 기술을 개발했지만 아직 사용하지 못하고 있는 이유다. 규제 당국의 명확한 기준 없이 개별 회사가 임의로 익명정보를 정의하고 사용하는 것은 우리 법체계 안에서 불가능하다. 국가 차원에서 다양한 레벨의 고순도 익명정보 인증 기준을 만들어 공표해야 한다. 우리의 AI 빅데이터 산업은 미국과 경쟁할 충분한 잠재력이 있다. 미국을 따라가지 않고 우리의 첨단 기술로 우리만의 길을 개척할 때 AI 빅데이터 시대를 선도할 수 있다. ◆이원석 교수는 누구? 미국 보스턴대학(Boston University)에서 컴퓨터공학 학사를 받고 미국 퍼듀대에서 컴퓨터공학 석사, 박사 학위를 받았다. 삼성전자에서 1년간 선임연구원으로 일하다 1993년부터 현재까지 연세대학교 컴퓨터과학과 교수로 일하고 있다. 연세대 교수로 재직하며 지난 30년간 데이터 분야에서 활발한 교육과 첨단 연구를 해오고 있다. 80여건의 데이터 관련 첨단 연구과제를 수행했고, 데이터 분야에서 54건 SCI급 국제 논문을 발표했다. 또 57편 국내 논문과 174편 국내 학술대회 논문을 발표했다. 연세대 재직기간중 170명의 석사와 22명의 박사를 배출했다. 2005년 산업자원부 지정 최우수실험실로 뽑혔고 2006년에는 과학기술부지정 국가지정연구실(NRL)로 지정됐다. 2011년 대통령소속 국가정보화 전략위원회 실무위원으로 활동하면서 같은해 11월 국가정보화위원회의 청와대 보고에서 국가차원 빅데이터 활용을 담은 공공 빅데이터 기본계획을 수립하고 발표하는데 기여했다. 2012년부터는 한국빅데이터포럼 운영위원장을 맡아 민간 빅데이터 활용을 위한 다양한 활동을 했고 2013년부터 공공데이터 전략위원회의 빅데이터 전문위원장으로 6년간 활동하기도 했다. 최근 개인정보보호위원회의 제도발전위원으로도 일했다.

2024.03.16 15:00이원석

[이원석 교수의 익명정보②] 마이데이터와 가명정보는 '잘못된 만남'

유럽연합은 지난 2018년 자국 시장의 국가 차원 데이터 주도권 회복을 위해 강력한 개인정보보호법(GDPR, General Data Protection Regulation)을 시행했다. 정보 주체에게 정보삭제권과 정보처리 반대권, 정보이동권 등 다양한 자기 결정권을 법제화했다. GDPR에서 원천데이터 자원을 개인 동의 없이 합법적으로 활용하려면 '가명정보'나 '익명정보'로 가공해야 한다. 본명을 가명으로 가공하는 가명정보는 개인 식별이 가능한 고순도 원천데이터 자원이다. 따라서 기록보전이나 통계작성, 과학적 연구 목적에만 사용할 수 있다. 과학적 연구는 대출 신용도 연구와 같이 광범위한 분야에서 데이터를 활용한 연구다. 또 가명정보는 단순한 가공으로 생성할 수 있어 고도의 기술이 필요없다. 하지만 제약이 있다. 개인 식별이 가능해 법적으로 엄격한 보호 조치와 함께 사용해야 하는 것이다. 반면 익명정보는 이런 제약에서 자유롭다. 가공한 개인을 식별할 수 없게 했기 때문이다. 이에, 법적 제약 없이 자유롭게 사용할 수 있다. 통계데이터가 대표적인 익명정보다. 하지만 순도가 낮아 AI와 빅데이터 산업에 활용성이 낮다. 유럽은 아직 고순도 익명정보 처리 기술을 개발하지 못하고 있다. 우리나라는 2019년에 개인정보보호법을 개정해 GDPR의 가명정보 이용을 추가했다. 이 개정의 핵심은 제 3자 제공에 개인 동의가 필요 없는 가명정보를 이용, 회사 간에 원천데이터를 유통하게 한 것이다. 가명결합은 두 회사의 가명정보를 개인별로 결합한 고순도 비빔 가명정보를 만드는 과정이다. 두 회사는 각자의 가명정보를 공인 결합 전문기관에 함께 제공해 신청한다. 결합 전문기관은 결합 과정에서 두 회사가 제공한 가명정보 쌍에 있는 개인의 본명을 가명으로 작명해 동일한 가명을 갖는 레코드 쌍을 결합한다. 이 과정에서 개인을 식별할 수 있는 가명이 외부에 유출되지 않게 엄격한 법적 보호 조치를 실행한다. 가명결합은 데이터를 제공하는 회사와 받는 회사가 함께 신청해야 한다. 마치 원시시대의 물물교환과 같다. 하지만 파는 사람이 물건을 미리 보여줄 수 없어 매장에 전시할 수 없다. 받는 사람도 물건을 보지 않고 구매한다. 또한 사는 사람이 정해져야 가명 작명이 가능해 유통용 가명정보 제품을 미리 만들어 놓을 수 없다. 비효율적인 주문형 유통 방식이다. 가명결합 결과인 비빔 가명정보를 자기 회사로 가져오려면 엄격한 법적 반출 심사를 거쳐야 한다. 중소기업은 이 심사를 충족하기 어렵다. 더 큰 문제는 이렇게 많은 비용과 시간을 들여 만든 비빔 가명정보가 결과적으로 쓸모없을 수도 있다. 물건을 보지 않고 구매했기 때문이다. 가명결합은 AI 빅데이터 시대에 매우 부적합한 데이터 유통 체계다. 정부는 2019년 데이터 기반 행정법을 제정하고 모든 데이터를 연계하는 디지털 플랫폼 정부를 실현하려 한다. 문제는 원천데이터를 개인별로 연계하는 방법이다. 현실적으로 모든 국민에게 데이터 연계에 대한 동의를 받는 건 불가능하다. 유일한 방법은 제 3자 제공이 가능한 가명정보를 이용하는 것이다. 개인 맞춤 행정이나 복지사각지대 발굴과 같이 좋은 목적이라고 해도 동의 없이 모든 국민의 가명정보를 연계하는 것은 개인을 사찰하는 빅브라더 정부라는 오해를 받기에 충분하다. 가명정보는 개인이 식별되는 원천데이터 자원이기 때문이다. 정보이동권을 이용한 마이데이터는 개인 동의를 받아 여러 다른 회사에 산재한 개인의 원천데이터를 주관회사에서 취합해 한곳에 보여주는 서비스다. 개인은 이 편리성 때문에 주관회사의 마이데이터 서비스에 동의한다. 하지만 주관회사는 마이데이터로 모은 고객의 원천데이터 자원을 개인이 모르게 가명정보로 가공해 제 3자에게 제공해도 합법이다. 마이데이터와 가명정보는 개인을 기만하는 잘못된 만남이다. 정부가 진행하는 공공 마이데이터도 동일한 문제가 있다. 우리는 21세기 원유인 원천데이터를 원유 형태인 가명정보 한 가지로만 유통한다. AI와 빅데이터 산업의 국제 경쟁력을 갖추기 위해선 휘발유나 경유 등 다양한 목적을 위해 여러 형태로 정제한 고순도 비빔 익명정보 제품들을 미리 만들어 시장에 유통해야 한다. 누구나 자유롭게 비교하고 신속하게 결합해 가장 만족스러운 제품을 구매할 수 있는 선진 데이터 유통 구조를 만들어야 한다. ◆이원석 연세대 컴퓨터과학과 교수는... 미국 보스턴대학(Boston University)에서 컴퓨터공학 학사를 받고 미국 퍼듀대에서 컴퓨터공학 석사, 박사 학위를 받았다. 삼성전자에서 1년간 선임연구원으로 일하다 1993년부터 현재까지 연세대학교 컴퓨터과학과 교수로 일하고 있다. 연세대 교수로 재직한 30년간 데이터 분야에서 활발한 교육과 첨단 연구를 해왔다. 80여건의 데이터 관련 첨단 연구과제를 수행을 하면서 데이터 분야에서 54건의 SCI급 국제 논문을 발표했다. 또 57편의 국내 논문과 174편의 국내 학술대회 논문도 발표했다. 연세대 재직기간중 170명의 석사와 22명의 박사를 배출했다. 2005년 산업자원부 지정 최우수실험실로 뽑혔고 이어 2006년에는 과학기술부지정 국가지정연구실(NRL)로 지정됐다. 2011년에는 대통령소속 국가정보화 전략위원회 실무위원으로 활동하면서 이 해 11월 국가정보화위원회의 청와대 보고에서 국가차원의 빅데이터 활용을 담은 공공 빅데이터 기본계획을 수립하고 발표하는데 주도적인 역할을 했다. 2012년부터는 한국빅데이터포럼 운영위원장을 맡아 민간 빅데이터 활용을 위한 다양한 활동을 했고 2013년부터 공공데이터 전략위원회의 빅데이터 전문위원장으로 6년간 활동하기도 했다. 최근 개인정보보호위원회의 제도발전위원으로도 일했다.

2024.03.10 15:41이원석

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"요금 올리거나, 무료 풀거나"…OTT, 전략 분화

"책 대신 '아이패드'로 수업을"…디지털이 바꾼 교실 풍경은

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

[ZD브리핑] 아시아 IT 박람회 컴퓨텍스 개최...21대 대선 후보 첫 토론회

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현