• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'SW키트'통합검색 결과 입니다. (22건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

텔레그램에 퍼진 딥페이크, 다크웹이 더 문제다

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 생성형 인공지능(AI)을 악용한 딥페이크 이미지·영상이 텔레그램에 퍼진 가운데, 다크웹을 통한 딥페이크 음란물 확산 심각성도 인지해야 한다는 목소리가 나왔다. 전문가들은 텔레그램·다크웹 내 딥페이크 차단을 위해 기술 개발뿐 아니라 정부·기업 공조 수사가 필요하다고 입을 모았다. 29일 보안 업계는 텔레그램뿐 아니라 폐쇄적인 다크웹 환경에서도 딥페이크 영상과 사진을 잡기 어려울 것이라고 우려를 제기했다. 다크웹은 구글이나 네이버 등 일반적인 검색 엔진으로 접근할 수 없는 웹사이트들이 모여 있는 영역이다. 다크웹은 특별한 소프트웨어(SW)나 네트워크 권한이 있어야만 접근 가능하다. 누구나 쉽게 이용할 수 있는 텔레그램과 다른 개념이다. 딥페이크 음란물 포착이 다크웹서 더 어려운 이유다. 실제 노드VPN이 올 초 다크웹 게시판을 분석한 결과 소셜미디어(SNS), 텔레그램 등을 통해 유출된 노출 사진이나 영상에 댓글이 평균 1천850개 달리는 것으로 드러났다. 이에 텔레그램뿐 아니라 다크웹도 딥페이크 영상물 확산 통로로 지목되고 있다. 보안 업계는 다크웹 내 딥페이크 콘텐츠 포착이 어려운 이유로 강력한 데이터 휘발성을 꼽았다. 검색 환경이 잘 갖춰진 구글과 달리 다크웹 내 검색은 특정인 사진과 영상을 검색해도 찾기 어렵다는 의미다. 다크웹 시스템은 특수 브라우저 생성과 삭제를 통해 정보를 은닉할 수 있는 환경을 갖춘 셈이다. 이에 보안 기업들은 다크웹 내 콘텐츠 검색을 가능케하는 솔루션을 내놨다. 주로 다크웹 콘텐츠를 복원해 검색 결과에 드러나게 하는 기술을 갖췄다. 다만 이런 기능도 딥페이크 콘텐츠 포착을 100% 할 수는 없다. 한 보안업계 관계자는 "공격자들이 딥페이크 음란 콘텐츠가 쉽게 포착되지 않기 위해 틀린 정보를 의도적으로 흘리는 경우가 있다"며 "기술 개발이 아무리 뛰어나도 다크웹 내 딥페이크 음란 콘텐츠를 100% 걸러내기 힘든 이유"라고 본지에 강조했다. 딥페이크 차단 나선 정부…"기술 개발보다 공조 우선" 정부가 텔레그램·다크웹 내 딥페이크 음란물 차단을 위해 나섰다. 29일 과학기술정보통신부는 생성형 AI를 활용해 지인 대상 합성물을 제작 및 유포하는 딥페이크 예방을 위해 20억원 규모 예산을 편성했다고 발표했다. 과기정통부는 내년 예산안 브리핑에서 딥페이크 범죄 예방을 위해 연구개발(R&D) 과제에 착수한다고 밝혔다. 이주식 정보통신방송기술정책과장은 적대적 생성신경망(GAN) 기반 딥페이크 탐지 고도화 및 생성 억제 기술 개발에 10억원을 투자한다고 발표했다. 나머지 10억원은 자가진화형 딥페이크 탐지 기술 개발에 들어갈 방침이다. 이에 보안 업계는 정부가 딥페이크 차단 기술에만 집중해선 안 된다고 주장했다. 이보다 국내외 기업·기관과 수사 공조하는 것에 더 집중해야 한다고 입을 모았다. 현재 기술만으로 딥페이크 콘텐츠를 100% 포착하기 어렵기 때문이다. 또 딥페이크 콘텐츠 검색을 원활히 하기 위해선 국내외 콘텐츠 공급자와 꾸준한 소통이 이뤄져야 한다. 정부도 보안 업계 주장에 동의하는 분위기다. 우선 딥페이크 성범죄 콘텐츠 유포에 가장 많이 사용된 텔레그램 측과 소통을 시작하겠다고 밝혔다. 텔레그램은 해외 개발사 소유이므로 서버 위치가 해외에 있다. 차단 기술 개발뿐 아니라 서비스 공급자와 직접적 공조가 필요한 이유다. 국민의힘 김상훈 정책위의장은 29일 여의도 국회서 열린 딥페이크 성범죄 관련 부처 긴급 현안보고에서 "현재 텔레그램과 협력회의를 시작한 상태"라며 "상시 협의를 통해 핫라인을 확보할 것"이라고 했다. 이어 "그동안 국제 공조가 제대로 이뤄지지 않아 딥페이크 콘텐츠 차단에 어려움을 겪었다"며 "텔레그램과 원활한 소통을 통해 추가 피해를 막을 것"이라고 덧붙였다.

2024.08.29 16:42김미정

[김미정의 SW키트]① AI에게 줄 데이터가 부족하다…합성데이터 대안 될까?

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 생성형 인공지능(AI) 모델 발전에 필요한 데이터가 곧 고갈될 것이란 전망이 나오고 있다. 데이터가 AI 엔진 역할을 하는 만큼 데이터 고갈이 현실화하면 AI 모델 훈련을 추가로 진행할 수 없기 때문이다. 현재 이를 대체할 방안이 잇따라 나오고 있다. 전문가들은 AI로 만든 합성데이터를 모델에 훈련하자는 대안을 제시하고 있다. AI 모델에서 나온 결과물을 다시 모델에 넣어 학습 데이터로 재활용하는 식이다. 이를 조심스럽게 바라보는 이들도 있다. 만약 오류를 가진 합성데이터를 모델에 넣을 경우 AI 모델에 환각현상이 심해질 뿐 아니라 결국 모델 품질까지 떨어뜨린다는 주장도 나왔다. "합성데이터, AI 편향성 극복·희귀 데이터 수집 도와" 업계에서는 AI로 생성한 합성데이터가 모델 성능 향상에 유용할 것이라 입을 모았다. AI 알고리즘 편향성 감소와 희귀 데이터 수집 기회를 잡을 수 있다는 이유에서다. 15일 업계에 따르면 AI로 합성데이터를 만들어 고객사에 납품하는 개발사는 점차 늘어나는 분위기다. 해당 개발사들은 고객사에 부족한 데이터 종류를 AI로 제작해 채운다. 이를 통해 고객사는 데이터 제작 시간과 비용을 기존보다 줄일 수 있다. 김현수 슈퍼브에이아이 대표는 "실제 데이터를 수집하기 어려운 희귀하거나 극단적인 케이스가 포함된 데이터를 AI 합성을 통해 얻을 수 있다"며 "데이터 수집·라벨링 과정이 생략되기 때문에 데이터 취득비용을 줄이고 신속한 학습을 할 수 있다"고 강조했다. 김 대표는 합성데이터가 다양한 산업에서 작동하는 모델 기능을 올릴 수 있다고 주장했다. 그는 "특히 합성데이터는 국내외 제조 분야나 국방, 물리보안용 AI 모델에 유용할 수 있다"며 "취득하기 어려운 제조 결함이나 중대재해 사고, 화재, 드문 보안 이슈 데이터를 합성데이터로 채움으로써 모델 성능을 올리고 실제 위험에 대처할 수 있다"고 설명했다. 업스테이지 측은 합성데이터 생산 노하우가 개발 전략으로 자리 잡을 것이라고 봤다. 업스테이지 관계자는 "합성데이터를 고품질 정형 데이터로 적절히 융합해야 한다"며 "기업들이 자신에 맞는 융합 방식을 찾으면 그만큼 비용효율적인 대체제가 없을 것"이라고 강조했다. 이어 "각 기업이 같은 합성데이터를 이용해도 회사 기술력에 따라 모델 성능은 다를 것"이라고 덧붙였다. "오류 확증·재확산…연합학습법 등 다른 대안 필요" 합성데이터를 모델에 재사용하면 품질 저하를 일으킨다는 지적도 나왔다. 합성데이터에 오류가 있으면 모델이 환각현상 등 문제를 더 만들 수 있다. 최근 영국 옥스퍼드대에서도 논문을 통해 합성데이터 위험성을 경고했다. 연구진은 모델 개발·학습 과정에 합성데이터가 들어갈수록 모델 결함이 높아진다는 이론을 제시했다. 기존 오류와 새로운 환각 현상이 지속적으로 쌓이면서 결국 모델 붕괴 현상이 일어날 수 있다는 내용이다. 연구 책임자인 옥스퍼드대 일리아 슈마일로프 컴퓨터과학부 강사는 "현재 AI로 만든 합성데이터는 여러 면에서 약점을 지녔다"며 "이런 위험성을 객관적 수치로 알리는 것이 현대 과학자 의무"라고 강조했다. 국내 업계와 학계서도 합성데이터 활용에 조심스러운 입장이다. 네이버클라우드 하정우 AI혁신센터장은 "사람이 만든 데이터로만 모델을 학습시키면 편향이 발생한다"며 "이처럼 합성데이터를 모델에 과도하게 넣으면 모델 품질 하락 가능성도 있다"고 지적했다. 김동환 포티투마루 대표는 "합성데이터를 모델에 넣는 과정에서 오류가 발생할 수밖에 없고, 오류를 학습한 모델이 다시 합성데이터를 만들면서 결국 오류 전파(Error Propagation)를 보일 것"이라고 주장했다. 이어 "결국 생성물 자체가 현실과 괴리를 일으킬 것"이라며 "환각현상은 더 심해질 수 있다"고 내다봤다. 김 대표는 향후 데이터로 모델 성능 올리는 것 자체가 현실적으로 한계에 부딪혔다고 했다. 이에 대한 근거로 친칠라(Chinchilla) 법칙을 언급했다. 모델 파라미터가 2조 개에 이르면, 학습데이터 60조 개가 필요하다는 이론이다. 김 대표는 "이런 규모는 합성데이터를 통해서도 구성하기 힘들다"며 "이를 감당할 수 있는 그래픽처리장치(GPU) 등 인프라 확보조차 어렵기 때문"이라고 지적했다. 그는 대책도 제시했다. 김 대표는 "도메인 특화 경량화 모델로 데이터를 분산시키거나 연합학습으로 양질의 내부 데이터를 활용해야 한다"며 "이에 대한 연구가 진행돼야 할 것"이라고 말했다. 연합학습법은 분산된 여러 장치에서 모델을 학습하는 방법론이다. 데이터를 중앙 서버에 직접 옮기는 방식과 다르다. AI 모델 학습을 안전하고 경제적으로 진행할 수 있다고 평가받고 있다. 이에 대해 경희대 이경전 경영대학·빅데이터응용학과 교수는 "합성데이터 활용보단 연합학습 등 다양한 대안을 내놔야 한다"고 주장했다.

2024.08.15 11:00김미정

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

"나만 맞아"...SNS 필터 버블·양극화, 사실상 못 고친다

'보안 올림픽' 4연승 박세준 "K-보안, 글로벌로 가야"

공공 클라우드 전환 앞장서는 美정부…한국은 '제자리걸음'

블룸버그 "트럼프 행정부, 인텔에 지분 투자 검토"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.