기업은 생성형 AI의 데이터 유출을 어떻게 막을 수 있나
"기업이 마이크로소프트 365 코파일럿이나 다른 AI를 사용할 때 당연히 기업내 지식베이스의 데이터를 가져와 활용하게 된다. 그 데이터는 중요하고 민감한 정보를 포함할 수 있는데, 코파일럿이 이런 정보를 가져왔을 때 컨피덴셜 데이터를 판별할 수 있어야 한다. 사용자가 열람하고 복사 및 붙여넣기 할 수 없던 기밀 정보를 코파일럿이나 AI에서 제공받아도 안 되고, 생성된 콘텐츠를 외부 생성형 AI에 입력할 수도 없어야 한다. 마이크로소프트 퍼뷰는 기업 내 데이터의 보안 강도를 인식해 무분별한 AI 사용을 방지한다." 박상준 한국마이크로소프트 보안비즈니스 총괄 팀장은 최근 본지와 인터뷰에서 마이크로소프트 코파일럿 등 다양한 생성형 AI 활용 중 필요한 데이터 보안 방안을 이같이 설명했다. 박상준 팀장은 "현재 기업에서 사용하는 생성형 AI는 데이터 보호의 위험을 감지하고 완화할 수 있는 가시성이 부족하다"며 "점차 생성형 AI와 코파일럿 도입을 많이 할수록 이런 문제는 더욱 많아지며, 막 시작된 각국가별 관련 규제도 늘어나면서 규제에 대응하기도 어려워질 것"이라고 진단했다. 그는 "아직 초기 시장이어서 기업과 사용자는 AI 자체에만 관심을 두고 있다"며 "생성형 AI 활용에 대한 데이터 보안에 기업이 관심을 가져야 할 시점이지만 기존의 보안 솔루션 중 이런 위험성을 해결할 제품이 없는 상황"이라고 강조했다. 마이크로소프트 조사에 따르면, 생성형 AI의 위험을 감지하고 완화하기 위한 가시성의 부족을 우려하는 조직의 비율은 43%다. AI에서 공유되는 데이터를 보호할 수 있는 제어력이 부족하다고 우려하는 응답자는 35%라고 한다. 마이크로소프트 365 코파일럿은 오픈AI의 대규모언어모델(LLM)인 GPT를 기반 모델 삼아 워드, 엑셀, 파워포인트, 아웃룩, 팀즈 등에서 자연어 요청으로 다양한 문서와 콘텐츠를 작성해준다. 코파일럿은 사용자 프롬프트를 받아 마이크로소프트 그래프를 통해 셰어포인트 내에 저장되는 기업 내부 데이터를 열람하고, 웹 검색 데이터와 결합해 맥락에 적합한 답변을 하게 된다. 조직의 특성과 상황에 맞는 답변을 얻도록 여러 생성형 AI를 혼합, 최적화하는 증강검색생성(RAG)를 활용하면 마이크로소프트 365 코파일럿처럼 사용자에게 최적화된 AI 환경을 구축할 수 있다. 이 과정에서 AI 모델은 기업의 내부 정보에 접근하고 사용자 답변에 활용한다. 마이크로소프트 365 코파일럿이나 생성형 AI의 가장 흔한 활용 방식은 '복사'와 '붙여넣기'다. 한번에 완벽한 문서를 AI로 작성할 수도 있지만, 대부분 AI로 생성된 콘텐츠를 또다른 업무 애플리케이션이나 제3의 생성형 AI에 입력한다. 만약 이런 사용을 무분별하게 방치하면 무수한 기밀 정보가 무방비로 외부에 유출될 수 있다. 박 팀장은 "코파일럿으로 복사와 붙여넣기를 하다가 민감 정보를 복사해서 일반 또는 공개수준의 문서에 붙이기도 하는데 이는 기밀정보의 유출하는 문제가 있다"며 "또, 엑셀에서 코파일럿에게 물어서 기밀 정보를 보여달라고 프롬프트를 날리는 데이터 과잉 공유 문제도 발생한다"고 말했다. 그는 "경쟁 기업의 주가 조작을 위한 문서를 작성해달라는 식의 비윤리적인 콘텐츠를 요청하는 위험성 콘텐츠 생성을 방지하는 기능도 필요하다"고 덧붙였다. 마이크로소프트 퍼뷰는 데이터 보안, 거버넌스, 컴플라이언스 등의 기능을 제공하는 제품군이다. 퍼뷰 AI 허브는 중요한 데이터와 사용자 위험 컨텍스트를 포함한 프롬프트를 감지하는 가시성을 제공한다. 퍼뷰 데이터 로스 프리벤션은 엔드포인트 DLP 정책을 만들어 중요 정보의 복사 및 붙여넣기나 AI 앱 업로드를 차단한다. 어댑티브 프로텍션 인 마이크로소프트 퍼뷰는 합법적 비즈니스 활동을 차단하지 않도록 DLP 정책을 사용자 위험에 맞게 적용한다. 박 팀장은 "퍼뷰 AI 허브는 기업 내부에서 사용되는 코파일럿과 기타 AI 어시스턴트의 활용 내용을 보여주며, 중요한 정보가 프롬프트를 통해 얼마나 오가는지 탐지해 표시한다"며 "한 회사에서 코파일럿과 여러 AI를 쓴다고 할 때 주민등록번호나 신용카드 번호, 프로젝트 정보 등이 오가는것 자체를 탐지할 수 있으며, 위험도 집계를 통해 현황을 파악하고, 실 사용자에게 주의를 주거나 특정 조치를 취할 수 있게 한다"고 설명했다. 그는 "퍼뷰 DLP는 기밀자료에 대한 무단 복사/붙여넣기를 차단할 수 있다" 며 "다른 일반 AI에 복사 붙여넣기를 할 때 더 낮은 보안 등급의 문서나 앱에서 할 수 없도록 차단한다"고 말했다. 그는 "퍼뷰 커뮤니케이션 컴플라이언스는 이메일이나 채팅창에서 대화 중 문제있는 키워드를 탐지해 데이터 과잉 공유의 위험을 해결한다"며 "예를 들어 '프로젝트 옵시디안'이란 단어를 셰어포인트 사이트 라이브러리에 민감도 레이블을 적용하고 탐지해 '프로젝트 옵시디안' 관련 정보를 공유하지 못하게 막는다"고 덧붙였다. 마이크로소프트 퍼뷰는 중요한 데이터를 포함한 파일에 자동으로 레이블을 지정하고, 암호화, 권한관리, 워터마킹 등을 포함한 보호 제어를 적용해준다. 사용자가 민감도 레이블 관련 요청을 할 때 관련된 권한 관리 제어를 적용한다. 민감 데이터에 접근할 수 있는 사용자의 경우 코파일럿은 참조하는 파일에 가장 제한적인 레이블을 자동으로 상속하고, 무단 사용이나 유출을 방지한다. 퍼뷰 커뮤니케이션 컴플라이언스는 즉시 사용가능하고 학습 가능한 분류자(classifier)를 사용해 비규제적 콘텐츠를 포함하는 프롬프트도 감지한다. 데이터수명주기관리(DLM)를 통해 모든 마이크로소프트 365 코파일럿의 소통을 유지하고, 오딧을 통해 활동 로그를 기록한다. 코파일럿 상호작용을 포함한 모든 관련 데이터를 수집, 검토해 이디스커버리를 통해 조사나 소송에 대응할 수 있다. 박 팀장은 "DRM은 모든 파일을 암호화해 데이터 보호 조치를 취하는 솔루션으로, DRM을 쓴다면 AI의 데이터 읽기 자체가 차단된다"며 "DRM은 레이블없이 모든 외부 접근을 막기 때문에 DRM과 생성형 AI의 양립은 불가능하다고 봐야한다"고 말했다. 그는 "이런 기업들이 생성형 AI를 쓰기 위해 퍼뷰의 마이크로소프트인포메이션프로텍션(MIP)으로 전환하는 추세"라며 "문서에 레이블을 붙여서 AI가 그 레이블을 보고 보안 등급을 판단하는 게 MIP"라고 설명했다. 마이크로소프트 퍼뷰는 단독으로도 구독 가능한 상품이다. 하지만 단말기 관리와 ID 관리를 할 수 있는 마이크로소프트 인튠과 마이크로소프트 엔트라를 함께 활용할 때 그 역량이 극대화된다. 마이크로소프트는 보안 제품군을 자사 솔루션 연동으로 한정하지 않는다. 타사 환경도 포괄한다. 박 팀장은 "마이크로소프트 보안의 방향성은 포괄적 보안을 제공한다는 것이며, 개별적 부분을 강화하면서도 전반적으로 커버하는 보안을 지향한다"며 "마이크로소프트 환경뿐 아니라 멀티 클라우드와 온프레미스까지 포함한다"고 밝혔다. 그는 "마이크로소프트 퍼뷰는 우수한 가시성, 포괄적인 보호, 규정 준수 제어 등을 통합적으로 제공한다"며 "마이크로소프트의 포괄적인 접근방식을 기반으로 안전하고 규정을 준수하는 생성형 AI 환경을 만들 수 있으며, 제3자 솔루션을 포함해 종속성 없이 기업의 통합 플랫폼에 원활하게 통합된다"고 강조했다.