"망가진 공공SW 사업, 원인은 '데이터 설계도'"
"국가 정보 시스템 오류가 계속 발생합니다. 정부는 이를 땜질 처방식으로 일관합니다. 오류는 멈추지 않을 것입니다. 해결법은 간단합니다. 정부는 통합 정보 시스템을 구축해야 합니다. 이를 위한 '데이터 설계도' 제작이 절실합니다." 카이스트 문송천 경영공학부 명예교수는 최근 본지와 진행한 인터뷰에서 "국가 정보 시스템 오류를 뿌리째 뽑아야 한다"며 이같이 주장했다. 정부는 흩어진 데이터 시스템을 엉성하게 통합하는 것이 아니라, 통합 데이터 설계도부터 탄탄히 구축해야 한다고 재차 강조했다. 문송천 명예교수는 IT 용어 '클라우드'를 처음 만든 소프트웨어(SW) 1세대 학자다. 문 교수는 1980년대초 미국 일리노이대학에서 전산학 박사학위를 받았다. 당시 국가전산학박사 1호였다. 만 24세에 대학교수 생활을 시작했다. 카이스트와 영국 케임브리지대 전산학과·경영대학원 교수로 재직했다. 연구 분야는 빅데이터, 클라우드, 블록체인, 정보보안 등이다. 한국에서 20년 동안 금융정보분석원(FIU)을 비롯한 특허청, 국방부 데이터 시스템 설계도 수정·통합 작업을 직접 지휘했다. 문 교수를 직접 만나 정부 데이터 시스템 문제 원인은 무엇인지, 이에 대한 해결책은 무엇인지 자세히 들어봤다. Q. 정부 데이터 시스템에 문제가 많다. 주요 원인은. "데이터 설계도다. 설계도에서 잘못된 게 분명하다. 데이터 설계도가 아예 없거나, 부실한 설계도를 가지고 있을 것으로 보인다. 정부는 이리저리 흩어진 데이터 시스템을 모아 통합하기만 했다. 각기 다른 시스템을 억지로 통합하다 보니, 오류가 발생한 것이다. 지난해 말 1조5천억 원짜리 재난안전통신망은 이태원 참사에서 무용지물이었다. 설계도 없이 만들었다는 게 드러났다. 사회보장정보시스템도 마찬가지다. 역시 오류가 났다. 법원 전산망도 먹통 된 일이 일었다. 북한 무인기 탐지 실패 사례도 마찬가지다." Q. 최근 '4세대 나이스'에 오류가 생겼다. 같은 이유로 봐도 되나. "그렇다. 똑같은 시나리오다. 정부가 이리저리 분산된 데이터 시스템을 엉성하게 통합해 나이스를 만들었다. 데이터 설계도가 없거나 있어도 부실하다는 게 주요 원인이다. 교육부가 분산된 시스템을 두 개로 통합하는 쪽으로 해결 방안을 추진한 것으로 알고 있다. 사실 두 개가 아니라 하나로 통합해야 했다. 두 개로 통합하면, 내부 데이터가 어떤 관계로 이뤄졌는지 알 길이 없다. 데이터 비만도만 높아진다. 하나로 통합하는 것보다 비효율적이다. 밑 빠진 독에 물 붓기다." Q. 데이터 시스템을 통합하지 않으면 어떤 문제가 발생하는가? 구체적으로 설명해달라. "정상적인 통합 시스템은 3초 안에 맞는 답을 내놓는다. 통합 데이터 시스템 존재 이유다. 시스템을 통합하지 않으면 두 가지 문제가 발생한다. 답은 나오지만, 속도가 느린 경우다. 또 속도는 빠르지만, 틀린 답을 내놓는 상황도 있다. 현재 국가 정보 시스템은 분절됐다. 통합 시스템을 만들지 않으면 이런 문제를 계속 마주칠 수밖에 없다. 두더지 게임처럼 에러가 계속 나올 것이다. 통합 시스템 데이터 설계도가 중요한 이유다. 또 다른 문제는 데이터 중복이다. 불필요한 데이터가 너무 많아진다는 점이다. 분산된 시스템 내부에 똑같은 데이터가 여기저기 불규칙적으로 있다. 이는 데이터 처리 속도를 느리게 하고 품질을 떨어뜨린다. 오류가 생길 수밖에 없는 구조다. 이번 나이스 사태도 이에 해당한다. 문제지가 나와야 하는데 답안지가 나왔다. 또 맞는 결과가 나오지만 상당한 시간이 걸리는 경우도 이에 해당한다." Q. 통합 데이터 시스템에 필요한 설계도가 핵심인 것으로 이해하겠다. 데이터 설계도가 중요한 이유는 무엇인가. "데이터 설계도는 통합 시스템 근간이다. 시스템 속도와 질을 보장한다. 전국 교통지도로 생각하면 된다. 전국 교통지도는 국내 모든 길을 한데 모았다. 사람은 서울과 부산 지도만으로 전국 일주를 할 수 없다. 올바른 방향으로 가고 있는지 확인도 못한다. 중간에 헤맬 것이 분명하다. 맞게 간다 해도 늦게 도착할 것이다. 이처럼 시스템이 정상적으로 작동하지 않은 이유는 분명하다. 통합 시스템이 아니어서다. 시스템 설계도도 없다. 설계도가 있다해도 품질이 낮다." Q. 4세대 나이스 실패 원인이 대기업 부재라는 주장은 어떻게 보나. "아니다. 대기업이 참여해도 똑같은 결과가 나왔을 것이다. 기업 간 의사소통 부재가 더 크다. 보통 A 기업이 데이터 설계도를 제작하다 B 기업에 넘길 경우, A 기업은 그동안 진행한 설계도 자료를 다 넘기지 않는다. 굳이 B 기업에 좋은 일 할 필요 없다는 이유에서다. 업체 간 협조도 없다. 정부도 이를 강제하지 않는다. 관련 법도 없다. 탄탄한 데이터 설계도 제작은 업체 간 의사소통을 필요로 한다. A 기업이 설계도를 어떻게 만들었는지 B 기업에게 자세히 설명해 줘야 한다. B 기업은 A 기업에서 많이 배워야 하고, 자료도 다 받아내야 한다. 그런데 국내에선 불가능한 분위기다. 결과적으로 B 기업은 대충 넘겨받은 자료로 설계를 이어한다. 설계도 제작이 부실할 수밖에 없다. 설계도를 만들어 시스템 통합을 해도 오류가 생기는 건 당연하다. 설계 시간도 넉넉지 않다. 정보가 충분치 않은 상태에서 만들다 보니, 오류투성이다. 시간 부족으로 오류를 다 잡아내지 못한다. 정부는 이를 땜질식으로만 일관한다. 이런 방식으로 대응하면 안 된다. 설계 제작 과정 처음으로 돌아가야 한다. 무슨 문제가 있는지 살펴봐야 한다. 나이스 오류 발생 때도 그렇다. 정부가 "빨리 해결하겠다" "신속히 고치겠다"고 했다. 말뿐인 초지다. 이런 땜질식 처방으론 절대 시스템을 개선할 수 없다." Q. 해결 방안은 무엇인가. "튼튼한 통합 데이터 설계도가 필요하다. 기존 설계도를 고치면 된다. 기술적으로 4개월이면 충분하다. 데이터 설계 전문가가 문제를 정확히 진단하고 해법을 찾아야 한다. 데이터 설계자가 많이 필요한 실정이다. 그런데 국내 대학은 데이터 설계 학과가 없다. 경영학과에서 가르치긴 하지만 극소수다. 데이터 설계자는 데이터 시대에 핵심축 역할을 한다. 그런데 이를 양성할 전문가조차 부족하다. 데이터 설계도를 문서화해야 한다. 설계자는 왜 그렇게 설계도를 만들었는지 기록해야 한다. 왜 이 데이터가 저 데이터와 연결됐는지, 왜 연결이 안 됐는지 다 적어야 한다. 누가 보더라도 데이터 설계도 원리를 이해할 수 있어야 한다. 그래야 기업 간 관행이던 의사소통 부재를 해결할 수 있다. 현재는 데이터 설계도 문서화를 하지 않았다. 데이터 설계도도 없다. 있다고 해도 엉망이다." Q. 금융정보분석원(FIU)을 비롯한 특허청, 국방부 데이터 설계도를 수정·통합한 것으로 알고 있다. 현재 시스템 상태는 어떤가. 약 20년 전 FIU 데이터 설계도를 고쳤다. 현재까지 그 설계도를 사용 중이다. 이 기관은 시스템에 '차세대'를 더이상 붙이지 않는다. 20년 동안 설계도를 고치거나 수정할 필요가 없어서다. 이 데이터 설계도는 모든 새로운 기능을 빠르고 정확히 수행할 수 있다. 특허청과 국방부 정부 시스템도 마찬가지다." Q. AI 시대에도 데이터 설계도는 중요하다고 보는가. "그렇다. AI 엔진은 데이터다. 그런데 좋은 데이터라는 건 따로 없다. AI가 데이터 자체를 관리하지 않는다. 튼튼한 데이터 설계도가 좋은 데이터를 만든다. 부실한 설계도는 좋은 데이터를 만들 수 없다. 이 또한 AI 정확도와 품질을 좌우한다." Q. 마지막으로 강조하고 싶은 게 있다면. "탄탄한 데이터 설계도 제작은 SW 개발 첫 단추다. 이는 SW 품질을 좌우하고 국가 시스템 수준을 올린다. 튼튼한 설계도부터 만들고 그 위에 시스템을 구축해도 늦지 않다. 통합 데이터 설계도 빠진 정보 시스템은 돌아갈 수 없다. 운전자가 전국 교통지도 없이 길을 헤메는 일과 똑같다. 우리가 살고 있는 '데이터 시대'라는 게 바로 이런 세상이다."