"방대한 데이터, 물리적 이동없는 가상화로 관리해야"
"기업 데이터가 방대해졌고, 이를 한군데로 통합해 분석해야 한다. 데이터 가상화는 적은 비용과 높은 효율성으로 데이터를 한곳에 수집하고 실시간으로 분석할 수 있다." 클라우드소프트웨어그룹(CSG)코리아 장찬익 차장은 7일 콘래드 서울에서 열린 '피앤디솔루션 유저 컨퍼런스'에서 데이터 가상화 솔루션 '팁코 데이터 버추얼라이제이션(이하 TDV)'을 소개했다. CSG는 올해 초 팁코와 시트릭스의 합병으로 출범한 회사다. 데이터 가상화는 물리적으로 흩어진 이기종 데이터베이스 워크로드를 논리적인 계층에 통합하는 기술이다. 데이터 복제나 이동없이 통합해 활용할 수 있게 해주는 기술로, 오늘날 데이터 통합 플랫폼의 핵심으로 여겨진다. 장찬익 차장은 "현재 기업 데이터는 너무 방대해진 반면, 기업이 자체적으로 이를 한데 모아 관리할 수 없는 상황"이라며 "오라클같은 솔루션으로 데이터를 한곳에 모은다고 해도 서로 다른 데이터를 한곳에 통합하려면 긴 시간과 비용이 든다"고 지적했다. 전통적인 관계형 데이터베이스, 빅데이터 플랫폼, IoT, 로그 시스템 등 데이터를 저장하는 시스템은 많아졌다. 이기종 데이터를 함께 분석해야 정확성이나 예측 적중률이 향상되므로, 오늘날 기업은 각각 따로 구축된 데이터 저장소를 하나로 모으는 작업에 나섰다. 이른바 '데이터레이크'다. 하지만 데이터레이크는 물리적인 저장소를 하나로 합쳐야 하기 때문에 시간과 비용이 많이 든다. 데이터 저장소마다 각기 설정된 규제와 정책을 물리적으로 통합된 데이터레이크에서 세세하게 운영하기도 힘들다. 데이터를 모으는 ETL 작업은 지옥같은 노동이라 불릴 정도로 고되다. 장 차장은 데이터 가상화를 효율적인 기업 데이터 관리법이라고 재차 강조했다. 장 차장 설명에 따르면 데이터 가상화 솔루션은 기존보다 적은 비용으로 효율성을 높이는 효과를 누릴 수 있다. 그는 "TDV는 물리적인 데이터 이동 없이 논리적인 방식으로 데이터를 통합하는 개념으로 이뤄져, 데이터 복제가 일어나지 않는다"며 "다양한 유형으로 이뤄져 한곳에 모으기 힘든 오늘날 데이터의 특성을 해결하기 위해 TDV에서 통합뷰를 제공한다"고 설명했다. TDV는 온프레미스와 클라우드상에서 데이터를 가상으로 통합할 수 있다. 이를 통해 단일 데이터 뷰를 보여준다. 해당 뷰는 외부 솔루션에 연결할 수 있다. 데이터 모델링, 테스트, 시각화, 분석기능도 제공한다. TDV는 데이터 소스 통합에 필요한 어댑터를 200개 이상 갖췄다. 관계형데이터베이스, NoSQL, 스트리밍 등의 데이터 소스를 연결할 수 있다. 데이터의 위치를 특정 온프레미스 애플리케이션이나 일부 클라우드로 제한하지 않는다. 장찬익 차장은 "아마존웹서비스(AWS)나 SAP 등 다양한 환경에 어댑터를 손쉽게 연결할 수 있다"고 강조했다. TDV로 기업의 여러 데이터를 통합하면 실시간 데이터 분석을 구현할 수 있다. CSG는 스트리밍 분석을 위한 솔루션으로도 TDV를 제공한다. TDV는 '스트리밍 솔루션'으로 실시간 분석 업무를 수행할 수 있다. TDV는 스트리밍 분석용 어댑터를 제공한다. 어댑터는 트랜잭션 데이터, GPS 데이터, 실시간 데이터 유입에 사용될 수 있다. 장찬익 차장은 "데이터가 스트리밍 솔루션에 들어오면 데이터 분석 작업을 바로 처리할 수 있다"며 "실시간 데이터 분석은 금융, 물류, 제조업, 리테일 등 다양한 사업에 적용할 수 있다"고 강조했다.