"생성 AI 시대, 관계형 DB가 견고한 기반될 것"
[라스베이거스(미국)=김우용 기자] “미래는 AI가 선언적 의도를 생성하게 된다. 데이터와 앱 개발의 미래에 관계형 모델은 견고한 앱 구축의 기반이 될 것이다.” 후안 로이자 오라클 데이터베이스 총괄부사장은 20일 열린 '오라클 클라우드월드 2023' 컨퍼런스 2일차 기조연설에서 "최신의 오라클 DB는 생산성에 대단한 향상을 가져오게 될 것"이라며 "사용 중심의 데이터 생성, 앱 생성, 생성 AI 등의 변혁적 전략을 쓴다"고 말했다. 오라클은 이날 '오라클 데이터베이스 23c' 정식 출시를 발표했다. '앱 심플'이란 코드네임으로 불렸던 오라클 DB 23c는 데이터 전문가, 개발자, 데이터 사용자가 수작업 코딩 대신 의도한 결과를 선언해 더욱 간단하게 데이터와 상호작용할 수 있는 방식을 제공하는 데 중점을 두고 있다. 후안 로이자 총괄 부사장은 "관계형 DB는 데이터를 관리하는 입장에선 좋지만, 애플리케이션 개발자 입장에선 편리하지 않아 많이 쓰이지 않았다"며 "개발자는 API를 쉽게 제공해서 필요한 데이터를 한곳에 넣어 변경하고 싶을 때 바꿀 수 있는 JSON 모델을 좋아한다”고 말했다. 오라클은 관계형 DB에 JSON 문서도 포함하는 통합 모델을 제공중이다. 단일한 오라클 DB과 관계형과 도큐먼트 모두 갖게 됐다. 로이자 부사장은 “이는 양쪽의 장점을 다 쓸 수 있어 좋지만, 데이터 저장을 JSON으로 하면 모든 수직적 모델에서 이중적인 데이터가 생기고, 개발자는 일부 데이터를 바꿀 때마다 모든 걸 일일이 찾아서 바꿔야 하고 데이터 동기화 실패 같은 문제가 생길 수 있다”고 설명했다. 그는 “또한 오늘날 앱 개발은 스토리지 모델을 로우, 도큐먼트, 그래프 중 하나를 선정하면 첫번째 선택에 따라 모든게 달라진다”며 “관계형과 도큐먼트를 어떻게 단일화할 거냐에 대해 스토리지 포맷 대신 데이터를 사용하는 인텐트로 가자는 게 좋은 아이디어”라고 말했다. 그는 “개발자가 데이터 사용을 의도로 선언할 수 있다면, 각 앱의 사용상황에 따라 API를 만들 수있고, 의도만 파악하면 앱이 스토리지와 독립적으로 데이터 모델을 사용할 수 있게 된다”고 덧붙였다. 그는 오라클 DB 23c의 핵심 신기능인 'JSON 릴레이셔널 듀얼리티뷰'를 소개했다. JSON 릴레이셔널 듀얼리티뷰는 몽고DB를 비롯한 도큐먼트를 REST API로 관계형 DB로 가져온다. DB는 도큐먼트의 변경 사항을 감지하고 실제 앱의 변경값만 바꿔 성능 지연을 줄인다. 듀얼리티뷰를 사용하면 데이터는 매우 효율적인 정규화된 형식으로 관계형 테이블에 저장 되지만 앱은 JSON 문서 형식으로 액세스된다. 개발자는 단순성이나 효율성을 타협하지 않고 데이터 저장에 매우 효율적인 관계형 모델을 사용하면서 데이터 액세스를 위해 JSON 문서의 관점에서 생각할 수 있다. 또한 DB 수준 동시성 제어의 모든 복잡성을 사용자에게 숨겨 문서 수준 직렬성을 제공한다. 후안 로이자 부사장은 “스키마를 만들기 싫어하고 코딩만 하고 싶어하는 개발자는 관계형과 도큐먼트의 최고 장점만 사용할 수 있다”며 “관계형과 도큐먼트, 그리고 그래프, 오브젝트를 함께 묶어서 쿼리와 일관성을 가능하게 하면서, JSON의 단순성도 활용하는 대단한 일”이라고 강조했다. 다음으로 그래프 DB를 통합하는 '프로퍼티 그래프 뷰'를 소개했다. 오라클 DB 23c의 새 기능 중 하나다. 그래프 DB의 인텐트 간 쿼리가 복잡한데, 프로퍼티 그래프 뷰는 테이블을 통해 선언 의도를 보여준다. 후안 로이자 부사장은 “프로퍼티뷰를 통해 쿼리 언어로 그래프 DB의 데이터를 다 활용할 수 있다”며 “오라클 DB 23c는 모든 모델을 통합하며, 같은 데이터에 대해 로우, 도큐먼트, 그래프 등 원하는 모든 모델을 다 가질 수 있게 한다”고 강조했다. 오라클 DB의 두번째 혁신 전략으로 소개된 앱 생성에선 로우코드 플랫폼인 '에이펙스(APEX)'와 자율운영DB가 언급됐다. 후안 로이자 부사장은 “노코드 및 로우코드는 비주얼 도구를 사용하고 메타데이터를 활용하므로 생산성을 높여준다”며 “그러나 로우코드로 복잡한 기업용 앱을 만들기는 어려운데, 에이펙스는 데이터를 활용하는 어떤 앱이든 더 쉽게 구축해 운영할 수 있다”고 말했다. 또 “자율운영DB는 데이터 분석에서 로우코드를 실현하고 있다”고 덧붙였다. 세번째 혁신 전략인 생성 AI는 관계형 DB를 활용해 비정형 데이터 검색을 새롭게 해보자는 아이디어다. 오라클 DB 23c에 추가된 'AI 벡터 검색(AI Vector Search)'이란 기능 모음은 새로운 벡터 데이터 유형, 벡터 인덱스, 벡터 검색 SQL 연산자 등을 포함한다. 오라클 DB는 해당 기능들을 활용해 문서, 이미지 및 기타 비정형 데이터의 시맨틱 콘텐츠를 벡터로 저장하고, 저장한 벡터를 사용해 유사성 쿼리(similarity queries)를 신속하게 실행할 수 있다. 신기능들은 대형 언어 모델(LLM)과 개별 기업의 비즈니스 데이터를 결합해 자연어 질문에 대한 응답을 제공하는 생성형 AI 기술인 검색 증강 생성(RAG)을 지원한다. RAG는 검색 정확도를 대폭 향상시키고, 기업의 중요 데이터를 LLM 학습 데이터에 노출하지 않아도 된다. AI 벡터는 이미지, 문서, 영상 등의 콘텐츠 의미를 숫자로 표현한 것이다. 벡터는 콘텐츠 간의 관계, 유사성을 거리로 파악하게 해준다. 벡터 간의 거리는 시멘틱 유사성을 보여줄 수 있다. 후안 로이자 부사장은 “의미적인 검색과 함께 비즈니스 데이터 검색이 맞아떨어져야 한다”며 “비즈니스 데이터와 의미적 데이터를 공유해서 서치하면 효과적”이라고 말했다. 비즈니스 데이터와 벡터 데이터를 병합할 때 비즈니스 데이터를 벡터 DB에 넣으면 비속적으로 업데이트를 해야 한다. 한번 정해진 벡터가 잘 변하지 않는 반면, 비즈니스 데이터는 수시로 변하므로 벡터 DB의 부담이 크다. 반면, 오라클 DB 23c는 관계형 DB에 벡터 데이터를 넣는다. 데이터 동기화에 따른 부담이 사라진다. 후안 로이자 부사장은 “AI 벡터 검색을 통해 AI 전문가나 DB 전문가가 아니어도 쿼리를 쓸 수 있게 된다”며 “모델을 만들고 공부하지 않고 간단한 SQL만 적으면 된다”고 말했다. 그는 “비즈니스 데이터와 시맨틱 데이터의 결합은 AI 솔루션을 구현하고자 하는 기업에게 필요한 기술”이라며 "단일 DB에서 비즈니스 데이터와 시맨틱 데이터를 함께 관리하는 경우, 2가지 유형의 데이터를 결합하여 검색이 더 쉽고, 빠르며, 정확해진다”고 밝혔다. 그는 “오라클 DB에 추가되는 AI 벡터 검색 기능은 고객사가 보안성, 데이터 무결성, 성능을 희생할 필요 없이 AI의 이점만을 빠르고 쉽게 활용할 수 있게 해준다”며 “오라클 AI 벡터 검색 기능은 머신러닝에 대한 전문 지식 없이도 사용할 수 있고, 개발자 및 관리자를 비롯한 모든 DB 사용자는 30분 이내에 해당 기능의 사용 방법을 모두 파악할 수 있다”고 강조했다. 오라클은 오라클 DB와 자율운영 DB를 기반으로 구축된 애플리케이션에 LLM 기반 자연어 인터페이스를 추가함으로써 최종 사용자가 자연어를 이용한 질문만으로도 필요한 데이터를 빠르게 검색할 수 있는 간단하고 직관적인 방법을 제공할 예정이다. 생성형 AI 기능으로 강화된 에이팩스(APEX) 및 SQL 디벨로퍼 등의 같은 오라클 DB 도구는 개발자가 코드를 직접 작성할 필요 없이 자연어를 사용하여 애플리케이션을 생성하거나, SQL 쿼리를 생성할 수 있도록 만들어준다. 데이터 시스템은 자연어 인터페이스 기능과 결합된 JSON 릴레이셔널 듀얼리티 뷰, AI 벡터 검색 등의 새로운 DB 기술을 활용해 솔루션을 생성한다. 개발자는 해당 기술들을 오라클 에이팩스 개발 프레임워크와 결합해 완전한 애플리케이션을 개발할 수 있다. 이러한 접근 방식은 미래의 데이터 및 애플리케이션 개발의 표준이 될 것이며, 개발자 생산성을 대폭 향상시킨다. 그는 생성 AI를 활용해 DB 쿼리 생성을 자연어로 할 수 있게 된다고 했다. 그는 생성 AI를 활용해 자연어로 데이터 조회를 요청하면 DB가 알아서 스키마를 가져와 쿼리를 생성, 실행하는 미래 모습을 제시했다. 또한 자연어를 통해 로우코드 플랫폼에서 자연어로 앱을 생성하는 미래도 그렸다. 에이펙스가 자연어로 원하는 앱의 설명을 듣고, 자동으로 데이터를 가져와 앱의 블루프린트를 만드는 것이다. 생성AI가 완벽하지 못하므로 초안을 만들게 해 실제 활용될 앱은 사람의 검수와 개선을 거쳐야 한다고도 했다. 그밖에 데이터 전문가의 생성 AI 활용, 자율운영DB의 남은 수작업 제거 등도 언급됐다. 그는 “우리는 새로운 세상으로 나아가고 있다”며 “수작업으로 하지 않고 솔루션을 생산하고, 앱 개발의 생산성에서 엄청난 향상을 가져와 2년뒤면 앱 개발과 데이터의 세상이 크게 바뀌어 있을 것”이라고 강조했다.