오라클DB 23c 정식 출시…'AI 벡터 검색' 도입
[라스베이거스(미국)=김우용 기자] 융합형 데이터베이스 전략을 유지해온 오라클이 이제 데이터베이스 포맷에 'AI 벡터'도 추가했다. 관계형 데이터베이스에 AI 벡터 컬럼만 추가하면, 대형언어모델(LLM)이 기업 내부의 비즈니스 데이터에 빠르게 접근해 기업에서 원하는 전문적 답변 역량을 갖게 된다. 오라클은 20일 미국 라스베이거스에서 개최한 '오라클 클라우드월드 2023'에서 오라클 데이터베이스23c를 출시하고, AI 벡터를 사용하는 시맨틱 검색 기능을 추가한다고 20일 발표했다. 오라클은 오라클 데이터베이스와 자율운영 데이터베이스를 기반으로 구축된 애플리케이션에 LLM 기반 자연어 인터페이스를 추가함으로써 최종 사용자가 자연어를 이용한 질문만으로도 필요한 데이터를 빠르게 검색할 수 있는 간단하고 직관적인 방법을 제공할 예정이다. 생성형 AI 기능으로 강화된 에이팩스(APEX) 및 SQL 디벨로퍼 등의 같은 오라클 데이터베이스 도구는 개발자가 코드를 직접 작성할 필요 없이 자연어를 사용하여 애플리케이션을 생성하거나, SQL 쿼리를 생성할 수 있도록 만들어준다. '앱 심플(App Simple)'이라는 코드네임으로 불렸던 오라클 데이터베이스 23c는 데이터 전문가, 개발자, 데이터 사용자가 수작업 코딩 대신 의도한 결과를 선언하여 더욱 간단하게 데이터와 상호작용할 수 있는 방식을 제공하는 데 중점을 두고 있다. 데이터 시스템은 자연어 인터페이스 기능과 결합된 JSON 릴레이셔널 듀얼리티 뷰, AI 벡터 검색 등의 새로운 데이터베이스 기술을 활용해 솔루션을 생성한다. 개발자는 해당 기술들을 오라클의 로우코드 에이팩스 개발 프레임워크와 결합해 완전한 애플리케이션을 개발할 수 있다. 이러한 접근 방식은 미래의 데이터 및 애플리케이션 개발의 표준이 될 것이며, 개발자 생산성을 대폭 향상시킨다. 앤디 맨델손 오라클 데이터베이스 서버 기술 개발 총괄 부사장은 “개발자는 관계형 데이터베이스의 스키마를 가져가면서 JSON이든 그래프든 데이터를 함께 볼 수 있어 모든 편의를 누리면서 자신의 선호 포맷을 다 활용할 수 있다”며 “AI 벡터 검색은 개발자나 데이터 분석가가 SQL로 저장된 정보와 비정형 데이터 검색을 쉽게 할 수 있다는 것을 의미한다”고 설명했다. 그는 “오라클의 15년 간 AI 검색분야 연구와 투자를 바탕으로 아주 쉽게 이미지, 동영상, 문서 같은 비정형 데이터를 벡터로 인코딩하고 쉽게 관계형 DB에 저장해놓고, 이를 인덱스 형태로 만들어서 빠른 속도로 매칭을 해서 정보를 찾을 수 있게 하는 기술”이라며 “그렇기 때문에 표준적인 SQL 스테이트먼트 하나로 모두에게 익숙한 관계형 DB로도 벡터 쿼리로도 쉽게 검색할 수 있다”고 덧붙였다. 오라클 DB는 이와 함께 LLM의 자연어 기반 콘텐츠 생성 역량을 강화한다. 생성 AI 전문기업이나 조직이 만든 LLM은 기업 내부에 감춰진 비즈니스 데이터를 학습하지 못하고, 인터넷에 공개된 데이터만 학습한다. 이는 특정 분야에서 전문적 답변을 원하는 기업에게 아쉬움이다. 오라클은 오라클DB 23c의 AI 벡터 검색을 통해 '검색 증강 생성(retrieval augmented generation; RAG)을 제공한다. 앤디 맨델손 총괄 부사장은 “LLM은 이미 알고 있는 지식을 기반으로 대답하므로, 대기업이나 큰조직에서 검색에 그냥 활용하면 자신들에게 맞는 정보를 얻기 어렵다”며 “이를 개선하려면 LLM에서 사용할 수 있는 지침을 줘서 오라클의 SQL 쿼리를 생성하게 하고, 그렇게 얻은 정보를 LLM에 넣어 전문적인 답변을 내놓게 해야 한다”고 설명했다. 그는 “RAG는 일종의 도구, 방식으로, DB가 LLM에서 할 수 없는 일을 하도록 돕는 것”이라며 “LLM에게 더 전문적이고 내밀한 지식을 추가하려면 오라클 DB에 AI 벡터 검색 행을 추가하면 자연어로 들어온 질문을 벡터로 인코딩해 변환하고, 모든 정보와 매칭을 찾아내 LLM을 위한 프롬프트를 생성할 수 있다”고 덧붙였다. 오라클은 벡터 데이터스토어를 오라클DB에서 수용함으로써 '벡터 데이터베이스'란 또 하나의 특수목적 DB를 이용해야 하는 불편을 없앨 수 있다고 강조한다. 앤디 맨델손 부사장은 “현재 시대에 벡터 검색을 전문으로 하는 일종의 '벡터 데이터베이스 전문기업'이 많이 나와 있지만, 그들은 벡터 검색만 전문으로 할 뿐 대기업의 비즈니스 트랜잭션을 잘 다루지 못한다”며 “벡터 DB에 비즈니스 데이터를 옮겨서 활용해야 하는 불편이 생기는데, 오라클의 트랜잭셔널 DB가 벡터를 추가하면, 비즈니스 쿼리의 효율성을 확보하면서 여러 검색을 함께 할 수 있게 된다”고 말했다. 그는 “이미 SQL을 알고 있는 개발자나 분석가라면 벡터 검색을 배워서 활용하는데 20분이면 된다”며 “축적된 AI 기술을 빠르게 배워 활용할 길이 열리게 된다는 것이며, 벡터를 SQL로 쿼리하면 벡터 DB 업체의 전용 API없이 개방형 표준을 이용할 수 있다는 장점도 있다”고 덧붙였다. 그는 “SQL은 개방형 표준이고, 그동안 등장한 JSON, 그래프, 벡터 등 다양한 새로운 기능을 흡수하며 강해져왔다”며 “오라클 DB 23c는 그동안 해왔던 모든 혁신과 설계를 볼 때 가장 최선이라고 말할 수 있고 클라우드 시대에도 오라클 DB는 업계 최고 수준이라 할 수 있다”고 강조했다. 이밖에도 오라클 자율운영 데이터베이스 무료 컨테이너 이미지를 활용해 개발자는 자율운영 데이터베이스의 다운로드 가능한 무료 이미지를 사용하여 클라우드 전용 애플리케이션을 개발할 수 있다. 해당 이미지는 오라클 클라우드 인프라스트럭처(OCI) 상시 무료 자율운영 데이터베이스(Always Free Autonomous Database)와 동일한 고급 기능을 제공한다. 개발자는 개인 노트북을 비롯해 본인의 요구사항에 가장 적합한 환경에서 자율운영 데이터베이스를 사용함으로써 자율운영 데이터베이스 데이터 스튜디오의 모든 로우코드, ETL, 분석, 보고 기능을 포함한 자체 관리형 데이터베이스의 단순성 및 성능을 십분 활용할 수 있고, 개발한 애플리케이션은 별도의 변경 없이 그대로 클라우드로 마이그레이션할 수 있다. 골든게이트 23c 무료 버전도 소개됐다. 개발자, DBA, 데이터 분석가, 학생 등이 오라클 골든게이트의 업계 선도적 데이터 통합 및 데이터 메시 기능을 무료로 사용할 수 있는 서비스다. 골든게이트 23c 무료 버전은 초보자도 데이터 복제 및 통합 체계를 간단히 구성할 수 있는 단순화된 사용자 경험과 함께 더욱 간단하고 직관적인 런타임 관측 및 진단 기능을 제공한다. 오라클 데이터베이스 23c는 OCI의 오라클 베이스 데이터베이스 서비스를 통해 정식으로 이용 가능하다. 베이스 데이터베이스 서비스를 사용하는 고객사는 별도의 인프라 관리 작업을 수행할 필요 없이 데이터베이스 수명 주기 작업을 자동화하여 운영 비용을 크게 줄일 수 있다. 또한, 여러 인스턴스 유형별 유연한 가상머신 구성 및 사용량 기반 가격 정책을 통해 클라우드 배포를 간소화할 수 있다. 나아가 베이스 데이터베이스 서비스를 사용하는 개발자는 이제 클라우드를 통해 오라클 데이터베이스 23c의 모든 신기능을 신속히 활용할 수 있게 됐다. 2023년 4월부터 제공된 오라클 데이터베이스 23c 개발자용 무료 버전도 최신 버전의 오라클 데이터베이스 23c로 갱신됐다. 차세대 엑사데이터 시스템 소프트웨어인 엑사데이터 엑사스케일은 클라우드 데이터베이스 및 보다 소규모의 구성을 필요로 했던 개발자들을 위해 엑사데이터 기술 사용료를 획기적으로 낮췄다. 엑사데이터 엑사스케일은 멀티테넌시, 리소스 풀링, 사용량 기반 과금 방식과 같은 클라우드 전용 기능을 데이터베이스 인텔리전스 엑사데이터 스토리지 및 RDMA의 성능과 결합하고, 온프레미스 및 오라클 클라우드에서 모두 사용 가능한 매우 탄력적인 데이터베이스 인프라를 제공한다. 스토리지 효율성을 극대화하는 첨단 데이터베이스 복제 기능을 통해 개발자 생산성을 향상시키고 비용은 절감시켜 준다. 클라우드에 배포된 엑사데이터 엑사스케일은 소수의 컴퓨트 코어만으로도 엑사데이터의 모든 이점을 누릴 수 있도록 지원하며, 중소기업 및 개별 부서 단위로도 엑사데이터의 강력한 성능과 미션 크리티컬 기능을 사용할 수 있도록 한다. 오라클 글로벌 분산형 자율운영 데이터베이스는 데이터 레지던시 규정, 고가용성, 초확장성, 전 세계적으로 분산된 사용자들을 위한 낮은 데이터베이스 액세스 지연 시간 등의 요건을 준수할 필요가 있는 미션 크리티컬 애플리케이션용 샤드(sharded) 또는 분산(distributed) 애플리케이션 아키텍처의 개발 및 배포를 간소화할 수 있도록 지원한다. 이 분산형 데이터베이스 오퍼링은 오라클 자율운영 데이터베이스의 모든 이점을 그대로 누리면서도 데이터 분산 정책은 고객이 직접 관리할 수 있는 완전 관리형 OCI 서비스다. 자율운영 데이터베이스 엘라스틱 리소스 풀은 모든 데이터베이스를 클라우드로 통합함으로써 운영 효율성을 개선하고 비용을 절감할 수 있도록 지원한다. 이 서비스는 데이터베이스 인스턴스를 다운타임 없이 확장 및 축소할 수 있는 하나의 풀로 통합함으로써 인스턴스별 비용을 별도로 지불하는 것과 비교하여 최대 87%의 컴퓨팅 비용 절감 효과를 제공한다. 골든게이트 23c는 오라클 데이터베이스 23c의 신규 기능으로 더 빠른 고가용성 복제, 간편한 런타임 관리, 향상된 통합 가시성 및 진단, 강화된 보안을 제공한다. 주요 기능으로는 비동기API를 사용한 이벤트 기반 데이터 스트림 노출, 비 오라클 데이터베이스 및 공유 데이터베이스를 추가로 지원하는 확장된 최대 가용성 아키텍처(MAA), 향상된 런타임 상태 검사 등이 있다. 오라클 골든게이트 23c는 새롭게 추가되는 스트리밍 삽입 및 AI 벡터 임베딩 기능을 통해 생성형 AI 및 데이터 분석에 사용할 엔터프라이즈 데이터 트랜잭션용 AI 벡터 임베딩을 실시간으로 수집, 이동, 생성할 수 있다. OCI 골든게이트는 AWS, 애저, 구글 클라우드 플랫폼(GCP) 등 멀티 클라우드 환경 전반의 오라클 및 타사 소스로부터의 40개 이상의 새로운 데이터 연결과 함께 실시간 벡터 임베딩을 통한 스트리밍 애널리틱스를 지원한다. 오라클 골든게이트 베리데이터 23c 베타 버전은 특정 데이터세트를 다른 데이터세트와 비교하고, 동기화되지 않은 데이터를 식별하고, 잘못된 데이터를 복구할 수 있도록 지원한다. 이 최신 릴리스는 브라우저 기반 셀프 서비스 사용자 경험, 고급 작업 모니터링, 트랜잭션 수집을 위한 분산 에이전트 등의 새로운 기능들을 제공한다. 오라클 데이터베이스 어플라이언스 X10은 분산된 업체들을 포함한 중소규모의 기업 및 사업부가 보다 간단하고 저렴하게 오라클 데이터베이스, 애플리케이션, 인프라를 배포 및 관리할 수 있도록 지원한다. 데이터베이스에 최적화된 이 엔지니어드 시스템의 최신 릴리스는 향상된 종단간 자동화 기능 및 이전 세대보다 최대 50% 향상된 성능을 제공한다. 고객사는 탁월한 가성비를 자랑하고 최소한의 IT 전문지식만을 요구하는 이 시스템을 활용해 원하는 오라클 데이터베이스 워크로드를 자유롭게 배포할 수 있다.