• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'벡터 서치'통합검색 결과 입니다. (3건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"급증하는 LLM 데이터 처리량, '벡터 DB'로 해결"

디노티시아는 LLM의 전력 및 비용 효율성을 획기적으로 높일 수 있는 '벡터 데이터베이스(DB)'를 개발하고 있습니다. 기존 소프트웨어만을 다루는 기업들과 달리, 전용 반도체를 개발해 기술력을 크게 높인 것이 차별점이죠. 이달 주요 학회에서 '업계 최초'로 반도체 기반의 벡터 데이터베이스 데모 버전을 공개합니다. 정무경 디노티시아 대표는 최근 서울 강남 소재의 본사에서 기자와 만나 회사의 핵심 기술 및 향후 사업 전략에 대해 이같이 밝혔다. 지난해 설립된 디노티시아는 AI 기반 데이터 솔루션 전문기업이다. 삼성전자, SK텔레콤, 사피온 등에서 시스템반도체와 스토리지 시스템, 데이터베이스 등을 두루 개발한 정무경 대표가 창업했다. LLM서 급증하는 데이터 처리량…'벡터 DB'로 해결 정 대표는 기존 LLM(거대언어모델)의 발전 방향이 갈수록 한계에 직면할 것이라고 내다봤다. LLM 구동에 필요한 데이터 처리량이 매우 빠르게 늘어나고 있는 반면, 반도체의 성능 향상 속도는 기술적 한계로 이를 따라가지 못하고 있기 때문이다. 정 대표는 "현재 LLM은 1조개에 달하는 파라미터(매개변수)를 메모리에 저장하고, 필요할 때마다 이를 전부 읽어서 계산해야 하기 때문에 데이터 처리량이 매우 방대하다"며 "메모리의 대역폭을 넓힌 HBM(고대역폭메모리)가 비싼 가격과 어려운 수율 확보에도 불구하고 엔비디아 등에서 적극 채용한 이유도 여기에 있다"고 설명했다. 이 같은 LLM의 비효율성을 해결하기 위한 기술 중 하나가 RAG(검색증강생성)다. RAG는 데이터로부터 AI가 필요로하는 특정 정보를 정확하게 검색해내는 기술로, 이를 활용하면 답변의 정확도 및 효율성을 높일 수 있다. 디노티시아는 이 RAG의 핵심 기술인 벡터 데이터베이스를 '씨홀스(Seahorse)라는 이름으로 개발하고 있다. 벡터 데이터베이스란 문서·이미지·오디오 등 다양한 유형의 데이터를 고차원 벡터로 변환해, 유사한 내용을 손쉽게 검색할 수 있도록 설계된 데이터베이스 시스템을 뜻한다. 정 대표는 "벡터 데이터베이스를 활용하면, 수 많은 데이터를 일일이 직접 들여다보지 않더라도 질문과 관련된 정보들이 자동적으로 추출될 수 있게 인덱스(색인)할 수 있다"며 "디노티시아는 전 세계 모든 고객사의 데이터를 벡터 데이터베이스해 효율적인 시맨틱 서치(사용자의 의도 및 문맥을 파악해 원하는 결과를 도출하는 검색)를 가능케 하는 게 목표"라고 밝혔다. 업계 최초 벡터 DB '전용 칩'으로 차별화…내년 매출 실현 목표 이미 업계에서는 벡터 데이터베이스를 개발하는 경쟁사들이 많이 있으나, 이들 기업은 소프트웨어 알고리즘만을 활용한다. 반면 디노티시아는 벡터 데이터베이스를 위한 '전용 칩'을 세계 최초로 개발해, 차별화된 경쟁력을 확보했다. 정 대표는 "소프트웨어만으로는 점점 더 커지는 데이터 처리량을 감당할 수 없는 시대가 곧 올 것"이라며 "때문에 디노티시아는 벡터 데이터베이스를 위한 가속기를 만들어, 소프트웨어와 하드웨어 모두 제공할 수 있도록 할 것"이라고 말했다. 이를 위해 디노티시아는 TSMC의 12나노 공정을 활용한 VDPU(벡터 데이터 프로세싱 유닛)를 개발하고 있다. 최근 FPGA(필드 프로그래머블 게이트 어레이) 형태의 데모 칩 개발이 완료돼, 이달 열리는 세계 최대 규모의 슈퍼컴퓨팅 기술 전시회 '슈퍼컴퓨팅(Super Computing) 2024'에서 처음 공개할 계획이다. 정 대표는 "디노티시아의 하드웨어 및 소프트웨어 기반의 벡터 데이터베이스를 활용하면 데이터센터의 전력 효율성은 10배 높아지고, TCO(총소유비용)은 80% 이상 절감할 수 있다"며 "향후 LLM급 성능을 갖춘 온-디바이스 AI가 구현된다면, 여기에도 적용될 수 있을 것"이라고 강조했다. 이후 디노티시아는 내년 FPGA 기반의 솔루션을 상용화하고, 내후년에는 ASIC(주문형반도체) 기반의 솔루션을 상용화할 계획이다. 회사 설립 2년만에 매출을 실현하겠다는 공격적인 목표지만, 정 대표는 이 같은 계획을 현실화할 수 있다는 자신감을 가지고 있다. 배경에는 뛰어난 기술력과 양질의 인력이 있다. 현재 디노티시아는 약 78명의 임직원을 보유하고 있으며, 이들 중 상당수가 반도체 및 소프트웨어 분야에서 상당한 경력을 쌓은 베테랑들이다. 정 대표는 "시맨틱 서치에는 AI와 데이터베이스 기술이 중요한데, 디노티시아는 우리나라 데이터베이스 분야에서 최고의 인력들을 많이 보유하고 있다"며 "AI 분야 역시 경력이 상당한 개발자들을 확보했다"고 밝혔다.

2024.11.20 09:45장경윤

몽고DB, AWS・구글클라우드와 생성형 AI 협력 확대

몽고DB는 아마존웹서비스(AWS), 구글 클라우드 등과 협력을 확대한다고 13일 밝혔다 . 몽고DB는 '날리지베이스 포 아마존 베드록'에 '몽고DB 아틀라스 벡터 서치'를 정식 통합해, 기업이 완전관리형 파운데이션 모델(FM)를 활용해 생성형 AI 애플리케이션 기능을 더 쉽게 구축할 수 있도록 지원한다. 수많은 개발자와 고객이 비즈니스 크리티컬 애플리케이션 구동을 위해 사용 중인 업계를 선도하는 개발자 데이터 플랫폼인 몽고DB에서 구글 클라우드의 제미나이 코드 어시스트를 최적화하며 애플리케이션 개발 및 현대화를 위한 향상된 개발자 경험을 제공한다. 아마존 베드록은 AWS의 완전관리형 서비스로, 단일 API를 통한 다양한 고성능 FM을 지원하고 보안, 개인정보 보호 및 책임감 있는 AI 역량을 갖춘 생성형 AI 애플리케이션 구축을 위한 광범위한 기술을 제공한다. 이번 통합으로 개발자는 자체 데이터를 활용해 복잡한 작업을 자동화하고, 엔드 유저의 요구사항에 따라 정확하고 신뢰 가능한 최신 응답을 제공하는 생성형 AI 애플리케이션을 쉽게 제작할 수 있다. 기업은 아틀라스 벡터 서치에서 처리된 데이터를 기반으로 AWS에서 빠르고 쉽게 생성형 AI 애플리케이션을 배포할 수 있으며, 더욱 정확하고 관련성 높은 응답을 제공할 수 있다. 벡터 데이터만 저장하는 애드온 솔루션과 달리, 아틀라스 벡터 서치는 고성능의 확장 가능한 벡터 데이터베이스로서 전 세계에 분산된 운영 데이터베이스와 통합돼 기업의 전체 데이터를 저장 및 처리할 수 있어 생성형 AI 애플리케이션을 효과적으로 지원한다. 아마존 베드록과의 통합으로 고객은 실시간 운영 데이터를 벡터 임베딩으로 변환해 대규모 언어 모델(LLMs)에서 사용할 수 있다. AI21랩스, 아마존, 앤트로픽, 코히어, 메타, 미스트랄 AI, 스태빌리티 AI 등의 LLM 을 자체 데이터로 맞춤화한다. 개발자는 검색 증강 생성(RAG)을 위한 아마존 베드록 에이전트로 직접 코딩하지 않더라도 사용자 쿼리와 연관된 맥락에 맞는 응답을 바탕으로 애플리케이션을 구축할 수 있다. 기업은 몽고DB 아틀라스 서치 노드를 통해 핵심 운영 데이터베이스에서 생성 AI 워크로드를 분리 및 확장하며 쿼리 시간을 최대 60% 단축하는 등 비용과 성능을 최적화할 수 있다. 이 같은 완전관리형 기능은 노보 노디스크 같은 AWS와 몽고DB의 공동 고객이 조직 전반에서 자체 데이터로 생성형 AI를 안전하게 사용하고, 운영 오버헤드와 수작업을 줄이며 비즈니스 가치 실현을 가속화하도록 돕는다. 구글 클라우드의 제미나이 코드 어시스트는 코드 제안을 생성하고, 통합개발환경(IDE)에서 기존 코드에 관한 문의에 답하며, 간단한 프롬프트 입력으로 전체 코드베이스를 업데이트할 수 있는 기능을 제공한다. 몽고DB와 구글 클라우드의 협업으로 개발자는 제미나이 코드 어시스트를 활용해 몽고DB 코드와 매뉴얼, 모범 사례에 대한 답변과 정보를 얻을 수 있을 뿐만 아니라 신기능을 빠르게 프로토타이핑하고 애플리케이션 개발을 가속화할 수 있다. 오늘날 많은 개발자는 워크플로우에 생성형 AI 기반 코딩 어시스턴트를 통합해 일상 업무를 자동화해 생산성을 높이고 중요한 업무에 집중하기 위한 방법을 모색하고 있다. 제미나이 코드 어시스트는 공개된 데이터 세트를 학습하고 코드베이스에 대한 뛰어난 가독성을 갖췄으며, 널리 사용되는 애플리케이션, 소스 코드 저장소, 코드 편집기 등과 통합돼 개발자의 요구사항을 충족할 수 있는 기능을 제공한다. 제미나이 코드 어시스트의 통합으로 개발자는 신속한 애플리케이션 구축과 현대화를 위한 몽고DB 활용법을 익히고, 몽고DB 매뉴얼에서 엄선된 콘텐츠와 코드를 확인하며, 사용사례를 비롯해 몽고DB에서 데이터 작업 시 적용할 수 있는 다양한 기능에 대한 고도화된 제안을 받을 수 있다. 이 밖에도 제미나이 코드 어시스트는 자연어 채팅, 코드 사용자화, 전체 코드베이스의 대규모 변경, AI 기반의 스마트한 작업 자동화, API 개발 간소화 등 핵심 기능과 기업이 라이선스 요건을 준수할 수 있도록 코드 제안 시 출처를 함께 제공한다. 이처럼 양사의 지속적인 협력은 개발자가 반복적인 작업에 투입하는 시간을 대폭 줄이고 구글 클라우드용 몽고DB에서 데이터 기반 애플리케이션을 신속하게 구축할 수 있는 토대를 제공한다. 바시 필로민 AWS 생성형 AI 부문 부사장은 “오늘날 수만 개의 기업은 특정 요구사항에 맞는 생성형 AI 애플리케이션을 구축하기 위해 아마존 베드록을 사용하고 있다”며 “이제 양사의 공동 고객은 날리지베이스 포 아마존 베드록에서 정식 제공되는 몽고DB 아틀라스 벡터 서치로 RAG를 더욱 쉽고 빠르게 구현하며 데이터에서 풍부한 인사이트를 도출할 수 있다”고 강조했다. 스티븐 오반 구글 클라우드 마이그레이션, ISV 및 마켓플레이스 부문 부사장은 “제미나이 코드 어시스트는 개발자가 고품질 코드를 더 효율적으로 작성할 수 있도록 엔터프라이즈급 AI를 지원한다”며 “개발자는 제미나이 코드 어시스턴트로 확장된 몽고DB 관련 정보와 매뉴얼, 코드를 통해 애플리케이션 구축과 가치 창출에 소요되는 시간을 줄이고, 소프트웨어 개발 및 제공 프로세스 전반에서 불필요한 마찰을 줄일 수 있다”고 밝혔다.

2024.05.13 11:05김우용

몽고DB, 구글클라우드와 생성형 AI 협력 확대

몽고DB는 최근 개최된 '구글 클라우드 넥스트 2024'에서 구글 클라우드와 협력 강화를 발표했다. 협력 확대로 개발자는 몽고DB 아틀라스 벡터 서치와 구글 클라우드의 버텍스 AI를 사용해 생성형 AI 애플리케이션을 더욱 쉽고 비용 효율적으로 구축, 확장 및 배포할 수 있으며, 빅쿼리를 통한 데이터 처리 시 추가 지원을 제공받을 수 있다. 양사는 유통 및 제조업을 위한 새로운 산업 솔루션을 위해 손잡고, 몰입도 높은 쇼핑 경험과 스마트 팩토리용 데이터 기반 애플리케이션에 적합한 개발 환경을 제공한다. 이와 함께 민감한 데이터 기반의 워크로드 실행을 위한 몽고DB 엔터프라이즈 어드밴스드 구글 분산형 클라우드(GDC) 지원도 새롭게 추가됐다. 몽고DB와 구글 클라우드는 2018년 파트너십 체결 이후 켈러 윌리엄스, 파워렛저, 렌트더런웨이, 얼타 등 수천 개의 공동 고객사가 클라우드 네이티브 데이터 전략을 채택하고 조직 운영 및 엔드 유저 서비스 방식을 현대화하도록 도왔다. 몽고DB 아틀라스 서치 노드를 구글 클라우드에서 이용할 수 있게 됨에 따라 아틀라스 벡터 서치 및 아틀라스 서치를 사용하는 생성형 AI 및 관련성 기반 검색 워크로드를 위한 전용 인프라를 제공한다. 고객은 핵심 운영 데이터베이스 노드와는 별개로 아틀라스 서치 노드를 통해 워크로드를 분리하고 비용을 최적화하며 쿼리 시간을 최대 60%까지 단축할 수 있다. 특정 기간에만 트래픽이 많은 애플리케이션을 운영하는 금융 서비스 기업의 경우, 아틀라스 서치 노드가 포함된 전용 인프라를 통해 전체 워크로드 중 생성형 AI가 적용된 영역을 분리 및 확장하며 데이터베이스로부터 독립적으로 성능을 최적화할 수 있다. 기업은 전체 데이터베이스 크기를 조정할 필요 없이 자율 작업이 가능한 AI 에이전트를 위해 아틀라스 벡터 서치로 지식 검색 워크로드를 확장할 수 있다. 양사는 지난해 아틀라스 벡터 서치와 버텍스AI의 통합을 발표한 이래 생성형 AI 애플리케이션 구축을 위한 관리형 파운데이션 모델의 선택지를 넓혀왔다. 이제 전용 버텍스AI 확장 프로그램을 통해 데이터 변환이나 아틀라스 및 구글 클라우드 간 데이터 파이프라인을 관리할 필요 없이 엔트로픽, 구글클라우드, 메타, 미스트랄 등 대규모 언어 모델(LLM)을 쉽게 활용할 수 있다. 개발자는 조직의 실시간 운영 데이터로 LLM을 보강할 수 있어 복잡성을 낮추는 한편, 정확성과 신뢰성을 갖추고, 컨텍스트에 맞는 고도로 개인화된 엔드 유저 경험을 제공하는 최신 애플리케이션을 구축할 수 있다. 버텍스AI 콘솔에서 자연어 채팅을 통해 아틀라스에 저장된 데이터로 데이터 작업 및 데이터베이스 운영에 필요한 쿼리를 자동 생성할 수도 있다. 빅쿼리는 클라우드 전반에서 분석, 비즈니스 인텔리전스(BI) 및 머신 러닝 워크로드를 위한 확장성 및 비용 효율성을 갖춘 서버리스 엔터프라이즈 데이터 웨어하우스다. 현재 개발팀은 빅쿼리와 아틀라스 간 양방향 동기화를 통해 실시간 운영 데이터로 분석 워크로드를 강화하거나 엔드 유저 애플리케이션에 기존 엔터프라이즈 데이터에 대한 액세스를 제공하고 있다. 이제 스파크의 저장 프로시져와 빅쿼리의 새로운 통합으로 분석, BI 및 엔드 유저 애플리케이션을 위한 빅쿼리와 아틀라스 간 데이터 처리 워크플로우를 자동화하고 최적화 및 재사용할 수 있다. 수만 개의 기업이 높은 성능과 확장성을 갖춘 다양한 유형의 실시간 애플리케이션 데이터를 안전하게 저장, 처리 및 관리하기 위해 아틀라스를 사용하고 있다. 오늘날 많은 제조기업이 공장 장비 센서, 엔드 유저 애플리케이션, 전사적자원관리(ERP) 시스템 등 여러 소스의 데이터를 결합해 의사결정을 자동화하고 효율성을 높이며 운영 현대화를 도모하고 있으나 여전히 레거시 기술에 대한 의존으로 인해 혁신에 어려움을 겪고 있다. 새로운 아틀라스와 구글 클라우드 매뉴팩처링 데이터 엔진의 통합은 최신 실시간 애플리케이션으로 프로세스를 자동화하고 운영을 최적화하도록 돕는다. 몽고DB는 구글 클라우드의 '인더스트리 밸류 네트워크(IVN)' 파트너 프로그램에 합류해 유통기업이 대규모 고객 경험을 제공할 수 있도록 애플리케이션 구축을 지원한다. IVN은 SI파트너와 협업해 산업 전반에서 차별화된 엔드투엔드 솔루션 개발을 간소화하며 혁신을 가속화하는 이니셔티브다. 유통기업은 디지털 혁신 컨설팅 기업인 킨 앤 카르타의 통합 커머스 네트워크를 사용해 구글 클라우드용 아틀라스에서 비즈니스 요구 사항을 충족하고 고객에게 몰입도 높은 쇼핑 경험을 제공할 수 있는 최신 상거래 아키텍처를 구축할 수 있다. 민감한 데이터를 다루는 정부나 공공기관, 규제 산업군의 기업은 제한적인 워크로드 실행으로 인해 운영 현대화에 어려움을 겪고 있다. GDC에서 제공되는 몽고DB 엔터프라이즈 어드밴스드는 구글 클라우드나 공용 인터넷에 연결되지 않은 에어갭 환경에서 애플리케이션을 구축, 배포 및 확장할 수 있다. 몽고DB는 민감한 워크로드를 실행하는 고객을 위한 분산형 클라우드 프로그램인 '구글 클라우드 레디'에 검증된 솔루션을 제공 중인 초기 소프트웨어 기업 중 한 곳이다. GDC는 정부, 공공기관 및 규제 산업군의 기업이 엄격한 데이터 레지던시와 보안 요구 사항을 해소하도록 돕는다. 이들은 GDC와 엔터프라이즈 어드밴스드의 통합으로 민감한 데이터를 보호하면서 혁신적인 애플리케이션과 기능을 안전하고 유연하게 배포하며 운영 전반을 현대화할 수 있게 됐다. 앨런 차브라 몽고DB 파트너 부문 수석부사장은 “몽고DB와 구글 클라우드의 강력한 파트너십은 다양한 산업군에 걸친 기업의 요구 사항을 충족하기 위해 긴밀히 협력한 결과”라며 “몽고DB는 마켓플레이스 부문에서 '구글 클라우드 올해의 파트너'로 선정되며, 고객의 최신 애플리케이션 구축을 위한 최상의 솔루션을 제공하고 엄격한 보안 및 데이터 프라이버시를 준수하기 위한 노력을 인정받았다”고 밝혔다. 그는 “더 많은 고객이 새로운 유형의 생성형 AI 애플리케이션으로 비즈니스를 강화하는 데 몽고DB와 구글 클라우드를 선택해 양사의 파트너십이 계속 성장하길 기대한다”고 덧붙엿다. 스티븐 오반 구글클라우드 마이그레이션, ISV 및 마켓플레이스 부문 부사장은 “양사는 이미 수천 개의 공동 고객사에 구글 클라우드용 몽고DB 아틀라스를 통한 성공적인 애플리케이션 구축 및 배포를 지원했다”며 “앞으로도 전략적 파트너십을 지속하며, 버텍스 AI 및 빅쿼리를 통한 자동화된 데이터 파이프라인으로 선도적인 모델에 액세스하는 것을 비롯해 생성형 AI로 애플리케이션을 빠르고 효과적으로 구축 및 강화하도록 다양한 선택지를 제공할 것”이라고 강조했다.

2024.04.15 11:46김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

삼성전자, 브로드컴에 HBM3E 12단 공급…ASIC서 기회 포착

메타의 공격적 AI 인재 사냥, 핵심은 '데이터 전쟁'

마디마다 구동기 탑재…정교한 로봇손에 숨겨진 비밀

이재명 대통령 "AI·반도체·재생에너지·문화 투자 아끼지 않겠다"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.