• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
지스타2025
인공지능
스테이블코인
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'데이터브릭스'통합검색 결과 입니다. (48건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"역시 남다르네"…'MSP 대어' 메가존클라우드, 데이터브릭스 '최고' 등급 받았다

올해 기업공개(IPO) 추진에 본격 나선 메가존클라우드가 글로벌 경쟁력을 인정 받아 세계적인 데이터·인공지능(AI) 기업이자 레이크하우스 선구자인 데이터브릭스의 선택을 받았다. 메가존클라우드는 데이터브릭스의 최고 등급인 엘리트(Elite) 파트너로 선정됐다고 8일 밝혔다. 엘리트 등급은 데이터브릭스 솔루션에 대한 높은 기술 전문성을 바탕으로 고객의 성공적인 디지털 전환을 이끈 파트너에 부여된다. 파트너 등급은 레지스터(Registered), 셀렉트(Select), 엘리트로 구성된다. 메가존클라우드는 데이터·AI 프로젝트 수행 경험과 전문 역량을 인정받아 엘리트 파트너로 선정됐다. 메가존클라우드 및 메가존 관계사는 2천700여 명의 클라우드 전문 인력을 바탕으로 국내 클라우드 MSP업계 최초의 유니콘 기업에 등극했다. 지난해에는 1조5천106억원의 매출을 달성했다. 국내와 더불어 미국, 일본, 캐나다, 호주, 중국 상해·북경, 베트남, 홍콩, 싱가포르 등 해외 8개국에서 현지 법인도 운영하고 있다. 메가존클라우드는 2021년 데이터브릭스와 파트너십을 체결한 이래 데이터브릭스 솔루션을 기반으로 기술검증, 고객사 대상 핸즈온 세션 지원, 데이터 전환 사업 구축 등을 진행하고 있다. 특히 100여 명 규모의 AI & 데이터 분석 전문 조직인 ADC(AI & 데이터분석센터)를 통해 데브시스터즈, 무신사 등 기업 고객에 최적화된 데이터브릭스 솔루션과 함께 기술 지원 서비스를 제공해왔다. 지난 3월에는 데이터브릭스의 생태계 역량 강화 프로그램인 딜리버리 프로바이더 프로그램 파트너십 계약을 체결, 기술 협력을 통해 다양한 프로젝트를 진행하고 있다. 메가존클라우드 AI & 데이터분석센터 공성배 센터장은 "고객의 데이터 기반 비즈니스를 지원하기 위해 고객사에 최적화된 데이터 서비스 오퍼링 서비스를 제공해왔다"며 "최고 파트너 등급인 '엘리트' 선정을 바탕으로 데이터와 AI의 활용을 가속화할 수 있도록 지원을 아끼지 않겠다"고 말했다. 데이터브릭스 아시아태평양 지역 파트너 총괄 그렉 테일러 부사장은 "메가존클라우드는 한국 내 데이터브릭스의 핵심 파트너이자 선도적인 디지털 혁신 조력자로, 클라우드 기반 플랫폼 기술로 기업이 데이터와 AI를 통해 비즈니스를 혁신하도록 지원하고 있다"며 “더 많은 한국 기업들이 데이터브릭스 데이터 인텔리전스 플랫폼을 활용할 수 있도록 양사간 파트너십을 더욱 강화할 것"이라고 말했다.

2024.05.08 10:40장유미

데이터브릭스, 한국 시장서 연간 100% 성장

데이터브릭스는 23일 서울 인터컨티넨탈코엑스에서 개최한 '데이터 인텔리전스 데이' 컨퍼런스' 관련 기자간담회에서 지난 회계연도에 한국에서 연간 100% 이상의 성장을 달성했다고 발표했다. 국내 기업의 데이터 및 AI 수요 급증에 따른 결과라고 회사측은 설명했다. 데이터브릭스는 급속한 제품 혁신에 힘입어 지난 1월 31일 마감된 회계연도를 기준으로 전 세계적으로 16억 달러 (약 2조2천억원)이상의 매출을 기록했으며, 연간 50% 이상의 성장을 달성했다. 데이터브릭스는 지난 3월 출시 당시 표준 벤치마크에서 모든 오픈소스 모델을 능가하는 범용 대형언어모델(LLM) DBRX를 선보였다. 데이터 선도 기업들은 이미 데이터브릭스의 데이터 인텔리전스 플랫폼을 활용해 다양한 워크로드에서 비용 효율성과 고성능을 보장하는 동시에 비즈니스 운영을 최적화하고, 예측 분석 및 AI 애플리케이션 등을 통해 혁신을 이끌며, 고급 데이터 거버넌스 및 분석 기능을 통해 의사 결정을 개선해나가고 있다. 데이비드 마이어 데이터브릭스 제품 담당 수석부사장은 기조연설에서 “기업의 데이터 프로젝트를 AI와 결합하고자 할 때 실패로 귀결되기 쉬운데, 이는 워낙 다양한 사일로 시스템이 존재하기 때문”이라며 “데이터와 AI 시스템의 사일로는 내재적으로 복잡하며 거버넌스와 보안도 이 때문에 더 어려워지고, 여러 개발언어와 시스템을 이해해 쉽게 만들 수 있는 고도화된 기술인력도 확보하기 어렵다”고 말했다. 그는 “데이터브릭스의 레이크하우스 '델타레이크'는 비정형과 정형 데이터 모두를 레이크로 가져와서 정교화한 다음 데이터 복제와 이동없이 레이크 자체에서 활용하게 하므로 근본적으로 단순하다”며 “데이터레이크하우스만으로 충분하지 않고, 그 위에 거버넌스 레이어 '유니티 카탈로그'를 얹어 SQL, 스칼라, 자바, R 같은 각기 다른 엔트리 진입지점을 관리하고 데이터모델이나 노트북까지 모두 관리할 수 있다”고 강조했다. 데이터브릭스의 유니티 카탈로그는 전체 데이터 플랫폼의 거버넌스를 관리하는 계층이다. 모든 데이터 쿼리는 유니티 카탈로그를 거치게 되고, 사용자별로 데이터 접근권한을 관리할 수 있다. 유니티 카탈로그는 데이터브릭스 솔루션 외에 다양한 외부 거버넌스 시스템과도 통합가능하다. 데이터브릭스는 모자이크ML을 인수하고 최근 DBRX란 개방형 언어모델을 출시하는 등 생성형 AI 분야에 공격적인 투자를 하고 있다. 생성형 AI를 자사 플랫폼에 접목해 자연어로 데이터를 활용하게 하는 데이터 민주화를 추구한다. 데이비드 마이어 부사장은 “생성형 AI 자체를 레이크하우스에 녹여 근본적으로 새로운 것을 가능하게 했다”며 “데이터 인텔리전스 엔진을 델타레이크와 유니티 카탈로그 위에 얹어서 생성형 AI로 데이터 의미를 이해한다”고 말했다. 그는 “플랫폼에서 파티셔닝, 인덱싱, 레이어링, 리퀘스트 등의 기능을 자동화했으며, AI가 데이터 트래픽 패턴을 학습해 데이터를 재작성하고 사용자의 사용 행태에 따라 더 적은 비용으로 쿼리를 수행하도록 진화한다”며 “최고의 데이터웨어하우스는 훨씬 더 간결한 레이크하우스”라고 강조했다. 그는 “1년전 인수한 모자이크ML은 고객의 모델 학습과 미세조정을 더 저렴한 비용으로 할 수 있게 하며, 최대 10배의 비용을 절감시켜준다”며 “DBRX는 미세조정이나 자체 모델을 완벽히 제어할 수 있다”고 덧붙였다. 이날 기조연설에서 염화음 크래프톤 딥러닝실 데이터실장과 문효준 엘지전자 데이터플랫폼실 팀장이 무대에 올라 자사의 데이터브릭스 플랫폼 활용 사례를 공유했다. 에드 렌타 데이터브릭스 아태지역 총괄 부사장은 “데이터브릭스 클라우드의 한국 리전 범위를 확대하고 서버리스 SQL을 5월 출시할 예정”이라며 “한국어 기술 지원을 시작하고, 제품 교육 및 인증 프로그램의 한국어 지원도 5월 중 이뤄질 것이며, 생성형 AI 기능의 한국 리전 확대와 모델 서빙, 벡터 서치 등도 한국에서 쓸 수 있을 것”이라고 밝혔다. 에드 렌타 데이 부사장은 “한국은 아태지역에서 가장 빠르게 성장하는 시장 중 하나”라며 “한국이 기업의 AI 도입에 대한 야심찬 목표를 가지고 있는 시장인 만큼, 데이터브릭스는 보다 많은 한국 고객들이 자체적인 프라이빗 데이터를 사용해 안전하게 AI를 활용할 수 있도록 지속적으로 지원해나갈 계획”이라고 말했다. 데이터브릭스의 데이터 인텔리전스 데이는 데이터브릭스 고객, 업계 리더, 기술 전문가, 파트너가 주도하는 심층 세션을 통해 자연어로 데이터 인사이트를 확보하는 방법부터 데이터 프라이버시 보호 및 제어를 유지하면서 생성형AI 애플리케이션을 개발하는 혁신적인 방법까지 자세히 살펴볼 수 있다. LG전자, 크래프톤, 여기어때컴퍼니, 정육각, 하이퍼커넥트, 신세계I&C, 스캐터랩, 아임웹 등이 연사로 나서 데이터 및 AI 여정을 공유했다.

2024.04.23 16:05김우용

"생성형 AI의 보안은 '안전'과' 정확성'을 함께 원한다"

“기업은 AI를 활용할 때 관리 가능하고 안전할 뿐만 아니라, 매우 정확하고 관련성 높은 결과물을 요구한다. 이미 챗봇이 '환각' 현상으로 인해 고객에게 부정확한 답변을 제공하고, 이로 인해 기업이 어려움을 겪은 사례도 많이 존재한다. 좋은 AI 전략을 세우려면 강력한 데이터 전략이 필요하다. 기업은 사내에서 자체 AI 모델을 구축하고, 기업 내부 데이터로 해당 모델을 학습시켜 부정확한 답변을 생성하지 않도록 하며, 궁극적으로 지적재산(IP)에 대한 소유권을 갖기를 원하고 있다.” 페르민 세르나 데이터브릭스 최고보안책임자(CSO)는 본지와 서면인터뷰에서 최근 생성형 인공지능(AI) 트렌드 속에서 나타나는 데이터 보안 분야의 체크포인트를 이같이 요약했다. 그는 “AI는 자동화로 생산성을 향상시키고, 데이터에 기반한 의사 결정을 통한 효율성 증대와 성공적인 비즈니스 등 다양한 이점을 제공한다”며 “미국을 비롯한 전 세계 조직이 이러한 이점을 인지함에 따라 AI를 도입하는 사례가 늘고 있지만 동시에 보안과 개인정보 보호에 관한 우려로 인해 AI 프로젝트를 실제 업무에 적용할 때 신중을 기하는 추세”라고 설명했다. 기업의 데이터 보안 전략은 생성형 AI 환경에서 새롭게 업그레이드돼야 하는 상황이다. 데이터 통제 및 관리, 규제 준수 같은 안전을 보장하는 생성형 AI를 만들면서도, 맥락에 적합한 정확한 답변과 성능을 구현해야 한다. IT 보안이 생성형 AI를 맞아 전보다 더 넓은 범위를 고려해야 하는 것이다. 이에 대해 페르민 세르나 CSO는 중요한 조언을 몇가지 제시했다. 그는 단일한 데이터 플랫폼을 구축해 통합적인 보안과 거버넌스 체계를 갖춰야 한다고 강조했다. 데이터 및 AI에 대한 통합 가시성, 데이터 및 AI에 대한 단일 권한 모델, AI 기반 모니터링 및 통합 가시성 등의 접근 방안을 소개하기도 했다. Q. 기업용 생성형 AI에 대해 내부 데이터를 접근할 때 권한 및 보안등급 관리, 규제 준수 등 거버넌스와 컴플라이언스 이슈가 있다. 이에 대한 조언을 한다면? 지난해 JP 모건 체이스, 버라이즌, 삼성전자 등이 고객 정보 및 소스 코드에 대한 통제권을 잃을 수 있는 잠재적 위험을 줄이기 위해 챗GPT 사용을 금지한다고 발표한 바 있다. 이는 거버넌스 도구를 '데이터의 세계'에서 '데이터와 AI의 세계'로 확장해야 하는 이유를 보여주는 대표적인 예다. 서로 다른 여러 플랫폼, 시스템 및 공급업체에 걸쳐 데이터와 AI를 관리하는 일은 매우 복잡하다. 모든 조직이 직면하고 있는 가장 큰 과제 중 하나는, 데이터 사일로와 데이터 개인정보 보호 및 제어에 관한 문제다. 조직에서 사용하는 시스템이나 플랫폼마다 데이터가 중복되거나 시스템 간에 이동될 수 있으며, 또 플랫폼마다 보안 및 거버넌스에 대한 접근 방식이 다를 수 있다. 레이크하우스 아키텍처에 구축된 데이터브릭스 데이터 인텔리전스 플랫폼과 같은 단일 통합 플랫폼을 선택하면 통합 보안 및 거버넌스를 통해 하나의 데이터 사본을 AI에서 비즈니스 인텔리전스(BI)에 이르는 다양한 사용 사례에 저장하고 사용할 수 있어, 이러한 보안 위험을 완화할 수 있다. Q. 데이터브릭스는 생성 AI 시대의 데이터 거버넌스와 컴플라이언스에 어떤 해법을 제시할 수 있나? 데이터브릭스는 2020년에 데이터 웨어하우스와 데이터 레이크의 장점을 결합하고 통합하기 위해 레이크하우스를 분야를 개척했다. 레이크하우스는 (1) 조직 내 모든 데이터 소스(정형, 반정형, 비정형 데이터)를 함께 쿼리하고 (2) 데이터를 사용하는 모든 워크로드(BI, AI 등)를 통합된 방식으로 관리할 수 있는 통합 시스템을 제공한다. 레이크하우스는 독자적인 데이터 플랫폼 범주로 자리 잡았으며, 현재 기업에서 널리 채택되어 대부분의 벤더 스택에 통합되어 있다. MIT 테크놀로지 리뷰 인사이트 보고서에 따르면, 전 세계 CIO의 74%가 자사의 레이크하우스를 보유하고 있다고 답했다. 레이크하우스 도입은 이미 시장에서 대세로 자리 잡았지만, 데이터브릭스는 레이크하우스와 생성형 AI를 결합해 데이터 인텔리전스 플랫폼이라는 새로운 범주의 데이터 플랫폼을 만들었다. 데이터 인텔리전스 플랫폼을 통해 기업은 자연어를 사용하여 한 곳에서 데이터를 통합, 관리 및 활용할 수 있다. 데이터 인텔리전스 플랫폼은 생성형 AI 모델을 사용하여 기업 데이터의 의미를 파악하고 플랫폼의 모든 부분에서 이렇게 이해한 내용들을 활용한다. 데이터브릭스의 통합 거버넌스 솔루션인 유니티 카탈로그를 통해 조직은 모든 클라우드 및 플랫폼에서 정형 및 비정형 데이터, 머신러닝 모델, 노트북, 대시보드 및 파일을 원활하게 관리할 수 있다. Q. 회사 내부 보안조직의 대응법이 있으면 소개해달라. 데이터브릭스의 데이터 및 AI 거버넌스 접근 방식은 아래와 같다 1. 데이터 및 AI에 대한 통합 가시성: 조직은 생성형 AI를 통해 자연어를 사용하여 데이터와 AI를 안전하게 검색하고, 이해하고, 인사이트를 추출하여 생산성을 높일 수 있다. 2. 데이터 및 AI에 대한 단일 권한 모델: 통합 인터페이스로 액세스 관리를 간소화해 데이터 및 AI 자산에 대한 액세스 정책을 정의하고 모든 클라우드 또는 데이터 플랫폼에서 이러한 정책을 일관되게 적용 및 감사할 수 있다. 또한, 조직은 행과 열을 세밀하게 제어하여 보안을 강화하는 동시에 원활하게 확장되는 로우코드 속성 기반 액세스 정책을 통해 액세스를 효율적으로 관리할 수 있다. 3. AI 기반 모니터링 및 통합 가시성: AI를 사용하면 모니터링을 자동화하고 오류를 진단하며 데이터 및 ML 모델 품질을 유지할 수 있다. 조직은 개인 식별 정보(PII) 데이터를 자동으로 감지하고, 모델 드리프트를 추적하며, 데이터 및 AI 파이프라인 내의 문제를 효과적으로 해결하여 정확성과 무결성(integrity)을 유지하는 사전 예방적 알림의 이점을 누릴 수 있다. Q. 방어자 입장에서 AI를 어떻게 받아들여야 바람직할까? AI는 조직이 방대한 양의 데이터를 선별해 패턴을 모니터링하고 분석하는 데 도움을 준다. AI는 이렇게 학습된 패턴을 기준선으로 삼아 비정상적인 행동을 감지하고 시스템에 대한 무단 액세스를 제한할 수 있다. 또한, AI는 위험의 우선순위를 정하고 멀웨어와 침입의 가능성을 즉시 감지하여 분석가의 1차 작업을 보강하는 데 도움을 줄 수 있다. 데이터 인텔리전스 플랫폼과 생성형 AI를 사용하면 조직 내 사이버 보안 팀들은 자연어를 사용하여 사고의 영향과 보안 속성에 대해 질문을 할 수도 있다. Q. 세계 각국에서 AI 안전에 대한 규제가 나오기 시작했다. 조직에서 AI 안전을 담당하는 주체는 누가 돼야 하고, 어떻게 무수한 규제에 대응하고 정책변경에 빠르게 적응할 수 있을까? 새롭게 생겨나는 AI 규제는 다양하고 복잡한 요구 사항을 가지고 있지만, 한편으로는 반복되는 주제를 담고 있다. 일반적으로 5가지 주요 영역에서 의무가 발생한다: 1. AI 개발 및 배포 주기의 모든 단계에서 필요한 데이터 및 모델 보안과 개인 정보 보호 2. 출시 전 위험 평가, 계획 및 완화 - 데이터 학습과 가드레일 구현에 중점을 두고 편향성, 부정확성 및 기타 잠재적 피해를 해결 3. 출시 시 필요한 문서 - 개발 과정에서 수행한 단계와 AI 모델 또는 시스템의 특성(기능, 제한 사항, 학습 데이터 설명, 위험, 완화 조치 등)에 관한 내용 포함 4. 출시 후 모니터링 및 지속적인 위험 완화 - 부정확하거나 기타 유해한 결과물 생성 방지, 보호 대상 그룹에 대한 차별 방지, 사용자가 AI를 다루고 있음을 인지하도록 하는 데 중점을 둠 5. 대규모 모델을 학습하고 실행하는 데 사용되는 에너지가 환경에 미치는 영향 최소화 이러한 목표를 달성하려면 모든 조직이 데이터와 AI 모델에 대한 완전한 소유권과 통제권을 확보하고 AI 개발 및 배포의 모든 단계에서 포괄적인 모니터링, 개인정보 보호 제어, 거버넌스를 이용할 수 있어야 한다. 조직은 데이터 품질을 제공하고, 더 안전한 애플리케이션을 제공하며, 규제 표준을 준수하는 데 도움이 되는 책임 있는 AI 목표를 달성하기 위한 통합된 접근 방식을 필요로 한다.

2024.04.16 10:07김우용

데이터브릭스, 범용 대형언어모델 'DBRX' 출시

데이터브릭스가 표준 벤치마크에서 모든 오픈소스 모델을 능가하는 범용 대형언어모델(LLM) DBRX를 출시했다. 데이터브릭스는 기업의 자체 밤줌형 LLM을 구축, 학습시킬 수 있는 LLM 'DBRX'를 오픈소스로 28일 공개했다. DBRX는 모든 기업을 위해 맞춤형 고성능 LLM의 학습과 튜닝을 보편화한다. 조직은 DBRX를 통해 더 이상 소수의 폐쇄형 모델에 의존하지 않아도 된다. DBRX는 오늘부터 바로 사용 가능하며, 전 세계 조직은 비용 효율적으로 자체 맞춤형 LLM을 구축, 교육 및 서비스할 수 있다. DBRX는 언어 이해, 프로그래밍, 수학 및 논리와 같은 표준 업계 벤치마크에서 라마2 70B 및 믹스트랄 8x7B와 같은 기존 오픈소스 LLM보다 뛰어난 성능을 제공한다. DBRX는 여러 벤치마크에서 GPT-3.5의 성능을 능가한다. 모델 평가와 성능 벤치마크에 대한 보다 자세한 정보, 그리고 DBRX가 SQL과 같은 내부 사용 사례에서 GPT-4 품질 대비 어떤 경쟁력을 제공하는지에 대한 자세한 정보는 모자이크 리서치 블로그에서 확인할 수 있다. 데이터브릭스는 효율성을 위해 메가블록스의 오픈소스 프로젝트에 기반한 전문가 혼합(MoE) 아키텍처로 DBRX를 최적화했다. 이로 인해 DBRX는 다른 주요 LLM대비 최대 2배 높은 컴퓨팅 효율 등 최고의 성능을 갖추고 있다. 또한 DBRX는 주어진 시간에 360억 개의 매개변수만 사용한다. 하지만 모델 자체는 1천320억 개 파라미터이므로 속도(토큰/초) 대 성능(품질) 측면에서 두 마리 토끼를 모두 잡을 수 있다. DBRX는 모든 기업이 커스터마이징할 수 있는 투명한 생성형 AI로 오픈소스 모델의 새로운 기준을 제시한다. 최근 미국 VC 기업 안드레센 호로위츠가 발표한 조사 결과에 따르면 AI 리더의 약 60% 가 오픈소스 사용을 늘리거나 미세 조정된 오픈소스 모델이 폐쇄형 모델의 성능과 거의 일치할 경우, 오픈소스로 전환하는데 관심을 보이는 것으로 나타났다. 2024년 이후에는 상당수의 기업이 폐쇄형에서 오픈소스로 전환할 것으로 예상되며, 데이터브릭스는 DBRX가 이러한 추세를 더욱 가속화할 수 있을 것이라고 확신한다. DBRX는 데이터브릭스 모자이크 AI의 통합 툴링과 결합돼, 고객이 데이터와 지적 재산에 대한 제어권을 유지하면서도 안전하고 정확하며 관리 가능한 생산 품질의 생성형 AI 애플리케이션을 신속하게 구축 및 배포할 수 있도록 지원한다. 고객은 데이터 관리, 거버넌스, 리니지 및 모니터링 기능이 내장된 데이터브릭스의 데이터 인텔리전스 플랫폼의 다양한 이점을 누릴 수 있다. DBRX는 깃허브와 허깅페이스에서 연구 및 상업적 용도로 무료로 사용 가능하다. 기업은 데이터브릭스 플랫폼에서 DBRX와 상호 작용하고, 검색 증강 생성(RAG) 시스템에서 긴 문장(context) 기능을 활용하며, 자체 고유 데이터에서 맞춤형 DBRX 모델을 구축할 수 있다. AWS와 구글 클라우드,, 마이크로소프트 애저 등에서도 직접 사용할 수 있다. 알리 고드시 데이터브릭스 공동창립자 겸 CEO는 “데이터브릭스는 데이터와 AI를 보편화하겠다는 사명 아래 모든 기업에 데이터 인텔리전스를 제공하여 그들이 보유 중인 데이터를 이해하고 이를 활용하여 자체적인 AI 시스템을 구축할 수 있도록 지원하고 있다”며 “DBRX 출시는 이러한 노력의 결과물”이라고 밝혔다. 그는 “DBRX는 최신 업계 벤치마크에서 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는 수준으로, 우리는 독점 모델을 오픈소스 모델로 대체하는 추세가 고객 기반 전반에 걸쳐 가속화될 것으로 기대된다”며 “DBRX는 전문가 혼합 아키텍처를 사용하기 때문에 초당 토큰 전송 속도가 매우 빠르며 비용 효율적이므로, DBRX는 오픈소스 LLM의 새로운 기준을 제시하며, 기업이 자체 데이터를 기반으로 맞춤형 추론 기능을 구축할 수 있는 플랫폼을 제공해 준다”고 덧붙였다. 데이터브릭스는 오는 4월 26일 한국시간으로 오전 12시 DBRX 웨비나를 개최할 예정이다.

2024.03.28 11:24김우용

데이터브릭스-엔비디아, 기술 통합 강화

데이터브릭스는 엔비디아와 협력을 확대하고 기술 통합을 강화한다고 21일 밝혔다. 엔비디아 GTC 2024 컨퍼런스에서 양사는 데이터브릭스의 데이터 인텔리전스 플랫폼의 데이터 및 AI 워크로드 최적화에 박차를 가할 계획이라고 강조했다. 이 협력은 최근 엔비디아가 데이터브릭스 시리즈I 투자에 참여한 것의 연장선이다. 데이터브릭스 모자이크 AI와 엔비디아는 데이터브릭스의 엔드투엔드 플랫폼에서의 생성형 AI 모델 구축과 배포를 향상하기 위해 모델 훈련 및 추론 분야에서 협력할 방침이다. 데이터브릭스는 데이터 및 모델 전반에 대한 완벽한 제어와 거버넌스는 물론, 생성형 AI 솔루션을 구축, 테스트 및 배포하기 위한 포괄적인 툴 세트를 제공한다. 데이터브릭스 모자이크 AI는 생성형 AI 모델 훈련을 위해 대형 언어 모델(LLM) 개발에 최적화된 엔비디아 H100 텐서 코어 GPU를 사용한다. 이로써 모자이크 AI는 엔비디아 가속 컴퓨팅의 성능을 활용하고, 고객을 위해 LLM을 커스터마이징할 수 있는 효율적이며 확장 가능한 플랫폼을 제공할 수 있게 된다. 한편, 데이터브릭스는 모델 배포를 위해 스택 전반에서 엔비디아 가속 컴퓨팅 및 소프트웨어를 활용한다. 데이터브릭스 모자이크 AI 모델 서빙의 핵심 구성 요소는 최첨단 성능을 제공하고 솔루션의 비용 효율성, 확장성 및 성능을 보장하는 엔비디아 텐서RT-LLM 소프트웨어다. 모자이크 AI는 텐서RT-LLM의 출시 파트너로서 엔비디아 팀과 긴밀한 기술 협력을 이어왔다. 데이터브릭스는 자사의 벡터화된 차세대 쿼리 엔진인 포톤에서 엔비디아 가속 컴퓨팅에 대한 기본적인(native) 지원을 제공하고, 이로써 고객의 데이터 웨어하우징 및 분석 워크로드의 속도와 효율성을 개선한다는 계획이다. 포톤은 업계 최고 수준의 가격 대비 성능과 총소유비용(TCO)을 자랑하는 데이터브릭스의 서버리스 데이터 웨어하우스인 데이터브릭스 SQL을 구동하고 있다. 데이터 쿼리 처리를 위해 GPU를 사용하는 데이터브릭스 고객이 늘어나는 가운데, 양사의 협력은 이러한 성장을 더욱 가속화할 것으로 기대된다. 데이터브릭스 머신러닝은 엔비디아 GPU를 포함하는 사전 구축된 딥러닝 인프라를 제공하며, ML용 데이터브릭스 런타임에는 드라이버와 라이브러리 등 사전 구성된 GPU 지원이 포함되어 있다. 사용자는 이러한 툴을 통해 적합한 엔비디아 인프라를 기반으로 신속하게 작업을 시작할 수 있을 뿐만 아니라, 사용자 간 일관된 환경을 유지할 수 있다. 데이터브릭스는 3대 주요 클라우드에서 엔비디아 텐서 코어 GPU를 지원해, ML 워크로드를 위한 고성능 단일 노드 및 분산 훈련을 지원한다. 데이터브릭스와 엔비디아는 데이터 인텔리전스 플랫폼의 모멘텀을 강화해 보다 다양한 조직이 품질, 속도 및 민첩성을 갖춘 차세대 데이터 및 AI 애플리케이션을 개발할 수 있도록 지원해 나갈 계획이다. 알리 고드시 데이터브릭스 공동창립자 겸 CEO는 “이번 파트너십 확장으로 엔비디아의 가속 컴퓨팅 및 소프트웨어를 통해 데이터브릭스의 워크로드를 가속화하고 고객에 보다 많은 가치를 제공할 수 있게 돼 기쁘다"며 “엔비디아는 분석 사용 사례에서 AI에 이르기까지 데이터브릭스의 기본 모델 이니셔티브를 다수 지원해 왔다"고 밝혔다. 그는 "쿼리 가속화를 위한 상호 협력을 통해 더 많은 기업에게 가치를 입증할 수 있을 것으로 기대한다”고 덧붙였다. 젠슨 황 엔비디아 창립자 겸 CEO는 “AI 시대에서 기업이 보유하고 있는 데이터는 인텔리전스를 도출하는 데 필요한 매우 중요한 자산"이라며 “엔비디아와 데이터브릭스는 효율성을 개선해 더욱 우수한 인사이트와 결과를 얻고자 하는 기업을 위해 데이터 처리를 가속화하고, 이로써 AI의 개발과 배포를 향상할 수 있다"고 강조했다.

2024.03.21 09:35김우용

메가존클라우드, 데이터·AI로 기업 의사결정 지원

메가존클라우드(대표 이주완)가 데이터 기반 통합 거버넌스 의사결정 지원 서비스를 지원한다. 메가존클라우드는 데이터브릭스와 딜리버리 프로바이더 프로그램(DPP)에 따른 파트너십 계약을 체결했다고 20일 밝혔다. DPP는데이터브릭스의 생태계 역량 강화 프로그램으로, 높은 기술 역량과 다양한 고객 사례를 보유하고 있는 파트너 업체에게만 파트너십 체결 자격이 부여된다. 평가 기준은 데이터 엔지니어링 전문가 자격증 유무, 데이터브릭스 솔루션에 대한 실무 지식, 프로젝트 수행 경험 등이다. 메가존클라우드는 ▲국내 시장에 대한 이해 ▲주요 클라우드 서비스 제공업체 관련 업무 경험 ▲클라우드, 빅데이터, 데브옵스 관련 컨설팅 제공역량 ▲데이터브릭스 솔루션 수행경험 부문에서 높은 평가를 받으며 심사를 통과해 데이터브릭스와 파트너십 계약을 체결했다. 메가존클라우드는 DPP 파트너십을 바탕으로 데이터엔지니어링 업무가이드, 마이그레이션 서비스, 데이터브릭스 유니티 카탈로그 등 고객사가 데이터와 AI의 통합 거버넌스를 위해 데이터브릭스 활용을 극대화할 수 있도록 지원하는 데이터브릭스 프로페셔널 서비스를 제공한다. 또한, 데이터브릭스와 기술 협력을 통해 다양한 프로젝트를 진행함으로써 최신 기술을 기반으로 고객에게 향상된 서비스를 제공할 계획이다. 메가존클라우드는 데이터브릭스 솔루션을 기반으로 기술검증, 고객사 대상 핸즈온 세션 지원, 데이터 전환 사업 구축 등을 진행하고 있다. 100여명 규모의 전문 조직을 통해 기업 고객에 최적화된 데이터브릭스 제품을 제공해 데이터 기반 인사이트 제공 및 데이터 비즈니스에 대한 전문성 강화를 지원해왔다. 지난해 7월에는 데이터브릭스가 인증하는 데이터 및 AI 전문가인 데이터브릭스 챔피언을 배출한 바 있다. 메가존클라우드 AI & 데이터분석센터 공성배 센터장은 “데이터브릭스와의 파트너십 확대로 긴밀한 협업 관계를 구축하고 더욱 전문적인 서비스를 제공할 수 있게 돼 기쁘다”며 "우리의 운영 및 관리 경험과 혁신적인 데이터브릭스의 솔루션을 통해 다양한 고객에게 데이터 기반의 신속한 의사결정을 지원하겠다"고 밝혔다. 데이터브릭스 그레그 테일러 아태지역 파트너 부문 부사장은 "데이터 인텔리전스 플랫폼을 통해 많은 한국 기업들이 독점 데이터를 기반으로 안전하게 생성형 AI를 구축할 수 있을 것이라고 확신한다"고 말했다.

2024.03.20 11:18남혁우

데이터브릭스, 미스트랄AI에 투자…플랫폼에 모델 통합

데이터브릭스는 유럽의 생성형 AI 솔루션 기업인 미스트랄 AI와 파트너십을 체결하고 시리즈 A 투자에 참여한다고 18일 밝혔다. 양사는 이 파트너십을 통해 데이터브릭스의 데이터 인텔리전스 플랫폼에 기본적으로 통합된 미스트랄 AI의 개방형 모델을 제공한다는 방침이다. 데이터브릭스 고객은 오픈 마켓플레이스인 데이터브릭스 마켓플레이스에서 미스트랄 AI의 모델에 접근하고, 데이터브릭스 콘솔에서 사용 가능한 모자이크 AI 플레이그라운드(에서 모델과 상호 작용할 수 있다. AI 구축, 관리 및 쿼리 통합 서비스인 모자이크 AI 모델 서빙을 통해 미스트랄 AI의 모델을 최적화된 모델 엔드포인트로 사용하고, 고객의 자체 데이터에 맞게 커스터마이징할 수 있다. 고객은 데이터 인텔리전스 플랫폼에 통합된 미스트랄 AI 모델을 즉시 사용할 수 있으며, 기업이 데이터브릭스 플랫폼의 핵심인 보안, 데이터 프라이버시 및 거버넌스를 저해하지 않으면서도, 자체적인 생성형 AI 애플리케이션을 위해 미스트랄 AI의 모델을 신속하게 사용할 수 있도록 지원한다. 믹스트랄 7B 및 믹스트랄 8x7B을 포함한 미스트랄 AI의 개방형 모델은 데이터브릭스 플랫폼에 완전히 통합된다. 아서 멘쉬 미스트랄 AI 설립자 겸 CEO는 “데이터브릭스와 전략적 제휴로 모두를 위한 생성형 AI의 이동성, 개방성 및 접근성을 향상하겠다는 양사의 의지를 재확인하게 돼 기쁘다”며 “미스트랄 AI의 모델을 데이터브릭스의 데이터 인텔리전스 플랫폼에 원활하게 통합함으로써 AI 보편화라는 공동의 목표에 한걸음 더 가까워 졌다”고 밝혔다. 그는 “이번 통합은 미스트랄 AI의 혁신적인 솔루션을 데이터브릭스의 방대한 고객 기반으로 확장시키는 중요한 이정표로, AI의 혁신과 발전을 촉진할 것으로 기대한다”며 “전 세계 사용자에게 접근성이 높고 획기적인 AI 솔루션을 제공하기 위해 지속적으로 노력하겠다"고 강조했다. 프렘 프라카시 데이터브릭스 AI 및 머신러닝(ML) 제품 마케팅 총괄은 "데이터브릭스는 고객이 잘 알려진 오픈소스 모델을 비롯해 업무에 적합한 모델을 선택할 수 있는 유연성과 도구를 제공하는 데 집중하고 있다”며 “올해 초에만 1,000개 이상의 기업이 데이터브릭스에서 미스트랄 모델을 활용해 수백만 건의 모델 추론을 수행했으며, 이번 파트너십 또한 이러한 고객에 대한 지원을 확대하기 위해서”라고 밝혔다. 그는 “고객이 생성형 AI 애플리케이션을 위해 미스트랄 AI 모델을 기본적으로 더욱 쉽게 접근, 커스터마이징, 배포 및 관리할 수 있는 간소화된 환경을 제공할 것"이라고 덧붙였다.

2024.03.18 10:41김우용

데이터브릭스, AI 기반 데이터 플랫폼 '아인블릭' 인수

데이터브릭스는 AI 기반 데이터 플랫폼인 아인블릭(Einblick)을 인수한다고 5일 밝혔다. 데이터브릭스는 이번 인수를 통해 조직이 데이터 인텔리전스를 보편화하고, 품질, 속도 및 민첩성을 갖춘 차세대 데이터 및 AI 애플리케이션을 개발할 수 있도록 지원한다는 방침이다. 아인블릭은 쉽게 인사이트를 도출할 수 있도록 자연어 질문을 코드, 차트 및 모델로 변환하는 최첨단 기술 분야를 선도하고 있다. 이 과정에서 데이터 팀에 민첩한 워크플로우를 제공해 데이터를 신속하게 탐색하고, 예측 모델을 구축하고 데이터 앱을 배포하며, 사용자가 자연어를 사용하여 데이터문제를 해결할 수 있도록 지원한다. 아인블릭은 매사추세츠 공과대학교(MIT)와 브라운 대학교의 연구원들이 설립했으며, 기계 학습, 인간과 컴퓨터간의 상호작용, 자연어 처리의 경계를 탐구하는 기업이다. 지난 4년간 아인블릭 팀은 사용자가 단 한 문장으로 데이터 문제를 해결할 수 있도록 돕는 AI 네이티브 협업 플랫폼을 개발해 왔다. 이번 인수를 통해 데이터브릭스는 아인블릭의 개발 기술을 기본 데이터 카탈로그와 긴밀하게 통합하고, 더욱 강력하게 확장해 나간다는 계획이다. 알리 고드시 데이터브릭스 CEO는 “임마누엘, 필립을 비롯해 유능한 인재를 갖춘 아인블릭 팀이 데이터브릭스에 합류하게 된 것을 매우 기쁘다”며 “데이터브릭스와 아인블릭 팀은 오늘날 조직이 성공하는데 데이터와 AI를 깊이 활용해야 한다는 공통의 가치관을 갖고 있다”고 밝혔다. 그는 “앞으로 아인블릭의 혁신적인 AI 네이티브 접근방식을 데이터브릭스의 플랫폼과 통합해, 조직이 데이터 인텔리전스를 보편화하고, 품질, 속도 및 민첩성을 갖춘 차세대 데이터 및 AI 애플리케이션을 개발할 수 있기를 기대한다”고 덧붙였다. 임마누엘 즈그라겐 아인블릭 공동창립자 겸 CEO는 “아인블릭을 처음 설립했을 때 우리의 목표는 가장 쉽고 협업이 가능한 데이터 플랫폼을 만들어 기업이 데이터로 더 많은 일을 할 수 있도록 지원하는 것이었다”며 “이 인수는 우리가 데이터브릭스와 힘을 합쳐 아인블릭의 사명을 더욱 발전시키는 중요한 이정표가 될 것”이라고 강조했다. 한편, 이번 인수는 지난 한 해 동안 데이터브릭스가 여러 차례 진행한 기업 인수의 연장선이다. 작년 10월 데이터브릭스는 실시간 데이터 복제 기술을 제공하는 선도적인 업체인 아르시온(Arcion)을 인수했다. 그전인 6월 말 유명 생성형 AI 플랫폼인 모자이크ML을 13억 달러에 인수했으며 그에 앞서 6월 초, AI용 스토리지 시스템을 구축하는 스타트업 루비콘을 인수했다. 5월에는 AI에 특화된 데이터 거버넌스 플랫폼인 오케라를 인수했다. 이같은 전략적 확장은 모든 규모의 기업이 보다 쉽게 대규모 모델 학습을 시행하고, 이러한 학습 데이터를 이해하는 AI 애플리케이션을 개발할 수 있도록 지원한다는 데이터브릭스의 사명과도 부합한다.

2024.02.05 09:12김우용

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

한미 관세 팩트시트 확정…기업들 "불확실성 걷혔다"

웹툰엔터vs픽코마, 3분기 성적·확장 전략 비교해보니

벤츠, 韓에 직판제·亞구매 허브 구축…"세계 최고 고객 경험 선사"

해킹 인질된 핀테크社 "몸값 줄 돈, 보안 연구 기부하겠다"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.