• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'데이터 Ai'통합검색 결과 입니다. (967건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

오라클DB, 생성형 AI 만났다…"앱 구축·데이터 분석 간소화"

"생성형 인공지능(AI)이 '오라클데이터베이스(DB)'에 스며들었다. 고객은 이런 융합형DB과 자율운영DB를 통해 현대 애플리케이션 운영과 데이터 분석 작업을 간소화할 수 있다." 오라클 앤디 멘델손 DB 서버 기술개발사업부 총괄 부사장은 지난 16일 서울 삼성동에서 열린 '모던 데이터 플랫폼 및 데이터베이스 혁신 전략' 기자간담회에서 최신 오라클DB 소개와 사업 전략을 발표했다. 기업이 데이터 중심 클라우드 전환을 위해선 최신 오라클DB 구축이 필수라고 재차 강조했다. 멘델손 부사장은 DB 솔루션에 생성형 AI를 접목한 '융합형DB'와 이를 구동하는 '자율운영DB'를 소개했다. 융합형DB는 기업 경영진과 개발자 모두 필요로 하는 통합된 데이터를 지원한다. 퍼블릭 클라우드, 클라우드앳커스터머, 사내구축형 환경에서 작동한다. 자율운영DB는 온라인 트랜잭션 처리를 비롯한 분석, 배치 서비스 등을 지원한다. 오라클DB와 오라클 엑사데이터 기반으로 이뤄졌다. 엑사데이터 클라우드앳커스터머와 OCI 전용 리전을 통해 사내구축형 환경에서도 작성한다. 그는 "두 솔루션은 모던 앱과 분석을 자동 생성할 수 있다"며 "사람이 작업하는 시간 자체를 줄일 수 있다"고 설명했다. 이어 "융합 개방형 SQL DB가 기존 단일목적 상용DB를 대체할 수 있다"며 "개발자와 전문가들은 데이터 통합 시간을 줄이고 혁신에 집중할 수 있을 것"이라고 덧붙였다. 앤디 멘델손 부사장은 DB 및 분석 서비스에 지속적으로 투자하고 있다고 강조했다. 그는 대표 솔루션 '오라클 엑사데이터 클라우드앳커스터머', '마이SQL 히트웨이브', '오라클 에어펙스', '오라클 애널리틱스'. '오라클 애널리틱스' 등도 이날 소개했다. 오라클 엑사데이터 클라우드앳커스터머는 고객 데이터 센서 안에서 클라우드 DB 서비스를 제공한다. 이를 통해 데이터 주권과 보안 요건 충족을 지원한다. 마이SQL 히트웨이브는 완전 관리형 DB 서비스 겸 단일 마이SQL DB에 트랜잭션, 분석 서비스 등을 결홉한 클라우드 DB 서비스다. ETL 복제 복잡성과 레이턴시, 비용 없이 실시간으로 분석을 진행한다. 오라클 에이펙스는 로우코드 개발 플랫폼이다. 기업이 확장 가능한 데이터 기반 앱을 구축하고 사내구축형 또는 클라우드 환경에서 구동할 수 있도록 지원한다. 오라클 애널리틱스는 통합 분석 서비스 플랫폼이다. 오라클 퓨전 클라우드 애플리케이션, 오라클 자율운영 DB, 기타 제품 등 사용 중 오라클 제품과 관계없이 데이터로부터 통찰력을 보다 신속하게 확보하고 예측 정확도를 높인다. 앤디 멘델손 부사장은 "앞으로 DB 서비스는 융합형으로 데이터 관리를 지원할 것"이라며 "여기에 생성형 AI까지 더해 작업 간소화를 이룰 수 있다"고 강조했다.

2024.04.17 09:17김미정

에이모, CES 통해 국내외 기업 21곳 '4Core' AI 데이터 솔루션 공급

AI 데이터 플랫폼 에이모(AIMMO, 대표 오승택)가 지난 1월 선보인 신제품 AI 데이터 솔루션 '4Core'로 21개의 국내외 유수 기업과 공급 계약을 체결했다고 16일 밝혔다. 에이모는 지난 CES 2024 기간 중 단독 컨퍼런스를 열고 데이터 수집부터 정제, 가공, 평가까지 전주기를 통합 관리하는 AI 솔루션 4Core를 출시했다. 고품질 데이터가 필수적인 자율주행, 로보틱스 등 전 산업 분야에 적용 가능한 솔루션으로 데이터 관리에 필요한 시간단축 및 비용절감, 오류 확률 최소화 등이 특징이다. 컨퍼런스 기간 동안 신제품은 많은 관심을 받으며 100여개 기업의 리드를 확보했다. 이 중 약 20% 기업과 제품의 각 코어별 기능 및 데이터 공급에 대한 계약을 통해 데이터 최적화를 제공한다. 현재 이외 기업과도 기술평가(POC)를 논의하고 있는 만큼 계약은 추가될 것으로 기대하고 있다. 이번 계약은 국내 IT 기업을 비롯해 유럽, 북미 기업까지 글로벌 기업과 성사된 것에 의의가 있다. AI 데이터에 대한 수요가 증가하는 가운데 기술력을 인정받아 높은 계약률로 이어진 것. 또 자율주행을 넘어 스마트시티 및 스마트팩토리 등에 공급하며 분야를 확장했다. 특히 트리플렛 등 AI 솔루션 업체와 상생, 협력으로 동반 성장하는 AI 데이터 생태계 조성을 꾀하고 있다. 신동화 트리플렛 대표는 "에이모의 데이터 관리 기술과 자사의 AI 영상분석 기술이 만나 시너지가 날 것으로 기대해 계약을 체결했다"고 밝혔다. 에이모는 신제품 출시와 동시에 글로벌 확장에 박차를 가하고 있다. 캐나다, 영국, 독일, 베트남, 미국까지 5개의 해외 법인을 운영하고, 지속적인 해외 전시 참가를 통해 글로벌 기업과 데이터 솔루션 공급 협력 관계를 강화 및 확대해 나갈 계획이다. 에이모 관계자는 "국내외 유수의 기업과의 공급 계약을 통해 에이모의 기술력과 사업 파트너로서의 강점을 지속적으로 인정받고 있다"며 "그간 쌓아온 경험과 실적을 바탕으로 전 세계 AI 데이터 시장을 적극 공략할 것"이라고 밝혔다.

2024.04.16 11:12백봉삼

"생성형 AI의 보안은 '안전'과' 정확성'을 함께 원한다"

“기업은 AI를 활용할 때 관리 가능하고 안전할 뿐만 아니라, 매우 정확하고 관련성 높은 결과물을 요구한다. 이미 챗봇이 '환각' 현상으로 인해 고객에게 부정확한 답변을 제공하고, 이로 인해 기업이 어려움을 겪은 사례도 많이 존재한다. 좋은 AI 전략을 세우려면 강력한 데이터 전략이 필요하다. 기업은 사내에서 자체 AI 모델을 구축하고, 기업 내부 데이터로 해당 모델을 학습시켜 부정확한 답변을 생성하지 않도록 하며, 궁극적으로 지적재산(IP)에 대한 소유권을 갖기를 원하고 있다.” 페르민 세르나 데이터브릭스 최고보안책임자(CSO)는 본지와 서면인터뷰에서 최근 생성형 인공지능(AI) 트렌드 속에서 나타나는 데이터 보안 분야의 체크포인트를 이같이 요약했다. 그는 “AI는 자동화로 생산성을 향상시키고, 데이터에 기반한 의사 결정을 통한 효율성 증대와 성공적인 비즈니스 등 다양한 이점을 제공한다”며 “미국을 비롯한 전 세계 조직이 이러한 이점을 인지함에 따라 AI를 도입하는 사례가 늘고 있지만 동시에 보안과 개인정보 보호에 관한 우려로 인해 AI 프로젝트를 실제 업무에 적용할 때 신중을 기하는 추세”라고 설명했다. 기업의 데이터 보안 전략은 생성형 AI 환경에서 새롭게 업그레이드돼야 하는 상황이다. 데이터 통제 및 관리, 규제 준수 같은 안전을 보장하는 생성형 AI를 만들면서도, 맥락에 적합한 정확한 답변과 성능을 구현해야 한다. IT 보안이 생성형 AI를 맞아 전보다 더 넓은 범위를 고려해야 하는 것이다. 이에 대해 페르민 세르나 CSO는 중요한 조언을 몇가지 제시했다. 그는 단일한 데이터 플랫폼을 구축해 통합적인 보안과 거버넌스 체계를 갖춰야 한다고 강조했다. 데이터 및 AI에 대한 통합 가시성, 데이터 및 AI에 대한 단일 권한 모델, AI 기반 모니터링 및 통합 가시성 등의 접근 방안을 소개하기도 했다. Q. 기업용 생성형 AI에 대해 내부 데이터를 접근할 때 권한 및 보안등급 관리, 규제 준수 등 거버넌스와 컴플라이언스 이슈가 있다. 이에 대한 조언을 한다면? 지난해 JP 모건 체이스, 버라이즌, 삼성전자 등이 고객 정보 및 소스 코드에 대한 통제권을 잃을 수 있는 잠재적 위험을 줄이기 위해 챗GPT 사용을 금지한다고 발표한 바 있다. 이는 거버넌스 도구를 '데이터의 세계'에서 '데이터와 AI의 세계'로 확장해야 하는 이유를 보여주는 대표적인 예다. 서로 다른 여러 플랫폼, 시스템 및 공급업체에 걸쳐 데이터와 AI를 관리하는 일은 매우 복잡하다. 모든 조직이 직면하고 있는 가장 큰 과제 중 하나는, 데이터 사일로와 데이터 개인정보 보호 및 제어에 관한 문제다. 조직에서 사용하는 시스템이나 플랫폼마다 데이터가 중복되거나 시스템 간에 이동될 수 있으며, 또 플랫폼마다 보안 및 거버넌스에 대한 접근 방식이 다를 수 있다. 레이크하우스 아키텍처에 구축된 데이터브릭스 데이터 인텔리전스 플랫폼과 같은 단일 통합 플랫폼을 선택하면 통합 보안 및 거버넌스를 통해 하나의 데이터 사본을 AI에서 비즈니스 인텔리전스(BI)에 이르는 다양한 사용 사례에 저장하고 사용할 수 있어, 이러한 보안 위험을 완화할 수 있다. Q. 데이터브릭스는 생성 AI 시대의 데이터 거버넌스와 컴플라이언스에 어떤 해법을 제시할 수 있나? 데이터브릭스는 2020년에 데이터 웨어하우스와 데이터 레이크의 장점을 결합하고 통합하기 위해 레이크하우스를 분야를 개척했다. 레이크하우스는 (1) 조직 내 모든 데이터 소스(정형, 반정형, 비정형 데이터)를 함께 쿼리하고 (2) 데이터를 사용하는 모든 워크로드(BI, AI 등)를 통합된 방식으로 관리할 수 있는 통합 시스템을 제공한다. 레이크하우스는 독자적인 데이터 플랫폼 범주로 자리 잡았으며, 현재 기업에서 널리 채택되어 대부분의 벤더 스택에 통합되어 있다. MIT 테크놀로지 리뷰 인사이트 보고서에 따르면, 전 세계 CIO의 74%가 자사의 레이크하우스를 보유하고 있다고 답했다. 레이크하우스 도입은 이미 시장에서 대세로 자리 잡았지만, 데이터브릭스는 레이크하우스와 생성형 AI를 결합해 데이터 인텔리전스 플랫폼이라는 새로운 범주의 데이터 플랫폼을 만들었다. 데이터 인텔리전스 플랫폼을 통해 기업은 자연어를 사용하여 한 곳에서 데이터를 통합, 관리 및 활용할 수 있다. 데이터 인텔리전스 플랫폼은 생성형 AI 모델을 사용하여 기업 데이터의 의미를 파악하고 플랫폼의 모든 부분에서 이렇게 이해한 내용들을 활용한다. 데이터브릭스의 통합 거버넌스 솔루션인 유니티 카탈로그를 통해 조직은 모든 클라우드 및 플랫폼에서 정형 및 비정형 데이터, 머신러닝 모델, 노트북, 대시보드 및 파일을 원활하게 관리할 수 있다. Q. 회사 내부 보안조직의 대응법이 있으면 소개해달라. 데이터브릭스의 데이터 및 AI 거버넌스 접근 방식은 아래와 같다 1. 데이터 및 AI에 대한 통합 가시성: 조직은 생성형 AI를 통해 자연어를 사용하여 데이터와 AI를 안전하게 검색하고, 이해하고, 인사이트를 추출하여 생산성을 높일 수 있다. 2. 데이터 및 AI에 대한 단일 권한 모델: 통합 인터페이스로 액세스 관리를 간소화해 데이터 및 AI 자산에 대한 액세스 정책을 정의하고 모든 클라우드 또는 데이터 플랫폼에서 이러한 정책을 일관되게 적용 및 감사할 수 있다. 또한, 조직은 행과 열을 세밀하게 제어하여 보안을 강화하는 동시에 원활하게 확장되는 로우코드 속성 기반 액세스 정책을 통해 액세스를 효율적으로 관리할 수 있다. 3. AI 기반 모니터링 및 통합 가시성: AI를 사용하면 모니터링을 자동화하고 오류를 진단하며 데이터 및 ML 모델 품질을 유지할 수 있다. 조직은 개인 식별 정보(PII) 데이터를 자동으로 감지하고, 모델 드리프트를 추적하며, 데이터 및 AI 파이프라인 내의 문제를 효과적으로 해결하여 정확성과 무결성(integrity)을 유지하는 사전 예방적 알림의 이점을 누릴 수 있다. Q. 방어자 입장에서 AI를 어떻게 받아들여야 바람직할까? AI는 조직이 방대한 양의 데이터를 선별해 패턴을 모니터링하고 분석하는 데 도움을 준다. AI는 이렇게 학습된 패턴을 기준선으로 삼아 비정상적인 행동을 감지하고 시스템에 대한 무단 액세스를 제한할 수 있다. 또한, AI는 위험의 우선순위를 정하고 멀웨어와 침입의 가능성을 즉시 감지하여 분석가의 1차 작업을 보강하는 데 도움을 줄 수 있다. 데이터 인텔리전스 플랫폼과 생성형 AI를 사용하면 조직 내 사이버 보안 팀들은 자연어를 사용하여 사고의 영향과 보안 속성에 대해 질문을 할 수도 있다. Q. 세계 각국에서 AI 안전에 대한 규제가 나오기 시작했다. 조직에서 AI 안전을 담당하는 주체는 누가 돼야 하고, 어떻게 무수한 규제에 대응하고 정책변경에 빠르게 적응할 수 있을까? 새롭게 생겨나는 AI 규제는 다양하고 복잡한 요구 사항을 가지고 있지만, 한편으로는 반복되는 주제를 담고 있다. 일반적으로 5가지 주요 영역에서 의무가 발생한다: 1. AI 개발 및 배포 주기의 모든 단계에서 필요한 데이터 및 모델 보안과 개인 정보 보호 2. 출시 전 위험 평가, 계획 및 완화 - 데이터 학습과 가드레일 구현에 중점을 두고 편향성, 부정확성 및 기타 잠재적 피해를 해결 3. 출시 시 필요한 문서 - 개발 과정에서 수행한 단계와 AI 모델 또는 시스템의 특성(기능, 제한 사항, 학습 데이터 설명, 위험, 완화 조치 등)에 관한 내용 포함 4. 출시 후 모니터링 및 지속적인 위험 완화 - 부정확하거나 기타 유해한 결과물 생성 방지, 보호 대상 그룹에 대한 차별 방지, 사용자가 AI를 다루고 있음을 인지하도록 하는 데 중점을 둠 5. 대규모 모델을 학습하고 실행하는 데 사용되는 에너지가 환경에 미치는 영향 최소화 이러한 목표를 달성하려면 모든 조직이 데이터와 AI 모델에 대한 완전한 소유권과 통제권을 확보하고 AI 개발 및 배포의 모든 단계에서 포괄적인 모니터링, 개인정보 보호 제어, 거버넌스를 이용할 수 있어야 한다. 조직은 데이터 품질을 제공하고, 더 안전한 애플리케이션을 제공하며, 규제 표준을 준수하는 데 도움이 되는 책임 있는 AI 목표를 달성하기 위한 통합된 접근 방식을 필요로 한다.

2024.04.16 10:07김우용

아직 갈길 먼 AI 도입, 가장 큰 과제는 '데이터'

글로벌 빅테크를 중심으로 생성형AI 기술이 하루가 다르게 급격한 발전을 이루고 있다. 하지만 아직 상당수의 기업들은 AI를 도입하는 데 어려움을 겪는 것으로 나타났다. AI 기술은 빠르게 발전하고 있지만 정작 AI학습 및 운영을 위한 기업 내 데이터가 아직 충분히 갖춰지지 않거나 체계화되지 않아 제대로 활용할 수 없기 때문이다. 최근 세일즈포스가 발표한 '2024 연결성 벤치마크 보고서'에 따르면 62%의 기업에서 “아직 AI 활용에 필요한 데이터 시스템 통합이 준비돼 있지 않다”고 답했다. 15일 관련 업계에 따르면 기업들이 AI 도입을 검토하는 과정에서 가장 부담을 느끼거나 피로감을 느끼는 부분도 데이터로 나타났다. GPT-4 등 생성형AI는 대규모언어모델(LLM)이라는 용어처럼 방대한 양의 데이터를 기반으로 한 사전학습이 필요하다. 데이터를 학습할수록 AI로부터 자연스러운 반응을 이끌어내고 오류율을 낮출 수 있기 때문이다. 오픈AI, 구글 등 빅테크 기업들은 이미 사전에 확보한 데이터를 거의 소진했으며, 보다 높은 AI성능을 확보하기 위해 저작권 규정도 무시한 채 추가 데이터 확보에 사활을 걸고 있다. 반면 일반 기업들은 내부 데이터도 AI학습을 위해 체계화하거나 일원화하지 않은 사례가 상당수인 것으로 알려졌다. 아직 많은 기업들이 IT역량이 부족해 AI 서비스를 도입 과정에서 데이터 통합이 필요하다는 것을 모르는 경우가 상당수라는 지적이다. 조직 또는 부서 간 갈등도 데이터 통합을 막는 주요 원인 중 하나로 지목됐다. 각 조직은 데이터를 개인자산이라고 생각하는 경우가 많아 데이터 통합 과정에서 이를 공개하는 것을 꺼리거나 공유를 반대한다는 것이다. 이로 인해 세일즈포스 설문조사 결과에 따르면 IT 리더 중 98% 이상이 조직의 디지털 혁신에 어려움을 겪고 있으며, 이중 81%는 데이터가 산발적으로 격리된 데이터 사일로가 AI 도입과 운영의 가장 큰 장벽이라고 밝혔다. 관련 기업들은 AI 도입에 앞서 자동화 도구 등을 활용해 데이터를 AI 학습에 적합한 방식으로 전환하는 과정을 반드시 거칠 필요가 있다고 강조했다. 특히 AI 전문 기업과의 소통을 통해 AI와 데이터의 연관 관계를 이해하고 AI 학습을 위해 사내 데이터를 어떻게 데이터베스화 할 것이지 충분히 고려해야 한다고 조언했다. 조규곤 파수 대표는 “기존 데이터가 아무리 많더라도 데이터베이스화하지 않으면 AI에서 에서 제대로 활용하기 어렵다”며 “기업에서 활용할 목적에 따라 AI를 활용할 수 있도록 체계화해 데이터베이스를 구축해야 한다”고 강조했다. 옵스나우 조용석 IoT옵스 개발팀장은 “수많은 설비와 장비로 이뤄진 공장은 수만 개 이상의 센서에서 데이터가 끊임없이 생성되고 축적되지만 이를 그대로 AI에 활용할 수 있는 곳은 존재하지 않는다”며 “데이터의 특성이나 종류에 따라 적합한 DB모델로 분배하고 관리할 수 있는 플랫폼을 구축하지는 과정을 거치지 않으면 AI 도입을 위해선 더욱 많은 시간과 비용을 지출해야 한다”고 말했다.

2024.04.15 15:08남혁우

마이크로스트레티지코리아, 정경후 신임 지사장 선임

마이크로스트레티지는 정경후 신임 한국지사장을 선임했다고 15일 밝혔다. 정경후 지사장은 BI 및 데이터 분석 분야에서 20년이 넘는 경험을 보유한 업계 베테랑으로서 마이크로스트레티지 코리아의 전반적인 운영을 이끌고 사업 확장을 추진한다. 데이터는 비즈니스의 핵심 자산이며 특히, AI 시대에 접어들면서 기업들의 데이터 분석 및 활용 능력은 기업 경쟁력의 중요한 요소로 자리매김하고 있다. 기업은 데이터에 입각한 의사결정을 통해 생산성과 업무효율성을 향상시키고, 새로운 시장 발굴 및 고객 인사이트를 확보하며, 혁신적인 제품과 서비스를 개발할 수 있다. 이와 같은 AI 시대에, 마이크로스트레티지는 분석 통합 플랫폼 '마이크로스트래티지원'과, 최근 발표한 AI 기능인 '마이크로스트래티지 오토 봇'을 기반으로 국내 기업의 데이터 분석 및 활용과 차별화된 경쟁력 확보를 지원하고 있다. 정경후 신임 지사장은 마이크로스트레티지 합류 이전에 IBM에서 기술 엔지니어로 근무했으며, 2011년 마이크로스트레티지 코리아에 입사해 수석 기술 엔지니어로서 경험과 성과를 쌓다 마이크로스트레티지 아시아태평양지역의 최고 기술 총괄을 역임하면서 비즈니스 전략 수립 및 운영 능력을 인정받았다. 이후 아세안 및 중국 지역의 지사장을 맡으면서 마이크로스트레티지의 경쟁력과 위상을 높이는데 공헌했다. 정경후 지사장은 “국내 시장에서 마이크로스트레티지의 비즈니스 성장을 견인하는 역할을 맡게 되어 기쁘다. 선진화된 '마이크로스트래티지원' 분석 플랫폼과 탁월한 고객 서비스로 가장 신뢰할 수 있고 인정받는 비즈니스 인텔리전스(BI) 업체로 업계를 선도해 나가겠다”고 밝혔다. 그는 “마이크로스트레티지는 AI 분석 기능의 선두주자로서 리테일, 제조업, 게임, 헬스케어, 서비스 분야를 중심으로 수많은 AI 분석 도입 사례와 전문 인력을 가졌다”며 “국내 기업이 AI 분석을 통해 글로벌 시장에서 경쟁 우위를 선점할 수 있도록 한국 지사 차원에서 지속적인 교육을 실시하고, 국내외 AI 분석 성공 사례를 바탕으로 최고의 전문가 팀이 클라우드를 통한 신속한 AI 분석이 구현될 수 있도록 적극 지원하겠다”고 덧붙였다.

2024.04.15 11:35김우용

중동 오일달러, AI 데이터센터 '정조준'..."사막지형 탓 한계도 뚜렷"

중동 지역 국가들이 인공지능(AI) 데이터센터 건립 경쟁에도 불이 붙은 모습이다. 원유 기반 사업에서 탈피하기 위해 국가 경제 체질을 전향적으로 변모시키기 위해서다. 사우디아라비아와 아랍에미리트(UAE)는 거액을 들여 투자 펀드도 조성할 태세다. 다만 전제군주제라는 체제와 사막 지형은 한계로 거론된다. 최근 블룸버그 통신 등 복수의 외신에 따르면 미국의 데이터 센터 개발 기업 에퀴닉스(Equinix)는 UAE에서 네 번째 데이터 센터를 건립한 데 이어 최근엔 사우디로까지 확장을 논의 중인 것으로 알려졌다. 에퀴닉스의 데이터센터 확장은 사우디와 UAE 등 중동 국가의 이해관계와 맞아떨어진다. 양 국가 모두 원유 기반 사업에서 벗어나 AI 초강대국이라는 도전적인 목표를 설정했다. 앞서 사우디는 미국의 벤처캐피탈 앤드리슨 호로위츠와 협약을 체결하고 AI 분야에 400억달러(약 55조원)를 투자하는 방안을 검토 중이다. UAE 역시 지난 3월 최대 1천억달러(약 137조원)에 달하는 AI 투자 펀드를 발표한 바 있다. 특히 생성형 AI 모델에서 수위를 달리고 있는 샘 알트만 오픈AI 최고경영자(CEO)는 UAE 정부 관계자들과 만나 대규모 AI 인프라를 지원하기 위한 협력방안을 논의하기도 했다. AI 산업이 양국에 불러올 경제적 파급효과는 어마어마하다. 글로벌 컨설팅 기업 PwC는 오는 2030년까지 UAE가 AI로 인해 960억달러(약132조원), 사우디가 1천350억달러(약185조원의) 경제적 이득을 볼 것이라고 추산했다. 현재 중동 국가들의 데이터센터 처리 용량 역시 부족하다. 글로벌 리서치 기업 DC바이트에 따르면 지난해 말 기준 UAE의 데이터센터 처리 용량은 235메가와트(MW), 같은 기간 사우디의 처리 용량은 123MW에 불과하다. 반면 독일의 데이터센터 처리 용량은 1천60MW다. 두 국가 모두 AI 산업 육성을 비롯해 데이터산업 유치에도 혈안이지만 한계가 여럿 존재한다. 사우디는 전제 군주제 군가다. 외국 빅테크 기업의 데이터센터가 들어설 경우 정보 유출이 우려된다는 점이다. 즉, 이 문제는 사우디의 국가 운영이 민주적으로 작동하지 않다는 데 있다. 실제 무함마드 빈 살만 왕세자는 국가 운영의 전권을 쥔 상황에서 왕실은 입법·행정·사법 영역 모두를 주무르고 있다. 또 척박한 사막으로 이루어진 국토 탓에 데이터센터에 들어가는 컴퓨팅 시설이 효과적으로 작동하는 게 어렵다는 점이다. 더위 탓에 열이 올라간 데이터 센터에 냉각 장치를 달아줘야 하고 이 때문에 전력 공급은 더욱 많아질 수밖에 없다. 두바이에 본사를 둔 하다아라 컨설팅(Hadaara Consulting) 칼 로버츠 고문은 "AI를 위해서는 수백 기가와트의 데이터 센터 전력이 필요하지만 인프라가 없다"면서 "AI에 초점을 맞춘 빅 데이터 센터를 갖추려면 아직 갈 길이 멀다"고 진단했다.

2024.04.13 10:12이한얼

HPE AI 스토리지 '알레트라 MP 파일' 집적도 대폭 향상

지난달 HPE는 인공지능(AI), 기계학습(ML), 고성능컴퓨팅(HPC) 등의 전용 스토리지인 'HPE 알레트라 MP 파일 스토리지'의 신규 업데이트를 출시했다. HPE 알레트라 MP 파일 스토리지는 엔터프라이즈 대규모 AI 환경, 데이터레이크 등의 데이터 중심의 고성능 워크로드에 최적화된 스토리지로 활용되고 있다. 가장 큰 변화는 고집적성이다. 기존 대비 랙 유닛당 4배 많은 용량과 2배 향상된 성능을 제공한다. 그에 따라 AI 업무 처리량을 2배로 늘릴 수 있고, 전력 소비를 최대 50%까지 절감할 수 있게 됐다. 컨트롤러의 접적성 향상 뿐만 아니라 1RU당 1.3PB 용량의 올NVMe를 제공하는 드라이브 샤시의 혁신을 통해 비용을 크게 줄이며 데이터 센터의 상면과 전력 소비를 크게 절감할 수 있다. 이러한 개선 사항을 통해 HPE는 AI 및 데이터레이크 등 데이터 중심의 고성능 워크로드에서 성능, 운영 편의성, 효율성 향상을 달성할 수 있도록 도움을 준다. 작년 출시된 HPE 알레트라 MP 파일 스토리지는 지속적인 업데이트와 혁신 적용을 약속해 왔으며 최신 업데이트에서 기존 대비 7배 높은 고집적도를 제공하면서 그 약속을 실현했다. 이번 업데이트를 통해 HPE 알레트라 MP 파일스토리지는 경쟁사의 파일 스토리지 대비 2.3배 높은 집적성을 제공한다고 회사측은 강조했다. HPE는 특히 AI 워크로드에서 성능과 역량적인 측면을 더욱 개선해왔다. 이는 폭발적으로 증가하는 AI 워크로드에 대응해 가장 범용적인 스케일아웃 파일 스토리지에 투자하길 원하는 고객을 선제적으로 지원하기 위한 HPE의 노력을 반영한다. 많은 기업이 AI를 최우선 당면 과제로 여기고 있으며 신속하게 도입, 적용하고 확대함에 따라 HPE는 그에 맞는 AI 전용 스토리지를 출시하여 고객들의 고민을 함께 해결해왔다. HPE 알레트라 MP 파일은 작은 규모로 시작해 대규모로 확장할 수 있는 유연성과 효율성을 제공하고, 스냅샷, 원격복제, 중복제거·압축·유사성제거, QoS, 고가용성 아키텍처 등 엔터프라이즈급 환경을 지원한다. 고성능을 통해 학습, 튜닝, 추론의 모든 AI 단계를 아우를 수 있다. 그렇기에 생성형 AI, 대규모 언어 모델(LLM) 등 다양한 AI 워크로드에서 각광을 받고 있다. AI 워크로드를 처리함에 있어 기존의 레거시 스케일아웃 NAS 스토리지는 성능 확장성의 제한이라는 한계점이 존재한다. 비공유 아키텍처로 인해 발생하는 한계다. 기존의 스케일아웃 스토리지는 다수의 노드로 구성되며, 각 노드는 컨트롤러 CPU, 메모리, 드라이브, NIC가 함께 구성된다. 각 노드 내부에 저장된 데이터는 해당 노드 자신만이 데이터를 볼 수 있으며, 다른 노드와 공유 및 분산저장, 처리하려면 고속의 네트워크로 구성돼야 하며, 그로 인해 발생하는 이스트웨스트 트래픽으로 인해 성능 확장성의 한계를 가지게 된다. 즉, 단 하나의 파일을 접근하는 작업이라도 항상 모든 노드들과 통신을 해야만 하는 단점이 존재한다. HPE 알레트라 MP 파일 스토리지의 공유 아키텍처는 컨트롤러와 드라이브 노드를 분리 구성해 모든 컨트롤러는 모든 드라이브를 직접 볼 수 있는 구조로 노드 간 이스트웨스트 트래픽을 원천적으로 제거했다. 이로 인해 성능 확장이 필요한 경우 컨트롤러만 독립적으로 증설하여 효율적인 성능 확장이 가능하다. 용량 확장이 필요한 경우 드라이브만 독립적으로 증설해 불필요한 컴퓨팅 파워의 증설을 사전에 방지할 수 있다. HPE 알레트라 MP 파일 스토리지는 기본 장착되는 고속의 NVMe SCM이 캐싱역할을 담당해 빠른 응답속도를 제공한다. 모든 데이터는 NVMe SSD에 최종 저장돼 미디어 간 데이터 이동, 티어링을 하지 않아 데이터 집약적인 AI 워크로드에서 성능을 극대화 한다. HPE 알레트라 MP 파일 스토리지는 생성형 AI 및 LLM 등을 비롯한 가장 까다롭고 데이터 집약적인 AI 워크로드 전반에서 빠르고 일정한 수준을 유지하는 성능을 제공할 수 있다. 레거시 파일 스토리지는 또 다른 문제가 있다. 전문 지식을 가진 엔지니어만 스토리지를 다룰 수 있으며 유지보수관리를 위해 복잡하고 어려운 명령어 기반의 수동 작업이 필요한 경우가 바로 그것이다. 이로 인해 조직은 새로운 AI 모델의 가치 창출보다 반복적이고 일상적인 관리 업무에 많은 시간을 소모하게 된다. HPE 알레트라 MP 파일은 누구나 쉽고 간편하게 다룰 수 있는 GUI로 모든 관리를 할 수 있다. 운영 및 관리 오버헤드를 줄이고 AI 를 통한 생산성 향상에 기여를 한다. 더 이상 전문 지식과 복잡한 설정 프로세스가 필요하지 않으며 새로운 개발 및 혁신에 걸리는 시간을 단축할 수 있다. HPE 그린레이크 플랫폼에서 동작하는 클라우드 관리 콘솔을 제공해 언제 어디서나 모든 기기에서 엑세스할 수 있는 통합 관리를 제공한다. 스마트폰처럼 최적의 버전에 대한 업데이트 알림을 주고 시스템 중단 없이 업그레이드를 수행할 수 있다. 블록스토리지, HCI, 백업·복구, 재해복구, SAN 스위치 등을 함께 통합된 환경에서 관리할 수 있어 인프라 관리에 소요되는 시간과 인력, 노력을 최소화 할 수 있다. 데이터 집약적인 AI 모델은 스토리지 용량, 상면, 전력 소비와 관련해 충족해야 할 사항들이 매우 많다. 하지만 레거시 NAS 스토리지는 집적성, 단위 TB당 비용, 전력 효율성 등의 요구사항을 충족하기에 턱없이 부족하다. HPE 알레트라 MP 파일은 단위 랙 유닛 밀도당 4배 더 많은 용량과 절반의 전력 소비로 AI 스토리지 비용을 절감한다. 데이터 중복제거·압축·유사성제거 기술, 무중단 업그레이드, 낭비 자원을 방지하는 애즈어서비스 구독형 AI 스토리지 모델을 통해 탄소 배출량도 줄일 수 있다. 성능과 용량을 독립적으로 확장 가능하여 확장 효율성을 높이면서도 비용은 절감시킬 수 있고, NVIDIA의 GPU다이렉트 스토리지 기능을 완벽 지원하여 GPU 사용률을 극대화함으로써 GPU의 투자수익(ROI)을 최대화할 수 있다. 용량 효율성 측면을 살펴보면, 업계 유일의 유사성 제거 기능을 통해 중복제거, 압축과 더불어 한번 더 용량을 절감하여 저장할 수 있다. 유사성 제거는 매우 정교한 방식으로 데이터를 줄여주는 기술로 생명과학 데이터의 경우 2대1, 중복제거된 백업, 압축 로그 파일, HPC 및 애니메이션 데이터의 경우 3대1, 그리고 비압축 시계열 데이터의 경우 8:1의 비율로 절감 효과가 있다. HPE 알레트라 MP 파일스토리지는 엔비디아 퀀텀-2 플랫폼과 우수한 호환성을 제공하며, 인피니밴드, 엔비디아 GPU다이렉트 연동을 통한 AI 모델 생성시 체크포인트를 신속하게 생성할 수 있어 GPU 활용을 최적화 하고 AI 워크로드를 가속화한다. 데이비드 유 HPE 스토리지 제품 수석 매니저는 “조직이 AI 당면 과제를 해결하고 오늘날의 시장에서 경쟁하려면 엔터프라이즈급 성능, 간편성, 효율성을 모두 제공할 수 있는 전용의 AI 파일 스토리지가 필요하다”며 “AI 워크로드를 진정으로 가속화하려면 이 세 가지 역량을 모두 필수적으로 갖춰야 한다”고 설명했다. 그는 “HPE 알레트라 MP 파일은 각 역량을 모두 제공하도록 설계되었으며 학습, 추론, 튜닝의 모든 AI 단계에 적합하다”며 “AI, HPC, 데이터레이크, 생명과학, 금융, 미디어 & 엔터테인먼트, 교육, 제조 등의 모든 워크로드를 포괄하는 유일한 솔루션으로 데이터를 활용해 가치를 창출해내려는 모든 기업에 최고의 지원을 제공한다”고 강조했다.

2024.04.12 13:34김우용

리벨리온, 'PCIe 5.0' 컴플라이언스 테스트 통과

AI 반도체 스타트업 리벨리온은 데이터센터향 AI반도체 '아톰(ATOM)'을 탑재한 '아톰 카드'가 업계 표준화 단체 'PCI-SIG'가 주관하는 PCIe 5.0 컴플라이언스 테스트를 통과했다고 12일 밝혔다. 리벨리온은 국내 AI 반도체 스타트업으로는 최초로 PCIe 5.0 지원에 대한 공식 검증을 통과했다. 국내에서 해당 검증을 통과한 기업은 삼성전자, SK하이닉스와 리벨리온이 유일하다. PCIe는 컴퓨터 내부에서 다양한 부품들이 빠르고 정확하게 데이터를 주고받을 수 있도록 하는 기술 규격으로 SSD, 그래픽카드 등 다양한 전자 기기에 활용된다. PCI-SIG가 주관하는 컴플라이언스 테스트는 특정 기기 또는 플랫폼이 특정 세대의 PCIe를 얼마나 안정적으로 지원하는지 다양한 항목을 기반으로 평가한다. 리벨리온의 아톰 카드는 이번 테스트의 모든 평가항목을 통과해 최신 5세대 규격인 PCIe 5.0을 지원하기 위한 기술과 성능, 다양한 서버 및 플랫폼에 대한 호환성을 증명했다. 더불어 16개의 레인(Lane)을 지원해 높은 대역폭(bandwidth)과 속도를 확보했다. 레인(Lane): PCIe에서 데이터롤 전송하는 하나의 양방향 경로를 말하며, 레인이 많을수록 컴퓨터 내부에서 데이터를 더 많이, 빠르게 전송할 수 있다. 리벨리온은 여러 대의 아톰 카드를 연결해 AI연산의 성능과 효율성을 높이는 일명 멀티카드 환경에 PCIe 5.0 기술을 활용하며, 언어모델을 포함한 생성형AI 모델을 가속한다. 고객은 공인받은 고속 통신 기술을 기반으로 큰 규모의 AI모델을 더욱 빠르고 효율적으로 연산할 수 있다. 리벨리온은 올해 중순부터 고객에게 멀티카드 환경 기반으로 소규모 언어모델(SLM)을 가속할 수 있도록 지원할 예정이다. 이를 바탕으로 SLM 기반 상용서비스를 기획하는 PoC를 본격적으로 진행하고, ATOM 양산품의 상용화를 추진할 계획이다. 오진욱 리벨리온 CTO는 "수준 높은 AI 추론 연산을 제공하기 위해선 칩 설계 뿐 아니라 카드 단위에 적용되는 통신 기술 또한 중요한 역할을 수행한다"며 “리벨리온은 단순히 최신 통신기술을 선제 적용하는 데 그치지 않고 기술의 안정성까지 철저히 검증받음으로써 생성형 AI 추론의 필수 인프라인 멀티카드 솔루션의 성능과 신뢰성을 모두 확보하고자 했다"고 밝혔다.

2024.04.12 10:01장경윤

디노도, 구글클라우드와 생성형 AI 통합 발표

디노도테크놀로지(이하 디노도)는 구글클라우드와 파트너십의 일환으로 데이터 통합, 관리 플랫폼인 디노도 플랫폼과 구글 클라우드의 버텍스 AI를 새롭게 통합한다고 11일 밝혔다. 디노도는 데이터 가상화 기술을 기반으로 구글 클라우드와 협력해 논리적 데이터 관리 기능을 생성형 AI 서비스와 결합하고 최신 대규모언어모델(LLM)을 활용할 수 있도록 지원할 계획이다. 오늘날 기업은 금융 서비스, 의료, 제조, 소매, 통신, 고등 교육 등 산업 전분야에 걸쳐 생성형 AI를 활용한 비즈니스 혁신 방안을 적극적으로 찾고 있다. 이번 양사의 플랫폼 통합으로 기업은 제미나이 모델을 이용해 혁신적인 신규 서비스와 애플리케이션을 개발할 수 있게 돼 실질적인 변화를 추진할 수 있게 된다. 구글클라우드는 인프라 플랫폼, 산업 솔루션 및 전문성을 결합해 기업 비즈니스의 디지털 혁신 역량을 강화한다. 기업은 구글 클라우드의 생성형 AI 및 LLM 기술과 결합한 디노도 플랫폼을 활용해 자사의 데이터를 안전하고 효율적으로 버텍스 AI 애플리케이션에 제공함으로써 편향성 완화, 개인정보 보호 및 인적 오류 등 윤리적 고려사항을 책임감 있게 지킬 수 있다. 리티카 수리 구글클라우드 기술파트너십부문 이사는 “생성형 AI는 비즈니스 운영 방식을 현저하게 개선하고 사실상 모든 산업에 이익을 제공할 수 있다”며 “디노도는 구글 클라우드의 선도적인 생성형 AI 기능을 활용함으로써 고객이 데이터 운영을 개선하고 생산성을 향상하는 데 도움이 되는 새로운 인사이트를 확보할 수 있도록 지원할 수 있게 됐다”라고 밝혔다 . 나라얀 순다르 디노도 전략적 제휴 담당 선임 이사는 “다양한 산업 분야의 기업들이 디노도의 논리적 접근방식을 통해 데이터를 통합 및 관리하고, 사전에 훈련된 LLM 과 외부 데이터 소스를 결합한 RAG 기술을 적용할 수 있다”며 “양사의 이번 플랫폼 통합은 데이터와 생성형 AI의 강력한 힘을 기반으로 새로운 차원의 비즈니스 가치를 실현함으로써 기업이 혁신의 한계를 재정의할 수 있는 계기를 제공한다”고 강조했다. 그는 “구글클라우드의 오랜 파트너인 디노도는 신뢰할 수 있고 연관성 있는 데이터를 쿼리하고, 비즈니스 인사이트를 제공하는 섬세한 응답을 생성할 수 있도록 함으로써 LLM의 기능을 개선한다” 고 덧붙였다.

2024.04.11 10:17김우용

AI 플랫폼, 성능과 지속가능성 함께 잡는 전략은

전 세계 기업이 AI로 다양한 문제를 해결하고 비즈니스 성장을 이끌고 있는 가운데, 기존의 데이터 관련 접근 방식은 막대한 초기 투자와 높은 에너지를 소비해 지속가능성 면에서 우려를 낳고 있다. 대화형 AI 서비스, 문서 초안 작성, 이미지 및 동영상 생성, 작곡 등을 수행하는 모든 AI 모델은 시간당 메가와트 단위의 막대한 서버 운영 비용을 발생시킨다. AI 모델의 전력 소비량을 정확히 추정하는 건 어렵다. AI 개발과 운영에 필요한 GPU의 전력 외에 CPU, 저장매체, 스토리지, 네트워킹 등의 전력도 전체 에너지 소비에 영향을 주며, 데이터센터의 냉각과 공조에 소비되는 전력도 무시할 수 없다. AI 모델의 소비 전력량은 이같은 여러 요소를 종합적으로 판단하고, 각 인프라 상황에 따라 달라질 수 있다. AI 모델의 전력 소비량은 학습과 추론에 따라 다르게 볼 수 있다. 2022년 발표된 한 논문에 따르면, 오픈AI의 GPT-3를 학습시키는 데 1천300메가와트시(MWh) 수준의 전력이 필요한 것으로 추정된다. 이는 넷플릭스 동영상 스트리밍을 162만5천시간동안 지속하는 양이다. 허깅페이스와 카네기멜론대학교의 알렉산드라 사샤 루치오니 박사의 작년 12월 연구 조사에 의하면, AI 모델의 샘플 1천건 분류에 0.002킬로와트시(kwh)를 소비하는 반면, 텍스트 생성 작업을 1천번 실행하는데 평균 0.0476kWh의 에너지를 사용한다. 이미지 생성 모델은 1천회 추론당 평균 2천907kWh 전력을 사용하는 것으로 나타났다. 이 연구는 학습보다 추론에 더 많은 전력을 사용한다는 것을 보여준다. 또 엔비디아 GPU의 비트코인 채굴 시 전력 소비량을 계산했던 알렉스 드 브리에스 VU 암스테르담 박사과정 후보자의 작년 연구에 의하면, AI 부문은 2027년까지 매년 85~134테라와트시(TWh)를 소비할 것으로 예측됐다. 이는 네덜란드 연간 전력수요와 비슷한 수준이다. 드 브라이스는 2027년까지 AI 전력 소비가 전세계 전력 소비의 0.5%를 차지할 것이라고 전망했다. 국제에너지기구는 2022년 현재 데이터센터의 전력 사용량을 약 460TWh로 추정하면서 2026년까지 620~1천50TWh로 증가할 것이라고 최근 보고서에서 추정했다. 이같은 급격한 전력 소비량 증가세는 AI 수요의 영향 때문이다. 여러 연구자들은 AI 모델을 전력 소비를 절감하는 방향으로 구성하면 에너지 소비량을 크게 줄일 수 있다고 강조한다. 지금까지 AI 모델 개발과 운영은 주로 성능 개선에만 초점을 맞추고 발전해왔고, 현 상황부터 에너지 절감에 초점을 맞추면 얼마든지 개선할 수 있다는 것이다. 연구자들은 AI 인프라 관련 제조사에서 제품 전략을 지속가능성이란 한방향으로 맞추면 달성할 수 있다고 조언한다. AI 모델의 성능과 에너지 절감 즉, 지속가능성을 함께 달성하는 여러 방법 중 하나로 가장 활발한 주장을 내놓는 회사는 퓨어스토리지다. 퓨어스토리지는 고가용성 올플래시 스토리지인 플래시블레이드를 AI 데이터 플랫폼 솔루션으로 제시하면서 데이터센터의 에너지 절감을 주요 강조점을 내세우고 있다. AI 프로젝트의 성공은 방대하고 다양한 종류의 데이터 처리에 달려 있다. 정형 데이터뿐 아니라 수집, 저장, 분석이 까다로운 비정형 데이터 관리에 최적화된 퓨어스토리지의 플래시블레이드는 파일과 오브젝트 모두를 지원하며, 데이터 크기나 액세스 패턴에 관계없이 우수한 성능을 제공한다. 플래시블레이드는 데이터 증가에도 성능을 유지하는 스케일아웃 구조를 갖추고 있어, 성능과 용량을 필요에 따라 유연하게 확장할 수 있으며 다양한 스케일의 AI 수요를 충족시킨다. 퓨어스토리지는 올플래시 스토리지를 통해 AI 데이터 운영을 간소화하고, 컨테이너화된 AI 환경에서 셀프 서비스 기능 및 서비스수준협약(SLA) 기반 리소스 프로비저닝을 제공한다. 경쟁 솔루션 대비 에너지 사용량과 데이터센터 내 상면 공간을 최대 80%까지 절감하고, 전자 폐기물을 85%까지 감소시켜 데이터센터 비용 절감에도 크게 기여한다. 기존 AI 데이터 스토리지는 용량 확장만 가능할 뿐, GPU 발전에 따른 성능 향상은 어려웠다. 구축과 최적화에 장시간이 소요되며, 내구연한에 이를 경우 최신 하드웨어로의 업그레이드가 필요하지만 무중단 업그레이드는 불가능했다. 이에 퓨어스토리지는 클라우드와 같은 구독형 모델을 올플래시 스토리지에 접목했다. 퓨어스토리지는 클라우드와 같은 구독형 모델을 올플래시 스토리지에 적용하여, 기업이 스토리지를 사용하는 만큼만 비용을 지불하게 하고, 스토리지 업그레이드 시 기존 제품의 교체 번거로움과 데이터 마이그레이션 중 발생할 수 있는 서비스 중단 문제를 해결했다. 퓨어스토리지의 구독 서비스인 에버그린(Evergreen) 포트폴리오를 통해, 데이터 플랫폼을 항상 최신 하드웨어와 소프트웨어로 유지함으로써 최고의 성능을 제공하고, 업그레이드 과정에서도 시스템 중단 없이 작업을 이어갈 수 있다. 이러한 접근 방식은 AI 혁신 가속화, 비용 절감, 운영 효율성 향상, 환경 보호 등 다양한 이점을 제공하며, 기업들이 지속가능한 AI 데이터 파이프라인을 구축하는 데 핵심적인 역할을 한다. 이에 대해 퓨어스토리지는 AI 혁신 가속화를 위한 효율적인 데이터 파이프라인 구축 전략을 제시하고 지속가능한 IT 인프라 구축의 중요성을 강조한다. 퓨어스토리지는 데이터 파이프라인을 통한 인프라 간소화 및 프로세스 효율화로 AI 역량 강화와 속도를 극대화하고, 지속가능성 목표 달성을 위한 방안을 제시하고자 한다. 퓨어스토리지의 플래시블레이드는 포춘 100대 기업 중 25% 이상이 사용하고 있으며, 금융, 제조, 의료 및 IT 서비스 등 AI 관련 연구를 선도하는 국내외 기업 및 연구기관들의 AI 컴퓨팅 환경에서 활발하게 활용하고 있다. 엔씨소프트의 경우 AI 프로젝트를 가속화하기 위해 플래시블레이드를 확대 도입한 사례다. 플래시블레이드 도입 후 수일이 소요되던 데이터 이동 및 로딩 작업을 당일 내 처리할 수 있게 되었으며, 클라우드와 같이 스케일링이 가능한 AI 환경을 온프레미스에 구축하여 총소유비용(TCO)을 대폭 절감하고, 추가 비용 없이 온프레미스 인프라를 유연하게 확장할 수 있는 역량을 확보했다. 카카오는 AI 애플리케이션에서 발생하는 방대한 양의 데이터를 처리하고 GPU의 성능을 극대화하기 위해 플래시블레이드를 도입했다. 도입 이후, 카카오는 네트워크 인터페이스 및 스토리지 병목 현상을 제거하여 GPU로부터 높은 컴퓨팅 리소스를 확보했으며, 사내 관제 시스템과 유기적으로 통합된 플래시블레이드는 데이터 파이프라인에 대한 직관적인 관리를 제공하고, 중복된 데이터 사일로의 제거 및 데이터 압축 저장을 통해 운영 및 관리 비용을 절감했다. 미디어젠은 플래시블레이드를 통해 최대 12개월이 소요되던 음성인식 모델링 작업을 2주(96% 향상)로 단축했으며, 충북테크노파크는 플래시블레이드를 도입해 데이터 처리 성능을 2배 이상 향상하고, GPU 서버 내 데이터 읽기 속도를 개선해 GPU 활용률을 기존 30%에서 80%로 약 2.6배 증가시켰다. 이같은 AI 데이터 플랫폼의 성능과 지속가능성 개선이란 두 목표를 달성하기 위한 방안은 오는 17일 인터컨티넨탈서울코엑스 하모니볼룸에서 열리는 'ACC+ 2024' 행사에서 더 자세히 확인할 수 있다. ACC+ 2024는 AI와 더불어, 빅데이터, 클라우드, 보안 등 최신 IT 솔루션과 서비스를 확인할 수 있는 세미나와 함께 직접 경험할 수 있는 기업 전시부스를 다양하게 운영한다. 사전 등록을 통해 행사에 참가할 수 있으며, 현재 얼리버드 등록 이벤트를 통해 할인 혜택을 제공하고 있다. 사전 등록과 등록 문의는 공식 웹사이트를 통해 가능하다.

2024.04.08 11:25김우용

"여행을 10배 더 쉽게”...야놀자, 새 CI 공개

야놀자(총괄대표 이수진)가 신규 기업 아이덴티티(이하 CI)를 공개했다. 야놀자의 신규 미션은 '10X'로, 데이터와 사람으로부터 탄생한 초연결된 여행 기술을 만들어여행을 10배 더 쉽게 한다는 의미를 담았다. 파편화된 전 세계 여행 정보와 데이터를 야놀자의 플랫폼 및 클라우드 솔루션 기술을 통해 효과적으로 연결하고 AI·빅데이터 기술로 누구나 여행을 통해 꿈을 실현하는 세상을 만들겠다는 비전이다. 특히 AI기술 기반 데이터 플랫폼으로서 글로벌 여행시장의 혁신을 주도한다는 계획이다. 신규 미션과 함께 새로운 CI도 선보였다. 신규 CI는 야놀자가 제공하는 혁신적인 기술로 만들어갈 여행의 무한한 기회와 연결성을 상징한다. 또 지구와 여행의 각 터치 포인트를 연결하는 라인을 형상화한 심볼을 더해 전 세계 여행시장을 연결하는 '하이퍼 커넥터(Hyper-connector)로서의 정체성을 시각적으로 표현했다. 박진수 야놀자 디자인실장은 "신규 기업 아이덴티티는 AI기술 기반 글로벌 데이터 플랫폼으로서 전 세계 여행시장의 혁신을 선도하는 야놀자의 브랜드를 직관적으로 보여주는 것이 특징"이라며 "전 세계 200개 국 이상에서 사업을 영위하고 해외사업 성과 역시 급증하고 있는 만큼, 전 세계 여행의 하이퍼 커넥터로서 누구나 여행 통해 꿈을 실현하는 세상을 만들어 나갈 계획"이라고 말했다.

2024.04.05 08:28백봉삼

지코어코리아, 한국에 엔비디아 H100 기반 데이터센터 개소

글로벌 퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지AI 전문기업 지코어는 4일 서울 더플라자호텔에서 기자간담회를 개최하고 엔비디아 H100 기반의 AI 퍼블릭 클라우드 서비스를 한국시장에 출시한다고 밝혔다. 오는 15일 한국에 개소하는 지코어 데이터센터는 AI 학습에서 현존하는 가장 효과적인 GPU로 인정받는 엔비디아 H100 서버 40대를 설치한다. GPU 기준으로 320개다. 그 동안 국내 AI 기업은 AI 모델을 개발하고 학습시키는데 있어 필수적인, 고성능 GPU 확보에 큰 어려움을 겪고 있었다. 이제 한국의 AI 전문기업은 더 이상 대규모의 GPU를 확보하기 위해 수십주를 기다리거나 타국에 위치한 자원을 활용하지 않고, 초고성능 AI 컴퓨팅 자원을 지코어의 엣지 클라우드를 통해 쉽게 활용할 수 있다. 지코어의 H100 기반 AI 퍼블릭 클라우드 서비스는 SMX5 타입의 H100 GPU를 각 8개씩 탑재한 서버들을 대규모 클러스터로 구성해 강력한 컴퓨팅 능력을 제공한다. AI학습 성능에 가장 큰 영향을 미치는 GPU간 연결을 모두 인피니밴드 NDR(400Gbps)로 구성해 각 서버당 대역폭을 3.2Tbps로 제공한다. 유니파이드패브릭매니저(UFM)으로 관리되는 논블로킹 클러스터는 핫 스페어와 콜드 스페어를 각각 구성해 서비스 품질도 GDPR의 기준을 충족한다. 각 서버당 2TB에 달하는 메모리와 112개에 달하는 CPU코어로 대용량 데이터 처리 및 고성능 컴퓨팅 작업 환경을 제공한다. 서버당 12KW에 달하는 전력량 충족, 빠른 네트워크, 안전한 센터 설계 등으로 최상의 서비스 구현이 가능하다. 지코어는 이 서비스를 준비하면서 NHN클라우드와 데이터센터 선정에서부터 한국고객의 수요를 반영한 서비스 구성에 이르기까지 긴밀히 협업했다. NHN클라우드는 한국 AI산업의 역량이 급부상함에 따라 국내 고객들이 원하는 특수한 요구사항을 잘 파악하고 있는 만큼 지코어 서비스를 현지화하고 고객 맞춤형으로 구성하는데 있어서 큰 역할을 했다. NHN클라우드는 지코어의 데이터센터 운영에도 지속적으로 참여할 예정이다. 정현용 지코어코리아 한국지사장은 “한국은 AI 반도체, 시스템, 서비스 등 AI 기술 전반에 걸쳐 세계적으로 엄청난 성장 잠재력을 지니고 있는 국가”라며 “이제 국내 초고속 통신망 내에 위치한 지코어의 데이터센터는 물론, 전세계와 초저지연 네트워크로 상호 연결돼 있는 지코어의 글로벌 엣지 네트워크를 접목해 한국기업들이 글로벌 AI시장에서 선도적인 위치를 선점해 나갈 수 있기를 기대한다”고 말했다. 그는 “국내 AI시장 및 고객에 대한 전문적 이해와 경험을 보유한 NHN클라우드와의 지속적이고 긴밀한 협업을 통해 공공기관은 물론 연구소, 금융 및 제조업계 등을 비롯해 다양한 영역에서 급속히 증가하고 있는 국내 AI 수요에 빠르고 신속하게 대응해 나갈 것”이라고 강조했다. 김동훈 NHN클라우드 대표는 “국내는 물론 글로벌 AI 인프라 시장의 패러다임이 급격히 변화하고 있는 만큼, NHN클라우드는 광주 국가 AI 데이터센터를 포함해 판교 데이터센터(NCC1) 등 자사 데이터센터에 1천 개 이상의 엔비디아 H100으로 구축하는 등 국내 최대 규모 GPU 클러스터를 구축해 나가고 있다”고 밝혔다. 그는 이어 “지코어는 전세계 160개 이상의 PoP를 기반으로 강력하고 안전한 클라우드 및 엣지 AI에 대한 노하우를 보유하고 있는 기업으로, 엔비디아의 최신 GPU인 H100을 발빠르게 한국에 도입함으로써 국내 AI 시장의 도약을 위한 새로운 국면을 맞게 한 일등공신”이라며 “NHN클라우드는 지코어와의 파트너십을 통해 국내 AI 인프라 시장의 경쟁력을 강화하고, 글로벌 진출 및 시장 변화에 적극적으로 대응해 나갈 것”이라고 덧붙였다. 이날 기자간담회에 자크 플리스 주한 룩셈부르크 초대 대사 내정자가 참석해 룩셈부르크 소재의 글로벌 IT 기업인 지코어가 한국 기업고객들에게 혁신적인 기술을 전하고 협력 기회를 확대할 수 있기를 기대한다며 축사를 전했다. 지코어는 기업의 AI 도입과정 모든 단계에 도움을 주기 위해 완전 자동화된 AI 인프라, 다양한 관리도구, 안전하고 신뢰할 수 있는 보안체계 등을 갖춘 클라우드 플랫폼 환경을 서비스하고 있다.

2024.04.04 13:45김우용

디노도 "방대한 기업 데이터, 물리적 통합보다 '논리적 연결' 우선"

"기업 데이터 환경이 복잡해졌습니다. 기업이 자사 데이터를 찾고 활용하는 것이 버거울 정도입니다. 이제 데이터를 한 플랫폼에서 관리할 수 있어야 합니다. 디노도는 '디노도플랫폼9.0'으로 이를 도와줄 수 있습니다. 디노도플랫폼9.0은 데이터 가상화를 통해 이리저리 흩어져있는 데이터를 물리적으로 이동하지 않고도 논리적으로 연결해 데이터 활용률을 높여줍니다." 남궁명선 디노도코리아 대표는 3일 인터컨티넨탈 서울 코엑스에서 열린 기자간담회서 올 상반기 출시 예정인 디노도플랫폼9.0 기능을 소개하며 이같이 밝혔다. 남궁명선 대표는 기업 데이터 환경이 복잡해진 추세라고 지적했다. 그는 "기업은 멀티 클라우드 환경에서 데이터를 관리한다"며 "이럴수록 데이터는 점점 방대해지면서 이리저리 흩어지는 사일로 현상까지 보인다"고 설명했다. 기업은 이를 극복하기 위해 데이터 레이크하우스 등을 활용해 물리적으로 데이터를 모은다. 그는 "현재 사일로화된 데이터를 물리적으로 모으는 건 무리인 시대"라며 "이는 인적, 물적 낭비일 것"이라고 설명했다. 남궁 대표는 "현재 기업은 내부 데이터뿐 아니라 외부 데이터도 자주 사용한다"며 "이때 외부 데이터까지 기업 환경에 맞게 통합·저장하는 것도 버거운 상황"이라고 했다. 기업이 물리적으로 데이터를 한데 모아 관리하기 벅찬 시기라는 의미다. 남궁 대표는 데이터 물리적 통합보다 논리적으로 한데 연결하는 것을 목표로 둬야 한다고 했다. 그는 이를 위해 데이터 가상화를 해결책으로 제시했다. 데이터 가상화는 데이터를 물리적으로 옮기는 개념과 다르다. 이리저리 흩어져 있는 데이터를 그대로 두되, 데이터끼리 논리적으로 연결하는 것을 의미한다. 기업은 데이터를 굳이 옮기지 않아도 필요에 따라 연결해 사용하면 된다. 남궁명선 대표는 "디노도는 데이터를 물리적으로 모아서 덩치를 키우는 것보다 이미 있는 데이터끼리 잘 연결해서 활용하는 것을 목표로 뒀다"고 설명했다. 디노도플랫폼9.0은 이런 데이터 가상화 기능을 갖춘 제품이다. 기업의 방대한 데이터를 물리적으로 통합하지 않아도 필요에 따라 데이터끼리 연결해 활용도를 높여주는 솔루션이다. 그는 "분산된 데이터 환경에서도 데이터 사용률을 높여주는 셈"이라며 "고객은 한 플랫폼에서 모든 데이터를 연결, 관리할 수 있는 편리성을 갖출 수 있다"고 강조했다. 남궁명선 대표는 "기업은 데이터를 물리적으로 모아놨을 때 데이터를 효율적으로 사용하지 못한다"고는 점도 언급했다. 디노도 자체 조사 결과에 따르면, 기업 전체 데이터 중 75%가 내부에서 활용되지 못하는 것으로 나타났다. 그는 "디노도플랫폼9.0은 모든 데이터를 연결함으로써 이러한 사각지대를 해소해 줄 것으로 기대한다"고 했다. 그는 올해 국내 신규고객 유치를 본격화하겠다고 했다. 지난해 카카오뱅크와 한 운송업체를 고객사로 유치한 바 있다. 남궁 대표는 "올해 상반기 통신사, 증권사와 계약 논의 중이다"며 "하반기에는 제조사, 보험사 등 다양한 분야의 고객사 유치를 위해 노력할 것"이라고 했다. 그는 "현재 기업들과 실증 시험도 여러 차례 진행했다"며 "올해 본격적인 성과를 낼 것"이라고 자신했다. "생성형 AI, 사람-데이터 다리 역할…관리 자동화 한층 높여" 이날 디노도는 디노도플랫폼9.0의 주요 기능도 소개했다. 디노도코리아 김세준 기술영업 상무는 생성형 AI 적용을 통한 셀프서비스 기능 향상과 빨라진 데이터 처리 속도 등을 제품 강점으로 내세웠다. 김세준 기술영업 상무는 고객이 생성형 AI를 통해 필요한 데이터 검색을 실시간으로 진행할 수 있다는 입장이다. 이때 오픈AI의 GPT 모델이 사용자 명령어 이해, 검색 결과를 제공한다. 우선 사용자가 생성형 AI 창에 "이번 분기에 가장 많이 팔린 제품명을 순서대로 나열해 줘"라고 입력하면, AI는 이를 이해한 뒤 프로그래밍언어(SQL)로 바꾼다. 그 후 디노도 플랫폼에 해당 데이터를 요청한다. 플랫폼이 관련 데이터를 SQL로 제공하면, AI는 이를 자연어로 변환한 뒤 사용자에게 주는 식이다. 그는 "IT 기술자가 아니어도 자연어를 통해 데이터를 관리할 수 있을 것"이라며 "이 플랫폼에서 생성형 AI는 사람과 데이터를 연결하는 다리 역할을 맡았다"고 덧붙였다. 김세준 상무는 "범용 거대언어모델(LLM)은 데이터 용어를 잘 이해하지 못한다"며 "디노도는 AI가 고객사 내 데이터 문맥을 파악할 수 있도록 별도 작업을 거친다"고 설명했다. 김 상무는 "디노도의 광범위한 메타데이터와 기업 데이터를 통합해 LLM에 공급하는 식"이라며 "여기에 모델 정확성과 신뢰성을 올리는 기술 검색증강생성(RAG)을 지원한다"고 덧붙였다. 그는 이 외에도 기존보다 더 빠른 데이터 처리 향상을 보인다고 설명했다. 김 상무는 "디노도플랫폼9.0은 오픈소스 쿼리 엔진인 프레스토 기반의 대규모 병렬처리(MPP) 기능을 탑재했다"며 "이를 통해 대용량 데이터 처리 성능을 올리고 데이터 가시성 확보를 더 늘렸다"고 강조했다. 데이터 보안 강화도 높였다고 했다. 그는 "데이터 관리 권한을 세분화했다"며 "관리자가 볼 수 있는 데이터가 다르고, 내부·외부 데이터도 각각 다른 뷰를 보여준다"고 강조했다.

2024.04.03 16:36김미정

김우승 크라우드웍스 대표 취임..."신뢰할 수 있는 AI 구축"

김우승 크라우드웍스 신임 대표가 정식 취임했다. 크라우드웍스는 정기주주총회에서 김우승 대표 선임 안건을 승인했다고 3일 밝혔다. 김우승 대표는 취임 후 가진 첫 타운홀미팅에서 임직원들과 회사 비전을 공유했다. 김 대표는 "챗GPT 등장 이후 AI 모델 기술력이 상향 평준화되면서 AI 발전은 결국 데이터가 결정하게 될 것"이라며 "크라우드웍스는 국내 최고 수준의 AI 데이터 지식을 갖춘 기업으로, 데이터 전문가가 개발한 엔터프라이즈 AI 비즈니스로 새로운 성장 스토리를 만들어갈 것"이라고 말했다. 크라우드웍스는 신임 대표 취임과 함께 회사 사업 방향을 담은 신규 캐치프레이즈 'Trustworthy AI built on your data'도 공개했다. 기업의 핵심 자산인 '데이터'를 바탕으로 '신뢰할 수 있는 AI'를 구축하는 최고의 AI 테크 기업으로 확고히 자리매김한다는 목표를 담았다. 크라우드웍스는 데이터 전문역량과 경쟁력을 기반으로 거대언어모델(LLM) 사업 확장에 박차를 가할 계획이다. 지난해 하반기부터 파운데이션 모델을 활용한 기업 맞춤형 LLM 개발 레퍼런스를 빠르게 확보하며 생성형AI 시장 선점에 나섰다. 기업들의 성공적인 LLM 도입을 위한 전략 컨설팅부터 데이터 구축 및 자산화, RAG와 파인튜닝 등을 통한 LLM 모델 구축, 레드팀 서비스까지 'LLM Service' 사업 부문 포트폴리오를 강화하며 사업 성장에 시너지를 만들고 있다. 크라우드웍스는 상반기 신임 대표 취임과 함께 데이터 솔루션 고도화, LLM 상품 출시 등을 추진하며 올해 지속 성장을 가속화할 방침이다. 김우승 크라우드웍스 대표는 삼성전자, SK텔레콤, SK플래닛 등을 거친 ICT 전문가로 줌인터넷에 CTO로 합류해 대표까지 역임하며 2019년 코스닥 상장을 이끌었다. 2021년부터는 대교에 CDO로 영입돼 디지털 전환에 중추적 역할을 맡았고, 동시에 대교와 메가존클라우드 합작사 디피니션 대표를 겸직했다.

2024.04.03 09:04백봉삼

"토종 AI칩, 엔비디아와 경쟁 위해 특화 시장 공략해야"

“엔비디아가 AI 반도체 시장에서 지배적인 입지에 있다고 해도 국내 기업이 경쟁을 포기하고 종속되면 안 됩니다. 국산 AI 반도체가 성공하려면 애플리케이션 맞춤형 저전력 NPU(신경망처리장치)를 개발하고 특화된 시장(니치 마켓)을 공략해야 합니다.” 김형준 차세대지능형반도체사업 단장은 지디넷코리아와 인터뷰에서 국산 AI 반도체 기술 개발에 대한 방향성에 대해 이같이 강조했다. 차세대지능형반도체사업단을 이끄는 수장인 김형준 단장은 반도체 소자 및 공정 전문가다. 김 단장은 1986년부터 서울대학교 재료공학부에서 교수 생활을 시작해 서울대학교 반도체공동연구소, 한국반도체디스플레이기술학회, 한국재료학회, 한국결정학회 등 다양한 학술 단체를 이끌었고, 2001년부터 2011년까지 국책 사업으로 진행된 '2010 시스템집적반도체개발사업단'에서 사업단장을 역임했다. 차세대지능형반도체사업단은 정부(과학기술정보통신부, 산업통상자원부)가 국내 차세대지능형 반도체 개발과 생태계 구축을 위해 2020년 9월 출범한 조직으로, 10년간 산·학·연간 협력을 돕는 가교 역할을 한다. 사업단으로부터 지원받은 AI 반도체는 사피온이 지난해 11월 출시한 'X330'과 퓨리오사AI가 올해 2분기에 출시하는 '레니게이트'를 비롯해 딥엑스, 텔레칩스 등이 대표적이다. ■ 국산 NPU, 저전력·가격 경쟁력 내세워 니치 마켓 공략 필요 AI 반도체 시장에서 엔비디아의 GPU(그래픽처리장치)는 80% 점유율을 차지한다. 엔비디아는 하드웨어뿐 아니라 '쿠다(CUDA)' 소프트웨어를 공급해 AI 반도체 시장을 장악할 수 있었다. 반면 국내 스타트업들은 GPU 보다 저전력에 특화된 분야에서 처리 능력이 뛰어난 NPU(신경망처리장치)에 주력하고 있다. 최근 애플, 아마존, 마이크로소프트(MS) 등 미국 빅테크 기업도 NPU 칩을 개발하는 추세다. “이런 상황에 국내 스타트업이 엔비디아와 경쟁 및 글로벌 시장에서 성공할 수 있을지에 대해 의구심이 든다”는 기자의 질문에 김 단장은 “엔비디아의 GPU도 AI 모델에 따라 여러 종류를 판매하고 있으므로, 국내 업체도 특정 추론 모델에 특화된 맞춤형 NPU 반도체를 만들어 니치 마켓을 공략해야 한다”고 답했다. 그는 이어 “AI 반도체가 지속 가능하려면 저전력이 되어야 한다”라며 “데이터센터에는 약 1만장 이상의 GPU가 탑재되며, 이로 인해 많은 전력이 소모된다는 지적이 따른다. 전 세계 데이터센터 소비량은 현재 남아프리카공화국의 전력 소비량과 비슷하다. 또 2027년 전 세계 데이터센터가 필요한 전력은 스웨덴의 1년 전력량과 맞먹는 85~134Twh가 될 전망이다. 이는 최근 업계가 저전력 NPU 반도체에 관해 관심이 높아지는 이유다”라고 설명했다. NPU는 GPU보다 저렴한 가격으로도 경쟁력을 갖출 수 있다. 엔비디아 GPU는 리드타임(주문해서 받기까지 기간)이 1년 이상 걸리고 1개 칩당 5천만원 이상으로 비싼 가격이다. 김 단장은 “일례로 인도네시아, 말레이시아, 베트남 등의 국가가 데이터센터를 만들고 싶어도 엔비디아 GPU의 비싼 가격으로 인해 선뜻 투자하기 어려울 것”이라며 “국산 NPU가 뛰어난 성능에 엔비디아 GPU보다 저렴한 가격에 공급한다면, 해당 시장을 개척할 수 있을 것”이라고 말했다. 또한 “우리나라가 예전에 F35 전투기를 개발할 당시, 구매하는 것보다 개발 비용이 수십 배 더 들었지만, 결국 기술 확보를 위해 개발에 착수하고 국산화에 성공했다. 그 결과 현재 전투기도 수출하는 국가가 되었다. 이렇듯 AI 반도체도 개발을 지속해야 하며, 결코 미국에 종속되어서는 안 된다”고 강조했다. ■ 실증 사업 통해 레퍼런스 확보 중요…엣지 시장에 기회 있을 것 국내 AI 반도체 기업은 데이터센터 실증 사업 통해 레퍼런스를 확보하는 것이 중요하다. 정부는 AI 반도체 육성을 위해 K-클라우드 사업을 전개하고 있으며, KT, 네이버 등의 데이터센터는 GPU 대신 국산 NPU를 도입해 일부 실증 테스트를 진행하고 있다. 김 단장은 “NPU 기업은 데이터센터 실증 테스트를 적극 활용해서 제품 경쟁력을 높이는 것이 필요하다”며 “레퍼런스를 바탕으로 국내뿐 아니라 해외에 NPU를 수출할 수 있을 것”이라고 조언했다. 언제쯤 국내 NPU 반도체가 해외의 주요 고객사에 수출될 수 있을지에 대한 질문에 김 단장은 “국내 스타트업의 칩 양산이 올해 본격화되기에 2026년에는 성공 여부가 판가름 날 것”이라며 “냉정하게 경쟁력이 없다고 판단되면 사업을 접어야 할 것”이라고 말했다. 그는 “하지만 데이터센터 외에도 공장 자동화, 모바일, 자율주행차 등 엣지 쪽에는 굉장히 많은 애플리케이션이 있다”라며 “특화된 시장을 겨냥해 AI 응용 칩을 만들면 반드시 기회가 있을 것으로 본다”고 전망했다.

2024.04.02 10:46이나리

[기고] AI 생성, 생각보다 쉬울 수 있다

챗GPT 등장 후 1년이 조금 넘었는데, 그 사이 AI는 이미 여러 산업에서 그 적용 범위를 확대해 나가고 있으며, 생성형 AI의 인기는 텍스트부터 이미지 생성, 심지어 의료 및 과학 연구 등 다양한 분야에서의 활용 가능성 덕분에 나날이 높아지고 있다. 이런 생성형 AI의 열풍에 부응하려면 높은 비용과 복잡성이 요구되는데, 이런 상황에서 AI를 어떻게 잘, 그리고 정확하게 작동시킬지에 대한 고민이 생기는 것은 당연하다. 우리가 AI에 이르게 되는 과정을 살펴보면, AI의 잠재력은 그 지혜로움에서 비롯됨을 알 수 있다. 그 방대한 용량과 일관된 처리 능력 때문에 인간이 간과할 수 있는 세부 사항도 포착하는 AI지만 궁극적으로 AI도 데이터를 기반으로 작동한다. 우리는 이런 데이터를 적절하게 처리하고 보호해야 하는데, 이는 데이터가 IT 인프라뿐만 아니라 사람 또는 인공 지능이 만들어내는 모든 혁신의 기초가 되기 때문이다. 생성형 AI의 가장 기초가 되는 데이터베이스는 생성형 AI 시대에 기업들의 요구사항에 부응하기 위해 발전해 왔으므로 기업의 효과적인 AI 활용은 올바른 데이터 관리와 깊은 관련이 있다. ■ 흔한 데이터베이스 모델 비즈니스에서 흔히 사용되는 데이터베이스에는 여러 가지가 있는데 그중 온라인 트랜잭션 처리(OLTP)라는 데이터베이스 유형은 온라인 거래를 지원한다. OLTP는 온라인 뱅킹 또는 쇼핑 환경에서 기업이 동시에 여러 거래를 처리하도록 돕는데, 데이터가 축적되면 그 데이터 풀을 활용해 새로운 비즈니스 가치를 만들어낼 수 있다. 또 여러 소스의 데이터를 통합해 신속하고 강력한 상호작용형 애널리틱스를 지원하는 온라인 분석 처리(OLAP) 데이터베이스도 있다. OLAP을 사용하면 소매업자는 재고와 실제 재고 데이터를 다른 데이터세트인 고객 구매 데이터와 결합해 특정 상품의 수요가 다른 상품보다 높아져서 해당 상품의 생산을 증가시킬 필요에 대한 통찰력을 얻을 수 있다. NoSQL이라는 또 다른 데이터베이스는 위 두 모델과 달리 비정형 데이터를 정렬하는 데 도움이 되어 인기를 얻고 있다. ■ AI를 위한 새로운 데이터베이스 모델 앞서 언급된 모델들이 각자의 영역에서 충실히 제 기능을 해왔음에도 AI 시대에는 벡터 데이터베이스 모델이 가장 혁신적인 변화를 가져올 것이다. 벡터 데이터베이스는 대규모 언어 모델의 '인텔리전트 워크로드'를 처리하고 수백만 개의 고차원 벡터를 저장하는 데 쓰인다. 문서, 이미지, 오디오 녹음, 비디오 등과 같은 비구조화된 데이터가 여기에 해당되는데, 이런 데이터는 2050년까지 전 세계 데이터의 80% 이상을 차지할 것으로 예상된다. 이는 단순 의미 파악을 넘어서 AI 시대에 걸맞게 전체 맥락과 뉘앙스까지 이해하는 시맨틱스(기존 데이터의 의미)에 대한 이해를 가능하게 한다. 벡터 데이터베이스 없이는 그런 이해를 얻기 어려우므로 이는 대규모 언어 모델을 통한 특화된 산업 지식의 발전에 필수적인 요소가 된다. 이에 대비해 알리바바 클라우드는 독자적인 벡터 엔진을 통해 클라우드 네이티브 데이터베이스 폴라DB, 클라우드 네이티브 데이터 웨어하우스 애널리틱DB, 클라우드 네이티브 다중 모델 데이터베이스 린돔을 포함한 모든 데이터베이스 솔루션을 강화해 왔다. 그 결과 기업들은 벡터 데이터베이스에 분야별 지식을 입력해 생성형 AI 애플리케이션을 구축 및 출시할 수 있게 됐다. 일례로 동남아시아의 한 온라인 게임 회사는 알리바바 클라우드의 데이터베이스 솔루션을 사용해 지능적인 비플레이어 캐릭터(NPC)를 생성하고 있다. 이 NPC들은 사전에 정해진 대사를 단순히 읽는 것이 아니라 플레이어가 전달하는 내용을 실시간으로 이해하고 반응해 실제 플레이어들과 더욱 현실감 있는 상호작용을 할 수 있다. ■ AI로 가능해지는 합리적인 소비 AI의 잠재력은 게임이나 비정형 데이터의 이해에만 국한되지 않는다. AI는 데이터베이스를 스스로 관리할 수 있는 능력도 갖췄다. 예를 들어, 저장 공간이 부족해지면 AI는 시스템 관리자에게 경고를 보내고, 추가 저장 공간을 확장할지 여부를 물을 수 있다. 또 권한이 주어지면 저장 공간을 자동으로 확장하는 조치도 취할 수 있으며, 이런 기능은 CPU 용량, 메모리 용량 및 기타 기능에도 적용될 수 있다. 이런 AI의 능력은 서버리스 클라우드 컴퓨팅으로 전환을 고려할 때 특히 유용하다. 과거에 클라우드 서비스 제품을 구매할 때 일정량의 서버를 준비하는 프로비저닝 작업이 필요했는데, 이 과정에서 추가 비용이 발생하는 것은 물론, 실제 워크로드보다 더 많은 용량을 준비할 경우 자원을 낭비하는 일도 발생했다. 하지만 서버리스 컴퓨팅은 클라우드 서비스가 사용하는 서버 용량을 워크로드에 정확히 맞추며, 워크로드 변동에 따라 서버 용량을 유연하게 조절할 수 있는 장점을 지닌다. ■ 일거양득: AI와 서버리스 클라우드 컴퓨팅의 장점 누리기 따라서 AI와 서버리스 클라우드 컴퓨팅의 결합은 비정형 데이터의 이해 및 데이터베이스 자가 관리뿐만 아니라 서버 용량의 유연한 조절까지, 두 기술의 장점을 모두 활용할 기회를 제공한다. 이제 바로 알리바바 클라우드가 핵심 AI 기반 데이터베이스 제품을 서버리스로 만든 이유이기도 하다. 이를 통해 고객은 필요한 자원에 대해서만 비용을 지불하고, AI의 지능적 관리를 통해 급격한 수요 증가나 변동이 큰 워크로드에 효과적으로 대응할 수 있을 것이다. 다시 요약하자면 AI 활용의 성패는 올바른 데이터베이스 활용 전략에 좌우됨을 명심해야 한다.

2024.04.02 09:01리페이페이

클라우데라, AI 시대 데이터 아키텍처 전략 발표

클라우데라는 'AI 시대의 데이터 아키텍처와 전략' 설문조사 결과를 1일 발표했다. 클라우데라의 의뢰로 파운드리에서 실시한 이 설문조사는 600명 이상의 데이터 분야 리더와 IT 의사결정권자를 대상으로 최신 데이터 아키텍처 현황과 함께 인공지능(AI)의 부상이 데이터 전략에 미치는 영향을 조사했다. 조사 결과에 따르면 IT 리더의 90%가 분석과 AI를 위해선 단일 플랫폼에서 데이터 라이프사이클을 통합하는 것이 매우 중요하다고 답했다. 생성형 AI가 점차 대중화됨에 따라 신뢰할 수 있는 데이터 확보도 중요해지고 있다. AI 인사이트는 훈련한 데이터에 의해 결정되기 때문이다. 설문조사에 따르면 응답자들은 데이터의 품질과 가용성(36%), 확장성과 구축(36%), 기존 시스템과의 통합(35%), 변경사항 관리(34%), 모델 투명성(34%)으로 인해 AI 여정에 어려움을 겪고 있는 것으로 나타났다. 이를 통해 많은 기업이 AI에 투자하고 있지만 해결해야 할 근본적인 문제는 여전히 존재하는 것을 유추할 수 있다. 아바스 리키 클라우데라 최고 전략 책임자(CSO)는 “비즈니스 혁신과 고객 지향 디지털, AI 지원 솔루션을 구축하려는 기업이 늘어나면서 하이브리드와 멀티클라우드 전략 채택이 늘어나고 있다”며 “이로 인해 LOB, 기능 단위, 비즈니스 애플리케이션, 실무자 팀 전반에 걸쳐 데이터가 무질서하게 축적되는 '데이터 스프롤', 설계 한계를 뛰어넘는 '아키텍처 오버런'이 발생한다”고 설명했다. 그는 “AI를 효과적으로 활용하기 위해 기업은 표준화된 사용 사례 중심의 데이터 아키텍처와 플랫폼을 설계, 구축해 서로 다른 팀들이 데이터의 위치에 관계없이 '모든 데이터'를 활용해야 한다”고 밝혔다. 설문조사에 의하면 효과적인 AI를 구축하고자 하는 기업이 기본적으로 갖춰야 할 세 가지 필수 요소는 ▲비즈니스 전략에 기반한 최신 데이터 아키텍처 ▲데이터 통합 관리 ▲다양한 기능을 가진 안전한 데이터 플랫폼이다. 첫번째 필수 요소는 비즈니스 전략에 기반한 최신 데이터 아키텍처다. 퍼블릭 클라우드와 온프레미스 모두에서 원활하게 작동하는 단일 데이터 플랫폼은 이 요소의 핵심이다. 최신 데이터 아키텍처의 이점에 대해 응답자가 가장 많았던 답변은 데이터, 분석 프로세스 간소화(40%)였고 두번째로 많았던 답변은 모든 유형의 데이터를 유연하게 처리할 수 있는 유연성 확보(38%)다. 두번째 필수 요소는 데이터 통합 관리다. 오늘날의 기업은 유연하고 확장 가능한 클라우드 관리 기술을 요구한다. 이러한 기술은 정보를 인사이트로 전환할 수 있는 툴을 제공한다. AI 모델 개발에 필요한 종단간 데이터 관리를 방해하는 요소로 응답자들은 데이터의 양과 복잡성(62%), 데이터 보안(56%), 거버넌스 및 규정 준수(52%)라고 답했다. 마지막 필수 요소는 다양한 기능을 가진 안전한 데이터 플랫폼이다. 데이터, 분석 전략으로는 온프레미스와 퍼블릭 클라우드 환경 모두 관리할 수 있는 하이브리드 데이터 관리 방식이 주로 쓰인다. 응답자의 93%는 '데이터, 분석을 위한 멀티클라우드/하이브리드 기능은 기업이 변화에 적응하기 위한 필수 요소'라고 답했다. 리키 CSO는 “기업은 비용 효율적 데이터 전략을 통해 최고의 성과를 달성하고 AI 이니셔티브를 강화하길 원한다”며, “데이터를 최대로 활용하고자 하는 기업은 최신 플랫폼과 AI 아키텍처를 신속하게 구축해야 한다”고 밝혔다. 그는 “클라우데라는 하이브리드 멀티클라우드 데이터 플랫폼으로 고객이 어디서나 데이터를 사용할 수 있도록 한다"며 "이로써 데이터와 AI 관련 문제를 해결할 수 있다”고 강조했다.

2024.04.01 08:50김우용

망 분리 규제 가로막힌 금융사 생성형AI 활용, 이번엔?

국내 금융사들은 생성형 인공지능(AI)이 발전함에도 지나친 규제나 규제 공백때문에 활용이 어렵다는 지적에 금융위원회가 금융사 등과 함께 거버넌스 구축에 나선다. 28일 금융위는 이날 김소영 금융위 부위원장이 주재하고 금융감독원·신용정보원·금융보안원·금융결제원 등의 기관과 신한은행·하나은행·KB증권·삼성생명·현대해상 등 금융사와 함께 금융권 AI 활성화를 위한 이슈 전반을 검토하는 '금융권 AI 협의회'를 발족한다고 밝혔다. 협의회 내 세 분과(▲AI인프라 구축 ▲데이터지원 ▲신뢰도 확보)에서 세부 내용을 관련 학계 및 업계 전문가들은 생성형 AI 활용 인프라 구축과 AI 개발 관련 맞춤형 데이터베이스(DB) 구축 등 구체적인 사안 등을 다루게 된다. 이날 김소영 부위원장은 업계에서 생성형AI 활용의 가장 큰 걸림돌로 지적한 망 분리 규제, 데이터 결합과 합성데이터 활용 확대에 대한 요구를 해왔다고 말했다. 금융사 망 분리 규제는 내부통신망과 연결된 내부 업무용 시스템은 인터넷 등 외부 통신망과 분리되거나 차단해 운영해야 한다는 내용을 담고 있다. 이 때문에 인터넷이 연결돼야 쓸 수 있는 GPT4, 제미나이를 국내 금융사가 활용하기 어렵다. 일부 대형 금융사만 경량화 AI를 내부망에 자체 구축해 실험적으로 쓰는 수준에 불과한 것이 현실이다. 여기에 AI 학습을 위해서는 양질의 데이터 확보가 필수적이나, 현재 개인정보 보호규제 등으로 내부정보 활용이 어려운 상황이다. 김소영 부위원장은 "협의회에서는 국내외 AI 기술과 정책동향을 함께 공유해 금융회사들이 빠르게 변화하는 AI 기술에 신속히 대응할 수 있도록 하겠다"며 "AI 협의회가 금융권의 양질의 데이터 공동확보, AI 공동학습 등 협업을 지원할 수 있는 매개체가 되도록 하겠다"고 발언했다.

2024.03.28 16:39손희연

개인정보위, 오픈 AI 등 6개 기업에 개인정보 취약점 보완 권고

개인정보보호위원회 대규모 언어 모델(Large Language Model, LLM) 기반으로 인공지능(AI) 사업을 운영 중인 오픈 AI등 6개 기업에게 개인정보 취약점을 보완하라고 권고했다. 개인정보위는 27일 제6회 전체회의를 열고 인공지능(AI) 서비스 기업에게 이같이 의결했다. 이번 권고 조치를 받은 기업은 ▲오픈AI ▲구글 ▲MS ▲메타 ▲네이버 ▲뤼튼 등 6개 기업이다. 개인정보위는 지난해 11월부터 한국인터넷진흥원(KISA)과 함께 주요 AI 서비스를 대상으로 사전 실태점검을 진행한 바 있다. AI 단계별 개인정보 보호의 취약점 점검 결과 ▲공개된 데이터에 포함된 개인정보 처리 ▲이용자 입력 데이터 등의 처리 ▲개인정보 침해 예방‧대응 조치 및 투명성 등 관련해 일부 미흡한 사항이 발견됐다. AI 서비스 제공사업자는 인터넷에 공개된 데이터를 수집 AI 모델 학습데이터로 사용하는데 이 과정에서 주민등록번호, 신용카드번호 등 한국 정보주체의 중요한 개인정보가 포함될 수 있는 것으로 지적됐다. 오픈AI, 구글, 메타는 개인정보 집적 사이트를 AI 모델 학습에서 배제하고 학습데이터 내 중복, 유해 콘텐츠 제거조치와 AI 모델이 개인정보를 답변하지 않도록 하는 조치를 적용하고 있다. 다만 학습데이터에서 주민등록번호 등 주요 식별정보를 사전 제거하는 조치가 충분하지 않은 것으로 확인됐다. 개인정보위는 AI 서비스 제공 단계별 보호조치 강화를 요구할 계획이다. 최소한 사전 학습단계(pre-training)에서 주요 개인식별정보 등이 제거될 수 있도록 인터넷에 개인정보가 노출된 것을 탐지한 데이터(URL)를 AI 서비스 제공사업자에게 제공할 계획이다. 개인정보위는 AI 모델 등 개선 목적으로 이용자 입력 데이터에 대한 인적 검토과정을 거치는 경우 이용자에게 관련 사실을 명확하게 고지하는 한편, 이용자가 입력 데이터를 손쉽게 제거‧삭제할 수 있도록 해당 기능에 대한 접근성을 제고하도록 권고했다. 개인정보위는 AI 서비스와 관련된 내용을 종합해 개인정보 처리방침 등에 보다 구체적으로 안내하고 부적절한 답변에 대한 신고 기능을 반드시 포함토록 했다. 또 AI 서비스와 LLM의 취약점 발견 시 신속히 조치할 수 있는 과정도 갖추도록 개선권고했다.

2024.03.28 12:00이한얼

데이터브릭스, 범용 대형언어모델 'DBRX' 출시

데이터브릭스가 표준 벤치마크에서 모든 오픈소스 모델을 능가하는 범용 대형언어모델(LLM) DBRX를 출시했다. 데이터브릭스는 기업의 자체 밤줌형 LLM을 구축, 학습시킬 수 있는 LLM 'DBRX'를 오픈소스로 28일 공개했다. DBRX는 모든 기업을 위해 맞춤형 고성능 LLM의 학습과 튜닝을 보편화한다. 조직은 DBRX를 통해 더 이상 소수의 폐쇄형 모델에 의존하지 않아도 된다. DBRX는 오늘부터 바로 사용 가능하며, 전 세계 조직은 비용 효율적으로 자체 맞춤형 LLM을 구축, 교육 및 서비스할 수 있다. DBRX는 언어 이해, 프로그래밍, 수학 및 논리와 같은 표준 업계 벤치마크에서 라마2 70B 및 믹스트랄 8x7B와 같은 기존 오픈소스 LLM보다 뛰어난 성능을 제공한다. DBRX는 여러 벤치마크에서 GPT-3.5의 성능을 능가한다. 모델 평가와 성능 벤치마크에 대한 보다 자세한 정보, 그리고 DBRX가 SQL과 같은 내부 사용 사례에서 GPT-4 품질 대비 어떤 경쟁력을 제공하는지에 대한 자세한 정보는 모자이크 리서치 블로그에서 확인할 수 있다. 데이터브릭스는 효율성을 위해 메가블록스의 오픈소스 프로젝트에 기반한 전문가 혼합(MoE) 아키텍처로 DBRX를 최적화했다. 이로 인해 DBRX는 다른 주요 LLM대비 최대 2배 높은 컴퓨팅 효율 등 최고의 성능을 갖추고 있다. 또한 DBRX는 주어진 시간에 360억 개의 매개변수만 사용한다. 하지만 모델 자체는 1천320억 개 파라미터이므로 속도(토큰/초) 대 성능(품질) 측면에서 두 마리 토끼를 모두 잡을 수 있다. DBRX는 모든 기업이 커스터마이징할 수 있는 투명한 생성형 AI로 오픈소스 모델의 새로운 기준을 제시한다. 최근 미국 VC 기업 안드레센 호로위츠가 발표한 조사 결과에 따르면 AI 리더의 약 60% 가 오픈소스 사용을 늘리거나 미세 조정된 오픈소스 모델이 폐쇄형 모델의 성능과 거의 일치할 경우, 오픈소스로 전환하는데 관심을 보이는 것으로 나타났다. 2024년 이후에는 상당수의 기업이 폐쇄형에서 오픈소스로 전환할 것으로 예상되며, 데이터브릭스는 DBRX가 이러한 추세를 더욱 가속화할 수 있을 것이라고 확신한다. DBRX는 데이터브릭스 모자이크 AI의 통합 툴링과 결합돼, 고객이 데이터와 지적 재산에 대한 제어권을 유지하면서도 안전하고 정확하며 관리 가능한 생산 품질의 생성형 AI 애플리케이션을 신속하게 구축 및 배포할 수 있도록 지원한다. 고객은 데이터 관리, 거버넌스, 리니지 및 모니터링 기능이 내장된 데이터브릭스의 데이터 인텔리전스 플랫폼의 다양한 이점을 누릴 수 있다. DBRX는 깃허브와 허깅페이스에서 연구 및 상업적 용도로 무료로 사용 가능하다. 기업은 데이터브릭스 플랫폼에서 DBRX와 상호 작용하고, 검색 증강 생성(RAG) 시스템에서 긴 문장(context) 기능을 활용하며, 자체 고유 데이터에서 맞춤형 DBRX 모델을 구축할 수 있다. AWS와 구글 클라우드,, 마이크로소프트 애저 등에서도 직접 사용할 수 있다. 알리 고드시 데이터브릭스 공동창립자 겸 CEO는 “데이터브릭스는 데이터와 AI를 보편화하겠다는 사명 아래 모든 기업에 데이터 인텔리전스를 제공하여 그들이 보유 중인 데이터를 이해하고 이를 활용하여 자체적인 AI 시스템을 구축할 수 있도록 지원하고 있다”며 “DBRX 출시는 이러한 노력의 결과물”이라고 밝혔다. 그는 “DBRX는 최신 업계 벤치마크에서 오픈소스 모델을 능가하고, 대부분의 벤치마크에서 GPT-3.5를 뛰어넘는 수준으로, 우리는 독점 모델을 오픈소스 모델로 대체하는 추세가 고객 기반 전반에 걸쳐 가속화될 것으로 기대된다”며 “DBRX는 전문가 혼합 아키텍처를 사용하기 때문에 초당 토큰 전송 속도가 매우 빠르며 비용 효율적이므로, DBRX는 오픈소스 LLM의 새로운 기준을 제시하며, 기업이 자체 데이터를 기반으로 맞춤형 추론 기능을 구축할 수 있는 플랫폼을 제공해 준다”고 덧붙였다. 데이터브릭스는 오는 4월 26일 한국시간으로 오전 12시 DBRX 웨비나를 개최할 예정이다.

2024.03.28 11:24김우용

  Prev 41 42 43 44 45 46 47 48 49 Next  

지금 뜨는 기사

이시각 헤드라인

예스24 또 속였나?..."1차 해킹 때 백업망도 랜섬웨어 감염"

삼성·SK, 올 상반기 R&D에 '적극 투자'…AI 시대 준비

"소비쿠폰 사용도 막았다"…홈플러스 폐점 발표에 노조·종사자 "철회하라"

메가존클라우드, AI 챔피언 대회 인프라 사업 수주…정부 AI 인재 육성 사업 주도

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.