• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'엣지 AI'통합검색 결과 입니다. (66건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

지코어, 엣지에서 실시간 추론 '인퍼런스앳더엣지' 솔루션 출시

지코어는 AI 애플리케이션에 초저지연 경험을 실시간 제공하는 '인퍼런스 앳더 엣지' 솔루션을 출시한다고 10일 밝혔다. 솔루션은 사전 학습된 머신 러닝 모델을 전 세계에 분포돼 있는 엣지 추론 노드 중 사용자와 가장 가까운 경로 또는 위치에서 응답할 수 있도록 함으로써 원활한 실시간 추론을 보장한다. 지코어 인퍼런스 앳더 엣지는 180개 이상의 엣지 노드로 구성된 지코어의 광범위한 글로벌 네트워크(PoP)에서 실행되며, 모두 지코어의 정교한 저지연 스마트 라우팅 기술로 상호 연결된다. 고성능의 각 노드는 지코어 네트워크 중 최종 사용자와 가까운 엣지에 전략적으로 배치된다. 무엇보다 지코어 각 엣지에서의 AI 추론은, 이를 위해 특별히 설계된 업계 내 최고의 칩인 엔비디아 L40S GPU에서 실행된다. 사용자가 요청을 보내면 엣지 노드는 지연 시간이 가장 짧은, 가장 가까운 엣지 추론 노드로 경로를 설정해 일반적으로 30밀리초(ms) 미만의 응답 시간을 보장한다. 네트워크 간 최대 대역폭도 200Tbps로 최고 수준의 학습 및 추론 능력이 가능하다. 인퍼런스 앳더 엣지는 광범위한 기본 머신 러닝 및 커스텀 모델을 지원한다. 지코어 머신 러닝 모델 허브에서 사용 가능한 오픈 소스 기반 모델로 라마프로 8B, 미스트랄 7B, 스테이블디퓨전 XL 등이 있다. 여러 형식 또는 여러 소스로부터 데이터를 수신해, 모델을 사용 사례에 맞게 선택하고 학습한 후 전 세계에 위치하고 있는 인퍼런스 앳더 엣지 노드에 배포할 수 있다. 이는 일반적으로 개발팀이 직면하는 중요한 문제 중 하나인, 이미 AI 모델이 학습된 동일한 서버에서 다시 실행됨으로써 발생하는 성능이 저하되는 문제를 해결해 준다. 지코어 인퍼런스 앳더 엣지의 주요 이점을 정리해 보면 다음과 같다. ▲첫째, 유연한 가격구조로 고객이 사용한 리소스에 대해서만 비용을 지불할 수 있어 '비용 효율적인 배포'가 가능하다. ▲둘째, 디도스 공격에도 머신 러닝의 각 앤드포인트가 지코어의 인프라를 통해 자동으로 보호되는 내장형 디도스 보호 기능을 갖추고 있다. ▲셋째, GDPR, PCI DSS, ISO/IEC 27001 등 업계 표준을 준수하는 뛰어난 데이터 프라이버시 및 보안을 보장한다. ▲넷째, 모델 자동확장 기능으로 모델이 항상 최대 수요는 물론 예기치 않은 로드 급증을 지원한다. ▲마지막으로, 빠르게 진화하는 요구에 맞춰 S3 호환 클라우드 오브젝트 스토리지를 무제한으로 제공한다. 이러한 강점을 통해 지코어 인퍼런스 앳더 엣지는 자동차, 제조업, 유통, 테크놀로지 등 다양한 산업 분야의 기업들이 비용 효율적이고 확장 가능하며, 안전한 AI 모델 배포를 통해 역량을 강화할 수 있도록 지원한다. 이를 통해 기업은 생성형 AI, 객체 인식, 실시간 행동 분석, 가상 비서, 생산 모니터링과 같은 사용 사례를 글로벌 규모로 빠르게 실현할 수 있다. 안드레 레이텐바흐 지코어 CEO는 "지코어 인퍼런스 앳더 엣지는 고객이 전 세계에 AI 애플리케이션을 배포하는 데 필요한 비용, 기술, 인프라에 대해 걱정할 필요 없이 머신 러닝 모델을 학습시키는 데 집중할 수 있도록 지원한다”며 “지코어는 엣지가 최고의 성능과 최종 사용자 경험을 제공하는 곳이라고 믿으며, 모든 고객이 탁월한 규모와 성능을 누릴 수 있도록 지속적으로 혁신해 나가고 있다”고 밝혔다. 그는 “인퍼런스 앳더 엣지는 전 산업분야에 걸쳐 현대적이고 효과적이며, 가장 효율적인 AI 추론 환경을 제공하게 될 것"이라고 강조했다.

2024.06.10 14:21김우용

갤북에도 퀄컴 두뇌 심었다…맥북 이길 무기는 바로 'AI'

"갤럭시북 최초 코파일럿+ PC 출시는 삼성전자, 마이크로소프트(MS), 퀄컴이 3년간 준비한 프로젝트입니다. 소비자들이 느끼는 불편함 개선을 시작 단계서부터 강조했고, 오랜 노력을 통해 상당수 문제를 해결했으며 지속적으로 ARM 기반으로 생태계를 확대하고 있습니다." 삼성전자 MX사업부 갤럭시 에코 상품기획팀장 박준호 상무는 '갤럭시북4 엣지' 출시를 앞두고 열린 30일 미디어 브리핑에서 이같이 말했다. 삼성전자가 ARM 기반 PC를 처음 내놓았는데, 기존 인텔 CPU(x86) 기반 앱들과 호환성 문제는 어떻게 해결했는지에 대한 질문에 답한 것이다. 퀄컴 역시 거의 모든 앱이 호환성 테스르를 통과했다고 자신했다. 이날 행사에 참석한 퀄컴 CDMA 테크놀로지 코리아 마케팅 부문 박지성 부사장은 "거의 모든 앱 호환성 테스트를 통과했다"며 "실제로 제품을 사용해 보면 그 효과를 경험할 수 있을 것"이라고 덧붙였다. 국내 최초 코파일럿+ PC 갤럭시북4 엣지는 내달 3일부터 삼성닷컴에서 사전구매알림을 신청할 수 있으며, 신청 고객이 실제 제품을 구입할 경우 네이버페이 5만원권을 증정한다. 공식 출시일은 내달 18일이다. 가격은 35.6cm(14인치)는 215만원, 40.6cm(16인치)는 235만원과 265만원 2종으로 출시된다. 국내뿐 아니라 10여개 국에 동시 출시해 해외 시장을 노린다. 100만원 중후반대 M3 맥북 에어보다 가격이 비싸다. 다만, M3 맥북은 AI 기능을 제공하지 않는다. ■ AI 폰 자신감 얻은 삼성, AI PC로 분위기 이어가나 삼성전자는 AI PC 시장 공략에 속도를 내고 있다. 국내 시장 절반 이상을 차지하겠다는 야심찬 계획도 내놨다. 박준호 상무는 "갤럭시북4 엣지 출시로 국내 AI PC 시장을 선도할 것"이라며 "올해 국내 AI 노트 PC 시장에서 3대중 2대가 갤럭시북으로 판매될 수 있도록 AI 사용성을 지속 혁신할 것"이라고 밝혔다. 그는 인텔 CPU 시장점유율이 높은 상황에서 퀄컴 CPU 경쟁력에 대해 묻자 "자동차를 구매할 때 디자인과 가격도 보지만, 엔진에 따라 전기차와 가솔린차, 디젤차 등을 선택한다"며 "각 (CPU의) 장단점이 있기에 퀄컴 스냅드래곤X 엘리트는 사용시간과 효율성 측면 등을 고려해 소비자들이 선택할 것"이라고 답했다. 박지성 퀄컴 부사장은 "갤럭시북4 엣지에 탑재된 스냅드래곤X 엘리트는 AI PC에 최적화된 프로세서로, 업계 선두의 성능과 수일간 지속되는 배터리 수명 등 사용자의 컴퓨팅 경험을 재정의하는 혁신적인 AI 성능을 구현한다"는 점을 강조했다. ■ AI PC 쏟아지는데…기존 PC와 뭐가 다를까? 올해 경쟁사에서도 다양한 AI PC를 출시하거나 출시할 예정이다. 대동소이한 기능을 내세우는 가운데 삼성전자는 갤럭시북4 엣지의 차별성으로 '초경량'과 '연결성'을 내세운다. 박준호 상무는 "다른 제조사 제품도 많이 나왔지만, 초경량·초박형 디자인으로 갤럭시북4 엣지가 가장 가볍다"며 "슈퍼 아몰레드 디스플레이는 타의 추종을 불허하는 기술력이며, 갤럭시 스마트폰과의 심리스한 연동 경험이 한 단계 진화했다"고 설명했다. 갤럭시북4 엣지와 갤럭시 스마트폰을 '링크 투 윈도'로 연결하면, 갤럭시 AI의 기능을 스마트폰뿐 아니라 PC 대화면에서도 활용할 수 있다. 예를 들어 갤럭시 스마트폰의 '서클 투 서치' 검색 결과를 갤럭시북4엣지 디스플레이에 미러링하면, PC에서 작업 중인 문서에 검색 결과를 바로 붙여 넣을 수 있었다. 갤럭시 스마트폰으로 회의 내용을 녹음한 뒤 갤럭시북4 엣지에 연결하면, PC의 대화면에서 스마트폰의 AI 기능을 활용해 요약이나 번역을 진행하고, 이후 이메일에 붙여 넣기를 하는 등 기기간 연동도 가능했다. 국내 최초 코파일럿+ PC 갤럭시북4 엣지에 탑재된 '리콜' 기능도 소개했다. 사용자가 과거의 특정 시점에 어떤 작업을 했는지 자연어로 쉽게 검색할 수 있게 해주는 이 기능은, 최근 작성한 문서나 이메일은 물론, 과거에 시청했던 영상 콘텐츠도 문자나 음성으로 손쉽게 검색해 준다. 업무 효율과 창작을 지원하는 마이크로소프트의 다양한 기능도 선보였다. '페인트'의 '코크리에이터'는 AI를 통해 간단한 아이디어나 스케치를 미술 작품으로 바꾸거나 단 몇 줄의 명령어만으로도 새로운 이미지를 생성해 준다. 윈도 스튜디오 '이펙트'는 온디바이스 AI로 구동되는 PC 카메라 필터와 배경 효과를 줄 수 있다. 음성 초점, 인물 모드, 배경 흐림, 초점 맞춤 등 실용적인 기능도 제공한다. 화상 회의 때 실시간 음성을 번역해 자막으로 제공하는 기능도 제공한다.

2024.05.30 13:32류은주

"엣지 플랫폼, 새로운 AI 담도록 진화한다"

[라스베이거스(미국)=김우용 기자] “엣지 플랫폼은 점점 더 많은 AI 여정을 수용하고 있다.” 피에르루카 치오델리 델테크놀로지스 엣지포트폴리오제품관리 수석부사장은 22일(현지시간) 미국 라스베이거스에서 열린 '델테크놀로지스월드(DTW) 2024'에서 한국기자단과 만나 이같이 강조했다. 피에르루카 치오델리 부사장은 델테크놀로지스에서 스토리지 관련 신규 비즈니스 구축을 담당해왔다고 자신을 소개했다. 그는 델테크놀로지스 파워스토어를 개발했으며, CTO실에서 VM웨어 모든 공동 전략 프로젝트 감독조직을 이끌었다. 그는 “델테크놀로지스는 2년전 프로젝트 프론티어를 발표하고 작년 델 네이티브엣지 신제품을 발표하며 엣지 비즈니스를 개발해왔다”며 “디지털시티부터 제조, 소매, 에너지 등의 전문가 팀을 구성해 제품을 연구한 결과 제로 터치를 확보할 수 있는 엣지 플랫폼을 수평적으로 구축해야 한다는 결론을 내렸다”고 말했다. 그는 “델 네이티브엣지는 제로트러스트와 제로토치를 통해 애플리케이션과 워크로드를 엣지에 배포할 수 있는 플랫폼”이라고 설명했다. 델테크놀로지스는 올해 행사에서 델 네이티브엣지의 최신 버전을 발표했다. 델 네이티브엣지 2.1 버전은 엔비디아, 서비스나우, 마이크로소프트와 파트너십을 강화하고, 엣지에서 메어메탈 컨테이너 기반으로 AI 애플리케이션 개발, 배포, 확장 등을 간소화할 수 있게 됐다. 올해 델테크놀로지스월드2024의 전체 주제가 AI로 관통하는 만큼 '델 네이티브엣지'도 새로운 AI 환경 구현에 주목했다. 그는 “AI는 아주 오랫동안 엣지에 존재하며 사용돼 왔고, 예전의 AI는 매우 최적화된 알고리즘 혹은 모델로서 간단한 조작에서 수년간 매우 정확하게 사용돼왔다”며 “지금은 AI 모델을 학습시켜 엣지로 추론을 가져와야 하는데, 엔비디아와 함께 네이티브엣지의 청사진을 통해 즉각적으로 엔비디아 NIM을 배포할 수 있는 기능을 발표했다”고 말했다. 그는 “네이티브엣지는 현재 엣지로 엔비디아 NIM을 사용할 수 있는 최초의 제품”이라며 “또, AI 실행은 매일 패키지를 변경하고, 계속 업데이트하면서 재교육을 해야 하기 때문에, 중앙부터 엣지까지 보안이 필요하다”고 강조했다. 그는 “AI 모델은 더 세련될 필요가 있고, 훈련을 받아야 하며, 또한 멀티모달 종류와 같은 더 다른 차원을 추가해야 한다”며 “따라서 AI 공장에서 만든 모델을 제조 공간이나 소매 공간으로 옮겨야 하는데 보안을 위해 쉽게 패키징할 수 있는 게 필요하다”고 덧붙였다. 델 네이티브엣지 최신 버전은 올해 행사에서 발표된 '델 AI 팩토리'의 일환으로 프로덕션급 애플리케이션의 개발 및 배포를 위한 엔비디아 NIM과 기타 마이크로서비스를 포함하는 엔드투엔드 소프트웨어 플랫폼인 '엔비디아 AI 엔터프라이즈'를 제공한다. 델 네이티브엣지와 엔비디아 AI 도구 및 SDK가 결합됐고, 엔비디아 메트로폴리스를 사용한 비디오 분석, 엔비디아 리바를 사용한 음성 및 번역, 엔비디아 NIM을 사용한 엣지에서 최적화된 추론 등에 이르는 엔비디아 AI 프레임워크를 엣지로 자동 제공할 수 있다. 델 네이티브엣지는 서비스나우의 나우플랫폼과 통합돼 엣지에서 AI 애플리케이션 개발 및 배포를 단순화한다. 기업은 IT 운영을 핵심 데이터 센터에서 엣지까지 효율적으로 확장할 수 있으며, 1일차 초기 배포부터 2일차 이상의 운영까지 아우르는 자동화된 엣지 관리 솔루션을 구축할 수 있다. 치오델리 부사장은 “이같은 폐쇄 루프 자동화를 통해 엣지 컴퓨팅 리소스의 오케스트레이션, 관리 및 워크플로를 단순화하고, 여러 산업 전반에 걸쳐 AI 및 기타 엣지 워크로드를 위한 보다 효율적이고 민첩하며 안전한 운영 및 서비스 모델을 제공할 것”이라며 “또 마이크로소프트 애저 아크 활성화 자동화 도입으로 엣지에서 추진력이 더욱 증폭됐다”고 말했다. 델테크놀로지스는 더 나은 비즈니스 성과와 엣지 사용 사례를 추진하기 위해 제조, 소매 및 디지털 도시에 서비스를 제공하는 ISV를 위한 6가지 새로운 네이티브엣지 솔루션을 도입했다. 대표적으로, 아비바 솔루션을 갖춘 새로운 통합 운영 센터는 도시 계획에 대한 360도 운영 뷰를 제공해 데이터 관리 및 시민 서비스를 향상시킨다. 플랫폼 자체 개선 사항으로 엣지 애플리케이션 성능, 확장성 및 보안이 향상됐다. 더 나은 성능, 확장성 및 보안을 제공하는 베어메탈 컨테이너에 애플리케이션을 배포하는 기능을 포함하며, 델네이티브엣지용 REST API를 도입해 데브옵스 워크플로에 통합하고 애플리케이션 통합을 개발하는 데 도움을 주는 비주얼스튜디오 플러그인 같은 새 도구를 제공한다. 델 에이펙스를 통한 단일 월간 구독으로 네이티브엣지 소프트웨어와 네이티브엣지 엔드포인트를 모두 활용할 수 있다. 델 '델 프리시전 워크스테이션'과 파워엣지 T160 서버 등의 새 엣지 하드웨어를 엣지 인프라 지원에 포함시켰다. 델 파워엣지 T160은 이전 제품보다 42% 작은 크기로 소매점 같은 작은 공간에 이상적이다. 엣지 및 인프라를 위한 프로컨설트 자문서비스와 엣지용 애플리케이션 디자인 서비스 등의 새 엣지 서비스를 출시했다. 델 서비스 전문가는 현재 상태를 평가하고 원하는 상태에 도달하기 위한 엣지 전략을 구축할 뿐만 아니라 효율성, 성능 및 ROI를 극대화하도록 엣지 환경을 설계하는 데 도움을 준다. 그는 네이티브엣지를 사용해 청사진 기술을 조정할 수 있고, 모든 것을 제로트러스트와 제로터치로 자동화하면서, 요구사항과 필요한 모든 소프트웨어를 패키지에 넣을 수 있다”며 “비용을 절감하고 완전한 보안을 달성하면서, 추론을 엣지에서 수행하고 모델을 재훈련시키는 전체 루프를 갖게 된다”고 강조했다. 그는 생성형 AI를 산업 엣지 환경에서 활용이 이제 막 시작됐다고 밝혔다. 그는 “큰 교량의 상황을 분석하고 품질을 관리한다고 할 때 현재의 컴퓨터비전으로 할 수 있는 건 얼마나 녹슬었는지 보는 정도였다”며 “생성형 AI를 활용한다면, 녹슨 교량 주변의 나무나, 다른 종류의 변색, 진동, 소음 등을 포함해 생성형 AI 기반의 3D 모델을 만들어내는 식이 가능할 것”이라고 예를 들었다. 그는 “올해 플랫폼을 지속적으로 혁신하면서 더 많은 릴리스를 출시할 예정”이라며 “플랫폼 기능을 더 확장하고, 파트너 생태계를 더욱 확장함으로써 고객에게 엣지를 위한 최고의 기반을 제공할 것”이라고 밝혔다.

2024.05.24 00:07김우용

델, 엔비디아 블랙웰 GPU 8개 탑재 4U 서버 공개

[라스베이거스(미국)=김우용 기자] 델테크놀로지스가 엔비디아와의 협력을 확대하며, 엔비디아 블랙웰 GPU를 한 랙에 최대 72개 장착할 수 있는 파워엣지 서버 신제품을 공개했다. 단일 서버 크기는 기존 제품대비 3분의2로 줄이면서 더 높은 성능과 대역폭을 제공한다. 델테크놀로지스는 21일(현지시간) 미국 라스베이거스에서 개최한 '델테크놀로지스월드(DTW) 2024' 컨퍼런스에서 '엔비디아 기반 델 AI 팩토리'에 새로운 서버, 엣지, 워크스테이션, 솔루션, 서비스 등을 추가한다고 발표했다. '엔비디아 기반 델 AI 팩토리'는 델의 AI 포트폴리오를 '엔비디아 AI 엔터프라이즈' 소프트웨어 플랫폼과 통합한 오퍼링이다. 엔비디아 텐서 코어 GPU, 엔비디아 스펙트럼-X 이더넷 네트워킹 패브릭 및 엔비디아 블루필드 DPU 등의 기술을 기반으로 한다. 고객은 필요에 따라 맞춤화된 통합 기능 또는 사전 검증된 전체 스택 솔루션을 구매해 검색증강생성(RAG), 모델 학습 및 추론과 같은 AI 사용 사례에 적용할 수 있다. 신제품 '델 파워엣지 XE9680L'은 기존 모델 대비 더 작은 4U 폼 팩터에 8개의 엔비디아 블랙웰 아키텍처 GPU를 탑재해 높은 성능을 제공한다. 기존 모델인 '델 파워엣지 XE9680'의 경우 6U 크기 제품이었는데, '델 파워엣지 XE9680L'는 4U 크기로 작아졌다. 업계 표준 x86 랙 상에서 엔비디아 GPU를 최고 수준의 집적도를 자랑한다. 기존 모델 대비 노드당 33% 더 높은 GPU 집적도를 제공한다. 20% 더 많은 5세대 PCIe 슬롯을 장착하고, 노스-사우스 네트워크 확장 용량을 2배로 늘렸다. 델 파워엣지 XE9680L서버는 '다이렉트 리퀴드 쿨링' 기술로 CPU 및 GPU의 냉각 용량을 높여 전반적인 효율성을 향상시켰다. 손쉬운 서비스가 가능하도록 설계됐으며, 랙 스케일 구축 및 현장 설치가 용이하게끔 공장에서부터 완벽하게 구성이 완료된 상태로 출하된다. 델은 업계에서 가장 높은 집적도와 에너지 효율의 랙 규모 턴키 솔루션을 공급함으로써 대규모 GPU 가속 구축의 가치 실현 시간을 단축한다. 델과 엔비디아는 향후 단일 랙에서 64개의 GPU를 지원하는 공냉식 설계 또는 단일 랙에서 72개의 엔비디아 블랙웰 GPU를 지원하는 수냉식 서례 등 다양한 옵션을 선보일 예정이다. 델테크놀로지스는 '엔비디아 AI 엔터프라이즈' 소프트웨어의 배포를 자동화하는 엣지 오케스트레이션 플랫폼 '델 네이티브엣지'를 선보였다. 개발자와 IT 운영자는 이를 이용해 엣지에 AI 애플리케이션 및 솔루션을 손쉽게 구축할 수 있다. 제조업이나 유통업계의 다양한 기업들이 엔비디아 메트로폴리스 영상 분석, 엔비디아 리바 음성 및 번역 기능, 엔비디아 NIM 추론 마이크로서비스를 포함한 새로운 델 네이티브엣지 블루프린트를 통해 빠르고 정확하게 엣지 데이터를 분석할 수 있다. 마이클 델 델테크놀로지스 회장은 “전세계가 AI를 활용하기 위해 빠르게 움직이고 있으며, 이것이 바로 엔비디아와 긴밀하게 협력하는 중요한 이유"라며 "엔비디아 기반 델 AI 팩토리 포트폴리오의 확장은 양사 공동의 사명을 이어가는 것으로, 더 많은 기업과 기관들이 AI를 보다 손쉽게 구축하여 과감하게 차세대 기술에 도전할 수 있도록 하는 것을 목표로 한다”고 밝혔다. 젠슨 황 엔비디아 CEO는 "생성형 AI는 새로운 유형의 컴퓨팅 인프라, 즉 인텔리전스를 생성하는 AI 팩토리를 필요로 한다"며 "엔비디아와 델은 함께 협력해 전세계 다양한 산업군에 컴퓨팅, 네트워킹, 소프트웨어를 포함한 풀스택 오퍼링을 제공해 코파일럿, 코딩 어시스턴트, 가상 고객 서비스 에이전트, 산업용 디지털 트윈 등을 구축할 수 있도록 지원할 계획"이라고 강조했다. DTW 2024 첫째날 기조연설에서 마이클 델 회장이 델 파워엣지 XE9680L을 소개하자, 젠슨 황 CEO는 “그런 말로 나를 유혹하지 마라”며 “랙에 72개의 블랙웰이 있다니 그것은 나를 매우 흥분하게 만든다”며 환하게 웃었다. 한편, 새롭게 공개된 '디지털 어시스턴트를 위한 델 생성형 AI 솔루션'은 델과 엔비디아의 풀스택 솔루션을 기본으로 사용자가 개인화된 셀프서비스를 경험할 수 있게끔 디지털 어시스턴트의 빠른 구축을 돕는다. 함께 발표된 '디지털 어시스턴트를 위한 구축 서비스'는 디지털 어시스턴트 솔루션을 설계, 계획, 구현, 테스트 및 확장할 수 있도록 지원한다. 양사 공동 엔지니어링을 통해 설계된 풀스택 자동화 솔루션인 '엔비디아 기반 델 AI 팩토리'는 다양한 활용 사례에 대한 AI 환경을 빠르게 구축할 수 있게끔 돕는다. 가치 실현 시간을 최대 85% 앞당기며, 엔비디아 추론 마이크로서비스(NIM)'와 함께 사용할 경우 딜리버리에서 추론 작업 실행에 걸리는 전체 시간을 획기적으로 단축한다. '프리시전 AI 워크스테이션 기반 RAG를 위한 델 가속기 서비스'는 AI 개발 주기를 단축하고 AI 애플리케이션 성능을 향상시킨다. 엔비디아 AI 워크벤치 툴킷을 탑재한 델 프리시전 워크스테이션 기반 RAG를 통해 맞춤형 대규모 언어모델을 활용함으로써 안전한 환경에서 신속한 프로토타이핑이 가능하다. '델 파워엣지 XE9680L' 서버는 올해 하반기 중 출시될 예정이다. '델 네이티브엣지'의 엔비디아 지원은 하반기를 시작으로 순차적으로 제공된다. '디지털 어시스턴트를 위한 델 생성형 AI 솔루션' 및 '디지털 어시스턴트를 위한 구현 서비스'는 현재 북미 지역에 한해 제공되고 있다. '프리시전 AI 워크스테이션 기반 RAG를 위한 델 가속 서비스'는 북미, EMEA, 아태지역의 일부 국가에 한해 하반기 중 출시될 예정이다. 제프 클라크 델테크놀로지스 제품 및 운영부문 부사장은 DTW 2024 둘째날 기조연설에서 “기존의 데이터센터 아키텍처는 생성에이아이 워크로드에 적합하지 않다는게 자명해졌다”며 “파워엣지 XE9680L은 한 랙에서 72개 블랙웰 GPU를 탑재할 수 있는데, 이 GPU는 수천, 수만개로 늘어날 수 있다”고 말했다. 그는 “옛 시스템에서 벗어나 완전히 다른 방식으로 구축하고 생성형 AI 워크로드에 맞춰 최적화하면서 발전해 나가야 한다”고 덧붙였다.

2024.05.22 07:45김우용

오픈엣지, 중기부 '초격차 스타트업 1000+ 육성사업'에 선정

반도체 설계자산(IP) 플랫폼 전문회사 오픈엣지테크놀로지(이하 오픈엣지)는 중소벤처기업가 주관하는 '2024년 초격차 스타트업 1000+ 육성사업'에 선정됐다고 21일 밝혔다. 해당 사업은 시스템반도체, 빅데이터·AI, 로봇 등의 신사업 10대 분야에서 국가 경제의 미래와 글로벌 시장을 선도할 딥테크 스타트업을 1,000개 이상 육성하는 것을 목표로 하고 있다. 선정된 기업들은 사업화 자금, 기술개발·정책자금·기술보증 등 다양한 혜택을 지원 받게 된다. 오픈엣지가 2019년 업계 최초로 출시 및 고객사 통해 양산 성공한 고효율 4·8비트 혼합정밀도 인공지능 프로세서 NPU IP인 'ENLIGHT(인라이트)'는 면적, 성능, 전력소모량 측면에서 높은 경쟁력을 갖추고 있다. 이 제품은 실시간 반응이 필요한 환경 또는 네트워크 연결이 제한된 환경에서 용이하다. 오픈엣지는 해당 IP를 활용해 고객사의 SoC 개발을 지원하고, 다양한 분야에서 활용 가능한 통합 AI 플랫폼을 구축하여 반도체 산업 및 국가 차원에서 온디바이스 AI 산업의 확산과 활성화를 도모할 계획이다. 오픈엣지는 2020년에 'BIG3 혁신분야 창업패키지'에 선정돼 3년간 정부 지원을 받았다. 이러한 성과가 우수한 기업으로 재선정되어 향후 2년 동안 최대 10억 원의 추가 지원 자금을 지원받게 되었다. 이번 후속 지원을 통해 오픈엣지는 NPU IP기술 개발을 더욱 고도화하고, 글로벌 탑티어 기업은 물론 해외 중소형 팹리스 기업을 대상으로 IP 판매 활동을 강화할 계획이다. 이성현 오픈엣지 대표는 “이번 프로젝트를 계기로 NPU 기술을 지속적으로 개발해 고객에게 더 높은 가치를 제공할 것”이라며 “혁신적인 기술 리더로서의 입지를 더욱 공고히 하고, 국내외 신규 고객을 유치하여 국가 경쟁력 강화에 적극적으로 기여할 것”이라고 밝혔다. 한편 오픈엣지는 대규모 언어 모델(LLM)의 핵심 요소인 '트랜스포머' 신경망 지원을 위한 8·16비트 혼합정밀도 고성능 NPU IP인 'ENLIGHT PRO(인라이트 프로)'를 최근 출시했다.

2024.05.21 09:53장경윤

퀄컴, 스냅드래곤 X 탑재 코파일럿+ PC 22종 공개

퀄컴이 21일 스냅드래곤 X 엘리트/플러스 탑재 코파일럿+ PC 22종을 공개했다. 마이크로소프트는 20일(미국 현지시간) '빌드' 행사에서 윈도 PC의 새로운 카테고리인 '코파일럿+ PC'를 공개했다. 코파일럿+ PC는 AI 연산을 가속하는 NPU(신경망처리장치) 성능이 최소 40 TOPS(초당 1조 번 연산) 이상이 되어야 함을 요구한다. 스냅드래곤 X 엘리트는 12코어 오라이온 CPU, 스냅드래곤 X 플러스는 10코어 오라이온 CPU를 탑재하며 CPU 최대 작동 속도와 GPU 성능에 차이가 있지만 NPU 성능은 최대 45 TOPS로 동일하다. 두 SoC(시스템반도체)의 AI 처리 성능은 현재 시장에 출시된 인텔 코어 울트라(메테오레이크, 11 TOPS)나 AMD 라이젠 8000 시리즈(16 TOPS) 대비 최대 4배 이상 빠르다. 퀄컴은 "스냅드래곤 X 엘리트/플러스 탑재 PC는 현 시점에서 윈도11이 제공하는 코파일럿+ 경험을 구현할 수 있는 유일한 기기"라고 강조했다. 알렉스 카투지안 퀄컴 모바일, 컴퓨트 및 XR 부문 그룹 본부장은 "퀄컴과 마이크로소프트와의 협업에 기반한 스냅드래곤 X 시리즈 및 코파일럿+ 성능 결합은 업계 선두의 성능 및 수일간 지속되는 배터리 수명 등 사용자의 컴퓨팅 경험을 재정의하는 혁신적인 AI 성능을 구현한다"고 밝혔다. 이어 "주요 PC 제조사는 스냅드래곤 X 기반 코파일럿+ PC를 다양한 폼팩터와 가격대로 출시 예정이며 퀄컴은 이러한 산업의 변화를 매우 기쁘게 생각한다"고 덧붙였다. 삼성전자, HP, 델테크놀로지스, 레노버 등 주요 PC 제조사를 통해 스냅드래곤 X 엘리트 탑재 노트북 18종, 스냅드래곤 X 플러스 탑재 PC 7종 등 총 25종이 오는 6월부터 순차 출시 예정이다.

2024.05.21 09:28권봉석

마이클 델 "AI, 두렵다고 아무것도 안하면 미래 기회 놓치는 것"

[라스베이거스(미국)=김우용 기자] “이전에 이뤄진 모든 발전은 실제 게임 전 쇼에 불과했다. 우리는 계산에서 인지를 거쳐 AI 시대로 나아가고 있다. 이는 생산성, 혁신, 성장을 위한 세대적인 기회다. 진짜 질문은 AI가 얼마나 커질 것인가가 아니라, AI가 얼마나 많은 좋은 일을 할 것인가다. 조직을 재창조하고 재구성하는 것은 어렵다. 위험하고 심지어 무섭게 느껴지기도 한다. 하지만 더 큰 위험과 더 큰 두려움은 그렇게 하지 않으면 무슨 일이 일어날 것인가다.” 마이클 델 델테크놀로지스 회장은 20일(현지시간) 미국 라스베이거스에서 개최된 '델테크놀로지스월드2024' 컨퍼런스 첫날 기조연설에서 이같이 밝혔다. 마이클 델 회장은 “AI는 우리의 도덕성, 신념, 법률 및 인간성의 매개변수 내에서 훈련돼야 한다”며 “결국 인공지능은 우리 삶, 보안, 상업, 교육, 과학, 의료의 중심을 이뤄 놀라운 속도로 발전하게 될 것”이라고 말했다. 델 회장은 “AI의 가능성을 실현하려면 책임감 있게 AI를 수행하고 채택 장벽을 전체적으로 해결해야 한다”며 “정부는 강력한 인프라 개발과 민첩한 규제에 초점을 맞춘 AI 우선 투자 전략을 채택해 혁신을 강화하고, 우리는 정부 지도자들을 지원하고 AI를 위한 안전하고 혁신적이며 포용적인 미래를 함께 만들 준비가 돼 있다”고 덧붙였다. 그는 기업과 단체, 공공 등에서 생성형 AI 기술의 이점을 올바른 방향에서 누릴 수 있도록 만반의 지원 준비를 갖췄다고 강조했다. 델테크놀로지스는 생성형 AI 서비스 구축 기간을 단축할 수 있는 사전 통합 레퍼런스 아키텍처 '델 AI 팩토리'를 지난달 공개했다. 델 AI 팩토리는 생성형 AI를 온프레미스 환경에 손쉽게 구축할 수 있도록 서버, 스토리지, 네트워킹 등의 하드웨어와 AI 관련 핵심 소프트웨어, 전문 기술지원 서비스 등을 모두 제공한다. 마이클 델 회장은 “델 AI 팩토리는 통제가능한 데이터 성능과 서비스, 비용, 보안 등을 갖춘 솔루션”이라며 “미래를 위한 데이터센터이며, 처음부터 AI 우선 사고방식으로 구축 및 설계됐다”고 강조했다. 그는 모든 데이터를 클라우드로 가져가기보다 사내 환경에 두고 싶어하는 기업의 움직임을 전했다. 그는 데이터를 클라우드에 모두 둘 경우 제어하기 어려워지고 더 많은 비용을 감당하게 된다는 점을 들었다. 그는 대규모언어모델(LLM) 추론을 퍼블릭 클라우드에서 구동할 때보다 온프레미스에서 구동할 때 75% 더 비용 효율적이란 최근 조사 결과를 소개했다. 기업 CIO 83%는 올해 일부 워크로드를 퍼블릭 클라우드에서 온프레미스로 되돌릴 계획을 갖고있다는 설문 결과도 전했다. 그는 ”이는 추론과 데이터 중력이라는 두 가지 요인에 의해 추진된다”며 “데이터에 AI를 적용하려는 것이지 그 반대가 아니다”라고 말했다. 그는 미션크리티컬 애플리케이션의 데이터를 저장하는 '파워스토어'의 신제품 '파워스토어 프라임'을 간략히 소개하고, 대규모 초고속 데이터 저장을 위한 '파워스케일 F910' 출시를 발표했다. 파워스토어 프라임은 QLC 어레이로 성능을 최대 66% 향상시켰고, 5대1의 데이터 절감을 보장하는 제품이다. 파워스케일 F910은 비정형 데이터와 생성형 AI 파운데이션 모델 학습용 데이터를 저장하는 스토리지다. 생성형 AI 최적화 서버로 큰 인기를 누리고 있는 '델 파워엣지 XE9680' 서버의 최신 모델인 '델 파워엣지 XE9680L' 출시도 발표했다. 델 파워엣지 XE9680L은 기존 버전보다 더 작은 크기에 최신 엔비디아 블랙웰 GPU 8개를 장착할 수 있고, 랙 하나에서 최대 72개의 블랙웰 GPU를 묶음구성할 수 있다. 마이크로소프트의 '코파일럿 플러스 PC'에 기반한 신규 AI PC 5종도 소개했다. 델 AI 팩토리 위드 엔비디아는 이날 새롭게 출시된 서버와 스토리지, 클라이언트 제품을 포함하며 확장됐다. 이날 마이클 델 회장의 기조연설은 빌 맥더못 서비스나우 최고경영자(CEO), 황성우 삼성SDS 대표, 젠슨 황 엔비디아 CEO 등의 대담과 함께 진행됐다. 마이클 델 회장은 “미래 세대를 정의할 기회이며, 이제 우리가 그를 하지 않으면 부끄러운 일이 될 것이고 우리 모두와 세계의 손실이 될 것”이라며 “우리는 인지의 새로운 시대, AI 시대의 새벽에 있으며 가능성은 오늘날의 가장 위대한 혁신가의 정신에 불을 붙이고 있다”고 말했다. 그는 “오늘날의 혁신가보다 훨씬 더 중요한 것은 이 초지능이 차세대 혁신가에게 어떤 의미를 가질 수 있는지다”라며 “미래는 바로 지금”이라고 강조했다.

2024.05.21 07:30김우용

딥엑스, 1100억원 규모 신규 투자 유치…스카이레이크 등 참여

AI반도체 원천기술 기업 딥엑스는 사모펀드 기관들의 신규 투자를 중심으로 1천100억 원 규모의 신규 투자 유치를 마무리했다고 10일 밝혔다. 이로써 딥엑스는 글로벌 시장 진출을 위한 1세대 제품의 양산화와 LLM 온디바이스를 위한 차세대 제품 개발 및 출시에 더욱 속도를 낼 계획이다. 이번 투자에는 기존 주주인 ▲타임폴리오 자산운용을 비롯해 ▲스카이레이크 에쿼티파트너스 ▲BNW인베스트먼트 ▲아주IB 등 사모펀드 기관들이 참여했다. 사모펀드 중심의 투자가 단행된 점, 신규 투자자들이 대부분의 투자금을 차지한 점, 반도체 산업에 대한 전문적인 지식과 경험 그리고 네트워크가 풍부한 전문가들이 포진한 투자자로 구성된 점이 이번 투자의 특징이다. 딥엑스의 2대 주주가 된 스카이레이크는 '미스터 반도체'라 불리는 진대제 전 정보통신부 장관이 설립한 국내 대표 사모펀드 기관이다. 진대제 회장은 삼성전자 재직 시절 세계 최초로 메모리 반도체 16MB, 256MB D램의 개발을 이끈 주역으로 한국 반도체 산업을 상징하는 인물이다. 김재욱 BNW인베스트먼트 회장 역시 삼성전자 메모리 제조 기술 담당 사장 등을 역임해 메모리 제조공정 혁신을 이끌며 삼성전자 메모리 글로벌 1위를 만들어 낸 국내 반도체 산업의 권위자다. 딥엑스는 온디바이스 AI 반도체 및 AI 컴퓨팅 솔루션에 대한 원천기술을 보유한 기업이다. 물리 보안, 로봇, 가전, 공장자동화, AI 서버 등 다양한 응용 제품에 AI를 저전력, 고성능, 저비용으로 구동할 수 있는 AI 반도체 제품군을 확보했다. 또한 딥엑스는 올해 말부터 시작되는 대단위 양산 비즈니스를 위해 대륙별로 총판 협약을 진행하며 벨류체인 네트워크를 빠르게 확산하고 있다. 김녹원 대표는 “스카이레이크의 진대제 회장님은 제가 반도체를 배우던 학창 시절에 국내 반도체 산업을 세계 시장의 주역으로 만든 분"이라며 "딥엑스가 쌓아 온 기술적 가능성을 가장 정확하게 판단해 주실 최적의 전문가라고 생각해 투자를 요청하게 된 것이 이번 투자 라운드의 시작이었다"고 밝혔다. 김녹원 대표는 이어 "이번 투자는 글로벌 전략 자산인 AI 반도체 원천 기술과 국내 최초 글로벌 팹리스 탄생이라는 숙원의 과제를 성취하라는 명령으로 생각하고 과감하게 글로벌 시장에 도전하고자 한다"고 덧붙였다.

2024.05.10 09:06장경윤

델-현대오토에버, 엣지 AI 기술로 공장 프로세스 강화

델테크놀로지스는 제조업체의 AI 활용을 지원하기 위해 엣지 솔루션 포트폴리오를 확대한다고 24일 밝혔다. 이를 위해 델은 현대오토에버, 인텔 등과 협력해 엣지 파트너 에코시스템을 강화함으로써 제조 고객들이 AI를 통해 데이터로부터 더 많은 가치를 창출할 수 있도록 지원한다. 제조업체는 AI를 통해 엣지 데이터를 보다 빠르고 정확하게 수집, 분석, 처리할 수 있다. IDC는 AI가 향후 수년간 엣지 컴퓨팅의 성장을 주도할 것으로 예상하며, 2024년 전 세계 엣지 컴퓨팅 투자가 2023년 대비 15.4% 증가한 2,320억 달러에 달할 것으로 전망했다. 델은 '제조 엣지 환경을 위한 델 검증 설계'에 현대오토에버의 오퍼링을 결합해 제조업체들이 AI 기반 팩토리로 전환하게끔 돕는다. 현대오토에버는 제조업체들의 운영 간소화 및 디지털 연속성을 위해 기존의 IT 및 OT 인프라와 통합 가능한 스마트 팩토리 솔루션을 제공한다. '제조 엣지를 위한 델 검증 설계'에 현대오토에버의 '네오팩토리 IoT' 소프트웨어를 통합해 공장 프로세스에 AI 기반으로 최적화하고 성과를 촉진할 수 있다. 공장 관리자는 장비 성능을 신속하게 모니터링하여 이상현상을 감지하고, 예측 유지 보수를 통해 다운타임을 줄이는 한편 생산성을 높일 수 있다. 공정 낭비로 인한 비용을 제거하고 프로세스 직행 수율을 향상시키는 효과를 얻게 된다. 제조 엣지를 위한 델 검증 설계는 델의 엣지 운영 소프트웨어 플랫폼인 '델 네이티브엣지'에서 지원된다. 제조업체는 인프라스트럭처 구축을 간소화하고, 공장 현장에서 여러 애플리케이션을 관리하며, 인프라스트럭처와 애플리케이션을 신속하게 확장하는 동시에 공장의 보안을 유지 및 강화할 수 있다. 현대오토에버 차세대 스마트팩토리 추진실은 "델과의 협력을 통해 현대오토에버의 네오팩토리 IoT는 엣지에서 실시간 데이터와 AI를 사용해 의사 결정을 내리고 비즈니스 성장을 촉진함으로써 현대적인 제조 방식을 한층 고도화한다”며 “델 네이티브엣지와 통합으로 확장 가능하고 안전한 솔루션을 제공함으로써 제조 역량을 제고하고 디지털 혁신의 새로운 기준을 재정의할 계획”이라고 밝혔다. 제조 엣지를 위한 델 검증 설계는 다양한 파트너 및 독립 소프트웨어 공급업체(ISV)로 구성된 에코시스템을 지원해 제조업체가 공장 현장의 데이터를 관리하는 방식에 대한 폭넓은 선택권과 유연성을 제공한다. XM프로를 통한 확장된 디지털 트윈 기능, 코그넥스의 AI 지원 스마트 카메라를 통한 고급 품질 관리, 클래로티(Claroty)의 향상된 온프레미스 위협 감지 기능 등 델의 파트너 에코시스템은 제조업체의 환경을 지원하는 데 필요한 기술을 지속적으로 혁신하고 제공한다. 델은 엣지에서 AI 및 머신러닝 애플리케이션을 구축하고 관리할 수 있는 더 많은 유연성과 선택권을 제공하기 위해 '인텔 타이버 엣지' 플랫폼의 일부인 '오픈비노' 툴킷을 지원하는 '델 네이티브엣지 블루프린트'를 선보인다. 양사의 통합 기술은 엣지 컴퓨팅 자원의 오케스트레이션 및 관리를 간소화하여 인텔 기반 하드웨어에 안전하고 원활하게 애플리케이션을 배포할 수 있도록 지원한다. 최적화된 AI 추론으로 실시간 인사이트를 도출하고 기업의 운영 효율성을 개선하는데 도움이 된다. 김경진 한국델테크놀로지스 총괄 사장은 “공장에서 데이터를 생성하는 모든 지점에서 비즈니스 가치를 발견할 수 있다”며 “장비 상태, 부품 생산 현황, 조립 라인의 공정 및 안전을 위한 모니터링 카메라, 포장 및 물류 등 수많은 곳에서 방대한 양의 데이터가 생성된다”고 설명했다. 그는 “제조기업이 델을 선택함으로써 데이터의 가치와 AI의 가능성을 실현시킬 수 있도록 혁신 기술을 지속적으로 제공하고자 한다”고 강조했다.

2024.04.24 14:02김우용

지코어 "삶을 바꾸는 생성 AI의 위치는 엣지"

“인공지능(AI)이 인류의 미래를 바꿀 것이라 전망되지만, AI가 어떻게 산업에 연결돼 서비스로 다가오고 경제 생활을 만들어낼 지 알 수 없다. 가시적인 변화는 AI가 생산성으로 이어져야 가능할 것이다. 일반인공지능(AGI)도 중요한 문제고 인류의 미래를 바꾸겠지만, 기업의 먹거리와 인류의 삶을 바꾸는 AI는 결국 엣지에서 있을 것이다.” 지코어코리아 김진용 팀장은 지디넷코리아가 17일 서울 인터컨티넨탈코엑스에서 개최한 '제21회 어드밴스드컴퓨팅컨퍼런스플러스(ACC+) 2024' 기조연설에서 이같이 밝혔다. 김진용 팀장은 "생성형 AI는 2년도 안 돼 부풀려진 기대치의 정점을 찍었고, 곧 환멸의 골짜기에 도달할 것으로 보인다”며 “생성형 AI 기업의 운영 비용은 월 100만달러에 달하는 큰 부담을 주고 실질적인 이익을 벌어들이지 못하는 상황이기 때문”이라고 설명했다. 김 팀장은 “현 시점에서 필요한 것은 기존 자산을 잘 조합하고 새로운 아이디어를 고안해내서 새로운 혁신을 이루는 것”이라며 “AI 학습과 추론, 모델을 묶어서 사용자 가까이 있는 디바이스와 안전한 통신으로 연결되는 모든 세트를 갖춰야 한다”고 강조했다. 지코어는 160개 이상의 국가와 지역에 PoP를 운영하고 있다. 강력하고 안전한 클라우드 및 엣지 AI에 대한 노하우를 보유하고 있는 기업이라고 스스로를 강조한다. 특히 생성형 AI 학습과 추론에 필요한 전용 인프라를 클라우드 서비스로 제공하고 있다. 최근 지코어코리아는 한국 데이터센터를 개소했다. 품귀현상을 보이는 엔비디아 H100 텐서코어 GPU 서버를 설치했다.지코어의 H100 기반 AI 퍼블릭 클라우드 서비스는 SMX5 타입의 H100 GPU를 각 8개씩 탑재한 서버들을 대규모 클러스터로 구성해 강력한 컴퓨팅 능력을 제공한다. AI학습 성능에 가장 큰 영향을 미치는 GPU간 연결을 모두 인피니밴드 NDR(400Gbps)로 구성해 각 서버당 대역폭을 3.2Tbps로 제공한다. 김진용 팀장은 “생성형 AI의 아키텍처는 기존 엔터프라이즈용 애플리케이션과 달리 서비스 부분에서 많은 자원이 필요하다”며 “지코어는 훈련용과 추론용 인프라로 GPU 자원을 제공하며, 더 특별한 수요에 대응하는 IPU도 제공한다”고 말했다. 지코어의 또 다른 강점은 네트워킹 인프라다. 콘텐츠딜리버리네트워크(CDN)에서 시작한 회사란 장점을 살려 초저지연시간을 보장하는 고속 네트워크를 생성 AI에 제공할 수 있다. 지코어의 클라우드 컴퓨팅은 '서버리스 컴퓨팅'에 기반한다. 거대언어모델(LLM)을 사용할 때 자원 할당을 별도로 하지 않아도 되며, 실제로 모델을 작동시키는 양만큼만 비용을 내면 된다. 그는 “AI는 지연시간에 민감한 서비스기에 지코어는 글로벌 평균 26밀리초의 지연시간을 유지하며, 한국의 경우 한자릿수 밀리초의 지연시간으로 이용할 수 있다”며 “다양한 LLM을 기업이 모두 미리 깔아놓을 수 없으므로 정말 필요할 때 자원과 모델을 곧바로 활용할 수 있도록 서버리스 컴퓨팅으로 제공하고 있다”고 설명했다. 지코어는 중앙의 인프라와 네트워킹에 더해 엣지 단계에서 AI 모델 추론을 수행할 수 있는 환경도 제공한다. '인퍼런스앳더엣지'란 서비스는 160여개 지코어 POP의 캐싱서버에 암페어 알트라맥스와 엔비디아 L40S 칩을 두고 고객의 AI 서비스를 구동할 수 있게 한다. 필요한 LLM도 캐싱해 빠르게 제공할 수 있으며, 유사한 추론을 반복적으로 하게 되는 상황을 감안해 모델응답을 캐시할 수 있다. 김 팀장은 “사용자가 지코어 기잔의 AI 서비스에 접속하면 인퍼런스앳더엣지의 AI 칩으로 다양한 모델을 끌어와 서비스를 돌릴 수 있다”며 “지리적 혹은 정치적 이유에 따른 규제 차이에 맞게 답변과 모델에 차이를 둬야 할 때도 맞춤형으로 대응가능하다”고 말했다. 그는 여기에 '5G 보안 네트워크' 기반으로 생성 AI와 사용자 디바이스를 연결할 수 있다고 했다. 사용자, 기업 등의 데이터가 외부에 유출되지 않도록 제로트러스트 네트워크를 통해 정보를 주고 받을 수 있다. 그는 “어떤 IoT 디바이스든 데이터를 실제 AI 서비스 장소까지 안전하게 전달하는 센서 데이터 보안 확보가 가능하다” 그는 “지코어의 서비스를 통해 '모든 것의 인터넷(IoT)'에서 '모든 것의 AI(AioT)'라 할 수 있게 된다”며 “지코어는 앞으로 AI 시장이 우리 현실 속에 들어온 엣지 디바이스에서 일어날 것으로 생각하며 이를 실현하기 위해 어느 기업보다 먼저 아키텍처를 고안해 선보이고 실제로 잘 움직이도록 잘 조율해 서비스에 녹여왔다”고 강조했다.

2024.04.17 11:53김우용

마이크로칩, 뉴로닉스 AI 랩스 인수

마이크로칩테크놀로지는 FPGA에 배포된 전력 효율적인 AI 기반 엣지 솔루션의 개발 역량을 강화하기 위해 뉴로닉스 AI 랩스(Neuronix AI Labs)를 인수했다고 16일 밝혔다. 뉴로닉스 AI 랩스는 이미지 분류, 물체 감지 및 시멘틱 세그멘테이션 등의 작업에 필요한 전력, 크기 및 연산양을 절감시키기 위해 높은 수준의 정확도를 유지하는 뉴럴 네트워크 희소성 최적화 기술을 제공하는 업체다. 마이크로칩의 미드레인지 폴라파이어(PolarFire) FPGA 및 SoC는 저전력, 신뢰성, 보안 기능 측면에서 이미 업계를 선도하고 있다. 마이크로칩은 이번 인수로 비용, 크기, 전력 제약이 있는 시스템에서 컴퓨터 비전 애플리케이션이 사용하도록 설계된 부품의 대규모 엣지 디플로이먼트를 더욱 비용 효율적으로 개발할 수 있게 됐다. 또한 로우레인지 및 미드레인지 FPGA의 AI/ML 처리 능력을 몇 배 더 증대할 수 있게 됐다. 브루스 바이어 마이크로칩 FPGA 사업부 부사장은 "뉴로닉스 AI 랩스의 기술을 통해 AI·ML 알고리즘을 활용하는 인텔리전트 엣지 시스템에 배포되는 FPGA 및 SoC의 전력 효율성을 향상시킬 수 것"이라며 "이제 시스템 개발자들은 이전에는 크기, 열 또는 전력 제약으로 구현이 어려웠던 스몰 풋프린트 하드웨어의 아키텍처를 설계 및 배포할 수 있게 됐다"고 말했다. 뉴로닉스 기술의 확보로 FPGA 설계 플로우에 대한 전문적인 지식을 가진 FPGA 전문 개발자가 아니더라도 업계 표준 AI 프레임워크를 사용하여 강력한 병렬 처리 기능을 활용할 수 있게 됐다. 뉴로닉스의 AI 지적 재산과 마이크로칩의 기존 컴파일러와 소프트웨어 설계 키트를 결합하면 RTL 관련 전문 기술이나 기본적인 FPGA 아키텍처에 대한 심층적인 지식 없어도 커스터마이징 가능한 FPGA 로직에 AI·ML 알고리즘을 구현할 수 있다. 또한 하드웨어를 다시 프로그래밍 할 필요 없이 즉시 CNN 업데이트 및 업그레이드가 가능하도록 설계할 수 있다.

2024.04.16 14:36장경윤

델, 파워엣지 서버에서 인텔 가우디3 AI 가속기 지원

델테크놀로지스는 고성능 AI 서버 '델 파워엣지 XE9680'에 '인텔 가우디 3' AI 가속기 지원을 추가한다고 15일 밝혔다. 델 파워엣지 XE9680은 x86 서버 아키텍처에 8개의 GPU를 탑재하는 모델로 AI 운영에 특화된 성능을 제공한다. 델은 XE9680 에코시스템에 인텔 가우디3 가속기를 통합함으로써 고객이 생성형 AI 워크로드와 관련된 컴퓨팅 요구 사항에 맞춰 시스템을 맞춤화 할 수 있도록 지원한다. 델은 범용성과 강력한 성능을 모두 갖춘 AI 가속 인프라를 제공하겠다는 전략이다. XE9680은 가우디3 가속기를 추가함으로써 더 풍부한 서버 구성 옵션을 제공하게 됐다. 최대 32개의 DDR5 메모리 DIMM 슬롯을 통해 데이터 처리량을 향상시켰고, 16개의 EDSFF3 플래시 스토리지 드라이브와 8개의 PCIe Gen 5.0 슬롯으로 확장된 연결성과 대역폭을 제공한다. 프로세서당 최대 56개 코어를 지원하는 4세대 인텔 제온 스케일러블 프로세서를 2개를 장착했으며, 가장 고난도의 AI·ML 워크로드에 대한 데이터 처리 및 분석에 최적화됐다. 기존 하드웨어 성능을 뛰어넘어 AI를 통해 심층적인 데이터 인사이트를 확보하고자 하는 기업에서는 폭넓은 가속기 옵션을 갖춘 XE9680을 중요 자산으로 활용할 수 있다. 고급 처리 능력과 효율적인 공랭식 설계가 결합된 이 제품은 AI 가속화의 새로운 기준을 제시하며, 비즈니스 성과를 촉진하는 신속하고 실행 가능한 인사이트를 제공한다. 인텔 가우디 3 AI 가속기를 탑재한 '파워엣지 XE9680' 서버 모델은 올해 안에 국내 출시될 계획이다 인텔 가우디3 AI 가속기는 64개의 커스텀 및 프로그래밍 가능한 텐서 프로세서 코어(TPC)와 128GB의 HBMe2 메모리 용량, 3.7TB의 메모리 대역폭, 96MB의 온보드 SRAM 등 생성형 AI 워크로드에 필수적인 스펙을 갖췄다. 가우디3는 개방형 에코시스템을 갖춰 파트너십 기반의 최적화 및 모델 라이브러리 프레임워크 지원의 이점이 있다. 기존 코드베이스의 전환을 간소화하는 개발 툴로 간편한 마이그레이션을 지원한다. 가우디3 가속기로 강화된 파워엣지 XE9680은 6개의 OSFP 800GbE 포트를 통해 가속기에 직접 결합된 새로운 네트워킹 기능을 제공한다. 외장 NIC를 시스템에 배치할 필요 없이 외부 가속기 패브릭에 직접 연결 가능해 인프라를 단순화하고 인프라의 총소유비용과 복잡성을 낮추는데 효과적이다. 인텔 가우디3 전문 미디어 디코더는 AI 비전 애플리케이션을 위해 설계됐다. 광범위한 사전 처리 작업을 지원해 비디오에서 텍스트로의 변환을 간소화하고 엔터프라이즈 AI 애플리케이션의 성능을 향상시킨다. 델은 최근 포레스터웨이브 보고서에서 AI 분야 선도 기업으로 선정됐다. IT 및 데이터 과학자가 AI를 적용하고 생산성을 높일 수 있도록 포괄적인 솔루션을 제공함으로써 엔드투엔드 환경의 생성형AI 성과를 이끌어낸다는 평가를 받으며 전략과 오퍼링 측면 모두에서 높은 점수를 획득했다. 김경진 한국델테크놀로지스의 총괄 사장은 “델은 폭넓은 협업 전략을 통해 AI 개발의 경계를 확장하고, 새로운 표준을 끊임없이 제시하고 있다”며 “고객이 AI 여정의 어느 단계에 있든 목표 달성을 가속하고, 미래에 필요하게 될 요구 성능에 대비하는 동시에 이 여정이 안전하게 지속될 수 있도록 지원하는데 집중할 계획”이라고 강조했다.

2024.04.15 11:39김우용

AMD, 버설 AI 엣지·프라임 2세대 공개...2025년 출시

AMD가 임베디드 기기에서 AI 처리 역량을 극대화한 버설(Versal) AI 엣지/프라임 2세대 SoC(시스템반도체)를 내년 하반기 출시한다. 버설 AI 엣지/프라임 2세대는 AI 처리를 위해 신호를 수집하는 전처리, 추론, 후처리 등 모든 작업을 단일 칩으로 처리한다. Arm이 지난 해 공개한 자동차용 IP(지적재산권)인 코어텍스-A78AE와 코어텍스 R52를 이용해 온도와 전력 등 임베디드 환경 내구성을 확보했다. ■ 임베디드 환경에서 AI 처리시 환경적 제약 ↑ 스테프 고티에(Steph Gauthier) AMD 적응형 및 임베디드 컴퓨팅 그룹 버설 시리즈 수석 매니저는 사전 브리핑에서 "AI 처리 역량을 임베디드 기기에 적용하려면 여러 가지 도전 과제에 직면한다"고 설명했다. 이어 "임베디드 환경은 온도와 전력 소모, 크기 등에 제약을 받으며 실시간 구동되는 환경에서 보안과 안전성, 신뢰성을 확보해야 한다. 여기에 AI 처리 기능까지 더하며 상당한 제약 조건이 존재한다"고 덧붙였다. 현재 시스템에서 AI 관련 기능을 처리하려면 추론에 필요한 영상이나 음성, 센서의 각종 신호를 처리하는 전처리, AI 엔진이 실제로 구동되는 신경망 기반 추론, 추론 결과를 바탕으로 각종 모터나 센서를 구동하는 과정 등 3단계를 거친다. ■ 전처리·AI 추론·후처리 과정 여러 칩에 분산 스테프 고티에 수석 매니저는 "전처리 과정에서 하드웨어 기반 가속 기능이 작동하지 않으면 처리 과정에서 병목 현상이 일어나며 보다 적은 자원으로 이를 처리하는 프로그래머블 로직(PL)을 이용해 이를 해결할 수 있다"고 말했다. 전처리를 통해 수집한 데이터를 기반으로 추론 작업을 실행할 때는 고성능 프로세서 기반 벡터 연산이 필요하다. 스테프 고티에 수석 매니저는 "지금까지 나온 솔루션 중 대부분은 전처리나 벡터 연산 등 최대 두 개만 처리 가능한 것이 한계"라고 밝혔다. 이어 "현재 구조로는 여러 개 칩을 탑재해야 하는데 더 큰 기판을 적용하면서 시스템 크기와 메모리 용량, 전력 소모가 모두 늘어난다. 칩 사이 데이터 전송시 지연시간도 발생하며 고장 요인과 보안 취약점도 늘어난다"고 덧붙였다. ■ 각종 SoC 통합해 전력 소모·복잡성 최소화 버설 AI 엣지/프라임 2세대는 전처리와 추론, 후처리 등 3개 동작을 한 번에 처리할 수 있도록 각종 SoC를 통합했다. 전처리 과정에는 프로그래머블 로직과 메모리/입출력에 필요한 IP를 기본 내장해 전력 소모를 줄였다. 추론은 벡터 연산에 최적화된 차세대 엔진을 이용한다. 신경망 처리에 흔히 쓰이는 파이토치, 텐서플로 등을 모두 지원하며 독자 개발 모델도 쓸 수 있다. 스테프 고티에 수석 매니저는 "스마트시티 솔루션의 이미지 처리에서 전세대 대비 보드 면적은 그대로 유지하며 초당 30fps 영상처리가 가능하다"고 설명했다. 후처리 과정에는 Arm 코어텍스-A78AE와 코어텍스-R52 코어를 이용한다. 자동차 탑재 기준인 ASIL(자동차 안전 무결성 수준)을 만족해 자동차 등 환경에서 안정적으로 작동한다. ■ 스바루, ADAS 기능에 버설 AI 엣지 2세대 적용 마누엘 엄(Manuel Uhm) AMD 버설 제품 마케팅 디렉터는 "주된 용도가 ADAS 제어용이 될 것"이라고 설명했다. 실제로 완성차 업체 스바루는 카메라 3대로 구현된 ADAS 기능인 아이사이트(EyeSight)에 버설 AI 엣지 2세대를 도입할 예정이다. 버설 AI 엣지/프라임 2세대 관련 문서는 오늘(9일)부터 신청한 개발자에 제공된다. 실리콘에 이를 구현한 시제품은 내년 상반기, 평가 키트는 내년 중반 제공되며 실제 제품은 내년 하반기 출시 예정이다.

2024.04.09 17:20권봉석

"AI 기술을 가장 쉽고 안전하게 활용할 수 있는 플랫폼"

“레드햇이 한국에 존재하는 이유는 한국 고객의 경쟁력 강화에 기여하기 위해서다. 현재 고객의 경쟁력 강화를 위한 논의는 인공지능(AI)에 있다. 레드햇은 엔터프라이즈 AI 플랫폼을 방향으로 잡았고, 고객이 AI 기술을 가장 잘 활용할 수 있도록 지원한다.” 김경상 한국레드햇 대표는 최근 본지와 인터뷰에서 자사의 사업 전략에 대해 이같이 밝혔다. 2021년부터 한국레드햇 수장을 맡아온 김경상 대표는 “지난 3년 사이 고객에게 주로 듣는 이야기의 키워드가 클라우드 도입에서 클라우드 네이티브 애플리케이션 AI, 엣지 등으로 바뀌었다”며 “특히 작년 가장 많이 논의된 주제가 AI였고, 레드햇도 어떻게 AI에 대응해야 할 지 고민을 많이 했다”고 강조했다. 작년 한해 많은 기업이 생성형 AI에 관심을 갖고 발빠르게 투자에 나섰다. 일단 생성형 AI의 유즈케이스와 기술적 검증이 주된 투자처였다. 이제 검증 단계를 거쳐 본격적인 도입의 시기가 오고 있다. 그와 함께 전과 다른 새로운 고민거리가 기업에 부담을 주고 있다. 김경상 대표는 “기존 기업용 앱 개발 및 관리 과정과 AI를 활용해 서비스하는 과정 사이에 특성 차이가 있다”며 “기존 기업용 앱과 달리 AI는 대량 데이터 관리와 고성능 GPU 서버 제어, 초기 모델 학습과 서비스 개시 후 지속적인 모델 최적화 과정 등이 잘 진행돼야 한다”고 설명했다. 그는 “인프라 과점에서 초기 대량 데이터 학습 시점과 서비스 시점의 인프라 관리 지점이 달라진다”며 “이런 부분에 초점을 둬서 레드햇의 컨테이너와 쿠버네티스 기술인 오픈시프트를 기반으로 전체 과정을 지원하는 플랫폼인 '오픈시프트 AI'란 것을 출시해 기업용 앱과 다른 요구사항을 가진 AI 활용 부분을 지원하고 있다”고 덧붙였다. 그에 따르면, 생성형 AI는 기업에 막 도입되기 시작한 초기 단계기 때문에 전세계 많은 전문업체와 서비스업체가 각자의 소프트웨어와 하드웨어를 내놓고 있다. 무분별한 도입시 관리 복잡성이 커지고, 지속적으로 업데이트돼야 하는 AI 플랫폼의 특성을 유지하지 못할 수 있다. 레드햇의 오픈시프트 AI는 오픈소스 소프트웨어를 기반의 개방형 아키텍처를 갖고 있고, 다양한 소프트웨어 회사와 협업 가능하도록 설계됐다. 레드햇은 엔터프라이즈 리눅스를 수십년간 제공해온 노하우를 통해 AI 기술을 더 안정적이고 호환성 검증된 환경에서 이용하게 한다. 김 대표는 “레드햇의 오픈 하이브리드 클라우드는 퍼블릭 및 프라이빗 클라우드와 엣지 어디서든 자유롭도록 상호운용을 보장한다”며 “이게 오픈시프트의 기본 사상이며 프라이빗에서 AI를 준비하고 디바이스 엣지 단에 보내 퍼블릭에서 활용하게 하는 등의 자유도를 줄 수 있다”고 말했다. 그는 “또 한편으로 레드햇 제품에 생성형 AI 역량을 심고 있는데, 레드햇 앤서블 자동화 솔루션에 생성형 AI를 접목했다”며 “운영체제부터 서비스형 플랫폼(PaaS)에 이르는 인프라 관리 관련 경험과 데이터를 AI에 학습시켜서 자동화 코드를 생성하는 서비스인 '앤서블 라이트스피트'를 제공하고 있으며, 앞으로 생성형 AI 역량을 고도화해 다양한 제품군으로 확대할 계획”이라고 강조했다. 김 대표는 지난 3년 간 이룬 고객 확보 사례로 삼성전자의 사례를 들었다. 단순히 솔루션을 제공하는 것에 그치지 않고 고객의 경쟁력 향상에 기여한다는 기본 전략을 실현한 사례란 것이다. 그는 “삼성전자와 레드햇은 2년전부터 협약을 맺었고, 그 첫 사례로 차세대 CXL 메모리 분야에서 협력하고 있다”며 “앞으로 차세대 메모리로 각광받는 CXL을 서버에서 사용할 때 가장 많이 활용될 OS인 레드햇엔터프라이즈리눅스(RHEL)를 제품 개발 과정부터 성능을 검증해 출시하는 것”이라고 말했다. 그는 “레드햇 소프트웨어에서 삼성전자 CXL이 최적 성능을 내는 지 검증하고, 확인하고 출시함으로써 해당 메모리가 시장에 나왔을 때 훨씬 더 경쟁력있게 활약할 수 있는 윈윈 사례라고 생각한다”고 덧붙였다. 그는 또 다른 상호 협력 사례로 삼성SDS와 한전KDN을 들었다. 삼성SDS는 자사 퍼블릭 클라우드 플랫폼에서 레드햇 오픈시프트를 서비스 품목으로 제공하게 됐다. 한전KDN은 에너지 관련 공공기관에 제공하는 클라우드 네이티브 애플리케이션 전환 서비스에서 레드햇의 솔루션 역량을 활용하고 있다. 김 대표는 “계속해서 아이템을 발굴해서 고객과 서로 윈윈하는 케이스를 많이 만드려 하고 있다”며 “한국 시장에 기여하는 노력을 꾸준히 해왔고 앞으로도 계속할 것”이라고 강조했다. 레드햇은 작년과 올해 여러 시장 변화를 마주하고 있다. 2020년부터 RHEL의 오픈소스 다운스트림 프로젝트인 센트OS 리눅스를 업스트림 프로젝트인 '센트OS 스트림'으로 변경했고, 그 일환으로 RHEL의 소스코드를 고객과 파트너에게 한정적으로 제공하고 있다. 센트OS 리눅스의 대체재를 강조하는 경쟁사의 공격적 영업이 글로벌 시장과 국내 시장에서 활발히 일어났다. 김 대표는 “가격이든 품질이든 경쟁은 시장 자체의 크기를 키우기 때문에 좋은 것이라 생각한다”며 “그런 차원에서 이미 검증된 솔루션이냐 안정적이냐 부분에 초점을 두고 최고의 품질을 보장한 상태에서 고객이 사용할 수 있다는데 초점을 맞춰 시장을 대하고 있다”고 밝혔다. 서버 가상화 시장도 변화를 맞고 있다. VM웨어가 서버 가상화 솔루션의 라이선스를 구독형으로 전면 전환하고, 가격 체계를 개편하면서 기 고객의 대안 솔루션 검토가 늘고 있다. 레드햇 가상화(RHV)와 레드햇 오픈시프트 가상화, 레드햇 오픈스택 가상화 등도 대안 솔루션으로 관심받고 있다. 김 대표는 “서버 가상화 부분도 고객의 고민이고 무언가 솔루션을 받길 원하는 상태인데, 레드햇은 그들의 고민을 함께 해결할 수 있는 여러 솔루션 옵션을 가졌다”며 “고객 각자 처한 상황이 다 다르고,. 오픈시프트 중심의 애플리케이션 현대화 방향으로 가려는 고객이나 기존 가상화 형태로 가려는 고객도 있을 것이어서 상황을 잘 검토하면서 많은 해결책을 드릴 수 있을 것이라 여긴다”고 밝혔다. 그는 기업의 엣지 환경에 대한 접근에도 신경쓰고 있다고 했다. 레드햇은 데이터센터를 산업 현장과 지점에 근접 배치하는 것 외에도 소프트웨어를 포함해 구동하는 사용자 단계의 최종 단말기까지 엣지로 본다. 통신기업의 MEC, vRAN, 리테일의 디지털 스토어 및 POS 단말기, 커넥티드카와 소프트웨어정의자동차 등도 레드햇에게 엣지다. 김 대표는 “단말기에 필요한 경량의 OS, 그리고 단말기 속 여러 애플리케이션과 소프트웨어를 관리하기 위한 오픈시프트 컨테이너 플랫폼 등을 혼합해 패키징해서 엔터프라이즈용 엣지 플랫폼을 제공하고 있다”며 “GM이 레드햇 오픈시프트 플랫폼으로 인비히클 소프트웨어를 개발, 배포하고 있으며, 이를 통해 아키텍처와 기술을 표준화해 관리 인력과 구입비용 등을 절감하고 일상적 개발 배포 주기를 단축하고 있다”고 말했다. 그는 “항상 고객과 눈높이를 맞춰야 더 잘할 수 있고 더 많이 도울 수 있다고 생각하고 있다”며 “그것이 한국레드햇의 성장”이라고 강조했다.

2024.04.01 10:47김우용

시놀로지 "올해 국내 중소기업 영상보안 공략 강화"

"한국 영상보안 시장은 한화비전(구 삼성테크윈) 등이 브랜드 인지도와 사후 유지보수 용이성, 고객지원 등을 앞세워 대규모 고객사를 확보했습니다. 올해 한국 시장에서 비용 문제로 어려움을 겪는 중·소규모 기업에 제품을 알리는 것이 목표입니다." 20일 개막한 '제 23회 세계 보안 엑스포'(SECON 2024) 행사장에서 기자와 만난 석미은 시놀로지 대만 본사 시니어 세일즈 매니저가 이와 같이 설명했다. 시놀로지는 2022년 이후 2년 연속으로 SECON 2024에 독자 부스를 마련하고 오는 22일까지 NAS(네트워크 저장장치)와 IP 카메라를 활용한 영상보안 솔루션을 시연중이다. 행사장을 찾은 관람객들은 엣지 AI를 활용한 영상 분석 기능에 많은 관심을 보였다. ■ 2009년 NAS 운영체제에 영상 보안 솔루션 통합 시놀로지는 전세계 NAS(네트워크 저장장치) 시장에서 강세를 보이는 업체다. 2009년 NAS용 자체 개발 운영체제 DSM(디스크스테이션매니저)에 IP 카메라 영상 관리 소프트웨어 '서베일런스 스테이션'을 통합했다. '서베일런스 스테이션'은 지난 해 9.0으로 업데이트를 거치며 자동차 번호판 인식, 지정 구역 혼잡도 알림, 침입 탐지 등 기능을 추가했다. 해당 기능은 인텔 셀러론(-2020)·AMD 라이젠 임베디드(2021-) 등 NAS 프로세서로 구동된다. 지난 2022년에는 엣지 AI 기능을 내장한 IP 카메라인 BC500/TC500 2종을 국내 포함 전세계 출시했다. 서베일런스 스테이션과 연동해 초기 카메라 설정이 가능하며 출입자 확인, 감시 영역 설정 등이 가능하다. ■ "시놀로지 영상 감시 솔루션, 비용 면에서 강점" 석미은 매니저는 "국내 영상보안 환경 구축시 소프트웨어와 IP 카메라는 국내/외 제품으로 구축 후 장기적으로 저장이 필요한 대용량 영상 데이터 보관에만 NAS를 이용하는 경향이 있다"고 설명했다. 이어 "NAS는 실시간 영상 데이터 저장 이외에 온디바이스 AI를 이용한 지능형 감시, 녹화 영상 백업과 공유 등을 갖춰 중/소규모 기업의 초기 투자를 줄이며 시설 보안 효율화가 가능하다"고 덧붙였다. 또 "국내 시설보안 업체는 침입자나 화재 등이 발생하면 보안요원이 출동하는 점에서 강점이 있지만 월 이용료 결제 등에서 한계가 있다. 시놀로지 영상 보안 솔루션은 유사시 직접 대처해야 하지만 추가 비용을 억제할 수 있다"고 강조했다. ■ "NAS·IP 카메라 공급으로 유지보수 일원화 가능" 서베일런스 스테이션은 지금까지 출시된 8천400여 개의 IP 카메라를 모두 지원한다. 그러나 석미은 매니저는 "타사 IP 카메라를 이용한 영상보안 시스템 구축시 유지보수 제공자가 분리되는 문제가 있었다"고 설명했다. 이어 "NAS와 IP 카메라를 모두 공급해 유지보수나 문제 발생시 통합된 지원을 제공하겠다는 것이 시놀로지 목표이며 BC500/TC500 2종을 시작으로 국내외 시장에 주기적으로 신제품을 출시할 예정"이라고 덧붙였다.

2024.03.20 17:53권봉석

지코어, 100개 언어 지원하는 AI 자동 음성인식 서비스 출시

퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지 AI 전문기업 지코어는 빠른 속도는 물론 비용 효율성을 높인 '지코어 AI 자동 음성인식 서비스(Gcore AI ASR)'를 선보인다고 19일 밝혔다. 지코어 AI 자동 음성인식 서비스는 지코어의 워크플로우에 통합되어, 데이터의 빠른 전달 속도가 매우 중요한 방송사, 주문형 비디오(VOD), 라이브 스트리밍 및 콘텐츠 소유자가 전세계 시청자에게 신속하게 도달할 수 있도록 지원한다. 100개 이상의 언어를 지원하는 관리형 클라우드 서비스로, 다른 언어를 사용하거나 청각 장애가 있는 사용자들도 생성된 자막을 통해 콘텐츠 접근성을 높일 수 있다. 기존의 자동 음성인식 서비스는 속도가 느리고, 비용이 많이 들어 콘텐츠 제작자와 소유자에게 상당한 비용 부담이 됐다. 기존의 자막 생성은 여러 언어가 포함된 경우 몇 시간 또는 며칠씩 걸리기도 했다. 하지만 지코어 AI 자동 음성인식 서비스는 1시간 분량의 동영상 자막을 10분 이내 생성하며, 일반적인 단어 사용에 대한 오류도 4~5%로 낮게 나타나는 등 정확도가 사람이 생성한 것과 유사하거나 더 높다. 뿐만 아니라 여기에 특정 언어 또는 주제 영역에 대한 오픈소스 자동 음성인식 서비스 모델을 선택함으로써 자막을 생성할 콘텐츠에 대한 정확도를 더 높일 수 있다. 이러한 사용자 지정 방식은 산업별 용어나 여러 언어를 사용하는 콘텐츠에 유리하다. 이를 위해 지코어 AI 자동 음성인식 서비스는 새롭게 출시되고 업데이트되는 자동 음성인식 모델을 내부적으로 엄격히 평가해 고객이 사전 구성된 서비스를 통해 최상의 옵션을 사용할 수 있도록 보장한다. 직접 테스트를 거친 최고의 자동음성인식 모델을 한 곳에서 만나볼 수 있도록 지원함으로써 고객은 직접 모델을 선택하거나 조정할 필요 없이 콘텐츠의 빠른 자막 생성에만 집중할 수 있다. 물론 고객이 원할 경우 지코어의 서비스 팀은 고객이 특정 자동음성인식 모델을 선택하고 미세조정을 통해 특정 요구사항을 충족할 수 있도록 지원한다. 알렉세이 페트로브스키크 지코어 스트리밍 플랫폼 헤드는 "전세계 시청자에게 영상 콘텐츠를 제공하는 데 있어 자막은 매우 중요한 요소”라며 “지코어 AI 자동 음성인식 서비스, AI ASR은 방송사는 물론 콘텐츠 소유자 및 기업이 신선하고 접근하기 쉬운 콘텐츠로 세계 곳곳의 시청자에게 도달할 수 있도록 비용 효율적이고 정확한 방법을 제공한다”고 밝혔다. 그는 “지코어의 솔루션과 엣지 인프라의 지속적인 혁신을 위한 또 다른 진전이 될 것"이라고 강조했다. 지코어 AI 자동 음성인식 서비스는 현재 상용 서비스 중이다.

2024.03.19 14:00김우용

韓 MCU 시장 강화 나선 ST…"2025년까지 생산능력 2배 확장"

ST마이크로일렉트로닉스가 국내 범용 마이크로컨트롤러(MCU) 시장 공략을 위한 전략을 공개했다. 올해 엣지 AI 등 다양한 산업을 위한 신규 칩을 출시하는 것은 물론, 오는 2025년까지 생산능력을 2배 확충하기 위한 투자에도 나선다. 19일 ST마이크로일렉트로닉스는 서울 강남 노보텔에서 '2024년 STM32 신제품 발표회'를 개최했다. 이날 발표를 맡은 최경화 ST코리아 이사는 올해 ST의 국내 범용 마이크로컨트롤러 시장 공략을 위한 핵심 전략을 크게 4가지로 제시했다. 첫 번째 전략은 STM32 제품군의 확장이다. STM32는 Arm '코어텍스-M' 프로세서 기반의 32비트 마이크로컨트롤러 및 마이크로프로세서(MPU)다. AI와 같은 고성능은 물론 무선, 저전력, 임베디드 등 다양한 산업을 위한 제품으로 구성돼 있다. 이에 따라 ST는 이달 STM 신제품 칩 4종을 국내에 출시한다. 먼저 MPU 제품에서는 64비트 프로세싱 및 엣지 AI 가속 기능을 갖춘 'STM32MP2'를 선보였다. STM32MP2는 첨단 보안 기능과 함께, 까다롭고 시간에 민감한 작업부하와 AI 추론, 통신을 지원하도록 설계됐다. MCU 제품은 ▲STM32U0 ▲STM32H7R ▲STM32WBA55 등을 공개했다. STM32U0은 STM32 시리즈 중 가장 소비전력이 낮은 MCU다. 다양한 저전력 모드를 지원해 배터리 사용 시간을 최대로 확대할 수 있다. STM32H7R은 최대 600MHz의 동작 속도를 가지는 고성능 MCU다. 다양한 고속의 직렬/병렬 메모리 인터페이스가 제공돼 메모리 선택 폭을 넓혔다. STM32WBA55는 저전력 블루투스(Bluetooth LE) 5.4 및 SESIP(IoT용 보안 평가 표준) 레벨 3 인증을 위한 무선 MCU다. 최 이사는 "IoT 환경에서 수십 개의 장치가 점차 더 자율적으로 작동 및 연결되고 있어, 로컬 네트워크에서 데이터를 처리하는 일이 많아지고 있다"며 "이에 ST는 시장의 요구에 대응하기 위해 지금까지 약 3천300개의 제품을 출시했다"고 밝혔다. 두 번째 전략은 에코시스템 강화다. ST는 STM32 제품과 관련한 각종 소프트웨어 및 하드웨어 툴을 제공하고 있다. 엣지 AI 산업을 위해 자동으로 머신러닝 모델을 생성하는 '나노엣지 AI 스튜디오'를 STM32 사용자들에게 무묘로 제공하는 것이 대표적인 사례다. 세 번째 전략은 제조 분야 강화다. ST는 올해부터 내년까지 전공정 관련 협력사를 2곳 추가하고, 후공정 협력사도 3곳 추가해 생산능력과 제조 유연성을 높일 예정이다. 최 이사는 "ST는 지난 2022년부터 2025년까지 생산능력을 2배 확장하기 위해 투자하고 있다"며 "설비투자는 주로 ST의 자회사가 위치한 이탈리아, 프랑스 공장에서 이뤄지고 있다"고 설명했다. 네 번째 전략은 접근성과 영향력 확장이다. ST는 현재 전 세계에서 1천여개 이상의 유통 파트너십을 구축한 상황으로, STM32 관련 커뮤니티 운영을 통해 고객사의 접근성을 높이고 있다.

2024.03.19 13:49장경윤

레드햇-NTT, IOWN 기술로 엣지 AI 분석 강화

레드햇과 일본 통신 기업 NTT는 차세대 통신 표준 협의체 아이온(IOWN) 이니셔티브의 일환으로 엔비디아 및 후지쯔와 협력해 엣지에서 실시간 생성형 AI 데이터 분석을 향상하고 확장할 수 있는 솔루션을 공동 개발했다고 27일 밝혔다. 이 솔루션은 아이온 글로벌 포럼에서 개발한 기술을 사용해 쿠버네티스 기반 레드햇 오픈시프트 상에 구축됐으며, 실제 실행 가능성 및 사용 사례에 대해 '아이온 글로벌 포럼의 개념 증명(POC)을 획득했다. AI 센싱 기술과 네트워킹 혁신이 가속되고 특히 데이터 소스가 빠르게 확장됨에 따라, 네트워크 엣지에서 데이터를 평가하고 분류하는데 있어 AI 분석 활용의 중요성이 더욱 커지고 있다. 그러나 AI 분석을 대규모로 사용하는 것은 속도가 느리고 복잡할 수 있으며, 새로운 AI 모델과 추가적인 하드웨어로 인한 관리 비용과 소프트웨어 유지 비용이 증가할 수 있다. 더 많은 원격지에서 엣지 컴퓨팅이 가능하게 되면 AI 분석을 센서에 더 가깝게 배치함으로써 지연 시간을 줄이고 대역폭을 늘릴 수 있게 된다. 레드햇과 NTT의 이번 솔루션은 아이온 올 포토닉스 네트워크(APN)과 아이온 데이터 중심 인프라(DCI) 내의 데이터 파이프라인 가속 기술로 구성돼 있다. NTT의 AI용 가속 데이터 파이프라인은 APN을 통한 원격 직접 기억장치 접근(RDMA) 방식을 채택해 엣지에서 대량의 센서 데이터를 효율적으로 수집하고 처리한다. 레드햇 오픈시프트의 컨테이너 오케스트레이션 기술은 지리적으로 분산돼 있는 원격 데이터 센터들에 걸쳐 있는 가속 데이터 파이프라인 내에서 워크로드를 보다 유연하게 운영할 수 있도록 지원한다. 레드햇과 NTT는 이번 솔루션이 엣지에서 이뤄지는 실시간 AI 분석을 위한 저지연성과 낮은 전력 소비량을 확보할 수 있음을 성공적으로 입증했다. 양사는 개념 증명(PoC)을 통해 일본 요코스카 시를 센서 설치 거점으로, 무사시노 시를 원격 데이터센터로 go 두 곳 모두 APN으로 연결된 상태에서 실시간 AI 분석 플랫폼을 평가했다. 그 결과, 많은 수의 카메라를 포함한 경우에도 AI 분석을 위한 센서 데이터를 집계하는 데 필요한 지연 시간이 종래의 AI 추론 워크로드 대비 60% 줄었다. 엣지의 각 카메라 별 AI 분석에 필요한 전력 소비량이 기존 기술보다 40% 절감될 수 있음이 입증됐다. 이 실시간 AI 분석 플랫폼을 사용하면 CPU의 병목 현상 없이 더 많은 수의 카메라를 수용할 수 있도록 GPU를 확장할 수 있다. 시범 계산에 따르면 1천대의 카메라를 수용할 수 있는 규모라고 가정한다면 전력 소비량을 60%까지 줄일 수 있을 것으로 예상된다. NTT가 제공하는 AI 추론을 위한 가속 데이터 파이프라인은APN을 통한 RDMA를 활용해 각지의 대규모 센서 데이터를 원격 데이터 센터의 가속기 내 메모리로 직접 가져와 기존 네트워크의 프로토콜 처리 오버헤드를 줄인다. 이후 더 적은 CPU 제어 오버헤드로 가속기 내에서 AI 추론의 데이터 처리를 완료해 AI 추론의 전력 효율을 개선한다. 레드햇 오픈시프트 기반의 실시간 대규모 AI 데이터 분석은 쿠버네티스 오퍼레이터가 하드웨어 기반 가속기(GPU, DPU 등) 구현의 복잡성을 최소화할 수 있도록 지원해 원격 데이터센터를 비롯한 분산된 위치 전반에 걸쳐 유연성을 개선하고 배포를 용이하게 한다. 이 개념 증명은 AI 추론을 위해 엔비디아 A100 텐서 코어 GPU와 엔비디아 커넥트X-6 NIC를 사용한다. 이번 솔루션은 지능형 AI 지원 기술의 기반을 마련하고 이를 통해 비즈니스의 지속 가능한 확장을 돕는다. 크리스 라이트 레드햇 최고기술책임자, 글로벌 엔지니어링 수석 부사장 겸 아이온 글로벌 포럼 이사회 이사는 "우리는 아이온 글로벌 포럼의 일원으로서 지난 몇 년 동안 오픈소스 기반 AI 혁신의 무대를 마련하고 미래를 위한 더 현명한 선택을 가능케 하는 기술을 제공하기 위해 노력해왔다”며 “이번 결과를 통해 우리는 전세계 기업을 위한 지속 가능하고 혁신적인 AI 기반 솔루션을 구축할 수 있음을 입증할 수 있었다"고 밝혔다. 카츠히코 카와조에 NTT 수석 부사장 겸 아이온 글로벌 포럼 회장은 "NTT 그룹은 파트너와 긴밀하게 협업하며 지속 가능한 사회를 실현하기 위해 아이온의 발전에 박차를 가하고 있다”며 “이번 아이온 PoC는 AI의 집단 지성을 지원하는 AI용 그린 컴퓨팅을 향한 중요한 진전”이라고 강조했다.

2024.02.27 11:39김우용

엣지 AI 칩, 6년간 '2배' 성장 전망…PC·스마트폰서 채택 활발

엣지 AI용 프로세서 시장이 PC, 스마트폰 등 다양한 산업의 수요 증가로 견조한 성장세를 이뤄낼 것으로 예상된다. 23일 시장조사업체 옴디아에 따르면 세계 엣지 AI용 반도체 시장 규모는 지난 2022년 310억 달러(한화 약 41조2천200억 원)에서 오는 2028년 600억 달러(약 79조7천300억 원)로 2배가량 증가할 전망이다. 엣지 AI는 중앙 집중형 서버를 거치지 않고 기기 주변의 로컬 네트워크를 통해 데이터를 처리하는 기술을 뜻한다. 엣지 AI는 최근 IT 업계의 화두로 떠오른 온디바이스 AI와도 맞닿아 있다. 온디바이스 AI는 기기 자체에서 AI 기능을 처리하는 기술로, 실제 구동 환경에서는 클라우드 및 엣지 네트워크를 동시에 활용하는 '하이브리드 AI' 운용이 필요하기 때문이다. 옴디아는 이들 기술과 연관된 AI 가속기, AI용 주문형 반도체, GPU(그래픽처리장치) 등 관련 산업이 견조한 성장세를 보일 것으로 내다봤다. 예상 시장 규모는 2022년 310억 달러에서 2028년 600억 달러로, 연평균 성장률은 11% 달할 전망이다. 실제로 AI 시대를 겨냥한 시스템 반도체는 스마트폰, 노트북 등에서 점차 도입이 확대되는 추세다. 스마트폰의 경우 삼성전자, 퀄컴, 미디어텍 등이 최신 모바일 AP(애플리케이션 프로세서)에 AI 성능을 앞다퉈 강조하고 나섰다. 일례로 삼성전자는 올해 초 '엑시노스 2400'을 공개하면서 AI 성능이 전작 대비 14.7배 향상됐다고 설명한 바 있다. 퀄컴이 지난해 10월 공개한 '스냅드래곤 8 3세대'는 내부 '헥사곤' NPU(신경망처리장치) 성능을 98%, 효율성을 40%가량 높였다. 노트북용 프로세서도 상황은 비슷하다. 애플 'M3' 시리즈, 퀄컴 '스냅드래곤 X 엘리트', AMD '8000G' 등 최신 프로세서들이 모두 AI 기능 구현을 위한 성능을 갖췄다. 옴디아는 "최근 엣지 AI용 반도체가 활발히 출시되면서 AI PC로의 전환을 앞당기고 있다"며 "스마트폰 시장도 현재 3분의 2 이상이 어떠한 형태로든 AI 기능을 갖추고 있어, 프리미엄 제품을 중심으로 성장세가 예상된다"고 밝혔다. 국내 스타트업들도 엣지 AI용 NPU 시장 진출을 준비하고 있다. 모빌린트는 80 TOPS(TOPS: 초당 1조 번의 정수 연산처리) 수준의 고성능 NPU를 개발해, 올해 첫 시제품 양산을 목표로 하고 있다. 딥엑스는 올해 산업별로 다른 성능을 갖춘 온디바이스용 NPU 4종을 양산하고, 내년에는 LLM(대규모언어모델) 및 생성형 AI를 구동하는 초저전력 온디바이스 AI 칩을 출시할 계획이다. 옴디아는 "AI ASSP(특정 용도로 설계된 표준 칩)가 전통적인 GPU의 자리를 흡수해 전체 엣지 AI용 프로세서 시장의 비중을 19%에서 28%로 확대할 것"이라며 "PC 시장은 기존 스마트폰 칩셋 구조인 CPU·GPU·NPU를 점점 더 많이 채택하고 있다"고 설명했다.

2024.02.23 14:39장경윤

래블업, MWC 2024서 엣지클라우드·생성 AI 플랫폼 공개

래블업은 오는 26일부터 29일까지 4일간 스페인 바르셀로나에서 열리는 'MWC 2024'에 참가한다고 23일 밝혔다. MWC 2024의 최대 화두는 AI다. 통신사들은 글로벌 트랜드인 엣지클라우드 시장에 합류하기 위해 앞다퉈 AI 관련 최신 기술의 투자 소식을 알리고 있다. 래블업은 통신사들이 기지국 단에 세우는 소규모 연산 자원인 엣지클라우드에서 빠르고 쉽게, 그리고 저비용으로 AI를 연구 개발, 서비스하는 사례를 소개한다. 글로벌 기업 협력을 통해 전 세계 엣지클라우드 시장에 진출할 예정이다. 래블업은 전시회에서 일반 대중을 위한 사용하기 쉬운 AI 애플리케이션 통합 플랫폼인 'GenAI Desktop'을 선보일 예정이다. 이 플랫폼은 사용자가 AI를 쉽게 이해하고 활용할 수 있도록 돕는 도구다. 백엔드닷AI 패스트트랙을 통해 래블업에서 거대 언어 모델을 원하는 형태로 파인튜닝해 개발한 챗봇 솔루션인 'Talkativot'을 모바일에서 직접 시연해 볼 수 있다. 패스트트랙은 기업 및 연구소 대상의 B2B 솔루션으로 생성AI 개발을 간소화하고 자동화하는 ML옵스 플랫폼이다. 이 플랫폼으로 데이터 분석, 분류, 처리부터 AI 훈련, 평가, 서비스 배포 등 파이프라인 모든 과정을 신속하고 효과적으로 관리한다. 신정규 대표는 “래블업은 올해 'Make AI Scalable'을 목표로, 엣지클라우드 기반의 AI 솔루션과 생성형 AI 애플리케이션 플랫폼을 통해 글로벌 AI 시장을 선도하는 플랫폼 기업으로 도약할 것"이라며 "3월 개최될 엔비디아 GTC 2024에 실버 스폰서로 참가해 국내뿐 아니라 글로벌 AI 시장에서도 최신 AI 트렌드를 선도할 것”이라고 강조했다.

2024.02.23 11:15김우용

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

[ZD브리핑] 美 반도체 관세 여부 주목…23일부터 한일 정상회담

통신사가 직접 'AI 스마트폰' 만들어 판다

이재명 대통령 "AI 혁신에만 전념할 환경 만들겠다"

국내 OTT, 해외서도 끊김 없이 보려면…여름휴가·연휴 안전한 시청법

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.