• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'추론'통합검색 결과 입니다. (44건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

KAIST, 멀티모달 대형언어모델 '깃허브' 공개…GPT-4V 시각성능 "제꼈다"

국내 연구진이 오픈AI의 GPT-4V와 구글 제미나이-프로(Gemini-Pro)의 시각 성능을 능가하는 멀티모달 대형언어모델을 개발, 오픈소스 커뮤니티 깃허브(Github)에 공개했다. 최근 주목받는 생성형 AI 트랜드가 멀티모달화로 진화 중이어서 귀추가 주목됐다. KAIST는 전기및전자공학부 노용만 교수 연구팀이 GPT-4V 등 비공개 상업 모델의 시각 성능을 넘어서는 공개형 멀티모달 대형언어모델을 선보였다고 20일 밝혔다. 연구팀은 멀티모달 대형언어모델 시각 성능을 개선하기 위해 '콜라보(CoLLaVO)'와 '모아이(MoAI)' 2가지 기술을 자체 개발했다. 이병관 연구원(박사과정,제1저자)은 "GPT-4V나 제미나이-프로 등과 시각성능 만을 비교하면 점수나 정확도 면에서 최대 10% 더 우수하다"고 말했다. 인지추론성도 함께 따져봐야 하지만, 이는 이번 연구 주제에서 벗어나 나중에 생각할 부분이라는 것이 이 연구원 얘기다. 사실 인지추론성도 개별 검토한 결과 오픈AI나 구글 모델 대비 결코 뒤지진 않는다는 것이 이 연구원의 귀뜸이다. 연구팀은 '콜라보'를 개발하기 전 기존 공개형 멀티모달 대형언어모델 성능이 비공개형에 비해 떨어지는 이유를 1차적으로 물체 수준에 대한 이미지 이해 능력 저하에서 찾았다. 연구팀은 이를 개선하기 위해 이미지 내 정보를 배경과 물체 단위로 분할하고 각 배경 및 물체에 대한 정보를 멀티모달 대형언어모델에 직접 넣어주는 '크레용 프롬프트(Crayon Prompt)'라는 시각적 프롬프트를 새로 설계했다. 또 시각적 지시 조정 단계에서 크레용 프롬프트로 학습한 정보를 잃어버리지 않기 위해 물체 수준 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터로 학습시키는 획기적인 학습전략인 '듀얼 큐로라(Dual QLoRA)'를 제안했다. 이병관 연구원은 "이로 인해 이미지 내에서 배경 및 물체를 1차원적으로 구분하는 능력이 크게 향상됐다"고 덧붙였다. 대형언어모델인 모아이(MoAI)'도 개발했다. 인간이 사물을 판단하는 인지과학적 요소(물체 존재나 상태, 상호작용, 배경, 텍스트 등)에서 영감을 얻었다는 것이 연구팀 설명이다. 연구팀은 "기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용하기 때문에, 이미지 픽셀 수준에서의 상세하고 종합적인 실세계 장면에 대한 이해가 모자란다고 판단했다"고 말했다. 연구팀은 △전체적 분할 △한계가 없는 물체 검출기 △상황 그래프 생성 △글자 인식 등 4가지 컴퓨터 비전 모델을 언어로 변환한 뒤 멀티모달 대형언어모델에 입력했다. 이를 연구팀이 실제 검증한 결과 '콜라보'는 Math Vista(대학수준 수학 및 물리문제)나 MM-벤치(영어 객관식 문제), MMB-CN(중국어 객관식 문제), AI2D(어학문제) 등의 풀이에서 기존 모델 대비 최대 10%까지 점수와 정확도가 우수했다. 또 '모아이'는 기존 공개형 및 비공개형 LLVMs(멀티모달 대형언어)와 비교한 결과 각 질문에 따라 점수가 20포인트 이상 우수하게 답변한 경우도 나타났다. 이병관 연구원은 "3개월전 깃허브에 올려놓은 '콜라보'(https://github.com/ByungKwanLee/CoLLaVO)와 '모아이'(https://github.com/ByungKwanLee/MoAI)에 관심을 가져달라"며 "박사학위가 마무리되면 멀티모달 대형언어를 아이템으로 창업할 생각도 있다"고 말했다. 박사과정 5년차인 이 연구원은 또 "개인적으로 향후 기회가 닿는다면, 핸드폰에 들어가는 사이즈로 현재 성능을 유지하는 멀티모달 대형언어모델을 만들어 볼 것"이라고 덧붙였다. 노용만 교수는 “연구팀에서 개발한 공개형 멀티모달 대형언어모델이 허깅페이스 일간 화제의 논문(Huggingface Daily Papers)에 추천됐다"며 "SNS 등을 통해 전세계에 점차 알려지는 등 관련분야 발전에 기여할 것"으로 기대했다. 연구에는 논문 제1저자 이병관 박사과정 연구원 외에도 박범찬 석박사통합과정, 김채원 박사과정이 공동 저자로 참여했다. 연구결과는 '콜라보'의 경우 자연어 처리(NLP) 분야 국제 학회 'ACL Findings 2024'(5월16일자)에 게재됐다. '모아이(MoAI)'는 컴퓨터 비전 국제 학회인 'ECCV 2024'에 논문을 제출하고 결과를 기다리고 있다. 한편 이 연구는 KAIST 미래국방 인공지능 특화연구센터 및 전기및전자공학부 지원을 받아 수행했다.

2024.06.20 14:26박희범

AWS "보안과 IT혁신 동시 지원하는 자동화된 추론"

[필라델피아(미국)=남혁우 기자] 아마존웹서비스(AWS)가 자동화된 추론(Automated Reasoning)이라는 인공지능(AI) 기술을 통해 기업 보안 강화와 함께 기술혁신 촉진에 나선다. 12일(현지시간) AWS의 커트 쿠펠드 정체성, 관측 가능성 및 보안 부문 부사장은 AWS 리인포스 2024 키노트에서 공개한 자동화된 추론의 중요성과 적용 사례에 대해 소개했다. 자동화된 추론은 복잡한 시스템의 프로세스를 자동으로 정확하게 분석하고 검증할 수 있는 기술이다. 소프트웨어(SW)를 비롯해 하드웨어(HW) 전반에 걸쳐 설계부터 개발, 운영 과정 전반을 분석하며 예상치 못한 취약점이나 오류를 사전에 식별할 수 있다. 이를 통해 공격자가 악용할 수 있는 잠재적인 침입 경로를 차단하고 이미 침투한 악성코드 등을 제거 가능하다. 커트 쿠펠드 부사장는 "예를 들어 모든 AWS API 호출은 인증 실행내역 클라이언트(ARC)를 통해 허가를 받는다”며 “이 코드는 자동화된 추론을 사용해 수학적으로 검증되었으며, 이를 통해 코드가 예상대로 작동하는지 확인해 안정성을 높였다”고 설명했다. 이어서 “이 밖에도 제트 엔진 데이터 같은 기업 기밀 데이터를 분리해 보호하는 시스템을 설계하는 과정에서 매커니즘의 안전성을 검증하기 위해 자동화된 추론이 활용되기도 한다”고 사례를 소개했다. 자동화된 추론은 복잡한 데이터를 분석하고 평가하는 과정을 통해 개발 중인 새로운 기능이나 신규 비즈니스 전략 등을 빠르게 검증해 의사결정에 필요한 근거를 제공하는 등 보안 분야 외에도 폭넓게 활용될 수 있다. AWS는 AWS API 호출을 자동화된 추론을 통해 수학적으로 검증하며 코드가 예상대로 작동함을 확인해 시스템의 안정성을 높였다. 특히 메모리 안전성을 강화하기 위해 프로그래밍 언어 러스트를 도입하는 과정에서 SW의 신뢰성과 성능 향상을 기대할 수 있는지 파악하기 위해 자동화된 추론을 활용한 바 있다. 커트 쿠펠드 부사장는 “이 밖에도 자동화된 추론은 생성형AI의 정확성을 높이기 위해서도 활용할 수 있다”며 "생성형AI에 자동화된 추론을 적용하면 결과값의 정확성을 수학적으로 검증할 수 있어 이를 기반으로 점차 AI모델의 정확성을 높이는 것이 가능하다"라고 쿠펠드는 설명했다. 이어서 “앞서 소개한 것처럼 자동화된 추론은 하나의 기술로 보안과 혁신에 양 분야에서 중요한 역할을 하고 있다”며 “이 기술은 기업이 보다 안전하고 지능적으로 새로운 시장 기회를 탐색하고 경쟁 우위를 확보할 수 있도록 지원한다”고 강조했다. 커트 쿠펠드 부사장은 자동화된 추론 기술 역량을 확보하고 관련 서비스를 지속적으로 선보이기 위해 전문 팀을 운영 중이다. 그는 “자동화된 추론팀은 SW의 안전성과 신뢰성을 높이기 위해 시스템과 알고리즘의 보안을 강화하고, 예상치 못한 오류를 자동으로 감지하고 수정하기위한 수학적 증명 방법을 개발 중”이라며 “고객사의 비즈니스가 클라우드 솔루션에 의존할 때 발생할 수 있는 위험을 최소화하고, 핵심 비즈니스에 더 집중할 수 지원하는 핵심적인 기술이 될 것”이라고 강조했다.

2024.06.13 07:59남혁우

지코어, 엣지에서 실시간 추론 '인퍼런스앳더엣지' 솔루션 출시

지코어는 AI 애플리케이션에 초저지연 경험을 실시간 제공하는 '인퍼런스 앳더 엣지' 솔루션을 출시한다고 10일 밝혔다. 솔루션은 사전 학습된 머신 러닝 모델을 전 세계에 분포돼 있는 엣지 추론 노드 중 사용자와 가장 가까운 경로 또는 위치에서 응답할 수 있도록 함으로써 원활한 실시간 추론을 보장한다. 지코어 인퍼런스 앳더 엣지는 180개 이상의 엣지 노드로 구성된 지코어의 광범위한 글로벌 네트워크(PoP)에서 실행되며, 모두 지코어의 정교한 저지연 스마트 라우팅 기술로 상호 연결된다. 고성능의 각 노드는 지코어 네트워크 중 최종 사용자와 가까운 엣지에 전략적으로 배치된다. 무엇보다 지코어 각 엣지에서의 AI 추론은, 이를 위해 특별히 설계된 업계 내 최고의 칩인 엔비디아 L40S GPU에서 실행된다. 사용자가 요청을 보내면 엣지 노드는 지연 시간이 가장 짧은, 가장 가까운 엣지 추론 노드로 경로를 설정해 일반적으로 30밀리초(ms) 미만의 응답 시간을 보장한다. 네트워크 간 최대 대역폭도 200Tbps로 최고 수준의 학습 및 추론 능력이 가능하다. 인퍼런스 앳더 엣지는 광범위한 기본 머신 러닝 및 커스텀 모델을 지원한다. 지코어 머신 러닝 모델 허브에서 사용 가능한 오픈 소스 기반 모델로 라마프로 8B, 미스트랄 7B, 스테이블디퓨전 XL 등이 있다. 여러 형식 또는 여러 소스로부터 데이터를 수신해, 모델을 사용 사례에 맞게 선택하고 학습한 후 전 세계에 위치하고 있는 인퍼런스 앳더 엣지 노드에 배포할 수 있다. 이는 일반적으로 개발팀이 직면하는 중요한 문제 중 하나인, 이미 AI 모델이 학습된 동일한 서버에서 다시 실행됨으로써 발생하는 성능이 저하되는 문제를 해결해 준다. 지코어 인퍼런스 앳더 엣지의 주요 이점을 정리해 보면 다음과 같다. ▲첫째, 유연한 가격구조로 고객이 사용한 리소스에 대해서만 비용을 지불할 수 있어 '비용 효율적인 배포'가 가능하다. ▲둘째, 디도스 공격에도 머신 러닝의 각 앤드포인트가 지코어의 인프라를 통해 자동으로 보호되는 내장형 디도스 보호 기능을 갖추고 있다. ▲셋째, GDPR, PCI DSS, ISO/IEC 27001 등 업계 표준을 준수하는 뛰어난 데이터 프라이버시 및 보안을 보장한다. ▲넷째, 모델 자동확장 기능으로 모델이 항상 최대 수요는 물론 예기치 않은 로드 급증을 지원한다. ▲마지막으로, 빠르게 진화하는 요구에 맞춰 S3 호환 클라우드 오브젝트 스토리지를 무제한으로 제공한다. 이러한 강점을 통해 지코어 인퍼런스 앳더 엣지는 자동차, 제조업, 유통, 테크놀로지 등 다양한 산업 분야의 기업들이 비용 효율적이고 확장 가능하며, 안전한 AI 모델 배포를 통해 역량을 강화할 수 있도록 지원한다. 이를 통해 기업은 생성형 AI, 객체 인식, 실시간 행동 분석, 가상 비서, 생산 모니터링과 같은 사용 사례를 글로벌 규모로 빠르게 실현할 수 있다. 안드레 레이텐바흐 지코어 CEO는 "지코어 인퍼런스 앳더 엣지는 고객이 전 세계에 AI 애플리케이션을 배포하는 데 필요한 비용, 기술, 인프라에 대해 걱정할 필요 없이 머신 러닝 모델을 학습시키는 데 집중할 수 있도록 지원한다”며 “지코어는 엣지가 최고의 성능과 최종 사용자 경험을 제공하는 곳이라고 믿으며, 모든 고객이 탁월한 규모와 성능을 누릴 수 있도록 지속적으로 혁신해 나가고 있다”고 밝혔다. 그는 “인퍼런스 앳더 엣지는 전 산업분야에 걸쳐 현대적이고 효과적이며, 가장 효율적인 AI 추론 환경을 제공하게 될 것"이라고 강조했다.

2024.06.10 14:21김우용

"엣지 플랫폼, 새로운 AI 담도록 진화한다"

[라스베이거스(미국)=김우용 기자] “엣지 플랫폼은 점점 더 많은 AI 여정을 수용하고 있다.” 피에르루카 치오델리 델테크놀로지스 엣지포트폴리오제품관리 수석부사장은 22일(현지시간) 미국 라스베이거스에서 열린 '델테크놀로지스월드(DTW) 2024'에서 한국기자단과 만나 이같이 강조했다. 피에르루카 치오델리 부사장은 델테크놀로지스에서 스토리지 관련 신규 비즈니스 구축을 담당해왔다고 자신을 소개했다. 그는 델테크놀로지스 파워스토어를 개발했으며, CTO실에서 VM웨어 모든 공동 전략 프로젝트 감독조직을 이끌었다. 그는 “델테크놀로지스는 2년전 프로젝트 프론티어를 발표하고 작년 델 네이티브엣지 신제품을 발표하며 엣지 비즈니스를 개발해왔다”며 “디지털시티부터 제조, 소매, 에너지 등의 전문가 팀을 구성해 제품을 연구한 결과 제로 터치를 확보할 수 있는 엣지 플랫폼을 수평적으로 구축해야 한다는 결론을 내렸다”고 말했다. 그는 “델 네이티브엣지는 제로트러스트와 제로토치를 통해 애플리케이션과 워크로드를 엣지에 배포할 수 있는 플랫폼”이라고 설명했다. 델테크놀로지스는 올해 행사에서 델 네이티브엣지의 최신 버전을 발표했다. 델 네이티브엣지 2.1 버전은 엔비디아, 서비스나우, 마이크로소프트와 파트너십을 강화하고, 엣지에서 메어메탈 컨테이너 기반으로 AI 애플리케이션 개발, 배포, 확장 등을 간소화할 수 있게 됐다. 올해 델테크놀로지스월드2024의 전체 주제가 AI로 관통하는 만큼 '델 네이티브엣지'도 새로운 AI 환경 구현에 주목했다. 그는 “AI는 아주 오랫동안 엣지에 존재하며 사용돼 왔고, 예전의 AI는 매우 최적화된 알고리즘 혹은 모델로서 간단한 조작에서 수년간 매우 정확하게 사용돼왔다”며 “지금은 AI 모델을 학습시켜 엣지로 추론을 가져와야 하는데, 엔비디아와 함께 네이티브엣지의 청사진을 통해 즉각적으로 엔비디아 NIM을 배포할 수 있는 기능을 발표했다”고 말했다. 그는 “네이티브엣지는 현재 엣지로 엔비디아 NIM을 사용할 수 있는 최초의 제품”이라며 “또, AI 실행은 매일 패키지를 변경하고, 계속 업데이트하면서 재교육을 해야 하기 때문에, 중앙부터 엣지까지 보안이 필요하다”고 강조했다. 그는 “AI 모델은 더 세련될 필요가 있고, 훈련을 받아야 하며, 또한 멀티모달 종류와 같은 더 다른 차원을 추가해야 한다”며 “따라서 AI 공장에서 만든 모델을 제조 공간이나 소매 공간으로 옮겨야 하는데 보안을 위해 쉽게 패키징할 수 있는 게 필요하다”고 덧붙였다. 델 네이티브엣지 최신 버전은 올해 행사에서 발표된 '델 AI 팩토리'의 일환으로 프로덕션급 애플리케이션의 개발 및 배포를 위한 엔비디아 NIM과 기타 마이크로서비스를 포함하는 엔드투엔드 소프트웨어 플랫폼인 '엔비디아 AI 엔터프라이즈'를 제공한다. 델 네이티브엣지와 엔비디아 AI 도구 및 SDK가 결합됐고, 엔비디아 메트로폴리스를 사용한 비디오 분석, 엔비디아 리바를 사용한 음성 및 번역, 엔비디아 NIM을 사용한 엣지에서 최적화된 추론 등에 이르는 엔비디아 AI 프레임워크를 엣지로 자동 제공할 수 있다. 델 네이티브엣지는 서비스나우의 나우플랫폼과 통합돼 엣지에서 AI 애플리케이션 개발 및 배포를 단순화한다. 기업은 IT 운영을 핵심 데이터 센터에서 엣지까지 효율적으로 확장할 수 있으며, 1일차 초기 배포부터 2일차 이상의 운영까지 아우르는 자동화된 엣지 관리 솔루션을 구축할 수 있다. 치오델리 부사장은 “이같은 폐쇄 루프 자동화를 통해 엣지 컴퓨팅 리소스의 오케스트레이션, 관리 및 워크플로를 단순화하고, 여러 산업 전반에 걸쳐 AI 및 기타 엣지 워크로드를 위한 보다 효율적이고 민첩하며 안전한 운영 및 서비스 모델을 제공할 것”이라며 “또 마이크로소프트 애저 아크 활성화 자동화 도입으로 엣지에서 추진력이 더욱 증폭됐다”고 말했다. 델테크놀로지스는 더 나은 비즈니스 성과와 엣지 사용 사례를 추진하기 위해 제조, 소매 및 디지털 도시에 서비스를 제공하는 ISV를 위한 6가지 새로운 네이티브엣지 솔루션을 도입했다. 대표적으로, 아비바 솔루션을 갖춘 새로운 통합 운영 센터는 도시 계획에 대한 360도 운영 뷰를 제공해 데이터 관리 및 시민 서비스를 향상시킨다. 플랫폼 자체 개선 사항으로 엣지 애플리케이션 성능, 확장성 및 보안이 향상됐다. 더 나은 성능, 확장성 및 보안을 제공하는 베어메탈 컨테이너에 애플리케이션을 배포하는 기능을 포함하며, 델네이티브엣지용 REST API를 도입해 데브옵스 워크플로에 통합하고 애플리케이션 통합을 개발하는 데 도움을 주는 비주얼스튜디오 플러그인 같은 새 도구를 제공한다. 델 에이펙스를 통한 단일 월간 구독으로 네이티브엣지 소프트웨어와 네이티브엣지 엔드포인트를 모두 활용할 수 있다. 델 '델 프리시전 워크스테이션'과 파워엣지 T160 서버 등의 새 엣지 하드웨어를 엣지 인프라 지원에 포함시켰다. 델 파워엣지 T160은 이전 제품보다 42% 작은 크기로 소매점 같은 작은 공간에 이상적이다. 엣지 및 인프라를 위한 프로컨설트 자문서비스와 엣지용 애플리케이션 디자인 서비스 등의 새 엣지 서비스를 출시했다. 델 서비스 전문가는 현재 상태를 평가하고 원하는 상태에 도달하기 위한 엣지 전략을 구축할 뿐만 아니라 효율성, 성능 및 ROI를 극대화하도록 엣지 환경을 설계하는 데 도움을 준다. 그는 네이티브엣지를 사용해 청사진 기술을 조정할 수 있고, 모든 것을 제로트러스트와 제로터치로 자동화하면서, 요구사항과 필요한 모든 소프트웨어를 패키지에 넣을 수 있다”며 “비용을 절감하고 완전한 보안을 달성하면서, 추론을 엣지에서 수행하고 모델을 재훈련시키는 전체 루프를 갖게 된다”고 강조했다. 그는 생성형 AI를 산업 엣지 환경에서 활용이 이제 막 시작됐다고 밝혔다. 그는 “큰 교량의 상황을 분석하고 품질을 관리한다고 할 때 현재의 컴퓨터비전으로 할 수 있는 건 얼마나 녹슬었는지 보는 정도였다”며 “생성형 AI를 활용한다면, 녹슨 교량 주변의 나무나, 다른 종류의 변색, 진동, 소음 등을 포함해 생성형 AI 기반의 3D 모델을 만들어내는 식이 가능할 것”이라고 예를 들었다. 그는 “올해 플랫폼을 지속적으로 혁신하면서 더 많은 릴리스를 출시할 예정”이라며 “플랫폼 기능을 더 확장하고, 파트너 생태계를 더욱 확장함으로써 고객에게 엣지를 위한 최고의 기반을 제공할 것”이라고 밝혔다.

2024.05.24 00:07김우용

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

"AI 챗봇 '과잉 공감' 경계해야"…나르시시즘·망상 키울 수도

'보안 올림픽' 4연승 박세준 "K-보안, 글로벌로 가야"

공공 클라우드 전환 앞장서는 美정부…한국은 '제자리걸음'

블룸버그 "트럼프 행정부, 인텔에 지분 투자 검토"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.