AWS "한국 AI 모델, 아마존베드락 마켓서 사용 가능"
"생성형 인공지능(AI) 모델은 빠른 추론과 높은 정확성, 낮은 비용입니다. 개발자는 '아마존베드락 마켓플레이스'에서 낮은 비용으로 빠르고 정확한 모델을 이용할 수 있습니다. 아마존웹서비스(AWS)는 개발자들의 편리한 모델 사용을 지원하기 위해 빠른 추론과 높은 정확도, 낮은 가격을 최대한 실현할 수 있는 기술을 꾸준히 개발할 것입니다." AWS 스와미 시바수브라마니안 데이터 및 AI 부문 부사장은 4일(현지시간) 열린 'AWS 리인벤트' 기조연설에서 이같이 밝혔다. 지난 2일 미국 라스베이거스에서 개막된 이번 행사는 6일까지 계속된다. 시바수브라마니안 부사장은 생성형 AI 생태계 확장을 위해 아마존베드락 마켓플레이스에 전 세계 AI 모델 100개를 구축할 목표를 내비쳤다. 이중 LG AI연구원, 업스테이지, 엔씨소프트 모델도 등록된 상태다. 그는 모델 다양성만으로는 우수한 AI 생태계를 구축은 할 수 없다고 주장했다. 사용자가 AI 모델을 빠르고 저렴하고 적합하게 경험할 수 있어야 진정한 AI 생태계 구축이 가능하다고 봤다. '아마존베드락 마켓플레이스' 발표…韓 모델도 등록 이날 시바수브라마니안 부사장은 아마존베드락 마켓플레이스를 발표했다. 해당 마켓플레이스는 생성형 AI 생태계 확장을 위해 구축된 AI 전용 마켓이다. 100개 넘는 새로운 파운데이션 모델에 대한 접근성을 제공한다. 기업이 자사 모델을 마켓플레이스에 배포하면, 사용자는 통합 API로 해당 모델을 사용하면 된다. 또 아마존베드락 기반의 가드레일, 에이전트, 보안, 모델 디스틸레이션 등 다양한 기능을 함께 이용할 수도 있다. AWS는 해당 마켓플레이스에 한국 모델도 들어갔다고 밝혔다. 현재 LG AI연구원, 업스테이지, 엔씨소프트 모델이 등록됐다. LG AI연구원은 오픈소스 모델 '엑사원 3.0 7.8B 인스트럭트'를 등록했다. 업스테이지는 솔라, 솔라 프로를 마켓플레이스에 올렸다. 엔씨소프트는 '바르고 LLM KO/EN 13B-IST'를 등록했다. 아마존베드락에 새로운 모델도 추가됐다. '레이2'와 '말리부' '풀사이드' '스테이블 디퓨전 3.5'가 내년 초 탑재될 예정이다. 말리부는 복잡한 소프트웨어(SW) 엔지니어링 이슈를 해결해 주는 역할을 맡는다. 풀사이드는 코드 개발 중에 발생하는 지연을 줄여주는 역할을 한다. 레이2는 루마 AI가 개발한 비디오 생성 모델이다. 스테이블 디퓨전 3.5는 스태빌리티AI의 이미지 생성 모델이다. "아마존베드락, 더 쉽고 저렴하고 빠른 개발 환경 조성" 이날 시바수브라마니안 부사장은 아마존베드락에 새로 추가한 기능을 발표했다. 모델 추가만으론 생성형 AI 생태계를 확장할 수 없다는 이유에서다. 그는 '프롬프트 캐싱' 기능을 소개했다. 사용자가 자주 사용하는 프롬프트를 미리 파악해 중복된 명령어를 제거하는 기술이다. 이를 통해 프롬프트 비용을 90% 줄이고 지연 시간도 85% 절약할 수 있다는 설명이다. 시바수브라마니안 부사장은 "보통 여러 사람이 생성형 AI에 동일한 프롬프트를 입력할 경우 비용이 이중으로 든다"며 "프롬프트 캐싱은 유사한 질문이 들어왔을 때 기존 명령어를 재사용함으로써 기존보다 더 빠르고 낮은 비용으로 서비스를 지원한다"고 강조했다. 그는 '인텔리전트 프롬프트 라우팅' 기능도 공유했다. 이 기능은 사용자 요청에 가장 적합한 답변을 할 수 있는 모델을 선별하는 기술이다. 단순한 질문은 소형모델에 던지고, 복잡한 질문은 LLM에 전달하는 식이다. 시바수브라마니안 부사장은 "이 기술은 비용을 30% 줄이면서도 정확성을 떨어뜨리지 않는다"며 "맞춤형 모델 라우팅을 통해 저가 비용으로 모델 최적화가 이뤄진다"고 강조했다. 그는 아마존베드락에 '데이터 오토메이션' 기능도 추가했다고 발표했다. 해당 기능은 비정형 데이터를 텍스트로 변환해 데이터를 통합 분석·처리하는 기술이다. 시바수브라마니안 부사장은 "이미지와 비디오, 음성 등 다양한 비정형 데이터에서 의미 있는 인사이트를 도출하는 기능"이라며 "다양한 산업군의 복잡한 데이터를 자동 분석함으로써 생산성을 높일 수 있다"고 강조했다. "RAG 더 효율적으로...책임감 있는 AI 구현할 것" 시바수브라마니안 부사장은 아마존베드락의 검색증강생성(RAG) 기능을 기존보다 고도화했다고 밝혔다. 우선 그는 '아마존베드락 날리지 베이스'를 소개했다. 기업 데이터를 쉽고 빠르게 검색할 수 있게 돕는 서비스다. 그동안 개발자는 데이터베이스(DB)에서 필요한 정보를 검색하려면 복잡한 SQL 쿼리를 작성해야 했다. 이번 신규 기능을 통해 사용자가 자연어로 원하는 데이터를 설명하기만 하면 된다. 사용자는 복잡한 DB 구조나 파이썬 등 전문 지식을 갖추지 않아도 원하는 정보를 얻을 수 있다. 비즈니스 전략 수립을 비롯한 보고서 작성, 애플리케이션 개발 등에 해당 기능을 활용할 수 있다. 또 아마존 S3를 비롯한 세이지메이커 레이크하우스, 레드시프트 등 여러 데이터 소스와 통합함으로써 흩어진 데이터를 한곳에 모아 효율성을 높일 수 있다. 시바수브라마니안 부사장은 "이 기능은 인간과 DB와의 상호작용을 간소화한다"며 "사용자 친화적인 인터페이스를 통해 비전문가도 데이터를 효과적으로 탐색할 수 있게 지원한다"고 설명했다. 그는 '아마존 켄드라 제너레이티브 AI 인덱스'도 소개했다. 40개 넘는 데이터 소스를 활용해 기업의 지식 베이스 기반으로 구조화된 검색을 돕는 솔루션이다. 해당 기술은 정형 데이터와 비정형 데이터를 통합 처리할 수 있다. 이를 통해 데이터 검색과 활용 효율성을 높인다. 시바수브라마니안 부사장은 "고객이 데이터를 머신러닝 파이프라인에 연결할 때 가장 필수적인 데이터 추출·변환·적재(ETL) 과정과 데이터 전처리 작업을 대폭 간소화한다"며 "데이터 관리 복잡성을 줄이면서도 정확한 답변 추출을 돕는다"고 밝혔다. 그는 '그래프RAG' 기능도 발표했다. 데이터 간 관계를 분석해 정보를 탐색함으로써 생성형 AI가 사용자 요청에 더 적합한 대답을 할 수 있게 돕는 기술이다. 보통 그래프 DB는 개념 간 관계를 선으로 연결해 시각화한다. 시바수브라마니안 부사장은 "그래프RAG는 기존 벡터 검색보다 맥락과 관계를 더 잘 이해할 수 있다"며 "생성형 AI는 데이터의 단편적 요소뿐 아니라 데이터 간 관계 기반으로 더 정교하고 관련 높은 응답을 제공할 수 있다"고 강조했다. 그는 아마존베드락이 유해 콘텐츠를 선별하는 기능을 탑재했다고 밝혔다. 최근 멀티모달 모델 활용 비중이 높아지면서 비정형 데이터에 들어있는 유해한 콘텐츠를 차단하기 위해서다. 그는 "혐오와 폭력, 위법행위가 담긴 이미지가 사람과 상호작용을 하지 못하게 베드락 내 모든 모델에 이를 적용했다"며 "유해 콘텐츠를 기존보다 85%까지 줄일 수 있다"고 설명했다.