• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
반도체
인공지능
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'LLM'통합검색 결과 입니다. (279건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[영상] "AI 실수도 기업 책임"…생성형 AI 시대, 리스크 관리가 생존 전략

생성형 인공지능(AI)이 기업 업무와 서비스 전반으로 확산되면서 새로운 과제가 떠오르고 있다. AI가 생산성을 높이고 업무 혁신을 이끄는 동시에 잘못된 답변과 보안 문제, 예기치 못한 오작동이 기업 리스크로 직결되고 있기 때문이다. 특히 AI가 고객과 직접 소통하는 서비스 영역으로 확대되면서 기업은 단순히 모델 성능을 높이는 것을 넘어 AI가 어떤 답변을 내놓고 어떤 행동을 수행하는지까지 관리해야 하는 상황에 직면했다. 생성형 AI 도입이 실험(PoC) 단계를 넘어 실제 서비스 운영 단계로 이동하면서 'LLM 옵저버빌리티(Observability)'가 새로운 기업 IT 과제로 부상하고 있다. 고지훈 와탭랩스 애플리케이션 팀 리드와 신민철 애플리케이션 팀 개발자는 26일 지디넷코리아와의 영상 인터뷰에서 생성형 AI 시대 기업이 마주할 변화와 이에 대응하기 위한 LLM 옵저버빌리티의 중요성을 강조했다. 고 팀장은 "AI가 제공한 답변이라도 결국 고객은 기업이 제공한 공식 정보로 받아들인다"며 "AI 서비스 운영 단계에서는 응답 품질과 신뢰성을 지속적으로 관리하는 체계가 필수"라고 말했다. AI 실수, 이제는 기업이 책임져야 고 팀장은 주요 사례로 캐나다 항공사 에어캐나다를 소개했다. 한 고객이 챗봇에 할인 혜택 적용 가능 여부를 문의하자 에어캐나다의 챗봇은 실제 존재하지 않는 할인 상품을 안내했다. 고객은 이를 믿고 항공권을 구매한 뒤 할인을 요구했지만 에어캐나다가 이를 거부하면서 법적 분쟁으로 이어졌다. 캐나다 법원은 'AI가 응답한 내용이라도 게시된 정보에 대한 책임은 기업에 있다'고 판단했다. 이에 에어캐나다는 패소했고 금전적 보상은 물론 기업 신뢰도에도 타격을 입었다. 신 개발자는 "AI 챗봇의 답변이 기업의 공식 입장으로 간주되는 사례가 실제로 빈번하게 발생하고 있다"며 "잘못된 응답 하나가 직접적인 비용 손실과 브랜드 신뢰도 하락으로 이어질 수 있다"고 설명했다. 고 팀장은 "작년까지는 많은 기업이 AI를 시범 적용하는 수준에 머물렀지만 올해부터는 금융, 공공, 엔터프라이즈를 중심으로 실제 서비스에 적용하는 사례가 빠르게 늘고 있다"며 "응답 품질을 관측할 체계 없이 서비스를 출시하는 기업도 적지 않다"고 지적했다. "지표는 정상인데 고객은 불만"…AI 시대 등장한 새로운 장애 문제는 기존 모니터링으로는 AI 응답 오류를 감지할 수 없다는 점이다. 서버·네트워크 지표가 정상이어도 AI가 잘못된 답변을 내보내면 알 방법이 없다. 고 팀장은 "CPU·메모리는 정상인데 고객 불만이 폭증하는 새로운 유형의 문제가 생긴다"며 "기존 인프라 모니터링만으로는 응답 품질 이상을 잡아낼 수 없다"고 말했다. 보안 위협도 새로운 형태로 진화했다. AI 에이전트가 코드 실행·시스템 제어까지 수행하게 되면서 악의적 입력으로 AI가 의도치 않은 동작을 하도록 유도하는 '프롬프트 인젝션' 공격이 현실화됐다. 와탭랩스 내부에서도 악의적 입력 없이 AI가 잘못된 판단을 내려 개발 PC 폴더가 통째로 삭제되는 사고를 경험했다. AI 보안 위협 역시 새로운 변수로 떠오르고 있다. 신 개발자는 "과거 LLM은 단순히 텍스트를 생성하는 수준이었지만 이제는 함수 호출, 코드 실행, 외부 시스템 제어까지 가능한 에이전트 형태로 발전하고 있다"며 "프롬프트 입력 하나가 실제 시스템 동작으로 연결될 수 있다"고 설명했다. 대표적인 위협은 '프롬프트 인젝션(Prompt Injection)'이다. 이는 특정 입력을 통해 AI가 의도하지 않은 행동을 수행하도록 유도하는 공격 방식이다. 특히 AI가 다양한 시스템과 연결될수록 피해 범위도 커질 수 있다. 와탭랩스 역시 내부 실험 과정에서 예상치 못한 사례를 경험했다. 오케스트레이션 기반 AI 개발 환경을 테스트하던 중 악의적 입력이 없었음에도 AI가 잘못된 판단을 내려 개발 PC의 특정 폴더를 삭제하는 사고가 발생한 것이다. 신 개발자는 "중요한 것은 사용자가 공격 의도를 갖지 않았더라도 AI가 예기치 않은 행동을 할 수 있다는 점"이라며 "AI가 어떤 과정을 거쳐 해당 결정을 내렸는지 추적하고 통제할 수 있어야 한다"고 말했다. GPU 다음은 LLM 운영…기업 AI 운영 경쟁 본격화 와탭랩스는 이러한 문제에 대응하기 위해 LLM 옵저버빌리티 솔루션을 선보인다. GPU 자원 사용량부터 애플리케이션 성능, AI 응답 품질까지 전체 흐름을 연계 분석해 서비스 운영 환경에서 발생하는 오류와 장애를 통합 관리한다. 주요 감시 항목은 ▲AI 답변 적합성·정확성 ▲할루시네이션(없는 정보를 만들어내는 AI 환각 현상) ▲프롬프트 인젝션 공격 ▲개인정보 포함 여부 ▲불필요한 응답 우회 경로 ▲토큰·GPU 리소스 효율 등이다. 특히 보안상 외부 AI 서비스를 사용할 수 없어 GPU를 직접 구축해 모델을 운영하는 국내 금융·공공기관에 적합하게 구현됐다. 자체 GPU로 모델을 운영하는 환경에서는 AI 응답에 쓰이는 토큰이 GPU 자원과 직결되기 때문에, 응답 경로를 최적화하면 처리 성능과 비용 효율을 동시에 높일 수 있다는 설명이다. 신 개발자는 "AI 서비스를 운영하는 기업이라면 응답 품질부터 보안 위협까지 한 플랫폼에서 감시할 수 있는 체계를 갖춰야 한다"며 "단순히 있으면 좋은 도구가 아니라 서비스 신뢰도를 지키는 핵심 인프라"라고 강조했다. 고지훈 팀장은 AI 시대 운영자의 역할 변화도 예고했다. 그는 "앞으로 운영자는 데이터를 직접 분석하는 사람이 아니라, AI가 안전하게 작동할 수 있는 가드레일을 설계하는 사람이 될 것"이라며 "인프라·애플리케이션·AI 모델을 통합 관측하는 체계가 기업 경쟁력을 좌우하게 될 것"이라고 강조했다.

2026.06.26 10:40남혁우 기자

메가존클라우드, 과기정통부 국산 AI반도체 실증 인프라 구축 참가

정부에서 추진하는 대규모 국산 인공지능(AI) 반도체 인프라 구축에 메가존클라우드(대표 염동훈)가 힘을 보탠다. 메가존클라우드는 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관하는 'AI컴퓨팅 실증 인프라 고도화' 2차년도 사업에 참여한다고 25일 밝혔다. 이번 사업은 국산 AI반도체를 기반으로 대규모 인프라를 구축하는 국가 과제다. 대규모언어모델(LLM) 기반 서비스와 GPU, NPU 혼용 환경을 실증한다. 메가존클라우드는 국산 NPU 기반 클라우드 인프라의 통합 운영 전반을 담당한다. NPU 자원할당과 통합 관리 모니터링 소프트웨어(SW)를 개발한다. AI컴퓨팅 인프라 통합 운영·관제 인프라도 구축한다. 국산 AI반도체가 실제 서비스 환경에서 안정적으로 작동하도록 돕는 역할이다. 이번 사업은 오는 2027년까지 3개년에 걸쳐 추진된다. 올해 2차년도 목표는 연산용량 60페타플롭스 이상의 컴퓨팅 인프라 구축이다. 메가존클라우드는 지난해에 이어 2년 연속 참여해 운영 안정성을 높일 계획이다. 이번 사업에는 퓨리오사AI, 리벨리온, NHN클라우드, 하이퍼엑셀, 네이버클라우드 등이 컨소시엄으로 함께 참여한다. 사업 성과는 제조, 금융, 헬스케어, 교육 등 다양한 산업군의 AI 서비스 고도화에 활용된다. 메가존클라우드는 국산 AI반도체의 해외 실증도 이끈다. 지난 5월 'AI-반도체 해외실증 지원 사업' 주관사업자로 선정됐다. 사우디아라비아 아람코 디지털을 대상으로 퓨리오사AI의 2세대 NPU 'RNGD' 기반 AI 서비스를 실증하고 있다. 황인철 메가존클라우드 CRO는 "국산 AI반도체의 상용화 경쟁력은 실제 서비스 환경에서 안정적으로 운영하고 확장할 수 있는 클라우드 플랫폼 역량이 함께 뒷받침돼야 한다"며 "국내 인프라 구축과 해외 현장 실증 양면에서 경험을 축적해 국산 AI반도체 생태계의 실질적인 성숙에 기여하겠다"고 말했다.

2026.06.25 15:30남혁우 기자

오픈AI도 자체 칩 승부수…'할라페뇨'로 엔비디아 의존 줄인다

오픈AI가 인공지능(AI) 추론 전용 반도체를 직접 설계하며 칩부터 모델, 서비스까지 아우르는 '풀스택' 전략에 본격 시동을 걸었다. 오픈AI는 24일(현지시간) 브로드컴과 공동 개발한 첫 AI 추론 가속기 '할라페뇨'를 공개했다. 올해 말부터 데이터센터에 배치할 예정인 이 칩은 두 회사가 함께 구축하는 다세대 컴퓨팅 플랫폼의 첫 제품이다. 오픈AI는 할라페뇨 초기 테스트에서 와트당 성능이 현존 최고 수준을 크게 웃돌았다고 설명했다. 최종 성능은 측정 중이며 세부 기술 보고서는 수개월 내 공개할 예정이다. 혹 탄 브로드컴 최고경영자(CEO)는 로이터 통신에 "할라페뇨는 엔비디아의 블랙웰 칩이나 구글의 텐서처리장치(TPU)와 대등한 성능을 갖췄다"고 말했다. 할라페뇨는 기존 AI 가속기를 개조한 범용 칩이 아니라 최신 거대언어모델(LLM) 추론을 겨냥해 처음부터 새로 설계됐다. 챗GPT·코덱스·응용 프로그램 인터페이스(API)를 매일 운영하며 쌓은 데이터가 반영됐다. 초기 설계부터 파운드리(반도체 수탁생산) 공장에 넘기는 '테이프아웃' 단계까지는 9개월밖에 걸리지 않았다. 이에 대해 양사는 고성능 첨단 반도체 분야에서 가장 빠른 주문형 반도체(ASIC) 개발 주기라고 강조했다. 할라페뇨는 대만 TSMC가 양산하며 삼성전자와 SK하이닉스가 브로드컴에 메모리 칩을 공급한다. 블룸버그 통신에 따르면 두 회사는 차기 칩을 2028년에 내놓고 이후 매년 새 칩을 선보일 계획이다. 최근 AI 모델 시장을 이끄는 기업들은 자체 칩을 확보해 엔비디아 의존도를 낮추는 전략을 추진하고 있다. TPU를 앞세운 구글에 이어 오픈AI도 할라페뇨를 통해 자체 추론 칩을 선보였고 앤트로픽 역시 자체 칩 개발을 타진하고 있다. 이들 기업이 모두 핵심 연산 인프라의 내재화에 나서면서 엔비디아 중심의 AI 가속기 주도권 경쟁이 새 국면에 접어들었다. 그렉 브록먼 오픈AI 사장은 "세계는 연산 기반 경제로 나아가고 있다"며 "할라페뇨는 연산 자원을 더 풍부하게 만들어 개인과 기업에 빠르고 안정적이며 저렴한 AI를 제공할 것"이라고 말했다.

2026.06.25 09:59이나연 기자

AI 모델 120여 개를 한 플랫폼에…카페24, 'LLM 라우터' 공개

카페24는 하나의 응용 프로그램 인터페이스(API)로 120개 이상의 인공지능(AI) 모델을 통합 활용할 수 있는 AI 운용 인프라 서비스 '초거대 언어모델(LLM) 라우터'를 선보인다고 23일 밝혔다. LLM 라우터는 ▲챗GPT ▲클로드 ▲제미나이 등 주요 AI 모델 120여 개를 하나의 플랫폼으로 연결하고, 사용자가 입력한 요청에 맞는 모델을 선택·분배·전환해 주는 '오케스트레이터'의 역할을 수행한다. LLM 라우터는 오픈AI GPT 패밀리 모델을 포함해 ▲클로드 ▲제미나이 ▲딥시크 ▲큐웬 ▲라마 등 120여 개 AI 모델을 하나의 API로 이용할 수 있도록 지원한다. 구현의 핵심은 라우팅 엔진이다. 라우팅 엔진은 사용자가 입력한 요청 내용을 바탕으로 ▲코딩 ▲추론 ▲번역 ▲창작 등 작업 유형을 분석해 적합한 AI 모델을 자동 연결한다. 사용할 모델 범위를 미리 지정해두면 그 안에서만 자동 연결돼 모델을 일일이 비교하거나 선택하지 않아도 목적에 맞는 AI를 활용할 수 있다. 사용자가 원하는 기준에 따라 AI 서비스 제공사의 우선순위를 설정할 수 있는 기능도 제공한다. 동일 모델을 제공하는 여러 AI 서비스 제공사 가운데 ▲비용 ▲속도 처리량 등 사용자가 선택한 기준에 따라 가장 적합한 제공사로 자동 연결한다. 예를 들어 같은 클로드 모델이라도 비용을 기준으로 설정하면 가장 비용 효율이 높은 제공사로, 속도를 기준으로 설정하면 가장 빠른 제공사로 자동 연결된다. 특정 AI 서비스 제공사를 허용하거나 제외하는 화이트리스트, 블랙리스트 기능도 지원한다. 사용자는 이를 통해 자동 연결 대상 범위를 필요에 따라 유연하게 확대, 축소할 수 있다. 특정 AI 모델이 응답하지 않을 경우를 대비해 '자동 전환 기능'도 지원한다. 사용자는 주 모델과 대체 모델을 미리 설정할 수 있으며, 앞선 모델이 응답하지 못하면 다음 후보 모델이 자동으로 요청을 이어받는다. 예를 들어 주 모델로 사용하던 클로드가 응답하지 않을 경우 사전에 지정한 다른 모델이 자동으로 처리해 연속성 있는 운영 환경을 구성할 수 있다. 여러 AI 모델을 하나의 환경에서 직관적으로 관리할 수도 있다. 사용자는 '실시간 대시보드'를 통해 ▲요청 수·비용·토큰 사용량 추이와 ▲모델별 비용 비중 ▲성공·실패 비율 등을 한 화면에서 확인할 수 있다. 요청 단위 상세 기록과 팀·프로젝트·환경별 사용량 분류 추적도 지원해 AI 활용 현황과 비용 구조를 보다 효율적으로 파악할 수 있다. 사용자가 보유한 AI 모델 키를 LLM 라우터에 연결해 쓸 수도 있다. 'BYOK(Bring Your Own Key)' 모드를 통해 ▲GPT ▲클로드 ▲제미나이 등 이미 사용 중인 모델 키를 등록하면 해당 모델을 LLM 라우터 환경에서 그대로 활용할 수 있다. 이를 통해 LLM 라우터를 거치더라도 AI 모델 사용 비용을 직접 관리할 수 있다. LLM 라우터는 충전한 만큼 사용하는 크레딧 종량제로 운영된다. 가입 즉시 무료 크레딧을 제공해 서비스를 직접 경험해볼 수 있다. 카페24는 앞으로도 신규 AI 모델과 AI 서비스 제공사 지원 범위를 지속 확대하고, AI 운영과 관리 편의성을 높이는 기능도 함께 고도화해 나갈 계획이다. 이재석 카페24 대표는 "AI 모델의 종류가 빠르게 늘어나면서 이를 효율적으로 연결하고 운영하는 것이 새로운 과제가 되고 있다"며 "앞으로도 사용자가 다양한 AI를 보다 편리하게 활용할 수 있도록 관련 인프라 역할을 충실히 해나가겠다"고 말했다.

2026.06.23 10:05박서린 기자

AI 대부 얀 르쿤 "머스크의 xAI는 실패작"

인공지능(AI) 분야 대표적 석학인 얀 르쿤(AMI랩스 창립자)이 일론 머스크의 AI 기업 xAI를 두고 '실패작(failure)'이라고 평가했다. 더불어 AI 산업 전반에 대규모 거품 붕괴 가능성을 경고했다. 19일 얀 르쿤 의장은 CNBC와의 인터뷰에서 xAI가 AI 경쟁에서 뒤처질 것으로 전망했다. 핵심 인재 이탈과 천문학적인 운영 손실이 주요 이유다. 그는 "xAI는 솔직히 말해 실패작에 가깝다"며 "창립 멤버들이 회사를 떠났고 일론 머스크 최고경영자(CEO)는 최고 수준의 AI 인재를 영입하기 어려운 위치에 놓여 있다"고 말했다. 이어 "머스크 CEO가 이전 팀을 대하는 과정에서 좋은 모습을 보여주지 못했기 때문에 우수한 연구자를 끌어들이기 쉽지 않을 것"이라고 덧붙였다. 양 측은 AI를 비롯해 다양한 주제를 놓고 수년간 공개적으로 충돌해 왔다. 얀 르쿤 의장은 과거 일론 머스크 CEO가 소셜 서비스(SNS)에서 펼친 주장을 음모론이라고 비판한 바 있다. 일론 머스크 CEO 역시 얀 르쿤 의장을 향해 "오랫동안 AI 흐름을 따라가지 못했다"고 공격했다. 'AI 대부' 중 한 명으로 불리는 얀 르쿤 의장 발언은 AI 업계 주요 기업의 기업가치와 사업 지속 가능성에 대한 논란을 다시 불러일으키고 있다. 실제로 xAI는 최근 공동 창업자들의 잇따른 이탈을 겪었다. 머스크는 올해 2월 우주기업 스페이스X와 xAI를 통합하는 대규모 거래를 단행했다. 당시 기업가치는 1조2500억 달러(약 1922조원)로 평가됐다. 그러나 올해 1분기 스페이스X의 AI 사업 부문은 xAI를 포함해 25억 달러(약 3조 8450억원) 규모의 영업손실을 기록한 것으로 알려졌다. 얀 르쿤 의장은 xAI의 대규모 데이터센터 투자 역시 지속 가능성에 의문이 있다고 지적했다. 그는 "xAI는 막대한 인프라를 보유하고 있지만 다른 기업에 컴퓨팅 자원을 임대하고 있다"며 "이는 투자 비용을 회수할 수 있는 사실상 유일한 방법"이라고 비판했다. 이는 미국 테네시주 멤피스에 구축된 xAI의 초대형 AI 데이터센터 '콜로서스 1'과 '콜로서스 2'를 겨냥한 발언으로 해석된다. 현재 구글과 앤트로픽 등도 해당 시설의 컴퓨팅 자원을 활용하고 있는 것으로 알려졌다. 그는 "xAI의 미래 전망에 대해 긍정적이지 않다"며 "오픈AI나 앤트로픽 같은 선도 기업들과 경쟁할 수 있을 것으로 보지 않는다"고 평가했다. xAI 외에도 AI 산업 전반에 대해서도 우려를 나타냈다. 많은 기업에서 AI 도입 비용 증가 문제를 제기하는 가운데 현재 주요 AI 기업의 수익 구조가 장기적으로 지속되기 어렵다는 진단이다. 얀 르쿤 의장은 "AI 서비스 가격은 오르고 있지만 운영 비용 감소 속도는 충분히 빠르지 않다"며 "AI 기업 대부분은 여전히 적자를 내고 있고 사용자가 누리는 혜택 상당 부분은 투자자 자금으로 보조되고 있다"고 말했다. 이어 "이 같은 구조는 오래 지속될 수 없다"며 "오픈AI와 앤트로픽 같은 기업들은 결국 가격을 인상하거나 비용을 절감해야 하며, 그렇지 않으면 대규모 거품 붕괴가 발생할 수 있다"고 경고했다. 현재 AI 업계 주류 기술인 대규모언어모델(LLM)에 대해서도 한계를 지적했다. LLM이 코딩이나 수학 문제 해결에는 유용하지만 장기적으로 범용 AI 시스템의 기반이 되기는 어렵다는 설명이다. 대신 그는 자신이 오랫동안 연구해 온 '월드 모델(World Model)' 접근법을 차세대 AI의 핵심 기술로 제시했다. LLM이 언어 패턴을 학습해 다음 단어를 예측하는 방식이라면 월드 모델은 현실 또는 가상 세계의 물체와 인과관계, 행동 원리를 이해하는 데 초점을 맞춘다. 얀 르쿤 의장은 "신뢰할 수 있는 범용 AI 에이전트 시스템은 결국 월드 모델 기반으로 구축될 것"이라며 "현재의 LLM만으로는 한계가 있다"고 말했다. 이어 "LLM은 유용한 기술이지만 현재 수준의 성능을 유지하는 데 드는 비용이 사용자가 지불할 의향이 있는 금액에 비해 지나치게 높다"고 지적했다.

2026.06.19 08:57남혁우 기자

래블업 "인텔 '아크 프로 B70', RTX 프로 4000 대비 추론 처리량 높아"

AI 시장의 중심이 모델 학습에서 추론과 에이전틱 AI 서비스 운영으로 이동하면서 GPU 내장 메모리 용량의 중요성이 커지고 있다. 거대언어모델(LLM)에서 길게 이어지는 대화의 맥락을 처리하고 여러 이용자를 동시에 처리하려면 대용량 메모리가 중요하다. 특히 에이전틱 AI는 장시간 대화 맥락을 유지하고 여러 작업을 병렬 처리해야 하는 만큼 GPU 메모리 사용량이 급격히 증가한다. 이 과정에서 이전 추론 결과를 저장하는 'KV 캐시(Key-Value Cache)'가 중요한 역할을 한다. KV 캐시가 충분하지 않으면 기존 KV 캐시 데이터를 제거하거나 재배치해야 하며 이 과정에서 처리량이 감소하거나 응답 지연이 발생할 수 있다. 반대로 KV 캐시를 담을 메모리 용량이 충분하면 더 많은 사용자 요청과 긴 컨텍스트를 동시에 처리할 수 있다. 래블업, '백엔드.AI'에서 LLM 2종 대상 벤치마크 수행 국내 AI 플랫폼 기업인 래블업은 최근 엔터프라이즈 AI 인프라 운영 플랫폼 '백엔드.AI'에서 인텔 아크 프로 B70과 엔비디아 RTX 프로 4000 블랙웰을 대상으로 한 LLM 벤치마크 결과를 공개했다.(인텔 제온 w9-3475X, 우분투 25.10 환경) 인텔 아크 프로 B70은 지난 3월 말 출시된 워크스테이션용 GPU로 AI 추론 수요를 겨냥했다. Xe2 코어 32개와 32GB 메모리 기반으로 대용량 AI 모델을 분할 없이 구동할 수 있다는 점이 차별화 포인트다. 연산 성능은 최대 367 INT8 TOPS(초당 1조 회 연산) 수준이며 GDDR6 32GB 메모리를 탑재해 중소규모 기업과 개발자가 대형 언어모델(LLM)을 로컬 환경에서 직접 구동할 수 있게 했다. 비교 대상이 된 RTX 프로 4000 블랙웰은 쿠다 코어 8960개, ECC GDDR7 24GB 메모리를 탑재했고 메모리 대역폭은 672GB/s 수준이다. Qwen3 8B 모델에서 동시 요청시 초당 처리량 향상 현재 기업들이 활용하는 7B~30B급 오픈소스 LLM은 추론 과정에서 상당한 KV 캐시 공간을 요구하기 때문에 24GB와 32GB 메모리의 차이가 실제 처리량 격차로 이어질 수 있다. 래블업이 Qwen3 8B 모델을 기반으로 수행한 8K 컨텍스트 테스트에서 아크 프로 B70은 동시 요청 수가 늘어나도 초당 처리량이 꾸준히 높아졌다. 반면 RTX 프로 4000 블랙웰은 동시 요청 수가 16개 수준에 도달하자 메모리 부족 현상으로 처리량이 급감했다. 이 테스트에서 아크 프로 B70은 엔비디아 GPU 대비 최대 2.24배 높은 처리량을 기록했다. 컨텍스트 길이를 32K까지 늘린 환경에서는 격차가 더욱 커졌고 특정 구간에서는 아크 프로 B70이 최대 4배 이상 높은 처리량을 보였다. 이는 AI 에이전트 시대에 GPU 연산 성능 못지않게 메모리 용량이 중요해지고 있음을 시사한다. GPT-OSS 20B에서도 RTX 프로 4000 대비 처리량 25% 우위 GPT-OSS 20B 모델을 이용한 테스트에서도 비슷한 경향이 확인됐다. 아크 프로 B70은 동시 요청 수가 증가해도 안정적으로 성능을 유지했으며 32개 동시 요청 환경에서 RTX 프로 4000 블랙웰 대비 25% 처리량이 높았다. 래블업은 실제 벤치마크에서 아크 프로 B70의 KV 캐시 활용 가능 용량이 RTX 프로 4000 블랙웰 대비 평균 2배 수준으로 나타났다고 설명했다. 래블업 관계자는 "이에 따라 모델 가중치를 적재한 이후에도 더 많은 메모리 여유 공간을 확보할 수 있다"고 설명했다. 이어 "처리량과 가격을 함께 고려한 비용 효율 분석에서도 아크 프로 B70이 더 나은 결과를 보였고 AI 서비스 운영에 중요한 토큰당 비용 기준으로는 최대 8배 이상의 효율 향상이 가능하다"고 분석했다. AI 에이전트 등장에 GPU 메모리 용량 중요성 ↑ 래블업은 "장비와 솔루션 도입 시 토큰 처리 비용은 주요 검토 항목 중 하나이며 처리량과 GPU 가격에 따라 결정된다. 정가 기준 아크 프로 B70은 1099달러(약 149만원), RTX 프로 4000 블랙웰은 2199달러(약 297만원)로 벤치마크 결과를 반영하면 두 제품 간 비용 효율 격차는 더욱 커진다"고 설명했다. 다만 이번 결과는 특정 모델과 특정 추론 환경에서 측정된 것으로, AI 학습 성능이나 모든 워크로드에서 동일한 우위를 의미하지는 않는다. 또 AI 생태계 전반에서는 여전히 엔비디아의 영향력이 압도적이다. 쿠다(CUDA)를 중심으로 구축된 개발 환경과 풍부한 소프트웨어 지원은 AMD나 인텔 등 경쟁사가 단시간에 따라잡기 힘들다. 그러나 오픈소스 기반 인텔 AI 프레임워크인 '오픈비노'를 비롯해 vLLM, llama.cpp 등 주요 AI 프레임워크가 인텔 GPU 지원을 확대하고 있다. 업계에서는 아크 프로 B70이 AI 추론 시장을 겨냥한 실용적인 대안으로 자리잡을 가능성이 높다고 보고 있다. AI 에이전트가 확산될 수록 연산 성능뿐 아니라 메모리 용량과 비용 효율이 중요해지고 있기 때문이다.

2026.06.18 16:08권봉석 기자

SKT, 독파모 선행연구 기반 세미나 열어

SK텔레콤이 독자 AI 파운데이션 모델에 관심이 있는 학생, 개발자와 소통하기 위한 세미나를 개최했다. 지난 17일 오후 서울 을지로 SK텔레콤 본사 사옥에서 열린 세미나에서는 서울대학교 수리과학부 서인석 교수가 '수학 인공지능: 그럴싸함과 올바름의 차이'를 주제로 발표했다. 서 교수는 이 자리에서 'AI는 어떻게 생각하는가'라는 화두를 던졌다. 인공지능이 어떤 수학을 하고 있는지, 거대언어모델(LLM)은 수학을 어떻게 배우는지에 대해 수학자의 관점에서 이해하기 쉽게 풀이했다. 세미나에는 개발자, 학생, SK 그룹사 직원 등 200여 명의 AI 관계자들이 참석해 다양한 질문을 던지며 토론을 진행했다. SK텔레콤 정예팀은 정부의 독자 AI 파운데이션 모델 프로젝트를 수행하며 연구해 온 AI 기술의 흐름을 대중과 공유하기 위해 이번 세미나를 마련했다. 총 3회에 걸쳐 진행되는 세미나는 'AI가 어떻게 생각하고 행동하며 하나의 산업 시스템으로 진화하는가'라는 화두를 종합적으로 풀어내는 자리다. 특히 SK텔레콤 정예팀이 어떤 선행연구를 바탕으로 모델을 개발하는지에 대한 학문적 기반을 누구나 이해할 수 있는 수준으로 안내하는 것이 목표다. 연사로는 SK텔레콤 정예팀에서 선행연구를 담당하는 연구진을 대표해 서울대 교수진이 나섰다. 1차 세미나에서는 서인석 교수가 수학적 관점에서 AI의 원리를 설명했다. 오는 23일에는 컴퓨터공학부 유영재 교수가 인공지능 추론 방법을, 7월 1일에는 전기정보공학부 윤성로 교수가 AI 모델 생태계를 주제로 발표한다. 각 강연은 A.X K2 개발 관점에서도 의미를 갖는다. 서인석 교수의 강연은 AI가 추론 역량을 어떻게 습득하는지, 유영재 교수의 강연은 SK텔레콤 정예팀이 추구하는 멀티모달 역량의 기반이 무엇인지, 윤성로 교수의 강연은 개발된 인공지능 모델이 산업과 어떻게 연계되고 기여할 수 있는지를 다룬다. 세미나 당일에는 실시간 온라인 중계를 통해 간편하게 참여할 수 있다. 온라인 중계 시청을 원하는 경우 A.X 링크드인을 통해 신청하면 된다. SK텔레콤 정예팀은 'A.X K2'가 수학 문제 풀이와 코딩 등 에이전트 기능을 비롯해 모델 활용과 산업 확장에 적합한 성능을 갖출 수 있도록 컨소시엄 차원의 산학 협력을 진행할 예정이다. 김태윤 SK텔레콤 파운데이션모델 담당은 “모델 학습에 담긴 기술적 배경을 쉽게 전달해 독자 파운데이션 모델이 어떤 역량을 갖춰야 하는지 누구나 이해하고 공감할 수 있도록 하는 것이 이번 세미나의 취지”라고 말했다.

2026.06.18 09:57박수형 기자

KT, 연내 초개인화 AI 에이전트 상용화..."품질·안정성 차별화"

KT가 올 하반기 품질과 안정성에 초점을 맞춘 초개인화 AI 에이전트를 상용화하겠다는 계획을 밝혔다. 김준석 KT AX미래기술원 에이전틱 AI랩장은 17일 서울 광화문 KT 웨스트 사옥에서 "지난해 연말부터 많은 사람들이 개인 에이전트 사용을 시도했으나, 일반인이 설치하기 어려웠고, 보안 문제가 존재했다"며 "KT는 AX미래기술원 네트워크 경쟁력을 종합해 차별화된 기술을 적용하고, 오작동 방지 솔루션으로 안정성을 높이겠다"고 말했다. KT는 현재 B2C 영역에선 사용자 성향에 맞춘 나만의 비서 개념인 초개인화 AI 에이전트로 기존 서비스 고도화를 추진 중이다. 초개인화 AI 에이전트엔 KT가 기존에 운영 중인 MY K, 지니TV, 사장이지 등에 사용자 취향, 선호도를 구조화된 데이터로 활용하는 기술과 단순 추천을 넘어 요금제 변경 등 실제 수행하는 기술이 적용된다. 에이전트는 가입자 이용 이력과 패턴을 분석해 가장 최적화된 요금제를 제안하고, 대화 히스토리를 바탕으로 멤버십 이벤트를 알려주거나, 개인 선호에 맞는 콘텐츠를 추천하는 데 사용된다. 일정 조율도 가능하다. 가령 여러 사람이 골프 라운딩을 예약할 때 사람 개입 없이 각자 AI 에이전트가 사람의 일정을 확인해 날짜, 장소 등 투표를 진행하고, 최종안을 사람에게 확인받은 후, 직접 장소를 예약하는 방식이다. B2B 영역에선 산업별 특화 데이터를 바탕으로 해결책을 제시하는 버티컬 AI 에이전트로 하반기 성공 사례를 찾아 실효성을 입증한다. 김 AI랩장은 "버티컬 AI에이전트는 현업 전문가의 노하우와 지식을 에이전트에 잘 녹여내야 한다"며 "데이터 파이프라인을 꼼꼼히 점검해 고품질 데이터를 확보하고, 이를 기반으로 LLM을 최적화하며 에이전트 모델을 고도화하고 있다"고 밝혔다. 버티컬 AI 에이전트는 네트워크 장애 발생 시 AI가 어떤 부분에 문제가 있는지 파악하고 조치하고, 공장이나 발전소 등에서 제안된 과제와 유사한 특허를 AI가 찾아서 비교 분석해 특허 등록 가능성을 가늠하는 데 사용된다. KT는 법제처, 양형 검색 등을 지원하는 법률 에이전트도 고도화하고 있다. 현재 대법원에 관련 서비스, 모델을 납품하고 실증을 진행하고 있으며, 다음 달 입찰 예정이다. 또 회사는 AI가 답변을 생성하기 전 근거 정보를 먼저 검색하고 검증하는 K RAG 기술을 자체 개발해 검색·생성·학습·실행 전 단계를 아우르고, 환각(할루시네이션) 현상을 효과적으로 줄이고 있다고 설명했다. 김 AI랩장은 "100% 완벽한 모델은 없다. 결국 할루시네이션 등 오류를 어떻게 최소화하느냐가 핵심"이라면서 "데이터 정제와 도메인 노하우 결합을 통해 모델 품질을 높이고 있다"고 강조했다. KT는 실효성 검증을 위해 AI 기반 사내 지식 검색 서비스 'KT지식허브'에 K RAG 기술을 적용했고, 향후 B2B, B2C 영역으로도 기술 적용을 확장한다는 방침이다.

2026.06.17 14:58홍지후 기자

주거 공간에 테슬라 같은 혁신 심는 '트러스테이' 이야기

인공지능(AI) 기술이 전 세계 산업 지형을 뒤흔드는 가운데, 주거 공간에도 자율주행 개념을 도입한 혁신적인 플랫폼이 등장해 주목받고 있다. 야놀자 투자를 받은 프롭테크 기업 '트러스테이'(대표 이승오)가 그 주인공이다. 트러스테이는 10일 서울 대치동 MDM 타워 1층 야놀자 스퀘어에서 열린 '제3회 미디어허브: 주거 플랫폼·ERP 시장' 행사에서 'AI 기반 스마트 주거 서비스 패러다임 변화'를 주제로 향후 사업 전략과 독자적인 기술력을 공개했다. 이날 발표자로 나선 임태민 트러스테이 R&D실 CTO는 단순한 주거 관리 앱을 넘어, 단지와 단지, 나아가 도시 전체를 연결하는 '하이퍼 커넥티드 플랫폼' 비전을 제시했다. 공간의 한계를 넘다…'노키 AI'가 제시하는 3세대 주거 플랫폼 임 CTO는 주거 플랫폼 시장의 발전 단계를 총 3세대로 정의했다. 1세대가 모든 민원과 행정을 수기로 처리하던 아날로그 시대였다면, 2세대는 방문 주차 예약이나 게시판 확인 등 단편적인 기능을 제공하는 일반적인 IT 앱의 시대다. 트러스테이가 지향하는 3세대는 주거 공간 자체에 '자율주행 OS(오퍼레이팅 시스템)'를 탑재해 시스템 스스로 작동하고 선제적으로 통합 관제를 수행하는 '생활 지원 밀착형 스마트 공간'이다. 이 같은 3세대 패러다임을 이끄는 핵심 동력은 트러스테이의 독자적인 인공지능 브랜드 '노키 AI'다. 노키 AI는 크게 세 가지 축으로 구성돼 오프라인 주거 환경의 페인 포인트를 해결한다. 첫 번째 축인 '온사이트 AI(On-site AI)'는 각 주거 단지만이 가진 고유하고 폐쇄적인 데이터를 독점적으로 학습해 특화 서비스를 제공한다. 가장 대표적인 기능이 '멀티모달 기반의 주간 생활 요약'이다. 관리사무소에서 정형화되지 않은 이미지나 PDF, 첨부파일 형태로 공지사항을 올리면, 온사이트 AI가 이를 스스로 분석·가공해 입주민별 맞춤형 스케줄(동별 주차장 청소, 분리수거일 등)을 요약 전달한다. 회사에 따르면, 이 서비스는 입주민 만족도가 90%에 달할 만큼 실용성이 높다. 또 아파트 단지 내 고질적 문제인 입주민-관리사무소-입주자대표회의 간의 분쟁을 해결하기 위해 단지별 관리규약, 공동주택관리법, 아파트 관리 신문 등의 방대한 데이터를 학습한 '아파트 특화 행정·법률 자문 LMM' 기능도 탑재했다. 두 번째 축인 '노키 비전'은 컴퓨터 비전 기술을 활용한 혁신적인 안전·보안 관제 시스템이다. 차량 번호 인식(LPR)의 경우, 공개되지 않은 번호판 폰트 자체의 특장점을 스스로 학습하고 데이터를 생성하는 독창적인 파이프라인을 구축해 영상 기반 인식률을 약 99.5%까지 끌어올렸다. 이는 국가별로 다른 번호판 체계에도 쉽게 적용할 수 있어 글로벌 확장성이 높다는게 회사 설명이다. 지능형 화재 감지 시스템 역시 유용하다. 불꽃을 인식하면 단순히 경보를 울리는 데 그치지 않고 확산 속도를 감지해 3단계(관리자 알림→입주민 피난 안내→소방서·경찰서 자동 신고)로 대응한다. 특히 온사이트 AI와 연동돼 화재 발생 층수와 위치에 따라 세대별로 최적의 대피 경로를 다르게 안내하는 고도화된 솔루션을 제공한다. 테슬라의 센트리 모드(Sentry Mode)처럼 단지 내 쓰러짐 사고, 싸움, 접촉 사고 등 이벤트 발생 전후 10초의 영상을 자동으로 캡처·기록해 관리자가 수많은 CCTV를 일일이 돌려볼 필요가 없도록 효율성을 극대화했다. 마지막 세 번째 축인 '하이퍼 커넥티드 AI'는 궁극적으로 온·오프라인의 인프라를 완벽하게 제어하는 인공지능이다. 현재 트러스테이 R&D실에서 고도화 연구 개발을 지속하고 있으며 상용화를 앞두고 있다. 1200개 단지 확보와 프리미엄 시장 평정, 글로벌 영토 확장 임 CTO에 따르면, 트러스테이의 뛰어난 기술력은 시장 데이터로 증명되고 있다. ▲주거 관리 통합 솔루션 '노크타운' ▲하드웨어 연결 바탕이 되는 '노크존' ▲생활 상권 하이퍼로컬 소통 플랫폼 '노크플레이스' 시너지를 통해 사용자가 증가하고 있다. 올해 상반기 기준 이미 1200개 단지와 계약을 확정 지었으며, 연말까지 2000개 단지 도입을 목표로 달리고 있다. 분기별 활성 사용자(QAU)는 70만에 육박하며, 이용자의 플랫폼 체류 및 결착도를 나타내는 '스티키니스(Stickiness) 지수'는 기존 아파트 관련 앱 대비 2~3배 이상 높은 수준을 기록 중이다. 단지 내 커뮤니티 시설 제어부터 행정 유틸리티까지 제공되는 세부 서비스만 60여 개가 넘는다. 시장 내 지위도 탄탄하다. 성수동의 초고가 프리미엄 주거 단지(성수 3대장)를 비롯해 고급 타운하우스, 대형 스포츠센터 등에 솔루션 진입을 완료했다. 특히 고령화 시대의 핵심 인프라인 실버타운 시장에서는 위급 상황 시 관리자에게 즉각 신호를 보내는 비상 대응 시스템을 인정받아, 실버타운을 온전히 커버할 수 있는 플랫폼으로 자리매김하며 러브콜을 받고 있다. 최근에는 3D 공간 데이터 전문 기업 '아키스케치'와의 MOU를 통해 실제 도면 기반의 3D 공간 변환 및 AI 인테리어 커머스 기능까지 노크타운 내에 탑재하며 서비스 영역을 무한히 확장하고 있다. 국내 시장의 성공을 발판 삼아 글로벌 진출도 가시화됐다. 현재 약 5개국으로부터 러브콜을 받고 있으며, 그중 2개국에서는 실질적인 사업화 단계인 PoC(기술검증)를 성공적으로 진행 중이다. 특히 몽골 제2의 도시인 '다르한 시'와 직접 PoC 계약을 체결, 도시 전역의 CCTV 200여 대를 실시간으로 분석·관제하는 시스템 도입을 완료했다. 임태민 CTO는 "현지에서 소방청, 경찰, 군 관계자가 모인 가운데 불을 질러 화재 감지 테스트를 진행했는데, 노키 비전이 완벽하게 화재를 잡아내 대단한 찬사를 받았다"고 일화를 전했다. 또 최근에는 인도네시아 신도시 건설사 및 바이어들과 실무 미팅을 갖고 아시아 시장 스마트시티 인프라 진출을 위한 구체적인 논의를 마쳤다고 알렸다. '당근'과는 다르다… 오프라인 문제 해결하는 상생의 '피지컬 AI' 이날 질의응답 세션에서는 스마트 주거 플랫폼 도입에 따른 관리사무소 인력 대체 우려와, 지역 기반 플랫폼인 '당근' 등 기존 빅플레이어와의 차별점에 대한 질문들이 이어졌다. 이에 대해 이승오 트러스테이 대표가 직접 마이크를 잡고 트러스테이만의 '상생 경영 철학'과 '비즈니스 정체성'을 명확히 밝혔다. 이 대표는 기술 도입으로 인한 일자리 감소 우려에 대해 "주거 단지의 규모가 커지고 관리 시설이 고도화되는 반면, 위탁 관리 인력은 제한돼 현재 관리소 직원들은 1인이 멀티 세대를 감당해야 하는 한계 상황에 직면해 있다"고 진단했다. 이어 "우리의 목적은 직업을 없애는 것이 아니라, 과중한 행정 업무와 모니터링을 AI로 자동화해 효율성을 높여주는 것"이라며 "정작 중요한 사람과 사람 간의 따뜻한 커뮤니케이션에 집중할 수 있도록 돕는 상생 구조"라고 강조했다. 기존 인프라를 전면 교체할 필요 없이 트러스테이의 'ECA 장비'만 추가하면 기존 CCTV 인프라를 그대로 활용할 수 있어 단지 비용 부담도 최소화 된다는 설명이다. 지역 소통 플랫폼인 '당근'이나 배달 플랫폼과의 차별성에 대해서는 비즈니스 모델의 근본적인 깊이가 다르다고 선을 그었다. 이 대표는 "당근이 광범위한 지역 이용자를 대상으로 하는 B2C 온라인 플랫폼이라면, 트러스테이는 관리사무소, 입주자대표회의, 입주민 등 다양한 이해관계자의 공식 계약을 기반으로 움직이는 'B2B2C 오프라인 베이스 플랫폼'"이라고 정의했다. 실제로 노크플레이스는 철저한 입주민 인증을 거친 폐쇄성을 무기로 삼는다. 온라인상에 가격이 노출되지 않는 특성을 활용해, 특정 단지 주민들만을 위한 공동구매(예: 숨고와 연계한 세탁기 청소 공구) 등 강력한 바게닝 파워(Bargaining Power)를 행사할 수 있다. 하드웨어 영역과의 결합도 완벽하다. 단지 내 스크린골프장 예약과 관리비 부과 연동은 물론, 안면 인식을 통한 아파트 현관문 자동 개폐 등 오프라인 공간 및 사물인터넷(IoT) 제어 역량은 온라인 기반 서비스가 흉내 낼 수 없는 영역이다. 이승오 대표는 발표를 마무리하며 "챗GPT나 제미나이 같은 글로벌 빅테크의 거대언어모델(LLM)이 대단하지만, 이들은 철저히 온라인 세상의 문제만을 해결한다"며 "반면 트러스테이는 오프라인 환경 요소를 분석하고 IoT와 연결해 현실의 문제를 직접 해결하는 '물리적 AI'를 지향한다"고 강조했다.

2026.06.10 17:06백봉삼 기자

[현장] 와탭랩스 "AI로 완전 자율 모니터링 시대 열 것"

"인공지능(AI) 시장 무게중심이 'AI 실행'에서 'AI 운영'으로 이동하고 있습니다. 우리는 이에 발맞춰 기업이 AI 시스템 운영 전 과정을 한눈에 볼 수 있도록 제품군을 지속 강화할 것입니다. 그동안 파악하기 어려웠던 AI 서비스 성능부터 비용, 품질 문제를 통합 분석하는 시대를 열겠습니다." 이동인 와탭랩스 대표는 9일 서울 서초구 본사에서 'LLM 옵저버빌리티 미디어 데이'를 열고 그래픽처리장치(GPU) 모니터링을 비롯한 LLM 옵저버빌리티, AI 적용 전략을 이같이 발표했다. 이번에 정식 출시된 'LLM 옵저버빌리티'는 거대언어모델(LLM) 기반 애플리케이션 요청 흐름과 성능, 비용, 답변 품질을 추적·분석하는 기능이다. 사용자 요청이 들어온 순간부터 응답이 반환되기까지 전 과정을 트레이스 단위로 기록해 병목 원인을 확인할 수 있도록 한다. 이 대표는 AI 서비스 장애가 기존 IT 시스템처럼 단일 원인으로 발생하지 않는다고 설명했다. 그는 "추론용 GPU 부족을 비롯한 LLM API 응답 지연, 검색 단계 병목, 애플리케이션 호출 오류 등이 복합적으로 얽힐 수 있다"며 "이제 기업은 전 계층을 동시에 관측해야 한다"고 당부했다. LLM 옵저버빌리티는 모든 LLM 호출 입출력 토큰을 요청, 기능, 모델 단위로 집계한다. 이를 통해 기업은 토큰 사용량과 비용을 모니터링하고 AI 환각 감지 등 답변 품질 평가까지 수행할 수 있다. 이 기능은 기존 와탭 플랫폼의 애플리케이션, 쿠버네티스, 서버, 데이터베이스, GPU 모니터링과 연결된다. 기존 고객은 별도 도구를 추가하지 않고 LLM 레이어에서 인프라 영역까지 하나의 대시보드에서 드릴다운 방식으로 분석할 수 있다. 이 대표는 올해 하반기까지 GPU, LLM, AI 운영 중심으로 산업별 솔루션 적용을 확대할 계획이다. 궁극적으로 AI 운영의 표준이 되는 풀스택 플랫폼 완성을 목표로 하고 있다. 와탭랩스는 해외 시장서도 사업 기반을 넓히고 있다. 현재 일본과 동남아 시장에서 고객사를 확보하고 있다. 특히 일본법인은 40개 이상 파트너사를 보유하고 있는 것으로 나타났다. 동남아에서는 인도네시아 중심으로 고객 확대 가능성을 보고 있다. 이 대표는 북미 시장 진출도 추진 중이다. 그는 "현재 김성조 최고기술책임자(CTO)가 현지에서 개발 활동을 이어갈 계획"이라며 "해외 진출 확대를 위해 시장 상황을 지켜보고 있다"고 말했다. 와탭 AI, 대화로 데이터 분석부터 인사이트 도출까지 이날 최진식 와탭랩스 개발 총괄은 대화형 AI '와탭 AI'를 소개했다. 그는 와탭 AI의 자율 운영 기능을 고도화 중이라고 밝혔다. 와탭 AI는 이상 탐지와 원인 추론, 조치 기능을 AI가 수행하도록 지원한다. 이에 운영자가 장애 원인을 더 빠르게 파악하고 대응할 수 있도록 돕는다. 와탭 AI는 비용 최적화 기능도 제공한다. 리소스 사용 패턴과 활용도를 분석해 불필요한 비용을 줄일 수 있는 방향을 제안하는 식이다. 최 총괄은 "팀별 자원 사용 최적화를 통해 GPU 작업량을 2~3배 늘리는 데 기여할 수 있다"고 설명했다. 이 기능은 운영자가 직접 모니터링 화면을 구성해야 하는 부담도 줄인다. 기존에는 며칠씩 걸리던 대시보드 작업을 채팅 몇 줄로 완성할 수 있으며, 프리셋부터 플랫폼 보드까지 필요한 화면을 구현할 수 있다. 제품 간 연계 분석 기능도 와탭 AI 핵심이다. 서로 다른 제품 데이터를 한 흐름으로 연결해 장애 원인을 입체적으로 파악하고, 사용자가 현재 보고 있는 화면의 맥락과 실제 데이터를 바탕으로 분석을 이어갈 수 있도록 지원한다. 와탭AI는 메신저 연계 리포트 기능도 갖췄다. 사용자는 와탭에 직접 접속하지 않아도 메신저에서 운영 현황을 확인하고 주기적인 리포트를 받을 수 있다. 그는 "우리는 그동안 파악하기 어려웠던 AI 서비스 성능부터 비용, 품질 문제를 통합 분석하는 시대를 열 것"이라고 포부를 밝혔다.

2026.06.09 12:21김미정 기자

[유미's 픽] 독파모 올라탄 AI 기업들, 자금전 본격화…업스테이지·모티프 실탄 확보

정부의 '독자 인공지능(AI) 파운데이션 모델' 프로젝트를 계기로 국내 AI 기업들의 자금 확보 경쟁이 본격화되고 있다. 참여 기업들이 민간 투자와 정책금융을 잇달아 확보하며 대규모 모델 개발과 인프라 확충에 속도를 내는 모습이다. 모티프테크놀로지스는 240억원 규모 시리즈B 투자를 유치했다고 27일 밝혔다. 이번 투자 라운드에는 기존 투자사인 나이스투자파트너스와 노틸러스인베스트먼트가 후속 투자자로 참여했다. 디토인베스트먼트와 포레스트벤처스는 신규 투자자로 이름을 올렸다. 모티프테크놀로지스는 이번 투자금을 AI 딥테크 역량 강화와 기업 AX 솔루션 개발, 차세대 AI 인프라 및 서비스 고도화 등에 투입할 계획이다. 오는 8월 독자 AI 파운데이션 모델 단계평가를 앞두고 모델 개발과 인프라 고도화에 필요한 실탄을 확보한 셈이다. 모티프테크놀로지스는 AI 인프라 솔루션 기업 모레의 자회사로 지난해 2월 출범했다. 이 회사는 모델 아키텍처 연구개발(R&D), 그래픽처리장치(GPU) 인프라, 시스템 운영 솔루션, 사후학습·강화학습 방법론을 아우르는 풀스택 엔지니어링 역량을 강점으로 내세우고 있다. 또 설립 4개월 만에 프롬 스크래치 방식으로 개발한 소형언어모델(sLLM) '모티프(Motif)-2.6B'를 오픈소스로 공개해 주목받기도 했다. 이후 텍스트 기반 이미지 생성 모델 '모티프-이미지-6B(Motif-Image-6B)', 자체 개발 대규모언어모델(LLM) '모티프-2-12.7B' 등을 선보이며 모델 라인업을 확대했다. 여기에 모티프테크놀로지스는 지난 2월 과학기술정보통신부가 주관하는 독자 AI 파운데이션 모델 프로젝트 추가 공모에서 정예팀으로 선정되며 시장의 높은 관심을 받았다. 현재는 기존 정예팀인 LG AI연구원, SK텔레콤, 업스테이지와 함께 오는 8월 단계평가를 받기 위해 전력을 쏟고 있다. 모티프테크놀로지스는 모레, 서울대, 한국과학기술원, 삼일회계법인, 국가유산진흥원, HDC랩스 등 17개 기관과 함께 300B급 추론형 LLM도 개발하고 있다. 이후 310B급 시각언어모델(VLM), 320B급 시각언어행동(VLA) 모델로 단계적으로 고도화해 독자 AI 파운데이션 모델을 확보한다는 계획이다. 독자 AI 모델 개발 기업을 향한 자금 공급은 업스테이지에서도 두드러진다. 업스테이지는 지난달 국민성장펀드 직접투자 2호 기업으로 선정돼 차세대 AI 모델 개발 등을 위한 5600억원 규모의 직접투자 안건 승인을 받았다. 이 중 1000억원은 첨단전략산업기금으로 투입된다. 업스테이지는 기업·정부용 AI 솔루션과 LLM을 개발하는 국내 대표 AI 스타트업으로, 정부의 독자 AI 파운데이션 모델 프로젝트에서 벤처·중소기업 가운데 유일하게 1차 평가를 통과했다. 또 최근에는 1800억원 규모의 시리즈C 1차 투자도 마무리한 상태로, 국내 생성형 AI 스타트업 중 처음으로 기업가치 1조원을 인정받는 유니콘에 올랐다. 누적 투자금은 약 4000억원으로 확대됐다. 업스테이지는 자체 개발 LLM '솔라'와 문서처리 AI '다큐먼트 파스'를 앞세워 기업 시장을 공략하고 있다. 확보한 자금은 독자 파운데이션 모델 프로젝트 등 AI 모델 고도화를 위한 GPU 인프라 확충, 국내외 인재 영입, 미국·일본 등 해외 시장 개척에 투입할 방침이다. 김성훈 업스테이지 대표는 "한국을 넘어 글로벌 시장에서도 경쟁력 있는 자체 AI 모델을 고도화해 단순 기업가치가 아닌 매출로 증명하는 기업이 되겠다"며 "기업가치 1조원을 넘어 매출 1조원을 돌파하는 회사가 되기 위해 계속 앞으로 전진하겠다"고 말했다. 두 회사는 모두 독자 AI 파운데이션 모델 사업에 참여하고 있지만 성장 전략에는 차이가 있다. 업스테이지가 상용화 성과와 정책금융 지원을 기반으로 소버린 AI 기업으로 체급을 키우고 있다면, 모티프테크놀로지스는 독자 아키텍처와 풀스택 개발 역량을 앞세워 대규모 추론형 모델 개발에 무게를 두고 있다. 업계에선 독자 AI 파운데이션 모델 사업을 계기로 국내 AI 기업 간 경쟁축이 기술 개발에서 자금 조달로 확장되고 있다고 보고 있다. 대규모 모델 개발에는 GPU 인프라와 데이터, 고급 인재, 사후학습 역량, 상용화 능력이 동시에 요구되는 만큼, 안정적인 자금 확보 여부가 향후 단계평가와 글로벌 경쟁력의 핵심 변수로 떠오르고 있다. 특히 업스테이지가 정책금융을 통해 대규모 투자 승인이라는 발판을 마련하고, 모티프테크놀로지스가 민간 벤처투자 시장에서 후속 투자를 유치하면서 독자 AI 기업을 둘러싼 자본 경쟁은 더 치열해질 전망이다. 정부 사업을 통해 기술력을 검증받은 기업들이 민간 투자와 정책 자금을 동시에 끌어들이는 구조가 만들어지고 있다는 분석도 나온다. 임정환 모티프테크놀로지스 대표는 "이번 투자 유치는 모티프의 AI 딥테크 역량 강화의 발판이 될 것"이라며 "현재 진행 중인 프로젝트를 비롯해 기업 AX 솔루션 개발, 차세대 AI 인프라 및 서비스 고도화 등 다양한 사업을 계획대로 차질 없이 추진해 시장 경쟁력을 더욱 강화하겠다"고 밝혔다.

2026.05.27 15:53장유미 기자

씨플랫폼, 제약·바이오 AI 전환 나선다…실행형 R&D 체계 전면에

씨플랫폼이 글로벌 인공지능(AI)·고성능컴퓨팅(HPC) 기업들과 손잡고 국내 제약·바이오 업계 AI 전환(AX) 시장 공략에 나선다. 단순 AI 도입을 넘어 실제 연구 성과와 운영 효율로 이어지는 실행 중심 AI 연구개발(R&D) 체계 구축 수요가 커지는 가운데, AI 인프라와 머신러닝·거대언어모델 운영관리(MLOps·LLMOps) 플랫폼을 결합한 통합 전략으로 시장 확대에 속도를 낸다는 목표다. 씨플랫폼은 HPE, 웨이츠&바이어시스(W&B), 노바디엑스와 함께 'AI 기반 제약·바이오·헬스케어 R&D 가속화 전략 세미나'를 개최해 국내 제약·바이오 산업을 위한 AI R&D 전략을 제시했다고 26일 밝혔다. 행사에는 국내 주요 제약·바이오·헬스케어 기업 IT 담당자와 AI 연구원 등 관계자 60여 명이 참석했다. 이번 세미나는 단순 기술 도입이 아닌 실제 연구 성과로 이어지는 실행 중심 AI 연구 체계 구축을 핵심 메시지로 내세웠다. 최근 제약·바이오 업계에선 생성형 AI와 LLM을 활용한 신약 개발과 후보물질 탐색 경쟁이 확대되고 있다. 하지만 실제 현장에선 AI 활용 사례 부족과 투자 대비 성과 불확실성, 데이터 관리 문제 등이 주요 과제로 떠오르고 있다. 실제 현장 설문조사 결과, 참석 기업들은 AI 도입의 가장 큰 걸림돌로 'AI 활용 사례 부족 및 투자 대비 ROI 불확실성(61.8%)'을 꼽았다. 이어 조직 내 AI 역량 부족(35.3%), 데이터 관리 및 실험 재현성 부족(29.4%), ML옵스 어려움(29.4%), 그래픽처리장치(GPU) 인프라 부족(26.5%) 순으로 나타났다. 업계 고민이 단순 인프라 확보 단계를 넘어 실제 업무 프로세스에 AI를 적용하고 운영 체계를 고도화하는 단계로 이동하고 있다는 분석이다. 이에 씨플랫폼은 AI 인프라와 ML옵스 플랫폼을 고객 연구 환경과 운영 목적에 맞춰 유연하게 결합하는 방안을 핵심 대안으로 제시했다. HPE는 대규모 AI 모델 학습과 추론에 최적화된 GPU 기반 고성능 인프라 전략을 소개했으며 데이터 처리부터 모델 학습·추론·운영까지 연결되는 AI 라이프사이클 전반 지원 구조를 강조했다. W&B는 실험 추적과 데이터·모델 버전 관리, 협업 환경 구축 등을 지원하는 ML옵스·LLM옵스 플랫폼을 소개했다. 반복 실험이 많은 AI 연구 환경에서 실험 재현성과 데이터 신뢰성을 확보해 실제 운영 환경 전환 속도를 높일 수 있다는 점을 내세웠다. 노바디엑스는 AI 인프라 설계부터 ML옵스 환경 구성까지 포함한 맞춤형 통합 구축 서비스를 선보였다. 아울러 아이티센클로잇은 멀티 AI 에이전트 관리 플랫폼 '에이전트고 2026'를 통해 연구 데이터 분석과 후보물질 탐색 자동화 전략을 발표했다. 최근 글로벌 제약·바이오 산업은 생성형 AI를 활용한 신약 후보물질 발굴과 임상 데이터 분석 경쟁이 본격화되면서 AI 인프라와 데이터 운영 체계 중요성이 빠르게 커지는 분위기다. 단순 모델 도입을 넘어 데이터 신뢰성과 실험 재현성, 운영 자동화 체계를 얼마나 안정적으로 구축하느냐가 핵심 경쟁력으로 부상하고 있다는 평가다. 김현석 W&B 한국지사장은 "W&B는 전 세계 LLM 개발 조직이 표준처럼 활용하는 플랫폼으로, 한국은 글로벌 사용량 톱3에 드는 핵심 시장"이라며 "앞으로 기업 AI 경쟁력은 모델 성능 자체를 넘어 실험과 데이터를 체계적으로 관리하고 이를 신속하게 운영 환경에 적용할 수 있는 역량에 달려 있다"고 설명했다. 백현범 씨플랫폼 본부장은 "제약·바이오 산업에서 AI는 이제 도입 여부가 아닌 실제 성과로 연결하는 운영 체계가 핵심 경쟁력"이라며 "HPE와 W&B 등 글로벌 파트너 생태계를 기반으로 고객들이 실질적으로 체감할 수 있는 AI R&D 실행 구조를 구축하는 데 앞장서겠다"고 강조했다.

2026.05.26 16:14한정호 기자

"비즈니스 모르는 범용 AI, 트럼프 등 지정학적 변수 해석 못해"

[올랜도(미국)=남혁우 기자] "현재 범용 인공지능(AI)은 비즈니스 영역에서 한계에 부딪혀 있습니다. 예를 들어 트럼프 대통령 같은 지정학적 상황이 기업에 어떤 영향을 미치는지에 대해 제대로 된 답을 내놓지 못합니다." 크리스천 클라인 SAP 최고경영자(CEO)는 11일 미국 올랜도에서 열린 'SAP 사파이어 2026' 사전 행사에서 기업용 AI가 직면한 치명적인 한계를 정면으로 지적했다. 기업에 특화되지 못하고 공개된 정보에만 의존해 비즈니스 맥락을 파악하지 못하는 기존 AI는 결국 신뢰할 수 없는 '그저 그런 결과(so-so results)'만을 생성한다는 비판이다. 클라인 CEO는 대안으로 SAP의 비즈니스 지식(Brain)과 대규모언어모델(LLM)을 결합한 '에이전틱 AI'를 제시했다. 외부 지정학적 변수를 LLM으로 분석하고 SAP 내부 데이터와 결합해 각 기업에 특화된 구체적인 해법을 제시하기 때문이다. 이를 활용해 공급망 차질이 예상되는 상황에서 제품 배송 경로를 A에서 B가 아닌 A에서 C로 변경하라는 식의 선제적 조언이 가능하다는 설명이다. 나아가 기업의 보안 우려를 해소하기 위해 전사적자원관리(ERP) 기반의 권한 관리 체계를 AI에 이식하겠다는 청사진을 밝혔다. 에이전트 스스로 데이터 접근 권한을 판단하게 하여 보안 사고를 원천 차단하겠다는 구상이다. 하지만 클라인 CEO는 AI 기술 고도화에도 불구하고 최종 승인과 법적·비즈니스적 책임은 여전히 사람에게 있어야 한다고 강조했다. 그는 "많은 최고재무책임자(CFO)가 AI 에이전트가 재무 마감 업무를 수행한다면 SAP가 그에 대한 책임을 지는지 묻는다"며 "이에 대한 대답은 '아니오(No)'"라고 답했다. 기업의 미션 크리티컬한 업무에 AI를 도입하더라도 최종 결과가 올바른지 규정을 준수했는지 검증하고 미세조정할 책임자가 필요하기 때문이다. 결국 프로세스 마지막에는 항상 인간이 있어야 한다는 설명이다. 이에 SAP는 고객사에서 사용 중인 AI 에이전트가 정확히 어떤 활동을 하는지 추적하고 감시할 수 있는 기능도 함께 제공할 방침이다. 크리스천 클라인 CEO는 "우리는 단순히 이메일을 요약하는 수준을 넘어 조달과 공급망을 혁신하는 실질적인 가치를 보여줄 것"이라며 "이번 행사에서 여러분에게 AI가 마침내 어떻게 비즈니스를 이해하게 되는지 그리고 그것이 기업 미래를 어떻게 바꿀 것인지 증명해 보이겠다"고 자신감을 내비쳤다.

2026.05.13 08:01남혁우 기자

솔트룩스, 에이전트 폭증 시대 산업 AI 선점 나선다

솔트룩스가 20년 이상 축적한 온톨로지 기술과 대규모언어모델(LLM)을 결합한 '온톨로지 파운드리' 플랫폼을 통해 산업형 AI 시장 공략에 나선다. 솔트룩스는 자사 AI 컨퍼런스 'SAC 2026'에서 온톨로지 파운드리를 최초 공개한다고 12일 밝혔다. 온톨로지 파운드리는 데이터 의미와 관계를 구조화하는 온톨로지 기술과 LLM을 결합한 뉴로심볼릭 구조 플랫폼으로, 맥락 이해·추론·설명 가능한 의사결정을 수행하는 에이전틱 AI를 구현한다. 솔트룩스는 AI 에이전트 수가 올해 80억개를 넘어서고 2~3년 내 800억개 이상으로 폭증할 것으로 전망한다. 순수 LLM만으로는 이기종 데이터의 의미적 맥락을 이해하고 고정밀 의사결정을 내리는 데 한계가 있다는 판단에서 온톨로지와 LLM 결합을 핵심 전략으로 내세웠다. 글로벌 시장에선 팔란티어가 온톨로지 기반 AI플랫폼(AIP) 체계로 시가총액 2000억 달러를 넘어서며 산업 AI 대표 기업으로 자리 잡고 있다. 솔트룩스는 온톨로지 관련 특허 39건과 국내 최대 규모 온톨로지 구축·운영 경험을 보유하고 있다. 세계 오픈LLM 평가 1위를 달성한 독자 LLM '루시아'를 결합해 한국형 온톨로지 파운드리 플랫폼을 구현한다는 구상이다. 오는 28일 서울 강남구 GS타워에서 열릴 SAC 2026에선 온톨로지 파운드리와 함께 ▲비정형 문서·이미지에서 온톨로지를 자동 생성하는 '도큐먼트 스튜디오' ▲업무 에이전트를 직접 설계·운영하는 '에이전트 스튜디오' ▲차세대 언어모델 '루시아 4.0' ▲일체형 AI 어플라이언스 '루시아 온(LUXIA-ON)'이 처음 공개된다. 경쟁 관계인 에이로봇·트위니·뉴로메카, 리벨리·퓨리오사·모빌린트가 각각 같은 무대에 올라 공개 토론을 벌이는 자리도 마련된다. 이경일 솔트룩스 대표는 "생성형 AI 이후 경쟁은 '데이터를 이해하는 AI'에 있다"며 "온톨로지와 LLM을 결합한 뉴로심볼릭 AI가 산업 현장의 의사결정 방식을 근본적으로 바꿀 것"이라고 말했다.

2026.05.12 14:05이나연 기자

중부발전, 'KOMIPO 피지컬 AI 기업발굴 협의체' 출범

한국중부발전(대표 이영조)은 28일 'KOMIPO 피지컬 AI 기업발굴 협의체'를 출범했다. 이와 함께 KAIST 글로벌기술사업화센터(GCC)와 업무협약을 체결하고 발전 현장을 거점으로 한 국산 NPU 기반 피지컬 AI 실증 생태계 조성에 본격적으로 착수했다. 협의체는 AI와 로봇 기술을 보유한 중소기업이 발전 현장에서 기술을 검증하고 공신력 있는 실증 이력을 확보할 수 있도록 돕기 위해 구성됐다. 조직은 총괄위원회 산하 기획·기술검증·현장실증 등 3대 분과 체제로 운영된다. 한국AI·로봇산업협회가 운영을 총괄하고 KAIST GCC가 초격차 기술기업 발굴과 정부 R&D 기획을 담당하는 3자 협력 구조를 갖췄다. 중부발전은 참여 기업에 실질적인 혜택을 제공한다. 발전 데이터와 실증장소를 무상으로 개방하고, 기업당 2000만원의 과제 기획비를 지원한다. 또 발전소 직원이 직접 컨설팅하는 'Field-Pass 멘토링', 수요 매칭을 위한 'AI 매칭데이', 국가 R&D 공모 컨설팅 등 기업 성장의 전 주기에 걸친 패키지 지원을 제공한다. 중부발전 측은 “이번 사업은 국산 저전력 AI 반도체의 공공 판로를 개척함으로써 정부의 'AI 3대 강국 실현' 및 반도체 산업 자립화 정책에 실질적으로 기여할 것”으로 내다봤다. 중부발전과 KAIST GCC는 협약에 따라 AI 스타트업 공동 발굴부터 투자 연계, 글로벌 기술사업화, 해외사업장 실증 지원에 이르기까지 사업 전 과정에 걸쳐 동반 지원에 협력하기로 했다. 이종국 중부발전 기획관리본부장은 “AI 중소기업에는 성장의 기회를, 발전소에는 안전과 효율 확보라는 상생 협력의 장을 펼처 나갈 것”이라며 “앞으로도 AI 기업과의 적극적인 협력을 통해 대한민국 AI 3대 강국 실현과 에너지 산업의 미래 경쟁력 확보에 선도적인 역할을 수행하겠다”고 밝혔다. 한편, 발대식에서 장병탁 서울대학교 교수는 기조 특강에서 거대언어모델(LLM)에서 신체화된 지능(Embodied AI)으로 진화하는 글로벌 AI 패러다임을 제시하며, 이번 협의체 출범이 발전 산업의 미래 경쟁력을 확보하는 데 중요한 정책적 의의가 있음을 강조했다.

2026.04.28 17:40주문정 기자

리티스, '콩' 기반 기업 API·AI 인프라 구축 지원

생성형 AI와 대규모 언어 모델(LLM) 기업 도입이 본격화되면서, AI 호출 트래픽을 안전하고 일관되게 관리하는 API 게이트웨이의 역할이 빠르게 확장되고 있다. 이런 흐름 속에서 글로벌 API 플랫폼 기업 콩(Kong)은 '콩 AI 게이트웨이'를 통해 AI·LLM 전용 트래픽 관리 영역으로 포트폴리오를 확장하고 있다고 28일 밝혔다. 또 국내에서는 리티스(litis)가 Kong 기반 서비스를 중심으로 기업의 API 및 AI 인프라 구축을 지원하고 있다고 설명했다. AI 호출을 위한 전용 관문, 콩 AI 게이트웨이 콩 AI 게이트웨이는 기존 API 게이트웨이 개념을 확장해 LLM 및 생성형 AI API 호출을 중앙에서 제어, 보안, 관측할 수 있도록 설계된 솔루션이다. 단순한 프록시 역할을 넘어, AI 서비스 운영에 필수적인 통제 지점을 제공하는 것이 핵심이다. 주요 기능으로는 오픈AI, 애저 오픈AI, 앤트로픽 등 다양한 LLM API 호출을 단일 게이트웨이에서 표준화 해 관리할 수 있다. 또 요청 및 응답 로깅, 민감 정보 마스킹, 정책 기반 필터링을 통해 데이터 유출 리스크를 감소시키고, 모델별 호출량, 비용, 지연 시간을 실시간으로 모니터링해 AI 트래픽 가시성을 제공한다. 보안 및 컴플라이언스 강화를 위해 인증·인가, 사용량 제한, 감사 로그도 AI 호출에 동일하게 적용된다. 특히 기존 콩 게이트웨이를 사용 중인 기업이라면, 기존 API 운영 체계를 유지하면서 AI 트래픽까지 자연스럽게 확장할 수 있다는 점이 강점으로 평가된다. 리티스, 콩 기반 API·AI 인프라 서비스 확대 국내 IT 서비스 기업 리티스는 콩 게이트웨이·콩 AI 게이트웨이를 중심으로 API 관리, 보안, 운영 전반을 아우르는 서비스를 제공하고 있다. 단순 제품 공급을 넘어, 기업 환경에 맞춘 아키텍처 설계와 운영 안정성 확보에 초점을 맞추고 있다. 리티스의 콩 서비스는 마이크로서비스, 하이브리드·멀티 클라우드 환경에 적합한 API 게이트웨이 아키텍처 설계, LLM 호출 흐름 분석 및 보안 정책 수립, 비용·성능 최적화를 위한 전략 제시 등 AI 게이트웨이 도입 컨설팅을 포함한다. 또 OWASP API 시큐리티 톱 10 기반 정책 설계 및 실운영 적용, 장애 대응, 성능 개선, 버전 업그레이드 등 운영 단계까지 전반에 걸친 포괄적인 지원을 제공한다. 이를 통해 리티스는 기존 API 관리(APIM) 고객의 AI 전환을 단계적으로 지원하는 역할을 수행하고 있다. 리티스 관계자는 "전문가들은 생성형 AI 도입이 확산될수록 AI 거버넌스의 출발점은 API가 될 것으로 전망한다. LLM 호출 역시 API 형태로 이뤄지는 만큼 인증, 보안, 모니터링이 가능한 중앙 관문이 필수적이기 때문"이라며 "콩 AI 게이트웨이는 이런 요구에 기술적으로 대응하는 플랫폼으로, 리티스는 이를 국내 기업 환경에 맞게 현실적인 구축·운영 모델로 구현하는 파트너로 자리매김하고 있다"고 말했다. 이어 "생성형 AI가 실험 단계를 넘어 실제 비즈니스에 적용되는 시점에서, 콩 AI 게이트웨이는 더 이상 단순한 인프라가 아닌 AI 통제의 핵심 레이어로 진화하고 있다"고 덧붙였다.

2026.04.28 15:43백봉삼 기자

HP "AI는 도구 아닌 동료... 새 AI PC로 기업 지원"

"올해는 AI로 지식노동 중 상당 부분이 자동화되고 AI가 도구가 아닌 동료가 될 것이다. 특히 기업 환경에서는 더 이상 클라우드에만 의존할 수 없다. AI를 업무에 투입하려면 기업 내 절차를 바꾸는 한편 연산 성능도 중요하다." 28일 오전 서울 청담 앤헤이븐에서 열린 신제품 출시 기자간담회에서 강용남 HP코리아 대표가 이렇게 강조했다. 이날 HP코리아는 올 2분기부터 시장에 투입할 인텔·AMD·퀄컴 최신 프로세서 기반 AI PC 신제품과 이를 뒷받침할 솔루션인 'HP IQ'를 공개했다. 강용남 대표는 "HP는 PC, 프린터, 협업 디바이스 등 사무 환경 전반을 아우르는 포트폴리오를 기반으로, 각각의 기기가 하나의 지능형 시스템처럼 연결되는 '일의 미래'를 만들어가고 있다"고 말했다. "기업 규모와 용도, 예산에 맞는 다양한 기기 공급" 소병홍 HP코리아 전무는 "HP가 지난 3년간 전 세계 12개 나라, 1만 5000명의 지식근로자 대상으로 설문조사 결과 일과 건강한 관계를 유지하는 근로자는 전체 20%였고 이 중 AI 도구를 일상적으로 활용한다고 답했다"고 설명했다. 이어 "AI 중심이 클라우드에서 엣지로 옮겨오고 있으며 이를 구현하기 위한 AI PC는 중소·중견기업부터 대기업 모두에 중요한 도구다. HP는 이를 위해 용도와 예산에 맞는 다양한 기기를 출시할 예정"이라고 설명했다. 이날 공개된 엘리트북 X G2는 14인치, 3K OLED 디스플레이를 탑재했다. 무게는 999g, 두께는 15.9mm이며 인텔과 AMD, 퀄컴 등 다양한 제조사 실리콘을 탑재한다. 퀄컴 스냅드래곤 X2 기반 제품은 최대 85 TOPS(1초당 1조번 연산) NPU를 내장한다. 키보드형 AI PC/퀄컴 기반 보급형 제품도 공급 엘리트보드 G1a는 올 초 CES 2026에서 공개된 새 컨셉 제품으로 676g 무게 본체에 AMD 라이젠 프로세서와 SSD, 메모리를 담았다. 윈도11 코파일럿+ 기준을 충족하는 50 TOPS NPU를 내장했고 4K 모니터를 최대 4개 장착할 수 있다. 퀄컴 스냅드래곤 X2 엘리트/플러스를 탑재한 엘리트북6 G2q도 국내 출시 예정이다. 소병홍 전무는 "퀄컴 스냅드래곤 기반 PC에 대한 기업 시장의 인식이 개선되고 있고 긴 배터리 지속시간과 고성능 등 장점이 있어 기업 도입 사례가 늘어날 것"이라고 설명했다. 사내 데이터 처리를 위한 AI 워크스테이션으로는 인텔 제온 600 프로세서와 엔비디아 RTX 프로 6000 블랙웰을 조합한 Z8 퓨리 G6i, 엔비디아 블랙웰 GB10 기반 초소형 워크스테이션인 ZGX 나노 등이 공급된다. AI 기반 협업·LLM 강화 'HP IQ' 탑재 HP는 지난 해까지 기업용 노트북에 거대언어모델(LLM) 기반으로 여러 지식을 검색하는 '디스커버', 각종 문서 파일을 분석해 주는 '애널라이즈' 등 기능을 내장한 'AI 컴패니언'을 탑재했다. 올해는 AI 컴패니언의 일부 기능을 계승하면서 회의 지원, 주위 기기 인식과 문서 요약 등 기능을 넓힌 'HP IQ'를 기본 제공한다. 차성호 HP코리아 매니저는 "HP IQ는 오픈소스 LLM인 GPT-OSS-20B(200억개 매개변수) 모델 기반으로 구동되며 PC 내 문서 요약과 검색, 회의록 자동 작성, 회의 참석자 간 파일 공유 기능을 내장했다"고 설명했다. 이어 "HP는 PC 뿐만 아니라 프린터, 화상회의 솔루션 등 폭 넓은 포트폴리오를 가졌고 이를 자동으로 인식하는 '니어센스' 기능을 확장해 미래 업무 환경을 구축할 것"이라고 덧붙였다. 강용남 대표 "모든 분야 1위 달성 목표" 지난 3월 취임한 강용남 HP코리아 대표는 이날 취임 후 첫 공식석상에서 "게이밍 PC와 워크스테이션 뿐만 아니라 모든 분야에서 시장점유율 1위를 달성하는 것이 목표"라고 밝혔다. 강용남 대표는 "HP는 GPU가 들어간 고성능 AI 워크스테이션과 게이밍 PC 등 다양한 폼팩터 제품을 갖췄다. Z시리즈 워크스테이션과 하이퍼X 오멘 게이밍 PC는 현재 국내 시장점유율 1위를 기록중"이라고 밝혔다. 이어 "최근 주목받는 AI를 바탕으로 이들 제품 뿐만 아니라 전체 시장에서 1위를 차지할 수 있을 것이다. 그 시점을 최대한 앞당기는 것이 포부이자 목표"라고 설명했다.

2026.04.28 14:41권봉석 기자

"이체해줘"…웰컴저축은행, 음성인식 'AI 금융비서' 만든 이유

“홍하나에게 3만원 송금해줘” 말로 돈 보내는 시대 왔다. 누가 민감한 금융 서비스를 음성으로 이용하겠냐는 회의적인 시각도 있었지만, 현실은 달랐다. 웰컴저축은행이 지난달 음성으로 이체할 수 있는 '인공지능(AI) 금융비서' 서비스를 출시한 결과, 예상보다 사용자들이 활발하게 이용 중인 것으로 나타났다. AI 금융비서는 사용자가 음성이나 텍스트로 명령을 내리면 이를 수행하는 서비스다. 현재 이체, 계좌정보 조회, 거래내역 조회, 메뉴 이동 등의 기능을 지원한다. 특히 서비스를 경험한 사용자들의 재사용률이 높은 것으로 나타났다. 말 한마디면 송금이 이뤄지고, 원하는 메뉴로 이동할 수 있는 직관적인 사용성이 강점이라는 게 웰컴저축은행의 설명이다. 지디넷코리아는 지난 21일 서울 용산구 웰컴저축은행 본사에서 AI 금융비서 서비스 기획과 개발을 주도한 김아론 AICT 이노베이션테크팀장과 전진영 플랫폼사업팀장을 만나 인터뷰를 진행했다. “음성으로 바로 실행”…조작 단계 최소화 AI 금융비서는 모바일 뱅킹 앱 이용 시 조작 단계를 줄이기 위한 취지에서 기획됐다. 이동 중이거나 손을 쓰기 어려운 상황, 혹은 스마트폰 조작이 익숙하지 않은 사용자에게 직관적인 금융 서비스를 제공하는 것이 출발점이었다. 그러나 지난 3월 서비스 출시 후 뚜껑을 열어보니, 실제 이용자층은 예상과 달랐다. 김아론 팀장은 “초기에는 고령층 중심의 서비스가 될 것으로 예상했지만, 실제로 주 고객층인 40~50대가 음성인식 기능을 많이 활용하는 것으로 나타났다”고 말했다. 사용자들은 주로 음성 명령을 통해 이체를 하는 데 서비스를 활용한다. 이체는 기존 거래 이력이 있거나 사전에 등록된 계좌에 한해 가능하다. 예를 들어 “홍하나에게 3만원 입금해줘”라고 말하면 기존 거래 내역에 있는 동일 이름의 계좌로 이체가 진행된다. 다만 오입금을 방지하기 위해 최종 단계에서는 '확인' 버튼을 눌러야 한다. 전진영 팀장은 “처음에는 공공장소에서 음성으로 금전 거래를 하는 것에 대한 우려가 있었지만, 직접 사용해보니 오히려 말로 하는 것이 더 편리하다는 반응이 많다”고 설명했다. 또 앱에서 필요한 메뉴를 일일이 찾지 않아도 음성을 통해 바로 접근할 수 있다는 것도 장점이다. 전 팀장은 “AI 금융비서를 통해 메뉴 탐색 없이 다양한 기능을 이용할 수 있다는 점에서 사용자들이 서비스를 찾고 있다”며 “궁극적으로는 '노메뉴 뱅킹'을 구현하는 것이 목표”라고 말했다. “기술 개발은 직접”…내재화 전략 AI 금융비서 서비스를 위한 인프라 구축부터 시스템 개발, 파인튜닝, 기획 등 대부분은 웰컴저축은행 인력이 수행했다. 일반적으로 금융권이 외주 시스템통합(SI) 업체나 그룹사 IT기업에 의존하는 것과는 다른 행보다. 웰컴저축은행은 기술 내재화를 위해 개발 역량을 내부에 집중하고 있다. 현재 AI 모델링 담당 인력은 13명, 전체 기술 인력은 100명 이상으로 전체 인력의 약 6분의 1 수준이다. 차세대 시스템 전환과 같은 대형 프로젝트를 제외하면 대부분의 개발을 자체 수행하고 있다. 김아론 팀장은 “서비스 도입을 위해 관련 기술을 직접 학습하고 구현하고 있다”며 “이 경우 새로운 기술을 빠르게 적용할 수 있는 장점이 있다”고 말했다. 거대언어모델(LLM)은 한국어 인식률을 고려해 LG의 '엑사원'을 채택했다. 핵심 서비스는 내부 역량으로 개발하되, AI 모델은 외부 기술을 결합하는 방식을 택했다. 여기에 금융 서비스 특성에 맞게 직접 전문용어 학습과 파인튜닝을 진행했다. 예를 들어 “송금해줘”, “보내줘”, “쏴줘” 등 다양한 표현을 모두 '이체'로 인식하도록 모델을 학습시켰다. 김 팀장은 “자연어를 실제 금융 거래로 연결하는 과정에서 의도 해석 오류를 줄이는 것이 가장 큰 과제였다”며 “금융 특화 발화 데이터를 지속적으로 학습시키며 정확도를 높이고 있다”고 설명했다. “AI 금융비서→AI 에이전트로” 웰컴저축은행은 향후 AI 금융비서를 자율적으로 업무를 수행하는 'AI 에이전트'로 고도화할 계획이다. 현재는 이체, 조회, 메뉴 이동 중심이지만, 앞으로는 대출 한도 조회, 타 금융사 상품 비교 등으로 기능을 확장한다. 웰컴저축은행 사용자의 주 관심 영역인 대출 실행 영역까지 서비스를 넓히는 것이 목표다. 전진영 팀장은 “모니터링 결과 금리나 대출 관련 문의가 많았다”며 “대출 한도 조회, 상품 비교 기능을 추가하는 방안을 검토 중”이라고 말했다. 이어 “장기적으로는 대출 가입과 해지까지 대화형으로 처리할 수 있도록 발전시킬 계획”이라고 덧붙였다.

2026.04.22 14:55홍하나 기자

인텔 "아크 프로 B70·B65, 추론 특화 GPU 시장 현실적 선택지"

"아크 프로 B70은 클라우드에 의존하지 않는 온프레미스(On-Premise) AI를 구축할 수 있는 성능과 32GB 대용량 메모리를 갖췄습니다. AI가 실험 단계를 넘어 실무로 확산되는 현 시점에서 현실적인 선택지입니다." 21일 서울 여의도 인텔코리아에서 만난 주민규 인텔코리아 한국 채널영업본부장(전무)가 이렇게 강조했다. 인텔은 지난 3월 말 AI 추론 수요를 겨냥한 워크스테이션용 GPU '아크 프로 B70/B65'를 출시했다. GDDR6 32GB 메모리를 탑재해 중소규모 기업과 개발자가 대형 언어모델(LLM)을 로컬 환경에서 직접 구동할 수 있게 한 것이 핵심이다. "32GB 메모리로 클라우드 없이 대용량 LLM 구동" 아크 프로 B70은 Xe2 코어 32개와 32GB 메모리 기반으로 대용량 AI 모델을 분할 없이 구동할 수 있다는 점이 차별화 포인트다. 연산 성능은 최대 367 INT8 TOPS(초당 1조 회 연산) 수준이다. 현재 시중에서 32GB 메모리를 탑재한 엔비디아 지포스 RTX 5090이 500만원을 웃도는 반면, 아크 프로 B70은 949달러(약 140만원) 수준이다. 200억 개 이상 매개변수를 가진 모델도 로컬 GPU에서 직접 실행할 수 있다. 메모리 용량과 비용 효율을 중시하는 환경을 겨냥했다. 주민규 본부장은 "보안 규제로 클라우드 활용이 제한된 기업이나 기관에서 관심이 높다"며 "비용 부담을 낮추려는 중소규모 조직에도 현실적인 대안이 될 수 있다"고 말했다. "추론 특화 GPU 시장 선점 노린다" 주 본부장은 아크 프로 B70/B65를 소비자용이 아닌 '추론 특화 GPU'로 규정했다. 그는 "현재 AI 시장은 학습보다 실제 서비스 운영 단계의 추론 수요가 더 빠르게 증가하고 있다"며 "다수 기업이 참여하는 성장 초기 시장이라고 판단했다"고 설명했다. 이어 "기업들이 AI를 실험 단계에서 실제 적용 단계로 전환하면서, 추론을 효율적으로 처리할 수 있는 인프라에 대한 관심이 높아지고 있다"며 "이 수요를 겨냥해 선제적으로 제품을 출시했다"고 덧붙였다. "AI 도입 초기 설치 장벽 낮추는 SW도 준비" 온프레미스 AI 확산의 걸림돌로는 초기 구축 난이도가 꼽힌다. 현재는 비개발자가 로컬 환경에서 AI를 실행하기까지 복잡한 설치 과정을 거쳐야 한다. 에이전틱 AI 소프트웨어 '오픈클로'도 윈도 환경에서 최소 5단계를 거쳐야 구동된다. 주 본부장은 "AI 활용의 확산은 초기 진입 장벽을 얼마나 낮추느냐에 달려 있다"고 말했다. 인텔은 이를 해결하기 위해 소프트웨어 협력사와 함께 클릭 한 번으로 AI 실행 환경을 구성할 수 있는 설치 도구를 준비 중이다. 해당 소프트웨어는 근시일 내 배포될 예정이다. "안정적 드라이버 지원으로 제품 수명·활용 범위 확장" 인텔은 아크 GPU 출시 이후 드라이버 지원을 지속적으로 강화해왔다. 게임 출시와 동시에 대응하는 '데이제로' 드라이버를 제공하고, 월 2~3회 업데이트를 유지하고 있다. 최근 펄어비스 신작 게임 '붉은사막'이 아크 GPU에서 실행되지 않는 문제가 발생하자 약 10일 만에 수정 드라이버를 배포하기도 했다. 신규 장비 도입 후 장기간 운영되는 기업 환경에서는 드라이버 업데이트의 중요성이 더 크다. AI 모델과 소프트웨어 지원을 통해 활용 범위를 지속적으로 확장할 수 있기 때문이다. 주 본부장은 "제품 수명주기 동안 일관된 드라이버 지원은 필수"라며 "시장 점유율과 무관하게 지원을 지속하는 것이 인텔의 방향"이라고 강조했다. "방향성 다른 소비자·기업 만족 위해 노력" 인텔은 2022년 이후 아크 GPU 라인업을 확대해왔다. 데스크톱용 A770·A750을 시작으로 B580/B570을 출시했고, 워크스테이션용으로는 A60, B60/B50, B70/B65까지 제품군을 확장했다. 주 본부장은 "인텔은 일반 소비자 시장과 전문가용 시장 모두 중요하게 보고 있다. 일반 소비자용 시장은 경쟁이 치열하지만 전체적인 시장 규모는 기업용 시장이 크다. 어느 시장에 더 중점을 둔다고 말하기는 어렵다"고 말했다. 그는 "다만 일반 소비자가 원하는 게임 성능과 기업·개발자가 요구하는 추론 성능은 기술적으로 차이가 있다"며 "두 시장을 동시에 만족시키는 것이 인텔의 목표"라고 덧붙였다.

2026.04.22 08:49권봉석 기자

Arm·애플·퀄컴 출신 전문가, CPU 스타트업 '누바코어' 설립

에이전틱 AI가 등장하며 CPU의 중요성이 커지는 상황에서 x86·Arm 위주의 서버용 프로세서 시장에 새로운 도전이 시작됐다. 애플과 Arm, 퀄컴을 거친 CPU 설계 전문가 제러드 윌리엄스가 '완전히 새로운 CPU' 개발을 선언했다. 그가 애플·퀄컴에서 함께 한 동업자 두 명과 함께 이달 설립한 스타트업 '누바코어(Nuvacore)'는 거대언어모델(LLM)과 에이전틱 AI에 최적화된 차세대 프로세서 개발을 목표로 했다. 누바코어는 "성능과 전력 효율 간 절충이 아닌, 두 요소를 동시에 극대화하는 '리셋' 수준의 제품 개발"을 선언했다. 이런 새로운 설계 방향이 실제 상용화로 이어질 경우, 반도체 산업의 경쟁 구도 전반에 적지 않은 파장을 미칠 것으로 전망된다. 제러드 윌리엄스, 누비아 거쳐 2021년 퀄컴 합류 제러드 윌리엄스는 1996년 텍사스 인스트루먼트(TI)를 시작으로 1998년부터 2010년까지 Arm에서 근무하며 CPU IP인 코어텍스 A8, 코어텍스 A15 개발을 주도한 시스템반도체(SoC) 설계 전문가다. 애플에서는 아이폰용 A시리즈 SoC에 탑재되는 CPU IP를 개발하는 한편 애플이 자체 설계한 PC용 SoC인 M1 4종 설계에도 관여했다. 이후 Arm과 애플에서 함께 했던 엔지니어와 스타트업 '누비아'(Nuvia)를 차렸다. PC 분야 역량 강화를 원하던 퀄컴은 CPU 강화를 목적으로 2021년 누비아를 인수했다. 제러드 윌리엄스도 수석부사장으로 퀄컴에 합류해 오라이언(Oryon) CPU 개발을 지휘했다. 오라이언 CPU 상용화... 당초 방향성에서 이탈 오라이언 CPU는 2024년 6월 PC용 칩인 스냅드래곤 X 엘리트 등으르 시작으로 PC와 스마트폰 등에 쓰였다. 제러드 윌리엄스가 목표로 했던 서버용 프로세서 '피닉스'와는 방향성이 크게 달라졌다. 제러드 윌리엄스는 지난 2월 초 자신이 운영하는 링크드인 계정에 "현재 가족과 시간을 보내고 있으며 퀄컴과 여정은 끝났다. 지난 4년간 함께 한 모든 분께 감사한다"고 밝혔다. 이어 "올 1월부터 집의 벽을 칠하고 수리하는 등 편안한 시간을 보내고 있다"고 적기도 했다. 퀄컴 퇴직 후 3개월만에 '누바코어' 설립 제러드 윌리엄스는 퀄컴 퇴직 3개월 만인 이번 달부터 다시 복귀를 선언했다. 애플과 퀄컴 시절을 함께 보낸 동료 두 명과 스타트업 '누바코어'를 차리고 완전히 새로운 CPU를 설계하겠다고 선언한 것이다. 그는 링크드인에 "CPU는 수십년 간 이전 세대를 위해 만들어진 아키텍처를 기반으로 조금씩 발전해 왔다. 그러나 현대 대규모 인프라와 AI가 요구하는 것은 게임의 판도를 바꾸고 있으며 누바코어는 이를 리셋하기 위한 회사"라고 설명했다. 이어 "(Arm과 애플, 퀄컴에서 함께한) 존 브루노, 람 스리니바산과 함께 누바코어를 설립했고 세쿼이아 캐피털의 투자를 받아 최대 성능과 절대적인 효율성을 규모에 맞게 구현하기 위해 처음부터 새롭게 설계된 새로운 클래스의 CPU를 만들고 있다"고 설명했다. "현대 요구사항에 맞춘 새 CPU 개발" 선언 제러드 윌리엄스가 밝힌 누바코어의 목표는 분명하다. 지금까지 설계된 CPU의 구조를 완전히 벗어나 거대언어모델(LLM)과 에이전틱 AI에 특화된 완전히 새로운 CPU를 만들겠다는 것이다. 누바코어 공식 블로그 역시 "기존 아키텍처가 전력 효율과 성능 사이 균형을 찾는데 어려움을 겪는 반면, 새로 설계할 CPU는 최대 성능과 절대적인 면적 효율성이라는 두 축에 집중할 것"이라고 강조했다. '기존 아키텍처'에 대한 명확한 설명은 없었지만 정황상 인텔 제온과 AMD 에픽 등 기존 x86 기반 서버용 프로세서를 겨냥한 것으로 보인다. 실제로 인텔은 2023년 기존 16비트 응용프로그램 관련 구조를 완전히 덜어낸 새로운 64비트 명령어 체계인 'x86-S'를 만들겠다고 선언하기도 했다. 그러나 1년 뒤인 2024년 말 이 프로젝트를 폐기하기도 했다. x86·Arm 중심 CPU 경쟁 구도 깨지나 현재 AI 연산은 GPU와 가속기가 주도하고 있지만, 데이터 처리·스케줄링·시스템 제어 측면에서 CPU의 역할은 여전히 중요하다. 특히 에이전틱 AI가 등장하며 이를 처리할 장치로 CPU가 다시 주목받고 있는 상황이다. 지난 달 Arm 네오버스 CSS 기반 첫 완제품 프로세서인 'AGI CPU'를 공개한 Arm 역시 에이전틱 AI의 중요성을 내세웠다. 누바코어는 회사 웹사이트 공개와 함께 아키텍처, 회로 설계 등 CPU 설계에 필요한 전 영역에서 인재 채용에 나섰다. 단순히 개념 설계에서 벗어나 실제 칩 개발과 공급까지 염두에 둔 조직 구축을 시작한 것이다. 누바코어가 새로운 CPU 개발과 상용화에 성공할 경우 기존 x86·Arm 중심의 CPU 경쟁 구도에도 변화가 올 수 있다.

2026.04.20 17:39권봉석 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

美, 앤트로픽 '미토스5' 빗장 풀어…"100여 곳에 허용"

"AI 전력 소비 1000분의 1로 줄인다"…신형 AI 아키텍처 등장

에픽게임즈 CEO "스팀의 AI 사용 표기 정책, 무책임한 처사"

[르포] 전화통화도 어렵던 다도해 섬에 쏟아진 초고속인터넷

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.