• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'비전 AI'통합검색 결과 입니다. (76건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

상상만 하면 AI가 '뚝딱'...네이버 실감형 미디어 기술 엿보니

카메라 앞에 선 우주인이 인사를 건넨다. 그 뒤로 펼쳐진 배경은 현실이 아닌, 네이버가 만든 가상 공간. 이제 영상 속 장면은 사람이 아닌 AI가 구성하고, 텍스트 한 줄로도 숏폼 영상이 자동 생성된다. 네이버가 AI 기술을 일상으로 확장하는 '온서비스 AI' 전략을 영상 콘텐츠 생태계로 본격 확장하며, 올해 안에 다양한 영상 기술과 확장현실(XR) 콘텐츠 플랫폼 공개를 예고했다. 16일 네이버는 경기 분당구에서 기자간담회를 열고 '이머시브 미디어 플랫폼' 확대 구축과 함께 이같은 사실을 알렸다. 버추얼 콘텐츠 경험 확대가 미디어 업계 화두로 부상함에 따라 네이버는 독자 구축한 ▲미디어 AI ▲XR 스튜디오 ▲버추얼 스트리밍 등 '비전 테크 트라이앵글 기술'을 바탕으로 서비스 전반에 실감형 미디어 경험 확대에 나설 계획이다. 연내 영상에 AI 접목한 플랫폼·기술 출시…텍스트를 영상으로 변환 네이버는 실감형 미디어 경험 확대를 위해 AI 기반 영상 콘텐츠 플랫폼과 기술을 선보인다. 먼저, 영상의 맥락을 심층적으로 이해하는 AI 기술인 '뮤(MU)Ai' 플랫폼을 연내 확대해 공개할 예정이다. 해당 플랫폼은 저작권 관리, 유해 콘텐츠 및 저품질 영상 감지 기능을 기반으로 한층 고도화됐다. 올해는 영상 이해 기술의 범위를 확대해 영상의 챕터를 구분하고 설명을 제공하는 오토 챕터 기술, 분위기·장소 등 영상의 세부 내용을 분석하고 메타 데이터화 해 네이버 피드의 추천을 고도화하는 등 사용자 경험을 개선한다. 해당 플랫폼에는 여러 AI 모델과 이미지 처리 기술이 유형별로 내재화 돼 있어 비용 경쟁력도 확보했다는 것이 네이버 측 설명이다. 텍스트 콘텐츠를 영상으로 자동 변환해주는 '오토클립Ai'도 내놓는다. 멀티모달 초거대언어모델(LLM)을 활용해 블로그 맥락을 이해하고 요약해 숏폼에 최적화된 내용을 자동 생성하는 기술이다. 음성, 배경음악 등 내용에 맞는 편집 기법을 자동 적용해 최적화된 콘텐츠를 생성한다. 비전 스테이지서 가상화면·실제화면도 연동한다 네이버는 이날 확대 구축한 이머시브 미디어 플랫폼 구현의 대표 사례로 '비전·모션 스테이지'를 제시했다. 비전 스테이지와 모션 스테이지는 각각 다양한 주제에 맞춰 초현실화한 가상 배경을 제공할 수 있는 스튜디오, 고품질 3D 콘텐츠를 제작하고자 하는 치지직 스트리머들이 활용할 수 있도록 전문 기술력과 인력 등을 지원하는 스튜디오를 일컫는다. 그 중에서도 비전 스테이지는 ▲커머스부터 ▲드라마나 ▲영화까지도 제작 가능할 정도로 활용도가 높은 것이 특징이다. 현재 많이 제작되고 있는 콘텐츠는 라이브 커머스이며 무한도전 등 치지직의 오리지널 콘텐츠에도 활용되고 있다. 모션 스테이지는 캐릭터에 움직임을 부여하고 가상 배경을 혼합해 끊김 없는 실시간 방송이 가능하다. 이날 현장에서는 시연도 이뤄졌다. 비전 스테이지에서는 카메라 트래킹 기술이 적용돼 실제 촬영 시점과 가상 화면이 실시간으로 연동되는 장면을 볼 수 있었다. 고해상도 LED 디스플레이에 모습을 드러낸 후 사라진 우주인이 카메라 트래킹 기술이 적용된 화면에서는 오한기 네이버 리얼타임 엔진 스튜디오 리더와 인사하는 장면이 연출되기도 했다. 오 리더는 “비전 스테이지는 지난해 완공된 스튜디오로 사람이 많이 만드는 그래픽을 통해서도 콘텐츠를 만들지만 생성형 AI 이미지를 통해서도 다양한 콘텐츠를 단시간에 빨리 만들 수 있다”며 “실제로 콘텐츠가 나오는 속도가 짧기 때문에 브랜드가 원하는 콘텐츠를 즉각적으로 확보할 수 있다는 장점이 있다”고 설명했다. 이같은 미디어 기술 고도화 다음 목표로 네이버는 XR 콘텐츠 시장을 들여다보고 있다. XR은 ▲증강현실(AR) ▲가상현실(VR) ▲혼합현실(MR)을 포괄하는 기술로 네이버는 안드로이드 운영체제 기반의 XR 콘텐츠 플랫폼을 준비하고 있다고 언급하기도 했다.

2025.07.17 13:53박서린

트웰브랩스, 아마존 베드록에 '영상 AI' 공급…韓 AI, 글로벌 주류 '진입'

세계 주요 클라우드 플랫폼이 생성형 인공지능(AI) 확장에 나서는 가운데 트웰브랩스가 회사의 영상 AI 모델을 아마존에 공급하며 글로벌 시장 공략을 본격화했다. 트웰브랩스는 회사의 초거대 영상 AI 모델 '마렝고'와 '페가수스'를 아마존웹서비스(AWS)의 완전관리형 서비스 '아마존 베드록'을 통해 제공한다고 16일 밝혔다. 국내에서 개발된 파운데이션 모델이 글로벌 AI 플랫폼에 공식 편입된 건 이번이 처음이다. 아마존 베드록은 개발자가 단일 응용 프로그램 인터페이스(API)로 여러 AI 모델을 호출할 수 있는 플랫폼으로, 메타, 엔트로픽, 딥시크, 미스트랄AI 등 주요 AI 기업의 모델을 포함하고 있다. 트웰브랩스는 베드록 내에서 영상 이해 AI를 제공하는 유일한 서드파티 기업으로, 아마존 자체 모델인 '노바'를 제외하면 독점적 위치에 있다. 이번 공급을 통해 전 세계 AWS 고객들은 별도의 인프라 구축 없이 영상 내 객체, 행동, 배경음 등 다양한 요소를 자연어로 탐색할 수 있는 트웰브랩스의 모델을 활용할 수 있다. 영상 분석, 하이라이트 제작, 콘텐츠 태깅 등의 작업이 자동화돼 영상 기반 산업의 업무 생산성을 높일 수 있는 기반이 마련됐다. 트웰브랩스는 모델이 영상 분석 시간 단축 외에도 기업 내부의 아카이브 자산을 구조화하거나 마케팅과 서비스에 쓰이는 짧은 형식의 2차 콘텐츠를 제작하는데 쓰일 수 있다고 밝혔다. 활용 가능한 산업은 미디어, 스포츠, 엔터테인먼트 전반으로 확장된다. 실제로 북미 최대 스포츠 엔터테인먼트 기업인 메이플리프스포츠앤엔터테인먼트(MSLE)는 트웰브랩스 모델을 도입해 콘텐츠 제작 시간을 16시간에서 9분으로 줄였다. 트웰브랩스는 이를 통해 '데이터로서의 영상' 활용이 본격화될 것이라고 전망했다. 업계에서는 트웰브랩스의 아마존 베드록 진입을 '소버린 AI'의 실질적 구현 사례로 평가한다. 기존의 소버린 AI 개념이 국산 기술의 국내 활용에 머물렀다면 트웰브랩스는 글로벌 공급망 안에서 국산 AI가 주도권을 확보할 수 있음을 입증한 셈이다. 이재성 트웰브랩스 대표는 "이번 아마존 내 모델 공급 개시로 영상 데이터의 새로운 가치를 창출해 고객사의 비즈니스 성장에 기여할 것"이라며 "AWS와 지속 협력해 전 세계 기업들이 국산 영상 AI를 사용하는 진정한 소버린 AI를 실현하겠다"고 밝혔다.

2025.07.16 16:09조이환

토스랩-비전, 일본 내 '잔디 AI' 더 널리 알린다

업무용 협업툴 '잔디'를 서비스하는 토스랩(대표 김대현)은 일본 파트너사인 '비전'과 함께 일본 시장 내 잔디 AI 확산을 위한 협력을 본격화한다고 8일 밝혔다. 비전은 일본증권거래소(JPX)의 프라임 시장에 상장된 통신 서비스 기업이다. 전 세계 200여 개국을 대상으로 해외 데이터 통신 서비스와 폭넓은 B2B 서비스를 제공한다. 현재 2천여 명의 자사 및 협력사 구성원이 잔디를 활용하고 있다. 토스랩과 비전은 지난 2019년 일본 내 기업용 협업툴 시장 공략을 위한 파트너십을 체결한 이후, 현지 영업망과 고객 지원 역량을 기반으로 잔디의 일본 시장 확산을 주도해 왔다. 특히 2024년 말 기준, 전년 대비 잔디 판매액을 20% 성장시키며, 일본 내 협업툴 시장에서 입지를 다지고 있다. 비전은 잔디의 일본어 지원, 엔화 결제, 일본어 이모티콘 등 기능 현지화에 대한 피드백을 제공하며 일본 이용자들의 활용 경험 개선에도 적극 참여하고 있다. 또 자사의 AI전환에도 잔디AI를 적극적으로 활용하고 있다. 비전은 사내 시스템 관련 문제 해결과 전사 정보 공유에 잔디 AI를 활용하고 있으며, 고객 응대 이력 요약, 자동 분류, 의사 결정 지원 등 다양한 업무 영역으로 AI 활용처를 넓혀 나가고 있다. 비전 시스템부의 하야시 차장은 "잔디 AI는 사내 시스템 관련 문제 해결에 필요한 정보를 신속하게 파악할 수 있도록 도와주며, 문제 대응 시간을 단축한다"면서 "직접 체감한 잔디 AI의 효용을 바탕으로 일본 내 법인 고객에게 AI 도입을 적극 제안할 계획"이라고 밝혔다. 김대현 토스랩 대표는 "비전은 고객이자 파트너로서 견고한 신뢰관계를 구축해 온 글로벌 성장 파트너"라며 "양사의 검증된 협업 시너지를 통해 일본 기업의 AI 전환에 더욱 속도감 있게 대응할 것"이라고 말했다.

2025.07.08 14:29백봉삼

[인터뷰] "텍스트 다음은 비디오"…팔란티어 출신 베테랑, 韓 스타트업 간 이유는?

"실리콘밸리에서 오랫동안 다양한 기술과 환경을 경험해 왔지만 영상 데이터를 '이해'하려는 시도는 다른 차원의 도전으로 느껴졌습니다. 단순히 기술이 뛰어나다는 걸 넘어서 제가 정말로 풀고 싶었던 문제를 정면으로 다루고 있었습니다. 자연스럽게 '이제 이곳에서 일해야겠다'는 생각이 들었습니다." 폴 조지 머신러닝 엔지니어는 최근 기자와의 인터뷰에서 트웰브랩스에 합류하게 된 계기를 두고 이같이 말했다. 실리콘밸리에서 지난 15년 동안 활동하며 팔란티어, 오픈도어, 퍼페추아 등 핵심 기술 기업을 거친 그는 지난해 퍼페추아의 엔지니어링 디렉터 자리를 내려놓고 트웰브랩스에 합류했다. 8일 업계에 따르면 파운데이션 모델의 개념이 거대언어모델(LLM)을 넘어 컴퓨터 비전과 멀티모달 영역으로 확장되는 추세다. 이 흐름 속에서 트웰브랩스는 영상 이해에 특화된 비전 파운데이션 모델을 구축하며 주목받고 있다. 지난 2021년 샌프란시스코에서 설립된 이 회사는 영상 속 시각, 음성, 언어 정보를 통합적으로 처리하는 멀티모달 AI 모델을 독자적으로 개발 중이다. 조지 엔지니어가 트웰브랩스를 선택한 배경에는 코넬대 박사과정 시절 직접 공동 창업한 교육용 영상 플랫폼 '비디오노트' 경험이 깔려 있다. 당시 그는 MIT 오픈코스웨어에서 착안해 강의를 촬영하고 메타데이터를 수작업으로 정리하는 과정을 거치며 이 작업을 자동화할 수 있으면 좋겠다는 문제의식을 품게 됐다. 이후 관련 분야에서 연구와 제품 개발을 이어가다 최근 트웰브랩스의 기술을 접했고 자신이 과거에 고민했던 문제를 실제로 해결하고 있는 회사라고 판단했다. 실제로 이 회사는 멀티모달 기반의 영상 이해 기술을 바탕으로 검색, 분석, 요약, 자동화를 수행하는 AI 플랫폼을 개발한다. 영상 내 음성, 자막, 시각 정보를 통합적으로 처리하는 자체 비디오-언어 모델 '페가수스'와 시공간 정보를 인코딩하는 인프라 모델 '마렝고'를 중심으로, 실시간 검색 및 대용량 인덱싱이 가능한 서비스까지 상용화했다. 텍스트 기반 모델에 비해 100배 이상 복잡한 영상 데이터를 처리하기 위한 구조다. 조지 엔지니어는 영상 AI의 기술적 깊이와 스케일 모두를 강조했다. 영상은 텍스트나 이미지보다 정보량이 훨씬 많고 다차원적이기 때문에 단순히 모델 정확도만으로는 대응할 수 없기 때문이다. 그는 "비디오 데이터셋은 그 자체로 대규모 연산 인프라, 고정밀 트레이닝, 신속한 응답 속도를 요구하는 영역"이라며 "우리는 이를 감당할 수 있는 구조를 갖추고 있으며 실제로 기업 고객에 적용해 실시간 영상 분석을 제공하고 있다"고 설명했다. 현재 트웰브랩스는 샌프란시스코와 서울을 중심으로 양측 오피스를 운영하고 있으며 약 100여 명의 구성원 중 서울 본사에는 연구 및 엔지니어링 팀이, 샌프란시스코 오피스에는 비즈니스 및 고객 대응 조직이 주로 배치돼 있다. 조지 엔지니어는 미국에 거주하면서도 한국 엔지니어들과 긴밀한 협업을 이어가고 있는 상황이다. 조지 엔지니어는 프랑스어로 '에스프리 드 코르(esprit de corps)'라는 표현을 인용하며, 물리적으로 떨어져 있어도 하나의 팀처럼 유기적으로 작동하는 분위기를 강조했다. 더불어 한국 엔지니어들과의 협업에 대해서는 단순히 똑똑한 것을 넘어서 문제를 깊이 있게 파고드는 성향이 인상적이었다고 평가했다. 그는 "특히 멀티모달 AI의 복잡한 구조를 함께 설계하고 운영할 수 있는 동료로서 높은 신뢰를 갖고 있다"며 "한국 오피스를 방문했을 때는 공간에 들어서는 순간 자연스럽게 연결된다는 느낌을 받았다"고 말했다. 트웰브랩스의 기술은 연구 수준에 머무르지 않고 다양한 산업 현장에서 검증되고 있다. 북미 스포츠 구단 운영사 MLSE는 트웰브랩스의 기술을 도입해 수천 시간의 경기 영상을 실시간으로 분석하고 장면 요약과 콘텐츠 자동화를 수행하고 있다. 이외에도 SK텔레콤, 아이콘, 미디어·엔터테인먼트 기업들과의 협업이 진행 중이다. 폴 조지 엔지니어는 "영상 AI는 단순히 유행을 따르는 영역이 아니라 본질적으로 인간과 가장 가까운 인지 데이터를 다루는 분야"라며 "우리가 만든 모델은 고객의 실시간 서비스에 적용되고 있으며 그 자체가 AI 스타트업이 진짜로 세상에 영향을 주는 방식"이라고 밝혔다.

2025.07.08 11:44조이환

"IP 보호 솔루션이 해낸 일"…마크비전, 생성형 AI 확산 속 300억 ARR 돌파

마크비전이 생성형 인공지능(AI) 확산으로 인한 디지털 위협 증가 흐름에 맞춰 올인원 지적재산권(IP) 보호 솔루션을 고도화한 덕분에 연간반복매출(ARR) 2천200만 달러(한화 약 300억원)를 달성했다. 마크비전은 정식 서비스 출시 4년 만에 연간반복매출(ARR)이 두 배 이상 증가했다고 30일 밝혔다. 이는 지난해 1분기 1천만 달러(한화 약 140억원)를 달성한 이후 1년 만에 이룬 성과다. 회사는 60개 이상의 모듈형 IP 서비스를 순차적으로 출시해 내년 6천만 달러(한화 약 840억원), 오는 2027년 1억 달러(한화 약 1천400억원) 달성을 목표로 삼고 있다. 이 회사의 주요 성장 배경은 생성형 AI 기술과 그에 따른 위조상품, 무단판매, 웹사이트 사칭 등 디지털 위협의 다변화다. 이에 따라 글로벌 브랜드들은 기존 수동적 대응 방식을 대체할 AI 기반 자동화 솔루션을 필요로 하고 있는 틈새를 공략해 왔다. 특히 마크비전은 ▲브랜드 침해 탐지와 제재를 자동화하는 '마크AI' ▲글로벌 상표 출원과 관리 지원 툴인 '마크폴리오' ▲현장 단속·조사를 담당하는 '마크로우'로 구성된 통합 솔루션을 통해 브랜드의 IP 생애주기를 전방위적으로 지원한다. 회사 측에 따르면 마크AI는 지난해 총 5천41만 건의 브랜드 침해 요소를 제재하며 전년 대비 66.5% 증가한 실적을 기록했고 제재 정확도는 99.1%에 달했다. 제재 대상도 기존 위조상품과 무단판매에서 웹툰, 웹소설, 게임 등 불법 콘텐츠와 계정 사칭 등으로 확대됐다. 이에 따라 러쉬, 루이비통모에헤네시 등 글로벌 브랜드를 비롯해 티르티르, 아누아, 말본골프 등 국내외 신흥 브랜드의 고객사 합류도 꾸준히 이어졌다. 회사 측은 고객 수가 전년 대비 약 두 배가량 증가했다고 설명했다. 이인섭 마크비전 대표는 "신속히 변화하는 디지털 환경 속에서 브랜드 보호의 중요성이 커지고 있다"며 "우리 AI 기반 통합 솔루션이 고객의 IP 자산을 안전하게 지키고 실질적인 비즈니스 성과로 이어질 수 있도록 최선을 다하겠다"고 말했다.

2025.06.30 14:38조이환

[현장] 슈퍼브에이아이 "비전, 한국이 1등할 수 있다"…수출형 소버린 AI 선언

"기존에 우리가 알던 거대언어모델(LLM) 기반의 소버린 인공지능(AI) 전략이 주로 방어적 접근이라면 산업용 비전 AI는 오히려 세계 무대 수출의 무기가 될 수 있습니다. 제조업에 강점을 가진 한국이 산업 특화형 파운데이션 모델(VFM)로 글로벌 경쟁력을 확보할 수 있기 때문입니다." 김현수 슈퍼브에이아이 대표는 24일 서울 여의도 콘래드호텔에서 열린 기자간담회에서 이같이 말했다. 이날 행사는 산업용 비전 AI 파운데이션 모델 '제로(ZERO)' 공개를 위한 자리로, 질의응답에는 김 대표를 비롯해 최고기술책임자(CTO), 최고사업책임자(CBO) 등 주요 경영진이 직접 참석했다. 김 대표의 발언은 정부가 최근 '국가 파운데이션 모델' 프로젝트를 통해 다양한 형태의 모델 개발을 유도하겠다는 의지를 밝힌 데 따른 것이다. 특히 소버린 AI 전략을 주창해온 네이버클라우드 출신 하정우 수석이 국가 AI 정책의 총괄 책임자로 선임되면서 거대언어모델에 대한 보완 전략도 함께 주목받고 있다. 이날 김현수 대표는 정부의 소버린 AI 전략과 제로의 연결 지점을 묻는 기자의 질문에 "LLM은 외산 모델 리스크를 막기 위한 수비형 기술로 해석되나 비전 파운데이션 모델은 수출 전략 기술이 될 수 있다"고 강조했다. 이어 "한국은 제조·조선·반도체 등 고도화된 산업 인프라를 가진 몇 안 되는 국가로, 이 기반 위에서 한국형 비전 AI는 글로벌 1등 가능성이 있다"고 말했다. 슈퍼브에이아이는 파운데이션 모델 기술을 공개하는 데 그치지 않고 산업 현장의 AI 도입 장벽을 구조적으로 낮추는 생태계 전략도 함께 제시했다. 차문수 최고기술책임자(CTO)는 "8B, 7B 모델은 현장 적용이 어려워 제로는 경량화에 집중했다"며 "산업용 제어 컴퓨터(PLC), 신경망 처리장치(NPU) 등 다양한 산업 장비와 응용 프로그램 인터페이스(API)로 직접 연동이 가능해 손쉽게 시스템에 탑재할 수 있는 구조를 갖췄다"고 설명했다. 시장 전략으로는 '플랫폼 중심 생태계 공급'을 강조했다. 김진회 최고사업책임자(CBO)는 기자의 관련 질의에 "'제로'는 아마존 웹서비스(AWS) 같은 글로벌 플랫폼에서 쉽게 호출할 수 있도록 설계됐다"며 "사용자가 가장 익숙하고 신뢰하는 환경에서 AI를 바로 접할 수 있게 했다"고 말했다. 이어 "AWS에 등록된 제로는 시간당 약 10달러(한화 약 1만4천원) 수준으로, 초기에는 할인된 가격으로 제공될 예정"이라고 설명했다. 올해 매출에는 '제로' 관련 수익이 반영되지 않는다. 슈퍼브에이아이는 현 시점에서의 '제로'를 직접적인 매출원이 아닌 '시장 인지도 제고를 위한 마중물'로 규정했다. 김진회 CBO는 "'제로'를 통해 AI가 실제 어떤 문제를 푸는지 체험하게 되면 이후 머신러닝 기반운영 'MLOps 플랫폼'과 '버티컬 솔루션' 수요가 자연스럽게 확대될 것"이라고 말했다. 김현수 대표는 "20조원 규모의 기존 머신비전 시장을 넘어 스마트팩토리와 영상관제 등 200조 원 이상 시장에서 제로가 탐지·이해 등의 작업을 대체할 수 있다"며 "빠른 시일 안에 해당 시장을 본격적으로 공략할 것"이라고 강조했다.

2025.06.24 15:15조이환

[현장] "AI 도입 비용 0"…슈퍼브에이아이, 산업용 비전 파운데이션 모델 '제로' 공개

슈퍼브에이아이가 인공지능(AI) 도입 비용과 시간을 대폭 줄인 산업용 비전 파운데이션(VFM) 모델을 통해 전 산업의 디지털 전환 가속화에 나선다. 기술 부담 없이 누구나 AI를 쓸 수 있도록 만들겠다는 전략이다. 슈퍼브에이아이는 24일 서울 콘래드호텔에서 기자간담회를 열고 산업 특화형 비전 파운데이션 모델 '제로(ZERO)'를 공개했다. 이날 행사에는 김현수 최고경영자(CEO)를 비롯해 차문수 최고기술책임자(CTO), 김진회 최고사업책임자(CBO)가 참석해 슈퍼브에이아이의 기술 전략과 시장 계획을 상세히 밝혔다. 김현수 CEO는 "AI 도입 비용을 완전히 '0'으로 만들겠다"는 선언과 함께 슈퍼브에이아이가 개발한 '제로'를 소개했다. 회사에 따르면 '제로'는 학습 데이터 없이도 즉시 활용 가능한 영상 AI 모델로, 기존 AI 개발에 요구되던 데이터 구축과 모델 학습 과정 자체를 생략할 수 있는 것이 핵심이다. 영상 속 객체 탐지, 추적, 질의응답까지 다양한 작업을 단일 모델로 처리할 수 있어 산업 적용성도 강조됐다. 산업용 범용 기반 모델 '제로'…AI 도입 병목 해소한다 이날 행사를 시작하며 김 CEO는 슈퍼브에이아이가 AI 도입에 있어 ▲전문 인력 부족 ▲데이터 부족 ▲기술 인프라 부재라는 세 가지 병목을 확인했다고 설명했다. 이를 해결하기 위해 이미 개발한 것이 머신러닝 기반의 'MLOps 플랫폼'과 '버티컬 솔루션'이다. 데이터 라벨링 자동화와 AI 개발 전 과정을 하나의 플랫폼에서 처리할 수 있는 이 플랫폼은 AI 개발 기간을 6개월에서 2주로 줄이는 데 성공했다. '버티컬 솔루션'은 개발 역량이 부족한 산업 현장에서 AI를 즉시 활용할 수 있도록 만든 제품군이다. CCTV 기반 화재 감지, 안전 모니터링 솔루션은 실제로 발전소, 공항, 지자체 등에서 쓰이고 있다. 김 대표는 "이제는 더 높은 목표를 설정할 시점"이라며 "이에 '제로' 모델을 개발할 필요성을 느꼈다"고 강조했다. 슈퍼브에이아이에 따르면 '제로'는 마치 '챗GPT'처럼 프롬프트 입력만으로 다양한 작업을 실행하는 멀티모달 인터페이스를 갖췄다. 예시 이미지 하나로 생산 현장의 결함 탐지나 수량 계산이 가능하고 프롬프트를 통해 다양한 산업 과업을 정의할 수 있다. 기존 AI의 한계였던 '사전 정의된 카테고리만 인식 가능' 문제도 해결한다는 설명이다. 김 대표는 제로가 지닌 '제로샷' 능력을 핵심 경쟁력으로 꼽았다. 학습 없이도 기존 지식만으로 새로운 상황을 추론할 수 있는 점은 제조업 기반이 강한 한국이 비전 AI 분야에서 세계 시장을 주도할 수 있는 전략적 교두보가 될 수 있다는 의미이기도 하다. 산업용 비전 데이터는 대부분 기업 내부에 있고 공개되지 않는다. 텍스트 기반의 언어 모델과 달리 접근이 어렵다. 김 대표는 "바로 이 점이 우리가 경쟁력을 가질 수 있는 이유"라며 "한국의 제조·조선·방산 같은 고도화된 산업 인프라 위에서 비전 파운데이션 모델은 세계 1등을 노릴 수 있다"고 말했다. 김 대표는 "AI의 3대 축으로 거대언어모델(LLM), 비전 파운데이션 모델(VFM), 피지컬 AI(로보틱스 등)가 제시된다"며 "이 가운데 비전 AI가 산업 현장의 눈이 될 것"이라고 말했다. 이어 "산업용 비전 AI가 한국의 국가 경쟁력에 기여하도록 '제로'를 통해 AI 민주화와 함께 산업 혁신의 속도를 끌어올리겠다"고 밝혔다. 구글·MS·중국 모델 제쳤다…국산 비전 '제로'로 CVPR 2위 이어 차문수 CTO는 '제로'의 기술적 배경과 성능 성과를 설명했다. 그는 기존 비전 AI의 구조적 한계부터 짚으며 제로가 어떤 기술 혁신을 통해 이를 극복했는지를 순차적으로 소개했다. 차 CTO는 기존 비전 AI가 ▲새 객체 인식 불가 ▲환경 변화에 취약 ▲작업마다 별도 모델이 필요한 복잡성 등 세 가지 태생적 한계를 안고 있다고 설명했다. 산업 현장에서는 이 같은 제약이 반복적인 데이터 수집과 학습 비용으로 이어졌고 AI 도입 자체를 가로막아 왔다고 진단했다. 그는 슈퍼브에이아이가 이 같은 구조적 병목을 해결하기 위해 '제로'를 설계했다고 밝혔다. 제로가 가진 '제로샷'이란 대규모 언어 데이터와 이미지 데이터를 함께 학습해 학습되지 않은 객체도 추론 가능한 능력이다. 더불어 정해진 분류 없이도 작동하는 '오픈월드' 구조로 설계됐다. 이미지나 텍스트 등 다양한 형태의 프롬프트를 지원하는 멀티모달 인터페이스와 수십 개의 태스크를 하나의 모델로 처리할 수 있는 멀티태스크 구조를 채택했다. 무엇보다도 산업현장에서 필요로 하는 문제를 곧바로 다룰 수 있도록 퍼블릭 웹 데이터 외에 슈퍼브에이아이 자체 구축 데이터와 국내 AI허브 데이터 등 산업용 특화 데이터를 중심으로 학습시킨 점이 특징이다. 추가 학습 없이 바로 제조, 유통, 건설 등 다양한 분야에서 사용 가능한 형태로 만들었다는 점에서 기술적 실용성이 강조됐다. '제로'는 벤치마크에서도 뚜렷한 성과를 냈다. 산업용 영상 AI 벤치마크에서 경쟁 모델들을 제치고 1위를 기록했다. 글로벌 비전학회인 국제 컴퓨티 비전 및 패턴 인식 학회(CVPR)의 객체 탐지 및 퓨샷 챌린지에서도 각각 2위, 4위를 기록했다. 중국의 '티렉스-2(T-Rex2)', 마이크로소프트의 '플로센스-2(Florence-2)', 구글 '오더블유엘브이2(OWLv2)' 등과 비교해도 성능 격차를 크게 벌린 것으로 나타났다. 또 차 CTO는 '제로'가 적은 리소스로 고성능을 구현한 점을 강조했다. 'A100' 그래픽 처리장치(GPU) 8장만으로 학습했으며 수집한 1억 장 규모의 데이터에서 약 90만 장만을 선별 학습에 사용했다. 이를 가능하게 한 것은 슈퍼브가 보유한 MLOps 플랫폼의 데이터 선별 기술이었다는 설명이다. 모델 경량화도 특징이다. 10억 파라미터 미만으로 설계돼 연산량이 작아 엣지 디바이스나 클라우드 등 다양한 환경에서 가볍게 배포 가능하다. 응용 프로그램 인터페이스(API) 호출 방식뿐 아니라 엣지AI 형태로도 쉽게 연동 가능하며 실제 산업 환경에서의 AI 도입을 빠르고 간편하게 만든다는 것이 슈퍼브에이아이의 설명이다. 차 CTO는 "'제로'는 단일 모델에 그치지 않는다"며 "하드웨어-플랫폼-모델-버티컬 솔루션을 포괄하는 '제로 스택'으로 풀스택 생태계를 구성하겠다"고 밝혔다. '제로'로 200조 시장 노린다…"지능형 비전, 모든 산업의 표준 될 것" 이어 김진회 CBO는 '제로'가 실제 비즈니스 현장에 어떻게 가치를 창출하는지 설명하며 기술 중심 전략에서 '고객 중심 전환'으로의 구체적 비전을 제시했다. 그는 '제로'의 활용이 단순한 AI 도입을 넘어 산업 전체의 운영 구조를 바꾸는 촉매가 될 수 있다고 강조했다. 김 CBO는 "AI가 중요한 게 아니라 여러분의 자연지능이 중요하다"며 기존 AI 도입 방식의 비효율성과 제로의 실용적 전환 능력을 대비해 설명했다. 학습 없이도 객체 탐지, 결함 검출, 수량 카운팅이 가능한 '제로샷'의 현장 데모를 통해 복잡한 모델 설계와 라벨링 없이도 AI 도입이 가능함을 시연했다. 데모에서는 리테일 환경에서는 변화가 잦은 제품군을 사전 학습 없이도 인식하고 분류할 수 있는 능력도 선보였다. 영상 속 인물의 행동을 추론하고 사고 현장을 이해해 답변을 제공하는 지능형 에이전트 형태로 확장된 기능도 함께 시연됐다. 김 CBO는 '제로'가 기존 AI 도입에서 필연적으로 요구되던 '문제 정의→데이터 수집→라벨링→모델 학습→배포'의 전 과정을 무력화했다고 밝혔다. 그는 "이제는 아이디어만 있으면 AI를 바로 쓸 수 있게 된다"며 "기술검증(PoC)에 수천만 원을 쓰지 않아도 된고 전문가를 고용하는데 소요되는 시간도 필요 없게 하는 것이 우리의 궁극적 목적이었다"고 말했다. 시장 확장 전략으로는 '플랫폼 중심 생태계 공급' 구조를 제시했다. 아마존웹서비스(AWS) 같은 글로벌 플랫폼에서 손쉽게 제로를 호출할 수 있는 구조를 갖춰 사용자가 가장 익숙하고 신뢰하는 환경에서 AI를 접할 수 있도록 하겠다는 것이다. 실제로 제로는 이날 오후부터 AWS를 통해 공개될 예정이다. 그는 궁극적으로 '제로'가 모든 산업 장비·시스템에 탑재되는 표준이 되겠다는 포부를 밝혔다. 20조원 규모의 기존 컴퓨터 비전 시장을 넘어 200조원에 달하는 글로벌 영상 관제 시장, 290조원 규모의 스마트팩토리 시장 등으로 진출하겠다는 계획이다. 김진회 CBO는 "의사는 의료 AI, 농업 전문가는 농업 AI를 만드는 시대를 '제로'가 열 것"이라며 "지금까지의 AI가 기술을 위한 것이었다면 이제는 사람을 위한 AI로 전환해야 한다"고 말했다.

2025.06.24 14:21조이환

'문서 AI'가 더 똑똑해졌다…"서류 속 문맥·구조까지 파악"

문서 인공지능(AI) 기술이 단순 텍스트 인식을 넘어 문맥·구조까지 이해하는 방향으로 진화했다. 복잡한 문서에서도 주요 정보를 자동 식별하고 고도화된 자동화 처리까지 가능해졌다. 11일 IT 업계에 따르면 최근 문서 처리 시장에서는 비전언어모델(VLM) 기반 광학 문자 인식(OCR) 기술이 주목받고 있다. 이 기술은 계약서, 보고서 등 여러 형식과 맥락으로 이뤄진 문서 속 표, 조항, 제목, 본문을 AI로 식별해 구조화된 데이터로 변환할 수 있다. VLM은 이미지와 언어 정보를 동시에 이해하는 AI 모델이다. 일종의 '이미지 전문가'와 '언어 전문가'가 한 팀처럼 협업하는 방식으로 작동한다. 우선 이 모델은 문서에서 표, 문장, 도장, 손글씨 등 다양한 이미지 요소를 구분한다. 이후 각 영역의 텍스트를 분석해 의미를 파악하고, 이를 종합적으로 해석한다. 이 과정에서 시각 정보와 언어 정보가 실시간으로 상호작용하며 정답을 조율한다. 정보 하나가 잘못 인식되면 다른 정보가 이를 보완하고, 누락된 부분은 이미지 단서를 활용해 추론하는 식이다. 예를 들어, 사용자가 계약서에 VLM 기반 OCR을 적용하면 '계약 당사자'와 '계약 기간' '주요 조항' '서명란' 등을 자동으로 식별해 체계적으로 정리할 수 있다. 이를 통해 문서 처리 자동화 수준을 높이고 반복 작업과 인적 오류를 줄일 수 있다. 기존 OCR은 이미지 속 텍스트를 디지털 문자로 바꾸는 데만 초점 맞췄다. 문서 레이아웃이나 의미적 맥락은 이해하지 못해 데이터 활용에 한계가 있었다. 이에 추가 인력이 이를 수작업으로 정리해야만 했다. VLM OCR, 정확도·사업성 모두 잡아 한국딥러닝은 '딥 OCR 플러스' 출시로 VLM OCR 서비스를 이미 상용화했다. 이 솔루션은 별도 학습 없이 여러 형식 문서를 처리할 수 있다. 한국어·영어·숫자·특수문자가 섞인 복잡한 구조도 정확하게 인식할 수 있도록 설계됐다. 딥 OCR 플러스는 문서의 표나 문단을 자동 분석해 핵심 정보를 요약하고, 추출 데이터를 표준 포맷으로 제공해 업무 시스템과 연동된다. 한국딥러닝은 이 솔루션으로 문서 검토 시간을 최대 80% 줄이고, 일관된 데이터 품질을 유지할 수 있다고 강조했다. 앞서 업스테이지도 AI 기반 문서 구조화 솔루션 '다큐먼트 파스'를 출시해 보험, 금융, 의료 등 산업 현장에서 문서 자동화를 지원하고 있다. 고정밀 벤치마크에서 아마존·마이크로소프트 모델보다 높은 정확도를 기록한 것으로 전해졌다. 올해 6월 모델 '솔라'를 결합한 '솔라 다큐브엘엠'도 출시한다. 솔라 타큐브엘엠은 시각 정보와 언어 정보 통합 처리 역량을 강화해 문서 기반 요약, 질의응답, 자동 분류까지 수행할 수 있도록 구성됐다. 특히 비정형 문서나 복잡한 레이아웃 문서에서도 높은 인식률을 보일 것이란 평가를 받고 있다. 김지현 한국딥러닝 대표는 "비전 OCR은 돈 버는 AI"라며 "정확도와 사업성을 모두 잡을 수 있는 실용 기술"이라고 강조했다.

2025.05.11 14:40김미정

[기고] 텍스트만 읽는 AI는 한계…이미지까지 이해하는 'VLM 시대' 왔다

텍스트만 바라보던 인공지능(AI)이 이미지도 읽기 시작했다. 생성형 AI 열풍 정점에 서 있던 거대언어모델(LLM)이 세상을 바꾼 지 채 2년이 되기도 전에 산업계는 벌써 비전언어모델(VLM) 이라는 새로운 반열을 주목하고 있다. LLM은 인터넷 전체에 해당하는 방대한 문서, 코드, 게시글 등을 토큰 단위로 분해해 빈도와 순서를 학습하는 통계 기반 언어 모델이다. 이를 통해 문장 구조, 주제 흐름, 단어 간 연관도 등을 정교하게 파악할 수 있다. 그러나 LLM은 픽셀로 구성된 시각 정보를 직접 해석하지 못한다. 특히 스캔본 한 장 안에 담긴 표, 도장, 서명, 손글씨, 이미지 등 다양한 비정형 요소 앞에서는 입력 자체를 받지 못해 무력해진다. 이 때문에 반드시 광학문자인식(OCR)을 거쳐 텍스트로 전처리한 후에야 분석이 가능하다. 이 과정에서 발생하는 정보 손실이나 오인식이 전체 모델 성능에 결정적 영향을 미친다. 이 한계를 근본적으로 보완하는 방식이 VLM이다. VLM은 쉽게 말해 '사진 전문가'와 '언어 전문가'가 한 팀이 된 모델이다. 우선 이미지를 보고 표, 문장, 도장, 필기 영역을 구분한 후 텍스트 기반으로 의미를 해석한다. 이를 실시간으로 교차 어텐션(Cross-Attention) 층에서 주고 받으며 정답을 보정한다. 한 영역이 잘못 인식되면 다른 쪽이 보완하고, 누락된 정보는 이미지의 시각 단서 바탕으로 추론해 빈칸을 채운다. 언어와 시각 정보가 동일 공간에서 상호작용하듯 작동하는 식이다. 구조가 복잡하거나 손글씨가 섞인 문서도 훨씬 자연스럽게 이해할 수 있다. 예를 들어 물결 무늬 배경 때문에 일부 금액 텍스트가 흐릿해진 스캔 이미지에서도 VLM은 표 헤더와 숫자 패턴을 근거로 '이 칸은 청구 금액일 것'이라고 추론한다. 텍스트만 해석하던 기존 LLM 방식과 달리, VLM은 이미지와 문장이 함께 대화하는 구조로 작동하기 때문에 비정형 문서에 강력한 성능을 발휘한다. 실제 산업 현장에서 VLM 기반 OCR은 이미 도입 초기부터 기존 접근법보다 뚜렷한 개선 효과를 보이고 있다. 이미 업계에서는 VLM을 통한 생산성 향상 효과가 나오고 있다. 신생 물류기업 L사는 하루 평균 4만 장의 송장을 스캔하는데, 양식 종류가 600종을 넘어서면서 OCR 오류율이 18%까지 상승했다. VLM을 탑재한 OCR을 적용한 결과 첫 달에 오류율이 4%까지 떨어졌고, 급히 투입된 15명의 검수 인력을 4명으로 줄일 수 있었다. 금융·보험 분야에서도 VLM은 의미 있는 변화를 만들어냈다. 보험 손해 사정사 워크플로에 도입된 VLM 기반 OCR 엔진은 의료 영수증, 처방전, 수기 메모가 섞인 PDF 문서를 분석해 질병 코드와 치료 기간, 총 청구액 등 핵심 정보를 의미 단위로 자동 매핑했다. 결과적으로 도입 3개월 만에 평균 심사 시간이 건당 4.7분 단축됐다. 부실 청구 탐지율은 2.3배 향상됐다. 실질적인 VLM 구현을 위해선 세 가지 핵심 과제가 수반된다. 첫째는 중앙처리장치(GPU) 비용이다. 이미지 해상도가 높을수록 메모리 요구량은 기하급수적으로 증가한다. 둘째는 데이터 보안이다. 문서 이미지에는 신분증과 도장, 주소 등 민감한 개인정보가 포함된다. 저장 암호화와 접근 제어 등 보안 설계가 모델 설계 초기부터 명확히 반영돼야 한다. 마지막으로 운영 측면에서의 ML옵스 통합이다. VLM은 텍스트와 이미지 양쪽에서 오류가 누적될 수 있으므로, 라벨 재검수·재학습 주기를 기존보다 촘촘하게 설정해 지속적 품질을 수행해야 한다. 이런 기술 과제를 극복할 수 있다면 VLM은 단순 OCR을 넘어 멀티모달 로봇프로세스자동화(RPA)로 진화할 수 있다. VLM이 문서 의미를 이해하게 되면 수준 높은 복합 워크플로까지 자동화할 수 있을 것이다. 실제 모바일 스캐너나 드론 카메라처럼 네트워크 지연이 큰 현장에서는 경량화된 VLM을 엣지 디바이스에서 구동하는 방향으로 연구가 진행되고 있으며, 실제 적용 사례도 점차 증가하고 있다. 유럽연합(EU)의 AI법 등 주요 규제는 이미지 데이터의 편향성과 프라이버시를 명확히 규정하기 시작했다. 이로 인해 향후 VLM 개발자는 학습 데이터셋의 출처와 라벨링 과정을 투명하게 기록해야 하는 책임도 함께 지게 될 전망이다. 기업과 공공기관이 다양한 형식의 데이터를 한 눈에 이해하는 AI를 원한다면 VLM OCR 전략을 로드맵에 포함해야 한다. 문서 인식부터 업무 자동화까지 이어지는 다음 혁신의 축은 '텍스트‑이미지 융합형 AI'가 될 가능성이 크다. 현재 기술 기업들의 도전이 이 변화를 앞당기고 있으며, 실제 도입 성공 사례는 더 빠르게 쌓일 것이다. 텍스트 AI만으로 충분하다고 느끼는 지금 이 순간이, 어쩌면 VLM 전환을 준비할 마지막 골든타임일지 모른다.

2025.04.30 15:54김지현

AI로 해양생물 지킨다…포스코DX, 국립공원공단과 '생태 모니터링' 협력

포스코그룹이 국립공원공단과 협력해 인공지능(AI) 기술을 적용한 해양생물 보전 활동에 나선다. 포스코DX는 국립공원공단·포스코스틸리온과 해양생물 찻길 사고 예방을 위한 ESG 업무협약(MOU)을 체결했다고 29일 밝혔다. 포스코DX 판교사무소에서 진행된 이번 협약식에는 심민석 포스코DX 사장, 주대영 국립공원공단 이사장, 포스코스틸리온 윤석철 컬러마케팅실장을 비롯한 관계자들이 참석했다. 이번 협약을 통해 포스코DX는 자사의 AI 기술을 적용한 '해양생물 모니터링 시스템'을 개발하고 경남 남해와 사천 일대의 한려해상국립공원 지역에 시스템 구축을 추진한다. 해당 지역은 육지에서 서식하는 게류와 토종 고래인 상괭이 등 해양 보호종으로 지정된 생물들이 살고 있다. 이번 시스템 적용을 통해 스마트 CCTV로 이들의 출현을 모니터링할 수 있게 됐다. 또 비전 AI로 영상을 판독·분석해 개체수와 출몰 패턴 등을 지속 관찰함으로써 해양 보호종 보전과 관리도 지원할 예정이다. 포스코스틸리온은 프리미엄 잉크젯프린트 강판인 포스아트(PosART)를 활용해 해양 생물이 해안 도로에 접근하지 못하도록 차단하는 펜스와 운전자 주의 표지판을 설치할 예정이다. 국립공원공단은 시스템 설치와 관련해 실무협의회를 운영하는 등 행정·기술적 지원을 총괄할 계획이다. 이번 프로젝트는 포스코그룹의 다양한 역량을 결집해 환경·사회 문제를 공동으로 해결하는 그룹 차원의 사회공헌활동이다 '세포시(세상을 바꾸는 포스코그룹 시너지공헌활동)'와 '포스코1%나눔재단'의 기금을 활용해 추진될 예정이다. 심민석 포스코DX 사장은 "생물다양성을 보전하고 생태계의 균형을 유지하는 데 포스코DX의 AI 기술이 활용돼 뜻깊게 생각한다"며 "시스템이 실질적인 효과를 내 더욱 의미 있게 쓰여질 수 있도록 지속적으로 고도화해 나가겠다"고 밝혔다.

2025.04.29 16:06한정호

표준협회, "AI 기반 혁신과 책임 실천으로 신뢰받는 동반자 될 것”

한국표준협회(회장 문동민)는 2025년부터 2027년까지 향후 3개년을 아우르는 제6차 중기전략을 수립하고 새로운 비전을 발표했다고 28일 밝혔다. 표준협회는 급변하는 기술 환경과 사회적 변화에 능동적으로 대응하고 협회의 지속가능한 성장을 위한 전략적 방향을 제시하기 위해 중기전략을 마련했다. 중기전략은 기술혁신과 사회구조의 급격한 변화 속에서 협회가 지속가능한 성장의 이정표를 주도적으로 그려가겠다는 전략적 선언이다. 표준협회 관계자는 “협회는 3년 주기로 외부 환경·정책 변화·내부 구성원의 목소리를 체계적으로 반영해 중기전략을 재정비해 왔다”며 “이번 전략 역시 정통성과 미래지향성을 동시에 담아냈다”고 전했다. 표준협회는 지난 제5차 전략으로 'DX와 ESG를 선도하는 지식서비스 기관'이라는 비전을 세워 표준·인증·품질·서비스 영역을 디지털 및 ESG로 확장·고도화하는 데 주력했다. 표준협회는 새로운 비전으로 “사회와 고객의 지속가능한 미래를 선도하는 지식서비스 파트너”를 선언하고 ▲미래 표준화 선도 및 산업 품질경쟁력 제고 ▲사회 변화 기여와 지속가능한 가치 선도 ▲AI 기반 고객가치 창출과 과감한 도전 ▲전략적 디지털 전환과 업무혁신 ▲미래 인재 육성과 핵심역량 강화 ▲열린 소통과 협업문화 정착에 역량을 결집해 나갈 계획이다. 표준협회는 특히 AI·첨단로봇·반도체·모빌리티 등 국가경쟁력 강화를 위한 미래 기술 분야 산업 표준화와 품질경영에 집중할 계획이다. 더불어 탄소중립·보호무역주의 강화·인구구조 변화 등 복합적 사회적 이슈에도 발 빠르게 대응해 고객에게 실질적인 가치를 제공할 방침이다. 혁신적 사고와 기술 활용을 통해 고객 기대를 넘어서는 새로운 니즈와 가치를 발굴해 AI 기반 융합형·맞춤형 서비스로 구현함으로써 미래형 지식서비스를 구현해 나간다는 계획이다. 내부 혁신에도 지속해서 힘을 쏟을 계획이다. 디지털 전환과 창의적인 문제해결 역량을 강화함으로써 전략 실행의 기반을 탄탄히 하고 조직의 역량을 한층 더 높여 나갈 방침이다. 문동민 표준협회 회장은 “표준협회는 앞으로도 국가 산업의 경쟁력 제고와 지속가능한 사회 구현을 위해 책임 있는 역할을 다하며 시대의 변화에 능동적으로 대응해 나갈 것”이라며 “변화를 따라가는 조직이 아닌, 변화를 준비하고 고객과 함께 미래를 함께 설계하는 신뢰할 수 있는 파트너로서 역할을 다하기 위해 지속적인 혁신과 책임 있는 실천을 이어갈 것”이라고 밝혔다.

2025.04.28 10:31주문정

아마존도 공식 파트너로 인정한 '이 기업'…"IP 위조 대응, 이만한 기술 없다"

마크비전이 글로벌 소프트웨어 플랫폼의 인정을 받았다. 사용자 경험을 중심으로 구성된 기술과 서비스 신뢰도를 바탕으로 글로벌 서비스형 소프트웨어(SaaS) 역량을 증명했기 때문이다. 마크비전은 '2025 G2 베스트 소프트웨어 어워즈'에서 브랜드 보호, 이커머스 솔루션, 사용자 만족도 등 세 개 부문에서 상위 4% 소프트웨어로 선정됐다고 23일 밝혔다. 'G2'는 9천만 명 이상이 사용하는 세계 최대 B2B 소프트웨어 리뷰 플랫폼으로, 295만 건 이상의 실제 사용자 리뷰를 기반으로 분기별 평가를 진행한다. 특히 이 회사는 브랜드 보호 부문에서 위조상품 탐지 정확도, 자동화된 제재 프로세스, 다양한 플랫폼 적용 사례 등을 통해 기술적 완성도를 인정받았다. 이커머스 솔루션 부문에서는 사칭 계정 대응력과 위조상품 제거 성과 등 온라인 리스크에 대한 민첩한 대응이 높은 평가를 받았다. 사용자 만족도 부문에서는 직관적인 인터페이스, 기능 개선 노력, 안정적 운영 등을 통해 전체적인 고객 경험이 우수하다는 리뷰가 주를 이뤘다. 'G2'는 이러한 요소들을 종합적으로 고려해 그 중 상위 4%에만 '리더' 또는 '고성과' 배지를 수여한다. 업계는 이번 수상으로 마크비전이 글로벌 시장에서 기술력뿐 아니라 고객 신뢰도까지 동시에 확보하고 있고 평가한다. 실제로 이 회사는 최근 아마존의 지적재산권(IP) 침해 대응 프로그램인 '에이펙스(APEX)'의 공식 파트너사로도 선정되며 글로벌 브랜드 보호 체계에 깊이 관여하고 있다. 실제로 아마존은 매년 1조3천억원 이상을 브랜드 보호 프로그램에 투자하고 있으며 '2025 브랜드 보호 보고서'에서 마크비전을 IP 보호 부문 유일의 공식 파트너사로 소개했다. 이인섭 마크비전 대표는 "'G2 어워즈'는 사용자 기반으로 글로벌 SaaS 제품의 경쟁력을 객관적으로 평가하는 지표"라며 "기업 고객들이 IP를 안전하게 보호할 수 있도록 기술 고도화와 제품 역량 강화에 힘쓸 것"이라고 밝혔다.

2025.04.23 17:27조이환

코오롱베니트, 리벨리온 손 잡고 'AI 비즈니스 생태계' 확장 본격화

코오롱베니트가 자체 개발한 안전 관제 시스템 '인공지능(AI) 비전 인텔리전스'로 AI 비즈니스 생태계 확장에 본격 나섰다. 국내 AI 반도체(NPU) 전문 기업 리벨리온과의 협업을 통해 건설 현장에 특화한 LLM(거대 언어 모델, Large Language Model) 기술을 고도화함으로써 코오롱글로벌 실제 건설 현장에 'AI 비전 인텔리전스'를 적용한 것이다. 코오롱베니트는 'AI 비전 인텔리전스' 고도화를 위한 최종 개념검증(PoC) 작업을 코오롱베니트·코오롱글로벌·리벨리온·위시 4사가 컨소시엄 형태로 진행했다고 21일 밝혔다. 코오롱베니트는 건설 환경에 최적화된 안전 관제 시스템을 만들기 위해 방대한 코오롱글로벌 건설 현장 데이터를 정제해 멀티(시각+언어) 구조의 AI 모델을 완성했다. 이 작업은 코오롱글로벌이 제공한 CCTV 영상과 건설 현장 운영 데이터 기반의 현장 맞춤형 기능 요구사항 수립과 시스템 점검을 바탕으로 이뤄졌다. 리벨리온은 자체 AI 반도체 아톰(ATOM)으로 NPU(Neural Processing Unit, 신경망처리장치) 기반의 CCTV 관제 서버 및 기술을 구성했다. 위시는 시각(Vision)과 언어(LLM) 정보를 동시에 출력하는 현장 CCTV 안전 관제 모니터링 솔루션을 제공했다. 이번 'AI 비전 인텔리전스' 프로젝트는 국내 AI 선도 기업과의 협력을 통해 기술력을 대폭 높인 점이 특별하다. 코오롱베니트는 국내 대표 AI 반도체 기업 리벨리온과 함께 GPU·NPU를 동시 활용하는 이종 반도체 기반 AI CCTV 안전 관제 시스템을 완성했다. 코오롱베니트 AI 솔루션센터의 GPU(Graphic Processing Unit, 그래픽처리장치)로 실제 현장의 데이터를 학습한 뒤 이를 리벨리온 AI 반도체가 적용된 NPU 서버로 배포해 추론력을 더 강화하는 방식이다. 이로 인해 현장에서 탐지된 위험 상황 설명이 훨씬 더 구체적이고 정교화됐다. 'AI 비전 인텔리전스'는 건설 현장의 ▲안전모 미착용 ▲위험구역 진입 ▲신호수 배치유무 ▲중장비 접근 등의 사고 예방율을 크게 높일 것으로 전망된다. 코오롱베니트가 개발한 건설 현장에서 탐지된 시각적인 위험 정보를 더 정교화된 언어적 알림 문구로 바꾸는 멀티 모델의 효과다. 이 모델은 기존 대비 처리 속도가 높은 고성능 라이브러리 vLLM(Versatile Large Language Model)을 사용해 LLM 추론 성능을 극대화했다. 코오롱베니트는 독자 개발 안전 관제 시스템 'AI 비전 인텔리전스'를 사업화해 AI 활용을 대중화하는 'AI 엑셀러레이션 서비스' 사업 성장 계기를 마련할 계획이다. 코오롱베니트 AI R&D(연구개발) 부문은 텍스트·이미지·음성 등을 동시 처리하는 '멀티모달 AI 서비스' 출시를 목표로 다양한 산업에 특화한 AI 기술을 개발하고 있다. 코오롱베니트에서 AI 관련 기술 개발을 담당하는 이승재 AI R&D팀장은 "우리는 고객의 사업 효율과 편의성을 극대화하는 AI 기술을 대중화하고 기업의 비즈니스 혁신성을 높이는 신사업 분야를 개척하고 있다"며 "우수한 기술력을 가진 국내 선도 기업들과 기술력을 연계해 AI 비즈니스 생태계를 확장해 나가겠다"고 밝혔다.

2025.04.21 11:19장유미

[르포] AI·자동화로 인력·수율·리드타임 해결...LG이노텍 '드림 팩토리'

LG이노텍의 FC-BGA(플립칩 볼그리드 어레이) 생산 허브인 대구 구미에 위치한 '드림 팩토리(Dream Factory)'. 지난 17일 언론에 첫 공개된 드림 팩토리 내부는 여느 공장들에 비해 인력이 적은 여유로운 분위기였다. 자재 운반부터 검사 등, 공정 전반이 AI와 자동화 설비로 이뤄지고 있기 때문이다. 실제로 드림 팩토리는 기존 공장 대비 인력을 50% 절감해 운영하고 있다. 이는 비용 효율성만이 아니라 제품의 생산성을 향상시키는 요소로도 작용한다. 드림 팩토리의 경우 초기 수율 향상에 필요한 기간을 절반이나 줄였으며, 제품의 리드타임(주문부터 납품까지 걸리는 시간) 또한 최대 90% 단축했다. 드림 팩토리에서 만난 강민석 기판소재사업부 부사장은 "FC-BGA는 다른 기판들과 달리 평균 수율이 낮은 제품"이라며 "드림 팩토리를 통해 수율을 끌어올린 것이 LG이노텍의 차별화 포인트"라고 설명했다. LG이노텍이 FC-BGA 사업에 진출한 시기는 지난 2022년이다. 당시 LG전자로부터 구미4공장을 인수해 공장을 구축했으며, 지난해 2월부터 본격적인 양산에 들어갔다. FC-BGA는 반도체 칩과 기판을 '플립칩 범프(칩을 뒤집는 방식)'로 연결하는 패키지기판이다. 기존 패키지에 주로 쓰이던 와이어 본딩 대비 전기적·열적 특성이 높다는 장점이 있다. 총 2만6천㎡ 규모로 조성된 드림 팩토리는 업계 최고 수준의 스마트 팩토리로 평가 받는다. 전 공정을 자동화∙정보화∙지능화해, 작업자와 실패 비용, 사후보전 손실, 안전사고 등 생산 경쟁력을 떨어트리는 주 요소들을 방지했다. 로봇이 자재 운반·필름 제거도 '척척'…인력 50% 절감 FC-BGA 메인 공정 설비가 구축된 생산라인에 들어가기 위해서는 두 겹의 장갑, 마스크, 방진복 등을 필수로 착용해야 한다. 눈썹, 침과 같은 미세한 이물질도 품질 불량으로 이어질 수 있기 때문이다. 이러한 깐깐한 사전준비를 거쳐 클린룸을 통과하면, 축구장보다 3배 큰 드림 팩토리가 마침내 모습을 드러낸다. 드림 팩토리 초입에는 공장 전체를 실시간으로 살펴볼 수 있는 라인 모니터링 시스템(LMS)이 설치돼 있다. 디지털 트윈 기술을 기반으로, 현재 가동 중인 생산라인과 제품 이동, 재고 상황, 설비 이상유무 등을 모두 관리한다. LMS실을 벗어난 뒤, 분주하게 돌아가는 설비들 사이로 자동로봇(AMR) 수십대가 자재를 운반하는 모습을 볼 수 있었다. 이 AMR은 원자재를 공정설비로 운반하는 일부터 가공이 끝난 제품을 다시 적재하는 등 다양한 역할을 수행한다. 패널에 붙어 있는 보호 필름을 벗겨내는 공정도 사람이 아닌 로봇의 몫이다. 이처럼 전 공정에 협동로봇과 같은 자동화 설비를 구축하면서, 드림 팩토리는 기존 대비 50% 수준의 인원으로도 운영이 가능해졌다. 실제로 공장 내부에서는 사람을 마주치는 일이 드물었다. LG이노텍은 향후 해당 공장을 무인화 수준으로 운영하는 것을 목표로 하고 있다. AI·자동화로 수율·리드타임 동시에 잡는다 LG이노텍은 제품의 양품 여부를 결정짓는 가장 중요한 단계인 AOI(자동광학검사) 과정에 AI 딥러닝 비전 검사 시스템을 적용했다. 생산이 완료된 FC-BGA 기판 제품을 로봇이 쉴 새 없이 비전 스크리닝 검사대로 옮기면, FC-BGA 불량품 및 양품 데이터 수만 건을 학습한 AI가 육안으로는 잡아내기 어려웠던 미세 불량영역을 단 30초 안에 센싱해 낸다. 제품의 램프업(양산 초기에 수율 향상을 통한 생산능력 확대) 속도도 '팩토리 시뮬레이션'을 통해 기존 대비 절반이나 줄였다. 해당 기술은 설비를 구축하기 전 가상 공간에서 3D 모델링을 활용해 최적의 환경을 조성해준다. 강민석 기판소재사업부 부사장은 "사람이 제품에 손을 대지만 않아도 이론적으로 훨씬 더 높은 수율이 나올 수 있다"며 "FC-BGA의 경우 수율이 평균적으로는 90%, 고난이도 제품은 50%까지 떨어질 수 있는데, LG이노텍의 드림 팩토리를 통한 수율 향상이 큰 차별화 포인트가 될 것"이라고 강조했다. 또한 드림 팩토리에서는 FC-BGA 생산과 관련해 하루에 20만개 이상의 파일, 100GB에 달하는 데이터가 지속적으로 생성된다. LG이노텍은 이 빅데이터를 지속 학습하는 AI를 불량 예측 및 검사 시스템에 적용해, 불량 발생으로 인한 리드타임(주문부터 납품까지 걸리는 시간)을 대폭 줄였다. 나아가 LG이노텍은 2026년까지 생산 과정 중 발생하는 품질 이상을 실시간으로 감지 및 분석해, 자동으로 보정하는 공정 지능화 시스템(i-QMS, intelligent-Quality Management system)을 도입할 방침이다. LG이노텍 관계자는 "AI 비전검사를 통해 리드타임을 최대 90% 단축하고, 샘플링 검사를 위해 투입하던 인원도 90% 줄일 수 있었다"고 설명했다.

2025.04.20 10:00장경윤

GIST '큐버', AI 비전 인식률 4.7% 개선…"오탐지 물체 삭제 기능"

…국내 연구진이 AI비전 인식률을 기존 대비 4.7%개선할 수 있는 기술을 개발했다. 광주과학기술원(GIST, 총장 임기철)은 AI융합학과 이규빈 교수 연구팀이 오류 추정을 통해 미학습 물체의 인식 결과를 정제하는 AI모델, '큐버'(QuBER)를 개발했다고 14일 밝혔다. '큐버'는 실시간으로 학습 데이터에 포함되지 않은, 오탐지된 물체를 삭제하거나 추가하는 기능을 갖췄다. 현재 널리 사용되는 AI 비전 기술에는 몇 가지 한계가 있다. 2018년 공개된 마스크 R-CNN 모델은 사전에 학습된 물체만 인식할 수 있다. 2023년 나온 '세그멘트 애니싱' 모델은 임의 탐지는 가능하지만, 복잡한 환경에서 정확도가 크게 떨어진다. 이 같은 단점을 보완한 모델이 GIST '큐버'다. 기존대비 인식률이 4.7%가량 개선됐다. '큐버'는 RGB-D(컬러+깊이) 이미지와 초기 예측 데이터를 활용해 '4자 경계 오류'를 분석, 물체 인식의 정확도를 높이는 것이 특징이다. 이 기술을 통해 처음 보는 미학습 물체도 실시간 빠르고 정확하게 인식할 수 있다. '4자 경계 오류'는 AI의 초기 예측값과 실제 데이터 간 차이를 올바르게 검출된 경계 검출해야 했지만 놓친 경계 잘못 검출한 경계 검출하지 않아야 할 부분을 정확히 비검출한 경계 등을 말한다. 연구팀은 ▲실내 환경(OCID)에서 88.4%의 인식률 ▲테이블 위 물체들(OSD)에서 83.3%의 정확도 ▲상자 안의 복잡한 물체들(WISDOM)에서 77.5%의 정확도를 보였다고 설명했다. 이규빈 교수는 “로봇이 처음 보는 물체도 정확하고 효율적으로 인식할 수 있다는 가능성을 확인했다”며, “이 기술이 다양한 로봇 작업에 적용돼 새로운 환경에서도 안정적으로 동작하는 로봇 개발에 큰 역할을 할 것”이라고 기대감을 나타냈다. 연구는 산업통상자원부와 과학기술정보통신부 지원을 받았다. 백승혁 박사가 박사과정 재학 중 수행했다. 연구결과는 오는 5월 열리는 로봇 분야 국제 학회인 IEEE 국제 로봇 자동화 학술대회(ICRA)에서 발표한다.

2025.04.14 13:48박희범

이재명 "AI 투자 100조원 시대 열겠다"

이재명 전 더불어민주당 대표가 14일 “AI 투자 100조원 시대를 열겠다”고 밝혔다. 민주당 대선 후보 경선에 나선 이 전 대표는 “정부가 민간 투자 마중물이 되어 AI 관련 예산이 선진국을 넘어서는 수준까지 증액하고자 한다”면서 이같이 말했다. 이 전 대표는 “대통령 직속 기구 '국가인공지능위원회'를 내실 있게 강화해 본격적 K-AI 시대를 다지겠다”며 “기술자, 연구자, 투자기업과 정부의 협력을 대통령인 위원장이 직접 살피는 명실상부한 중심 기구로 재편하겠다”고 강조했다. 이어, “국가 AI 데이터 집적 클러스터를 조성해 글로벌 AI 허브의 기반을 만들겠다”며 “AI 핵심 자산인 GPU를 최소 5만 개 이상 확보하고 AI 전용 NPU 개발과 실증을 적극 지원해 기술 주권을 확보하겠다”고 했다. 이 전 대표는 이날 퓨리오사AI를 찾아 간담회를 열어 국내 AI 반도체 업계의 의견을 청취할 예정이다. 글로벌 협력도 제시했다. AI 초성장 사회로 도약을 위해 글로벌 협력 체계를 갖춰야 하기 때문에 '글로벌 AI 이니셔티브'를 확보하겠다는 전략이다. 이 전 대표는 “글로벌 AI 공동투자기금을 조성하고 협력국 간 공용으로 사용가능한 기술을 개발하겠다”며 “이를 기반으로 태평양, 인도, 중동 국가까지 협력이 확대되어 다국적 데이터 활용이 가능해진다면 디지털 인구가 10억 명까지 늘어날 수 있다”고 설명했다. AI 인재 양성을 위해 STEM(Science, Tecnology, Engineering, Mathematics) 교육을 강화한다는 방침이다. 이 전 대표는 “AI의 성패는 결국 인공지능(AI)을 설계하고 학습시키는 사람의 역량에 달려 있다”며 “지역별 거점대학에 AI 단과대학을 설립하고 석박사급 전문 인재를 더 양성하겠다. AI 분야 우수 인재의 병역특례를 확대하겠다”고 밝혔다. AI 규제 합리화에 대해서는 “우리 기업이 기술을 개발하고 제대로 투자받기도 전에 불합리한 AI 규제로 위축된 바는 없는지 면밀히 점검해야 한다”며 “AI 산업 생태계 조성 관련법을 정비하고특허법, 출입국관리법 등 규제 특례가 적용될 AI 특구도 과감하게 확대해 가겠다”고 말했다. 이 전 대표는 또 “국민 모두가 선진국 수준의 AI를 무료로 활용할 수 있게 '모두의 AI' 프로젝트를 추진하겠다”며 “이른바 '한국형 챗-GPT'를 전 국민이 사용하게 된다면 순식간에 수많은 데이터를 쌓을 수 있다”고 강조했다. 그러면서 “다른 산업과의 융합으로 생산성 혁신으로, 때로는 신산업 창출로 이어져 결국 국가 경쟁력을 강화할 것”이라며 “국가가 '모두의 AI'에 투자해야 하는 이유다”고 덧붙였다. 이 전 대표는 끝으로 “무엇보다 더 이상 사람의 생명을 담보로 성장하지 않아도 되는 AI를 통한 '안전 사회'를 실현할 수 있다”며 “AI로 금융, 건강, 식량, 재난 리스크를 분석해 국민의 삶을 지키는 'AI 기본사회'를 만들겠다”고 했다.

2025.04.14 09:31박수형

마크비전, '마크AI' 대규모 업데이트…브랜드 생태계 파괴하는 '무단판매' 잡는다

마크비전이 브랜드 가격정책을 훼손하는 무분별한 온라인 할인판매를 막기 위해 가격 모니터링 기능을 전면 강화한다. 마크비전은 인공지능(AI) 기반 지적재산권(IP) 솔루션 '마크AI' 가격 모니터링 서비스에 대규모 업데이트를 단행했다고 9일 밝혔다. 이번 개편을 통해 국내 최대 이커머스 플랫폼에서의 적정 판매가 유지 현황 파악, 무단판매 제재를 통한 손실 절감 수치화 등이 가능해졌다. 최근 온라인 유통 채널이 급증하고 개인 판매자 진입 장벽이 낮아지며 브랜드와 무관한 판매자의 무단판매가 빠르게 확산하고 있다. 공식 유통망을 거치지 않은 상품은 원산지나 유통 경로 확인이 어려운 데다 플랫폼 내 노출 경쟁을 위해 지나치게 낮은 가격에 거래되는 경우가 많다. 이로 인해 정식 계약을 맺은 판매자들은 가격 경쟁에서 밀리고 브랜드는 적정 가격정책을 유지하지 못한 채 매출 손실을 떠안는 상황이 반복돼 왔다. 마크비전은 이러한 흐름을 막기 위해 지난 해 5월부터 비공식 판매자의 가격 변동, 거래 점유율 등을 분석하는 모니터링 기능을 제공해 왔다. 특히 이번 업데이트를 통해 마크비전은 ▲국내 최대 이커머스 내 상품별 평균 가격의 적정가 대비 수준 확인 ▲의심 판매자 자동 신고 및 제재 ▲무단판매 제재 효과 수치화 등의 기능을 새롭게 도입했다. 최저가 매칭 정책으로 인해 가격이 연쇄적으로 하락하는 다른 마켓플레이스의 사례도 함께 포착해 전체 유통 채널의 연동적 문제를 관리할 수 있도록 했다. 해당 이커머스는 연간 거래액이 55조원에 달하며 경쟁 쇼핑몰보다 낮은 가격을 자동 반영하는 시스템을 운영하고 있어 브랜드의 자율적인 가격정책이 사실상 무력화되는 구조다. 마크비전은 이러한 시스템의 허점을 악용하는 무단판매자를 체계적으로 걸러내고, 제재를 통해 발생한 경제적 효과까지 브랜드에 제공하는 것을 목표로 한다. 이미 롯데칠성, 한길통상, 브랜드501 등 다수의 기업들이 마크비전의 가격 모니터링을 도입해 활용해 왔다. 특히 이번 개편으로 생필품, 식음료 등 가격 민감도가 높은 업종의 브랜드들이 더욱 실효성 있는 가격 관리를 할 수 있을 것으로 기대된다. 이인섭 마크비전 대표는 "많은 기업이 오랜 시간 공들여 쌓은 브랜드 가치와 신뢰를 지킬 수 있도록 이번 기능을 강화했다"며 "향후 브랜드와 소비자 모두가 만족할 수 있는 공정한 이커머스 생태계를 구축하는 데 최선을 다할 것"이라고 밝혔다.

2025.04.09 17:18조이환

LG이노텍, 인텔 AI 비전 검사 도입…스마트팩토리 구축 가속화

LG이노텍이 글로벌 반도체 기업인 인텔과 협력해 AI(인공지능)를 활용한 스마트 팩토리 구축에 속도를 낸다. LG이노텍은 인텔과 AI 비전(Vision) 검사 분야 협력을 위한 양해각서(MOU)를 체결했다고 8일 밝혔다. 비전 검사란 생산 공정에서 제품 등의 외관을 살펴 이상 여부를 확인하는 과정이다. 기존에 사람이 하던 것을 카메라 등으로 대체하고 있으며, 최근에는 AI를 적용해 고도화하는 추세다. 특히 제조업에서 제품 불량률을 낮추기 위해 다양한 생산 공정에 활발히 적용되고 있다. 이번 협력으로 LG이노텍은 i-GPU(그래픽처리장치) 기반 인텔 AI 비전 검사 솔루션을 전 생산 공정에 적용할 계획이다. i-GPU는 CPU(중앙처리장치)에 내장된 GPU다. 고가의 외장 GPU나 추가적인 PC 설치 없이도, AI 기능을 손쉽게 구현할 수 있다. LG이노텍은 인텔 AI 솔루션을 활용한 AI 학습 모델을 개발해 비전 검사의 판정 정확도를 100% 가까이 높일 수 있을 것으로 기대하고 있다. 또한 AI 학습에 소요되는 시간도 최대 1.5배가량 빨라질 수 있을 것으로 보고 있다. LG이노텍은 지난해 모바일 카메라 모듈 생산라인에 인텔 AI 비전 검사 솔루션을 처음 적용했다. 올해는 FC-BGA(플립칩 볼그리드 어레이) 생산 거점인 구미 4공장 등 타 생산라인에도 단계적으로 확대할 계획이다. LG이노텍은 스마트 팩토리 구축을 통해 원가 경쟁력 제고에 속도를 낸다는 방침이다. 양사는 향후 생산 공정 지능화 및 고도화를 위한 협력을 강화해 나갈 예정이다. 이상석 LG이노텍 생산혁신센터장은 “인텔과의 협력으로 스마트 팩토리 구축에 한층 속도를 낼 수 있게 됐다”며 “앞으로도 인텔과 파트너십을 강화해 나가며, 생산 혁신을 통한 차별적 고객가치를 지속 창출해 나갈 것”이라고 밝혔다. 김현준 인텔코리아 한국영업본부 총괄은 “인텔은 최첨단 비전 검사 AI 솔루션을 앞세워 제조산업의 디지털 혁신을 이끌어 가고 있다”며 “앞으로도 LG이노텍의 품질∙원가 경쟁력을 제고할 수 있는 다양한 협력을 모색해 나갈 것”이라고 말했다.

2025.04.08 08:56장경윤

트웰브랩스, 아마존 '베드록' 입성…韓 최초로 영상 AI 모델 공급

트웰브랩스가 아마존의 대표 인공지능(AI) 플랫폼에 입성한다. 세계 주요 파운데이션 모델 기업들과 어깨를 나란히 하며 글로벌 영상 AI 시장 주도권 확보에 나서는 모양새다. 트웰브랩스는 아마존웹서비스(AWS)의 완전 관리형 AI 서비스 '아마존 베드록'에 자사 멀티모달 AI 모델인 '마렝고'와 '페가수스'를 제공하기로 했다고 7일 밝혔다. 국내 기반 영상 AI 모델이 '베드록'에 들어가는 것은 이번이 처음이다. 아마존 '베드록'은 메타, 앤트로픽, 미스트랄AI, 스태빌리티AI 등 세계 유수의 AI기업 모델을 단일 애플리케이션 프로그램 인터페이스(API)로 제공하는 플랫폼이다. 아마존 내부 모델인 '노바'를 제외하면 트웰브랩스는 베드록 내 유일한 영상이해 AI 제공사로 자리하게 됐다. 트웰브랩스의 영상 모델들은 객체, 행동, 배경음 등 영상 내 요소를 자연어로 검색하고 해석할 수 있다. 이를 통해 영상 콘텐츠의 검색, 분류, 요약, 인사이트 추출 등 전 과정을 자동화할 수 있는 것이 특징이다. 이에 고객은 '베드록'에서 인프라 관리 없이 트웰브랩스 모델을 활용해 생성형 AI 기반 영상 서비스를 구축할 수 있게 된다. 모델이 작은 영상 클립부터 대규모 콘텐츠 라이브러리까지 일관된 분석 성능을 제공하고 기업 수준의 보안 및 데이터 통제 기능도 갖췄기 때문이다. 업계 일각에서는 이번 협력이 스포츠, 미디어, 엔터테인먼트, 광고 등 영상 중심 산업 전반에 파급력을 미칠 것으로 전망한다. 방송사와 스튜디오는 촬영분 아카이빙을 자동화할 수 있고 스포츠 팀은 하이라이트를 자동 생성해 팬 맞춤형 콘텐츠를 제작할 수 있게 된다. 트웰브랩스는 AWS와의 전략적 협업 계약(SCA)을 바탕으로 아마존 '세이지메이커 하이퍼팟'도 활용 중이다. 이를 통해 모델 학습 속도는 최대 10% 빨라졌고 비용은 15% 이상 절감한 것으로 알려졌다. 글로벌 진출도 본격화하고 있다. 회사는 AWS 액티베이트 프로그램의 지원을 통해 해외 확장을 준비 중이며 AWS 마켓플레이스를 통해 전 세계 고객에게 자사 서비스를 제공할 계획이다. 사미라 파나 바크티아르 AWS 미디어·엔터테인먼트 총괄은 "트웰브랩스 모델 도입으로 영상 데이터의 활용이 쉬워졌다"며 "기업들이 인프라 없이도 AI 기술을 확장 가능하게 됐다"고 밝혔다. 이재성 트웰브랩스 대표는 "세계 영상 데이터의 80%가 사실상 미활용 상태"라며 "이번 베드록 공급은 우리 기술력이 세계 최고 수준임을 입증한 결과"라고 말했다.

2025.04.07 15:30조이환

삼성전자, AI TV로 프리미엄 시장 뚫는다…"OLED 1등 할 것"

삼성전자가 올해 프리미엄 TV 시장에 대한 자신감을 드러냈다. 최신형 제품에서 AI 기능 적용 모델을 확대하는 한편, OLED TV의 출하량 확대로 새로운 시장 영역을 더욱 넓혀나갈 계획이다. 최근 IT 업계의 불확실성을 높이고 있는 미국 관세 정책도 유연한 공급망 전략으로 대응해 나간다는 전략이다. 삼성전자는 7일 서울 서초구에 위치한 삼성 강남에서 신제품 출시 행사 '언박스 & 디스커버(Unbox & Discover) 2025'를 진행했다. 이날 삼성전자는 올해 2025년형 TV 신제품을 공개하고, '홈 인사이트' 등 사용자 경험을 높이는 신규 AI 기능들을 대거 소개했다. 홈 인사이트 기능은 사용자의 생활 패턴과 기기 사용 이력, 실내 환경 등을 고려해 '실내 온도가 높으면 에어컨 켜기', '공기 질이 나쁘면 공기청정기 작동' 등 필요한 행동을 추천한다. 올해 AI TV 라인업도 기존 Neo QLED와 OLED에서 QLED와 더 프레임까지 확대하기로 했다. 이에 따라 삼성전자의 AI TV는 작년 9개 시리즈 34개 모델에서 올해 QLED와 더 프레임을 포함해 14개 시리즈 61개로 크게 늘어났다. 특히 OLED는 SF90 시리즈에 42형부터 83형까지 라인업을 구축했다. 3개 시리즈의 14개 모델을 선보여, OLED를 선호하는 소비자에게 더욱 다양한 선택지를 제공한다. 용석우 삼성전자 영상디스플레이사업부 사업부장은 "삼성전자가 OLED TV 시장에 진출한 지 3년차인데, 출하량은 지난해 140만대 정도에서 올해는 이보다 많은 수량으로 넓혀나갈 것"이라며 "거시 경제의 불확실성 속에서도 프리미엄 TV 시장이 성장하고 있는 만큼, 이 부분을 지속 공략할 계획"이라고 설명했다. 최근 불거진 트럼프 미국 행정부의 관세 정책에 대해서도 영향력을 최소화한다는 방침이다. 용 사장은 "거의 대부분의 TV를 멕시코에서 생사하고 있어 경쟁사 대비 관세의 영향은 적을 것"이라며 "당사는 전 세계에 약 10개 생산거점을 두고 있어, 관세에 따라 조정을 통해 파고를 넘어가도록 할 것"이라고 말했다. 이어 "77인치 이상 OLED TV 부문에서는 당사의 국내 점유율이 60% 정도 된다"며 "초대형과 프미리엄 시장에서 1등을 하겠다는 기조를 지속 유지할 것"이라고 강조했다.

2025.04.07 11:16장경윤

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

25% 요금할인 받고...단통법 제한받던 매장 보조금도 받는다

"오징어야 문어야?"…촉수 흔드는 AI 로봇 나왔다

[리뷰] "사무실에서도 OK" 저소음 유무선 기계식 키보드

英, 지루해서 못쓰게 된다는 '어린이 아이폰' 내놨다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.