• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'생성'통합검색 결과 입니다. (887건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[현장] "안경에 담긴 AI, 일상 혁신 기대"…시어스랩, 'AI눈' 공개

"일상에서 누구나 인공지능(AI)을 손쉽게 경험할 수 있는 시대가 열리고 있습니다. 이제 여러분이 쓰고 있는 안경에 AI를 담아 여행부터 요리와 운동까지 매 순간 필요한 정보를 실시간으로 제공하는 '동반자' 디바이스를 선보이고자 합니다." 정진욱 시어스랩 대표는 12일 서울 강남구 씨스퀘어 공연장에서 열린 'AI눈(AInoon)' 발표회에서 이같이 말했다. 시어스랩은 자체 개발한 AI 기반 스마트 글래스 'AI 눈'을 통해 기존 스마트폰 중심의 AI 활용을 벗어나 안경형 웨어러블로 AI 경험을 일상 깊숙이 녹여내겠다는 전략을 제시했다. 'AI눈'은 음성 명령과 카메라를 통한 실시간 정보 제공을 핵심으로 한다. 약 50g의 가벼운 무게로 일반 안경과 유사한 착용감을 갖추고 있으며 스마트폰 연동을 통해 AI 연산을 처리한다. 이를 통해 기기 자체를 무겁지 않게 유지하면서도 맞춤형 안내, 번역, 레시피 추천, 운동 가이드 등 다양한 서비스를 제공할 수 있다. 이날 행사에서는 정 대표가 직접 'AI눈'에게 자신을 보게 해 AI와의 대화를 시연했다. 'AI눈'은 정 대표가 입은 검은색 후드티와 청바지를 실시간으로 인식하고 "의상이 딱 봐도 실력 있는 개발자로 보인다"라고 재치 있게 반응했다. 이에 정 대표는 "'AI눈'은 단순히 디바이스가 아니라 사용자의 경험을 확장하는 새로운 접점"이라고 강조했다. 또 정 대표는 다양한 파트너십과 생태계 구축을 통한 서비스 다양화에도 힘쓸 계획임을 시사했다. 스마트폰 시대에는 앱 마켓이 디바이스 가치를 높였듯 'AI눈'을 통해 스마트 글래스 전용 앱 생태계를 열어가겠다는 계획이다. 이를 위해 시어스랩은 글로벌 안경 브랜드와의 협업은 물론, 교육·의료·산업 분야로의 적용 확대도 검토 중이다. 정 대표는 "다양한 서드파티 개발자와 서비스 업체가 자유롭게 참여할 수 있는 개방형 환경을 마련함으로써 사용자들이 목적에 따라 폭넓은 활용 경험을 누릴 수 있도록 하겠다"고 강조했다. 이어서 발표한 김병수 시어스랩 이사는 사용자 경험(UX)과 생태계 구축 전략을 밝혔다. 'AI눈'의 목적은 매 순간에 대해 집중하는 기술인 '모먼트 사용자 경험(UX)'을 적용해 유저가 평소에 겪는 작은 순간들이 의미 있는 경험으로 남도록 하는 것이다. 김 이사는 "개방형 생태계와 하이브리드 AI 전략을 통해 기존 앱 개발자와 파트너들의 참여를 유도하겠다"며 "스마트 글래스 전용 앱 마켓을 활성화하겠다"고 설명했다. 이날 행사에는 더밀크 손재권 대표도 참석해 AI 기술 발전 흐름과 미래 전망을 제시했다. 손 대표는 에이전트 기술의 도래로 AI가 단순한 비서를 넘어 독립적 판단이 가능한 주체로 진화하고 있다고 강조하며 이를 통해 인간의 의사결정을 보조하는 데서 나아가 스스로 복잡한 결정을 내릴 수 있는 단계로 나아가고 있음을 역설했다. 또 그는 안경형 AI 디바이스가 핵심 플랫폼으로 부상할 가능성을 제시하며 향후 에이전트 기술이 다양한 디바이스와 결합해 개인화된 AI 에이전트가 일상적으로 활용될 것이라는 전망을 내놓았다. 그는 "국내에서는 오늘 발표된 시어스랩의 'AI눈'이 기대가 된다"며 "이 자리에 함께하며 신기술을 국내 청중들에게 소개해 미래에 대한 대비를 지원할 수 있다는 점이 정말 자랑스럽다"고 강조했다.

2024.12.12 13:18조이환

오픈AI '소라' 게임 콘텐츠 무단 활용 의혹…"법적 리스크 커"

오픈AI가 최근 출시한 비디오 생성 인공지능(AI) '소라'에 게임 콘텐츠를 훈련 데이터로 사용했다는 주장이 제기되면서 법적 문제가 우려되고 있다. 12일 테크크런치에 따르면 '소라'는 텍스트 프롬프트나 이미지를 기반으로 최대 20초 길이의 비디오를 생성할 수 있는 기능을 갖추고 있다. 이미 오픈AI는 '소라'를 시연할 때 훈련에 유명 비디오게임 마인크래프트의 플레이 영상을 사용했다고 밝혔으며 전문가들은 다른 게임 콘텐츠도 훈련 데이터로 포함됐을 가능성이 높다고 분석했다. 실제로 '소라'는 닌텐도 게임인 '슈퍼마리오 브라더스'나 유명 1인칭 슈팅 게임인 '콜오브듀티' 스타일의 영상을 생성할 수 있다. 이와 함께 유명 트위치 스트리머의 외모를 반영한 캐릭터도 만들어내고 그의 문신을 복제하는 등 저작권 문제가 불거질 소지가 큰 것으로 나타났다. 법률 전문가들은 오픈AI가 무단으로 게임 플레이 영상을 사용했을 경우 저작권 침해 소송에 직면할 수 있다고 경고했다. 특히 게임 콘텐츠에는 개발사 뿐만 아니라 스트리머 등 여러 이해관계자가 얽혀 있어 저작권 관련 법적 리스크가 크다. 오픈AI는 훈련 데이터 출처에 대해 명확히 밝히지 않고 있으며 공공 데이터와 라이센스 데이터를 활용했다고만 언급했다. 지적재산권 변호사인 조슈아 와이겐스버그는 "비디오 게임 플레이 영상을 무단으로 사용하는데는 많은 리스크가 있다"고 밝혔다.

2024.12.12 11:27조이환

[인터뷰] "아마존 Q 디벨로퍼, 500년 걸리는 개발 업무 몇 시간으로 단축"

"개발자는 '아마존 Q 디벨로퍼'로 높은 개발 효율성을 경험할 수 있습니다. 자바 패키지 수만 개를 최신 버전으로 자동 변환하고 테스트·문서 작업을 단순화하는 등 업무 부담을 크게 줄일 수 있습니다. 아마존 Q 디벨로퍼를 통해 4~500년 걸리는 소프트웨어(SW) 개발 시간을 단 몇 시간으로 단축할 수 있습니다." 아마존웹서비스(AWS) 스리니 이라가바라푸 생성형 AI 애플리케이션 및 개발자 경험 총괄은 지난 6일까지 미국 라스베이거스에서 열린 'AWS 리인벤트'에서 기자와 만나 아마존 Q 디벨로퍼 특장점을 이같이 밝혔다. AWS는 이번 행사에서 아마존 Q 디벨로퍼 기능을 처음 발표했다. 아마존 Q 디벨로퍼는 AWS 솔루션에서 애플리케이션 구축과 운영, 유지 보수 등 SW 개발 라이프사이클 전반을 지원하는 생성형 AI 개발 보조 도구다. 개발자는 단위 테스트와 문서화, 코드 리뷰 등 번거로운 개발 업무를 자동화할 수 있다. 이라가바라푸 총괄은 아마존 Q 디벨로퍼 특장점으로 에이전트 업무 자동화를 꼽았다. 에이전트가 코드 생성부터 테스트, 문서 작성, 문제 해결법 제안 등을 실행할 수 있어서다. 이 에이전트는 아마존 베드록을 통해 업무를 처리한다. 베드록에 탑재된 '아마존 노바'를 비롯한 오픈소스형 거대언어모델(LLM)을 통해 개발자에게 텍스트로 설명할 수 있다. 에이전트는 세 종류로 이뤄졌다. 유닛 데스트 생성 에이전트는 함수 단위나 파일 단위로 자동 테스트를 생성할 수 있다. 이를 통해 개발 시간을 단축한다. 문서화 에이전트는 코드 수정에 맞춰 관련 문서를 자동 업데이트해 준다. 이에 개발자들은 문서 작업에 들이는 시간을 줄일 수 있다. 코드 리뷰 에이전트는 AI를 통해 코드 변경 사항을 분석해 문제나 취약점, 성능 개선 사항을 작업자에 제안한다. 아마존 Q 디벨로퍼는 운영 측면에서도 활용된다. AWS 관리 콘솔에서 문제가 발생하면 아마존 Q 디벨로퍼가 이를 실시간으로 인식할 수 있어서다. 관리자에게 해결 방안까지 제시한다. 아라가바라푸 총괄은 "개발자들은 단순 업무 자동화를 직접적으로 경험할 수 있다"며 "기업이나 개인 개발자는 원하는 에이전트를 상황에 따라 선택할 수 있게 업무 자동화 옵션을 다양하게 만들었다"고 강조했다. 아라가바라푸 총괄은 아마존 Q 디벨로퍼 활용 사례도 공유했다. 특히 자바 업그레이드 에이전트 애플리케이션을 연동해 이룬 업무 효과를 소개했다. 그는 "최근 내부적으로 아마존 Q 디벨로퍼의 자바 에이전트 앱으로 3만 개 넘는 자바 패키지를 최신 버전으로 자동 변환했다"며 "이는 4~500년 걸리는 개발 시간을 몇 시간으로 단축하고 비용 절감을 2억6천만 달러(약 3천700억원) 절약한 것과 같은 셈"이라고 강조했다. 이어 "그동안 사람이 코드를 직접 수정해야 했다"며 "디벨로퍼 내 구축된 에이전트 덕에 이를 자동 처리할 수 있다"고 강조했다. 그는 향후 아마존 Q 디벨로퍼의 AI 기능을 더 고도화할 방침이다. 현재 AI가 개발 과정서 발생하는 단순 업무를 자동화하지만, 향후 복잡한 추론까지 자동화할 수 있도록 솔루션 업그레이드를 진행할 예정이다. 아라가바라푸 총괄은 "결국 아마존 Q 디벨로퍼는 SW 개발 라이프사이클 전 과정을 지원할 것"이라며 "기업과 개발자는 더 적은 비용과 시간으로 높은 수준의 결과물을 얻을 수 있을 것"이라고 강조했다.

2024.12.12 10:34김미정

자다라, '소버린 AI 클라우드 서비스' 출시…AI 시장 진출 속도

자다라가 소버린 인공지능(AI) 환경을 제공하는 솔루션을 출시해 엔터프라이즈 고객의 AI 시장 진출을 돕는다. 자다라가 AI 워크로드에 최적화된 '소버린 AI 엣지 클라우드 서비스'를 출시했다고 12일 밝혔다. 최근 생성형 AI와 급속한 거대언어모델(LLM) 발전으로 고성능 그래픽처리장치(GPU)에 수요가 증가하고 있다. GPU 인프라 구축을 위한 높은 초기 투자 비용과 운영 관리 복잡성은 기업의 주요 장애물이다. 자다라는 소버린 AI 엣지 클라우드 서비스로 이런 문제를 극복하겠다는 전략이다. 기업들은 초기 투자 없이도 필요한 만큼 GPU 자원을 즉시 사용할 수 있다. 확장 가능한 유연한 아키텍처를 통해 비즈니스 성장에 따른 탄력적인 운영도 가능하다. 자다라의 가장 큰 차별점은 퍼블릭 클라우드와 동일한 AI 환경을 고객 데이터센터 내부에 제공한다는 점이다. 개인 데이터와 재무 기록, 지적 재산 같은 민감 정보를 다루는 AI 애플리케이션은 데이터를 외부 유출 없이 활용하는 것이 필수다. 특히 규제 준수가 중요한 금융, 의료, 공공 부문 고객들은 데이터 유출없는 AI 워크로드 실행을 원한다. 소버린 AI 엣지 클라우드 서비스는 특허 기술이 적용된 z스토리지를 통해 여러 유형의 데이터를 격리되고 안전하게 저장하고 고성능으로 AI 및 분석 환경에 제공함으로써 소버린 AI에서 요구하는 보안과 성능을 보장한다. 이를 통해 기업들은 데이터 보안과 규제 준수 문제를 해결하며 AI 모델을 안전히 운영하는데 강점을 갖는다. 이 솔루션은 중앙화된 퍼블릭 클라우드에서 AI 서비스를 처리하는 것이 아닌 사용자와 가까운 분산 엣지 환경에서 실시간 의사결정을 지원한다. 이를 통해 대역폭 제한이나 연결 불안정 환경에서도 안정적인 AI 서비스를 제공하고 지연 시간을 줄여 빠른 의사결정을 돕는다. 자다라는 소버린 AI 엣지 클라우드 서비스를 기존 서비스형 인프라(IaaS), 매니지드 쿠버네티스(Managed K8s), 서비스형 데이터베이스(DBaaS), 서비스형 백업(BaaS) 등과 함께 제공한다. 이에 고객은 AI 워크로드에 필요한 모든 서비스를 지원 받을 수 있다. 모든 서비스는 실제 사용량 만큼만 과금돼 비용 효율성을 극대화할 수 있다. 자다라 코리아 조순현 영업총괄은 "소버린 AI 엣지 클라우드 서비스는 단순한 인프라 제공을 넘어 기업의 AI 혁신을 위한 클라우드 솔루션이다"며 "보안과 규제가 중요한 엔터프라이즈 시장에서 강력한 경쟁력이 될 수 있을 것"이라고 강조했다.

2024.12.12 08:29김미정

한수원, 세계 최초 원전 특화형 초거대 AI 구축 착수

한국수력원자력(대표 황주호)은 네이버클라우드(대표 김유원)·베스핀글로벌(대표 장인수)과 손잡고 '한수원형 생성형 AI 구축 사업에 나선다고 11일 밝혔다. 한수원은 이날 계약으로 네이버클라우드의 초거대 언어모델인 '하이퍼클로바 X'에 원전 데이터를 학습시킨 후, 외부망으로부터 분리된 사내 데이터센터에 설치하고 베스핀글로벌의 챗봇 서비스인 'HelpNow AI'를 이용해 한수원에 특화된 AI 서비스를 운영할 계획이다. 원전에 특화된 초거대 생성형 AI를 구축하는 것은 세계 최초다. 한수원 관계자는 “일반적으로 챗GPT·코파일럿 등 초거대 언어모델 서비스는 공공 클라우드망을 통해 제공되지만, 데이터 보안이 중요한 한수원은 국내 공공기관 최초로 이를 사내망에 구축하기로 했다”고 전했다. 한수원은 2025년 3월 사내에 하이퍼클로바 X 서비스를 개시해 임직원이 사내 업무망에서 문서요약·번역 등과 같은 생성형 AI의 범용기능을 자유롭게 활용할 수 있도록 할 계획이다. 이후 7월까지 한수원 데이터 학습을 완료하고 원전건설·발전·정비작업·안전·수력/신재생·대외기관 대응·AI Assistant 등 7대 업무 분야에 서비스를 제공해 업무 생산성을 높일 방침이다. 황주호 한수원 사장은 “엄격한 규제와 품질이 요구되는 원전 산업에 AI 시스템을 도입함으로써 원전 안전성과 효율성을 더욱 높일 것”이라며 “이번 네이버클라우드와 베스핀글로벌과의 사업을 통해 한수원이 원전 분야에서 차별화된 글로벌 경쟁력을 확보할 것으로 기대한다”고 밝혔다.

2024.12.11 17:32주문정

오픈AI, 기술 한계 직면했나…'소라' 출시 직후 연일 '먹통'

오픈AI의 야심작인 동영상 생성 인공지능(AI) 모델 '소라(Sora)'가 서비스 정식 출시와 동시에 마비됐다. 시장 내 '게임체인저'가 될 것이란 기대감과 달리 사전 대비가 소홀했다는 지적이 나오면서 AI 기술 주도권을 쥔 오픈AI가 오점을 남겼다는 평가다. 11일 업계에 따르면 오픈AI '소라'를 경험하기 위한 이용자들이 일시적으로 몰리면서 이날 오후 4시 14분(한국시간) 현재도 '소라닷컴'에 접속이 되지 않고 있다. 서비스는 이달 10일(현지 시간 9일) 오픈됐지만 트래픽이 심해 일시적으로 비활성화 조치가 내려졌다. 오픈AI '소라'가 무료가 아닌 유료 이용자들을 대상으로 서비스 된다는 점에서 이번 일은 상당한 실망감을 가져다줬다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 사실상 유료 서비스인 셈이다. 하지만 서비스 정식 출시 후 3일째가 된 이날도 여전히 정상화되지 않고 있다는 점에서 이용자들은 점차 불만을 터트리고 있다. '소라'를 이용하기 위해 '챗GPT 플러스'를 다시 구독하기 시작한 이용자들도 상당히 있지만, 사이트가 '먹통'이 된 탓에 많은 아쉬움을 드러내고 있다. 일각에선 국내와 달리 해외 기업의 서비스 먹통에 대한 민감도가 낮은 듯 하다고 지적했다. 앞서 카카오의 경우 지난 2022년 10월 SK C&C 데이터센터 화재로 서비스가 줄줄이 중단돼 많은 비난이 쏟아진 바 있다. 카카오는 카카오톡 등 무료 서비스에 대해서도 서비스 중단에 대한 책임을 지기 위해 보상안을 마련하며 여론을 달래기 위해 노력했다. 하지만 오픈AI는 유료 고객을 대상으로 한 서비스가 제대로 작동하고 있지 않음에도 개선책은커녕 보상안에 대해서도 제대로 내놓지 못하고 있어 눈살을 찌푸리고 있다. 오픈AI는 '소라닷컴' 알림창에 "현재 트래픽이 심해 소라 계정 생성을 일시적으로 비활성화했다"고만 공지한 상태다. 또 언제 서비스 정상화가 될 수 있냐는 질문에는 명확한 답변을 내놓지 못했다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고만 말했다. 업계 관계자는 "접속 채널에 동시 접속자가 많으면 많을수록 비용이 많이 든다"며 "그만큼 인프라를 확보해 둬야 하기 때문"이라고 설명했다. 이어 "한정된 자원과 예산으로 동시에 들어올 수 있는 인원수를 제한하려고 하다 보니 이 같은 일이 벌어진 듯 하다"며 "유료 구독자를 대상으로 하는 서비스임에도 기술적 한계와 비용 투입이 제대로 일어나지 않아 이 같은 일이 벌어진 듯 해 아쉽다"고 덧붙였다. 그러면서 "영상을 AI로 제작하는 서비스인 만큼 컴퓨팅 리소스를 엄청나게 소모할 듯 한 데 이를 오픈AI가 최적화하지 못한 측면도 있지 않을까 싶다"며 "유료 임에도 SLA(최저보장속도)을 보장해주지 않았다는 점에서 사용자들의 권리를 침해한 것으로 보여 비즈니스 모델로서도 성공적인 시작을 하진 못한 듯 하다"고 평가했다.

2024.12.11 16:19장유미

"에이전트 AI, 양자컴퓨팅과 손잡을 것"…복잡한 산업 과제 해결 '가속화' 전망

에이전트 인공지능(AI)이 사람보다 높은 추론 능력을 갖추고 다양한 최첨단 기술과 결합해 미래 산업의 핵심 요소가 될 것이라는 예측이 나왔다. 11일 엔비디아 '2025년 AI 핵심 인사이트 공유'에 따르면 다단계 추론을 통해 의사결정과 문제 해결 능력을 강화한 에이전트 AI의 역할이 점차 중요해질 예정이다. 특히 양자컴퓨팅, 생성형 AI와의 결합으로 복잡한 산업 과제를 공략하며 기업과 국가의 경쟁력을 높일 것으로 기대된다. 다단계 추론을 바탕으로 한 에이전트 AI는 복잡한 질문을 세분화하고 분석해 정교한 해결책을 제시한다. 이는 의료, 금융, 과학 연구 등 다양한 분야에서 적용돼 실시간 의사결정과 맞춤형 인사이트를 제공할 것으로 보인다. 기업들은 이러한 기술을 활용해 내부 네트워크를 최적화하고 효율을 극대화할 전망이다. 양자컴퓨팅과 AI의 융합은 신약개발, 물류 최적화 같은 난제 해결을 가속화할 것으로 전망된다. 큐비트 안정성을 높이는 양자 오류 수정 기술과 AI 기반 슈퍼컴퓨팅이 결합되며 고성능 계산이 필요한 연구개발에서 새로운 가능성을 열어줄 것으로 보인다. 휴머노이드 로봇의 발전도 주목된다. 인간의 언어를 이해하고 물리적 작업을 수행하는 로봇이 점진적으로 상용화될 가능성이 높다. 멀티모달 모델로 구동되는 이 로봇은 노동력 부족 문제 해결과 고령화 사회의 대안으로 자리잡을 것으로 기대된다. AI 팩토리는 방대한 데이터를 실시간으로 분석하고 예측해 인사이트를 제공한다. 엔비디아는 수냉식 데이터센터와 컴퓨팅 패브릭을 활용한 대규모 인프라 확충 방안을 제시하며 기업들이 효율적으로 디지털 트윈 구축과 공급망 시뮬레이션을 실행할 수 있도록 지원하고 있다. 생성형 AI는 도시 설계와 엔지니어링에도 활용될 예정이다. 도시 교통 관리, 건축 설계 초기 단계에서부터 AI 기반 데이터 분석이 적용돼 지속 가능한 도시 인프라 구축에 기여할 것으로 예상된다. 브라이언 카탄자로 엔비디아 응용 딥러닝 리서치 부문 부사장은 "AI는 인간과 더 유사해지고 있으며 더 나아가 창의적이고 친숙한 형태로 발전하고 있다"며 "AI와의 상호작용이 보다 자연스럽고 생산적인 방식으로 바뀌고 있다"고 밝혔다.

2024.12.11 15:03조이환

오픈AI '소라' 등장에 주눅 든 어도비…뒤처진 기술 우려에 주가도 '뚝'

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 경쟁사인 오픈AI가 동영상 생성 인공지능(AI) '소라'를 정식 출시하자 또 다시 위기설에 휩싸였다. 관련 서비스를 아직 제대로 선보이지 않고 있는 탓에 오픈AI보다 기술력에서 뒤처지고 있다는 평가도 받고 있다. 11일 블룸버그통신 등에 따르면 어도비는 생성형 AI를 사용해 프롬프트나 이미지에서 동영상을 만들 수 있는 브라우저 기반 서비스를 발표한 지 두 달이 지났지만, 여전히 테스트 단계에 머물고 있는 것으로 나타났다. 현재 어도비와 계약을 맺은 소수의 이용자만 접근할 수 있는 상태다. 앞서 어도비는 지난 10월 초 연례 컨퍼런스를 통해 '파이어플라이 AI' 제품군의 일부로 동영상 생성 AI 기능을 발표했으나, 베타 버전으로만 선보였다. 또 '프리미어'에 동영상 편집 툴을 출시했는데, 이는 사용자가 생성형 AI를 사용해 동영상 클립을 확장할 수 있게 해준다. 어도비는 자사 웹사이트에 "다양한 사용 사례를 가장 잘 지원하고 모델 안전을 보장하기 위해 피드백 수집에 중점을 두고 제한적으로 베타 서비스에 접근할 수 있게 하고 있다"며 "(이용을 원하면) 대기자 명단에 가입하면 된다"고 기재했다. 반면 오픈AI는 지난 9일 동영상 생성 AI '소라'를 정식 출시하며 업계의 주목을 받았다. 이는 지난 2월 발표한 지 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 '소라'에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 현재 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. 다만 오픈AI가 '소라'를 정식 출시한 후 이용자가 몰리면서 현재 이를 사용할 수 있는 '소라닷컴'의 접속은 원활하게 이뤄지지 않고 있다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고 말했다. 이 외에도 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 탓에 어도비의 주가는 올 들어 8.3%나 하락해 동종 업계보다 뒤처진 모습을 보였다. '소라'가 발표된 후 지난 10일 주가는 전 거래일 대비 0.16% 하락한 547.05달러로 마감했다. 이를 두고 업계에선 어도비가 AI에 대해 두려움을 갖고 혁신적으로 나서지 못했다고 지적했다. 어도비는 "앞으로 몇 주~몇 달 안에 (AI 서비스) 가용성을 확대할 예정"이라며 "어도비 파이어플라이는 상업적으로 안전한 유일한 비디오 모델로, 6주 전에 출시된 후 강력한 고객들의 반응을 확인했다"고 말했다. 그러면서 "모델의 최종 조정과 안전성을 위해 여전히 노력하고 있다"며 "(비디오 AI에 대해선) 전문가들이 사용하는 워크 플로우에 대한 통합뿐 아니라 모델에 초점을 맞추고 있다"고 덧붙였다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2024.12.11 09:08장유미

영상 생성AI '소라' 나오자...中 바이트댄스·텐센트 반격

미국 오픈AI의 영상 생성 인공지능(AI) 서비스 '소라'가 출시되면서 중국 기업들의 영상 생성 서비스도 속도를 내고 있다. 10일 중국 바이트댄스는 자사 초거대 AI 챗봇 더우바오의 PC 버전을 내놓으면서 영상 생성 모델 '픽셀댄스(PixelDance)'의 내부 테스트를 시작하고 일부 사용자에게 공개했다. 사용자들은 하루에 무료로 10개 영상을 생성할 수 있다. 픽셀댄스는 지난 9월 처음 발표됐으며, 더우바오 영상 생성 초거대 모델을 기반으로 하고 있다. 아직 테스트 단계이긴 하지만 고급 카메라 모션 및 각종 영상 효과를 지원한다. 관계자에 따르면 약 10초 영상을 생성하면서 3~5개의 효과를 적용하는 경우 최적의 영상을 만들 수 있다고 소개됐다. 이달 초 중국 텐센트도 '훈위안 영상 생성 모델(HunYuan-Vieo)' 기반 영상 생성 기능을 내놨다. 130억 매개 변수를 가진 이 모델은 중국어와 영어 입력을 통한 영상 생성을 지원하며, 개인 사용자 혹은 기업 고객이 신청을 통해 사용해볼 수 있다. 텐센트는 이 매개 변수가 업계 최대 수준이며, 5초 짜리 영상을 생성할 수 있다고 소개했다. 이뿐 아니라 지난 3일엔 중국 국유 통신사 차이나텔레콤의 AI 연구소인 '텔레AI(TeleAI)'도 자사 싱천 초거대 모델 기반의 영상 생성 모델을 공개했다. 이 모델은 중국 국유 기업이 개발한 첫 영상 생성 모델로도 관심을 모았다. 바이트댄스와 텐센트, 차이나텔레콤뿐 아니라 앞서 중국 콰이서우, 센스타임, 미니맥스 등 기업도 AI 영상 생성 플랫폼을 공개한 바 있다. 중국 동영상 플랫폼 콰이서우가 내놓은 영상 생성 초거대 모델 '클링(KLING)'은 최대 2분짜리(30fps 주사율) 1080P 영상을 만들 수 있다.

2024.12.11 08:17유효정

스노우플레이크, 유니스토어 발표…"데이터 관리 간소화"

스노우플레이크가 데이터 아키텍처를 간소화하고 보안과 거버넌스를 강화하는 솔루션을 공개했다. 스노우플레이크는 트랜잭션 데이터와 분석 데이터를 단일 플랫폼으로 통합하는 유니스토어를 발표했다고 10일 밝혔다. 사용 기업은 이 플랫폼으로 트랜잭션과 분석 워크로드를 동시에 처리할 수 있어 데이터 전반에 일관된 보안을 유지할 수 있다. 전통적인 데이터 아키텍처는 트랜잭션 데이터와 분석 데이터를 별도로 관리해 운영 부담과 데이터 사일로 문제를 일으켰다. 유니스토어는 이런 문제를 해결하면서 데이터 전송 과정에서의 지연과 거버넌스 불일치 문제를 해소했다. 이날 스노우플레이크는 유니스토어 기반으로 작동하는 하이브리드 테이블도 공개했다. 이는 쿼리 특성을 자동으로 식별해 트랜잭션과 분석 데이터를 최적화할 수 있다. 이를 통해 실시간 데이터 제공과 저지연 애플리케이션 개발을 지원한다. 기업은 데이터베이스 이동 없이도 트랜잭션 워크로드를 간소화할 수 있다. 스노우플레이크 칼 페리 핵심 서비스 책임자는 "하이브리드 테이블은 유니스토어의 핵심 기술로 고객들이 데이터 보호에 대한 부담을 줄이고 AI 데이터 클라우드로 혁신을 가속화할 수 있도록 돕는다"고 강조했다.

2024.12.10 17:24김미정

스노우플레이크, '크로스-클라우드' AI 협업 기능 강화

스노우플레이크가 데이터와 인공지능(AI) 협업을 통해 기업 보안과 생산성 강화에 나섰다. 스노우플레이크는 외부 파트너·고객과 데이터, AI 모델, 앱을 안전하게 공유하고 평가할 수 있는 기능을 공개했다고 10일 밝혔다. 내부 마켓플레이스와 스노우파크 머신러닝(ML) 모델링 API 등 도구로 기업의 AI 프로젝트 수행 효율성과 보안성을 높였다. 스노우플레이크의 내부 마켓플레이스는 조직 내 데이터를 검색하고 공유하는 과정을 간소화하며 권한 관리 기능을 제공한다. 이를 통해 AI 모델의 파인튜닝과 같은 고도화 작업을 팀 간 협업으로 효율적으로 진행할 수 있다. 데이터 복사와 이동 없이 모델 성능을 높여 배포할 수 있는 환경도 제공한다. 스노우파크 컨테이너 서비스와 네이티브 앱 프레임워크는 AI 기반 앱 개발 과정을 단축하고 상용화를 돕는다. 이를 통해 개발자들은 선호하는 언어와 환경에서 모델을 학습시키고 다양한 리전·클라우드 환경에 배포할 수 있다. 특히 그래픽처리장치(GPU)와 중앙처리장치(CPU) 인스턴스를 활용한 유연한 구성도 가능하다. 스노우플레이크는 보안 요구사항 높은 기업을 위한 맞춤형 지원도 확대했다. 보안 배포 기능과 컴플라이언스 배지 시스템은 외부 위협을 최소화하며 내부 표준 준수를 돕는다. 이를 통해 스노우플레이크는 엄격한 산업 기준에도 부합하는 AI와 데이터 제품의 안전한 배포를 가능케 했다. 스노우플레이크 프라사나 크리슈난 협업 및 호라이즌 사업부 총괄은 "기업들이 빠르게 변화하는 데이터와 AI 환경에서 성공하려면 조직 내외부 데이터를 즉시 활용할 수 있어야 한다"며 "보안과 협업이 조화를 이루는 환경을 제공할 것"이라고 밝혔다.

2024.12.10 17:23김미정

스노우플레이크 "방대한 기업 데이터, 단일 API로 관리 간소화"

"생성형 인공지능(AI) 시대 최대 과제는 기업 데이터 관리입니다. 단일 API로 데이터 환경을 간소화해야 합니다. 효율적인 데이터 관리로 쉬운 AI 애플리케이션 개발 환경을 고객에 제공할 수 있습니다. 또 고객에게 생성형 AI 서비스를 잘 지원하려면 높은 신뢰성·가성비도 필수입니다." 최기영 스노우플레이크 코리아 지사장은 10일 미디어 간담회를 통해 생성형 AI 시대 데이터 관리 방식과 AI 애플리케이션 개발 필수 요소를 이같이 밝혔다. 스노우플레이크는 10년 동안 글로벌 시장에 데이터 레이크하우스와 데이터 메시 등 다양한 데이터 아키텍처 솔루션을 지원해 왔다. 한국에는 3년 전 진출했다. 현재 전 세계적으로 50억 건 넘는 데이터를 매일 처리하고 있다. 고객은 약 10만 명이다. "AI로 복잡한 데이터 관리…단일 API로 간소화" 최기영 지사장은 생성형 AI 산업 활성화로 기업 데이터가 방대해졌다고 주장했다. 그동안 기업이 데이터 레이크 하우스와 데이터 메시, 웨어하우스 등으로 데이터 간소화에 노력했지만 복잡성이 오히려 늘었다고 지적했다. 이 과정에서 기업이 여러 엔진을 활용하면서 데이터 사일로가 다시 발생했다는 이유에서다. 이에 스노우플레이크는 방대한 데이터 관리를 간소화하기 위해 단일 API 방식을 채택했다. 이는 데이터 관리를 간소화할 뿐 아니라 여러 엔진을 하나로 합쳐줄 수 있는 방식으로 평가받고 있다. 현재 스노우플레이크 기업 고객은 단일 API로 정형 데이터와 비정형 데이터, 외부 데이터 등 다양한 소스를 하나의 통합된 인터페이스로 연결해 데이터를 간소화하고 통합적으로 활용하고 있다. 사용자는 복잡한 데이터 위치나 처리 방식을 고려하지 않아도 단일 API 호출로 데이터를 쿼리·분석할 수 있다. 예를 들어 PDF 계약서에서 결제 조건을 추출하거나 SQL 데이터베이스(DB)에서 배송 시간을 조회하는 작업을 동일한 API 호출로 한 번에 할 수 있다. 최 지사장은 "사용자는 단일 API를 통해 적합한 엔진을 자동으로 라우팅할 수 있다"며 "정형 데이터와 비정형 데이터를 유기적으로 연결할 수 있다"고 설명했다. 이어 "사용자는 별도 설정 없이 필요한 데이터를 간편하게 얻을 수 있다"며 "단일 API는 데이터 소스 간 경계를 허물고, 복잡한 데이터 추출·변환·적재(ETL) 작업을 줄여 효율성을 높인다"고 강조했다. "생성형 AI 환각현상 최소화·가성비 최대화 핵심" 스노우플레이크는 향후 AI 애플리케이션이 기업 시장에서 주요 킬러 앱으로 자리 잡을 것으로 내다봤다. 이를 실현하기 위한 필수 요소로 답변 신뢰성과 가성비를 꼽았다. 이날 스노우플레이크 코리아 이수현 테크에반젤리스트는 스노우플레이크의 검색증강생성(RAG) 주요 특징을 설명했다. 스노우플레이크는 현재 20개 넘는 매트릭스를 활용해 AI 모델 성능을 다각적으로 측정할 수 있는 방법을 도입했다. 측정 기준은 정확성과 연관성, 문맥 적합성이다. 우선 AI 모델이 내놓은 답변이 사용자 질문과 얼마나 밀접히 관련됐는지 평가한다. 이후 AI가 검색한 데이터와 제공한 응답 간 연관성을 검증한다. 마지막으로 답변이 질문 문맥과 얼마나 잘 맞는지 확인한다. 이를 자체적으로 수치화해 일정 점수가 넘어야 사용자에게 답변을 제공하는 식이다. 이 에반젤리스트는 AI 모델 성능이 임계값보다 낮을 경우 이를 자동으로 감지하고 사용자에게 알림을 제공한다고 설명했다. 과정도 간단하다. 우선 사용자는 모델 성능의 최소 허용 수준을 설정한다. 이후 시간이 지나면서 솔루션이 자체적으로 훈련 데이터와 현재 데이터 간 불일치를 탐지해 실시간으로 성능 저하를 식별한다. 이때 답변 정확도에 문제가 생기면 사용자는 기존 모델을 수정하거나 새 데이터로 모델을 재학습시키면 된다. 이 에반젤리스트는 "엔터프라이즈의 AI 핵심은 옵저버빌리티"라며 "AI 모델이 비즈니스 목표를 효과적으로 지원하고 기업에게 데이터 중심 의사 결정 기회를 줄 수 있을 것"이라고 밝혔다. 스노우플레이크는 데이터보안 강화를 위한 전략도 소개했다. 최근 잇따라 발생하는 데이터 거버넌스 이슈와 보안 문제를 해결하기 위한 목표다. 이 에반젤리스트는 "최근 기업들은 데이터를 AI 모델로 보내는 방식을 채택하기 일쑤"라며 "데이터를 외부 AI로 전송할 경우 보안 위험과 관리 어려움이 발생할 수 있다"고 지적했다. 이어 "AI 모델을 데이터 플랫폼으로 직접 가져와 데이터 내에서 관리하는 방식이 더 안전하다"며 "이를 통해 데이터 거버넌스와 보안에 생기는 이슈를 최소화할 수 있다"고 덧붙였다. 스노우플레이크는 가성비 있는 AI 활용을 지원하기 위해 오픈소스를 적극 활용할 것이라고 밝혔다. 기업이 데이터를 저비용에 처리할 수 있기 때문이다. 이를 통해 기업의 생성형 AI 사용 비용을 획기적으로 낮출 수 있다. 이 에반젤리스트는 "현재 아파치 아이스버그 도구로 생성형 AI의 학습 데이터 준비와 처리를 최적화해 비용 효율성을 높이고 있다"며 "대규모 데이터를 테이블 형식으로 관리해 필요한 데이터만 선택적으로 로드할 수 있어 데이터 준비와 처리 시간을 줄이고 불필요한 리소스 사용을 없앨 수 있다"고 강조했다.

2024.12.10 16:26김미정

"AI 악용·MLS, 내년 사이버 보안 핵심축"

내년 사이버 보안 분야에서 인공지능(AI) 악용과 딥페이크 공격, 차세대 보안관제센터 자동화, 다중계층보안(MLS) 등 신보안체계를 충족하는 공급망 보안 아키텍처가 주를 이룰 전망이다. 이글루코퍼레이션은 사이버 보안에 대한 주요 전망을 담은 '2025년 사이버 보안 위협 및 기술 전망 보고서'를 통해 이같이 10일 밝혔다. 이글루코퍼레이션 보안분석팀의 예측을 토대로 작성된 이번 보고서에는 내년 발생할 주요 보안 위협과 이에 대응하기 위한 보안 기술·방법론이 제시됐다. 이글루코퍼레이션은 AI의 급속한 발전·보편화로 인한 사회적 불안이 고조되면서 사이버 보안 역시 그 영향을 받을 것으로 전망했다. 악성 거대언어모델(LLM) 서비스, 딥페이크 등과 같은 신기술을 누구나 활용할 수 있게 되면서 이를 악용한 사이버 위협이 늘어 사회적 문제를 초래할 것으로 예상했다. 또 국가 주도의 공급망 공격, 다변화된 랜섬웨어 공격, 크리덴셜 탈취 공격도 늘어날 것으로 내다봤다. 이에 맞서 보안 위협의 복잡성을 해소해 효율성을 높이고 수많은 인프라·자산에 대한 통합적인 가시성을 확보할 수 있는 기술·방법론 중요성이 높아질 전망이다. 이글루코퍼레이션은 보안 정보 및 이벤트 관리(SIEM), 보안 운영·위협 대응 자동화 (SOAR), 위협 인텔리전스(TI) 등이 적용된 AI 기반 차세대 보안관제센터 자동화 구축에 대한 수요가 늘어날 것으로 예상했다. 또 위험 표면을 최소화하는 클라우드 보안 강화·해양 선박 운영기술(OT) 보안의 중요성이 높아지고 제로트러스트 아키텍처(ZTA) 및 다중계층보안(MLS) 등 신보안체계를 충족하는 공급망 보안 아키텍처 전략이 부각될 것으로 예측했다. 이글루코퍼레이션 김미희 보안분석팀장은 "생성형 AI 등 신기술을 적용한 다양한 형태 공격이 증가하면서 안정적인 보안 태세를 유지하고 보안 팀 역량을 확장할 수 있는AI 기반 차세대 보안관제센터 자동화 구현의 중요성이 높아질 것"이라며 "방어를 넘어 예측과 대응, 복구를 아우르는 전방위적인 보안 체계 구축에 힘쓸 것"이라고 강조했다.

2024.12.10 10:58김미정

스노우플레이크, 데이터 환경 개선·보안 강화 지원

스노우플레이크가 데이터 환경 단순화와 신뢰성 확보를 통해 기업에게 높은 개발 운영 효율성을 제공한다. 스노우플레이크는 자사 플렛폼 업그레이드와 신제품을 대거 출시했다고 10일 밝혔다. 이번 정식 출시된 '스노우플레이크 오픈 카탈로그'는 진화하는 데이터 아키텍쳐에서 새 엔진을 통합하고 일관된 거버넌스를 적용할 수 있다. 아파치 아이스커그 지원과 데이터 레이크하우스 기능도 강화했다. 스노우플레이크의 데이터 커버넌스 기능인 스노우플레이크 호라이즌 카탈로그에는 새 위협 예방 및 모니터링 기능을 추가하며 보안을 강화했다. 다크 웹에서 발견된 사용자의 비밀번호를 자동으로 비활성화하는 유출 비밀번호 보호기능과 API 인증을 위한 프로그래매틱 액세스 토큰을 지원한다. 애플리케이션 접근을 위한 개발자의 부담은 줄이고 해당 토큰에 범위와 만료 기한을 추가해 보안을 강화했다. 스노우플레이크는 트러스트 센터를 개선하고 플랫폼에 새로운 스토리지 라이프사이클 주기 정책, 데이터 레이크 성능 향상과 비용 절감을 위한 추가 기능도 더했다. 스노우컨버트의 경우 기존 테이블 오브젝트만 가능하던 마이그레이션을 뷰도 가능하도록 확대했다. '스노우플레이크 코텍스 AI' 업그레이드 스노우플레이크는 기업이 신뢰할 수 있는 AI를 프로덕션 환경에 도입할 수 있도록 지원하는 주요 기능도 발표했다. 이번에 업데이트된 스노우플레이크 코텍스 AI는 스노우플레이크의 완전 관리형 AI 서비스다. 기업이 고품질 대화형 앱을 더 효율적으로 구축하도록 지원한다. 이번 업데이트에는 메타의 라마 3.2 모델과 등 멀티모달 LLM을 통해 이미지와 곧 오디오, 다양한 형태의 비정형 데이터를 지원하는 기능이 추가됐다. 마이크로소프트 셰어포인트용 스노우플레이크 커넥터로 내부 지식 베이스와 외부 문서 데이터를 빠르게 통합할 수 있다. 마이크로소프트 365 셰어포인트 파일과 문서에 액세스, 자동으로 파일을 수집하고 AI 활용을 위한 전처리 작업을 생략할 수 있다. 문서 전처리 기능도 강화했다. 새로운 함수 호출로 PDF 및 다른 문서를 AI에 활용 가능한 상태로 쉽게 전처리할 수 있다. 텍스트 추출부터 청킹을 코텍스 서치에서 사용할 수 있다. 사용자는 코텍스 챗 API를 사용해 앱 프론트엔드와 스노우플레이크 간 통합을 간소화할 수 있다. 정형 데이터와 비정형 데이터를 단일 API 호출로 결합해 검색증강생성(RAG) 및 에이전트 기반 분석 앱을 더 쉽고 빠르게 구축하도록 돕는다. 사용자는 개발 및 운영 중에 AI 앱을 관련성, 정확도, 고정관념, 지연 등 20개 이상의 지표를 사용해 평가하고 지속적으로 모니터링할 수 있다. LLM을 위한 'AI 관찰'로 제공되며 스노우플레이크가 인수한 트루에라의 기술이 통합됐다. 정확한 셀프 서비스 분석도 제공한다. 코텍스 애널리스트를 통해 멀티턴 대화기능, 코텍스 서치 통합을 포함한 다양한 데이터 검색 기능으로 기업이 정형화된 데이터에서 더 정확한 인사이트를 얻도록 지원한다. 스노우플레이크는 자연어 처리(NLP) 기능을 향상해 배치 LLM 추론 옵션을 개선하고 더 많은 모델 옵션과 맞춤형 파인 튜닝 방식을 제공한다. 개발자는 코텍스 AI에 더 많은 사전 학습된 LLM, 임베딩 모델 크기, 지원하는 언어 등을 추가해 기업은 가장 적합한 LLM을 유연하게 선택할 수 있다. 이번에 추가된 코텍스 플레이그라운드 기능은 사용자가 다양한 LLM의 응답을 생성하고 비교할 수 있는 통합된 채팅 인터페이스다. 기업이 최적의 LLM 모델을 쉽게 찾도록 돕는다. 코텍스 서버리스 파인튜닝은 개발자가 데이터 자산으로 모델을 맞춤화하고 더 정확한 결과를 생성하도록 한다. 여러 작업에서 LLM을 대규모로 사용할 때 일관된 응답 생성을 지원한다. 프로비전드 스루풋은 대규모 LLM 추론 작업을 프로비전된 처리량으로 처리해야 하는 기업을 위해 기업이 성능을 보장하는 상태에서 성공적으로 작업을 처리하도록 지원한다. 스노우플레이크 배리스 굴테킨 AI 책임자는 "기업은 효과적인 의사 결정을 위해 정확하고 신뢰할 수 있는 AI가 필요하다"며 "이는 AI 모델을 작동할 다양한 출처의 고품질 데이터에 대한 접근으로부터 시작한다"고 강조했다. 이어 "스노우플레이크 코텍스 AI와 스노우플레이크 ML의 플랫폼 혁신을 통해 기업 데이터를 활용한 신뢰할 수 있는 AI를 더 빨리 제공할 수 있다"며 "이를 바탕으로 챗봇 개발 속도와 AI 프로젝트 비용, 성능을 개선해 ML 개발을 가속화할 수 있다"고 덧붙였다.

2024.12.10 10:37김미정

"동영상 생성 AI 최강자 떴다"…오픈AI '소라' 출시에 빅테크도 일자리도 '충격'

동영상 생성 인공지능(AI) 최강자로 지목된 오픈AI의 '소라'가 드디어 모습을 드러내며 구글, 메타 등 경쟁자들을 긴장시키고 있다. 텍스트만으로도 빠른 시간 내에 원하는 동영상을 간편하게 만들 수 있다는 점에서 일자리 위협을 느낀 예술가들의 반발도 더 커지는 모양새다. 10일 업계에 따르면 오픈AI는 지난 9일(현지시간) 온라인 행사를 통해 '소라'를 정식 출시한다고 발표했다. 지난 2월 처음 공개한 후 10개월 만으로, 그간 일부 이용자들을 대상으로 테스트를 한 후 문제점을 보완해 왔다. 공개 됐을 당시 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 등 환각 현상이 발견된 바 있다. '소라'는 이용자가 글로 프롬프트(명령어)를 넣으면 동영상을 생성해주는 AI로, 생성되는 동영상의 길이는 최대 20초다. 당초 최대 1분 길이의 동영상을 빠르게 제작할 수 있다고 오픈AI가 밝혔던 것에 비해선 상당히 시간이 줄었다. 이에 대해 오픈AI는 "최대한 많은 사람들이 소라에 접근할 수 있도록 하기 위해 성능과 확장성 사이의 균형을 맞춘 것"이라고 설명했다. '소라'는 텍스트뿐 아니라 이미지, 동영상에서 영감을 받아 동영상을 생성하는 것은 물론, 기존 동영상을 확장하거나 빠진 프레임을 채우는 '스토리보드' 기능도 제공한다. 오픈AI가 공개한 '우주에 떠 있는 토끼(a rabbit floating in outer space)'라는 프롬프트로 만든 데모 시연 영상에선 약 7초만에 5초짜리 동영상이 만들어져 이목을 집중시켰다. 만든 영상이 마음에 들지 않으면 프롬프트를 수정하거나 스토리보드를 고치면 된다. '소라'는 구글이 올해 1월 공개한 생성 AI 모델 '루미에르'가 단 5초 분량의 영상물을 제작해주는 것에 비해 월등한 기술력을 갖고 있다는 평가를 받고 있다. 이날부터 한국을 포함한 대부분의 국가에서 사용할 수 있지만 영국, 스위스, 유럽경제지역(EEA)은 이번에 출시가 제외됐다. 이는 이들 지역에서 테크 기업에 대한 규제가 강화하고 있는 데 따른 것으로, 영국 등에서의 정식 출시 일정은 미정이다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 이번 일로 동영상 생성 AI 시장 경쟁은 과열되는 분위기다. 지난해 11월에는 스태빌리티 AI가 '스테이블 비디오 디퓨전'을, 올해 1월에는 마이크로소프트(MS)가 비디오 프레임의 움직임을 조작하는 동영상 생성 모델 '드래그누와'를 선보였다. 바이트댄스는 '매직비디오-V2'를, 애플도 2월 대형언어모델(LLM)을 활용해 동영상을 생성하는 '키프레이머'를 내놨다. 오픈AI가 올해 2월 '소라'를 선보인 후에는 구글 동영상 생성 AI '비오(Veo)'와 중국 콰이쇼우 '클링', 미국 루마 AI '드림 머신', 런웨이 '젠-3 알파', 메타 '무비 젠' 등이 지금까지 공개됐다. 어도비도 지난 10월 '어도비 맥스' 행사에서 파이어 플라이 기반 동영상 AI를 발표하며 경쟁에 합류했고, 아마존도 이달 초 '리인벤트' 행사를 통해 동영상 생성 AI '노바 릴'을 처음 선보였다. 이에 따라 유튜브는 내년부터 동영상 생성 AI '비오'를 활용해 유튜브 쇼츠 영상을 만들 수 있게 할 계획이다. 메타는 '무비 젠'이 만든 AI 동영상을 인스타그램 등 SNS와 연계할 수 있도록 할 예정이다. 사용자들은 AI를 사용해 실감나는 릴스(인스타그램을 통해 공유할 수 있는 15초 이내 분량의 짧은 동영상)를 직접 만들어낼 수 있고 페이스북, 왓츠앱, 스레드 등 메타의 다른 SNS 플랫폼에도 공유할 수 있게 된다. 파이낸셜타임스(FT)는 "메타의 무비 젠 AI 동영상 모델은 할리우드 영화 제작사, 동영상 콘텐츠 크리에이터, SNS 인플루언서들의 창조 작업용 툴로 사용되기를 원하고 있다"며 "메타는 영화 등 예능, 오락산업, 광고를 넘어 보다 광범위한 산업 분야에서 수익 창출 모델을 발굴하려고 하고 있다"고 분석했다. 이처럼 본격적인 동영상 생성 AI 시대가 열리면서 영상 관련 산업은 큰 변화를 맞게 됐다. 영화, 애니메이션, 증강현실(AR) 및 가상현실(VR) 등 다양한 분야에서 활용할 수 있게 되면서 일자리를 위협 받는 이들도 상당해질 것으로 예상된다. 실제 소니픽처스는 영화 제작 비용을 줄이기 위해 생성형 AI를 적극 활용하겠다고 공개적으로 밝힌 바 있다. 이미 코카콜라의 최근 홀리데이 캠페인과 같은 광고에선 AI로 제작된 콘텐츠가 등장하고 있다. 영화 CG 일러스트레이터인 리드 사우든은 "2022년 미드저니(이미지 생성 AI)가 처음 나왔을 때 우리는 '귀엽다'며 비웃었다"며 "하지만 이제 사람들은 생성 AI 때문에 일자리를 잃고 있다"고 말했다. 이에 지난해 미국 할리우드에선 배우와 작가를 중심으로 생성형 AI 활용에 대항하기 위해 파업을 벌이기도 했다. 자칭 '소라 PR(대외홍보) 퍼펫'이라고 부르는 예술가 그룹은 지난달 26일 오픈AI '소라'에 접속할 수 있는 프로그래밍 인터페이스(API)를 온라인에 공개하며 반발하는 모습을 보였다. 업계 관계자는 "오픈AI '소라'가 등장하며 많은 기업들에게 동영상 생성 AI 모델에 대한 강력한 동기가 생겼다"며 "여러 모델들이 한꺼번에 풀리면서 산업계, 특히 미디어 시장에 엄청난 반향을 일으킬 것으로 보인다"고 밝혔다. 일각에선 딥페이크 문제에 대해서도 우려하고 있다. AI 기술로 유명인들의 얼굴을 합성해 정교한 가짜 영상을 만드는 것이 쉬워졌기 때문이다. 이에 오픈AI는 레드팀(취약점을 발견해 AI 안전성을 검증하는 팀)을 만들어 딥페이크를 방지하기 위해 나섰다. 또 '소라'로 생성된 모든 동영상에 C2PA(콘텐트 출처 및 진위 확인을 위한 연합) 표준 AI 워터마크를 넣어 AI가 생성한 콘텐츠임을 알 수 있도록 했다. 로한 사하이 오픈AI 엔지니어링 리드는 "도널드 트럼프 대통령 같은 주요 정치인이나 공적 인물은 생성이 차단된다"며 "잘못된 정보의 확산을 방지하려고 노력하고 있다"고 말했다.

2024.12.10 09:21장유미

KISTI, 1억8천만 연구데이터 기반 대화형 AI검색 서비스 '개시'

대화형 AI 통합검색 서비스인 사이언스온 AI(SAI)이 공개됐다. 한국과학기술정보연구원(원장 이식, KISTI)은 과학기술 지식인프라 사이언스온(ScienceON)을 통해 대화형 AI 통합검색 서비스를 9일부터 선보인다. 과학기술 지식인프라 사이언스온은 1억 8천만 건의 국내외 논문, 특허, 국가R&D 보고서 등의 과학기술정보와 연구데이터, 정보분석 서비스 및 연구인프라를 연계·융합해 한 곳에서 제공하는 개방형 협업 연구환경 플랫폼이다. SAI는 통합검색 기능에 생성형 AI를 접목했다. AI와의 대화를 통해 연구 질문에 대한 답을 찾아나가는 서비스다. 이용자가 단어나 문장 형태의 질문을 입력하면, AI가 질문을 이해하고 관련된 논문, 특허, 보고서, 동향 등 사이언스온이 보유하고 있는 과학기술정보를 분석해 적절한 답변을 제공한다. 답변 생성을 위해 참고한 정보를 표기해 답변의 신뢰성을 높였다. 이용자가 질문한 내용에 대한 답변 뿐만 아니라, 추천 질문과 검색어를 제시하도록 만들었다. 이용자가 더 넓은 범위에서 정보를 탐색하고 새로운 연구 방향을 발견할 수 있도록 돕는다. KISTI가 자체 개발한 생성형 언어 모델 고니(KONI)와 검색 증강 생성(RAG) 기술을 적용했다. KISTI 유수현 융합서비스센터장은 “데이터 신뢰성을 높이고 나아가 연구 효율성을 높이는데 기여할 것”이라며, “지속적인 기술 개발을 통해 SAI가 이용자들에게 최적화된 연구환경을 제공할 수 있도록 할 것"이라고 말했다.

2024.12.09 18:00박희범

[현장] "AI 저작물은 창의적인가"…저작권 쟁점 논의의 장 열렸다

"인공지능(AI)이 만들어낸 창작물을 과연 진정한 예술로 볼 수 있을지에 대한 논의가 절실합니다. 이는 단순히 기술 발전의 문제로만 접근해선 안됩니다. 인간 창작자와 AI가 함께 빚어내는 예술적 가치에 대한 평가와 저작권에 대한 법적 개념까지 근본적으로 재검토해야 하는 등 시대적 과제가 산적했습니다." 남윤재 경희대학교 교수는 9일 서울 여의도 FKI타워에서 열린 '인공지능이 사회문화에 미칠 영향 및 합리적 정책 방향' 세미나에서 이같이 강조했다. 이날 세미나는 생성형 AI 기술 확산으로 문화예술·미디어·법률 산업 전반에서 일어나는 변화와 쟁점을 조망하기 위해 마련됐다. 특히 챗GPT를 비롯한 다양한 생성형 AI 기술이 대중화되면서 그동안 사람이 독점해왔던 '창작'의 개념이 흔들리고 저작권 체계와 정책 방향을 재정립해야 한다는 공감대가 형성됐다. 남 교수는 AI 기술이 엔터테인먼트 및 미디어 산업에 광범위하게 침투하고 있음을 강조했다. 현재 AI는 스토리 초안 생성, 음악·영상 편집, 광고 제작 등 창의적인 산업의 운영 과정 전반에서 효율성을 높이며 산업구조를 재편하고 있다. 실제로 과거에는 디자이너와 작가가 오랜 시간 공들여야 했던 콘셉트 아트나 스토리보드를 AI가 순식간에 내놓을 수 있게 되면서 창작 과정이 압축되고 있다. 또 엔터테인먼트 분야에서 AI를 활용해 맞춤형 콘텐츠를 추천하거나 실시간 번역·현지화를 통해 글로벌 시장 공략이 용이해지는 등 분명한 장점이 발생하고 있다. 다만 이러한 효율성 이면에는 새로운 문제가 도사리고 있다는 점을 남 교수는 강조했다. 대량 복제를 통해 다수의 작품을 즉각 생산하는 AI의 능력이 창작물의 '진정성'과 '희소성'을 약화시키고 있기 때문이다. 이러한 상황에 대해 그는 "소비자들이 AI가 만든 작품을 접했을 때 그 작품이 진정한 의미의 예술인지 아니면 단순한 알고리즘의 산물인지 고민하게 된다"며 "이는 결국 '창작자란 누구이며 예술적 가치는 어디서 오는가'라는 근원적 질문으로 이어진다"고 분석했다. 이어서 발표에 나선 김우균 법무법인 세종 변호사는 '생성형 AI 콘텐츠 활용에 대한 저작권 이슈'를 정면으로 다뤘다. 김 변호사는 AI가 학습 단계에서 기존 저작물을 대량 복제·전송하는 행위가 과연 저작권 침해인지의 여부에 대한 질문을 제기했다. 현재 미국, 유럽연합(EU), 일본 등 해외 국가들은 AI 학습 과정에서 발생하는 저작권 문제를 공정 이용(Fair Use)이나 예외 조항을 통해 완화하려는 입법적·사법적 시도를 시도하고 있다. 특히 미국은 학습을 위한 복제가 꼭 '표현 감상' 목적이 아니므로 일정 부분 허용하는 방향으로 논의를 전개하고 있다. EU나 일본 역시 텍스트·데이터 마이닝(TDM)에 대한 명시적 면책 규정을 두거나 저작권자가 반대하지 않는 한 학습 행위를 허용하는 식으로 제도화하고 있다. 반면 한국은 아직 명확한 법적 근거가 없고 사법적 판례도 미비한 상황이다. 김 변호사는 "지금과 같은 법적 공백 상태에서는 학습 과정부터 생성물에 이르기까지 다양한 저작권 이슈가 발생할 수 있다"며 "이는 창작자, 개발자, 소비자 모두에게 불안정한 환경을 초래한다"고 지적했다. 이는 저작권 인정에 대한 딜레마로 이어진다. 현재의 모호한 제도로는 AI가 만든 창작물에 대한 저작권을 인정하기 어렵기 때문이다. 저작권법은 원칙적으로 '인간'이 창작한 표현물에만 권리를 부여하는데 AI가 독자적으로 만들어낸 결과물은 여기에 해당하지 않는 상황이다. 또 생성 AI에 대한 프롬프트 입력은 단순히 아이디어 제공에 그치는 경우가 대부분이다. 이 때문에 기존 저작권 개념으로는 모델의 개발 회사나 프롬프트 엔지니어에게 저작권을 부여하기 어렵다. 이러한 상황에 대해 김 변호사는 "정당한 보상을 창작자에게 돌리는 대안적 장치 마련이 시급하다"며 "AI 산업의 성장 이면에 기존 창작자들의 권익 보호를 위한 새로운 패러다임이 필요하다"고 설명했다. 이날 이어진 세미나의 토론 세션은 황창근 홍익대학교 법학과 교수가 사회를 맡아 진행했다. 토론에는 남 교수와 김 변호사를 비롯해 김경숙 상명대학교 교수, 박구만 서울과학기술대학교 교수, 이원태 아주대학교 교수, 최진응 국회입법조사처 조사관, 한정훈 K-엔터테크허브 대표 등이 참여해 심도 있는 논의를 펼쳤다. 행사를 주최한 노창희 디지털산업정책연구소 대표는 "인공지능에 대해 규제를 강화하자는 입장이나 무조건 장려하자는 입장이 아니라 가치 중립적인 시각에서 논의의 장을 마련했다"며 "앞으로도 인공지능을 비롯한 디지털 산업의 다양한 이슈에 대해 공론의 장을 지속적으로 제공할 계획"이라고 밝혔다.

2024.12.09 17:31조이환

AI모델과 데이터 보호, '동형 암호'가 답이다

“머신러닝(ML)과 인공지능(AI)모델 활용으로 인한 데이터 유출 우려가 높습니다. 암호화된 데이터를 직접 연산할 수 있는 동형암호가 기업의 AI활용 방안을 제시합니다.” 천정희 크립토랩 대표는 데이터를 노출하지 않고 AI모델을 활용할 수 있는 방안을 제시했다. 크립토랩은 동형 암호(Homomorphic Encryption) 전문 스타트업이다. 동형 암호는 암호화된 데이터를 복호화하지 않고 직접 연산할 수 있는 기술이다. 데이터가 암호화된 상태에서 특정 계산을 수행하고, 그 결과를 암호화된 형태로 얻을 수 있다. 이 기술은 데이터를 노출하지 않고 유용한 정보를 추출할 수 있어 강력한 보안 수단으로 주목받는다. 기업과 기관은 ML과 AI모델로 업무 혁신을 꾀한다. 하지만, ML이나 AI모델에 기업 내부 정보나 고객 정보, 국가 중요 데이터가 활용될 때 어떻게 보호할 것인가가 이슈다. 천 대표는 “크립토랩의 동형 암호 '혜안(HEaaN)'은 고객 계좌정보나 거래내역, 환자 정보, 중요 시설 영상 정보 등을 암호화한 상태에서 활용할 수 있다”고 설명했다. 군 AI모델 암호화 실증 사업 수행 중 크립토랩은 최근 군과 관련된 AI모델 암호화 실증 사업 과제를 수주했다. 영상 객체 인식 AI모델을 동형 암호화해 암호화한 상태에서도 정확도와 속도를 유지할 수 있는지를 검증한다. 군사 작전 수행 과정에서 생성형 AI플랫폼을 안전하게 운용할 수 있도록 암호화된 RAG기반의 생성형 AI 플랫폼을 실증한다. 천 대표는 "크립토랩은 데이터 보호뿐만 아니라 인공지능 모델을 안전하게 운영하는 기술 개발에도 힘쓰고 있다"면서 "현재까지 ML에 최적화한 동형 암호 기술을 완성했고 향후 소형언어모델(sLLM) 적용까지 바라보고 있다"고 설명했다. 천 대표는 서울대 수리과학부 교수이기도 하다. 2016년 4세대 동형 암호를 개발한 후 사업화 필요성을 절감했다. 동형 암호는 46년된 기술이다. 데이터 수요가 급증하면서 동형암호 수요 증가가 점쳐졌기 때문이다. 이후 2017년 크립토랩을 설립했다. 그는 “66건의 특허를 등록하고 184건은 출원하면서 동형 암호 기술의 가능성을 깨달았다”면서 “기술을 제대로 이해하고 상용화할 전문경영인을 찾다가 직접 스타트업을 설립했다”고 설명했다. 크립토랩은 전세계에서 가장 빠른 동형암호 제품 라인업을 가졌다고 자부한다. 4세대 동형암호 'CKKS' 원천 기술을 기반으로 동형암호 라이브러리 '혜안'을 내놨다. 크립토랩은 미 국방부 DARPA 과제를 두번 수주했고 스타트업 최초로 가트너 동형 암호 기술 부분 샘플 벤더로 선정되는 등 해외에서 기술력을 검증받은 스타트업이다. 혜안 인사이드 시대 꿈꾼다 천 대표는 “10여개 분야에서 동형 암호를 적용한 시범사업이 진행 중”이라면서 “마크로젠과 유전체 데이터 분석을 통한 맞춤형 의료 서비스를 비롯해 금융, 국방, 의료에 적용되고 있다”고 설명했다. 동형 암호는 미국 등 선진국에서 활용이 증가하고 있는 분야다. 미국 국립과학재단(NSF)과 국방과학연구소(DARPA) 등이 동형 암호 연구와 투자를 늘렸다. 그는 “최근 정부와 금융권은 망분리 규제 개선안을 발표하고 데이터 등급에 맞춘 다층보안체계(MLS)를 발표했다”면서 “동형 암호는 데이터별로 등급에 맞춰 암호화하는 것은 물론 권한에 따라 안전하게 데이터를 취급할 수 있는 길을 제시한다”고 말했다. 천 대표는 “모든 데이터를 처리할 때마다 '혜안 인사이드(HEaaN inside!)'되는 날을 꿈꾼다”면서 “동형 암호를 기반으로 민감한 정보의 안전한 활용 시대를 열 것”이라고 강조했다.

2024.12.09 17:05김인순

"산업 현장 데이터가 경쟁력"…LG, '엑사원 3.5'로 오픈소스 AI 시장 공략

LG AI연구원이 오픈소스 AI 모델 '엑사원(Exaone) 3.5'를 공개했다. 이번 발표는 초경량(2.4B), 범용(7.8B), 고성능(32B) 모델을 모두 오픈소스로 공개한 국내 기업 중 보기 드문 사례로, 글로벌 오픈소스 AI 시장에서 산업 특화 '니치(niche)' 공략에 나서겠다는 전략으로 해석된다. 9일 업계에 따르면 메타의 '라마(LLaMA)'는 오픈소스 AI 시장에서 현재 압도적인 1인자로 자리하고 있다. 메타는 지난 2022년 이후 다양한 크기의 모델을 공개하며 연구자와 기업들로부터 폭넓은 피드백을 받아왔다. 12월 기준으로 6억5천만 회 이상을 기록한 '라마' 앱 다운로드는 그 생태계가 얼마나 탄탄한지를 보여준다. 매개변수 규모도 거대하다. 가장 최신인 '라마 3.3'의 매개변수는 700억(70B) 파라미터로, '엑사원' 고성능 모델과 비교해 약 두 배 가까운 차이를 보인다. 실제로 라마의 지배력에 도전장을 내밀었던 오픈소스 경쟁자들의 성과는 미미했다. 마크롱 프랑스 대통령의 지원을 받는 초거대 AI 기업인 미스트랄은 올해 초 완전 오픈소스 라이선스를 적용한 모델을 출시하며 시장에 도전했으나 '라마' 생태계의 벽을 넘지 못하고 한정된 사용자층 확보에 그쳤다. 이러한 빅테크의 오픈소스 AI 시장 독주 속에서 LG AI연구원은 단순히 파라미터를 늘리는 대신 효율성을 극대화하는 경량화 전략을 내세우고 있다. '라마' 최신 모델의 절반 수준인 32B 모델만으로 고성능을 구현하면서도 전력 소비와 운영 비용을 대폭 줄여 실질적인 산업 적용이 가능하게 한 것이다. 이러한 전략을 시도할 수 있었던 것은 LG가 축적해온 전문 데이터 때문이다. LG 계열사들은 생화학·병리학·제조업 등 다양한 산업 분야에서 고품질 도메인 데이터를 확보해왔다. 이 데이터를 활용해 엑사원의 성능을 강화하면서도 매개변수 규모는 줄이는 효율적인 모델 설계가 가능했다는 설명이다. LG 관계자는 "엄청난 자금력을 가진 빅테크들과 같은 전략을 쓰는 대신 회사가 오랜 기간 쌓아온 자체 데이터를 활용해 산업별 맞춤형 역량을 제공하는데 집중하고 있다"며 "단순히 크롤링한 데이터가 아닌 양질의 도메인 데이터가 특화의 비결"이라고 설명했다. 이러한 전문 데이터 기반 경량화 전략은 실질적인 성과로 이어지고 있다. 최근 LG는 병리학 모델인 '엑사원 패스(EXAONEPath)'를 개발해 기존 대비 10배 경량화된 모델로도 우수한 성능을 구현했다. 이 모델은 특히 병리학 데이터에서 높은 정확도를 기록하며 글로벌 의료 AI 시장에서도 주목받았다. 이로 인해 LG는 현재 잭슨 랩(Jackson Laboratory)과 협업을 진행하고 있다. 잭슨 랩은 전임상 시험 분야에서 세계 최고의 기술력을 보유한 미국의 연구기관으로, LG의 우수한 병리학 데이터 덕분에 협업을 결정한 것으로 알려졌다. 이에 더해 LG AI연구원은 경량화를 넘어 대규모 행동모델(LAM, Large Action Model) 기반 AI 에이전트를 개발해 산업 현장에서의 혁신을 앞당길 계획이다. 단순히 생성형 AI에 그치지 않고 복합적인 기술을 통합해 산업 전반에 실질적인 가치를 제공하려는 의도로 풀이된다. LG 관계자는 "거대 생태계를 구축한 빅테크와 동일한 전략을 취하기보다는 선택과 집중을 통해 강점을 극대화하고 있다"며 "LLM뿐만 아니라 다양한 AI 기술에서의 기술적 돌파구를 모색하고 도메인 특화 데이터를 기반으로 산업 전반의 주요 문제를 해결하는 데 기여할 것"이라고 강조했다.

2024.12.09 14:59조이환

"누구나 비전언어모델 사용"…구글, 신형AI '팔리젬마2' 오픈소스로 공개

구글이 사람처럼 보고, 이해하고, 상호작용할 수 있는 신형 비전언어모델(VLM)을 오픈소스로 공개했다. 이를 통해 의료, 제조 등 다양한 산업 분야에서 보다 효율적으로 AI를 활용할 수 있을 전망이다. 5일 구글 딥마인드는 오픈소스 VLM '팔리젬마2(PaliGemma2)'를 공식 블로그를 통해 공개했다. 비전언어모델은 사람처럼 이미지와 텍스트를 함께 학습하고 업무를 처리하는 AI 모델이다. 이를 통해 두 가지 데이터 유형이 독립적으로 처리되었을 때 놓칠 수 있는 정보 간 연관성을 이해하고 처리할 수 있는 것이 특징이다. 구글의 팔리젬마2는 젬마2 언어 모델 기반으로 개발돼 언어 처리 성능을 향상시켰다. 이를 통해 세부 사항을 요구하는 작업을 보다 정확하게 수행할 수 있으며 복잡한 작업의 완성도도 높일 수 있다. 특히 구글의 AI전용 프로세서 TPUv5를 활용해 학습 효율성을 극대화했으며 일반 PC 환경에서도 효과적으로 실행될 수 있도록 최적화 작업을 거쳤다. 기존 페일젬마는 224px 해상도만 지원한 반면 팔리젬마2는 448px와 896px등 고해상도 까지 지원해 실제 활용할 수 있는 업무 범위를 확대했다. 이 밖에도 세밀한 글씨를 정확히 감지하고 인식하기 위한 광학문자인식(OCR) 등의 기능을 개선했다. 고해상도도 이미지를 학습하고 구연할 수 있어 ICDAR 15와 토털텍스트 데이터셋 벤치마크에서 이전 최고 성능 모델을 능가하며 F1 점수 75.9를 기록하며 VLM 중 가장 우수한 성능을 달성했다. 구글 딥러잉 측은 페일젬마2를 활용해 더욱 복잡한 분자구조나 X레이 이미지를 분석하고 음악 파형 등을 인식해 디지털 변환하는 과정의 정확도를 높이는 등 다양한 분야에 활용할 수 있을 것으로 예측하고 있다. 구글의 다니엘 카이저스 연구 엔지니어는 "볼 수 있는 맞춤형 AI를 구축하는 것은 복잡하고 리소스 집약적인 노력이 요구됐다"며 "하지만 이제는 팔리젬마2를 통해 누구나 시각적 입력을 이해하고 상호작용할 수 있는 AI를 활용할 수 있게됐다"고 말했다.

2024.12.06 10:25남혁우

  Prev 11 12 13 14 15 16 17 18 19 20 Next  

지금 뜨는 기사

이시각 헤드라인

2나노에 묶인 삼성 '엑시노스' 로드맵…최적화가 성패 가른다

서로 닮아가는 채용 플랫폼…데이팅·사주로 차별화 꾀하기도

작고 강하게…한국형 '로봇 손' 주도권 놓고 각축전

"따로 또 같이"...글로벌 서비스 ‘라인’은 현지화+기술통합 어떻게 하나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.