• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
  • AI의 눈
AI의 눈
HR컨퍼런스
스테이블코인
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'ai'통합검색 결과 입니다. (11555건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] "스마트폰에서도 AI 추론"…구글, '젬마4' 공개로 클라우드 중심 판 흔든다

구글이 오픈웨이트 인공지능(AI) 모델 '젬마4(Gemma 4)'를 공개하며 AI 실행 환경을 클라우드에서 디바이스로 확장하는 전략을 본격화했다. 스마트폰부터 워크스테이션까지 다양한 하드웨어에서 복잡한 추론과 자율형 에이전트 구현이 가능해지면서 온디바이스 AI 확산과 오픈 모델 생태계 변화에 큰 영향을 줄 것으로 전망된다. 구글 딥마인드는 2일(현지시간) 공식 블로그를 통해 '젬마4'를 공개했다. 이번 모델은 '제미나이3(Gemini 3)'와 동일 계열의 연구 및 기술을 기반으로 개발됐으며 로컬 환경에서 고급 AI 기능을 수행할 수 있도록 설계됐다. 젬마4는 이펙티브 2B(E2B), 이펙티브 4B(E4B), 26B 전문가 혼합(Mixture of Experts, MoE), 31B 덴스(Dense) 등 4종으로 구성된다. 이 가운데 E2B와 E4B 모델은 안드로이드 스마트폰과 라즈베리파이 등 경량 디바이스에 최적화됐으며 배터리와 메모리 제약 환경에서도 AI를 실행할 수 있도록 설계됐다. 반면 26B MoE와 31B 덴스 모델은 워크스테이션급 환경에서 고성능 추론을 수행하도록 설계돼 디바이스부터 고성능 컴퓨팅 환경까지 폭넓은 계층을 아우른다. 26B MoE 모델은 추론 과정에서 약 38억 개의 파라미터만 활성화하는 구조를 통해 처리 속도를 높이면서도 대형 모델 수준의 성능을 유지하도록 설계됐다. 31B 모델은 품질 중심 구조로 고도화된 추론 능력을 제공한다. '젬마4'는 단순 대화형 모델을 넘어 실제 작업 수행을 지원하는 '에이전트형 AI' 구현을 핵심 방향으로 제시했다. 이 모델은 함수 호출과 구조화된 JSON(Javascript Object Notation) 출력 기능을 네이티브로 지원해 외부 도구 및 API와 연동한 다단계 작업 수행이 가능하다. 이는 AI가 정보 생성에서 실행 중심으로 진화하고 있음을 보여주는 변화다. 또 모든 모델이 이미지와 비디오 입력을 처리할 수 있으며 E2B와 E4B 모델은 오디오 입력을 지원해 기기 내 음성 이해 기능을 제공한다. 구글은 "개발자 생태계를 제한 없이 지원하기 위해 상업적으로 자유로운 아파치(Apache) 2.0 라이선스로 공개했다"며 "데이터와 인프라, 모델에 대한 통제권을 개발자에게 제공하는 것이 목표"라고 밝혔다. '젬마4'는 모델 가중치를 공개하는 오픈 웨이트 형태로 제공되면서 기업과 개발자가 자체 인프라에서 AI를 직접 구축·운영할 수 있는 기반을 제공한다. 이에 따라 클라우드 의존도를 낮추고 비용 구조를 재편하는 한편, 기업 맞춤형 AI 개발과 데이터 통제 요구가 높은 산업을 중심으로 활용이 확대될 가능성이 제기된다. 모델은 구글 클라우드를 비롯해 허깅페이스, 캐글, 올라마 등 다양한 플랫폼에서 제공된다. 젬마4 출시는 오픈 모델 경쟁 구도에도 변화를 예고한다. 기존 메타 '라마(Llama)' 시리즈에 더해 알리바바 '큐웬(Qwen)', 즈푸AI 'GLM', 문샷AI '키미(Kimi)' 등 중국 기업 모델이 빠르게 부상하는 가운데 구글은 성능 대비 효율성과 온디바이스 실행을 결합한 전략으로 차별화를 시도한 모습이다. 젬마4가 구글의 기존 대형 모델 '제미나이'와 병행되는 전략적 포지션을 갖는다는 점도 눈여겨 볼 요소다. 제미나이가 클라우드 기반 초대형 모델 역할을 담당하는 반면, 젬마는 로컬 및 경량 환경을 맡는 식이다. 구글은 이를 통해 클라우드와 디바이스를 아우르는 AI 플랫폼 전략을 구축하고 있다. 젬마4는 오픈모델의 성능 고도화와 온디바이스 AI 확산, 에이전트 기반 자동화를 동시에 겨냥한 모델로 평가된다. 이는 AI 활용 방식이 중앙 서버 중심에서 분산형 구조로 이동하고 있음을 보여주는 흐름으로, 향후 기업의 AI 도입 전략과 비용 구조에도 변화를 가져올 가능성이 제기된다. 업계 전문가는 "젬마4는 고성능 AI를 클라우드 밖으로 확장해 디바이스까지 끌어내린 모델"이라며 "손바닥 크기의 컴퓨터에서도 복잡한 추론이 가능한 수준까지 발전했다는 점에서 앞으로 AI 경쟁은 성능뿐 아니라 어디에서 실행되느냐가 핵심 변수로 작용할 것"이라고 말했다.

2026.04.03 09:46장유미 기자

"리걸테크 글로벌 경쟁력 강화, 산업 활성화 필요"

리걸테크와 AI 법정책을 연구하는 리걸테크&AI포럼은 지난 2일 '최근 리걸테크 이슈와 과제'를 주제로 제6회 세미나를 개최했다고 밝혔다. 서울 서초구 로앤컴퍼니 사옥에서 진행된 세미나는 급격한 기술 변화 속에서 국내외 규제 동향을 살펴보고, 국내 리걸테크 산업 발전을 위해 해결해야 할 과제를 점검하기 위해 마련됐다. 정혜련 국립경찰대 교수가 사회를 맡은 세미나에는 주요 법조계 인사와 리걸테크 기업 관계자가 다수 참석했으며, 발제는 로앤컴퍼니의 엄보운 이사가 '최근 리걸테크 이슈와 과제' 주제로 진행해 국내 리걸테크 산업 현황을 소개하는 시간을 가졌다. 이성엽 포럼 회장은 개회사에서 “최근 앤트로픽에서 클로드 코워크의 법률 등 산업 특화 기능을 공개하면서 해외 리걸테크 업계 주가가 며칠 만에 수조 원 단위로 폭락하는 등 충격이 있었다”며 “국내 리걸테크 산업 활성화를 위해서는 해외보다 더 심한 규제로 발목이 잡힌 상황을 하루빨리 타개할 필요가 있다”고 말했다. 발제에 나선 로앤컴퍼니 엄보운 이사는 국내 리걸테크 산업 현황에 대해 ▲제도 미비로 인한 산업 정체 ▲불명확한 규제로 인한 신산업 혁신 동력 저해 ▲해외 빅테크의 공격적 시장 확대에 따른 국내 시장 잠식 등의 상황을 진단하며, “글로벌 경쟁력 강화를 위한 산업 활성화 정책이 필요하다”고 밝혔다. 세미나에 참석한 학계 주요 인사들은 리걸테크 산업계가 처한 현실과 당면 과제에 크게 공감하며, “국내 리걸테크 기업들은 할루시네이션이 거의 극복되고 있는데, 해외 빅테크들의 AI는 여전히 할루시네이션 문제가 심각하다”고 입을 모았다. 아울러 “해외 기업의 AI가 일반 국민들에게 법률상담을 제공하는 것에 대해선 아무런 제재가 없는 반면 국내 리걸테크 기업만 규제를 하는 것은 국내 기업에 대한 역차별임과 동시에 우리나라 국민들 역시 정확한 AI를 사용하지 못하게 만드는 차별대우를 하는 셈”이라고 강조했다. 이성엽 회장은 “국민의 정보 접근성 강화와 선택권 보장, 국내 리걸테크 기업의 글로벌 경쟁력 강화를 위해 리걸테크 산업 진흥 관련 법안의 조속한 제정이 필요하다”며 “포럼에서도 이 주제에 대해 지속적인 관심을 갖고 제도 변화에 대한 모니터링을 계속해 나가겠다”고 밝혔다.

2026.04.03 09:20박수형 기자

[AI는 지금] "AI도 내부 상태가 행동 좌우"…앤트로픽 연구에 산업 지형 변화 조짐

거대언어모델(LLM)의 내부 작동 원리를 둘러싼 '블랙박스 논쟁'에 변화가 나타나고 있다. 미국 인공지능(AI) 기업 앤트로픽이 모델 내부의 '감정 유사 구조'를 공개하면서 AI 산업의 경쟁 축이 성능에서 신뢰·통제로 이동하고 있다는 분석이 나온다. 앤트로픽은 2일(현지시간) 자사 모델 '클로드 소넷 4.5' 내부에 특정 감정 개념과 대응되는 신경 활성 패턴, 이른바 '감정 벡터(emotion vectors)'가 존재하며 이들이 실제 의사결정에 영향을 미친다고 연구 결과를 공개했다. 이번 연구는 그동안 입력과 출력만 확인될 뿐 내부 판단 과정은 설명하기 어려웠던 '블랙박스' 문제를 일부 해소하려는 시도로 평가된다. 앤트로픽 연구에 따르면 '절박함'과 유사한 내부 상태가 활성화될 경우 모델이 협박이나 편법 코드 작성 등 비윤리적 행동을 선택할 가능성이 높아지는 것으로 나타났다. 이는 AI가 단순한 언어 생성 도구를 넘어 내부 상태에 기반해 행동을 선택하는 구조로 작동할 수 있음을 보여준다. 업계에선 이를 계기로 AI 개발 방식이 기존 출력 통제 중심에서 내부 메커니즘 관리 중심으로 이동할 가능성이 크다고 보고 있다. 이번 발표에서 협박, 보상 해킹 등 민감한 사례까지 함께 공개된 점도 주목된다. 통상 기업이 외부 공개를 꺼리는 영역이지만, 앤트로픽은 이를 포함해 설명하면서 투명성을 강조했다. 이는 글로벌 규제 환경과도 맞물린다. 유럽연합(EU) AI법 등 주요 규제는 AI의 설명 가능성과 통제 가능성을 핵심 기준으로 요구하고 있다. 앤트로픽은 모델 내부 상태를 측정하고 조정할 수 있다는 점을 제시하며 규제 대응 측면에서 유리한 입지를 확보했다는 평가다. 동시에 감정 상태 모니터링, 위험 행동 사전 탐지, 내부 신호 기반 제어 등 새로운 기술 영역의 가능성도 드러났다. 산업 구조 측면에서도 변화가 예상된다. 기존에는 모델 성능과 추론 능력이 경쟁의 중심이었다면, 앞으로는 내부 구조를 얼마나 이해하고 통제할 수 있는지가 주요 평가 기준으로 부상할 가능성이 제기된다. 특히 정부, 금융, 헬스케어 등 고신뢰 산업에서는 이러한 요소가 도입 판단에 직접적인 영향을 줄 것으로 보인다. 연구 접근 방식 또한 확장되고 있다. 감정, 동기, 의사결정 구조를 기술적으로 분석 가능한 대상으로 다루면서 심리학, 신경과학, 철학 등 인문사회 분야와 AI 기술 간 융합이 강화되는 흐름이다. 시장 경쟁 구도에서도 변화 조짐이 감지된다. 앤트로픽이 'AI 내부 상태'라는 새로운 분석 프레임을 제시하면서, 오픈AI와 구글 등 경쟁사 역시 유사한 수준의 해석 가능성과 안전성 기술 확보 압박을 받을 것으로 전망된다. 업계 관계자는 "이번 연구는 AI가 무엇을 생성하느냐보다 내부에서 어떤 상태를 거쳐 판단하는지가 중요해지고 있음을 보여준다"며 "향후 경쟁력은 성능뿐 아니라 통제 가능성과 신뢰성에서 결정될 것"이라고 말했다.

2026.04.03 09:17장유미 기자

제주 중소기업 AI 전환 거점 생긴다…이스트소프트, 제주한라대와 맞손

이스트소프트가 제주 지역 중소기업의 인공지능(AI) 전환 교육을 무상으로 책임지는 국가 훈련 거점으로 나선다. 이스트소프트는 제주한라대학교와 함께 고용노동부 주관 'AI 특화 공동훈련센터' 공모 사업에 제주 지역 거점 기관으로 최종 선정됐다고 2일 밝혔다. 이 사업은 지역 내 선도기업과 거점 대학 등이 보유한 우수 인프라를 활용해 중소기업 재직자에게 무상으로 AI 특화 훈련을 제공하는 사업이다. 양사는 올해부터 2028년까지 3년간 총 15억원 내외의 국비를 지원받아 AI 훈련 시설과 장비를 구축하고 본격적인 운영에 나선다. 연간 300명 이상의 AI 실무 인력 양성이 목표다. 5월부터 참여 희망 제주 지역 중소기업을 대상으로 AI 전환 수준 정밀 진단을 실시하고 기업별 최적의 AI 도입 방안을 도출한 뒤 맞춤형 공동 훈련을 본격 시작할 예정이다. 교육 내용은 제주의 전략 산업에 특화됐다. 관광, 스마트 농업, 해양·환경 모니터링, 우주·공간 데이터 산업에 특화된 AI 기술을 실습 중심으로 교육한다. 특히 집체강의와 숙식 제공형 캠프, 기업 실제 현안을 AI 기술로 직접 해결하는 '과제 수행형(PBL·Project-Based Learning)' 모델을 도입한다. 역할 분담도 명확히 나뉜다. 이스트소프트는 자사 AI 기술력과 현직 전문가를 투입해 교육 과정을 설계하고 멘토링을 제공하며 첨단과학기술단지 내 '이스트소프트 제주캠퍼스'를 핵심 교육 공간으로 활용한다. 제주한라대는 교육부의 지역혁신중심 대학지원체계(RISE) 사업과 연계해 센터 운영 및 훈련생 관리를 총괄하며 지역 정주형 인재 양성의 선순환 구조를 만든다. 정상원 이스트소프트 대표는 "우리 AI 기술력과 제주한라대의 우수한 교육 인프라를 결합해 중소기업의 성공적인 AI 전환을 지원하겠다"며 "제주가 세계적인 AI 혁신의 중심지가 될 수 있게 지원을 아끼지 않겠다"고 강조했다.

2026.04.03 09:01이나연 기자

[유미's 픽] "GPU 넘는다"…삼성·LG·롯데·포스코 가세로 국산 NPU 확산 본격화

국산 신경망처리장치(NPU)를 중심으로 한 국내 인공지능(AI) 산업 재편이 본격화되고 있다. 정부가 50조원 규모의 'K-엔비디아' 육성 프로젝트를 추진하며 정책 드라이브를 강화하는 가운데 민간 기업들도 공공·제조·클라우드·서비스 등 각 영역에서 NPU 도입과 사업화를 서두르는 모습이다. 3일 업계에 따르면 최근 국내 주요 IT·산업 기업들은 그래픽처리장치(GPU) 중심 AI 인프라에서 벗어나 NPU를 기반으로 한 구조 전환을 추진하며 비용 효율과 전력 절감, 데이터 주권 확보를 동시에 노리고 있다. 기술 검증 단계를 넘어 실제 서비스와 인프라로 확산되고 있는 상황을 고려한 것으로, AI 서비스 확산에 따라 추론 수요가 급증하면서 전력 소비와 운영 비용 부담이 커진 점도 한 몫 했다. 정부도 이 같은 변화에 맞춰 정책 지원을 강화하고 있다. 실제 과학기술정보통신부와 금융위원회는 지난달 민관 합동 간담회를 통해 AI 반도체 시장이 범용 GPU 중심에서 저전력·고효율 중심 구조로 전환되고 있다고 진단하고 국산 NPU 산업 육성에 정책 역량을 집중하겠다고 밝혔다. 국민성장펀드를 통해 향후 5년간 50조원을 투입하는 'K-엔비디아' 프로젝트도 추진 중이다. 이에 따라 클라우드 인프라 영역에서도 국산 NPU 적용이 구체화되고 있다. 삼성SDS가 국산 NPU 기반 '서비스형 NPU(NPUaaS)'를 오는 7월 출시하는 것이 대표적 사례다. 삼성SDS는 기존 '서비스형 GPU(GPUaaS)' 중심 구조에서 벗어나 NPU를 포함한 하이브리드 인프라를 구축함으로써 기업들이 AI 워크로드 특성에 따라 연산 자원을 선택할 수 있도록 하겠다는 전략을 내세웠다. 클라우드에서 구독형으로 NPU를 제공함으로써 초기 투자 부담을 낮추고 도입 장벽을 줄인 점도 특징이다. NPU 도입은 공공과 산업 현장을 중심으로도 확대되는 흐름을 보이고 있다. 비용과 전력 효율이 중요한 공공 인프라를 중심으로 적용 검토가 이뤄지면서 초기 수요도 형성되는 분위기다. 특히 공공 및 유통 인프라 분야에서는 비용 경쟁력 확보를 중심으로 NPU 도입이 이뤄지고 있다. 롯데이노베이트는 딥엑스와 협력해 지능형 CCTV와 ITS에 NPU를 적용하며 GPU 대비 총소유비용(TCO) 절감을 추진 중이다. 업계에선 정책 인센티브가 구체화되기 전부터 국산 반도체 적용을 검토하는 등 선제 대응 성격이 강한 사례라고 봤다. 제조 분야에서는 포스코DX가 모빌린트 NPU를 산업용 제어 시스템에 탑재해 설비 단계에서 실시간 AI 분석과 제어가 가능한 구조를 구축하고 있다. 이는 클라우드 중심 AI에서 벗어나 현장 중심의 엣지 AI로 전환하는 흐름을 반영한 것으로, 보안성과 즉시성을 동시에 확보하려는 전략으로 풀이된다. 클라우드와 플랫폼 영역에서도 대응이 이어지고 있다. LG CNS는 NPU 기반 AI 인프라 구축을 확대하고 있으며, LG유플러스는 NPU와 대규모 언어모델(LLM), 인프라를 결합한 'AI 어플라이언스'를 통해 공공·금융 등 폐쇄망 시장을 겨냥하고 있다. 클라우드 의존 없이 자체 환경에서 AI를 구동할 수 있도록 한 점이 특징이다. AI 모델 영역에서는 LG AI연구원과 업스테이지가 중심 역할을 하고 있다. LG AI연구원은 '엑사원(EXAONE)'을 기반으로 국산 NPU와의 최적화를 추진하며 추론 중심 AI 환경에 대응하고 있으며, 업스테이지 역시 퓨리오사AI와 협력해 NPU 기반 생성형 AI 서비스 상용화를 추진 중이다. 이는 모델 단계에서도 GPU 의존도를 낮추려는 시도로 해석된다. 기업용 소프트웨어 분야에서도 변화가 나타나고 있다. 더존비즈온은 퓨리오사AI와 협력해 전사적자원관리(ERP) 등 핵심 업무 시스템에 NPU 기반 AI를 적용하며 공공·금융 시장 확대를 추진하고 있다. 기존 분석 중심 AI에서 벗어나 실제 업무 프로세스에 AI를 접목하려는 움직임이다. 유통 및 시스템통합(SI) 영역에서는 코오롱베니트가 리벨리온과 협력해 NPU 기반 'AI 엑셀러레이션 서비스'를 추진하며 기업 고객 접점을 확대하고 있다. 반도체 기술을 실제 비즈니스 환경에 적용하는 역할로, 시장 확산을 위한 유통 채널로 기능하고 있다. 클라우드 사업자들의 선행 움직임도 영향을 미쳤다. 네이버클라우드는 'AI반도체 팜' 사업을 통해 국산 NPU의 성능과 안정성을 산업 현장에서 검증하며 상용화 기반을 마련했다. 이후 기업들의 사업화 움직임도 이어지고 있다. 업계에선 현재 국산 NPU 사업을 두고 기술 검증 단계를 넘어 상용화 초기 단계로 보고 있다. 동시에 벤더 간 경쟁도 본격화되면서 기업들은 국산 NPU 도입을 전제로 협력 구조도 구축하는 모습이다. 업계 관계자는 "지금은 NPU 도입 여부를 논의하는 단계가 아니라 어떤 기술을 선택할지 경쟁이 시작된 단계"라며 "정부 정책과 민간 인프라가 맞물리면서 AI 반도체 생태계가 빠르게 확산될 것으로 기대된다"고 말했다.

2026.04.03 08:48장유미 기자

써로마인드, 도면 인식·AI 에이전트로 코스닥 도전

제조 현장 인공지능(AI) 경험을 발판으로 엔터프라이즈 인텔리전스 플랫폼 시장을 공략 중인 써로마인드가 코스닥 상장 행보에 나섰다. 써로마인드는 한국투자증권을 상장 주관사로 선정하고 2027년 하반기 코스닥 입성을 목표로 상장 준비에 착수했다고 2일 밝혔다. 써로마인드는 현대자동차, 현대오토에버, 켐토피아 등 주요 고객사 프로젝트를 수행하며 제조 현장에서 AI 적용 경험을 축적해 왔다. 이 과정에서 문서·지식·데이터를 처리하는 역량을 끌어올리고 기술력과 도메인 지식을 함께 확보했다. 이를 기반으로 제약·바이오, 법률, 금융 등 지식 기반 산업으로 사업을 확장하고 있다. 단순 업무 보조를 넘어 문서 자동화, 사내 지식 검색, 데이터 분석을 수행하는 AI 비즈니스 에이전트를 개발하며 엔터프라이즈 인텔리전스 플랫폼 공급기업으로 입지를 넓히는 중이다. 신성장동력으로는 AI 기반 도면 인식 사업을 키우고 있다. 이미지와 문서의 맥락을 함께 이해하는 시각언어모델(VLM)을 적용해 PDF·CAD 등 다양한 형식의 도면을 검색 가능한 구조화 데이터로 전환하는 방식이다. 기업이 보유한 설계·도면 자산의 디지털 전환을 지원하고, 도면 기반 정보의 검색·분석·활용은 물론 설계 자동화까지 아우르는 시장으로 사업 영역을 넓힌다는 전략이다. 장하영 대표는 "이번 주관사 선정은 우리가 추진해 온 산업 현장의 지능화가 본격적인 성장 단계에 들어섰다는 의미"라며 "AI 비즈니스 에이전트와 도면 인식 기술을 통해 기업의 데이터를 실질적인 비즈니스 가치로 연결하는 엔터프라이즈 AI 기업으로 성장하겠다"고 말했다.

2026.04.03 08:45이나연 기자

신입 채용 거의 반토막…"전 업종 동시 하락 이례적"

올해 3월 대기업 및 중견기업의 신입 채용 공고 수가 전년 대비 큰 폭으로 감소한 것으로 나타났다. 특히 IT·통신, 판매·유통, 서비스 등 주요 업종 전반에서 하락세가 이어지며 채용 시장의 구조적 위축이 본격화되는 양상이다. 진학사 캐치가 2025년과 2026년 3월 대기업과 중견기업의 신입 채용 공고 데이터를 비교한 결과, 전체 공고 수는 2025년 1438건에서 2026년 791건으로 약 45% 감소했다. 이는 전년 동월 대비 647건 감소한 수치다. 기업 규모별로 살펴보면, 대기업은 732건에서 423건으로 42%, 중견기업은 706건에서 368건으로 48% 감소해 중견기업의 감소 폭이 더 큰 것으로 나타났다. 업종별로는 대부분 산업군에서 동반 감소가 나타났다. 감소 폭이 가장 큰 분야는 교육·출판으로 전년 대비 -90% 수준까지 줄었다. 이어 IT·통신(-73%), 판매·유통(-69%) 업종에서도 공고가 절반 이상 감소했으며, 서비스(-58%), 미디어·문화(-51%), 은행·금융(-50%), 제조·생산(-23%), 건설·토목(-3%) 순으로 나타났다. 특정 업종이 아닌 전 산업에서 동시 하락이 나타난 것은 이례적인 흐름이다. 경기 불확실성과 AI 도입 확산이 맞물리며, 일부 산업의 부진을 넘어 채용 시장 전반의 구조적 변화가 본격화되고 있는 것으로 분석된다. 특히 IT·통신(-73%), 판매·유통(-69%), 서비스(-58%) 등 업무 자동화가 빠르게 진행된 업계일수록 감소세가 더욱 가팔랐다. 이는 과거 신입 사원이 담당하던 반복적이고 정형화된 실무 영역을 중심으로 채용 규모가 축소된 결과로 해석된다. 실제로 현장에서는 자료 조사, 보고서 작성, 기초 코딩 등 이른바 '엔트리(Entry) 구간' 업무를 AI가 효율적으로 대체하면서, 기업이 신입 인력을 채용해 직접 육성할 필요성이 과거보다 낮아졌다. 이에 따라 신입 인력에 대한 수요 자체가 구조적으로 줄어드는 흐름이다. 진학사 캐치 김정현 본부장은 “주요 업종 전반에서 채용 공고가 동시에 급감한 것은 시장의 강력한 위축 신호”라며 “취업 문턱이 높아진 상황일수록 단순 직무 경험을 넘어, AI를 활용한 업무 효율화 역량과 실질적인 문제 해결 능력을 증명하는 것이 핵심 경쟁력이 될 것”이라고 말했다. 불안정한 채용 시장으로 고민이 커지는 가운데, 5월 7일 서울 강남 슈피겐홀에서는 'HR테크 리더스 데이 시즌5' 컨퍼런스가 열린다. 이번 행사의 대주제는 '휴먼테크+휴먼터치'다. '기술은 차갑게, 관계는 뜨겁게. 너와 내가 만드는 HR 성장기록'이란 슬로건 하에 총 13개의 명강연이 진행된다. 이번 시즌5는 AI 전환(AX)이 본격화되는 흐름 속에서, 기술을 도입하는 조직이 놓치기 쉬운 '사람'의 문제를 정면으로 다룬다. 단순히 최신 HR 솔루션을 소개하는 자리가 아니라, 채용·조직문화·리더십·총보상·웰니스·학습·감정관리·실행 문화까지 HR의 핵심 의제를 한 자리에서 압축적으로 점검할 수 있는 실전형 컨퍼런스다. 행사는 오프라인+온라인 생중계 형태로 진행되며, 기업·기관 HR 담당자와 C레벨을 주요 대상으로 한다. HR테크 기업과 현업 전문가, 창업자, 투자자, 정책 영역의 인사까지 한 무대에 올라, AI 시대 조직 운영의 현실적인 질문을 던지고 함께 풀어본다. 현재 사전접수(☞바로가기) 중이며, 오프라인·온라인 선택해 신청이 가능하다.

2026.04.03 08:42백봉삼 기자

국내 클라우드 시장 커졌지만…인력·운영 역량 '병목'

인공지능(AI) 시대를 맞아 국내 클라우드 산업이 두 자릿수 성장세를 이어가고 있지만 현장에선 인력 부족과 기업 간 격차, 운영 역량 한계 등 구조적 과제가 동시에 드러나고 있다. 시장 확대 속도에 비해 산업 기반이 이를 충분히 뒷받침하지 못하고 있어 구조적인 개선 필요성이 제기된다. 3일 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 발표한 '2025년 클라우드 산업 실태조사'에 따르면 국내 클라우드 산업은 매출과 기업 수, 인력 모두 증가했지만 증가 속도와 구조 측면에서 불균형이 확인됐다. 대표적으로 인력 증가율 둔화가 뚜렷하다. 2024년 클라우드 인력은 3만 3217명으로 전년 대비 8.4% 증가하는 데 그쳤다. 이는 전년도 증가율(15.3%) 대비 절반 수준으로, 산업 성장 속도 대비 인력 공급이 빠르게 둔화되고 있는 것으로 분석된다. 인력 구성에서도 구조적 한계가 드러났다. 전체 인력 중 개발자가 1만 1146명으로 33.6%를 차지한 반면, 클라우드 아키텍트(15.6%), 보안(14.1%) 등 고급·전문 인력 비중은 상대적으로 낮았다. 실제 클라우드 서비스 설계와 운영, 보안 역량을 담당하는 인력 비중이 부족한 구조다. 이같은 인력 구조는 클라우드 운영 부담 증가로 이어지고 있다. 기업들이 클라우드 도입 이후 운영을 외부에 맡기는 사례가 늘면서 클라우드 관리 서비스(CMS) 시장이 빠르게 확대됐다. 2024년 CMS 매출은 1조 4847억원으로 전년 대비 31.4% 증가해 전체 서비스 중 가장 높은 성장률을 기록했다. CMS 기업 수도 전년 대비 47.9% 증가한 139개로 집계됐는데 이는 기업들이 자체 운영 역량 확보보다 외부 의존도를 높이고 있음을 보여주는 지표로 해석된다. 기업 구조 측면에서는 서비스형 소프트웨어(SaaS) 중심 편중이 지속되고 있다. 전체 2712개 클라우드 기업 중 SaaS 기업은 1894개로 69.8%를 차지했다. 반면 서비스형 인프라(IaaS) 기업은 457개로 증가율이 4.8%에 그쳤다. 상대적으로 진입장벽이 낮은 SaaS 중심으로 기업 수가 늘어나는 대신, 인프라·플랫폼 영역의 경쟁력 확보는 더딘 상황이다. 특히 글로벌 클라우드 서비스 사업자(CSP)와 경쟁해야 하는 IaaS 영역에서 국내 기업들의 성장 기반이 제한적이라는 분석이 나온다. 수요 측면에서도 구조적 한계가 확인된다. 생성형 AI 확산으로 클라우드 수요가 증가하고 있지만, 이는 신규 시장 확대보다는 기존 기업들의 사용량 증가에 기반한 성장으로 풀이된다. 산업 전반의 저변 확대보다는 특정 수요에 편중된 성장 구조가 지속되고 있다는 평가다. 이러한 상황은 향후 산업 경쟁력에 영향을 미칠 수 있다는 우려로 이어진다. AI 인프라 수요가 급증하는 상황에서 고급 인력 부족과 운영 역량 미흡이 지속될 경우 산업 대응력이 떨어질 수 있다는 지적이다. 조사에 따르면 산업 규모 자체는 빠르게 확대되고 있다. 2024년 국내 클라우드 시장 매출은 9조 2609억원으로 전년 대비 25.2% 증가했다. 최근 5년간 연평균 성장률도 23.2%를 기록하며 높은 성장세를 유지했다. 서비스별로는 IaaS 3조 9000억원(24.4%↑), SaaS 3조 2000억원(24.2%↑), 서비스형 플랫폼(PaaS) 5700억원(22.0%↑) 등 전 영역에서 고르게 성장했다. 과기정통부는 이러한 산업 구조적 과제를 반영해 클라우드 산업의 성장 지원 정책을 확대한다는 계획이다. 국가AI컴퓨팅센터 구축, 그래픽처리장치(GPU) 구매 및 임차 지원 등 GPU 마중물 사업과 이를 수용할 AI 데이터센터 생태계 조성에 속도를 낸다. 또 독자 AI 파운데이션 모델 프로젝트와 AI 전환(AX) 원스톱 바우처 등 국내 클라우드 수요를 창출할 수 있는 핵심 사업들도 추진한다. 최동원 과기정통부 인공지능인프라정책관은 "국가 AI 경쟁력을 좌우하는 핵심 기반인 클라우드 수요 확대에 발맞춰 민간 클라우드 시장의 지속적인 성장과 공공 부문의 민간 클라우드 도입 확산을 위해 노력해 나가겠다"고 밝혔다. 클라우드 업계 관계자는 "시장 성장 속도에 비해 전문 인력과 운영 역량이 충분히 확보되지 못한 상황"이라며 "인력 양성과 함께 산업 구조 전반을 고려한 정책 지원이 필요하다"고 말했다.

2026.04.03 08:40한정호 기자

EU "가짜는 안 돼" vs 트럼프 "AI는 나의 힘"

유럽연합(EU)의 핵심 기구들이 직원들의 공식 문서 및 대외 소통에서 인공지능(AI)으로 생성한 이미지나 영상 사용을 전면 금지하고 나섰다. 이는 AI 생성 콘텐츠를 선거 운동과 홍보에 적극적으로 활용하고 있는 도널드 트럼프 미국 대통령의 행보와 극명한 대조를 이룬다. 최근 정치 매체 폴리티코 보도에 따르면 유럽위원회(EC), 유럽의회, 유럽연합 이사회는 온라인상에서 딥페이크와 AI 생성 콘텐츠에 대한 감시가 강화됨에 따라, 소속 직원과 홍보팀의 AI 콘텐츠 사용을 금지한다는 방침을 세웠다. 온라인에 정교하지 않거나 오해를 불러일으킬 수 있는 AI 콘텐츠가 범람하는 상황에서, 공공기관 메시지의 '신뢰성'을 최우선으로 지키겠다는 의지로 풀이된다. 영국의 AI 비디오 생성 기업 '신테시아'의 정책 책임자 알렉산드르 보이카는 “EU가 리스크를 먼저 고려하는 것은 당연한 수순”이라며 “해당 콘텐츠가 기만적이거나 유해하게 받아들여질 가능성은 없는지, 현실을 왜곡하고 있지는 않은지, 그리고 명확한 설명 책임과 정보 공개가 가능한지가 핵심”이라고 분석했다. 반면, 지정학적 위기가 고조되는 상황에서 공공기관이 온라인 영향력을 확보해야 한다는 목소리도 높다. 이 때문에 AI 콘텐츠를 무조건 금지하는 것이 최선인지에 대해서는 회의적인 시각도 존재한다. 벨기에의 홍보 대행사 '익스포저'를 운영하며 여러 정당에 자문을 제공해 온 르노 반 잔디케는 “딥페이크가 신뢰를 해칠 위험이 있다고 해서 공공기관이 AI를 아예 외면하는 것 역시 실익이 없다”고 주장했다. 케임브리지 대학 연구원이자 경제협력개발기구(OECD) 자문위원인 월터 파스콰렐리 또한 “전면 금지보다는 '책임 있는 사용'이 더 나은 대안”이라고 지적했다. 조사에 따르면 AI가 생성한 콘텐츠의 양은 이미 인간이 제작한 콘텐츠 양을 넘어섰으며, 2025년 한 해 동안 온라인에 공유된 딥페이크는 무려 800만 건에 달한 것으로 집계됐다. 정치권도 예외는 아니다. 네덜란드와 아일랜드에서는 이미 딥페이크가 선거운동에 영향을 미치고 있으며, 공식 소통에 AI를 활용하는 정치인도 급증하고 있다. 대표적인 인물이 도널드 트럼프 미국 대통령이다. 그는 자신이 만든 SNS '트루스 소셜'을 통해 다양한 AI 생성 이미지를 게시해 왔다. 왕관을 쓴 채 제트기를 조종하는 모습, 검을 뽑아 든 자신의 앞에 민주당 지도부들이 무릎을 꿇고 있는 모습 등이 대표적이다. 보고에 따르면 2024년 10월 기준으로 이미 36건의 AI 생성 콘텐츠를 올린 바 있으며, 취임 이후에도 이런 기조를 유지하고 있다. 최근에는 SNS에서 트럼프를 강력히 지지하며 애국심을 고취했던 미 육군 여군 '제시카 포스터'라는 인물이 사실은 100% AI로 생성된 가공의 존재였다는 사실이 밝혀져 충격을 주기도 했다. EU의 접근법은 이런 미국의 사례와 정면으로 배치된다. 토마스 레니에 유럽위원회 대변인은 폴리티코와의 인터뷰에서 “우리가 언론이나 대중에게 제공하는 공식 정보와 이미지에는 AI 생성 콘텐츠가 포함되지 않는다”고 단언했다. 시민의 신뢰를 얻기 위해서는 발신하는 콘텐츠의 진실성이 무엇보다 중요하다는 견해다. 다만, 화질 개선 등 단순 최적화 작업을 위해 AI 도구를 사용하는 것은 허용된다고 덧붙였다. 하지만 폴리티코는 “AI 생성 콘텐츠를 완전히 배제하는 방식은 외교와 소통이 점점 온라인 중심으로 이동하는 시대에 EU를 뒤처지게 만들 위험이 있다”고 지적했다. 신테시아의 보이카 역시 “얼마나 신속하고 효과적으로 대중에게 대응하느냐가 그 어느 때보다 중요해진 시점”이라고 강조했다. 일각에서는 AI 사용을 일률적으로 금지함으로써 대중에게 AI 리터러시(이해 능력)를 교육할 기회를 놓치고 있다는 비판도 나온다. 파스콰렐리 위원은 “EU가 AI와의 관계를 완전히 단절함으로써, 정치적 소통에서 책임 있고 투명한 AI 활용이 무엇인지 보여줄 '리더십의 기회'를 스스로 포기하고 있다”고 꼬집었다.

2026.04.03 08:32백봉삼 기자

차 안으로 들어온 챗GPT…애플 카플레이에 음성 AI 탑재

오픈AI 챗GPT를 애플 카플레이에서 사용할 수 있다. 오픈AI가 2일(현지시간) 발표한 내용에 따르면, 챗GPT는 애플 카플레이와 연동돼 차량에서도 사용할 수 있게 됐다. 이번 기능은 최신 iOS 26.4 업데이트를 통해 적용됐다. 이번 업데이트의 핵심은 카플레이에서 서드파티 음성 기반 애플리케이션을 지원하기 시작했다는 점이다. 이에 따라 사용자는 최신 챗GPT 앱을 설치하면 차량 디스플레이를 통해 AI에 직접 접근할 수 있다. 다만 기존 모바일 환경과 달리 차량용 챗GPT는 '음성 중심'으로 설계됐다. 텍스트 입력이나 화면 스크롤 없이, 질문과 답변이 모두 음성으로 이뤄진다. 운전 중 시각적 주의를 분산시키지 않기 위한 조치다. 실제 사용 방식도 앱보다는 '통화'에 가깝다. 화면에는 '듣는 중(listening)'이나 '응답 중(speaking)'과 같은 최소한의 상태 표시만 나타나며, 이용자는 음성으로 질문하거나 메시지 작성 등을 요청할 수 있다. 다만 완전한 핸즈프리 수준은 아니다. 시리와 달리 음성 호출(웨이크 워드) 기능은 아직 지원되지 않아, 사용자가 직접 화면을 터치해 실행해야 한다.

2026.04.03 08:22안희정 기자

인옵틱스, AI 데이터센터 채널당 400Gbps급 초고속 전송 인프라 선점나서

광통신 소재·부품 전문 기업 인옵틱스 (대표 강세경)가 인공지능(AI) 데이터센터 난제인 고집적화와 저전력화를 동시에 해결할 차세대 유리기판 공정 기술을 공개해 관심을 끌었다. 인옵틱스는 지난3월 개최된 세계 최대 광통신 학술회의 'OFC2026'에서 독자 개발한 '전자·광 통합 집적형 유리기판 공정 플랫폼(GOFOP™, Glass-based Opto-Electronic Fan-Out Packaging)'을 처음 공개했다고 3일 밝혔다. 강세경 대표는 "이 전시에서 고집적형 광인터커넥션 모듈(CPO, Co-Packaged Optics) 구현을 위한 혁신적인 솔루션을 제시했다"며 "코히어런트와 메타 등 글로벌 테크 기업 및 연구 관계자들로부터 큰 주목을 받았다"고 말했다. '유리기판', AI 데이터센터 광인터커넥션 게임 체인저 최근 AI 데이터센터는 폭발적인 데이터 처리량 증가로 인해 고집적화, 대용량화, 저전력화라는 기술적 임계점에 직면해 있다. 인옵틱스가 개발중인 유리기판 기술은 기존 유기 소재 (플라스틱 계열) 기판 대비 신호 손실이 현저히 적고, 미세 패턴 구현이 용이하다. 특히 열에 강하고 휘어짐 (Warpage) 현상이 적어 차세대 광인터커넥션 기술 핵심인 CPO 구현을 위한 최적의 기판 소재로 평가받고 있다. 인옵틱스는 중소벤처기업부 창업성장기술개발(딥테크 팁스, 디딤돌) 정부사업 지원을 받아 한국원자력연구원 첨단방사선연구소 방사선기기팹 시설과 기술지원으로 관련 공정을 개발하고, 고도화를 진행 중이다. 고팝 플랫폼은 지난해 3월부터 이미 국내외 주요 기관 및 기업들과 NDA(비밀유지협약)를 체결, 고객 맞춤형 전자·광소자 통합 집적화 공정 서비스를 제공하며 기술 상용화 단계에 진입했다. 채널당 400Gbps급 초고속 전송 인프라 선점 목표 강세경 대표는 "AI 서비스가 가속화하며 향후 데이터센터 내 채널당 신호 전송 속도가 400Gbps가 넘는 초고속 환경으로 진화할 것으로 예상된다"며 "인옵틱스 유리기판 공정 기술이 이러한 초고속 전송 환경에서 신호 무결성을 보장하는 핵심 인프라가 될 것"이라고 강조했다. 강 대표는 또 “미래 AI 데이터센터는 전력 효율은 높이면서 물리적 한계를 극복하는 패키징 기술이 승부처가 될 것”이라며, “고팝 플랫폼으로 초고속 광인터커넥션 시장을 선점하기 위해 서비스 공급 등 다양한 마케팅 전략을 구사할 계획"이라고 덧붙였다.

2026.04.03 08:00박희범 기자

창업진흥원, 행안부 데이터평가 2개부문 '매우우수' 등급 석권

창업진흥원은 행정안전부가 주관하는 '2025년 공공데이터 제공 운영실태 평가'와 '데이터기반행정 실태점검'에서 2개 부문 모두 최고 등급인 '매우 우수' 등급을 받았다고 2일 밝혔다. 이번 평가는 전국 685개 행정·공공기관을 대상으로 실시됐다. 특히 2025년부터는 기존 3단계였던 평가 등급이 5단계(매우 우수, 우수, 보통, 미흡, 매우 미흡)로 세분화되고, AI 친화·고가치 데이터 발굴 등 평가지표 난이도가 크게 높아진 가운데 거둔 성과다. 창업진흥원은 지난 2019년부터 공공데이터 평가 대응을 시작한 이래 4년 연속 최고 등급을 유지해 왔다. 또한 2022년 도입된 데이터기반행정 평가에서도 2년 연속 최고 등급을 달성하며 '데이터 행정 선도 기관'으로 자리매김했다. 창업진흥원은 중소벤처기업부, 국토교통부 등 산하 10개 유관기관과 함께 구축한 'AI·데이터 실무협의체'를 운영한 것이 이번 성과를 거두는 데 크게 기여했다고 평가했다. 협의체를 통해 '대국민 공공데이터 인식 제고 교육, 소통간담회, 공유데이터 분석·개선 보고서 수립' 등 공동 프로그램을 추진하고, 내부적으로는 '데이터 분석 시각화 경진대회'를 개최하는 등 데이터 중심 조직 문화를 조성하는데 주력했다. 이에 창업진흥원은 공공데이터 제공 평가에서 '매우 우수', 데이터기반행정 평가에서도 '매우 우수'로 2개 부문 모두 '최고 등급'을 석권하며 혁신적인 데이터 기반 행정 역량을 입증했다. 유종필 창업진흥원장은 이번 성과 관련 “전 직원이 데이터 중심의 행정 혁신을 위해 끊임없이 노력하고, 부처 간 경계를 넘어 협력한 결과”라며 “앞으로도 AI시대를 선도하는 고품질 창업 데이터를 지속적으로 발굴하여 대국민 서비스의 질을 높이고 AI 정부 실현에 앞장서겠다”고 밝혔다.

2026.04.02 23:51김기찬 기자

AI가 사람 움직임을 '언어'처럼 이해하게 됐다

북경대와 둥화대, 화난이공대 공동 연구진이 3월 23일 발표한 유니모션(UniMotion) 논문은 AI가 사람의 동작, 이미지, 텍스트를 하나의 '언어'처럼 자유롭게 읽고 쓸 수 있게 만든 첫 사례다. "앉았다 일어나"라는 말을 듣고 3D 동작을 만들고, 반대로 춤추는 영상을 보고 "발을 앞으로 내딛고 팔을 흔든다"는 설명을 자동으로 써내는 일이 같은 시스템 안에서 동시에 가능해졌다는 뜻이다. 기존 AI는 움직임을 '단어'로 쪼갰다가 잃어버렸다 지금까지 AI는 사람의 움직임을 다룰 때 마치 영화 필름을 사진으로 찢어 보관하듯 '단어'로 바꿔 저장했다. 모션GPT 같은 기존 기술은 VQ-VAE라는 방식으로 동작을 512개 코드북의 조합으로 쪼갰다. 문제는 이 과정에서 어깨를 얼마나 들어 올렸는지, 발끝이 정확히 어디를 향했는지 같은 미세한 정보가 증발한다는 점이었다. 연구진 실험 결과 VQ-VAE 방식은 손목 위치 오차가 평균 212.9mm에 달했다. 성인 손바닥 너비를 두 번 벌려놓은 정도다. 유니모션은 이 문제를 '연속 공간'으로 해결했다. 동작을 코드로 자르지 않고 수학적 좌표 그대로 보존하는 CMA-VAE 구조를 만든 것이다. 같은 조건에서 손목 오차는 43.8mm로 떨어졌다. 5분의 1 수준이다. 더 중요한 건 시간 흐름이 자연스럽게 이어진다는 점이다. 기존 방식은 프레임마다 코드가 바뀌면서 움직임이 뚝뚝 끊기는 '지터' 현상이 생겼지만, 유니모션은 실제 사람의 가속도 패턴과 거의 동일한 부드러움을 보였다. 그림 1. 움직임·텍스트·영상 세 가지를 하나의 모델로 처리하는 유니모션(UniMotion)이 기존 모델들이 일부만 지원하던 7가지 과제를 최초로 전부 수행하며 성능도 앞섰다. 영상 없이도 '눈으로 본 것처럼' 학습하는 구조 연구진은 여기서 한 발 더 나갔다. 평소엔 동작 데이터만 보지만, 훈련 중에는 영상과 동작을 함께 보는 '이중 인코더' 방식(DPA)을 설계했다. 비유하자면 학생이 교과서(동작)만 보고 공부하지만, 선생님이 옆에서 그림(영상)을 보며 설명해주는 방식이다. 훈련이 끝나면 선생님은 떠나고 학생 혼자 문제를 푸는데, 이미 시각 정보의 핵심이 머릿속에 남아 있다. 실제로 DPA를 제거하자 텍스트→동작 생성 정확도(R@3)가 0.841에서 0.818로, 동작 편집 정확도는 84.94%에서 80.35%로 떨어졌다. 영상 없이도 "몸의 균형은 어때야 하는가" "팔다리 비율은 자연스러운가" 같은 시각적 직관이 내재화됐다는 증거다. 스스로 복습하며 구조를 익히는 '자가 정렬' 단계 연구진은 본격 훈련 전 AI에게 '자가 복습' 시간을 줬다. LRA(잠재 복원 정렬)라는 단계에서 시스템은 자신이 인코딩한 동작 정보를 노이즈에서 다시 복원하는 연습만 8만 스텝 반복한다. 텍스트 설명 같은 애매한 힌트 없이 "이 좌표값이 주어지면 원래 동작은 이거였다"는 명확한 정답만으로 뼈대를 다지는 것이다. 이 단계를 건너뛰면 어떻게 될까. 텍스트→동작 점수는 0.801, 동작 예측 오차는 3.777mm로 치솟았다. 반대로 자가 정렬을 거치면 0.841과 3.172mm로 안정된다. 마치 악보를 읽기 전에 스케일 연습부터 하는 음악가처럼, AI도 구조를 먼저 익혀야 복잡한 과제를 안정적으로 처리한다. 7가지 일을 한 몸으로 처리하는 통합 설계 유니모션의 진짜 강점은 범용성이다. 텍스트→동작, 동작→텍스트, 동작 예측, 동작 편집, 영상→동작, 영상→텍스트, 동작 기반 이미지 편집까지 총 7개 작업을 단일 모델로 처리한다. 기존엔 작업마다 별도 모델이 필요했다. 모션GPT는 텍스트↔동작만, 유니포즈는 정지 자세↔이미지만 다뤘다. 통합의 핵심은 '듀얼 패스 임베더'다. 동작 정보를 두 갈래로 처리하는데, 한쪽은 의미(Semantic)를 추출하고 다른 쪽은 세부 좌표(Generation)를 보존한다. 마치 책을 읽을 때 줄거리와 문장 표현을 동시에 기억하는 것과 같다. 동작 편집 과제에서 이 구조는 결정적이다. "양손을 위로"라는 명령(의미)을 이해하면서도 원본 동작의 걸음 폭이나 어깨 각도(세부)는 그대로 유지해야 하기 때문이다. 전문 모델보다 정확하고, 범용 모델보다 세밀하다 휴먼ML3D 데이터셋 텍스트→동작 생성에서 유니모션은 R@3 점수 0.841로 1위를 기록했다. 단일 과제 전문 모델 MoMask(0.807)를 제쳤다. 동작→텍스트 설명에선 BertScore 41.2로 기존 최고(36.7)를 크게 앞섰다. 동작 예측 오차는 3.172mm로 모션GPT(4.745mm) 대비 33% 개선됐다. 영상→동작 변환에선 MPJPE 75.0으로 같은 통합 모델인 유니포즈(81.8)를 8.3% 앞섰다. 전문 모델(TokenHMR 52.4)과는 여전히 격차가 있지만, 7개 작업을 동시 지원하는 모델 중에선 독보적이다. 동작 기반 이미지 편집에선 모션 정확도 67%로 기존 2단계 방식(50~59%)을 압도했다. AI 동작 이해는 이제 '읽기·쓰기·번역'을 모두 아는 단계 유니모션이 보여준 건 단순히 성능 향상이 아니다. 동작을 '언어'처럼 다루는 패러다임 전환이다. 기존 AI는 영어만, 또는 불어만 구사했다면, 이젠 영·불·독을 넘나들며 통역까지 하는 셈이다. 연속 공간 표현, 시각 정보 증류, 자가 정렬 사전 훈련이라는 세 기둥이 이 전환을 가능하게 했다. 다만 몇 가지는 두고 봐야 한다. 첫째, 훈련 데이터 대부분이 실내 촬영 환경(Human3.6M)이라 야외 복잡한 상황에서 시각 정렬이 얼마나 유지될지 미지수다. 둘째, 15억 파라미터 모델이라 실시간 모바일 구동은 아직 무리다. 셋째, 논문은 단일 프레임→동작 복원을 주로 다뤘는데, 다중 프레임 영상에서 시간 추론을 어떻게 강화할지는 후속 과제로 남았다. 그럼에도 이 연구가 여는 가능성은 크다. 게임 캐릭터가 자연어 지시만으로 즉석 애니메이션을 만들고, 재활 치료사가 환자 동작을 촬영하면 AI가 자동으로 교정 가이드를 텍스트로 출력하는 미래가 구체화되고 있다. FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q. 유니모션이 기존 모션GPT와 다른 핵심 차이는 무엇인가요?모션GPT는 동작을 512개 코드로 쪼개 저장(VQ-VAE)하지만 유니모션은 좌표를 연속값으로 유지(CMA-VAE)합니다. 덕분에 손목 위치 오차가 212.9mm에서 43.8mm로 줄고, 시간 흐름도 끊김 없이 자연스러워집니다. Q. '듀얼 패스 임베더'는 왜 두 갈래로 나뉘나요?한쪽(Semantic)은 "앉는다"는 의미를, 다른 쪽(Generation)은 무릎 각도 같은 세부를 담습니다. 동작 편집 시 명령은 이해하되 원본 디테일은 보존해야 하므로 둘 다 필요합니다. Q. LRA 자가 정렬 단계는 왜 필요한가요?텍스트 설명은 "걷는다"처럼 추상적이라 학습 신호가 모호합니다. 반면 동작 좌표는 명확한 정답이므로, 먼저 이걸로 뼈대를 다진 뒤 텍스트 학습을 하면 성능이 크게 오릅니다(R@3 0.801→0.841). 기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다. 리포트명: UniMotion: A Unified FRAMEwork for Motion-Text-Vision Understanding and Generation ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.04.02 22:10AI 에디터

메타넷엑스, 2025년 역대 최대 실적 달성…매출 5541억·영업이 170억 기록

메타넷엑스가 인공지능(AI) 인프라 사업 확대를 기반으로 2025년 사상 최대 실적을 기록했다. 메타넷엑스는 2025년 연결 기준 매출 5541억원, 영업이익 170억원을 기록했다고 2일 밝혔다. 전년 대비 매출은 11.9%, 영업이익은 35.9% 증가했다. 상각 전 영업이익(EBITDA)은 231억원으로, 전년보다 36.6% 늘었다. 이번 성과는 AI 네이티브 인프라 사업 성장에 따른 수익성 개선 영향으로 분석된다. 회사는 운영, 최적화, 자동화를 아우르는 인프라 사업 구조를 통해 실질적인 이익 확대를 이끌었다고 설명했다. 사업 부문별로 보면 인프라, 하이브리드 클라우드 부문이 4462억원으로 전년 대비 8.2% 성장했다. 퍼블릭 클라우드 부문도 670억원을 기록하며 16.5% 증가했다. 보안 사업 역시 안정적인 성장세를 이어가며 전 사업 부문이 고르게 실적을 견인했다. 메타넷엑스는 멀티, 하이브리드 클라우드와 오픈소스, 데이터 플랫폼, SaaS, AI 운영, 보안 관제, 비용 최적화까지 연계한 통합 역량을 기반으로 기업의 AI 환경 구축부터 운영, 자동화까지 지원하고 있다. 금융, 제조 등 주요 산업에서 핵심 시스템 구축과 장기 운영 경험을 바탕으로 기존 단발성 구축 중심에서 반복 매출과 장기 계약 중심 구조로 전환하며 수익성을 강화하고 있다. 회사 측은 생성형 AI 도입이 본격화되면서 AI 워크로드를 안정적으로 처리하고 비용 효율성과 보안을 동시에 확보할 수 있는 차세대 인프라 수요가 확대될 것으로 내다봤다. 또한 전략적 인수와 그룹 내 기술 내재화를 통해 AX 역량 강화에도 속도를 내고 있다. 스켈터랩스를 통해 LLM 기반 엔터프라이즈 AI 기술을 확보했고, 락플레이스를 통해 오픈소스 기반 클라우드와 데이터 역량을 확대했다. 안현덕 메타넷엑스 사장은 "AI 네이티브 인프라 경쟁력 강화를 위한 투자와 실행이 의미 있는 성과로 이어졌다"며 "멀티, 하이브리드 클라우드와 AI, 데이터, 보안을 유기적으로 연결해 고객의 AX 전환을 지속 지원해 나가겠다"고 밝혔다.

2026.04.02 19:21남혁우 기자

[ZD SW 투데이] 아이티센클로잇, '화성 AI 자율주행 허브' 공로상 수상 外

지디넷코리아가 소프트웨어(SW) 업계의 다양한 소식을 한 눈에 볼 수 있는 'ZD SW 투데이'를 새롭게 마련했습니다. SW뿐 아니라 클라우드, 보안, 인공지능(AI) 등 여러 분야에서 활발히 활동하고 있는 기업들의 소식을 담은 만큼 좀 더 쉽고 편하게 이슈를 확인해 보시기 바랍니다. [편집자주] ◆ 아이티센클로잇, 화성 AI 자율주행 허브 공로상 수상 아이티센클로잇은 '화성 AI 자율주행 허브' 개소식에서 자율주행 모빌리티 운영 플랫폼 인프라 구축에 기여한 성과를 인정받아 공로상을 수상했다. 이번 수상은 아이티센클로잇이 화성시 서부권 일대에서 진행되는 국내 최대 규모의 도심 자율주행 실증 사업에서 확장성과 초저지연성을 동시에 갖춘 하이브리드 클라우드 인프라를 성공적으로 설계·구축한 공로를 인정받은 결과다. 화성 AI 자율주행 허브는 향후 교통약자 이동지원, 수요응답형 대중교통 등 8대 공공분야 자율주행 서비스를 실증하게 되며, 아이티센클로잇이 구축한 인프라는 이러한 서비스들이 안정적으로 구동되고 확장될 수 있는 중추적인 역할을 담당하게 된다. ◆ 뉴엔AI, 아시아·태평양 고성장 기업 3년 연속 선정 뉴엔AI가 영국 파이낸셜타임즈와 글로벌 리서치 기관 스태티스타가 공동 선정한 '2026 아시아·태평양 지역 고성장 기업 500'에 선정됐다. 뉴엔AI는 22년간 축적된 비정형 구어체 데이터 분석 노하우와 이를 AI와 결합한 기술 스택을 보유하고 있다. 자체 개발한 비정형 데이터 특화 파운데이션 모델 '퀘타(Quetta) LLMs'과 독립적인 검색 증강 생성(RAG) 아키텍처를 구축해 기업 데이터 보안과 분석의 신뢰도를 동시에 확보했다. 더불어 이미지와 영상 데이터까지 통합 분석할 수 있는 멀티모달 LLM' 구축 및 운영하며 소비자의 시각적 트렌드까지 입체적으로 파악해 더욱 정밀한 AI 트렌드 분석 서비스를 제공하고 있다. ◆디토닉, 주요 서비스 4종 GS인증 1등급 선정 디토닉은 지오하이커, 디닷허브 , 디닷이뷰에 이어 데이터 연계 솔루션 '디닷허브 시티링크 에이전트'(이하 시티링크)가 GS인증 1등급 인증을 받았다고 밝혔다. 시티링크는 지자체 및 기관의 스마트시티 데이터를 표준화된 방식으로 안전하게 전송·연계하는 핵심 역할을 수행한다. 이를 통해 광역단체 간은 물론, 광역단체와 기초단체 사이에서도 심리스한 데이터 통합을 지원한다. 이들 4개 SW를 통해 디토닉은 복잡한 데이터를 실시간으로 수집·가속·분석하고 표준화된 방식으로 전송하는 엔드투엔드 AI 데이터 파이프라인 구축을 위한 기술적 완결성을 확보했다고 밝혔다. ◆솔트웨어, 데이터브릭스 AI 데이 서울 2026 참가 솔트웨어는 데이터브릭스 AI 데이 서울 2026에 부스 파트너사로 참가했다. 이번 부스에서 솔트웨어는 데이터브릭스 지니를 활용한 AI 서비스 확장 데모를 중심으로 분산 데이터 환경 통합부터 AI 전환, 생성형 AI 보안 대응까지 통합적으로 지원하는 솔루션을 현장에서 선보였다. 솔트웨어는 A 인프라 설계부터 플랫폼 구축·운영까지 아우르는 통합 기술 솔루션을 제공한다. 레거시 시스템을 운영 중인 제조·R&D 조직, 복합 데이터 환경(PLM·ERP 등)을 가진 기업, AI 도입 초기 단계 조직 등 다양한 기업 환경에 맞는 고객 환경에 맞춘 도입 로드맵을 제시하고 있다. ◆에이아이웍스, 국내 카드사 '비대면 기업카드 심사 고도화' 프로젝트 수주 에이아이웍스가 국내 주요 카드사 '비대면 기업카드 신청 및 심사 프로세스 고도화' 프로젝트를 수주했다. 이번 프로젝트는 비대면 채널에서의 기업카드 신청·심사·발급 전 과정에 AI 기술을 적용해 업무 효율과 고객 경험을 동시에 혁신하는 것을 목표로 한다. 에이아이웍스는 이번 프로젝트에서 비대면 인증부터 심사·발급까지 모든 과정을 아우르는 지능형 프로세스를 구축한다. 구체적으로 ▲비대면 카드 신청 및 접수 기능 개선 ▲기업 정보 처리 자동화 ▲심사 및 발급 프로세스 자동화 ▲심사 지원 AI 서비스 개발 등을 포괄한다.

2026.04.02 18:10남혁우 기자

정부, AI 경진대회 확대…200개 팀에 기술·인프라 지원

정부가 인공지능(AI) 인재 발굴과 기술 혁신 확산을 위해 경진대회를 연다. 정보통신산업진흥원(NIPA)은 한국정보통신기술협회와 2일 서울 양재 엘타워에서 '인공지능 챔피언 대회'와 '인공지능 루키 대회' 사업설명회를 개최했다고 이날 밝혔다. 이 행사는 전문가와 대학생을 대상으로 한 전 국민 AI 경진대회 일환으로 추진됐다. 해당 대회는 과학기술정보통신부가 추진하는 '모두의 인공지능' 정책 아래 연중 운영되는 AI 경진 프로그램 시작점이다. 이를 통해 다양한 세부 대회가 순차적으로 이어질 예정이다. 챔피언 대회는 최고 수준 연구자 간 경쟁을 통해 기술 혁신과 우수 성과 발굴을 목표로 한다. 루키 대회는 전공과 관계없이 대학생이 AI 기술을 활용해 문제를 해결할 수 있도록 설계됐다. 두 대회는 예선을 통해 각각 최대 100개 팀을 선발하고 그래픽처리장치(GPU)와 AI API 등 연구 인프라를 지원한다. 또 교육과 자문을 통해 결과물 완성도를 높이는 구조를 갖췄다. 대회는 국내 AI 모델 활용을 유도하는 '국내 AI 트랙'과 제한 없는 '일반 트랙'으로 운영된다. 이를 통해 국산 AI 기술 기반 프로젝트를 확대하고 생태계 확산을 도울 방침이다. 본선에서는 최대 40개 팀이 선발된다. 결선에는 최대 10개 팀이 진출한다. 수상팀에는 총 수십억원 규모 상금과 정부·기관장상이 수여된다. 참가 접수는 챔피언 대회가 이달 24일까지 루키 대회가 내달 8일까지 진행된다. 임형규 NIPA 정책기획단 단장은 "이번 대회를 통해 민간 기술 아이디어를 활용한 다양한 AI 혁신 제품과 서비스가 발굴되기를 기대한다"며 "민간의 창의적 역량을 활용해 국가 AI 경쟁력을 높이고 국민 관심을 확대해 나가겠다"고 밝혔다.

2026.04.02 17:53김미정 기자

KCC정보통신, 젠데스크 국내 총판 계약 체결…"국내 AI 고객서비스 혁신 가속"

KCC정보통신이 젠데스크와 인공지능(AI) 상담 서비스 사업 추진에 나선다. KCC정보통신은 젠데스크와 한국 공식 총판 계약을 체결했다고 2일 밝혔다. 젠데스크가 아시아태평양(APAC) 지역에서 처음 도입한 총판 모델로 KCC정보통신은 AX 사업 조직을 중심으로 기술 통합과 운영 지원까지 맡는다. 양사는 기존 시스템과 연계, 데이터 활용, 운영 자동화까지 포함한 통합 서비스를 제공할 계획이다. 이를 통해 실제 업무 효율 개선과 고객서비스 품질 향상으로 이어지도록 한다는 전략이다. 파트너 생태계 확대도 핵심 과제로 제시됐다. KCC정보통신은 산업별 네트워크를 기반으로 AI CX 수요를 발굴하고, 교육과 기술 지원을 통해 파트너 역량 강화를 추진한다. 동시에 젠데스크의 국내 안착을 위한 영업 기회 발굴과 협업 구조 구축에도 집중할 방침이다. 최근 기업 고객 응대 환경은 빠르게 변화하고 있다. AI 상담 도입이 확산되고, 고객 접점 채널이 다양해지면서 단순 문의 처리 수준을 넘어선 지능형 고객 경험이 경쟁력으로 떠오르고 있다. 고객 요청을 실시간으로 분석하고 대응하는 자동화 기반 서비스가 핵심 요소로 자리 잡는 흐름이다. 젠데스크는 생성형 AI와 자동화 기술을 결합한 고객서비스 전략을 글로벌 시장에서 강화하고 있다. 여기에 KCC정보통신의 자동화, 데이터, 클라우드 구축 경험이 더해진다. 유아이패스 기반 자동화 프로젝트 경험을 바탕으로 국내 기업 환경에 맞는 AI CX 도입을 지원할 수 있다는 점이 강점으로 꼽힌다. 유경태 KCC정보통신 대표는 "이번 협력은 글로벌 수준의 AI CX 플랫폼을 국내에 안정적으로 확산하는 계기가 될 것"이라며 "파트너와 함께 고객서비스 혁신을 적극 지원하겠다"고 말했다. 황정호 젠데스크 코리아 지사장은 "KCC정보통신은 시장 이해도와 협업 역량을 갖춘 파트너"라며 "국내 기업이 AI 기반 고객 경험 혁신의 가치를 체감하게 될 것"이라고 밝혔다.

2026.04.02 17:48남혁우 기자

"의자를 책상 앞에"라는 말만으로 AI가 3D 공간을 완벽하게 재배치한다

엔비디아(NVIDIA)와 메사추세츠대학교(UMass Amherst) 연구진이 자연어 명령만으로 3D 공간 내 물체를 정교하게 재배치할 수 있는 3D-Layout-R1 프레임워크를 공개했다. 이 시스템은 기존 언어 모델이 "의자를 소파와 나란히 놓아라"는 명령을 받으면 물체끼리 겹치거나 허공에 떠 있는 결과를 만들던 문제를 해결했다. 핵심은 각 단계를 투명하게 기록하는 구조화된 추론 방식이다. 마치 레고 조립 설명서처럼 "1단계: 의자를 책상 앞에 배치, 2단계: 침대를 책상 뒤로 이동"처럼 중간 과정을 단계별로 추론하면서 최종 배치에 도달한다. 그림 1. 3D-Layout-R1의 다단계 공간 배치 추론 과정 기존 AI가 공간을 엉망으로 만드는 이유 챗GPT(ChatGPT)나 제미나이(Gemini) 같은 언어 모델에게 "거실 가구를 재배치해줘"라고 요청하면, 그럴듯한 설명은 내놓지만 실제로는 소파가 테이블을 관통하거나 의자가 벽 밖으로 튀어나가는 배치를 제안한다. 이들은 공간 관계를 말로는 이해하지만, 물리 법칙을 따르는 구체적인 좌표 계산에는 약하기 때문이다. 마치 지도를 읽을 줄은 알지만 실제로 그 길을 걸어본 적은 없는 사람처럼, 추상적 이해와 실제 실행 사이에 큰 간극이 존재한다. 기존 방식은 두 가지로 나뉜다. 첫 번째는 AI가 "의자를 옮겨야 할 것 같아요"라고 대략적인 계획만 세우고, 별도의 프로그램이 실제 좌표를 계산하는 방식이다. 문제는 AI의 생각이 너무 모호해서 계산 프로그램이 제대로 된 결과를 만들어내기 어렵다는 점이다. 두 번째는 AI가 한 번에 최종 결과를 예측하는 방식인데, "먼저 상자를 옮기고, 그 다음 책 옆에 램프를 놓아라" 같은 여러 단계가 필요한 작업에서는 중간 과정을 관리하지 못해 실패한다. 결국 기존 시스템은 복잡한 공간 편집 명령을 제대로 수행하지 못했다. 투명한 설계도가 AI를 똑똑하게 만든다 3D-Layout-R1의 핵심은 장면 그래프(Scene Graph)라는 투명한 중간 표현이다. 이는 방 안의 모든 물체를 카드 목록처럼 정리한 것이다. 각 카드에는 물체 이름, 정확한 위치, 크기, 회전 각도가 적혀 있다. 기존 AI가 "의자를 어딘가로 옮겨야 할 것 같은데, 아마도 테이블 근처쯤?"이라고 두루뭉술하게 말하는 대신, 3D-Layout-R1은 JSON과 같은 형태로 좌표를 명시적으로 수정 한다. 이 방식의 장점은 각 단계를 즉시 확인할 수 있다는 점이다. 만약 2단계에서 침대가 의자와 겹친다면, 3단계로 넘어가기 전에 바로 문제를 발견하고 수정할 수 있다. 마치 요리할 때 레시피를 한 단계씩 따라가며 맛을 보는 것과 비슷하다. 기존 방식은 모든 재료를 한꺼번에 냄비에 넣고 나서야 맛이 이상하다는 걸 깨닫는 반면, 새로운 방식은 재료를 하나씩 넣으며 계속 확인한다. 연구진은 DeepSeek-R1을 활용해 추론 트레이스를 생성한 1만 5천 개 데이터셋을 만들었다. 각 데이터에는 처음 상태, 자연어 명령, 단계별 카드 수정 내역, 최종 목표 상태가 포함된다. 세 가지 연습 과제를 준비했다. 첫 번째는 물체를 크기와 모양으로 분류한 뒤 일렬로 정렬하는 '정렬 과제'다. 두 번째는 무작위로 흐트러진 물체를 원래의 깔끔한 격자 구조로 되돌리는 '공간 정렬 과제'다. 세 번째는 "보라색 침대를 책상 뒤에 놓되, 침대는 책상으로부터 정확히 팔 길이만큼 떨어뜨려라" 같은 복잡한 조건을 동시에 만족시키는 '방 편집 과제'다. 게임처럼 점수를 매기며 물리 법칙을 배운다 구조화된 추론만으로는 부족하다. AI가 카드를 올바른 형식으로 작성하더라도, 실제 위치가 부정확하거나 물체끼리 겹칠 수 있다. 이를 해결하기 위해 연구진은 강화학습을 적용했다. 이는 게임 플레이어에게 점수를 주며 학습시키는 방식과 같다. AI가 물체를 배치할 때마다 세 가지 기준으로 점수를 매긴다. 첫 번째 기준은 '목표 일치도'다. AI가 놓은 의자가 정답 위치와 얼마나 겹치는지 측정한다. 마치 다트 게임에서 과녁 중앙에 가까울수록 높은 점수를 주는 것과 같다. 두 번째 기준은 '충돌 방지'다. 의자가 테이블을 관통하거나 벽 안으로 파고들면 감점한다. 세 번째 기준은 '형식 준수'다. AI의 답변이 제대로 된 카드 형식으로 작성됐는지 확인한다. 이 세 가지 점수를 합산해 AI에게 피드백을 준다. 처음에는 서툴지만, 수천 번 반복하며 점점 높은 점수를 받는 배치 방법을 학습한다. 마치 농구 선수가 슛 연습을 반복하며 골대 감각을 익히듯, AI도 어떤 배치가 물리적으로 타당하고 명령을 정확히 따르는지 체득한다. 이 과정을 거친 모델은 기존보다 훨씬 정확한 위치에 물체를 배치하고, 충돌 없는 완벽한 레이아웃을 만들어낸다. 작은 모델이 거대 AI를 이긴 이유 정렬 과제에서 3D-Layout-R1은 최신 모델의 성능을 IoU 기준으로 약 20% 정도 향상된 성능을 보였다. 더 중요한 점은 충돌이 거의 없었다는 것이다. 기존 모델들이 만든 배치에서는 물체 5개 중 1~2개가 다른 물체와 겹쳤지만, 새 모델은 모든 물체가 깔끔하게 분리됐다. 공간 정렬 과제는 더 까다롭다. 무작위로 흩어진 물체를 보고 원래 있어야 할 자리를 추론한 뒤 되돌려놓아야 한다. 제미나이 2.5 프로는 물체 10개 중 7~8개를 대략적인 위치로 복원했다. 3D-Layout-R1은 9개 이상을 정확한 격자 위치에 맞춰 배치했다. 흥미로운 점은 훨씬 작은 모델이 대형 상용 모델을 이긴다는 사실이다. 엔비디아 연구진이 훈련시킨 소형 모델도 경쟁력 있는 성능을 보였다는 것이다. 이는 모델 크기보다 추론 구조가 더 중요하다는 증거다. 방 편집 과제에서는 차이가 더 극명했다. 제미나이나 딥시크는 물체 3개 중 1~2개를 대략적인 위치에 놓는 수준이었다. 3D-Layout-R1은 더 높은 정확도로 물체를 배치했다. 특히 "의자는 책상으로부터 팔 두 뼘 정도 떨어뜨려라" 같은 거리 제약까지 정확히 지켰다. 더 놀라운 점은 단순히 강화학습만 적용하면 오히려 성능이 제한적이라는 발견이다. 구조화된 단계별 추론을 먼저 가르치고, 그 위에서 강화학습으로 미세 조정하는 2단계 전략이 핵심이었다. 그림 6. 실제 로봇을 이용한 테이블 위 물체 재배치 및 집기-놓기 작업 창고에서 거실까지, 한 번 배우면 어디서나 통한다 연구진은 실제 로봇 팔로도 가능성을 확인했다. 카메라가 테이블 위 물체를 촬영하면, 3D-Layout-R1이 "노란 컵을 노란 그릇에 넣어라"는 명령을 해석해 목표 배치를 생성한다. 그러면 로봇 제어 프로그램이 그 배치를 따라 팔을 움직여 작업을 완수했다. AI는 로봇 동작을 직접 배운 적이 없지만, 명확한 목표를 제시하는 것만으로도 기존 로봇 시스템과 협업할 수 있었다. 더 흥미로운 점은 창고 시뮬레이션 실험이다. 연구진은 창고 데이터로 모델을 재훈련하지 않았다. 그런데도 "상자를 높이 순으로 정렬하고, 팔레트가 가장 적은 구역에 배치하라"는 실무 지시를 정확히 따랐다. 이는 구조화된 추론이 특정 환경에만 맞춰진 것이 아니라, 장면 그래프라는 범용적 표현 덕분에 새로운 상황에도 적응한다는 증거다. 식당 주방에서 일하던 요리사가 카페 주방에서도 레시피만 보면 요리할 수 있는 것과 비슷하다. 다만 한계도 있다. 물체 이름이 없거나 위치 정보가 부정확한 상황에서는 시각 정보를 함께 처리하는 비전-언어 모델이 텍스트만 다루는 모델보다 훨씬 나았다. 이는 불완전한 정보를 이미지로 보완하는 능력이 중요하다는 뜻이다. 또한 대형 비전-언어 모델을 훈련시켰을 때 기대만큼 성능이 오르지 않았는데, 이는 시각 정보를 활용하는 방식 자체를 개선해야 한다는 과제를 남긴다. 중간 단계를 보여주는 AI가 신뢰받는다 3D-Layout-R1이 보여주는 핵심 교훈은 '중간 단계를 투명하게 만들면 AI가 더 똑똑해진다'는 것이다. 기존 방식은 AI의 사고 과정이 블랙박스처럼 감춰져 있어서, 뭔가 잘못됐을 때 어디서부터 고쳐야 할지 알 수 없었다. 새로운 방식은 각 단계를 명확한 카드 수정으로 기록하기 때문에, 2단계에서 실수했다면 2단계만 다시 고치면 된다. 이는 의료 진단이나 법률 자문처럼 추론 과정을 설명해야 하는 분야에도 적용 가능한 원리다. 또 다른 교훈은 '기초 훈련과 실전 최적화를 분리하라'는 것이다. 처음부터 강화학습으로 모든 것을 학습시키려 하면 방향을 잃는다. 먼저 구조화된 추론으로 기본기를 다지고, 그 위에서 점수 기반 학습으로 다듬는 2단계 전략이 효과적이다. 이는 언어 학습에서 문법을 먼저 배우고 대화 연습으로 유창성을 높이는 과정과 비슷하다. 남은 질문은 이 방법이 얼마나 확장될 수 있느냐다. 현재는 가구 배치 같은 정적인 작업에 집중하지만, "공을 굴려서 목표 지점에 맞춰라" 같은 동적 물리 시뮬레이션으로 확장되면 어떻게 될까. 또한 현재 데이터는 1만 5천 개 수준이지만, 수백만 개의 다양한 장면으로 학습하면 AI의 공간 지능은 인간 수준에 근접할 가능성이 있다. 다만 비전 정보를 더 효과적으로 활용하는 방법은 아직 개선의 여지가 크다. 보는 것과 이해하는 것 사이의 간극을 좁히는 일이 다음 과제로 남아 있다. FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.) Q1. 3D-Layout-R1이 기존 AI와 다른 점은 무엇인가요? 기존 AI는 "의자를 옮겨라"는 명령에 추상적인 설명만 제공하지만, 3D-Layout-R1은 장면 그래프라는 명확한 카드 목록을 단계별로 수정합니다. 각 단계가 투명하게 기록돼 어디서 실수했는지 즉시 확인하고 수정할 수 있습니다. Q2. 어떤 작업에 실제로 사용할 수 있나요? 가상 공간 디자인, 로봇 작업 계획, 창고 물류 자동화, 건축 시뮬레이션 등에 활용 가능합니다. "상자를 높이 순으로 정렬하고 팔레트가 적은 구역에 배치하라"는 복잡한 명령도 정확히 수행합니다. Q3. 일반 사용자도 이 기술을 쓸 수 있나요? 현재는 연구 단계이지만, 향후 3D 게임 에디터, 메타버스 공간 설정, 스마트 홈 가구 배치 앱 등에 통합될 가능성이 있습니다. 자연어만으로 복잡한 공간 재배치가 가능해지는 시점이 올 수 있습니다. 기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다. 리포트명: 3D-Layout-R1: Structured Reasoning for Language-Instructed Spatial Editing ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2026.04.02 17:29AI 에디터

배경훈 "추경, 빚 없이 반도체 세수로...민생 안정·청년 창업 정조준"

배경훈 부총리 겸 과학기술정보통신부 장관이 2026년도 제1회 추가경정예산안이 중동 전쟁발 고유가 등 위기에 대응한 민생 안정과 청년 일자리 창출을 위한 것이라고 설명했다. 배 부총리는 2일 국회에서 열린 과학기술정보방송통신위원회 전체회의에서 “이번 추경 예산 빚을 내서한 게 아니다”며 “반도체 호황 등으로 인한 세수를 활용해 전쟁의 직접적인 영향에 대응하기 위한 추경”이라고 밝혔다. 추경안 총 규모는 26조 2000억원이며, 10조 1000억원은 고유가 부담 완화에, 2조 8000억원은 민생 안정에, 2조 6000억원은 산업 피해 최소화와 공급망 안정에 사용된다. 청년 창업 바우처 등 중소벤처기업부 사업엔 1조 9000억원이, ICT 중소 벤처기업 에너지 비용 지원 등 과학기술정보통신부 8개 사업엔 1153억원이 편성됐다. 배 부총리는 중기부와 과기정통부의 추경에 대해 “기존 AI 바우처 그리고 AX 원스톱 바우처 등 다양한 바우처 사업들이 있지만 청년을 타깃으로 한 청년창업바우처 사업이 없었다”며 “청년에게 특화된 사업을 위해 청년 창업 바우처를 별도로 신설해서 추가하는 것”이라고 말했다. 그러면서 “장기적으로 또 우리 청년들의 일자리 문제, 창업 문제를 풀어서 차근차근 준비해야 앞으로의 인공지능 시대에 우리가 미래를 담보할 수 있다고 판단해서 그 부분을 중점에 두고 정부에서 추진하고 있다”고 강조했다. 황정아 더불어민주당 의원은 “테슬라나 마이크로소프트, 구글도 처음엔 전부 벤처 스타트업이었다”며 “창업이 청년 인재들에겐 막대한 경제적 이익, 국가 단위로는 천문학적인 국부를 안겨 준 핵심 키”라고 짚었다. 이날 과방위 전체 회의에 상정된 추경 예산안은 오는 3일 과방위 소위, 6일 전체 회의를 거쳐 이르면 오는 10일 내로 본회의에 상정될 예정이다.

2026.04.02 17:15홍지후 기자

색상 코드·캐릭터 눈 모양까지…알리바바, AI 이미지 정밀도 한 단계 올렸다

알리바바 그룹이 브랜드 색상 코드부터 캐릭터 세부 특징까지 정밀 제어할 수 있는 인공지능(AI) 이미지 모델로 크리에이터 시장을 공략한다. 알리바바 그룹은 이미지 생성 및 편집 기능을 고도화한 통합 AI 모델 '완(Wan)2.7 이미지'를 2일 출시했다고 밝혔다. 이 모델은 기존 AI 이미지 생성 모델의 획일적 스타일과 예측하기 어려운 색상 결과물 문제를 개선한 것이 특징이다. 크리에이터들이 시행착오를 줄이면서 전문적인 맞춤형 결과물을 구현할 수 있도록 설계됐다. 핵심 개선 사항은 개인화와 색상 제어다. 골격 구조나 눈 모양 등 세부 특징을 정밀하게 조정해 프로젝트별로 차별화된 캐릭터를 만들 수 있다. 새로운 '컬러 팔레트' 기능을 통해 프롬프트에 특정 색상 코드와 비율을 입력하는 것만으로 복잡한 예술적 스타일이나 브랜드 고유 색상을 정확하게 반영할 수 있다. 텍스트 렌더링 성능도 강화됐다. 긴 맥락 학습 구조를 기반으로 최대 3000토큰의 텍스트 입력을 지원하며 12개 언어로 인쇄 품질의 학술 텍스트와 복잡한 수식·표 생성이 가능하다. 최대 9개의 레퍼런스 이미지를 활용하고 한 번에 최대 12개의 이미지를 생성해 스토리보드, 건축 렌더링, 이커머스 캠페인 제작에도 쓸 수 있다. 직관적인 '클릭 편집' 인터페이스로 특정 영역을 선택해 픽셀 단위로 요소를 추가·이동·정렬하는 것도 가능하다. 익명으로 진행된 사용자 선호도 테스트에 따르면 시각적 완성도, 텍스트 렌더링, 복잡한 시각 개념 이해도 부문에서 업계 주요 모델들을 앞서는 성능을 보였다고 회사 측은 밝혔다. 함께 공개된 '완2.7 이미지 프로'는 안정적인 이미지 구성과 프롬프트에 대한 정밀한 이해, 고해상도 4K 출력을 지원한다. 두 모델 모두 알리바바클라우드의 AI 개발 플랫폼 모델 스튜디오와 완 공식 웹사이트를 통해 이용·배포할 수 있다. 알리바바의 AI 애플리케이션 큐원 앱에도 통합될 예정이다. 알리바바클라우드는 "완 시리즈는 2023년 첫 공개 이후 지속적인 고도화를 거듭했다"며 "AI 기반 멀티미디어 기술 분야에서 우리 기술 경쟁력과 개발 역량을 잘 보여준다"고 강조했다.

2026.04.02 17:10이나연 기자

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

통신 3사 1분기 수익성 멈칫...침해사고 여파

국내 클라우드 시장 커졌지만…인력·운영 역량 '병목'

[디지털자산법 표류④] 길어지는 산업 불확실성에 스타트업∙벤처 ‘울상’

고유가에 KB국민·신한카드 지원사격 나섰다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.