• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'Telegram유령판매 | 텔문의 🅞🅝4989 | Telegram인원수 작업 텔레그램인원수 대행업체,zP0'통합검색 결과 입니다. (4718건)

  • 영역
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

더 빠르고 쾌적한 공항으로…인천공항, 280억 규모 스마트 통합관리 착수

인천공항이 공항 전역에 분산된 자산 및 유지보수 정보를 하나의 플랫폼에 통합해 디지털 기반의 운영체계 구축에 나선다. 이번 사업을 통해 공항 시설의 점검과 정비가 더욱 신속하고 체계적으로 이뤄져 방문객들은 보다 쾌적하고 안전한 환경에서 공항 서비스를 이용할 수 있을 전망이다. 14일 인천국제공항공사는 약 280억원 규모의 '통합 시설관리시스템 구축사업' 입찰공고를 조달청 나라장터를 통해 발표했다. 이번 사업은 단순한 시스템 교체를 넘어, 공항 내 설비, 자산, 유지관리 이력 등 방대한 정보를 하나로 통합하고 운영 전반을 디지털로 최적화하는 인프라 혁신 사업이다. 통합 시설관리시스템 구축으로 공항 이용객들도 서비스 품질 향상을 체감할 수 있을 것으로 기대된다. 체계적인 시설 점검과 정비를 통해 냉난방, 수송시설, 전기, 조명 등 공항 인프라의 안정성과 쾌적성이 높아지고 사고나 고장 발생 시 대응 속도도 개선될 것으로 기대된다. 업무 면에서는 부서별로 분산되거나 일부 수작업으로 운영되던 기존체계에서 벗어나 전사 업무를 하나의 플랫폼으로 통합한다. 시스템은 설비 마스터 관리부터 예방점검, 작업 오더, 자재 수불, 통계 분석까지 유지관리 전 주기를 아우르는 기능을 통합적으로 구현한다. 모바일 환경 기반으로 설계돼, 유지보수 인력은 태블릿이나 스마트폰으로 실시간 작업 지시를 확인하고 결과를 즉시 등록할 수 있다. 관리자는 오더 이력과 자재 현황을 통합 관리할 수 있으며, 실무자들은 현장에서의 업무 효율성을 크게 높일 수 있다. 더불어 예방정비 중심의 운영 체계를 통해 고장을 사전에 방지하고, 계획과 실적 기반의 분석 기능이 제공되면 설비 운영의 신뢰성과 예측 가능성도 높아질 전망이다. 사업은 제한경쟁입찰 및 협상에 의한 계약 방식으로 진행되며, 입찰에 참여하는 기업들은 기술력과 가격을 종합적으로 평가받는다. 입찰 경쟁의 기준이 되는 기초금액은 약 89억원이며 이는 실제 시스템 구축과 과업 수행에 해당하는 직접 계약 대상 금액이다. 기술 요건 측면에서는 전자정부 표준프레임워크 기반으로 시스템이 구축되며 다양한 연계 기술이 적용된다. SAP, CFMS 등 공항 내 관련 시스템과의 통합 연동도 필수 요건이다. 정보 접근성 향상을 위해 웹 표준 준수를 비롯해, 장애인과 고령자 정보접근 고시, 모바일 전자정부 지침 등 정부 기술 기준도 충실히 반영돼야 한다. 보안 요구사항도 엄격하게 적용된다. 개인정보 보호법, 전자정부법, 클라우드컴퓨팅법, 국가정보보안기본지침 등 30여 개 이상의 관련 법령과 고시에 따라 다양한 보안관리 기능 등을 모두 갖춰야 하며, 클라우드 서비스 보안인증(CSAP) 획득 요건도 포함된다. 사업 기간은 계약일로부터 26개월이며, 제안서 평가는 기술(90점)과 가격(10점)으로 구성된다. 제안요청서(RFP), 평가 항목, 제출서류 등 세부 정보는 조달청 나라장터 및 인천국제공항공사 전자조달시스템에서 확인할 수 있다. 인천국제공항공사 측은 입찰공고문을 통해 "점검·정비 업무의 디지털 전환이 이뤄지면 내부 직원들의 업무 효율성이 향상될 뿐 아니라, 공항 이용객들도 쾌적하고 안전한 환경에서 공항 서비스를 누릴 수 있을 것"이라며 "이번 시스템은 공항 운영 전반의 데이터를 통합하고 분석하는 기반이 되는 만큼, 공항의 경쟁력과 지속가능성을 높이는 핵심 인프라로 작용하게 될 것"이라고 밝혔다.

2025.04.14 14:09남혁우

GIST '큐버', AI 비전 인식률 4.7% 개선…"오탐지 물체 삭제 기능"

…국내 연구진이 AI비전 인식률을 기존 대비 4.7%개선할 수 있는 기술을 개발했다. 광주과학기술원(GIST, 총장 임기철)은 AI융합학과 이규빈 교수 연구팀이 오류 추정을 통해 미학습 물체의 인식 결과를 정제하는 AI모델, '큐버'(QuBER)를 개발했다고 14일 밝혔다. '큐버'는 실시간으로 학습 데이터에 포함되지 않은, 오탐지된 물체를 삭제하거나 추가하는 기능을 갖췄다. 현재 널리 사용되는 AI 비전 기술에는 몇 가지 한계가 있다. 2018년 공개된 마스크 R-CNN 모델은 사전에 학습된 물체만 인식할 수 있다. 2023년 나온 '세그멘트 애니싱' 모델은 임의 탐지는 가능하지만, 복잡한 환경에서 정확도가 크게 떨어진다. 이 같은 단점을 보완한 모델이 GIST '큐버'다. 기존대비 인식률이 4.7%가량 개선됐다. '큐버'는 RGB-D(컬러+깊이) 이미지와 초기 예측 데이터를 활용해 '4자 경계 오류'를 분석, 물체 인식의 정확도를 높이는 것이 특징이다. 이 기술을 통해 처음 보는 미학습 물체도 실시간 빠르고 정확하게 인식할 수 있다. '4자 경계 오류'는 AI의 초기 예측값과 실제 데이터 간 차이를 올바르게 검출된 경계 검출해야 했지만 놓친 경계 잘못 검출한 경계 검출하지 않아야 할 부분을 정확히 비검출한 경계 등을 말한다. 연구팀은 ▲실내 환경(OCID)에서 88.4%의 인식률 ▲테이블 위 물체들(OSD)에서 83.3%의 정확도 ▲상자 안의 복잡한 물체들(WISDOM)에서 77.5%의 정확도를 보였다고 설명했다. 이규빈 교수는 “로봇이 처음 보는 물체도 정확하고 효율적으로 인식할 수 있다는 가능성을 확인했다”며, “이 기술이 다양한 로봇 작업에 적용돼 새로운 환경에서도 안정적으로 동작하는 로봇 개발에 큰 역할을 할 것”이라고 기대감을 나타냈다. 연구는 산업통상자원부와 과학기술정보통신부 지원을 받았다. 백승혁 박사가 박사과정 재학 중 수행했다. 연구결과는 오는 5월 열리는 로봇 분야 국제 학회인 IEEE 국제 로봇 자동화 학술대회(ICRA)에서 발표한다.

2025.04.14 13:48박희범

AI는 튀김과 구이 구별할 수 있을까…식품 인식 기술 검증 결과

비공개 소스 AI 모델, 식품 인식에서 90% 이상의 정확도 달성 인공지능(AI) 발전으로 식품 이미지 인식 기술이 크게 향상되었다. 특히 비전-언어 모델(Vision-Language Models, VLM)이 텍스트와 이미지 데이터를 통합하여 식품 인식에 새로운 가능성을 제시하고 있다. 마드리드 자치대학교와 IMDEA 푸드 연구소 연구팀은 식품 영양 전문가 태그 데이터베이스(FoodNExTDB)를 개발하고, 비전-언어 모델 6종의 식품 인식 능력을 평가했다. 연구 결과, 비공개 소스 모델들이 공개 소스 모델보다 우수한 성능을 보였으며, 단일 제품 이미지에서는 90% 이상의 전문가 가중 회상률(Expert-Weighted Recall, EWR)을 달성했다. 그러나 현재 비전-언어 모델은 요리 스타일 구분이나 외관이 유사한 식품 간 차이 식별과 같은 세부적인 식품 인식에 여전히 어려움을 겪는 것으로 나타났다. 7명의 영양 전문가가 검증한 9,263개 이미지 - FoodNExTDB 데이터베이스의 특징 연구팀은 체중 감량 임상시험에 참여한 개인들의 실제 식이 기록에서 추출한 9,263개의 식품 이미지로 구성된 FoodNExTDB를 소개했다. 이 데이터베이스의 특징은 7명의 영양 전문가가 모든 이미지를 검토하여 약 5만 개의 라벨을 생성했다는 점이다. 각 이미지는 10개의 주요 식품 카테고리(예: "단백질 공급원", "채소 및 과일" 등), 62개의 하위 카테고리(예: "가금류", "과일" 등), 그리고 9개의 조리 스타일(예: "구운", "삶은" 등)로 체계적으로 분류되었다. 이러한 구조화된 분류법은 식품 인식 모델 평가에 있어 중요한 기준을 제공한다. 각 참가자는 평균적으로 약 96개의 식품 이미지를 촬영했으며, 이미지의 약 79%는 스페인의 주요 식사 시간(아침, 점심, 저녁)에 촬영되었다. 가장 자주 할당된 식품 카테고리는 "채소 및 과일"(약 28%), "곡물 및 콩류"(약 17%), "음료"(약 16%)였다. 하위 카테고리 수준에서는 "채소"(약 13%), "과일"(약 13%), "빵"(약 8%)이 가장 많았다. Gemini 70.16%, ChatGPT 64.32% - 비전-언어 모델 6종의 식품 인식 성능 비교 연구팀은 ChatGPT(GPT-4o), Gemini 2.0 Flash, Claude 3.5 Sonnet과 같은 비공개 소스 모델과 Moondream, DeepSeek Janus-Pro, LLaVA와 같은 공개 소스 모델을 포함한 6종의 비전-언어 모델을 평가했다. 비공개 소스 모델들은 모든 분류 수준에서 공개 소스 모델보다 일관되게 우수한 성능을 보였다. Gemini는 모든 수준에서 평균 70.16%의 EWR을 달성하여 가장 높은 성능을 보였으며, ChatGPT(64.32%)와 Claude(65.86%)도 강력한 성능을 유지했다. 분류 복잡성이 증가함에 따라 모든 모델의 성능이 저하되었다. 예를 들어, Gemini의 EWR은 카테고리 수준에서 85.79%였으나, 카테고리+하위 카테고리 수준에서는 74.69%, 카테고리+하위 카테고리+조리 스타일 수준에서는 50.00%로 감소했다. 공개 소스 모델 중에서는 Moondream이 DeepSeek과 LLaVA보다 우수한 성능(평균 54.71% 대 34.04%, 47.00%)을 보였다. DeepSeek은 식품 데이터셋에 대한 노출이 제한적이어서 가장 낮은 평균 EWR(34.04%)을 기록했다. "튀김"과 "조림" 구분에 어려움 - 비전-언어 모델의 조리 스타일 인식 한계 연구 결과, 비전-언어 모델들은 이미지의 복잡성에 따라 성능 차이를 보였다. DeepSeek을 제외한 모든 모델은 단일 제품 이미지에서 다중 제품 이미지보다 높은 성능을 보였다. ChatGPT, Gemini, Claude, Moondream과 같은 모델들은 단일 제품 이미지에서 90% 이상의 EWR을 달성했다. 카테고리 수준에서는 "곡물 및 콩류", "단백질 공급원", "유제품 및 식물성 음료"와 같은 식품 카테고리 인식에 비전-언어 모델들이 우수한 성능을 보였다. 하위 카테고리 수준에서는 "과일"이 "채소"보다, "생선"이 "가금류"보다 더 정확하게 인식되었다. "파스타"도 "쌀"보다 더 자주 인식되었다. 조리 스타일 수준에서는 모든 모델이 상당한 어려움을 겪었다. "신선한" 스타일이 가장 식별하기 쉬웠고, "구운" 스타일이 그 뒤를 이었으나, "튀긴"과 "조림" 스타일은 가장 정확하게 예측되지 않았다. 이는 비전-언어 모델들이 미세한 시각적 차이를 구분하는 데 여전히 한계가 있음을 시사한다. 웨어러블 기기와 AI의 만남 - 개인화된 영양 관리의 미래 전망 식이 분석은 영양학에서 여러 관련 요소를 고려해야 하는 주요 과제로 남아있다. 순수한 이미지 인식 모델들이 식품 인식 분야에서 크게 향상되었지만, 복잡한 다중 식품 이미지를 처리하고 충분한 맥락 이해를 제공하는 데는 여전히 어려움을 겪고 있다. 비전-언어 모델은 텍스트 및 시각적 추론을 통합하여 식품 인식 및 식이 분석에서 설명 가능성을 향상시키는 유망한 대안을 제시한다. 그러나 추가적인 다중 모달 데이터 통합이 필요한 조리 스타일 식별과 같은 세부적인 작업에는 여전히 어려움을 겪고 있다. 연구팀은 개인화된 영양 전략과 비전-언어 모델을 통합하면 식이 추적과 만성 질환 예방을 개선할 수 있다고 제안한다. 웨어러블 기기, 식이 설문지, 전문가 감독에서 얻은 다중 모달 데이터와 AI 기반 식품 인식을 결합하면 자동화된 식이 평가의 정확성과 준수도를 향상시킬 수 있을 것이다. FAQ Q: 비전-언어 모델(VLM)이란 무엇인가요? A: 비전-언어 모델은 이미지와 텍스트 데이터를 함께 처리할 수 있는 인공지능 모델입니다. 이 모델들은 시각적 정보와 언어적 정보를 통합하여 더 포괄적인 이해를 제공하며, 식품 인식과 같은 작업에서 기존 모델보다 더 나은 성능을 발휘할 수 있습니다. Q: 연구에서 사용된 FoodNExTDB는 어떤 데이터베이스인가요? A: FoodNExTDB는 9,263개의 식품 이미지로 구성된 데이터베이스로, 체중 감량 프로그램에 참여한 실제 참가자들의 식사 기록에서 수집되었습니다. 7명의 영양 전문가가 각 이미지를 검토하여 10개의 식품 카테고리, 62개의 하위 카테고리, 9개의 조리 스타일로 분류했으며, 총 5만 개 이상의 라벨을 생성했습니다. Q: 왜 비전-언어 모델은 조리 스타일 인식에 어려움을 겪나요? A: 조리 스타일 인식은 미세한 시각적 차이를 구분해야 하는 복잡한 작업입니다. 비전-언어 모델은 기본적인 식품 카테고리 인식에는 강하지만, "튀긴", "구운", "삶은" 등의 조리 방법 구분은 더 세밀한 특징을 요구합니다. 또한 이미지만으로는 조리 과정이나 사용된 소스, 기름 등을 정확히 파악하기 어렵기 때문에 이러한 세부적인 분류에 한계가 있습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.04.14 13:31AI 에디터

클라우드플레어, AI 에이전트 개발용 플랫폼 공개

클라우드플레어가 인공지능(AI) 에이전트 개발을 위한 신규 기능을 대거 공개해 개발자 지원에 본격 나섰다. 클라우드플레어는 업계에서 처음으로 원격 모델 컨텍스트 프로토콜(MCP) 서버를 비롯한 '워크플로우' '듀러블 오브젝트' 무료 플랜을 제공한다고 14일 밝혔다. MCP 서버는 AI 에이전트가 이메일 전송, 회의 예약, 코드 배포 등 복합 작업을 스스로 수행할 수 있게 지원한다. 기존 로컬 기반 MCP 제약을 해소하고 오스제로와 스티치, 워크 운영체제(OS)와의 연동으로 인증·권한 부여도 간소화했다. 듀러블 오브젝트는 컨텍스트 인식이 가능한 지능형 에이전트 구현을 돕는다. 이는 과거 사용자 이력이나 선호도를 기억해 반응하는 상태 기반 애플리케이션 개발에 활용된다. 서버리스 구조에서도 높은 확장성과 지연 최소화를 돕는다. 현재 해당 플랫폼은 무료로 제공된다. 워크플로우는 다단계 작업 흐름을 자동화하고 안정적으로 운영할 수 있는 기능이다. 수일 이상 지속되는 업무도 진행 상황을 기억해 이어서 수행할 수 있다. 복잡한 AI 기반 워크플로우 구현도 가능하다. 클라우드플레어는 사용한 만큼만 비용을 지불하는 구조를 통해 AI 추론에 소요되는 과도한 클라우드 비용 문제도 해소했다고 밝혔다. 서버리스 기반으로 유휴 시 리소스를 0으로 줄이고 필요 시 즉시 확장할 수 있다. 이를 통해 전통적인 클라우드 대비 운영 비용을 크게 낮출 수 있다. 전 세계 190여 개 도시에 그래픽처리장치(GPU) 인프라를 배치한 클라우드플레어는 사용자와 가까운 위치에서 AI를 실행할 수 있도록 지원해 지연을 줄이고 AI 접근성을 높이고 있다. 매튜 프린스 클라우드플레어 최고경영자(CEO)는 "AI 에이전트는 AI 기술 다음 단계"라며 "개발자들이 에이전트 기반 AI의 미래를 만들어갈 수 있도록 최고의 툴을 제공할 것"이라고 밝혔다.

2025.04.14 10:52김미정

크래프톤-펍지, 산불피해 복구 성금 12억 전달

크래프톤(대표 김창한)은 펍지 스튜디오(PUBG STUDIOS)와 함께 영남권 산불피해 지역의 빠른 복구와 이재민 지원을 위한 총 12억360만원의 성금을 기부한다고 14일 밝혔다. 이번 기부는 국가의 재난 극복에 기업이 적극 동참해 사회적 기여를 모범적으로 이어간다는 측면에서 이뤄졌다. 크래프톤은 영남권 산불피해가 사회 구성원이 공동으로 대응해야 할 재난이라고 강조하면서, 피해 복구를 위한 전방위적 지원을 펼치고자 게임업계 최대 규모로 성금을 전달하게 됐다고 기부의 취지를 밝혔다. 구호 성금은 크래프톤 임직원의 모금액에 회사가 동일한 금액을 매칭해 더하고, 펍지 스튜디오 및 'PUBG: 배틀그라운드(PUBG: BATTLEGROUNDS, 이하 배틀그라운드)' 이용자 일동 명의로 진행된 기부를 통해 조성됐다. 앞서 크래프톤은 전체 임직원을 대상으로 지난달 26일부터 11일간 매칭 그랜트 기반의 모금 캠페인을 전개해 기부금을 마련했다. 매칭 그랜트는 임직원이 자발적으로 모금한 성금에 회사가 기부금을 보태는 방식으로 지난 2021년부터 운영해왔다. 이달 6일까지 진행된 캠페인에는 장병규 의장, 김창한 대표를 비롯한 크래프톤 임직원 481명이 참여했다. 특히 펍지 스튜디오는 지난 2020년 호주 산불피해 지역에 약 58만 달러의 구호 성금을 전달한 데 이어 또다시 적극적인 기부에 나서 이목을 끈다. 장태석 펍지 스튜디오 총괄 PD는 “배틀그라운드가 지난 8년여간 플레이어들의 관심과 사랑으로 성장해 온 만큼, 이에 보답하고자 커뮤니티 구성원들의 이름으로 함께 기부를 진행하기로 결정했다”고 밝혔다. 기부금은 산불피해를 입은 지역과 주민들에 대한 실질적 지원을 위해 사용된다. 크래프톤은 재난사회복지 전문기관인 사단법인 더프라미스를 통해 이재민의 생활안정에 필요한 구호물품을 전달한다. 또한, 경북사회복지공동모금회에 기탁한 성금을 활용해 ▲아동·청소년 지원 ▲이재민의 일상 복귀 지원 ▲복구 작업 등 산불 피해가 집중된 지역의 신속한 재건을 도울 계획이다. 한편, 크래프톤은 재난에 따른 구호와 피해 복구에 적극적으로 나서며 위기 극복에 동참해왔다. 2020년 코로나19 당시 방역 및 구호물품 지원을 위해 10억원을 기부했으며, 2023년에는 지진으로 피해를 입은 튀르키예 지역에 기부금 약 1억2천600만원을 전달하기도 했다.

2025.04.14 10:44이도원

AI로 마약 잡고 3배 빨라진 통관…삼성SDS, 관세청 전자통관시스템 개편

관세청이 1천억원 규모의 전산장비 교체 사업을 마무리하고, 전자통관시스템 '유니패스(UNI-PASS)'를 개통했다. 이를 통해 수출입 통관부터 위해물품 차단까지 고도화되며 무역‧물류 산업의 핵심 인프라를 견고하게 구축했다. 삼성SDS는 관세청의 전자통관시스템 전산장비 교체 및 전환 사업을 마무리하고 유니패스를 개통했다고 14일 밝혔다. 개통 한 달을 맞은 유니패스는 수출입 통관부터 물류, 세금 징수, 여행자 통관, 위해물품 차단에 이르기까지 관세청의 모든 대국민 및 내부 행정업무를 처리하는 핵심 인프라로, 한국형 전자통관시스템의 대표 모델이다. 이번 사업은 국가관세종합정보망을 전면적으로 개편한 사업으로 삼성SDS 컨소시엄이 수행했다. 국가관세종합정보망은 우리나라 모든 수출입 통관 업무를 365일 24시간 실시간으로 처리하는 무역·물류의 핵심 인프라다. 이번 사업을 통해 노후화된 관세정보시스템(유니패스)의 전산장비와 소프트웨어를 고도화하고, 업무 시스템을 안정적으로 전환했다. 더불어 향후 클라우드 전환을 위한 기반도 마련했다. 유니패스는 기획재정부, 국토교통부, 산업통상자원부 등 135개 기관과 수출입 기업, 선사, 항공사 등 26만개 업체가 연계된 범정부‧산업 인프라로 작동하며, 우리나라 무역‧물류 시스템의 근간을 이룬다. 총 1천60억 의 예산이 투입된 이번 대형 프로젝트에서는 2015년부터 사용돼온 노후 전산장비와 80종의 상용 소프트웨어를 전면 교체하고 고도화했다. 이를 통해 급증하는 전자상거래와 같은 행정 수요에 선제적으로 대응하고 통관 시스템 장애로 인한 물류 차질 가능성도 줄일 수 있게 됐다. 특히 이번 시스템 개편은 단순 장비 교체를 넘어 인공지능(AI)과 빅데이터 기술을 활용한 첨단 관세행정 체계를 실현하는 데 방점을 뒀다. 마약 등 위해물품을 선별하는 데 AI 기술을 적용함으로써 감시정밀도가 높아졌으며, 향후 관세 전반에서 인공지능 기술의 활용 가능성도 크게 넓혔다. 시스템 개통 이후 각종 업무의 처리 속도도 향상됐다. 수입신고서는 평균 24.1초에서 9.7초로 2.5배 빨라졌고, 수출신고서는 1.8배, 환급신청서는 1.6배 개선됐다. 공공데이터의 동시 처리 능력도 3배 향상돼, 1분당 제공 가능한 건수가 10만 건에서 30만 건으로 늘어났으며, 이를 통해 화물통관진행정보 등 다양한 공공데이터를 보다 신속하고 안정적으로 국민에게 제공할 수 있게 됐다. 데이터 분석 성능 또한 2.7배 개선되어, 50만 건 기준 데이터 추출 시간이 11분에서 4분으로 단축되었으며, 이로 인해 밀수, 불법 무역, 관세 포탈 등 국가 경제를 위협하는 불법 행위에 대한 대응 역량이 크게 강화될 전망이다. 관세청은 개통 안정성을 확보하기 위해 작년 4월부터 모든 시스템 기능에 대한 철저한 사전 점검을 실시했으며, 업무 기반 통합 테스트 7차례, 대외기관 연계 테스트 5차례, 개통 리허설 5회를 거쳤다. 또한 개통 2주 전부터는 24시간 상시 대응체계를 운영하며 대규모 전환 작업임에도 불구하고 단 한 건의 큰 장애 없이 시스템 전환을 성공적으로 마쳤다. 개통 이후에도 시스템 안정화 과정에서 발생할 수 있는 결함에 즉각 대응하는 등 철저한 사후 관리에 나서고 있다. 삼성SDS 컨소시엄은 2년여에 걸친 이번 사업을 성공적으로 마무리하고, 신규 관세정보시스템을 통해 보다 신속하고 안정적인 통관 서비스를 제공할 수 있도록 지속적으로 지원할 예정이다. 또한, 삼성SDS는 현재 진행 중인 '관세청 전자상거래 전용 통관플랫폼 구축 사업'도 성공적으로 수행해 신속하고 편리하면서도 안전한 전자상거래 통관 체계를 마련하기 위해 최선을 다하고 있다. 고광효 관세청장은 "유니패스의 성공적인 개통을 통해 우리나라 무역‧물류 산업의 핵심 디지털 인프라가 한층 공고해졌다"며 "앞으로도 안정적이고 효율적인 서비스를 통해 국민에게 신뢰받는 관세행정을 제공할 수 있도록 유니패스를 체계적으로 유지‧관리해 나가겠다"고 밝혔다.

2025.04.14 10:29남혁우

"언어 장벽 낮춰"…AWS, '아마존 Q 디벨로퍼'에 한국어 추가

아마존웹서비스(AWS)가 생성형 인공지능(AI) 개발 도구에 한국어를 추가해 국내 개발자 업무 효율성과 글로벌 협업 역량 높이기에 나섰다. AWS는 생성형 AI 기반 개발 어시스턴트 '아마존 Q 디벨로퍼'에 한국어를 포함한 다국어 지원을 확장했다고 14일 밝혔다. 개발자는 한국어로 아키텍처 논의를 비롯한 문서 작성, 인터페이스 설계, 애플리케이션 구축 등 개발 업무를 수행할 수 있다. 아마존 Q 디벨로퍼는 코드에 대한 실시간 피드백과 문제 해결 가이드를 제공해 반복적이고 수동적인 개발 작업을 빠르게 처리할 수 있도록 돕는다. 신뢰성 높은 코드를 효율적으로 구현하고 전반적인 개발 생산성과 품질을 높일 수 있다는 평가를 받고 있다. AWS는 이번 한국어 지원을 통해 개발자가 복잡한 기술 개념을 보다 직관적으로 이해하고, 자연어 기반 인터페이스를 활용해 전략적인 개발 업무를 수행할 수 있는 환경을 조성할 것이라고 밝혔다. 특히 대규모 기술 현대화처럼 고도화된 작업에도 능동적으로 대응할 수 있게 됐다는 설명이다. 개발자는 이제 영어로 작성된 주석이나 소스코드에 대해 한국어로 질문하고 답변을 받을 수 있다. 언어 장벽을 낮춰 글로벌 코드에 대한 이해도를 높이고, 다양한 언어권과의 협업에서도 효율성을 확보할 수 있다. 확장된 언어 기능은 통합 개발 환경(IDE)과 커맨드라인 인터페이스(CLI)에서 즉시 사용 가능하며 추후 AWS 매니지먼트 콘솔에서도 적용될 예정이다. 프리·프로 요금제 사용자는 해당 기능을 이용할 수 있다. AWS는 "이번 언어 지원 확장을 통해 개발자들이 더 창의적인 문제 해결에 집중할 수 있는 환경이 마련됐다"며 "글로벌 팀 간 협업을 보다 포용적이고 효과적으로 만들 수 있을 것"이라고 강조했다.

2025.04.14 10:27김미정

두산로보틱스, 휴머노이드 R&D 조직 신설한다

두산로보틱스가 올해를 새로운 도약의 원년으로 삼고, 인공지능(AI) 중심의 기술 혁신을 추진한다. 두산로보틱스는 분당두산타워에서 김민표 대표를 비롯한 전 임직원이 참석한 가운데 타운홀 미팅을 진행했다고 14일 밝혔다. 이날 김 대표는 하드웨어 중심으로 편재됐던 사업을 '지능형 로봇 솔루션'으로 전환하는 한편, 휴머노이드 기술 확보를 위한 투자도 병행하겠다고 선언했다. 또한 빠른 성과를 내기 위해 대대적인 조직 변화와 혁신을 추진하자고 임직원들에게 주문했다. '지능형 로봇 솔루션'은 협동로봇의 하드웨어, 소프트웨어, AI 기능을 통합한 형태로, 간단히 설치 후 바로 운영할 수 있는 플러그앤플레이 제품이다. AI를 통해 작업 경로와 순서를 최적화하고 작업시간을 최소화할 수 있으며, 다수의 협동로봇간 협업으로 효율적인 작업이 가능하다. 특히, 지능형 로봇 솔루션은 물류, 용접, 커피 제조 등 개별 작업의 정밀성을 높이고 최적화를 위해 특화 인공지능(ANI)이 적용된다. 두산로보틱스는 먼저 제조 분야의 자동화 관련 지능형 로봇 솔루션을 연내 출시하고, 단계적으로 분야를 확대해 나갈 계획이다. 또한 두산로보틱스는 '실용적 휴머노이드' 사업 진출을 위해 우수인력을 조기에 확보한다. 이달 21일부터 홈페이지와 다양한 채용 플랫폼을 통해 로봇 R&D, 어플리케이션 엔지니어링, AI, 소프트웨어, 사용자경험(UX), 품질, 영업 등 전 분야에 걸쳐 대대적으로 경력사원 공개채용을 진행하기로 했다. 올해 하반기에는 AI & 소프트웨어와 휴머노이드 R&D 조직을 신설하고, 최적의 로봇 연구개발 환경을 보유한 통합 R&D 센터도 구축할 예정이다. 두산로보틱스가 지향하는 실용적 휴머노이드는 사용자가 요구한 작업을 형태, 기능 등의 최적화를 통해 가장 효율적으로 수행할 수 있는 로봇이다. 두산로보틱스는 '실용적 휴머노이드'를 위해 ▲여러 개의 팔을 동시에 제어함으로써 더 복잡하고 정교한 작업을 수행할 수 있는 '멀티암동시제어 기술' ▲다양한 환경에서 센서, 알고리즘을 이용해 안전한 작업을 돕는 '충돌 회피기술' ▲ 로봇이 스스로 작업계획을 수립하고 여러 단계의 복잡한 작업을 수행할 수 있는 '롱-호라이즌 태스크 기술' 등을 선제적으로 개발한다. 이 기술들은 '지능형 로봇 솔루션'에도 적용해 시너지를 낼 수 있는 만큼, 빠른 속도로 내재화한다는 계획이다. 이 외에도 두산로보틱스는 근본적인 조직 문화 혁신을 위해 블리츠스케일링 전략을 도입한다. 블리츠스케일링은 급변하는 시장과 치열한 경쟁속에서 기존 조직의 관성을 깨고, 압도적 속도의 실행력으로 명확한 기술우위와 시장 지배력을 확보하는 전략이다. 이에 따라 두산로보틱스는 ▲핵심기술과 사업에 자원 집중, ▲ 변화장벽제거 및 성과중심의 문화구축, ▲빠르고 혁신적인 실행력 강화에 힘쓰기로 했다. 김민표 두산로보틱스 대표는 “협동로봇 시장을 넘어 성장 잠재력이 더욱 큰 지능형 로봇시장의 탑 티어가 되기 위해 기술 혁신으로 제품 초격차를 이끌어 내고, 고객에게 더 많은 가치를 제공해야 한다”면서 “목표를 조기에 달성하기 위해 기술 개발 및 내재화, 전략적 파트너십, M&A 기회 확보 등 가용 자원을 총 동원할 뿐만 아니라 실행 중심의 조직 문화를 정착시켜 혁신을 이어가자”고 강조했다. 한편, 두산로보틱스는 최근 출범한 'K-휴머노이드 연합'에 로봇제조사로서 참여해 로봇 하드웨어 핵심기술 및 핵심 부품 개발, 인재 양성, 스타트업 지원 등을 수행해 국내 로봇 생태계 조성에 기여하고, 핵심 경쟁력을 확보할 계획이다.

2025.04.14 09:35류은주

"애플, 새 비전 프로 개발 중…가볍고 저렴하다"

애플이 더 가볍고 저렴한 차기 비전 프로 헤드셋을 개발 중이라고 블룸버그 통신이 13일(현지시간) 보도했다. 블룸버그 마크 거먼은 파워온 뉴스레터를 통해 애플이 비전 프로 헤드셋을 더 가볍게 만들기 위해 노력 중이라고 밝혔다. 현재 비전 프로의 무게는 약 700g로 착용자의 목과 머리에 부담을 줄 수 있다. 또, 3천 500달러(약 500만원)라는 높은 가격은 애플의 가장 비싼 노트북과 맞먹는 수준이며 메타 퀘스트 헤드셋 보다 7배 이상 비싸다. 애플은 이 문제를 해결하려 할 예정이지만 트럼프의 상호 관세 정책으로 비용 낮추는 것이 더욱 어려울 수 있다고 블룸버그는 지적했다. 현재 비전 프로 헤드셋은 중국에서 생산된다. 애플은 또한 맥과 유선으로 연결해 매우 낮은 지연 시간을 제공하는 다른 헤드셋 제품도 개발 중이다. 마크 거먼은 "일부 고객은 수술 중 영상 확인이나 비행 시뮬레이터 사용과 같은 작업에 비전 프로를 사용해왔다. 이 이 두 가지 영역에서 사용자는 지연 시간을 최소화하기를 원하지만, 완전 무선 시스템에서는 이를 보장할 수 없다"고 지적했다. 애플이 개발 중인 이 두 헤드셋을 언제 출시할 계획인지는 아직 확실하지 않다. 현재 시장에 나와 있는 비전 프로는 2024년 2월에 출시됐다. 마크 거먼은 팀 쿡 애플 최고경영자(CEO)의 최우선 순위 중 하나는 증강현실(VR) 안경이지만, 그러한 제품이 나오기까지는 수 년이 걸릴 가능성이 크다고 밝혔다. 이를 위해서는 초고해상도 디스플레이, 고성능 칩, 매일 몇 시간씩 사용할 수 있는 초소형 배터리 등 다양한 기술이 완성되어야 하기 때문이다. 애플은 인공지능(AI) 비서 시리와 카메라를 통해 주변 사물이나 장소에 대한 정보를 실시간으로 제공하는 '비주얼 인텔리전스'를 활용하기 위해 카메라와 마이크가 장착된 자체 안경을 개발해 왔다. 하지만 애플의 개인정보 보호 정책과 사람들이 사진과 동영상을 촬영에 아이폰을 사용하도록 유도하는 경향을 고려할 때, 애플이 메타 등의 경쟁사처럼 안경에도 미디어 촬영 기능을 허용할지 여부를 놓고 활발하게 논의하고 있다고 밝혔다.

2025.04.14 08:27이정현

[이창근의 헤디트] 한국미술의 무한한 가치

올 7월 제1차 미술진흥 기본계획(2025-2029)이 발표될 전망이다. 2023년 7월 「미술진흥법」 제정 이후 미술인들이 실질적 체감할 수 있는 첫 법정계획이다. 무엇보다 미술계 전반의 변화된 환경과 새로운 수요를 반영한 체계적 미술진흥 정책이 시행되는 점에서 의미가 크다. 건강한 미술 생태계 조성과 내실 있는 시장 기반 마련은 물론 한국미술의 지속 가능한 성장과 K-Art 확산의 기폭제가 되리라 본다. 문화체육관광부는 미술진흥 기본계획의 수립 방향을 현장 전문가, 관계자들과 논의하며 의견을 청취하고 있다. 5월까지 창작·유통·향유 등 분야별 주요 전략 및 중점 추진과제에 대해 현장의 목소리를 수렴한 뒤 6월 공청회를 거쳐 7월 공식 발표한다. 미술진흥법에서 정의한 미술이란 '작가의 사상·감정이나 예술적 경험을 회화, 조각, 판화, 미디어아트, 설치미술, 행위예술, 응용미술 등 시각적 매체를 이용해 표현하는 것'을 말한다. 작가가 미술 활동을 통해 산출한 유·무형의 창작물인 미술품은 아티스트 저마다의 예술철학과 사회적 메시지에서 출발한다. 연구와 구상, 고단한 작업 과정을 거쳐 본인만의 스타일을 담아 관객에게 메시지로 소구하는 예술작품이라고 할 수 있다. 예술장르 중 미술의 경우 창작에 대한 지원을 근간으로, 전시 및 유통 체제를 공정하고 지속적으로 발전시킬 수 있는 구조를 확립할 필요성이 제기되고 있었다. 나아가 이를 체계적으로 담당하는 통합지원전담기관이 없는 상황에서, 이를 통해 미술인의 개별 역량에만 의존해온 부분을 국가 지원 체제 확립을 중심으로 미술을 진흥해야 한다는 논의가 폭넓게 진행되고 있었다. 또한 최근 재료와 매체의 확장과 더불어 기술과의 융합이 시작됐으며, 기술의 발전과 미디어 환경의 변화에 따른 새로운 표현방법의 등장, 다양한 형태의 예술장르 발생은 예술의 창작 분야에 대한 새로운 시각을 요구하고 있다. 아울러 대안공간을 비롯한 비영리 공간이나 비엔날레, 미술인들의 창작 활동에 부합하는 정책을 마련할 필요성도 제기된 바 있다. 이런 미술계의 숙원으로 2023년 7월, 21대 국회에서 미술진흥법이 제정돼 지난해부터 시행됐다. 지난 10일 광화문 아트코리아랩에서 열린 '오후 3시의 예술정책 이야기'에서 문화체육관광부의 김수현 시각예술디자인과장이 미술진흥 기본계획案의 5개 분야별 추진방향을 발제했다. 내용을 보면 먼저 미술생태계 분야에서 지원 정책 및 지원 체계 고도화를 통한 균형적 성장 유도, 제도 기반은 충분한 의견 수렴 통한 미술시장의 제도적 성숙 기반 마련, 해외 진출은 전략적 접근으로 한국 미술시장의 글로벌 플랫폼화, 수요 확대는 미술품 및 전시 수요 촉진으로 지속 가능한 성장동력 확보, 마지막 지역 균형은 중앙-지방 연계·협력으로 전국 곳곳 미술향유 기회 획기적 증대까지 5대 방향에 따른 전략과제와 세부계획을 수립하고 있다. UN은 지속 가능한 발전목표인 SDGs(Sustainable Development Goals, 2016-2030)을 설정하고 빈곤퇴치, 사회발전, 환경보호 등 지속가능발전에 필요한 17개의 가치를 목표로 제시한 이래 문화예술과 지속가능한 발전의 연계성을 인식하면서 논의가 지속되고 있다. 사회적 지속가능성은 갈등과 통합의 사회적 관계를 조율하는 것으로 사회 내 다양한 주체가 소통하고 함께 성장하며 소외되지 않도록 하는 것을 의미한다. 지속가능한 문화예술은 지속가능한 사회의 비전, 삶의 가치와 방식을 제공하는 의미로 문화예술이 현시대 지속가능성 가치를 지향하는 인식의 전환을 이끄는 역할을 할 수 있다는 논의로 이어지고 있다. 그래서 문화예술의 실천은 다양한 가치에 대한 소통을 통해 사회 전반에 대한 책임과 생태윤리를 제공하고, 가치와 인식을 전환해 지속가능한 발전을 야기할 수 있으며, 시각예술 분야에서 보다 적극적으로 방안을 모색할 필요가 있다. 현대미술 현장에서 회화와 미디어아트를 매개로 컨템포러리 작품을 창작하는 최지원 작가는 “장기적 관점에서 한국미술의 진흥을 위해서는 보다 정교한 선순환 구조 구축이 필요할 것으로 보인다. 미술생태계를 이루는 작가들의 작업 환경을 온전히 과정 중심적인 연구와 제작에 몰두할 수 있는 유·무형의 창작지원 체계가 조성돼야 한다”며 “무엇보다 점차 다각화돼 가는 미술생태계의 진입-적응-가치발현-환원의 각 단계에서 해당 주체들이 자생력을 갖출 수 있도록 하는 세분된 접근이 필요하다”고 발전방안을 전했다. 미술은 미적 감성과 창의성의 근원으로, 미술의 창작에서부터 향유, 이를 매개하는 과정에서 발생하는 모든 문화적·사회적 가치는 우리 국민이 보다 풍요롭고 아름다운 삶의 누릴 수 있는 원천이 되고 있다. 과거 미술 정책은 창작, 기획, 전시, 유통, 향유 등 생태계의 다양한 주체를 포괄하지는 못하는 한계가 있었고, 문체부의 한국문화예술위원회, 예술경영지원센터, 국립현대미술관, 한국국제문화교류진흥원 등 여러 기관에 분산된 지원사업 또는 기획사업들이 운영됐다. 하지만 이제 미술진흥법 제정에 따라 미술창작을 근간으로 매개, 향유 영역이 순환하며 생태계의 자생적 발전을 이끄는 데 필요한 사항을 정해, 건강하고 공정한 미술 생태계를 조성하고 국민이 미술을 보다 폭넓게 향유할 수 있는 안정적 제도적 여건이 마련됐다. K-아트는 문화수출 시장의 신흥 강자다. 제1차 미술진흥 기본계획은 K-미술 생태계의 창작-유통-향유 선순환 체계를 구축하고 한국 작가들의 해외 진출을 강화할 주춧돌 역할을 한다. 문화경제의 한 축으로 한국미술의 역할이 중요하다. 또 침체한 우리 사회의 등불을 밝혀주는 희망이 돼주길 바란다. * 헤디트(HEDIT) : Heritage(문화자원) + Digital(첨단기술) + Art(예술창작)

2025.04.14 08:16이창근

오픈AI, 3번째 AI 에이전트 출시 앞둬

챗GPT 개발사인 오픈AI가 소프트웨어(SW) 엔지니어링을 대신할 수 있는 신규 AI 에이전트 출시를 시사했다. 13일 골드만삭스에 따르면 오픈AI는 세 번째 AI 에이전트 'A-SWE(에이전틱 소프트웨어 엔지니어)'를 출시할 예정이다. 앞서 오픈AI는 1월에 첫 번째 AI 에이전트인 오퍼레이터(Operator)를 출시했고, 이어 2월에는 딥 리서치(Deep Research)를 선보였다. 2가지 AI 서비스 모두 현재 챗GPT 유료 고객에게만 제공되고 있다. 새롭게 공개될 A-SWE는 사용자 맞춤형 앱을 개발하는 역할을 할 것으로 점쳐진다. 오픈AI의 사라 프라이어 최고재무책임자(CFO)는 최근 골드만삭스와의 인터뷰에서 "A-SWE는 일반 SW 엔지니어가 수행할 수 있는 작업뿐만 아니라 품질 보증, 버그 테스트, 버그 수정 등 추가적인 작업도 수행할 수 있다"고 설명했다. 프라이어 CFO는 "A-SWE는 단순히 기존의 SW 엔지니어를 지원하는 것을 넘어 사용자를 위한 앱을 직접 개발할 수 있는 에이전틱 SW 엔지니어"라며 "A-SWE는 엔지니어가 제공받는 홍보 자료만 있으면 바로 앱을 개발할 수 있다"며 "단순히 개발만 하는 것이 아니라 SW 엔지니어들이 하기 싫어하는 모든 일을 스스로 처리한다"고 강조했다. 이어 "자체적으로 QA, 품질 보증, 버그 테스트·수정, 문서화 작업 등 SW 엔지니어들이 꺼리는 업무를 처리할 수 있다"며 "기업들은 A-SWE를 활용해 엔지니어링 인력이 늘어난 것과 같은 효과를 얻을 수 있을 것"이라고 덧붙였다.

2025.04.13 16:33한정호

박정원 두산 회장 "밥캣만의 혁신 기술로 시장 선도해야"

“유럽 시장은 북미에 이어 두산밥캣의 지속성장을 뒷받침할 제2의 홈마켓이다. 밥캣만의 혁신기술로 시장을 선도해야 한다." 박정원 두산그룹 회장은 스캇박 두산밥캣 부회장 등 경영진과 함께 지난 7~13일(현지시간) 독일 뮌헨에서 열린 건설기계 박람회 '2025 바우마'에 찾아 이같이 말했다. 최고경영진들은 유럽 시장 현황을 살피고, 경쟁사들의 신기술 동향을 직접 확인했다. 유럽은 두산밥캣 매출 비중에서 북미에 이어 두번째로 높은 중요한 시장이다. 두산밥캣 전체 매출의 15~20%가 유럽에서 발생하고 있으며, 특히 두산밥캣은 신기술 도입과 포트폴리오 확장 등으로 최근 4년 간 유럽시장에서만 연평균 8% 성장을 지속했다. 유럽 소형 건설기계 시장은 연간 16만대 규모로 그 중 굴착기가 약 절반인 8만대, 텔레핸들러 약 4만대, 콤팩트 휠로더가 약 2만대로 추정된다. 두산밥캣은 이번 바우마를 통해 소형 굴착기 부문에서 신제품 4종을 포함한 12종의 모델을 선보이며 시장 확대를 노리고 있다. 기존 건설, 농업을 넘어 재활용 산업에서 활용도가 높아지고 있는 텔레핸들러 부문에서는 전동화 제품인 'TL25.60e' 콘셉트 제품을 전시하며 방문객들의 눈길을 끌었다. 올해 34회째를 맞은 바우마는 3년마다 개최되는 세계적 전시회로, 글로벌 건설기계 테마를 한눈에 확인할 수 있는 자리다. 미국 콘엑스포, 프랑스 인터마트와 함께 세계 3대 건설기계 전시회로 불린다. 올해 바우마에는 57개국 3천500여 개 기업이 참가했으며, 전시회장을 찾은 방문객은 약 60만 명으로 추산됐다. 바우마는 특히 유럽 건설기계 관련 기업 관계자, 바이어들이 총출동하는 플랫폼이자 비즈니스 교류의 장이다. '전동화'와 '무인화' 기술의 각축장인 이번 바우마에서 참가 기업들은 전기 및 수소를 활용한 제품, 무인 및 원격 기술, AI 기반 솔루션 등 첨단 기술과 신제품을 선보였다. 두산밥캣은 유럽시장 주력인 1~2톤급 미니굴착기를 포함한 신제품 5종을 비롯해 무인화·전동화 첨단기술을 적용한 장비 등 총 40여 종의 제품을 선보였다. 부스 중앙에 위치한 '데모 존'에서 장비 시연과 스마트폰을 이용한 원격조종을 선보였고, 실내 전시장에는 조종석에서 가상현실 속 작업을 시뮬레이션해 볼 수 있는 공간 등을 마련했다. 박 회장은 바우마 현장에서 두산밥캣을 비롯한 다양한 글로벌 기업들의 부스를 둘러봤다. 특히 올해 전시회 화두인 전동화 및 무인·원격 장비와 AI기반 첨단기술에 큰 관심을 보이며 경쟁사들의 제품을 유심히 살폈다. 이날 박 회장은 “건설기계 글로벌 톱티어들이 무인화, 전동화 트렌드에 맞춰 어떤 수준의 준비를 하고 있는지 확인한만큼 그들과 비교해서 우리 기술을 점검하고 먼저 앞서 나가도록 속도를 내야 한다”면서 “스키드 로더와 완전 전동식 건설장비 등 '세계 최초' 제품을 내놓은 혁신 DNA를 바탕으로 전동화, 무인화는 물론이고 AI 적용에 이르기까지 기술 혁신을 이어 나가자”고 말했다. 두산밥캣은 2019년 바우마에서 1톤급 전기 굴착기를, 2022년 미국에서 100% 전기로 작동하는 '완전 전동식' 로더 T7X를 업계 최초로 선보인 바 있다. 전동화 품목을 텔레핸들러 등으로 확대해 나가는 것과 동시에, 배터리 팩 사업에 진출하며 핵심 부품 내재화도 추진하고 있다. 또한 실리콘밸리의 스타트업들과 협력하면서 로더와 트랙터, 잔디깎이 제품 등에 무인·자율화 기술을 접목하고, 완전 무인화를 고려해 조종석을 과감하게 없앤 콘셉트 로더를 선보이는 등 미래에 대비한 기술을 개발하고 있다

2025.04.13 10:02류은주

[황승진의 AI칼럼] 쏟아지는 이미지 AI···비즈니스에는 어떻게 활용할까

생성AI로 대변되는 새로운 AI는 글, 그림, 음성을 읽고 쓸 수 있는 6가지 기능을 가졌다. LLM은 원래 언어를 다루지만, 이미지 처리 기술도 익혔다. 그래서 챗GPT나 제미나이(Gemini)의 답에서 그림이나 테이블을 볼 수 있다. 최근에는 여러 이미지 모델이 개발돼 DALL-E, Imagen, Stable Diffusion, Leonardo.ai나 Midjourney 같은 이미지 생성 제품이 등장했다. 이들의 공통된 기본기는 '텍스트-to-이미지'다. 즉, 글을 주고 이미지를 받는다. 예를 들어 vrew.ai와 같은 웹사이트에서는 쉽게 YouTube 비디오를 만들 수 있다. 내가 "아침 식사로 피해야 할 다섯 가지 식품"이라는 제목을 입력하면 소프트웨어는 텍스트, 이미지 시리즈, 배경음악에 음성으로 텍스트를 읽는 혼합된 비디오를 생성한다. 이를 위해 나는 전문 지식도, 손재주도, 상상력도, 컴퓨터 조작 능력도 없이, 그저 제목만 결정했다. 이 출력을 시작점으로 여러 변형도 가능하다. 비슷한 원리로 파워포인트, 광고포스터, TV광고도 반자동 제작이 가능하다. 한 걸음 더 나아가 소라(Sora), 비오(Veo)와 클링(Kling)은 텍스트 명령에 따라 '비디오'를 생성할 수 있다. 소라에게 "다음 비디오를 제작해주세요. 스타일리시한 여성이 따뜻하게 빛나는 네온 사인과 애니메이션 도시 간판으로 가득 찬 도쿄 거리를 걸어갑니다. 그녀는 검은색 재킷, 롱 드레스, 검은 부츠를 입고 있습니다"라고 명령하면 비디오를 얻을 수 있다. 아무리 생각해도, 기계가 이미지를 읽고 그리는 능력은 참으로 놀랍다. 도대체, 기계가 어떻게 숫자로 변환된 이미지를 인식할 수 있을까? 각 픽셀은 빨강(R), 녹색(G), 파랑(B)의 3가지 색상 구성 요소를 3개 숫자로 (30, 100, 9)처럼 표현된다. 이런 픽셀이 100x100 개 모여 한 컬러 사진을 이룬다. 우리는 이미지를 이러한 숫자 데이터로 옮긴 후, 라벨을 붙여 신경망에게 사전 훈련을 시킨다. 이미지를 주면서, “이것은 고양이다” 라고 지도한다. 이러한 많은 학습과 CNN 같은 복잡한 알고리즘을 쓰면, 기계가 정말 이미지를 구분할 수 있다. 성공 비결은 신경망의 입력 노드와 출력 노드 중간에 위치한 '은닉층(hidden layer)'에 있다. 가중치를 잘 배정함으로써, 신경망은 '특징(feature)'을 잡아 은닉층에 넣는다. 더욱이 특징을 '계층적으로' 농축 저장한다. 첫 번째 은닉층은 이미지의 '직선', '색깔'과 같은 막연한 특징을 잡아내고, 그 다음 은닉층은 '눈'이나 '귀'와 같이 더 세밀한 특징을 잡아낸다. 이렇게, 은닉층의 '특징 추출'이 '이미지 인식'으로 가는 중요한 단계다. CNN과 U-NET은 이런 특징을 관리하는 기법이다. 다음 단계로, '읽기(이미지 인식)에서 '쓰기(이미지 생성)로 바꿔, "개의 이미지를 그려 주세요"라고 요청한다. 생성은 인식보다 어렵고, 새로운 기술이 필요하다. 이를 위해서, CNN은 축출된 특징에 (예, 뾰족한 귀) 벡터 임베딩을 할당한다. 그런 다음, 생성 요청이 오면, 기계는 이에 맞춰 임베딩을 호출해 '뾰족한 귀를 가진 흰색 개'와 같은 이미지를 찾거나, 수정하거나, 생성한다. 또한, 사진 속의 심각한 표정의 남자를 웃는 얼굴로 변환하고 싶다면 기존 이미지에 웃는 '특징 벡터'를 추가함으로써 수행된다. 검은 안경 착용, 늙음, 남성, 금발 등 다른 특징들도 각각 고유한 특징 벡터를 가지며, 이를 이미지에 더하거나 빼서 수정된 이미지를 생성할 수 있다. 따라서, 이미지 변환이나 생성은 임베딩을 조작하는 문제다. 또한 신경망의 특성상, 이미지를 정확히 외우는 것이 아니라 느슨하게 저장했다가 나중에 모방할 수 있는 여지를 남겨두는 것이다. 요새 인기있다는 "이 사진을 지브리라는 일본 만화 풍으로 바꿔죠" 라는 이미지-to-이미지 요구에 대해 오픈AI는 '디퓨전 (diffusion)'이라는 독특한 이미지 생성 방식을 쓴다. 주어진 사진에 엄청난 양의 잡음을 마구 뿌려 이미지를 완전히 망친 후 이젠 거꾸로 잡음을 뽑아 내며 지브리 풍으로 변형 복구한다. 사진 원본을 외워서 재생하는 게 아니라 이를 모방해 새로운 그림을 만든다. 특징을 기억해 변형에 사용한다. 지웠다가 다시 그리며, 괜한 일 하는 듯하지만 아주 효과적이라는 평다. 이러한 비전 능력을 비즈니스 어디에 쓸까?를 생각해 보자. 소비자가 온라인 쇼핑에서 물건을 찾는 데는 두 가지 접근방식이 있다. 브라우즈(Browse)와 서치(Search)다. 브라우즈는 제품을 특정하지 않고 이리저리 뒤지다 맘에 드는 것을 발견하는 것이다. 예로, “다음 주 동창회에 갈 때 입을 옷” 정도다. 서치는 원하는 바를 알고 찾는 것이다. 예로, “핑크색 V-Neck 스웨터” 같다. 각 온라인 쇼핑몰은 둘 중 한 방식을 선택해 DB와 웹을 디자인한다. 서치 모델은 모든 상품을 조직적으로 저장하고 찾는 '속성' 위주의 디지털 방식이다. 브라우즈에서는 상품 목록처럼 여러 상품을 분위기에 따라 혹은 제조사별로 열거하는 '그림' 위주의 아날로그 방식이다. 브라우즈는 충동구매 덕택에, 판매가 더 많은 경향이 있다. 하지만 “빨간 V-Neck 스웨터” 같은 서치 요구에는 답을 못 내놓는다. 따라서 분석에는 서치가 좋고, 판매에는 브라우즈가 더 좋다. 어느 쇼핑사는 브라우즈를 택했다. 그 약점을 보완하기 위해 노동이 싼 먼 나라에서 수 백명을 고용해 분류 작업을 한다. 각 상품마다 수작업으로 라벨을 부여해 서치할 수 있는 DB를 만든다. '스웨터. 캐시미어. V-Neck. 빨간 색에 흰 줄.' 이렇게 아날로그를 디지털화하는 데는 비용이 많이 든다. 게다가 그림을 글로 옮기는 번역은 정확하지 않다. 여기에서 새로운 AI는 새로운 가능성을 열어 준다. 이제는 브라우즈 모델에서도, 수작업으로 설명을 넣지 않고도, 직접 텍스트나 이미지로 찾을 수 있다. 소비자가 인터넷의 사진을 가리키며 말한다. “이 여자가 입은 것 같은 드레스를 찾아 주세요.“

2025.04.12 10:14황승진

AI, 코드 디버깅 여전히 난관… 마이크로소프트, 디버깅 능력을 갖춘 '디버그-짐' 환경 공개

개발자 시간의 대부분은 디버깅에 사용된다... 코드 작성을 넘어선 AI의 진화 AI 코딩 도구가 개발자 효율성을 증가시키며 미래 소프트웨어 개발 환경을 빠르게 변화시키고 있다. 깃허브(GitHub) CEO 토마스 동케는 "머지 않아 80%의 코드가 코파일럿(Copilot)에 의해 작성될 것"이라고 예측했으며, Y 컴비네이터(Y Combinator)의 개리 탄에 따르면 최근 Y 컴비네이터 신생 기업 중 4분의 1은 코드의 95%가 대규모 언어 모델(LLM)에 의해 작성되었다고 한다. 하지만 대부분의 개발자는 코드 작성보다 디버깅에 더 많은 시간을 소비한다. 이에 마이크로소프트 리서치팀은 AI 코딩 도구가 인간처럼 코드를 디버깅할 수 있도록 가르치는 방법에 초점을 맞추게 되었다. 디버깅이란 코드 수정을 위한 대화형 반복 프로세스를 의미하며, 개발자들은 코드가 왜 충돌했는지 가설을 세우고, 프로그램을 단계별로 진행하며 변수 값을 검사하는 등의 증거를 수집한다. 이 과정에서 pdb(Python 디버거)와 같은 디버깅 도구를 사용해 정보를 수집하고, 코드가 수정될 때까지 이 과정을 반복한다. 현재의 AI 코딩 도구는 생산성을 향상시키고 가용한 코드와 오류 메시지를 기반으로 버그 해결책을 제안하는 데 탁월하다. 그러나 인간 개발자와 달리 솔루션이 실패할 때 추가 정보를 찾지 않아 일부 버그는 해결되지 않은 채 남게 된다. 이는 사용자들이 AI 코딩 도구가 해결하려는 문제의 전체 맥락을 이해하지 못한다고 느끼게 만든다. 디버그-짐: AI가 중단점 설정부터 변수값 검사까지, 인간 개발자처럼 코드를 이해하는 환경 이런 배경에서 마이크로소프트 리서치팀은 대규모 언어 모델(LLM)이 pdb와 같은 대화형 디버깅 도구를 어느 정도까지 사용할 수 있는지를 탐구하기 위해 디버그-짐(Debug-gym)을 출시했다. 해당 기술을 소개한 논문에 따르면, 디버그-짐은 코드 수정 에이전트가 능동적인 정보 탐색 행동을 위한 도구에 접근할 수 있게 해주는 환경이다. 이 환경은 에이전트의 행동 및 관찰 공간을 도구 사용에서 얻은 피드백으로 확장하여 중단점 설정, 코드 탐색, 변수 값 출력, 테스트 함수 생성 등을 가능하게 한다. 에이전트는 도구를 사용해 코드를 조사하거나 자신감이 있다면 코드를 다시 작성할 수 있다. 연구팀은 적절한 도구를 사용한 대화형 디버깅이 코딩 에이전트가 실제 소프트웨어 엔지니어링 작업을 처리할 수 있게 하고, LLM 기반 에이전트 연구의 중심이 될 것이라고 믿는다. 디버깅 기능을 갖춘 코딩 에이전트가 제안하고 인간 프로그래머가 승인한 수정 사항은 이전에 본 훈련 데이터에만 의존하는 추측이 아니라 관련 코드베이스, 프로그램 실행 및 문서의 맥락에 기반할 것이다. 도커 컨테이너부터 JSON 형식까지... 안전하고 확장 가능한 디버그-짐의 4가지 핵심 설계 디버그-짐은 여러 목표를 염두에 두고 설계 및 개발되었다. 첫째로, 저장소 수준의 정보 처리 능력을 갖추고 있어 에이전트에게 전체 저장소를 제공함으로써 파일을 자유롭게 탐색하고 편집할 수 있는 환경을 조성한다. 둘째로, 시스템과 개발 프로세스의 안전을 보장하기 위해 샌드박스 도커 컨테이너 내에서 코드를 실행하는 견고함과 안전성을 갖추었다. 이러한 격리된 런타임 환경은 유해한 작업을 방지하면서도 철저한 테스트와 디버깅을 가능하게 한다. 셋째로, 확장성을 핵심 설계 원칙으로 삼아 실무자들이 필요에 따라 새로운 도구를 쉽게 추가할 수 있는 유연한 구조를 제공한다. 마지막으로, 관찰 정보를 JSON 형식과 같은 구조화된 텍스트로 표현하고 텍스트 작업을 위한 간결한 구문을 정의하는 텍스트 기반 접근 방식을 채택했다. 이를 통해 최신 LLM 기반 에이전트들과 원활하게 호환되는 환경을 구축했다. 디버그-짐을 사용하면 연구자와 개발자는 폴더 경로를 지정하여 디버깅 에이전트의 성능을 평가하기 위해 모든 사용자 지정 저장소에서 작업할 수 있다. 또한 디버그-짐에는 대화형 디버깅에서 LLM 기반 에이전트의 성능을 측정하기 위한 세 가지 코딩 벤치마크가 포함되어 있다: 단순 함수 수준 코드 생성을 위한 Aider, 짧고 수작업으로 만든 버그가 있는 코드 예제를 위한 Mini-nightmare, 그리고 대규모 코드베이스의 포괄적인 이해와 GitHub 풀 리퀘스트 형식의 솔루션이 필요한 실제 코딩 문제를 위한 SWE-bench. Claude 3.7은 30%, OpenAI o1은 182%... 디버깅 도구로 AI 성능 대폭 향상 연구팀은 디버깅 도구에 접근할 때 LLM이 코딩 테스트에서 더 나은 성능을 보인다는 것을 검증하기 위한 초기 시도로, 간단한 프롬프트 기반 에이전트를 구축하고 eval, view, pdb, rewrite, listdir와 같은 디버그 도구에 대한 접근 권한을 제공했다. 이 에이전트의 백본으로 9개의 다른 LLM을 사용했다. 디버깅 도구를 사용하더라도 이 간단한 프롬프트 기반 에이전트는 SWE-bench Lite 이슈의 절반 이상을 해결하는 경우가 드물었다. 연구팀은 이것이 현재 LLM 훈련 코퍼스에서 순차적 의사 결정 행동(예: 디버깅 추적)을 나타내는 데이터의 부족 때문이라고 생각한다. 그러나 성능 향상이 상당하여(Claude 3.7은 30%, OpenAI o1은 182%, OpenAI o3-mini는 160%의 상대적 성능 향상을 보임) 이것이 유망한 연구 방향임을 입증한다. FAQ Q: 디버그-짐(Debug-gym)은 정확히 무엇인가요? A: 디버그-짐은 AI 코딩 도구가 인간 프로그래머처럼 코드를 디버깅하는 방법을 배울 수 있는 환경입니다. 이 환경은 코드 수정 에이전트에게 중단점 설정, 코드 탐색, 변수 값 출력 등과 같은 능동적인 정보 탐색 행동을 위한 도구에 접근할 수 있게 합니다. Q: 왜 AI 코딩 도구에 디버깅 능력이 필요한가요? A: 대부분의 개발자는 코드 작성보다 디버깅에 더 많은 시간을 소비합니다. 현재의 AI 코딩 도구는 코드와 오류 메시지를 기반으로 버그 해결책을 제안할 수 있지만, 솔루션이 실패할 때 추가 정보를 찾지 않아 일부 버그는 해결되지 않습니다. 디버깅 능력을 갖춘 AI는 실제 소프트웨어 엔지니ering 작업을 더 효과적으로 처리할 수 있습니다. Q: 디버그-짐은 어떻게 AI 코딩 도구의 성능을 향상시키나요? A: 디버그-짐은 AI 에이전트에게 pdb와 같은 디버깅 도구에 접근할 수 있게 해주어, 코드 실행 중에 추가 정보를 수집하고 더 정확한 수정을 제안할 수 있게 합니다. 초기 실험에서 디버깅 도구에 접근할 수 있는 AI 에이전트는 도구 없이 작동하는 동일한 AI 모델보다 최대 182%의 성능 향상을 보였습니다. ■ 이 기사는 AI 전문 매체 'AI 매터스'와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

2025.04.11 14:26AI 에디터

네오위즈, 인디 게임 8종 스팀 할인 판매

네오위즈(공동대표 김승철, 배태근)는 글로벌 온라인 유통 플랫폼 '스팀(Steam)'에 퍼블리싱하고 있는 인디 게임 8종의 할인 행사를 마련했다고 11일 밝혔다. 이번 할인은 오는 12일부터 17일까지까지 진행한다고 회사 측은 설명했다. 먼저 탄탄한 내러티브로 흥행에 성공한 '산나비'는 35%, 글로벌 누적 판매량 200만장을 돌파한 '스컬'은 50% 할인가에 판매한다. 오픈월드 힐링 어드벤처 게임 '아카'는 65%, 2D 액션 게임 '댄디 에이스'는 75% 할인가 가격에 만나볼 수 있다. 여기에 80%의 최대 할인율을 적용한 '메탈 유닛', '언소울드', '사망여각', '블레이드 어썰트'도 할인 행사에 참여한다. 같은 기간 '댄디 에이스'는 패치를 통한 게임의 밸런스 조정 작업을 진행, 이용자들에게 쉽고 쾌적한 플레이 경험을 선사한다.

2025.04.11 12:22이도원

현대차·제네시스·기아, '온라인 내비게이션' 첫 적용…편의성 개선

현대자동차, 제네시스, 기아가 무선 업데이트를 통해 지도 정보를 갱신하는 내비게이션에서 온라인 내비게이션으로 개선했다. 운전자가 주행 중 실시간 도로 상황을 실시간으로 받아 볼 수 있도록 한 것이 특징이다. 현대차그룹은 11일 새로운 인포테인먼트 시스템 업데이트를 통해 그룹 최초로 '온라인 내비게이션' 기능을 적용했다고 밝혔다. 온라인 내비게이션은 차량의 현재 위치와 주행 경로 데이터를 바탕으로 필요한 지도 정보만 실시간으로 다운로드해 최신, 그리고 최적의 경로를 안내하는 기능이다. 기존 현대차, 기아 차량은 새로운 도로나 변경된 정보를 반영하려면 지도 업데이트 과정이 필요했다. 기존 방식도 OTA(무선) 업데이트를 통해 지도 정보 갱신이 가능하기 때문에 크게 불편하지는 않았으나, 업데이트된 지도 정보를 기다려야 하는 과정이 필요해 공사 중이거나 새로 개통된 도로 정보를 즉시 반영할 수 없었다. 현대차그룹은 "온라인 내비게이션의 도입으로 현대차, 기아, 그리고 제네시스 고객들은 항상 최신 정보를 기반으로 더욱 정확하고 빠른 길 안내 서비스를 제공받을 수 있게 된다"고 설명했다. 현대차그룹의 온라인 내비게이션은 온라인으로 지도를 이용하지만, 기존의 내비게이션 연동 기능들은 그대로 유지된다. 또한 도로의 제한속도에 맞춰 자동으로 속도를 조절해 주는 '내비게이션 기반 스마트 크루즈 컨트롤(NSCC)', 터널 앞 내기순환 전환 및 창문 조절을 해주는 '터널 연동 자동 제어 기능' 등 개선된 편의 기능은 이전과 동일하게 작동한다. 이번 업데이트에는 전기차 특화 기능도 담겼다. 새롭게 추가된 'EV 경로 플래너' 기능은 충전소나 목적지에 도착했을 때 남겨둘 배터리 잔량을 설정할 수 있는 기능이다. 운전자가 희망하는 배터리 잔량을 설정하면 이동 경로 상 적합한 충전 장소, 횟수 등을 제안해 주행 경로를 최적화하고 배터리 잔량 관리에도 도움을 준다. 전기차 운전자의 고민을 덜어 주는 EV 경로 플래너는 내비게이션 설정 메뉴 중 '경로 안내' 항목에서 EV 경로 플래너를 선택할 때 설정이 가능하며, 설정 화면에서 직관적인 배터리 게이지 조작을 통해 도착 시 남겨둘 최소 배터리 잔량을 쉽게 설정할 수 있다. 한편 제네시스는 인포테인먼트 시스템에 넷플릭스와 유튜브, 웨이브 등 다양한 콘텐츠 스트리밍 서비스 도입에 이어 로벌 뉴스 플랫폼 '블룸버그(Bloomberg)'의 콘텐츠를 별도의 계정 생성과 구독 서비스 가입 없이 이용할 수 있도록 구성했다. 제네시스는 G90, G80, GV80 고객들에게 스마트폰이나 태블릿에서도 블룸버그 콘텐츠를 이용할 수 있도록 연간 299달러 상당의 블룸버그 1년 구독권도 무료로 증정한다. 2024년식 G90에만 적용되었던 '제네시스 뮤직'도 ccIC 전 모델로 확대 적용한다. '제네시스 뮤직'은 ccIC에 최적화된 UI 및 UX로 간편한 조작을 지원한다. 또한 스마트폰 없이도 음악 검색이 가능하고, 추천곡 리스트를 제공하는 등 편리한 음악 감상 환경을 제공한다. 또한 앞으로 ccIC가 탑재된 제네시스 차량 보유 고객은 돌비 애트모스(Dolby Atmos) 공간 음향의 풍부한 사운드를 최대 5년간 무료로 즐길 수 있다. 온라인 내비게이션 기능을 포함한 이번 소프트웨어 업데이트는 현대차∙기아∙제네시스 모델 중 ccNC 및 ccIC가 적용된 차량을 대상으로 한다. 그 외 인포테인먼트 플랫폼 고객들은 지도 업데이트와 시스템 안정화 작업을 지원받으며, 모든 업데이트는 무선 소프트웨어 업데이트(OTA) 방식을 통해 순차적으로 적용될 예정이다.

2025.04.11 10:24김재성

니어스랩, 비전AI 기반 비행제어 기술로 'IR52 장영실상' 수상

드론 인공지능(AI) 기업 니어스랩은 비전AI 기반 비행제어 기술의 혁신성을 인정받아 과학기술정보통신부가 주최한 제106차 'IR52 장영실상'을 수상했다고 11일 밝혔다. 장영실상은 우수한 신기술 제품과 연구 성과를 보유한 기업 및 연구조직을 선정해 시상하는 산업기술상이다. 비전AI 기반 비행제어 기술은 고가의 라이다 센서 없이도 드론에 탑재된 카메라만으로 목표물을 탐지하고 비행 경로를 생성한다. 니어스랩 전 제품군의 기반이 되는 핵심 요소다. 니어스랩은 먼저 풍력발전기 점검 분야에 실용화되며, 모바일 기반 자율 점검 솔루션 니어스윈드 모바일로 구현됐다. 사용자는 앱 설치만으로 일반 상용 드론에 자율비행 임무를 수행시킬 수 있다. 복잡한 장비나 조작 없이도 누구나 짧은 시간 내 점검이 가능해 에너지 산업 현장에서 기술 인력 부족 문제를 해결하고 높은 작업 효율을 입증해왔다. 기존에는 대형 산업용 드론이 필요했던 정밀 점검 작업을 소형 상용 드론으로 대체할 수 있다. 치안이나 통관 제약 등으로 산업용 드론 운용이 어려웠던 지역에도 기술을 적용할 수 있어 현장성과 확장성 면에서 주목받았다. 최재혁 니어스랩 대표는 "현장의 실질적인 문제 해결을 위한 기술 개발과 실제 적용이 이번 수상으로 이어졌다"며 "앞으로도 기술이 다양한 산업 현장에서 제대로 작동하고 안전성과 효율성을 높이는데 지속적으로 기여할 수 있도록 노력하겠다"고 밝혔다.

2025.04.11 09:16신영빈

"피지컬 AI는 이제 시작…로봇으로 상품화될 것"

"인공지능(AI)이 닫힌 디지털의 세계에서 열린 실제 세계로 나와서 사람의 일을 할 수 있게 됐습니다. 로봇이 AI를 갖추면서 어마어마한 변화의 시기가 왔습니다." 장병탁 서울대 AI연구소장은 10일 'K-휴머노이드 연합' 출범식에서 로봇 AI 모델 개발 동향을 이같이 소개했다. 장 원장은 "인공지능은 70년 전 사람처럼 생각하는 기계를 만들기 위해 출발한 기술"이라며 "사람 같은 지능적 기계를 만들려면 지각·사고·행동 능력이 필요한데 이 가운데 사고 능력이 가장 먼저 발달했다"고 말했다. 이어 "문자 중심의 거대언어모델이 먼저 나왔고, 여기에 비전 기능이 추가됐고, 행동은 많이 부족한 상황"이라며 "궁극적으로는 물리적 세계와 실제 상호작용할 수 있는 기술이 결합되면 이상적인 AI 에이전트가 될 것"이라고 강조했다. 장 원장은 AI의 학습 기술을 ▲감독학습 ▲무감독학습 ▲강화학습 ▲피지컬 AI 네 가지로 구분했다. 이 가운데 피지컬 AI 기술이 최근에 시작되면서 휴머노이드 로봇 고도화 가능성이 높아졌다는 설명이다. 그는 "인공지능 연구자들의 미션이 상당히 명확해졌다"며 "AI 연구의 연장선상은 명확히 휴머노이드 로봇 플랫폼에 지능을 집어넣고 일을 수행하게 하는 것"이라고 소개했다. 그러면서 "지금까지 AI에 많이 투자를 해도 상품화한 게 눈에 잘 안 보였는데, 휴머노이드 로봇은 에이전트로 명확하게 상품화할 수 있는 기술"이라며 "AI의 응용이 훨씬 더 넓어질 것"이라고 덧붙였다. 로봇 개발자 입장에서도 많은 변화가 생겼다. 이전까지 직접 프로그래밍을 통해 로봇을 제어해왔다면, 최근에는 로봇을 학습시키면서 사람의 행동을 흉내내서 스스로 알고리즘을 설계하는 일이 보편화됐다고 장 원장은 설명했다. 시각-언어-행동(VLA) 기술도 보편화되고 있다. 세 가지 기능이 개별적으로 동작하는 것이 아닌, 사이클을 이루며 작업을 수행하는 개념이다. 장 원장은 "피지컬 AI 분야에서 초거대 AI 모델을 구축하는 건 아직 시작 단계"라며 "한국이 언어 모델에서는 좀 늦었을지 모르지만 피지컬 AI에서는 충분히 경쟁력이 있다고 본다"고 말했다.

2025.04.11 09:05신영빈

"인구절벽 韓…테슬라 '피지컬 AI' 따라잡아야"

"피지컬 인공지능(AI) 기술은 테슬라가 2022년에 먼저 보여줬고, 유니트리가 따라가고 있습니다. 우리도 따라잡을 수 있습니다." 한재권 한양대학교 로봇공학과 교수는 10일 'K-휴머노이드 연합' 출범식에서 K-휴머노이드가 당면한 과제와 그 중요성에 대해 이같이 말했다. 한 교수는 2000년대부터 휴머노이드를 연구해 온 인물이다. 과거 로보티즈에서 재난 구조용 휴머노이드 '똘망'을 개발한 이후 학계에 몸담았다. 2021년 에이로봇 최고기술책임자(CTO)로 합류해 다시 휴머노이드 개발에 나서기도 했다. 한 교수는 "지금부터 20년 후면 지금 태어난 25만명의 신생아들이 성인이 되고, 1970년대에 태어났던 100만명의 사람들은 노인이 된다"며 "이런 상황에서 우리 사회를 유지하기 위한 성장 동력으로 로봇이 필요한 것"이라고 설명했다. 이어 "로봇이 충분한 사업성을 가지려면 하루 종일 일해야 한다"며 "그러려면 범용 로봇, 즉 휴머노이드 로봇을 만들어야 수많은 일을 성공할 확률이 높아진다"고 덧붙였다. 수년 전까지는 휴머노이드 로봇에 인간의 다양한 일을 학습시키는 작업이 불가능한 것처럼 여겨졌다. 최근에 들어서야 AI 기술이 발전하면서 로봇이 스스로 사람을 따라하고 배울 수 있게 됐다. 한 교수는 "테슬라를 비롯해서 수많은 기업들이 천문학적인 투자를 하고 글로벌 탑 티어 기업들이 사활을 걸고 달려가고 있다"며 "미국이 선도하고 중국이 바짝 쫓고 있는데, 한국은 극심한 인구 절벽으로 인해 더 절박한 상황"이라고 진단했다. 그러면서 "피지컬 AI 영역으로 기술이 진보하면서 한국이 지닌 강점도 많다"며 "제조업의 나라인 한국의 수많은 산업 현장에서 데이터를 취득하고 로봇에 학습시키면 보다 명품을 만들 수 있을 것"이라고 내다봤다. 한 교수는 "한국이 잘하는 '패스트 팔로잉' 전략으로 피지컬 AI 기술에서 빠르게 추격하고, 그 다음에는 넘어서서 선도하는 모습을 보여줄 수 있다"고 강조했다. 이어 "우리가 맞이하고 있는 인구 절벽이 비극이 아니라 다시 한 번 우리가 성장 모멘텀으로 삼을 수 있는 기회가 됐으면 한다"고 덧붙였다.

2025.04.11 08:57신영빈

엔피, '솔로지옥4' 배지연 창작세계 담은 XR 콘텐츠 공개

XR(확장현실) 콘텐츠 전문기업 엔피(대표 백승업·최지훈)가 '솔로지옥4'를 통해 대중의 큰 주목을 받은 신예 공간 디자이너 배지연과의 XR 협업 콘텐츠를 공개한다. '엔피 XR 스테이지'에서 진행된 이번 프로젝트는 배지연 디자이너의 공간 디자인 철학과 일상 속 감각을 입체적으로 소개하며 그녀의 일과 삶을 생생하게 전달하는 몰입형 XR 콘텐츠다. 콘텐츠는 총 3개의 장면으로 구성된다. 첫 번째 장면에서는 디자이너로서 배지연의 공간 철학을 소개한다. 두 번째 장면은 그만의 영감 오브제와 작업 레퍼런스, 홈 인테리어 스타일을 XR 갤러리로 구현한다. 마지막 장면은 배지연의 다양성을 표현한 여러 개의 가상 공간이 한 번에 펼쳐지며 디자인과 라이프스타일의 연결성을 표현한다. 엔피는 각 XR 공간을 배지연의 감정과 시선을 담아내는 강력한 매개체로 구현해, 콘텐츠 전체에 몰입감과 서사를 더했다. 촬영은 XR과 'IC VFX(In-Camera Visual Effects)'가 가능한 300평 규모의 LED 기반 버추얼 프로덕션 스튜디오인 '엔피 XR 스테이지'에서 진행됐다. 이 공간은 현실에서 구현이 어려운 장면들을 자유롭게 표현할 수 있어 배지연 디자이너의 창의적인 세계관을 효과적으로 담아낼 수 있었다. 백승업 엔피 대표는 "엔피 XR 스테이지는 예술, 디자인, 라이프스타일 등 다양한 분야에서 독자적인 관점과 영향력을 가진 인물들과의 협업하며 XR 콘텐츠의 가능성을 확장하고 있다"며 "앞으로도 XR 기술과 창의가 만나는 다양한 프로젝트를 선보일 것"이라고 밝혔다. 배지연 디자이너는 공간과 라이프스타일을 아우르는 감각적 시선으로 폭넓은 팬층의 사랑을 받고 있다. 특히 이번 촬영 현장을 담은 콘텐츠를 SNS에 공개해 뜨거운 반응을 얻었다. 배지연의 XR 콘텐츠는 예술과 XR기술이 만나 새로운 시각을 제시하는 '아트 오디세이: 현실을 넘어' 시리즈의 일환이다. 10일 에스콰이어 인스타그램 및 NP 유튜브 채널 등을 통해 공개된다.

2025.04.10 22:34백봉삼

  Prev 21 22 23 24 25 26 27 28 29 30 Next  

지금 뜨는 기사

이시각 헤드라인

"AI 인재도, 데이터도 없다"…망분리 완화부터 속도내야

인텔, 컴퓨텍스 2025서 AI 경쟁력 강화 신기술 공개

조립·분해부터 용접까지…공장 풍경 바꾸는 'AI 로봇'

Z세대 술 안 마시는데…롯데칠성 전략 실패 어쩌나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현