• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
AI페스타
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'SW키트'통합검색 결과 입니다. (25건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

해킹·랜섬웨어 '활개'…새해 공격관리·신원인증 산업 뜬다

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI)과 보안 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 생성형 인공지능(AI) 등 신기술을 악용한 해킹, 랜섬웨어 급증으로 국내 기업과 기관이 큰 피해를 본 가운데 이에 대응하기 위한 기술 산업·정책이 활성화될 전망이다. 특히 기업 데이터를 보호하는 신원인증과 사이버 공격을 모니터링하는 공격표면관리(ASM) 산업 전망이 밝다는 평가가 이어지고 있다. 정책적으로는 망분리 완화 후 클라우드 보안을 위한 제로트러스트 가이드라인 중요성이 높아지고 소프트웨어자재명세서(SBOM) 의무화 추진도 본격화할 것으로 예측된다. AI 등 신기술 늘었지만…예측 불가 공격 이어져 지난해 생성형 AI 등 신기술 성장으로 인해 비즈니스 활성화가 이뤄졌지만 그만큼 새로운 사이버 공격도 증가한 것으로 나타났다. AI 악용 기술과 랜섬웨어, 딥페이크 확산으로 정보 유출 등 피해 사례가 늘어서다. 또 기업의 IT 복잡성 증가로 예측 불가형 보안 이슈가 발생하기도 했다. 이에 빅테크는 사이버 보안 강화에 나섰다. 마이크로소프트는 지난 7월 크라우드스트라이크 업데이트 오류로 인한 IT 대란 사태를 겪은 후 클라우드 보안 강화를 본격화했다. 지난해 처음 자사 핵심성과지표(KPI)에 보안을 최우선 과제로 설정했다. 구글은 사이버 공격 예방을 위해 보안 스타트업 인트리그를 인수했다. 지난해 국내 정부는 개인정보 보호 대책 마련에 힘썼다. 우선 개인정보보호위원회는 메타와 구글, 카카오 등 빅테크와의 개인정보 관련 소송을 위해 법률 전문가를 몰색하고 있다. 이르면 올 초 빅테크 소송을 전담하는 팀을 꾸릴 예정이다. "신원인증 산업 커질 것"…클라우드 ID 성장도 업계에서는 국내 정부와 기업이 개인정보 보호 강화에 나서면서 이를 위한 신원인증 산업이 성장할 것으로 봤다. 실제 미국을 비롯한 유럽연합(EU)이 개인정보 보호 강화 제도에 시동을 걸면서 신원인증 산업이 성장하고 있다. 앞서 지난 5월 유럽연합(EU)에서 발의한 전자신원 및 신뢰서비스에 관한 법률에 따르면 2026년까지 모든 EU 회원국은 시민에게 디지털 신원 지갑을 제공해야 한다. 2030년까지 EU 시민 전원이 디지털 신원을 갖는 것을 목표로 한 법안이다. 한 보안업계 관계자는 "미국과 EU의 디지털 신원인증 활성화 움직임은 곧 국내에 영향 미칠 것"이라며 "국내 정부·기업도 이에 맞는 신원인증 기술이나 제도 필요성을 느낄 것"이라고 내다봤다. 국내 기업의 서비스형 소프트웨어(SaaS) 제품 수요가 늘면서 클라우드 내 정보보호를 위한 클라우드 ID 산업도 활성화할 것이란 예측도 나왔다. 국내 기업이 SaaS를 활발히 사용하면서 클라우드 ID 채택률도 증가할 것이란 전망이다. 전 세계적으로 GDPR 등 정보보호법이 활성화하면서 기업은 데이터 접근 기록 관리와 보안 조치 강화를 위해 클라우드 ID 기술에 투자를 늘릴 것이란 설명이다. 이를 통해 기업은 데이터를 클라우드 내 안전히 보관하고 데이터 규제까지 준수할 수 있다. 올해 망분리 완화…"제로트러스트·SBOM 중요도 커져" 올해 망분리 완화 정책이 본격화하면서 클라우드·SW 시스템 보안 강화를 위해 제로트러스트 가이드라인 중요성과 SBOM 의무화 목소리가 커질 전망이다. 망분리 완화로 인한 클라우드 내 데이터 유출이나 해킹에 취약할 가능성이 높아질 수 있다는 분위기 때문이다. 이에 발맞춰 정부는 제로트러스트 모델을 한층 구체화한 '제로트러스트 가이드라인 2.0'을 이달 발표했다. 새 가이드라인에는 기업이 제로트러스트 모델을 솔루션에 도입할 때 적용하는 단계를 하나 더 넣었다. '성숙도 모델'을 추가해 기존 3단계에서 4단계로 구체화했다. 또 관련 세부역량 52가지를 새로 제시해 모델에 구체화를 더했다. 망분리 완화 후 클라우드에 들어가는 SW 복잡성이 증가하면서 이를 투명하게 확인할 수 있는 정책 마련 필요성도 제기될 전망이다. 미국처럼 국내 정부도 SBOM 의무화에 속도를 낼 가능성이 높다는 평가다. 정부는 지난해 5월 SBOM 가이드라인을 발표했지만 이를 의무화하지 않은 상태다. 순천향대 염흥열 명예교수는 지난 11월 서울 강남 섬유센터에서 열린 한 보안 컨퍼런스에서 "미국과 유럽 등 선진국들은 이미 SBOM을 통해 SW 구성 요소 취약점을 신속히 식별해 전체적인 사이버 보안을 강화하고 있다"며 "이에 발맞춰 국내 정부도 SBOM 의무화를 적극 추진해야 한다"고 강조했다. "해킹 어디서든 발생"…공격표면관리(ASM) 산업 활성화 해외 보안 업계처럼 국내서도 사이버 공격을 기존보다 넓은 범위에서 예측할 수 있는 ASM 산업이 확장할 전망이다. 최근 기업에서 클라우드뿐 아니라 원격 근무, 생성형 AI 도입 등으로 인해 공격 가능한 보안 취약점이 빠르게 늘고 복잡해졌기 때문이다. ASM은 해커가 침투할 가능성이 있는 모든 IT 경로를 미리 파악하고, 이를 체계적으로 관리해 사이버 위협을 줄일 수 있는 보안 전략·도구다. 공격 발생 후 대응하는 것에 주력하는 기존 보안 시스템과 다른 방식이다. 앞서 해외는 이미 ASM을 통해 시스템 위험 식별 구축을 진행하고 있다. 빅테크 중심으로 ASM 생태계가 확장하는 추세다. 구글은 자회사 맨디언트를 통해 ASM 스타트업 인트리그를 인수한 바 있다. 마이크로소프트도 사이버보안 포트폴리오 강화를 위해 리스크아이뷰 인수했다. 팔로알토 네트웍스도 최근 ASM 시장 진입을 위해 익스펜스네트웍스를 인수했다. 현재 한국 보안 업계에서 ASM은 극초기 단계라는 평가가 이어지고 있다. 관련 솔루션을 운영하는 기업도 AI스페라가 유일하다. 업계 관계자는 "최근 국내 기업 시스템이 인식하지 못할 수 있는 인터넷 연결 자산과 시스템에서 오는 위험 식별 필요성이 높아졌다"며 "미국 보안 추세에 맞춰 ASM 산업을 눈여겨볼 만하다"고 밝혔다.

2025.01.02 11:09김미정

생성형 AI 다음은?…"물리 AI·공간 지능 시대 열린다"

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI)과 보안 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 생성형 인공지능(AI) 다음 시대에 대한 기대감이 높아지고 있다. 업계에서는 가상·현실 세계 차이점을 최대한 줄여 결과물 정확성을 높이는 '물리 AI'와 현실 세계의 3차원 특성을 반영한 '공간 지능'에 대한 관심이 쏠렸다. 해당 기술이 기존 AI 한계를 넘어 현실에 더 적합하고 정확한 결과물을 산출할 것으로 기대하는 분위기다. 25일 업계에 따르면 가상·현실 세계 차이를 최대한 줄여 결과 정확성을 높이는 '물리 AI'에 주목해야 한다는 목소리가 나왔다. 전문가들은 물리 AI가 기존 추론에 물리학 계산까지 접목해 현실에 더 적합하고 정확한 결과물을 산출한다고 입을 모았다. 물리 AI란 물리적 법칙과 데이터 기반 학습을 결합해 실제 현상을 더 정확히 예측하고 이해하는 AI다. 기존 생성형 AI 모델이 데이터를 활용해 추론하는 것에서 한 단계 더 심화했다. 이를 활용하면 기존 데이터 기반 모델이 추론하기 어려운 희귀 사건이나 극단적 상황을 더 정확히 예측할 수 있다. 대표적인 활용 예시는 날씨 예측과 자동차·반도체 설계, 우주 정거장 건설 등이다. 예를 들어 기존 AI가 비가 올 확률을 예측할 경우 기상 데이터 기반으로 계산한다. 반면 물리 AI는 공기 흐름이나 대기 압력 변화 등 물리학적 요소까지 고려해 비 올 확률을 계산한다. 이를 통해 물리 AI가 현실에 더 정확한 예측을 할 수 있는 이유다. 그동안 산업계에서도 물리 AI를 적용한 서비스를 출시한 바 있다. 대표 기업이 엔비디아와 다쏘시스템이다. 엔비디아는 지난해 3D 시뮬레이션 플랫폼 'VIMA'를 공개했다. 디지털 트윈 기술인 '엔비디아 옴니버스'를 활용해 현실 세계와 가상 세계 정보를 통합해 현실에 가장 적합한 시스템 구축을 지원한다. 다쏘시스템은 버추얼 트윈 플랫폼 '3D익스피리언스'로 가상 현실서 시뮬레이션해 현실 세계에 가장 적합한 제품 설계를 돕는다. 파스칼 달로즈 다쏘시스템 최고경영자(CEO)는 지난달 한국서 열린 기자간담회에서 3DX가 물리 AI에 기반한 플랫폼이라고 강조한 바 있다. 달로즈 CEO는 "그동안 여러 산업서 수집한 텍스트와 이미지, 비디오 등 다양한 유형의 데이터를 수집해 3DX에 접목했다"며 "개발자는 이를 3D 모델링 작업에 적용해 현실 세계에 더 적합한 제품을 만들 수 있다"고 설명했다. 예를 들어 개발자가 3DX로 공장을 설계할 경우 이를 분자 수준까지 분석해 자재 성분이나 적용 결과를 시뮬레이션할 수 있다. 설계도를 축소하면 공장 전체의 물류와 공급망 흐름을 확인할 수 있다. 기존 소프트웨어 기술이 물리 AI와 결합해 구현할 수 있는 기능이다. "1차원 멀티모달 넘자…공간 지능으로 3차원 AI 구현" 문자와 이미지를 모두 처리하는 멀티모달 모델이 진전을 보이는 가운데 차세대 기술로 공간 지능 모델도 주목받고 있다. AI 업계 전문가들은 현존하는 멀티모달은 1차원적 AI에 그친다고 평했다. 모델이 글과 이미지, 음성 등 여러 정보를 한 번에 다룰 수 있지만 한계가 있다는 분석이다. 사람과 달리 모델은 이미지, 음성 등 모든 정보를 '텍스트'로 취급해 다뤄서다. 이에 고유 이미지와 영상의 진정한 의미를 이해할 수 없다. 모든 정보를 1차원적 토큰 시퀀스에 끼워 맞추는 셈이다. 공간 지능은 여기서 한발 더 나아간다. 사람처럼 현실의 3차원적 특성 중심으로 데이터 처리와 문제 해결을 진행한다. 멀티모달과 달리 문자, 이미지, 음성 등 여러 특성을 각각 고려하면서 데이터를 처리하는 셈이다. 기존 AI는 종이 위에 그려진 지도만 보고 방향을 찾으려 한다면, 공간 지능은 직접 그 장소를 걸어 다니며 주변 환경을 보고 느끼면서 방향을 찾는 셈이다. 현재 스탠퍼드대 페이페이 리 교수는 공간 지능 구현을 위해 스타트업 월드랩스를 설립했다. 현재 월드랩스는 공간 지능에 필요한 대형세계모델(LWM)을 개발 중이다. 다만 일반 멀티모달보다 데이터 학습·훈련에 드는 시간이 상당해 구체적 출시 시기는 미정이다. 리 교수는 "공간 지능은 AI 능력을 언어 중심적 이해를 넘어 자연과 물리 세계, 우주까지 영역을 확장할 수 있을 것"이라며 "증강현실(AR)·가상현실(VR) 기술 발전에 기여할 수 있을 것"이라고 자신했다.

2024.11.25 17:18김미정

AI 사업 전략 갈린 韓 빅테크…"美 협업 vs 독자 개발 우선"

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 이야기를 재밌고 맛있게 보도하겠습니다. [편집자주] 국내 빅테크가 생성형 인공지능(AI) 시장 점유율을 높이기 위해 비즈니스 전략 다각화에 나섰다. 미국 기업과 손잡고 AI 모델·서비스 고도화에 나서는 한편, 모델을 독자 개발하면서 이를 수출하는 분위기가 공존하고 있다. 30일 업계에 따르면 KT는 마이크로소프트와 한국형 GPT-4o와 경량형 모델 파이(Phi), 코파일럿을 공동 개발하기로 했다. 한국 문화와 산업에 최적화된 AI 모델을 만들어 이를 기반으로 한 서비스를 선보이기 위해서다. KT와 마이크로소프트가 공동 개발한 맞춤형 AI 모델은 KT의 고객 서비스 챗봇 등을 비롯해 기업간거래(B2B) 고객을 위한 산업별 특화 AI 솔루션 구축에 활용된다. 여기에 KT 자체 AI 모델 '믿음'까지 고도화해 고객 수요에 맞춰 활용할 방침이다. KT는 마이크로소프트의 AI 비서 코파일럿을 자사 서비스에 접목할 방침이다. 이를 통해 KT 이용자들은 코파일럿 기반 AI 검색과 개인화 서비스를 이용할 수 있다. 앞서 올해 2월 SK텔레콤도 미국 생성형 AI 스타트업 퍼플렉시티와 파트너십을 체결했다. 양사는 대화형 답변 엔진을 통해 검색 시장을 공략하기로 했다. SK텔레콤은 해당 파트너십 이후 SK텔레콤 AI 비서 서비스 '에이닷' 고도화에도 나선 바 있다. 네이버·LG AI연구원 "AI 모델·독자 개발…수출 우선" 네이버클라우드와 LG AI연구원은 내부적으로 생성형 AI 모델 고도화에 집중하고 있다. 해외 기업과 협력해 모델·서비스를 만드는 것보다 이를 자체 개발해 해외 시장에 수출하겠다는 전략이다. 네이버클라우드 관계자는 "앞으로도 하이퍼클로바X 성능 고도화를 자체 진행할 것"이라고 밝혔다. 이에 하이퍼클로바X 기반 서비스 클로바X 등도 내부에서 자체 업그레이드를 진행할 예정이다. 다만 네이버클라우드는 소버린AI 생태계 구축 목표로 해외 교류를 더 늘릴 것이라고 밝혔다. 최근 사우디 데이터AI청와 파트너십 체결한 것이 대표 사례다. 또 AI 반도체 관련 협력을 위해 해외 기업과 협력하고 있다는 점도 재차 강조했다. 올 상반기 인텔과 AI 칩 프로젝트로 소규모 수익을 창출한 점도 그 예다. LG AI연구원도 생성형 AI 모델과 서비스를 자체 개발하고 있다. LG AI연구원은 엑사원 2.0에 이어 8월 멀티모달 모델 '엑사원 3.0'을 오픈소스로 공개한 바 있다. 온디바이스 AI에 들어갈 초경량 모델부터 범용 목적의 경량 모델, 전문 분야에 특화되거나 깊이 있는 연구를 위한 고성능 모델까지 활용 목적에 맞춰 다양한 사이즈 라인업으로 구성된 모델이다. 이와 함께 기업 구성원의 생산성을 향상하고 전문가 수준의 인사이트를 제공하는 '챗엑사원'도 출시했다. LG AI연구원 관계자는 "엑사원 모델군도 LG AI연구원이 독자 개발해 국내외에 공급하고 있다"며 "외부 서비스는 LG유플러스, LG CNS 등 계열사와 협업하는 방식으로 진행 중"이라고 설명했다.

2024.09.30 15:11김미정

[SW키트] 텔레그램에 퍼진 딥페이크, 다크웹이 더 문제다

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 생성형 인공지능(AI)을 악용한 딥페이크 이미지·영상이 텔레그램에 퍼진 가운데, 다크웹을 통한 딥페이크 음란물 확산 심각성도 인지해야 한다는 목소리가 나왔다. 전문가들은 텔레그램·다크웹 내 딥페이크 차단을 위해 기술 개발뿐 아니라 정부·기업 공조 수사가 필요하다고 입을 모았다. 29일 보안 업계는 텔레그램뿐 아니라 폐쇄적인 다크웹 환경에서도 딥페이크 영상과 사진을 잡기 어려울 것이라고 우려를 제기했다. 다크웹은 구글이나 네이버 등 일반적인 검색 엔진으로 접근할 수 없는 웹사이트들이 모여 있는 영역이다. 다크웹은 특별한 소프트웨어(SW)나 네트워크 권한이 있어야만 접근 가능하다. 누구나 쉽게 이용할 수 있는 텔레그램과 다른 개념이다. 딥페이크 음란물 포착이 다크웹서 더 어려운 이유다. 실제 노드VPN이 올 초 다크웹 게시판을 분석한 결과 소셜미디어(SNS), 텔레그램 등을 통해 유출된 노출 사진이나 영상에 댓글이 평균 1천850개 달리는 것으로 드러났다. 이에 텔레그램뿐 아니라 다크웹도 딥페이크 영상물 확산 통로로 지목되고 있다. 보안 업계는 다크웹 내 딥페이크 콘텐츠 포착이 어려운 이유로 강력한 데이터 휘발성을 꼽았다. 검색 환경이 잘 갖춰진 구글과 달리 다크웹 내 검색은 특정인 사진과 영상을 검색해도 찾기 어렵다는 의미다. 다크웹 시스템은 특수 브라우저 생성과 삭제를 통해 정보를 은닉할 수 있는 환경을 갖춘 셈이다. 이에 보안 기업들은 다크웹 내 콘텐츠 검색을 가능케하는 솔루션을 내놨다. 주로 다크웹 콘텐츠를 복원해 검색 결과에 드러나게 하는 기술을 갖췄다. 다만 이런 기능도 딥페이크 콘텐츠 포착을 100% 할 수는 없다. 한 보안업계 관계자는 "공격자들이 딥페이크 음란 콘텐츠가 쉽게 포착되지 않기 위해 틀린 정보를 의도적으로 흘리는 경우가 있다"며 "기술 개발이 아무리 뛰어나도 다크웹 내 딥페이크 음란 콘텐츠를 100% 걸러내기 힘든 이유"라고 본지에 강조했다. 딥페이크 차단 나선 정부…"기술 개발보다 공조 우선" 정부가 텔레그램·다크웹 내 딥페이크 음란물 차단을 위해 나섰다. 29일 과학기술정보통신부는 생성형 AI를 활용해 지인 대상 합성물을 제작 및 유포하는 딥페이크 예방을 위해 20억원 규모 예산을 편성했다고 발표했다. 과기정통부는 내년 예산안 브리핑에서 딥페이크 범죄 예방을 위해 연구개발(R&D) 과제에 착수한다고 밝혔다. 이주식 정보통신방송기술정책과장은 적대적 생성신경망(GAN) 기반 딥페이크 탐지 고도화 및 생성 억제 기술 개발에 10억원을 투자한다고 발표했다. 나머지 10억원은 자가진화형 딥페이크 탐지 기술 개발에 들어갈 방침이다. 이에 보안 업계는 정부가 딥페이크 차단 기술에만 집중해선 안 된다고 주장했다. 이보다 국내외 기업·기관과 수사 공조하는 것에 더 집중해야 한다고 입을 모았다. 현재 기술만으로 딥페이크 콘텐츠를 100% 포착하기 어렵기 때문이다. 또 딥페이크 콘텐츠 검색을 원활히 하기 위해선 국내외 콘텐츠 공급자와 꾸준한 소통이 이뤄져야 한다. 정부도 보안 업계 주장에 동의하는 분위기다. 우선 딥페이크 성범죄 콘텐츠 유포에 가장 많이 사용된 텔레그램 측과 소통을 시작하겠다고 밝혔다. 텔레그램은 해외 개발사 소유이므로 서버 위치가 해외에 있다. 차단 기술 개발뿐 아니라 서비스 공급자와 직접적 공조가 필요한 이유다. 국민의힘 김상훈 정책위의장은 29일 여의도 국회서 열린 딥페이크 성범죄 관련 부처 긴급 현안보고에서 "현재 텔레그램과 협력회의를 시작한 상태"라며 "상시 협의를 통해 핫라인을 확보할 것"이라고 했다. 이어 "그동안 국제 공조가 제대로 이뤄지지 않아 딥페이크 콘텐츠 차단에 어려움을 겪었다"며 "텔레그램과 원활한 소통을 통해 추가 피해를 막을 것"이라고 덧붙였다.

2024.08.29 16:42김미정

[SW키트] AI에게 줄 데이터가 부족하다…합성데이터 대안 될까?

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [김미정의 SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [김미정의 SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 생성형 인공지능(AI) 모델 발전에 필요한 데이터가 곧 고갈될 것이란 전망이 나오고 있다. 데이터가 AI 엔진 역할을 하는 만큼 데이터 고갈이 현실화하면 AI 모델 훈련을 추가로 진행할 수 없기 때문이다. 현재 이를 대체할 방안이 잇따라 나오고 있다. 전문가들은 AI로 만든 합성데이터를 모델에 훈련하자는 대안을 제시하고 있다. AI 모델에서 나온 결과물을 다시 모델에 넣어 학습 데이터로 재활용하는 식이다. 이를 조심스럽게 바라보는 이들도 있다. 만약 오류를 가진 합성데이터를 모델에 넣을 경우 AI 모델에 환각현상이 심해질 뿐 아니라 결국 모델 품질까지 떨어뜨린다는 주장도 나왔다. "합성데이터, AI 편향성 극복·희귀 데이터 수집 도와" 업계에서는 AI로 생성한 합성데이터가 모델 성능 향상에 유용할 것이라 입을 모았다. AI 알고리즘 편향성 감소와 희귀 데이터 수집 기회를 잡을 수 있다는 이유에서다. 15일 업계에 따르면 AI로 합성데이터를 만들어 고객사에 납품하는 개발사는 점차 늘어나는 분위기다. 해당 개발사들은 고객사에 부족한 데이터 종류를 AI로 제작해 채운다. 이를 통해 고객사는 데이터 제작 시간과 비용을 기존보다 줄일 수 있다. 김현수 슈퍼브에이아이 대표는 "실제 데이터를 수집하기 어려운 희귀하거나 극단적인 케이스가 포함된 데이터를 AI 합성을 통해 얻을 수 있다"며 "데이터 수집·라벨링 과정이 생략되기 때문에 데이터 취득비용을 줄이고 신속한 학습을 할 수 있다"고 강조했다. 김 대표는 합성데이터가 다양한 산업에서 작동하는 모델 기능을 올릴 수 있다고 주장했다. 그는 "특히 합성데이터는 국내외 제조 분야나 국방, 물리보안용 AI 모델에 유용할 수 있다"며 "취득하기 어려운 제조 결함이나 중대재해 사고, 화재, 드문 보안 이슈 데이터를 합성데이터로 채움으로써 모델 성능을 올리고 실제 위험에 대처할 수 있다"고 설명했다. 업스테이지 측은 합성데이터 생산 노하우가 개발 전략으로 자리 잡을 것이라고 봤다. 업스테이지 관계자는 "합성데이터를 고품질 정형 데이터로 적절히 융합해야 한다"며 "기업들이 자신에 맞는 융합 방식을 찾으면 그만큼 비용효율적인 대체제가 없을 것"이라고 강조했다. 이어 "각 기업이 같은 합성데이터를 이용해도 회사 기술력에 따라 모델 성능은 다를 것"이라고 덧붙였다. "오류 확증·재확산…연합학습법 등 다른 대안 필요" 합성데이터를 모델에 재사용하면 품질 저하를 일으킨다는 지적도 나왔다. 합성데이터에 오류가 있으면 모델이 환각현상 등 문제를 더 만들 수 있다. 최근 영국 옥스퍼드대에서도 논문을 통해 합성데이터 위험성을 경고했다. 연구진은 모델 개발·학습 과정에 합성데이터가 들어갈수록 모델 결함이 높아진다는 이론을 제시했다. 기존 오류와 새로운 환각 현상이 지속적으로 쌓이면서 결국 모델 붕괴 현상이 일어날 수 있다는 내용이다. 연구 책임자인 옥스퍼드대 일리아 슈마일로프 컴퓨터과학부 강사는 "현재 AI로 만든 합성데이터는 여러 면에서 약점을 지녔다"며 "이런 위험성을 객관적 수치로 알리는 것이 현대 과학자 의무"라고 강조했다. 국내 업계와 학계서도 합성데이터 활용에 조심스러운 입장이다. 네이버클라우드 하정우 AI혁신센터장은 "사람이 만든 데이터로만 모델을 학습시키면 편향이 발생한다"며 "이처럼 합성데이터를 모델에 과도하게 넣으면 모델 품질 하락 가능성도 있다"고 지적했다. 김동환 포티투마루 대표는 "합성데이터를 모델에 넣는 과정에서 오류가 발생할 수밖에 없고, 오류를 학습한 모델이 다시 합성데이터를 만들면서 결국 오류 전파(Error Propagation)를 보일 것"이라고 주장했다. 이어 "결국 생성물 자체가 현실과 괴리를 일으킬 것"이라며 "환각현상은 더 심해질 수 있다"고 내다봤다. 김 대표는 향후 데이터로 모델 성능 올리는 것 자체가 현실적으로 한계에 부딪혔다고 했다. 이에 대한 근거로 친칠라(Chinchilla) 법칙을 언급했다. 모델 파라미터가 2조 개에 이르면, 학습데이터 60조 개가 필요하다는 이론이다. 김 대표는 "이런 규모는 합성데이터를 통해서도 구성하기 힘들다"며 "이를 감당할 수 있는 그래픽처리장치(GPU) 등 인프라 확보조차 어렵기 때문"이라고 지적했다. 그는 대책도 제시했다. 김 대표는 "도메인 특화 경량화 모델로 데이터를 분산시키거나 연합학습으로 양질의 내부 데이터를 활용해야 한다"며 "이에 대한 연구가 진행돼야 할 것"이라고 말했다. 연합학습법은 분산된 여러 장치에서 모델을 학습하는 방법론이다. 데이터를 중앙 서버에 직접 옮기는 방식과 다르다. AI 모델 학습을 안전하고 경제적으로 진행할 수 있다고 평가받고 있다. 이에 대해 경희대 이경전 경영대학·빅데이터응용학과 교수는 "합성데이터 활용보단 연합학습 등 다양한 대안을 내놔야 한다"고 주장했다.

2024.08.15 11:00김미정

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

韓 미래 바꿀 혁신 무대 열린다…30일 인공지능 주간 'AI페스타' 개막

"각개전투식 R&D 효율 낮아…K-배터리, 선의의 경쟁 속 힘 모아야"

8개사 대표 교체한 신세계그룹…인사 보니 고민 보이네

국정자원 화재로 드러난 공공SW 부실…행안부 국감 '주목'

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.