• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'파라미터'통합검색 결과 입니다. (5건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

AI 더 똑똑하게 만드는 '수학적 방법' 찾았다

국내 연구진이 인공지능(AI) 안정성에 필수 요소인 '강건성'을 확보하고 개선할 조건을 수학적으로 증명해 관심을 끌었다. 강건성은 AI가 어떤 상황에서도 안정적으로 작동하는 정도를 말한다. UNIST는 인공지능대학원 윤성환 교수팀이 AI 학습 필수 단계인 데이터 증강을 통해 AI모델 강건성을 어떻게 높일 수 있는 지에 관한 조건을 수학적으로 증명했다고 19일 밝혔다. 윤성환 교수는 "눈보라에도 차선을 이탈하지 않는 자율주행차나 저화질 사진으로도 암을 진단하는 의료 AI 등을 만들기 위해서는 AI 모델 '강건성'이 뛰어나야 한다"며 ". 데이터 증강은 이러한 강건성을 높이는 기법으로 널리 쓰여왔는데, 그 정확한 강건성 향상 조건을 수학적으로 규명한 것"이라고 설명했다. 윤 교수는 "수학적 검증만으로도 효과적인 증강 기법을 선별할 수 있게 돼 AI 모델 개발에서 생산성을 크게 높일 수 있다"고 부연 설명했다. 딥러닝 모델은 학습한 데이터와 약간만 다른 환경에 노출되면 성능이 급격히 저하된다. 원본 데이터에 인위적으로 변형을 가해 학습량을 늘리는 데이터 증강이 필수적인 이유다. 그러나 어떤 변형 방식이 가장 효과적인지에 대해서는 명확히 밝혀진 바가 없어 수많은 시행착오를 반복해야 했다. 연구팀은 근접 지지 증강(PSA, Proximal-Support Augmentation)이라는 조건을 만족하는 증강일수록 원하는 효과를 거둘 수 있다는 것을 이번 연구에서 밝혀냈다. PSA는 원본 데이터에 미세한 변형을 가해 원본 데이터 주변을 촘촘히 채우는 증강 방식이다. 연구팀은 먼저 데이터 공간과 파라미터 공간에서 변화가 서로 대응된다는 점을 증명한 뒤, PSA 조건을 만족하는 데이터 공간에서의 변화가 파라미터 공간 손실함수 지형도 평평하게 다져준다는 사실을 입증했다. 입력 데이터 주변을 촘촘히 채우면, 이에 대응하는 모델 내부 파라미터 공간도 평평해져 AI가 강건성을 갖추게 된다는 것이 연구진 설명이다. 모델 손실함수 지형이 평탄(Flat Minima)할 경우, 뾰족한 지형(Sharp Minima)에 비해 강건성이 높았다. 실제 실험에서도 PSA 조건을 충족한 데이터 증강 기법이 그렇지 않은 기법보다 월등한 강건성을 나타냈다. 윤성환 교수는 “데이터 증강 설계를 보다 체계적인 과학으로 만든 연구”라며, “자율주행, 의료 영상, 제조 검사처럼 분포가 자주 바뀌는 실제 환경에서 신뢰할 수 있는 AI 모델을 만드는 데 중요한 이론적 기반이 될 것”이라고 말했다. 이 성과는 국제 인공지능 학술대회 중 하나인 전미인공지능학회(AAAI) 2026 정식 논문으로 채택됐다. 올해 학회는 오는 20일부터 27일까지 싱가포르에서 열린다. 연구는 △과학기술정보통신부와 정보통신기획평가원(IITP) '지역지능화혁신인재양성 사업' △UNIST '인공지능대학원' 사업 △UNIST 'AI스타펠로우십' 사업 △'인간지향적차세대 도전형 AI기술 개발' 사업 △한국연구재단 지원 개인기초연구 중견연구 지원을 받아 수행됐다.

2026.01.19 08:00박희범

라쿠텐 "일본 최고 AI 역량 강화 기업 목표"

일본 전자상거래 라쿠텐을 운영하는 라쿠텐그룹이 인공지능(AI) 개발에 비용 효율성을 중시하며 다른 빅테크들과 전혀 다른 행보를 보이고 있다. 23일(현지시간) 블룸버그 등 외신에 따르면 부진한 모바일 사업과 온라인 쇼핑에서 경쟁 상황에 직면한 라쿠텐이 AI를 도입하는 과정 초기부터 수익성 확보에 집중하고 있다. 라쿠텐의 AI팀을 이끄는 구글 출신 팅 차이는 취임 3년 차에 접어든 현재 회사의 다양한 사업을 강화하고 전자상거래 처리를 최소 비용으로 지원할 수 있는 AI 시스템을 구축하는 과제를 맡고 있다. 그는 올해 1천명 규모로 성장한 팀을 총괄하고 있다. 팅 차이는 “라쿠텐은 고객 문제를 해결하기 위해 최신 기술을 적용하는 데 매우 비즈니스 중심적”이라며 “이를 대규모로 실행하려면 최대 마진을 확보해야 한다. 그래서 생성형 AI를 배포할 때 비용을 줄이는 것이 우리에게 매우 중요하다”고 말했다. 차이가 이끄는 팀은 지난주 라쿠텐의 초거대 언어모델(LLM) 버전 3을 공개했다. 라쿠텐은 이 모델이 기존의 유사한 LLM과 비교했을 때 운영 비용이 90% 저렴하다고 설명했다. 회사는 작업을 더 단순한 업무 단위로 분해한 후 각 서비스 특정 요구사항을 해결하도록 맞춤형으로 설계된 더 작은 모델을 개발하는 방식을 채택하고 있다. 라쿠텐의 버전3는 전체 7천억 파라미터 중 각 토큰 처리 시 약 400억 파라미터만 활성화하고 나머지는 비활성 상태로 두면서 효율성을 높인다. 회사의 AI 기능은 지난해 영업이익에 105억 엔(약 984억원)을 기여했으며, 라쿠텐은 올해 이 수치를 두 배로 늘리는 것을 목표로 하고 있다. 지능형 광고 타깃팅 및 배치 기능을 라쿠텐 온라인 스토어를 이용하는 판매자들의 투자수익률을 개선했고 AI 기반 의미 검색과 개인화 추천은 사용자 참여도와 클릭률을 끌어올렸다. 팅 차이는 “사용자들이 라쿠텐 AI 이치바를 이용한 뒤 더 자주 돌아오는 현상을 확인했다”며 “이에 따라 자사가 해야 할 일은 이런 대화의 비용을 더 낮추는 것이다. 대화로 이뤄지는 모든 구매가 수익이 나도록 만들고 싶다”고 밝혔다. 이어 “회사의 목표는 일본 최고의 'AI 역량 강화 기업'이 되는 것”이라고 덧붙였다.

2025.12.24 10:37박서린

카카오, '카나나-2' 오픈소스 공개…에이전틱 AI 최적화

카카오는 허깅페이스에 자체 개발한 차세대 언어모델 '카나나-2'를 오픈소스로 공개했다고 19일 밝혔다. 카카오는 지난해 자체 개발 AI 모델 '카나나'의 라인업을 선보인 이래, 경량 사이즈의 모델부터 고난이도 문제 해결에 특화된 '카나나-1.5'까지 꾸준히 오픈소스로 추가 공개해왔다. 이번에 선보인 '카나나-2' 모델은 성능과 효율을 개선한 최신 연구 성과로, 사용자 명령의 맥락을 파악하고 능동적으로 동작하는 '동료'와 같은 AI 구현에 초점을 맞췄다. 이번에 공개된 모델은 총 3종으로 기본 모델인 ▲베이스, 사후 학습을 통해 지시 이행 능력을 높인 ▲인스트럭트, 이번에 처음 선보이는 ▲추론 특화 모델로 구성됐다. 개발자들이 자체 데이터를 활용해 자유롭게 모델을 파인튜닝할 수 있도록 학습 단계의 웨이트(학습된 매개변수 값)를 모두 공개한 점이 특징이다. 카나나-2는 에이전틱 AI 구현의 핵심인 도구 호출 기능과 사용자 지시 이행 능력이 향상됐다. 이전 모델(카나나-1.5-32.5b) 대비 다중 대화 도구 호출 능력을 3배 이상 향상시켰으며, 복잡한 단계별 요구 사항을 정확하게 이해하고 수행하도록 설계됐다. 지원 언어도 기존 한국어, 영어에서 ▲한국어 ▲영어 ▲일본어 ▲중국어 ▲태국어 ▲베트남어까지 6개로 확장해 활용도를 높였다. 기술적으로는 효율성을 극대화하기 위해 최신 아키텍처를 도입했다. 긴 입력을 효율적으로 처리하는 방식인 'MLA' 기법을 적용했으며, 추론 시 필요한 파라미터만 활성화하는 'MoE' 구조를 적용했다. 이를 통해 적은 메모리 자원으로도 긴 문맥을 효율적으로 처리할 수 있게 됐으며, 추론 시 필요한 파라미터만 활성화 해 연산 비용과 응답 속도가 개선됐다. 대규모 동시 접속 요청을 빠르게 처리하는 성능 진화를 만들었다. 성능 지표에서 인스트럭트 모델의 경우 동일한 구조의 최신 모델 'Qwen3-30B-A3B'와 유사한 수준을 달성했다. 이달 한국정보과학회와 공동 개최한 'AI 에이전트 경진대회'에서 참가자들에게 선공개돼 실제 에이전트 개발 환경에서의 활용 능력이 검증되기도 했다. 추론 특화 모델은 다양한 사고 능력이 요구되는 벤치마크에서 추론 모드를 적용한 'Qwen3-30B-A3B'와 유사한 성능을 보였다. 카카오는 향후 동일한 MoE 구조를 기반으로 모델 규모를 확장하고, 고차원적인 지시 이행 능력을 확보할 계획이다. 이와 함께 복잡한 AI 에이전트 시나리오에 특화된 모델 개발과 온 디바이스 경량화 모델의 고도화를 지속적으로 추진할 계획이다.

2025.12.19 10:00박서린

포바이포, 파라미터 예측 모델 활용 색상 보정법 특허 등록

콘텐츠 AI 솔루션 기업 포바이포(대표 윤준호)는 색상 보정 작업 과정을 단순화한 AI 모델의 학습 방법·색상 보정 방법론에 대한 특허 등록을 완료했다고 13일 밝혔다. 포바이포가 이번 등록한 특허명은 '이미지 색상을 보정하기 위한 인공 신경망 모델의 학습 방법 및 학습된 인공 신경망 모델을 이용한 이미지 색상 보정 방법'이다. 기존 색상 보정 AI모델의 '이미지를 직접 보정하는 방식'에서 벗어나 색상 보정에 필요한 '핵심 파라미터만을 정밀하게 예측'하는 경량화 모델을 구현한 점이 가장 큰 특징이다. 기존 색상 보정 방식이 '이미지→보정된 이미지'를 직접 출력하는 방식이었다면 포바이포가 개발한 모델은 '이미지→보정 파라미터 예측→이미지에 반영'하는 구조를 채택했다. 더 가벼워진 AI모델을 활용하면서도 안정성은 높이고 보정 처리 효율은 극대화했다는 게 회사 측 설명이다. 이번 특허의 효용은 크게 세 가지로 압축할 수 있다. 첫 번째로 해당 색상 보정 알고리즘은 수치화 된 정보(파라미터)를 그대로 반복 사용하기 때문에 학습대상에서 제외된다. 결과적으로 AI 모델의 학습 속도와 안정성이 크게 향상되고 학습과정도 단순화되기 때문에 작업 결과물이 일관성을 갖게 되고 과적합이나 실패 리스크도 낮아지게 된다. 두 번째로 이미지 전체가 아닌 소수의 보정 파라미터만 예측하면 되기 때문에 학습 처리 데이터 및 시간이 크게 줄어들고 예측 정밀도 역시 높아진다. 또 예측된 파라미터는 작업자가 후처리로 미세 조정할 수 있어 작업 유연성도 높아진다. 세 번째로 예측된 보정 파라미터는 수치 형태로 제공되므로 후속 보정 작업에서 특정 스타일을 정밀하게 맞추는 작업에 용이하다. 방송, 영화, 디지털 콘텐츠 등 제작 환경에 따른 서로 다른 특정 색 보정 기준을 모두 만족시킬 수 있다. 포바이포 배성완 픽셀사업본부장은 "이번 특허는 AI의 색상 보정 프로세스를 훨씬 가볍고 빠르게 개선해 필요한 기능만 골라 쓸 수 있는 맞춤형 상품 출시 가능성을 높이는 계기가 됐다"고 설명했다. 이어 "전문가용 영상 편집툴이나 방송, 영화 후반 작업 등 전문화된 현장에서도 비용 부담 없는 경량화 모델 하나만으로도 보정 품질의 일관성을 확보할 수 있게 된 셈"이라며 "이번 특허를 기반으로 화질 개선 AI 솔루션 픽셀의 상품성을 더욱 높이는 계기로 만들 것"이라고 덧붙였다. 이번 특허는 포바이포와 관계사 '에이아이네이션'이 공동 개발, 출원했으며 지분율은 9:1이다.

2025.05.13 08:45백봉삼

새 엣지 AI 시대 연다...Arm, 초고효율 CPU·플랫폼 공개

Arm이 이전 세대 대비 성능과 전력 효율성을 극대화한 신규 엣지 AI용 칩과 플랫폼을 선보인다. AWS(아마존웹서비스)·지멘스·르네사스 등 다양한 기업들이 주목하는 기술로, 이르면 내년 실제 상용화가 이뤄질 것으로 전망된다. 황선욱 Arm코리아 사장은 27일 서울 중구 더플라자 호텔에서 열린 'Arm 2025 엣지 AI 플랫폼 발표 기자 간담회'에서 신규 AI 엣지 플랫폼에 대해 이같이 밝혔다. 이날 Arm은 10억개 이상의 파라미터로 구성된 AI 모델을 온디바이스에서 실행할 수 있는 Arm Cortex-A320 CPU와, 엣지 AI용 가속기인 'Arm Ethos-U85' NPU를 탑재한 'Armv9 엣지 AI 플랫폼'을 발표했다. Cortex-A320은 Arm CPU 제품군 중에서도 전력효율성을 가장 강조한 모델이다. 이전 제품인 Cortex-A35 대비 머신러닝 성능을 10배 높였다. 또한 스칼라(scalar; CPU의 연산 수행 방식) 성능이 30% 향상됐다. 또한 고급 보안 기능을 신규 추가했다. Arm은 Cortex-A320과 트랜스포머 네트워크에 대한 운영자 지원 기능을 갖춘 Ethos-U85 NPU를 결합해, IoT에 최적화된 세계 최초의 Armv9 엣지 AI 플랫폼을 공개했다. 'Cortex-M85' 기반의 이전 플랫폼 대비 머신러닝 성능이 8배 향상된 것이 가장 큰 특징이다. 또한 이전 세대 대비 최대 메모리 지원량을 늘려, 고성능 LPDDR(저전력 D램)을 보다 유연하게 활용할 수 있을 것으로 기대된다. 황 사장은 "엣지 AI 모델이 복잡해지면서 더 높은 성능과 전력효율성을 갖춘 플랫폼에 대한 수요가 커지고 있다"며 "이에 다양한 엣지 AI 분야의 OEM, 반도체 기업들이 Cortex-A320으로 사업을 전개하려고 하고 있다"고 밝혔다. 실제로 이번 Arm의 신규 엣지 AI 플랫폼에 AWS, 지멘스, 르네사스, 어드밴텍, 유로테크 등이 관심을 가지고 있는 것으로 알려졌다. 실제 상용화 사례는 이르면 내년 확인할 수 있을 전망이다. 정성훈 Arm코리아 FAE 디렉터는 "고객사의 자세한 일정을 논할 수는 없으나, 오는 2026년 고객사가 Cortex-A320를 기반으로 한 칩을 출시할 것으로 예상된다"고 밝혔다.

2025.02.27 14:26장경윤

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

"캘리포니아, 이제 싫다"…줄줄이 짐싸는 실리콘밸리 억만장자들, 왜?

챗GPT도 더 싼 '광고 요금제' 나온다...월 8달러

최태원 "성장할수록 불리...경제형벌 리스크 줄여야"

4시간 연속 작업 거뜬...손가락까지 사람 닮은 로봇

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.