• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'프로세싱'통합검색 결과 입니다. (2건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] 中 딥시크·구글 움직임에 속 타는 오픈AI?…느리고 싼 新무기로 맞선다

저비용·고성능 인공지능(AI) 모델을 앞세운 중국 딥시크가 등장한 이후 자극을 받은 미국 기업들이 앞 다퉈 가격 조정에 나섰다. 그간 AI 학습에 드는 시간과 비용이 상당해 값비싼 구독료로 수익 확보에 나서던 이들은 딥시크를 의식해 가격 인하 경쟁을 벌이며 주도권을 빼앗기지 않기 위해 안간힘을 쓰는 모양새다. 18일 테크크런치 등 주요 외신에 따르면 오픈AI는 지난 17일(현지시간) 새로운 앱프로그램인터페이스(API) 옵션인 '플렉스 프로세싱(Flex Processing)'을 출시했다. 처리 우선순위가 낮아 응답시간은 느려지고 간헐적으로 사용 가능한 자원도 줄어들지만, AI 모델 사용 비용을 기존 구독료의 절반으로 낮춰준다는 점이 눈길을 끈다. 이는 전날 공개된 최신 추론 모델인 오픈AI 'o3' 및 'o4-미니'에서 베타 버전으로 제공된다. 모델 평가, 데이터 보강, 비동기 작업 등 긴급하지 않은 비생산성 작업을 위한 용도로 설계된 것이 특징이다. 다만 '플렉스 프로세싱'은 새롭게 도입된 오픈AI의 신원 인증을 거쳐야 활용할 수 있다. 신원 인증은 추론 요약 기능이나 스트리밍 API 지원 등 고급 기능을 접근하기 위한 조건이다. 사용 등급(tier) 1~3에 해당하는 개발자들은 신원 인증 절차를 통해 o3 등 주요 모델에 접근할 수 있다. 오픈AI의 사용자 등급은 서비스 이용 금액을 기준으로 나뉜다. 오픈AI는 신원 인증의 도입 배경에 대해 "악의적 사용자들의 정책 위반을 막기 위한 조치"라고 설명했다. API 가격은 o3 모델 기준으로 입력 토큰(AI 연산단위) 100만 개당 5달러, 출력 토큰 100만 개당 20달러다. o4-미니 모델 기준으로는 입력 토큰 100만 개당 0.55달러, 출력 토큰 100만 개당 2.20달러다. 기존 가격은 o3 모델이 각각 10달러, 40달러, o4-미니 모델이 1.10달러, 4.40달러다. 이처럼 오픈AI가 새로운 가격 정책을 내세우게 된 것은 최첨단 AI 모델의 사용 비용 증가 속에서도 구글, 딥시크 등 경쟁사들이 더 저렴하고 효율적인 AI 모델을 출시하고 있다는 점을 의식한 행보로 분석된다. 실제로 구글은 같은 날 고성능이면서도 저비용 가격으로 책정된 추론 모델 '제미나이 2.5 플래시'를 출시했다. 최근 '구글 클라우드 넥스트 2025'에서 공개됐던 이 모델은 딥시크의 R1 모델과 비교해 성능 면에서 우위에 있다고 평가받고 있다. '제미나이 2.5 프로' 대비 경량화한 모델로, 일반, 추론형 등 두 가지 버전으로 제공된다. 제미나이 2.5 플래시의 API 사용료는 100만 토큰당 입력이 0.15달러, 출력이 비추론의 경우 0.6달러, 추론은 3.5달러다. 이는 오픈AI o4-미니보다 저렴한 가격이지만, 딥시크 R1(0.55달러, 2.19달러)에 비해선 비싸다. 업계에선 구글 제미나이가 사용 방식에 따라 딥시크보다 높은 가성비를 지닌 것으로 평가했다. 구글도 "제미나이 2.5 플래시는 속도와 비용에 중점을 두면서도 추론 기능을 대폭 업그레이드해 비용 대비 성능이 매우 좋다"며 "품질과 비용, 시간 지연 간 균형 최적화를 위해 '사고(추론)'에 대한 예산을 설정할 수 있고 추론 기능을 쓰지 않더라도 기존과 같은 속도로 성능을 향상시킬 수 있다"고 자신했다. 업계에선 AI API 시장의 가격 경쟁이 치열해지는 상황 속에 오픈AI의 플렉스 프로세싱이 개발자들과 기업 고객에게 좋은 반응을 얻을 수 있을지 주목하고 있다. 또 오픈AI가 자체 클라우드 부재로 가격 구조가 취약한 상황에서 이번 조치가 해결책이 될 수 있을지에 대해서도 관심있게 보고 있다. 업계 관계자는 "구글은 자체 클라우드 사업이 있어 AI 가격을 낮춰도 수익성을 확보할 수 있지만, 오픈AI는 마이크로소프트(MS) 등 타사 클라우드를 빌려 써야 해 가격 인하에 제약이 있다"며 "'지브리풍 이미지'로 불리는 챗GPT 이미지 생성으로 연산력 부족도 심화하고 있어 연산 속도와 함께 가격을 낮추는 전략으로 경쟁사 견제에 나선 듯 하다"고 말했다.

2025.04.18 14:52장유미

몽고DB, '아틀라스 스트림 프로세싱' 공개 프리뷰 버전 공개

몽고DB는 아틀라스 스트림 프로세싱의 퍼블릭 프리뷰 버전을 19일 공개했다. 아틀라스 스트림 프로세싱은 높은 도큐먼트 모델 유연성 및 사용 편의성을 제공하고 쿼리 API를 지원하는 몽고DB 아틀라스의 장점을 스트림 처리에 접목한 솔루션이다. 아틀라스 스트림 프로세싱은 빠르게 변화하는 이벤트 데이터의 스트림을 집계 및 보강하고, 전송 중이거나 유휴 상태의 데이터 작업 방식을 통합해 개발자 경험을 개선한다. 몽고DB는 개발자가 아틀라스 데이터베이스에서 변경 스트림을 통해 데이터를 지속적으로 처리할 뿐만 아니라 컨플루언트 클라우드, 아마존 MSK, 애저 이벤트 허브, 레드판다 등 파트너 서비스에서 호스팅되는 카프카 데이터를 처리하는 데 아틀라스 스트림 프로세싱을 지원한다. 몽고DB는 몽고DB VS 코드 플러그인에 스트림 프로세싱 인스턴스에 대한 연결을 지원해 VS 코드를 통합했다. 플러그인을 활용하는 개발자는 익숙한 개발 환경에서 프로세서를 생성하고 관리해 도구 간 전환 시간을 줄이고 애플리케이션 구축에 집중할 수 있다. DLQ 기능은 강력한 스트림 처리를 위한 핵심 요소다. 아틀라스 스트림 프로세싱은 DLQ 기능을 확장해 'sp.process()'로 파이프라인을 실행하거나 구동 중인 프로세서에서 '.sample()'을 실행할 때 DLQ 메시지를 표시한다. 이를 통해 DLQ를 위한 타깃 컬렉션을 별도 설정할 필요 없이 더욱 간소화된 개발 환경을 구축할 수 있다. '$lookup'을 지원해 원격 아틀라스 클러스터 데이터로 스트림 프로세서에서 처리 중인 문서를 보강해 문서와 타깃 컬렉션의 필드에 대한 조인을 수행할 수 있다. 변경 스트림 '$source' 역시 개선해 사전 및 사후 이미지도 지원한다. 개발자는 문서 내에서 필드 간 델타 값을 계산하는 일반적인 사례 뿐만 아니라 삭제된 문서의 전체 내용에도 액세스할 수 있다. 병합 및 내보내기 단계에서는 동적 표현식을 사용한 조건부 라우팅을 구현해 처리 중인 문서의 필드 값을 사용하고 특정 메시지를 다른 아틀라스 컬렉션 또는 카프카 토픽으로 전송할 수 있다. 유휴 스트림 타임 아웃 기능 역시 제공되어 인바운드 데이터 부족으로 인해 상위 워터마크 없이 진행되는 스트림이 일정 시간 후 윈도우 결과를 내보낸 후 닫히도록 구성할 수 있다. 지속적으로 프로세스를 실행하는 스트림 프로세스에서 문제나 장애가 발생할 경우 지능적인 복구 매커니즘이 필요하다. 아틀라스 스트림 프로세싱은 데이터 처리 중 상태 저장을 위한 체크포인트를 지원해 데이터 수집 및 처리가 중단된 지점부터 스트림 프로세서를 쉽게 재가동할 수 있도록 지원한다. 테라폼에서 연결 및 스트림 처리 인스턴스(SPI)를 생성하고 인프라를 코드로 작성해 반복적으로 배포할 수 있다. 스트림 처리 작업에 필요한 만큼 일부 사용자에게만 사용자 권한을 부여할 수 있다. 아틀라스 스트림 프로세싱의 인증 기능을 통해 SPI 내 인증 시도 및 작업을 감사하고, 보안 관련 이벤트에 대한 인사이트를 얻을 수 있다. 카프카 소비자 그룹을 지원해 오프셋 추적을 위해 카프카 소비자 그룹을 사용하고 사용자가 스트림에서 프로세서의 위치 변경 및 지연 모니터링을 쉽게 수행할 수 있도록 돕는다. 신재성 몽고DB코리아 지사장은 “아틀라스 스트림 프로세싱을 통해 개발자 환경을 한 단계 발전시킬 수 있게 됐다”며 “몽고DB는 개발자들에게 현대화된 환경을 제공하기 위해 다양한 노력을 이어가고 있다. 개발자의 의견을 지속적으로 수렴해 주요 기술 전반에서 지속적으로 더 나은 경험을 제공할 계획”이라고 밝혔다.

2024.02.19 11:44김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

게임, '중독·규제' 프레임 탈피 절실…"질병코드 등재 막아야"

"최대 600만원 할인해도 안 팔려"…현대차, 전기차 생산 또 멈춘다

SK하이닉스 부스 찾은 젠슨 황 "GO SK! 넘버원" 찬사 연발

유심 부족 사태, e심은 왜 제 역할 못했나

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현