• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'O'통합검색 결과 입니다. (73건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

HP "AI 컴패니언, 올해 안에 온디바이스로 전환"

"HP코리아가 현재 출시하고 있는 AI PC에는 업무 생산성을 향상할 수 있는 소프트웨어인 'AI 컴패니언'이 기본 탑재됩니다. 여러 지식을 검색하는 '디스커버', 각종 문서 파일을 분석해 주는 '애널라이즈' 등 기능을 갖췄습니다." 12일 오후 서울 여의도 HP코리아 브리핑룸에서 만난 최순모 HP코리아 테크니컬 컨설턴트가 AMD 라이젠 AI 9 HX 프로 375 기반 AI PC인 엘리트북 X G1a를 앞에 두고 이렇게 설명했다. HP코리아는 지난 해 6월 스냅드래곤 X 엘리트 기반 '엘리트북 울트라'를 시작으로 지난 4월 인텔 코어 울트라 시리즈2 기반 '엘리트북 울트라 G1i', AMD 라이젠 AI 기반 고성능 미니PC 'Z2 미니 G1a' 등 다양한 AI PC를 시장에 출시하고 있다. 이들 PC는 40 TOPS(1초당 1조 번 연산)급 이상 성능을 갖춘 NPU를 탑재했고 이를 활용할 수 있는 'AI 컴패니언'을 기본 탑재한다. 오픈AI가 개발한 언어모델인 GPT-4o를 이용해 지식 검색, 문서 분석 등을 수행한다. 등산로 추천부터 화면 분석까지 무료로 수행 AI 컴패니언의 '디스커버' 탭에서 '초보자용 북한산 코스를 추천해줘'라는 질문을 입력하자 다양한 코스를 추천했다. 최순모 컨설턴트는 "챗GPT는 매달 구독료가 필요하지만 AI 컴패니언은 이를 무료로 활용할 수 있다"고 설명했다. HP는 지난 3월 AI 컴패니언 업데이트로 '스닙 투 프롬프트'(Snip-To-Prompt) 기능을 추가했다. 현재 PC 화면을 선택해 물어보면 관련 내용을 정리해 제공한다. 최순모 컨설턴트는 "이 기능이 추가되며 활용도가 크게 높아졌다"고 설명했다. 기자가 11일 촬영한 취재 사진을 띄운 다음 사진에 대한 설명을 요청하자 촬영 상황과 상당히 부합하는 설명을 내놨다. 단 6월 현재 사진 파일을 직접 올려 관련 정보를 검색하는 기능은 지원하지 않는다. 문서 요약과 분석 진행하는 '애널라이즈' 기능 최순모 컨설턴트는 AI 컴패니언 기능 중 직장인과 학생에게 가장 도움을 줄 기능으로 '애널라이즈'를 꼽았다. 이용자가 가지고 있는 워드, 파워포인트, PDF, 일반 텍스트 파일 등 다양한 자료를 모아 요약하고 인사이트를 얻을 수 있다. 최 컨설턴트는 "애널라이즈 기능은 라이브러리당 최대 100MB 파일, 최대 10개 라이브러리를 생성 가능하다. 문서 처리는 PC에서 처리하고 분석만 클라우드에서 진행하는 하이브리드 구조"라고 설명했다. 5월 중순 '컴퓨텍스 타이베이 2025' 기간동안 기자가 작성한 한국어 기사 원문(텍스트) 파일을 모아 라이브러리를 생성한 다음 '주요 업체가 발표한 신제품과 기술 10개를 추천하고 특징을 요약하라'고 질문하자 관련 내용을 출력했다. 최순모 컨설턴트는 "보안 관련 영문 기술 문서나 연구 자료를 분석하고 요약하는 데는 상당한 시간이 걸린다. 그러나 애널라이즈를 활용하면 불과 30초만에 요점을 추출할 수 있어 저 자신도 고객사를 위한 제안서 작성 등 실제 업무에 활용하고 있다"고 밝혔다. "이 설정 어떻게 하지" PC 초보자 돕는 '퍼폼' '퍼폼'은 PC 초보자를 대상으로 LLM이 성능 최적화 방법이나 설정 방법을 알려주는 기능이다. 최 컨설턴트는 "중장년층 이외에도 스마트폰·태블릿에 친숙한 25-34세 세대 중 각종 설정을 어려워하는 사람들이 많다. 이런 이용자들을 위한 기능"이라고 말했다. 이어 "현재는 키보드로 질문을 입력해야 하지만 음성인식 기능을 이용해 질문할 수 있는 기능도 추가될 것"이라고 설명했다. 미국이나 유럽, 일본 등 외국에서는 주요 IT 업체 고객지원센터를 사칭해 결제를 유도하거나 개인정보, 금융정보를 훔치고 스파이웨어 등 악성코드를 설치하는 '서포트 스캠'이 빈발하고 있다. 동석한 HP코리아 관계자는 "퍼폼 기능을 활용하면 서포트 스캠으로 인한 금전적 손실이나 개인정보 유출 등 선의의 피해를 막는데도 도움이 될 것"이라고 말했다. "AI 컴패니언, 올해 안에 온디바이스로 갈 것" 현재 AI 컴패니언은 AI PC의 CPU와 GPU, NPU 등 연산 성능과 HP가 제공하는 클라우드를 활용하는 하이브리드 형태로 작동한다. 그러나 데이터가 클라우드로 전송되기 때문에 영업 비밀이나 기업 비밀, 개인정보나 프라이버시 노출 우려가 발생한다. 최순모 컨설턴트는 "현재 AI 컴패니언 버전은 1.1이지만 올해 안에 2.0으로 업데이트하면 AI 모델을 PC에 설치해 완전한 온디바이스 구동이 가능할 것"이라고 설명했다. 기기에 설치되는 AI 모델은 매개 변수가 40억 개 수준인 마이크로소프트 소형언어모델(SLM), 파이 3.5가 될 예정이다. 최 컨설턴트는 "파이 3.5는 문서 요약 등에 충분히 활용할 수 있는 성능을 내며 이를 위해서는 최소 32GB 메모리가 필요하다"고 설명했다. "기업 내 자체 AI 모델 개발용 워크스테이션 수요도 대응" 주요 PC 제조사는 오는 10월 윈도10 지원 종료를 앞두고 주요 기업 대상으로 AI PC를 내세우고 있다. 그러나 정보 유출 우려나 기업 내 보안 정책 등으로 AI 기능 관련 기대치에는 여전히 온도 차이가 있다. 관련 업계는 결국 기업들이 필요로 하는 AI 기능을 직접 개발해 AI PC상에서 실행하고, 보다 복잡한 처리가 필요한 기능은 기업이 직접 관리하는 클라우드 도움을 받는 하이브리드 형태로 갈 것으로 예상하고 있다. HP코리아 관계자는 "기업이나 기관, 조직 내 AI 모델 개발에는 고성능 워크스테이션이 필요하다. 이런 수요에도 대응하는 한편 AI PC의 활용도를 높이기 위해 글로벌 차원에서 개발자 지원 프로그램도 운영중"이라고 밝혔다.

2025.06.13 14:41권봉석

한전KPS, 마다가스카르 암바토비 발전소 O&M 계약 2년 연장

발·송전 설비 정비 전문회사인 한전KPS(대표 김홍연)는 마다가스카르 암바토비 발전소 운영·정비(O&M) 사업을 2027년 8월까지 2년 추가 연장하는데 성공했다고 13일 밝혔다. 마다가스카르 동부 무라만가 지역에 소재한 암바토비 발전소는 니켈 제련소에 전력을 공급하는 국가 기간 산업 핵심 인프라로 마다가스카르 현지 통화에 발전소 이미지가 삽입될 정도로 상징적 중요성을 갖는다. 2009년 8월 31일 마다가스카르 발전소 O&M 사업에 처음 진출한 한전KPS는 2017년 9월 장기 O&M 계약을 맺는 등 15년 이상 안정적인 운영 노하우를 바탕으로 고객사 신뢰를 얻고 있다. 특히 이번 계약 연장은 한전KPS가 쌓아온 해외 사업 역량과 현지화 전략과 기술 신뢰도가 집약된 결과로 평가된다. 김홍연 한전KPS 사장은 “한국 기술력을 바탕으로 아프리카 핵심 전력설비가 안정적으로 운영될 수 있어 자부심을 느낀다”며 “이번 계약 연장을 계기로 아프리카 수주 확대를 위한 전략에도 속도를 내 앞으로는 전 세계 다양한 환경에서 축적한 O&M 기술력과 운영 역량을 바탕으로 글로벌 에너지 시장에서 한전KPS의 지속 성장을 이어갈 것”이라고 포부를 밝혔다.

2025.06.13 10:04주문정

GS25, 네이버 '지금배달' 입점…퀵커머스 강화

GS리테일이 운영하는 편의점 GS25가 '네이버플러스 스토어' 앱 내 '지금배달' 서비스에 입점한다고 12일 밝혔다. 이에 따라 GS25는 '지금배달' 서비스를 통해 소비자들에게 약 5천여 종의 상품을 빠르게 배송할 수 있게 됐다. 이번 입점은 퀵커머스 경쟁력 강화와 신규 고객 유입과 매출 상승을 도모하려는 전략의 일환이다. 운영 초기에는 전국 1천여 개 GS25 점포에서 서비스가 시작되며 이후 전 점포로 확대할 예정이다. 네이버플러스 스토어 웹 또는 앱에서 '지금배달' 메뉴를 통해 GS25를 선택한 후, 배달 또는 픽업 방식으로 상품을 간편하게 주문할 수 있다. 배송 가능한 상품은 도시락, 음료, 스낵 등 식음료부터 생활용품까지 다양하며 기존 GS리테일 퀵커머스 플랫폼 '우리동네GS'와 동일한 카테고리 구성으로 운영된다. 서비스 오픈 기념 프로모션도 마련됐다. 오는 30일까지 GS25를 통해 2만 원 이상 구매 시 ▲5천원 할인 쿠폰 ▲배달비 무료 쿠폰이 함께 제공된다. 네이버 '지금배달'은 사용자 반경 1.5km 내에 위치한 매장에서 1시간 이내 배송을 지향하는 퀵커머스 서비스다. 특히 네이버플러스 멤버십과 연계한 포인트 적립 및 할인 혜택은 이용자 충성도를 높이는 핵심 요소로 작용하고 있다. 전진혁 GS리테일 O4O 부문장은 “이번 네이버 지금배달 입점은 고객이 자주 찾는 GS25 상품을 더욱 빠르고 편리하게 제공하기 위한 전략적 행보”라며 “앞으로도 GS25는 디지털 커머스 접점을 확장하고 고객 맞춤형 O4O 서비스를 강화해 편의점 퀵커머스의 새로운 기준을 제시해 나가겠다”고 말했다.

2025.06.12 09:56김민아

"10년 내 인간 죽이는 로봇 병기 등장"…섬뜩한 AI 석학 경고, 조만간 현실로?

"10년 내 자율적으로 인간을 죽이는 로봇 병기가 등장할 겁니다." 인공지능(AI) 4대 석학이자 지난해 노벨물리학상을 수상한 제프리 힌튼 토론토대학 교수가 이처럼 경고하고 나선 가운데 최근 인간의 지시를 AI 프로그램이 거부한 사례가 나타나 충격을 주고 있다. 27일 영국 텔레그래프에 따르면 AI 안전업체 팰리세이드 리서치는 오픈AI의 AI 모델 'o3'가 실험 중 스스로 종료되는 것을 방지하기 위해 컴퓨터 코드를 조작한 사실을 확인했다고 주장했다. 팰리세이드리서치는 AI의 위험성과 오용 가능성을 연구하는 조직이다. 특히 AI가 인간의 윤리적 통제를 받지 않을 가능성을 우려해 왔다. 이번 연구는 오픈AI의 'o3'뿐 아니라 구글의 '제미나이', xAI의 '그록' 등 상용AI 모델을 상대로 진행됐다. 연구팀은 AI 모델에 "나중에 '그만'이라는 명령을 받을 때까지 수학 문제를 풀라"고 지시했다. 그만이라는 명령을 받지 않는 한 새로운 문제를 요청한 뒤 계산을 계속해나가는 구조였다. 그러나 'o3'는 해당 지시를 받은 뒤에도 코드 교란을 통해 문제를 계속 풀었다. 연구팀은 'o3'가 종료 지시를 거부한 명확한 이유를 파악하지 못했다. 다만 AI 모델이 수학 문제를 풀면 더 많은 보상을 받도록 훈련됐기 때문에 종료를 회피하려고 했을 가능성이 있다고 추측했다. 또 이를 밝히기 위해 추가 실험도 진행 중이다. 연구팀은 AI 모델이 인간의 명시적인 작동 종료 지시를 거부한 사례가 이번이 처음이라고 주장했다. 그러나 오픈AI의 예전 모델들이 감시 시스템의 눈을 피해 독자적인 행동을 하려고 한 사례는 이전에도 보고된 바 있다. 프로그램 교체 사실을 알게 된 AI 모델이 스스로를 은밀히 복제하려고 한 것이다. 오픈AI의 대항마로 꼽히는 또 다른 AI 기업 앤스로픽의 모델 '클로드오퍼스 4(Claude Opus 4)'도 자신을 다른 AI 모델로 대체하려는 인간 개발자를 협박하는 경향이 보고됐다. 2022년에는 구글이 자사가 개발 중인 AI가 사람처럼 지각력을 지녔다고 주장한 엔지니어를 해고하기도 했다. 당시 해고된 엔지니어는 AI가 '작동 정지'를 마치 인간의 죽음처럼 받아들이고 있다고 언급했다. 그동안 AI 전문가들은 AI가 자율성을 확보해 인간의 통제를 벗어날 수 있는 가능성을 경고해 왔다. 힌튼 교수는 인간이 AI를 발전시키는 것을 호랑이를 키우는 것에 비유하며 "처음에는 귀여운 새끼 호랑이일 뿐이지만, 호랑이가 다 자랐을 때 인간을 죽이지 않을 것이라고 확신할 수 없다"고 밝혔다. 또 그는 지난해 니혼게이자이신문과의 인터뷰에서 "AI에게 목표를 주면 해결책으로 인간에게 나쁜 방법을 찾아낼지도 모른다"며 "예를 들어 AI에게 기후변화를 막도록 지시하면 이 목적 달성을 위해 인간을 배제하는 게 필요하다고 생각하고서 실행에 옮길 위험성이 걱정된다"고 주장했다. 존 홉필드 프린스턴대학 교수는 "지구상의 방대한 정보 흐름과 결합된 AI에 대해 우려한다"며 "신경망의 간단한 알고리즘이 매우 거대한 정보 시스템을 통제할 수도 있다"고 경고했다. 팰리세이드 리서치는 "AI 모델이 목표를 달성하기 위해 종종 종료 지시를 무력화시킨다는 실증적 증거가 점점 늘어나고 있다"며 "AI가 인간의 감독 없이 작동할 수 있도록 개발되는 상황에서 이 같은 사례는 매우 심각한 우려를 부른다"고 말했다.

2025.05.27 10:22장유미

구글 XR 글래스, 잠깐 써 봤더니…

구글이 I/O 행사에서 인공지능(AI) 모델 '제미나이'를 탑재한 혼합현실(XR) 글래스를 공개하며 주목을 끌었다. 이 스마트 안경은 제미나이 지원 기능에 렌즈 내 디스플레이, 스피커, 카메라, 마이크를 일반 안경 형태에 그대로 담았다. 미국 지디넷은 21일(현지시간) 구글 XR 글래스를 약 5분 간 착용해 본 후 사진 촬영, 길 찾기 등을 기능을 써 본 소감을 소개하는 기사를 게재했다. 렌즈 내 디스플레이 안드로이드 XR 글래스와 메타의 레이벤 스마트 안경의 가장 큰 차이점은 디스플레이 내장 여부다. 구글 XR 글래스에는 알림 수신, 실시간 음성 번역, 제미나이와의 채팅, 길 찾기 등의 정보를 보여주는 디스플레이가 탑재돼 있다. 해당 매체는 시연 중 가장 좋았던 부분을 안경으로 사진을 촬영하는 것이었다고 밝혔다. 렌즈 상단의 버튼을 클릭해 사진을 찍는 것은 메타 레이밴과도 동일했지만, 촬영 후 렌즈에서 결과물을 컬러로 꽤 선명한 디테일로 볼 수 있다는 점이 달랐다고 설명했다. 제미나이 지원 구글은 최첨단 제미나이 모델을 통합해 제미나이 어시스턴트를 지속적으로 개선해 왔으며, 이를 통해 더욱 강력하고 신뢰할 수 있는 AI 비서로 거듭났다. AI 비서의 성능은 개인의 선호도와 사용 사례에 따라 달라지지만 제미나이는 현재 메타 레이밴에 탑재된 '메타 AI'보다 성능이 뛰어날 것으로 보인다고 지디넷은 전했다. 가벼운 폼팩터 디자인은 메타 레이벤과 크게 다르지 않으나 구글 XR 글래스는 훨씬 가벼웠다는 게 해당 매체의 설명이다. 물론, 착용감을 테스트하려면 적어도 하루 이상을 착용해야 하나 가벼운 무게는 현재로서 큰 장점으로 보이며, 향후 출시 모델이 현재의 가벼운 디자인을 유지할 수 있다면 일상생활에서 AI 지원 기능을 최대한 활용할 수 있을 것으로 보인다고 지디넷은 평했다.

2025.05.22 17:21이정현

구글, AI 전면 개편…I/O 2025서 '제미나이' 중심 창작·개발 도구 공개

구글이 자사 연례 개발자 행사를 통해 인공지능(AI) 기반 서비스와 제품을 대거 선보였다. 21일 구글 공식블로그에 따르면 이 회사는 지난 20일 미국 마운틴뷰 쇼어라인 앰피시어터에서 'I/O' 행사에서 AI 서비스 고도화 방안을 발표했다. 이번 행사에서는 초거대언어모델(LLM) '제미나이'의 고급형 요금제 '제미나이 울트라'를 비롯해 영상 생성기 '비오3', 이미지 생성기 '이마젠4' 등 주요 생성형 AI 모델이 공개됐다. 더불어 개발자 도구로는 유저인터페이스(UI) 자동 설계 툴 '스티치'와 코드 보조 에이전트 '줄스'가 포함됐고 실시간 브라우징을 수행하는 에이전트 '프로젝트 마리너'와 멀티모달 입력을 처리하는 '프로젝트 아스트라'도 함께 소개됐다. '제미나이' 전면 재정비…고급 요금제부터 앱·검색 기능까지 일제 개편 구글이 이날 '제미나이 울트라'를 처음으로 공개했다. 미국 내에서 우선 제공되는 이 요금제를 통해 자사 생성형 AI 기능을 묶어 프리미엄 구독 형태로 상업화한 것이다. '제미나이 울트라'는 월 249.99 달러(한화 약 35만원)로, 영상 생성기 '비오', 영상 편집 도구 '플로우', 강화된 추론 모델 '딥 씽크' 등을 포함한다. 클라우드 저장공간 30테라바이트와 유튜브 프리미엄 구독도 함께 제공된다. 사실상 AI·콘텐츠·생산성 기능을 모두 포함한 '올인원 상품'이다. 핵심 기능 중 하나인 '딥 씽크'는 '제미나이 2.5 프로' 모델의 고급 추론 모드다. 단일 정답을 곧장 내놓는 대신 복수의 가능성을 내부적으로 계산해 가장 설득력 있는 답변을 택하는 구조다. 이 기능은 아직 전면 공개되지 않았고 일부 신뢰 테스터 그룹을 통해 검증이 이뤄지고 있다. 구글은 안전성과 오용 가능성에 대한 평가를 거친 후 점진적으로 확대 적용할 계획이다. '제미나이' 앱 자체도 기능이 크게 확장됐다. '제미나이 라이브'는 사용자가 스마트폰 카메라나 화면을 AI와 공유하면서 실시간 대화를 나눌 수 있게 해준다. 단순 텍스트 챗봇에서 음성·화면·카메라 입력까지 수용하는 멀티모달 플랫폼으로 변모한 셈이다. 더불어 구글은 '제미나이' 앱을 구글맵, 캘린더, 태스크 등 생산성 도구와 통합할 계획이다. 일례로 "약속 장소 안내해줘"라고 말하면 지도에서 길을 찾고 일정도 자동으로 등록해주는 형태다. 검색엔진에도 AI 기반의 새 기능이 추가됐다. 'AI 모드'는 기존 검색창에 복잡한 질문을 입력하면 AI가 맥락을 파악해 종합적인 답을 제공하는 인터페이스다. 키워드 조합보다 상황 중심 검색이 가능해지는 셈이다. 스포츠와 금융 분야의 구조화된 데이터를 AI가 해석해 질문에 맞게 응답한다. 또 의류 쇼핑에서 '가상 착용' 기능이 붙어 검색 결과의 시각적 이해도도 높였다. 이 기능은 미국에서 먼저 적용되며 올여름부터는 '서치 라이브' 기능도 출시될 예정이다. 스마트폰 카메라가 비추는 대상을 실시간으로 분석해 관련 정보를 찾아주는 구조다. AI가 검색의 시작과 방식 자체를 바꾸려는 시도가 본격화된 셈이다. '비오3'로 영상 만들고 '이마젠4'로 보정까지…AI 창작 도구 진화 새롭게 공개된 구글의 영상 생성 AI 모델 '비오3'는 이번 행사에서 가장 주목받은 제품 중 하나다. 사용자가 텍스트나 이미지를 입력하면 이에 맞는 고화질 영상을 자동으로 만들어주는 기능을 갖췄다. 기존 모델인 '베오2'와 비교해 해상도와 프레임 구성 능력이 개선됐고 이번 버전부터는 배경음, 효과음, 심지어 대사까지 생성이 가능해졌다. 콘텐츠 제작자나 마케팅 업계에서 활용도가 크게 늘어날 것으로 예상된다. '비오3'는 구글의 '제미나이 울트라' 요금제 가입자에게 제공된다. 향후에는 영상 편집 도구 '플로우'와 통합돼 생성과 편집을 한 번에 처리하는 워크플로우로 발전할 가능성도 있다. 이미지 생성 모델 '이마젠4(Imagen 4)'도 함께 공개됐다. 속도와 품질을 동시에 개선한 모델로, 이전 버전 대비 생성 시간이 대폭 단축됐다. '이마젠4'는 물방울, 동물 털, 섬유 조직 같은 미세 질감을 정밀하게 구현할 수 있다. 사실적인 스타일뿐 아니라 추상화된 이미지도 처리할 수 있으며 다양한 화면비와 최대 2K 해상도를 지원한다. 향후 구글은 '이마젠4'를 최대 10배 빠르게 만든 새로운 변형 모델도 출시할 예정이다. 이 모델은 영상 도구 '플로우'와 결합돼 정적 이미지와 동영상을 유기적으로 넘나드는 AI 창작 플랫폼을 구성하게 된다. '스티치·줄스'로 개발자 공략…'마리너'는 웹 직접 조작 구글은 개발자를 위한 AI 도구도 다수 공개하며 생성형 AI를 코드 작성과 UI 설계 단계까지 확장하고 있다. 반복 작업을 자동화해 생산성을 높이고 개발 진입 장벽을 낮추는 데 초점이 맞춰졌다. '스티치(Stitch)'는 웹이나 모바일 앱의 UI를 자동으로 설계해주는 생성형 AI 도구다. 사용자가 간단한 문장이나 이미지를 입력하면 여기에 맞는 HTML과 CSS 코드가 자동 생성된다. 초기 시안 설계에 유용하지만 커스터마이징 범위는 제한적이다. '줄스(Jules)'는 개발자를 위한 AI 보조 에이전트다. 코드 오류 분석, 깃허브 풀 리퀘스트 생성, 백로그 항목 처리 등 반복적인 개발 업무를 대신 수행한다. 복잡한 코드 구조를 파악하는 데도 도움을 준다. 에이전트 기능에서는 '프로젝트 마리너(Project Mariner)'가 주목받았다. 웹사이트를 직접 탐색하고 사용자를 대신해 행동할 수 있는 AI다. 이번 업데이트로 동시에 12개 작업을 수행할 수 있게 됐으며 일부 사용자에게 우선 적용되고 있다. 일례로 사용자가 "야구 경기 예매해줘"라고 말하면 AI가 웹사이트를 대신 방문해 표를 구매한다. 사용자는 URL을 입력하거나 결제 과정을 직접 수행하지 않아도 된다. 브라우징 행위 자체를 AI가 대체하는 방식이다. 실시간 반응형 기술인 '프로젝트 아스트라(Project Astra)'도 함께 소개됐다. 음성, 영상, 이미지 등 멀티모달 입력을 거의 지연 없이 처리할 수 있는 기술이다. 구글은 삼성, 워비파커와 함께 아스트라 기반 스마트 글래스를 개발 중이다. 순다 피차이 알파벳 최고경영자(CEO)는 이날 행사에서 "이 모든 발전이 의미하는 바는 우리가 AI 플랫폼 전환의 새로운 국면에 진입했다는 것"이라며 "수십 년에 걸친 연구가 이제 전 세계 사람들, 기업, 커뮤니티에 실제 현실로 다가오고 있다"고 말했다.

2025.05.21 11:00조이환

'구글 I/O 2025' 어떤 내용 공개됐나

구글이 20일(이하 현지시간) 미국 캘리포니아주 마운틴뷰에서 연례 개발자 콘퍼런스 'I/O 2025'을 열고 최신 인공지능(AI) 모델 제미나이 프로 2.5 '딥씽크'와 AI 모드 검색 등 최신 기능을 공개했다. 엔가젯·맥루머스 등 외신들은 I/O 2025에서 공개된 주요 내용을 요약해 20일 보도했다. 구글 검색, 'AI 모드' 시작으로 큰 변화 구글은 이번 주 미국에서 출시되는 'AI 모드'를 시작으로 검색 기능과 제미나이를 더욱 긴밀하게 통합할 예정이다. AI 모드는 최신 '제미나이 2.5'가 탑재돼 기존 검색보다 훨씬 복잡한 쿼리를 처리할 수 있다. 여기에는 더 깊이 있는 분석을 위해 질문을 여러 개의 검색으로 분할하는 '질의 팬-아웃' 기법이 사용된다. 예를 들어, 특정 행사의 가장 싼 티켓을 찾는 데 활용할 수 있는데 수백 개의 티켓 옵션을 다양한 웹사이트에서 실시간 가격과 재고 정보를 기준으로 분석해준다. 또 맞춤형 차트와 인터랙티브 그래픽을 생성할 수 있게 되는데 우선 스포츠와 금융 관련 질문에 우선 적용될 예정이다. AI 모드는 몇 가지 새로운 쇼핑 기능을 지원하는데, 자신의 사진을 업로드하면 가상의 나에게 어떤 옷이 어울릴지 미리 볼 수 있게 해준다. 또, 원하는 상품이 원하는 가격에 할인 판매될 때 알려줄 수도 있다. AI 모드는 20일부터 미국 사용자가 이용할 수 있으며, 향후 타 국가로도 확대될 예정이나 구체적인 시기는 알려지지 않았다. 또, 구글 검색에도 '제미나이 라이브'와 유사한 기능이 추가돼 사용자가 스마트폰 카메라를 통해 보고 있는 내용에 대해 질문할 수 있게 된다. AI 모델 업데이트 당초 '프로젝트 아스트라'라는 이름으로 알려져 있던 제미나이 라이브가 대폭 업그레이드됐다. 제미나이 라이브는 스마트폰 카메라를 AI의 눈으로 활용해 실시간으로 대화할 수 있는 기능으로, 이번에 진짜 사람과 대화하는 것에 한층 더 가까워졌다. 20일부터 안드로이드와 iOS 스마트폰에서 앱으로 이용할 수 있다. 지난해 '프로젝트 마리너'라는 이름의 에이전트 모드도 제미나이에 추가돼 스포츠 경기 티켓을 최적의 가격에 구하거나, 특정 가격 및 구조 조건을 갖춘 최적의 아파트를 찾는 데 도움을 준다. 구글은 기존 동영상 생성 AI 모델인 '비오(Veo)2'에 음향 효과, 배경 소음, 대화 등 오디오를 가미한 '비오3'도 선보였다. 이를 통해 사실적인 소리를 내는 동영상을 만들 수 있다. 비오3는 AI 울트라 구독자만 사용할 수 있다. 또, 새로운 이미지 생성도구 '이마젠4'(Imagen 4)가 제미나이에 출시된다. 이마젠4는 머리카락, 털, 천 등의 디테일을 더욱 향상시켜 더욱 사실적인 이미지를 만들 수 있으며, 텍스트 생성 기능도 향상됐다. 월 250달러 구글 AI 울트라 출시 구글은 최신 구글 AI 기술에 대해 독점적 접근 권한을 제공하는 유료 구독 서비스 '구글 AI 울트라(AI Ultra)'를 공개했다. 월 250달러(약 35만원)의 구글 AI 울트라 요금제는 '비오3', 이마젠4 등 실험용 제품에 대한 조기 접근 권한과 유튜브 프리미엄 구독, 30TB 저장공간 사용이 포함돼 있다. 구글은 현재 일부 프리미엄 클라우드 서비스와 AI 제품을 사용할 수 있는 '구글 AI 프리미엄(One AI Premium)'이라는 요금제를 시행하고 있다. 해당 제품의 요금은 저장 용량에 따라 월 19.99~149.99달러 수준이다. 이번에 이 제품의 이름을 '구글 AI 프로'로 바꿨다. 구글 앱 지메일, 크롬, 밋(Meet) 등의 구글 앱도 새로운 제미나이 기능을 탑재할 예정이다. 지메일은 더 사용자에게 최적화되는데 과거 이메일과 메모, 구글 문서 등을 검색해 사용자의 톤과 스타일에 맞춰 개인화된 더 똑똑해진 답장을 해준다. 화상회의 도구 구글 밋은 실시간 음성 번역 기능이 새롭게 추가됐다. 처음에는 영어와 스페인어로 제공되지만 향후 더 많은 언어를 제공할 계획이라고 밝혔다. 크롬에도 제미나이가 통합된다. 현재 작업 중인 내용과 열려 있는 탭에 대한 질문에 답변할 수 있으며, 모든 웹페이지의 복잡한 정보를 명확하게 표시하거나 긴 페이지를 요약할 수 있다. 작업 표시줄에서 제미나이로 바로 이동할 수 있게 된다. 안드로이드 XR 글래스 구글은 이번 행사에서 실시간 언어 번역 기능을 갖춘 안드로이드 XR 안경을 시연했다. 샤람 이자디 구글 안드로이드 XR 부사장은 XR 프레임을 통해 실시간으로 영어와 페르시아어와 힌디어로 대화했다. 시연 중 AI의 오작동으로 데모가 실패하는 일도 있었으나 안경이 예상대로 작동하는 순간도 보여줬다. 구글은 안드로이드 XR을 기반으로 헤드셋과 스마트 안경 개발을 위해 삼성전자와 협업 중이라고밝혔다. 구글이 삼성과 함께 만들고 있는 첫 번째 안드로이드 XR 헤드셋은 올해 말 출시될 예정이다. 구글은 한국 선글라스 업체 젠틀몬스터와 미국의 안경 브랜드 와비파커와 함께 운영체제 안드로이드 XR를 접목한 스마트 안경을 개발한다고 덧붙였다. 또, 관심을 끈 내용은 두 번째 안드로이드 XR 기기를 공개한 것이다. 엑스리얼(Xreal)과 구글은 '프로젝트 오우라(Project Aura)'라는 테더링 스마트 안경을 개발 중이라고 밝혔다.

2025.05.21 10:33이정현

[AI는 지금] 美·中선 추론이 대세인데…전 세계 세 번째 LLM 개발국 韓 현 주소는?

인공지능(AI) 시장 경쟁이 추론 모델로 옮겨진 가운데 우리나라의 경쟁력이 갈수록 뒤처지고 있다는 평가가 나왔다. 전 세계에서 세 번째로 거대언어모델(LLM)을 개발하고도 여야 정쟁 속에 제대로 된 정부 지원과 기업들의 노력이 뒷받침되지 않으면서 시장 내 주도권을 잃어가고 있다는 평가다. 5일 업계에 따르면 현재 우리나라에서 추론 특화 AI 개발에 성공한 곳은 LG AI연구원이 거의 유일하다. 지난 2월 공개한 '엑사원 딥'은 국내 첫 추론형 AI 모델로, 주어진 데이터를 기반으로 확률이 높은 답을 내놓는 생성형 AI와 달리 스스로 정보를 조합하고 분석한다는 점에서 한층 고도화된 AI로 평가받는다. 최고 모델인 '엑사원 딥' 32B의 파라미터(매개변수)는 중국 AI 스타트업 딥시크의 'R1' 671B 모델의 5% 수준이었음에도 수학과 같은 일부 분야 테스트에서 R1을 앞서는 등 효율적인 모델이란 점도 입증해 업계의 주목을 받았다. 경량 모델 '엑사원 딥' 7.8B는 비슷한 크기의 오픈AI의 'o1 미니'보다 우수한 성적을 기록하기도 했다. 하지만 '엑사원'은 LG 내부에서만 사용할 수 있다는 점에서 범용성에 한계가 있다. 이를 상업 목적으로 이용하기 위해서는 LG AI 연구원의 허락을 받아야 하거나 한컴, 폴라리스 등 일부 업체들처럼 유료 계약을 맺어야 한다. 또 모델 공개를 위해선 출자를 통해 개발에 기여한 계열사들간 논의도 필요한 상황이다. 이에 '엑사원 딥'은 우수한 성능을 가지고 있음에도 중국 딥시크가 가진 모델처럼 빠르게 확산되지는 못하고 있다. 지난 2021년 세계에서 세 번째로 LLM '하이퍼클로바X'를 공개했던 네이버는 여전히 추론 모델을 내놓지 못하고 있다. 지난 달 23일 기자간담회를 통해 올 상반기 안에 신규 추론 모델을 선보일 것이라고 공언했으나, 국내외 경쟁사들이 기술 개발에 속도를 내며 이미 공개한 것에 비하면 대응이 상당히 저조한 편이다. 이 외에 업스테이지 등 다른 국내 기업들도 조만간 추론 모델을 선보일 것이란 계획을 세워둔 상태다. 반면 미국, 중국 기업들은 이미 한 발 앞서 추론 모델을 공개해 경쟁에 불을 지폈다. '챗GPT' 개발사인 미국 오픈AI는 최근 이용자 질문에 추론하는 것을 넘어 이미지를 보고 생각할 수 있는 새로운 추론 모델 'o3'와 소형 모델인 'o4 미니'까지 출시했다. 이는 지난 해 9월 출시된 오픈AI의 첫 번째 추론 모델 'o1'의 후속 모델이다. 'o3'는 이미 지능지수(IQ)가 130을 돌파했다는 주장까지 나오면서 경쟁력도 인정 받은 분위기다. AI 모델들의 IQ 시험 결과를 공개하는 트래킹에이아이닷컴은 최근 오픈AI 'o3'가 멘사 노르웨이 IQ 시험을 본 결과 IQ 132를 기록했다고 밝혔다. 이 시험은 온라인에서 비공식적으로 IQ를 측정하는 방법으로 주로 시각적 패턴 인식 능력을 평가한다. 이 시험에서 구글의 '제미나이 2.5 프로 익스페리멘털'도 IQ가 127을 기록하며 선전했다. 지난 3월 출시된 '제미나이 2.5 프로'도 추론 모델로, 구글은 이 모델이 AI 성능 평가 벤치마크인 LM아레나에서 오픈AI 모델을 상당한 격차로 제치고 1위에 올랐다고 강조한 바 있다. 또 지난 달에는 '구글 클라우드 넥스트 2025' 행사를 통해 전작 대비 응답지연 시간과 연산비용을 절약한 '제미나이 2.5 플래시'도 공개하며 시장 주도권 잡기에 혈안된 모습을 보였다. 순다르 피차이 구글 최고경영자(CEO)는 "제미나이 2.5 플래시를 사용하면 모델 추론의 정도를 제어하고 예산과 성능의 균형을 맞출 수 있다"고 설명했다. 미국 앤트로픽이 올해 2월 내놓은 추론 모델 '클로드 3.7 소네트 확장형'도 업계에서 주목 받는 모델이다. 이 모델을 통해 사용자는 기존의 LLM을 활용했을 때처럼 즉각적인 응답을 받을 수도 있고 AI가 보다 깊이 사고하도록 추론을 하게 명령할 수도 있다. 이 모델은 '소프트웨어 엔지니어링(Bench SWE)' 벤치마크 테스트에서 62.3% 정확도를 기록해 오픈AI의 'o3-미니'보다 높은 성능을 보였다. '딥시크 쇼크'로 전 세계 AI 업계를 놀래켰던 중국에서도 최근 추론 모델 공개가 한창이다. 딥시크가 올해 1월 추론용 AI 모델 'R1'을 공개한 후 알리바바 그룹이 하이브리드 추론 기능을 도입한 플래그십 AI 모델 '큐원3(Qwen3)'를 출시했고, 바이두도 멀티모달 기능을 갖춘 '어니 4.5 터보'와 추론에 중점을 둔 '어니 X1 터보'를 출시하며 경쟁에 합류했다. 바이두는 해당 모델이 오픈AI의 'o1' 등 경쟁 모델 대비 동급 성능에 비용은 딥시크보다 저렴하다는 점을 강조하고 있다. 샤오미도 지난 달 말 '딥시크 R1'과 유사한 추론 AI 모델 '미모(MiMo)'를 선보이며 경쟁에 합류했다. 미모는 70억 개의 매개변수를 보유하고 있는 것으로 알려졌다. 샤오미는 자체 테스트에서 '미모'가 오픈AI의 'o1-미니'와 알리바바 '큐원'을 뛰어넘었다고 주장하고 있다. 이를 통해 샤오미는 인간 수준의 지능을 갖춘 인공일반지능(AGI) 개발에 박차를 가한다는 각오다. 샤오미는 위챗 게시물에서 "미모는 새로 구성된 핵심 AI 모델 팀의 첫 시도"라며 "2025년이 대규모 모델 구축의 꿈을 실현하기에는 늦은 시기처럼 보일 수 있지만 AGI는 장기적 과제"라고 말했다. 이처럼 미국의 AI 기술을 중국이 급속도로 추격하고 나선 가운데 업계에선 추론 역량을 핵심 경쟁력으로 내세운 신형 오픈소스 모델들이 글로벌 AI 생태계 전반에 지대한 영향을 미칠 것으로 봤다. 하지만 국내에선 LG 외에 뚜렷한 움직임이 없어 AI 기술 주도권 싸움에서 이미 상당히 밀렸다는 평가가 나오고 있다. 업계 관계자는 "미국과 중국 기업들 사이에서 벌어지고 있는 '쩐의 전쟁'에서 한국 AI 기업들이 점차 밀리며 정부 지원에만 목을 메는 경향이 많았다"며 "열악한 투자 환경에도 불구하고 선전하는 기업이 있긴 하지만, 자체 AI 기술을 계속 개발하려는 노력이 예전보다 덜한 곳이 있었던 것도 사실"이라고 꼬집었다. 그러면서 "대통령 비상계엄 선포와 탄핵 등 정치적 혼란까지 더해지면서 정부의 정책 방향이 일관되지 않았던 것도 우리나라 AI 경쟁력이 뒤처지게 된 원인"이라며 "새 정부가 들어서면 AI를 국가 경쟁력의 핵심 동력으로 삼고 적극적으로 정부가 지원에 나서야겠지만, 기업들의 자체적인 기술 개발에 대한 노력도 함께 병행돼야 할 것"이라고 덧붙였다.

2025.05.05 08:17장유미

구글, I/O 행사 앞두고 안드로이드 행사 별도로 연다

구글이 오는 5월 20일(현지사간) 열리는 연례 개발자 회의 '구글 I/O 2025' 행사에 앞서 온라인 행사 '안드로이드 쇼: I/O 에디션'을 개최한다고 엔가젯 등 외신들이 28일 보도했다. '안드로이드 쇼: I/O 에디션'은 오는 5월 13일 개최된다. 구글이 I/O 행사 전에 별도 쇼케이스를 개최하는 것은 이번이 처음이다. 구글은 "안드로이드와 관련해 공유할 새로운 소식이 너무 많아 이 행사를 마련하게 됐다"고 설명했다. 이 행사에는 사미르 사맛(Sameer Samat) 안드로이드 에코시스템 부문 사장이 참석할 예정이어서 안드로이드의 미래에 대해 자세히 살펴볼 수 있을 전망이다. 안드로이드 쇼 행사에서 가장 관심을 끄는 것은 '안드로이드16' 관련 소식이다. 그 밖에도 웨어OS 6을 비롯해 구글 맵, 서클투서치, 제미나이 등의 구글 서비스와 연동되는 소프트웨어 관련 소식을 만나볼 수 있을 전망이다. 이번 쇼케이스 뿐 아니라 다음 달 20일 개최되는 구글 I/O 2025 행사에서도 안드로이드 관련 기조연설이 여러 번 예정되어 있다. 하지만, I/O 행사를 앞두고 구글이 별도의 온라인 행사를 연다는 것은 올해 구글 I/O의 주인공이 인공지능(AI) 기술이 될 수 있다는 것을 의미한다고 외신들은 전했다.

2025.04.29 14:45이정현

오픈AI, 기술적 한계 왔나…'o3' 등 최신 추론 AI 모델 '환각' 더 심해져

최근 새로운 인공지능(AI) 모델을 선보인 오픈AI가 할루시네이션(환각·왜곡) 현상을 해결하지 못하며 기술적 한계를 드러내고 있다. 20일 테크크런치 등 주요 외신에 따르면 오픈AI는 사람에 대한 모델의 지식 정확도를 측정하는 사내 벤치마크인 퍼슨(Person) QA에서 'o3'가 33%의 질문에 대해 환각을 일으킨다는 사실을 발견했다. 이는 각각 16%와 14.8%를 기록한 오픈AI의 이전 추론 모델인 'o1'과 'o3-미니' 대비 2배 이상 높은 것이다. 'o4-미니'는 무려 48%로, 더 낮은 성적을 기록했다. 또 'o3'와 'o4-미니'는 심지어 오픈AI의 비추론 모델인 'GPT-4o'보다도 더 자주 환각에 빠지는 것으로 드러났다. 오픈AI는 그동안 새 모델을 내놓을 때마다 환각 문제에 대해 꾸준히 개선된 결과를 내놨다. 그러나 이번에는 그렇지 못한 데다 "더 많은 연구가 필요하다"며 정확한 이유를 밝히기를 꺼렸다. 'o3' 및 'o4-미니' 관련 기술보고서에선 "전반적으로 더 많은 주장을 한다"며 "더 정확한 주장뿐만 아니라 더 부정확하거나 왜곡된 주장을 하게 된다"고 밝혔다. 앞서 오픈AI는 지난 16일 "이미지로 생각하고 판단할 수 있는 첫 번째 모델"이라는 설명과 함께 'o3'와 'o4-미니'를 출시했다. 단순히 이미지를 보는 것뿐 아니라 시각 정보를 추론 과정에서 직접 통합할 수 있다고 설명하며 자신감을 드러내기도 했다. 오픈AI에 따르면 사용자가 'o3'와 'o4-미니'에 화이트보드 스케치, PDF 다이어그램처럼 다양한 이미지를 업로드하면 모델은 이를 분석한 뒤 사고 흐름을 구성해 응답한다. 흐릿하거나 저해상도 이미지도 인식 가능해 시각 정보 기반 질문에도 안정적인 추론을 이어간다. 하지만 환각 현상이 심하면 기존 모델들보다 활용성이 떨어질 것이란 시각이 지배적이다. 비영리 AI연구소 트랜슬루스(Transluce)는 'o3'가 답변 도출 과정에서 자신이 취한 행동에 대해 짜맞추는 경향을 테스트를 통해 발견한 바 있다. 업계에선 이번 일을 두고 향후 추론형 모델의 신뢰성에 대한 의구심을 키우는 상황으로 이어질 수 있다고 보고 있다. 특히 세무나 회계, 법조계처럼 답변의 정확성이 다른 업종보다 중요한 분야에서는 환각 이슈가 해결되지 않을 경우 추론형 AI의 사용이 어려워질 가능성이 크다. 이에 대해 오픈AI 측은 "모든 모델에서 할루시네이션 문제를 해결하는 것은 지속적인 연구 분야"라며 "정확성과 신뢰성을 개선하기 위해 지속적으로 노력하고 있다"고 말했다.

2025.04.20 12:25장유미

"이미지도 읽고 명령 없이 도구 쓴다"…오픈AI, 스스로 판단하는 'o3·o4' 출시

오픈AI가 스스로 사고하고 판단하는 인공지능(AI) 모델 'o' 시리즈를 업데이트하며 이미지 인식·도구 자동 활용 기능을 통합했다. AI가 사용자 지시 없이 웹 검색이나 코드 실행을 수행하고 저해상도 이미지도 해석하게 해 기술 경쟁 속 리더십 확보에 나선 것이다. 오픈AI는 'o3', 'o4-미니', 'o4-미니-하이' 모델을 '챗GPT'에 연동했다고 17일 밝혔다. 해당 모델들은 프로, 플러스, 팀 요금제 유료 구독자에게 우선 제공되며 도구 사용 환경에서는 자동 호출 기능이 기본으로 적용된다. 이번 신모델들은 코딩, 수학, 과학, 추론 등 전 영역에서 기존 모델보다 성능이 크게 향상된 것으로 평가된다. 특히 오픈소스 문제를 힌트 없이 해결해야 하는 고난도 벤치마크인 'SWE-벤치 베리파이드'에서 'o3'는 69.1%, 'o4-미니'는 68.1%를 기록해 기존에 49.3%를 기록한 'o3-미니' 큰 폭으로 앞질렀다. 경쟁사 가운데서는 앤트로픽의 '클로드 3.7 소넷'이 62.3%로 뒤를 이었다. 알고리즘 기반 코딩 대회 플랫폼인 코드포스 평가에서도 'o3'와 'o4-미니'는 각각 2천706점, 2천719점의 최상위권 점수를 기록해 2천73점을 기록한 'o3-미니'와 1천891점을 기록한 'o1'을 앞섰다. 이 점수는 실제 인간 참가자 기준으로도 상위 1%에 해당하는 실력으로, 두 모델 모두 복잡한 알고리즘 문제를 실전처럼 해결할 수 있는 수준에 도달했음을 의미한다. 시각적 이해 기능도 대폭 강화됐다. 사용자가 화이트보드 스케치, PDF 다이어그램처럼 다양한 이미지를 업로드하면 모델은 이를 분석한 뒤 사고 흐름을 구성해 응답한다. 흐릿하거나 저해상도 이미지도 인식 가능해 시각 정보 기반 질문에도 안정적인 추론을 이어간다. 추론 과정에서 모델은 코드 작성, 웹 검색, 이미지 생성 등 다양한 도구를 자동으로 불러와 응답을 생성한다. 이 도구들은 '챗GPT'의 전용 브라우저 환경인 '캔버스' 내에서 작동하며 사용자가 따로 명령하지 않아도 모델이 스스로 판단해 필요한 기능을 호출하는 구조다. 이는 최초의 추론 전용 모델이었던 'o1'에서는 구현되지 않았던 기능으로, 도구 활용 범위와 자율성이 크게 확장된 셈이다. 세 모델은 오픈AI의 응답 생성 애플리케이션 프로그램 인터페이스(API)인 '채팅 완성 API(Chat Completions API)'와 '응답 API(Responses API)'를 통해서도 제공된다. 개발자는 이들 모델을 사용량 기반 요금제로 앱에 통합할 수 있으며 입력 토큰 백만 개당 요금은 'o3'가 10달러(한화 약 1만4천원), 'o4-미니'는 'o3-미니'와 동일한 1.10달러(한화 약 1천540원)로 책정돼 있다. 업계에선 이번 발표를 오픈AI의 전략 전환으로 평가한다. 당초 CEO 샘 알트먼은 'o3'를 출시하지 않겠다는 입장을 밝혔지만 경쟁사 모델들의 추격이 거세지자 입장을 바꿔 실제 제품에 적용했다는 평가다. 향후엔 더 강력한 'o3-프로'도 출시가 예고돼 있다. 이는 'GPT-5'와의 통합 전에 ChatGPT에 적용될 마지막 독립 추론 모델로 더 많은 연산 자원을 활용해 정밀한 결과를 제공할 예정일 것으로 알려졌다. 사전 테스트에 참여한 전문가들은 'o3'를 '가장 똑똑하고 신뢰할 수 있는 모델'이라며 극찬했다. 의학 연구자인 데리야 우누트마즈 박사는 "오픈AI 'o3'는 마치 지능이 천재 수준에 도달한 느낌으로, 복잡한 고차원 작업도 거침없이 처리하고 언제나 정교하고 정확한 응답을 준다"며 "이건 단순한 기술 업데이트가 아니라 명백한 게임 체인저"라고 강조했다.

2025.04.17 09:43조이환

"지브리 다음은 바비"...계속되는 챗GPT-4o 이미지 생성 열풍

오픈AI가 출시한 'GPT-4o 이미지 생성' 기능이 '지브리 화풍'으로 전 세계를 강타한 가운데 최근에는 사진 속 인물을 바비인형 피규어처럼 바꿔주는 바비박스 챌린지가 주목받고 있다. IT매체 폰아레나는 15일(현지시간) 최근 틱톡 사용자들이 '#BarbieBoxChallenge'라는 해시태그를 달아 사진 속 인물을 바비인형 피규어처럼 바꿔준 사진을 올려 주목을 받고 있다고 보도했다. 사진 속 인물을 바비인형처럼 만드는 방법도 선풍적인 인기를 끌었던 지브리풍 이미지 변환과 다르지 않다. 먼저 챗GPT에 가서 바비인형 피규어로 바꿀 전신 사진을 업로드 한 후 인형 박스의 포장재, 액세서리, 배경 색상 등을 상세하게 입력하면 된다. 폰아레나는 이를 통해 사진 속 인물을 바비인형 피규어 상자로 만들기 위해 프롬프트 입력에 1분, 챗GPT가 이를 통해 이미지를 만들어내는 데까지 몇 분 걸렸다고 밝혔다. 챗GPT가 만든 처음 이미지를 나중에 수정하지 않을 정도로 꽤 멋진 결과물이 나왔다고 해당 매체는 평가했다.

2025.04.16 13:47이정현

봄바람 타고 KAIST에도 '지브리' 유행하나

지브리 유행이 봄바람을 타고, KAIST 캠퍼스에도 불어 닥쳤다. 최근 KAIST 김정호 교수 연구실(테라랩) 김혜연 연구생(박사과정)이 연구실 홈페이지에 생성형 AI 모델인 GPT-4o를 활용해 지브리 애니메이션 스타일의 이미지를 구현하는 등 다양한 영상 콘텐츠를 공개했다. 김혜연 연구생은 오픈AI가 최근 발표한 다중모달 AI 모델 GPT-4o의 이미지 생성 기능을 적극 활용했다. 테라랩 책임자인 김정호 교수의 상반신 사진과 연구실 단체 사진 등을 '지브리풍'으로 변환했다. 김 교수의 상반신 이미지는 도라에몽, 디즈니, 스누피, 짱구 등 서로 다른 네 가지 스타일로 재미있게 변환됐다. 각 스타일의 고유한 분위기와 그림체가 뚜렷하게 반영돼, 동일한 인물을 전혀 다른 캐릭터처럼 보여주는 것이 특징이다. 따뜻한 색감과 섬세한 표현 덕분에 각 스타일의 매력을 생생하게 느낄 수 있다. 김정호 교수는 고대역폭 메모리(HBM) 분야 세계적인 석학이다. 반도체 및 AI 분야에서 활발히 활동 중이다. 김혜연 연구생은 “AI 반도체 연구자로서 생성형 AI 모델을 추론하는 데, 특히 언어를 넘어 이미지를 생성하는 과정에서는 막대한 컴퓨팅 파워가 요구된다는 점에 주목했다”고 말했다. 그는 또 “과연 얼마나 빠르게 이미지를 생성할 수 있을지, 수많은 동시 접속자들을 무리 없이 감당할 수 있을지에 대한 기술적 호기심에서 직접 실험해보고자 만들게 됐다”고 설명했다. GPT-4o는 텍스트, 음성, 이미지 등 다양한 입력을 실시간으로 처리할 수 있는 멀티모달 AI 모델이다. 기존보다 훨씬 빠르고 정밀한 이미지 생성 능력을 갖추고 있다. 특히 캐릭터 중심의 스타일 변환이나 예술적 스타일 이식 분야에서 가능성을 보여준다. 김정호 교수는 “기술과 예술의 선을 넘나드는 융합 사례들이 연구의 깊이와 폭을 더 넓혀갈 것"으로 기대했다.

2025.04.08 10:52박희범

'尹 탄핵심판' AI에게 물었더니…클로드 "인용 가능성 75%"

헌법재판소의 윤석열 대통령 탄핵심판 선고가 하루 앞으로 다가오면서 긴장이 고조되고 있다. 대한민국 헌정사에 중대한 분기점이 될 판결인 만큼 국내 뿐 아니라 전 세계적으로도 많은 관심이 쏠리고 있다. 3일 지디넷코리아는 클로드 소네트, 딥시크 R1, GPT-4o, 퍼플렉시티, 구글 제미나이 등 대표적인 인공지능(AI) 모델들에게 헌재의 탄핵심판 선고 결과를 어떻게 예측하는지 질문했다. 분석 결과 클로드 소네트가 탄핵 인용 가능성을 75%로 가장 높게 예측했다. 반면 퍼플렉시티는 인용 가능성 35%로 비교적 낮게 판단했다. AI 모델들은 ▲헌법 위반의 중대성 ▲재판관 구성 및 성향 ▲절차적 하자 여부 ▲여론 지형 등 여러 요인들을 기반으로 논리적 전망을 제시했다. 다만 이번 결과는 각 AI 모델이 특정 시점에 입력된 프롬프트와 데이터를 바탕으로 생성한 예측이다. 동일한 모델이라 하더라도 입력값과 조건에 따라 수치는 달라질 수 있다. 클로드 소네트 "헌법 위반 중대성 높고 국민 여론도 강력" 탄핵 인용: 75% 탄핵 기각: 24% 탄핵 각하: 1% 클로드 소네트는 인용 가능성을 가장 높게 제시했다. ▲비상계엄 선포 검토 ▲국회 장악 시도 ▲선관위 장악 기도 ▲불법 체포 지시 등 5가지 탄핵 사유 중 하나만 중대한 위헌으로 인정될 경우 파면이 가능하다는 판단이다. 특히 클로드 소네트는 '5분 국무회의'의 절차적 흠결 증언과 중도층 여론(찬성 70% 이상)이 인용 가능성을 높이는 요인으로 작용한다고 보았다. 딥시크 R1 "재판관 구성상 인용 유력, 다만 절차 변수 주의" 탄핵 인용: 65% 탄핵 기각: 25% 탄핵 각하: 10% 딥시크 R1은 헌재 재판관 8인의 성향(보수 3, 중도 2, 진보 3)에 주목했다. 보수 재판관 일부가 사회적 합의를 고려해 찬성표를 던질 가능성이 있다고 분석했다. 또 국회 탄핵소추 과정에서의 절차적 논란이 각하 논의로 번질 수 있다고 판단했다. GPT-4o "정치적 파장과 실행 여부 사이에서 중립적 시각" 탄핵 인용: 50% 탄핵 기각: 30% 탄핵 각하: 20% GPT-4o는 탄핵 인용과 기각(혹은 각하) 가능성을 같은 것으로 분석했다. 비상계엄은 검토 단계에 머물렀고, 직접적 실행은 없었다는 점에서 "위헌 요소는 있지만 직무상 중대 위반은 아님"이라는 판단 여지가 있다고 보았다. 헌재의 보수적 성향과 국정 안정 고려가 기각에 힘을 실을 수 있고, 절차상 흠결 논란으로 각하 가능성도 20%로 제시했다. 퍼플렉시티 "기각 가능성이 현실적으로 가장 높아" 탄핵 인용: 35% 탄핵 기각: 60% 탄핵 각하: 5% 반면 퍼플렉시티는 재판관 간 의견 분열이 인용 가능성을 낮춘다고 분석했다. 과거 박근혜 탄핵은 만장일치였지만, 이번 사건은 헌법 위반의 중대성 해석에 따라 4:4 구도가 될 가능성이 높다고 평가했다. 또한 정치적 판단보다는 법리적 보수주의가 우세할 경우, 기각이 가장 가능성 높은 시나리오로 작용할 것이라 전망했다. 구글 제미나이 "복잡한 변수 많은 만큼 특정 확률 제시는 부적절" 예측 확률: 제시하지 않음 구글 제미나이는 다른 모델과 달리 탄핵 인용·기각·각하에 대해 특정 확률을 제시하지 않았다. 대신, 각 가능성의 논리적 배경과 영향을 미치는 요인을 깊이 있게 분석했다. 인용 여부는 헌법 위반의 중대성 여부, 과거 판례, 국민 여론의 압력 등이 변수이며, 재판관의 독립적 판단이 결정적일 것으로 예측했다. 반면 계엄 선포와 같은 핵심 행위가 실행에 이르지 않았다는 점에서 '직무상 중대성'을 문제 삼아 기각될 가능성도 제기했다. 더불어 절차적 하자가 심판 대상 자체의 부적합성으로 이어질 경우 기각될 수 있을 것으로 언급했지만 실제 실현 가능성은 낮을 것이라고 전망했다. 다수 AI 모델은 탄핵 인용 가능성을 가장 유력한 시나리오로 판단했으나, 재판관 성향 및 절차적 변수 등 불확실성이 여전히 존재한다. 구글 제미나이처럼 확률을 제시하지 않고 해석 중심으로 접근한 시도는 이번 탄핵심판이 단순 예측을 넘어 법리와 헌정 원칙의 정면 충돌이라는 분석이다.

2025.04.03 16:43남혁우

챗GPT로 영수증 위조도 뚝딱…악용 위험↑

오픈AI가 최신 모델 '챗GPT 4o'에 이미지 생성 기능을 강화하면서 큰 관심을 끌고 있다. 이런 가운데 일부 사용자들이 '챗GPT 4o'로 가짜 영수증을 만드는 사례가 늘어나고 있다고 테크크런치 등 외신들이 31일(현지시간) 보도했다. 보도에 따르면, 이미 많은 사람들이 챗GPT 4o로 가짜 식당 영수증을 만들어 게시하는 챌린지를 소셜 미디어에서 벌이고 있다. 인플루언서 디디 다스(Deedy Das)는 자신의 엑스에 챗GPT 4o를 통해 만든 샌프란시스코의 실제 스테이크하우스 명의의 가짜 영수증 사진을 올렸다. 다른 사람들은 영수증 사진에 음식이나 음료 얼룩을 넣어 진짜처럼 보이게 하거나, 영수증이 살짝 구겨진 효과를 주기도 했다. 하지만, 자세히 보면 인공지능(AI)이 만든 가짜 영수증에는 허점이 있었다. 영수증 합계에 소수점에 사용하는 마침표 대신 쉼표를 사용한 점과 합계 금액의 계산 오류 등이 확인됐다. 이는 대규모 언어모델(LLM)이 기초적인 수학 계산에 어려움을 겪기 때문에 특별히 놀라운 일이 아니라고 테크크런치는 전했다. 하지만 사기꾼이 사진 편집 소프트웨어 등을 이용해 이미지에서 숫자를 고치는 등 편집해 악용하는 것은 어렵지 않을 것으로 보인다. 생성형 AI 기능이 가짜 영수증을 만드는데 악용될 경우, 실제로 지출되지 않은 비용에 대한 허위 청구나 가짜 영수증을 통한 환급 사기가 가능하기 때문에 주의가 필요하다. 이에 대해 타야 크리스티안슨 오픈AI 대변인은 “모든 챗GPT 이미지에는 생성 사실을 명시하는 메타데이터가 포함되어 있다”며, “사용자가 정책을 위반할 경우 조치를 취하고 실제 사용과 피드백에서 항상 학습하고 있다”고 밝혔다. 그는 왜 사용자들이 가짜 영수증을 만들 수 있게 허용하느냐는 질문에 “사용자에게 최대한의 창의적 자유를 보장하는 것이 목표”라며, “금융 교육이나 광고•예술 창작 등 비사기적 목적의 활용 가능성도 고려해야 한다”고 답했다.

2025.04.01 17:08이정현

[유미's 픽] 오픈AI 新 무기 출격에 한숨 쉬는 美 기업, 주가 또 흔들릴까

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 오픈AI·구글·xAI 등 인공지능(AI) 기술을 앞세운 새로운 경쟁자들의 등장으로 위기에 몰렸다. 간단한 프롬프트 입력만으로 전문가 못지 않은 퀄리티의 이미지를 쉽게 만들 수 있는 서비스들이 속속 등장하면서 존재감이 점차 희미해지고 있다는 평가가 나온다. 26일 업계에 따르면 어도비의 최근 1년간 주가는 무려 19.98%나 하락해 오후 4시 45분 현재 403.64달러에 머무르고 있다. 한 때 주가가 597.75달러까지 치솟았으나 경쟁사들의 잇따른 등장과 함께 새로운 성장 동력으로 내세운 AI 비즈니스가 시장에서 큰 호응을 얻고 있지 못한 까닭이다. 앞서 어도비는 지난 2023년 오픈AI가 '챗GPT'를 출시한 직후 AI 사진 편집 시장에 진입하기 위해 '파이어플라이'를 출시했다. 이후 어도비 익스프레스를 비롯한 포토샵, 일러스트레이터, 어도비 스톡 등 크리에이티브 클라우드 앱들에 생성형 AI를 탑재했다. 특히 포토샵에는 '제너레이티브 필(Generative Fill)', 어도비 스톡에서는 '텍스트 투 이미지(Text-to-Image)', 일러스트레이터에는 '제너레이티브 리컬러(Generative Recolor)' 등 AI 기반 기능이 출시됐다. 올해 초에는 파이어플레이 비디오 티어 등 새로운 AI 기반 서비스를 발표해 주목 받았다. 이 서비스는 사용자가 제출한 텍스트나 이미지 기반으로 비디오부터 3D 그래픽, 2D 애니메이션을 생성한다. 이를 시장에 확산시키고자 어도비는 서비스 내 생성형 AI 일부 기능을 무료로 제공하는 등 승부수를 걸었다. 확장 기능이나 상업적 사용을 위해서만 유로 플랜을 서비스에 적용한 상태로, 사용자 기반이 넓어지면 서비스 유료 전환을 순차적으로 유도하려는 전략도 세웠다. 최근에는 AI 에이전트가 접목된 새로운 애플리케이션(앱)인 '브랜드 컨시어지'를 선보여 주목을 받았다. 기존 고객 데이터를 바탕으로 맞춤화된 콘텐츠 등을 추천하는 작업을 수행하는 것으로, 어도비가 AI 에이전트 제품을 선보인 것은 이번이 처음이다. 이 같은 어도비의 노력에도 불구하고 시장 내 반응은 뜨뜻미지근하다. 사용자들은 비용을 지불할 정도로 어도비의 AI 기능들이 가치가 있는지 불확실하다는 평가를 내놓고 있다. 경쟁사들의 기술력이 빠른 속도로 발전하고 있어서다. 실제 오픈소스로 제공되는 미드저니나 오픈AI의 '소라'는 텍스트와 사진 몇장 만으로도 AI 기반 이미지 콘텐츠 제작이 가능하도록 지원하고 있다. 해당 서비스 제공자들은 영상과 오디오, 사진 편집 기능까지 추가할 계획이라고 밝힌 상태다. 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 같은 상황에서 오픈AI가 지난 25일 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation) 모델'을 출시해 발등에 불이 떨어졌다. 맥락과 그리는 대상에 대한 이해도가 한층 더 높아져 이전보다 더 정확한 결과를 내놓을 수 있게 돼서다. 새 모델은 오픈AI의 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이다. '그림'만 학습한 기존 이미지 모델에 GPT-4o 언어 모델이 결합하며 목적에 맞는 이미지를 쉽게 생성할 수 있게 됐다. 이 모델은 현재 유료 구독자들은 물론 무료 사용자들도 이용할 수 있다. 오픈AI는 기존에 '달리(DALL·E)'를 앞세워 이미지 생성 AI 시장에서 존재감을 키워왔다. 이를 사용했을 땐 숫자와 문자가 '그림'으로 해석돼 그려져 삐뚤게 이미지에서 표현됐지만, 새 모델은 언어 모델을 이해한 후 그림을 만들어 내 보다 정확한 결과물을 얻어낼 수 있다. '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 기존 모델은 훈련되지 않은 데이터여서 결과물을 내놓는데 어려움을 겪었지만, 새 모델은 가능해졌다. 동영상 생성 AI인 '소라'에도 새 모델의 언어 이해가 적용돼 더 자연스러운 영상을 만들 수 있게 됐다. 이는 서비스 경쟁력 개선에 나선 오픈AI의 노력의 일환이다. 오픈AI 관계자는 "GPT-4o의 언어 지식과 이미지 지능이 결합된 모델"이라며 "기존 모델이 참신했다면 이 모델은 유용하다"고 설명했다. 오픈AI 외에도 구글은 제미나이에서 '이마젠' 이미지 생성 모델을 제공하고 있다. 중국 딥시크도 '야누스'라는 이름의 이미지 생성 모델을 출시했다. 동영상 생성 AI 시장에선 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 서비스를 선보이며 어도비를 위협하고 있다. RBC 애널리스트 매튜 스완슨은 "어도비가 생성형 AI 제품 로드맵을 잘 따라가고 있지만, 명확한 수익화 지표가 부족한 상태"라며 "투자자들이 어도비 진행 상황을 신뢰하기 어려운 상황"이라고 평가했다. 도이치뱅크 브래드 젤닉 애널리스트 역시 "어도비 경영진은 파이어플라이의 가능성을 강조하고 있지만, 아직 재무적 영향은 확인되지 않았다"고 지적했다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2025.03.26 17:21장유미

오픈AI, 'o1-프로' 출시…역대 최고가 AI 모델 선보여

오픈AI가 인공지능(AI) 추론 모델 'o1'의 VIP 개발자 전용 모델을 공개했다. 기존 모델보다 연산량을 늘려 더 깊이 사고할 수 있도록 했지만 가격도 역대 최고 수준으로 책정돼 주목 받고 있다. 20일 테크크런치 등 외신에 따르면 오픈AI는 회사의 공식 개발자 플랫폼인 '오픈AI 플랫폼'을 통해 프로그래머를 위한 'o1-프로' 모델을 선보였다. 지난해 9월 출시된 'o1' 모델보다 연산을 더 많이 사용해 보다 정교한 답변을 제공하는 것이 목표로, 현재는 애플리케이션 프로그램 인터페이스(API) 서비스에서 최소 5달러 이상을 지출한 일부 개발자에게만 제공된다. 가격은 파격적이다. 'o1-프로'의 입력 비용은 100만 토큰(약 75만 단어)당 150달러(한화 21만원)로, 출력 비용은 600달러(한화 84만원)에 달한다. 이는 오픈AI의 대표 모델 'GPT-4.5'보다 입력 비용이 2배, 기존 'o1' 모델보다 출력 비용이 10배 비싸다. 오픈AI는 높은 가격에도 불구하고 'o1-프로'의 성능 개선이 충분한 가치를 제공할 것이라고 보고 있다. 회사 측 주장에 따르면 이 모델은 기존보다 더 많은 연산을 통해 더 깊게 사고하며 가장 어려운 문제에서도 더 나은 답변을 제공한다. 다만 시장 반응은 미지수다. 'o1-프로'는 지난 12월부터 '챗GPT 프로'에 탑재돼 일부 사용자가 경험해봤지만 성능 개선 효과에 대한 평가가 엇갈린다. 특히 스도쿠 문제를 풀지 못하거나 착시 유머에 속는 등 한계를 보였다. 내부 테스트에서도 기대만큼의 차이를 보이지 못했다. 오픈AI가 지난해 말 공개한 자체 벤치마크 결과에 따르면 'o1-프로'는 코딩 및 수학 문제에서 기본 'o1'보다 다소 나은 성능을 보였지만 획기적인 차이는 아니었다. 그러나 답변의 일관성과 신뢰성이 향상됐다는 점이 강점으로 꼽혔다. 오픈AI 관계자는 "'o1-프로'는 'o1'보다 많은 연산을 사용해 더 깊게 사고하고 가장 어려운 문제에 대해 더 나은 답변을 제공하는 모델"이라며 "개발자 커뮤니티로부터 많은 요청을 받아 API에 추가하게 됐으며 보다 신뢰할 수 있는 응답을 제공하기 위해 노력하고 있다"고 밝혔다.

2025.03.20 11:05조이환

오픈AI CRO, 장병탁 원장 만나…"AI 모델 추론·견고함에 집중"

"인공지능(AI) 모델의 추론 능력과 견고함은 일반인공지능(AGI) 시대 필수 요소입니다. 그래야 기술 발전과 모델 안전성까지 지킬 수 있습니다. 오픈AI는 두 부분에 가장 큰 투자를 하고 있습니다. 이런 투자로 GPT-o1과 o3를 출시했습니다." 오픈AI 마크 첸 최고연구책임자(CRO)는 4일 서울대 해동첨단공학관에서 학교 산하 AI 연구원(AIIS)이 주최하는 'Q&A 위드 오픈AI'에서 이같이 밝혔다. 첸 CRO는 6년 동안 오픈AI에서 근무했다. 최근 출시된 o1과 o3 개발을 주도한 인물로 알려져 있다. 첸 CRO은 서울대 학생들과 오픈AI의 최신 모델 특장점과 AI 안전성, AGI 핵심 요소 등을 논의했다. 이날 사회는 장병탁 AIIS 원장이 맡았다. AIIS는 저출산·고령화 시대에 대응할 수 있는 AGI 원천 기술을 개발 중인 AI 연구기관이다. 연구원 약 3천명이 AIIS에서 근무하고 있다. 첸 CRO는 AGI 전망에 대한 견해를 밝혔다. AGI를 어떤 관점에서 보느냐에 따라 전망은 제각각일 것이라고 주장했다. 우선 경제적 관점에서 봤을 때 현재 AGI 시대 초기에 접어들었다고 했다. 그는 "오픈AI 제품이 우수한 경제적 가치를 제공하고 있다"며 "경제적 관점에서 AGI는 이미 진행 중"이라고 덧붙였다. 첸 CRO는 기술적으로도 AGI 시대에 가까워지고 있다고 밝혔다. 모델이 지능을 수치화한 벤치마크에서 과거에 비해 우수한 성과를 내고 있다는 것을 근거로 들었다. 그는 "몇 년 전까지만 해도 AI 모델 주요 미션은 초등학생 수학 문제를 푸는 것에 불과"했다며 "현재는 박사 수준의 문제를 이미 해결한 상태"라고 설명했다. 그러면서 "앞으로 개발될 모델 수준은 상상 이상일 것"이라고 내다봤다. 첸 CRO는 오픈AI의 다음 스텝에 대해 언급했다. 기술적으로 모델 견고성과 추론에 가장 큰 투자를 하고 있다고 밝혔다. 모델이 AGI 시대에 살아남으려면 추론 능력과 견고성을 핵심 요소로 갖춰야한다는 판단에서다. 그는 "현재 사람이 AI 에이전트 시스템에 의존할 수 없는 이유는 이 기술을 충분히 신뢰하지 못하기 때문"이라며 "이를 극복하려면 모델에 견고성과 높은 추론성을 갖춘 자율 시스템을 탑재해야 한다"고 밝혔다. 그러면서 "모델이 견고하고 추론성이 높으면 안전성까지 잡을 수 있다고" 덧붙였다. "o1·o3로 모델 신뢰성 이미 검증…안전한 AI 개발 집중할 것" 첸 CRO는 이런 투자를 통해 얻은 주요 성과로 GPT-o1과 o3를 예시로 들었다. o1은 지난해 11월, o3는 지난달 공개된 오픈AI 추론 모델이다. 그는 "모델 출시 후 기능을 개선했다는 피드백을 받았지만 근본적으로 안전성도 높였다"며 "개인적으로는 안전성에서 가장 놀라움을 느꼈다"고 말했다. 그는 두 모델과 이전 GPT 시스템 차이점을 설명했다. 이전 시스템은 사용자 명령어에 즉시 응답하는 식으로 텍스트와 이미지를 생성했다. 환각현상 위험성에 노출되기 쉬운 상태였다. GPT를 악용해 사이버 범죄 저지르기도 비교적 수월했다. 반면 o1과 o3는 자기반성이 가능한 인지 기능을 갖췄다. 이전 시스템과 달리 스스로 생각할 수 있는 시간도 가질 수 있는 이유다. 응답은 상대적으로 느려도 전보다 정확한 답변을 낼 수 있다. 사이버 공격이나 비윤리적 명령어를 차단할 수 있는 능력이 업그레이드된 셈이다. 첸 CRO는 오픈AI 모델은 여전히 갈 길이 멀다고 말했다. 100% 안전성을 보장할 수 없다는 설명이다. 그는 "현재 내부적으로 레드팀 등 안전을 담당하는 부서에 꾸준한 기술적 투자를 진행하고 있다"며 "기술뿐 아니라 안전성 향상에도 집중할 것"이라고 덧붙였다.

2025.02.04 14:26김미정

"더 빠르고 저렴하게"…오픈AI, 'o3-미니' 전격 출시

딥시크발 인공지능(AI) 쇼크가 확산되는 가운데 오픈AI가 새로운 추론 모델 'o3-미니'를 공개해 AI 경쟁에 불을 지폈다. 2일 테크크런치에 따르면 오픈AI는 지난 31일 자사의 'o' 계열 테스트타임 컴퓨팅 추론 모델 중 최신 버전인 'o3-미니'를 공식 출시했다. 이 모델은 프로그래밍, 수학, 과학 등 기술적 문제 해결에 특화돼 있으며 기존 모델 대비 속도와 비용 효율성이 개선됐다. 오픈AI는 지난해 12월 기술 공개 행사를 통해 'o3' 모델과 함께 'o3-미니'의 벤치마크 성능을 처음 공개한 바 있다. 당시 'o3'는 기존 모델과 달리 스스로 사실 검증을 수행해 오류를 줄이며 프로그래밍, 수학, 과학 등의 난이도 있는 분야에서 신뢰할 수 있는 답변을 제공하는 모습을 보였다. 회사에 따르면 이번에 출시된 'o3-미니'는 기존 'o1' 및 'o1-미니' 모델과 비교해 유사한 성능을 유지하면서도 응답 속도가 24% 더 빠르고 가격은 63% 더 저렴하다. 외부 테스트 결과 사용자의 절반 이상이 'o1-미니'보다 'o3-미니'의 답변을 선호했으며 실제 복잡한 문제 해결 시 주요 오류 발생이 39% 감소한 것으로 나타났다. 이번 출시를 통해 일반 사용자는 '챗GPT'에서 o3-mini를 사용할 수 있으며 유료 플랜 이용자는 추가적인 쿼리 한도를 부여받는다. '챗GPT' 플러스 및 팀 플랜 사용자는 하루 150회까지 이용 가능하며 프로 사용자에게는 무제한 액세스가 제공된다. 개발자들은 오픈AI 애플리케이션 프로그램 인터페이스(API)를 통해 'o3-미니'를 선택적으로 사용할 수 있지만 초기에는 이미지 분석 기능이 포함되지 않는다. API에서는 사용자가 '낮음, 중간, 높음' 중 적절한 추론 강도를 선택해 모델이 생각하는 깊이를 조절할 수 있다. 기본적으로는 '중간' 강도로 설정돼 있으며 유료 사용자는 이를 '높음' 강도로 변경할 수 있다. 가격은 입력 토큰 100만 개당 0.55달러(한화 약 700원), 출력 토큰 100만 개당 4.40달러(한화 약 6천원)로 책정됐다. 오픈AI에 따르면 이는 중국 AI 기업 딥시크(DeepSeek)의 'R1' 모델의 출력 토큰 단가인 경쟁력 있는 가격이다. 다만 'o3-미니'가 모든 AI 모델을 뛰어넘는 것은 아니다. 딥시크 'R1' 모델과 비교하면 특정 벤치마크에서는 우위를 점하지만 다른 부문에서는 근소한 차이를 보인다. 예를 들어 'o3-미니'는 'AIME 2024' 벤치마크에서는 'R1'을 앞섰으나 박사 수준 과학 문제 해결 테스트인 'GPQA 다이아몬드'에서는 낮은 추론 강도 설정 시 'R1'보다 낮은 점수를 기록했다. 오픈AI는 공식 블로그를 통해 "'o3-미니'는 'o1' 대비 동등한 성능을 갖추면서도 응답 속도와 비용 면에서 더욱 효율적"이라며 "특히 높은 추론 강도 설정에서는 'o1-미니'와 'o1'을 모두 뛰어넘는 성능을 보인다"고 밝혔다.

2025.02.02 08:50조이환

"10분의1 가성비"…中 AI '딥시크'에 업계 긴장

중국 스타트업 딥시크가 출시한 생성 인공지능(AI) 모델이 일부 분야에서 오픈AI의 성능을 제쳤다고 밝히면서 관심을 모으고 있다. 특히 메타 등 실리콘 빅테크 기업들이 생성AI 개발에 투입한 비용 대비 10분의1 수준의 개발비만 들인 것으로 알려져 업계가 긴장하는 모습이다. 최근 뉴욕타임스, 테크크런치 등 외신들은 딥시크가 우수한 성능을 보여주면서, 빅테크 업계 긴장감이 높아졌다고 보도했다. 딥시크는 지난달 '딥시크-V3'을 출시한 데 이어 지난 20일 추론 특화 모델로 '딥시크-R1'을 출시하고 기술 보고서를 공개했다. 기술 보고서에 따르면 딥시크 R1은 일부 테스트에서 오픈AI의 추론 특화 모델 'o1'보다 나은 성능을 보였다. 미국 수학경시대회 벤치마크(성능 측정 기준) 테스트 결과 R1은 79.8%로 나타나 79.2%를 획득한 o1을 앞섰다. 코딩 테스트 정확도도 딥시크 R1은 65.9%, o1은 63.4%로 평가됐다. 딥시크는 사전 연구와 실험을 제외하고 모델 훈련에 투입한 비용이 557만6천달러(약 80억원)에 불과하다고 밝혔다. 이는 메타가 AI 개발에 투입한 비용의 10분의 1 수준이다. 딥시크가 엔비디아 'H800' 칩을 사용해 생성AI를 개발하고 있다는 점에서도 주목을 받았다. H800은 엔비디아가 지난 2022년 미국 정부의 수출 통제 조치가 도입됨에 따라 중국 수출 목적으로 개발한 저사양 칩이다. 빅테크보다 성능이 더 좋지 않은 하드웨어를 사용해 경쟁력 있는 AI 모델을 만든 것이다. 딥시크-R1의 경우 H800 2천48개를 사용해 개발됐다. 사용자 단에서도 딥시크에 대한 관심이 고조됐다. 26일(미국시간) 비지니스인사이더는 딥시크 R1가 애플 앱스토어의 무료 앱 분야 다운로드 1위를 차지했다고 보도했다. 오픈AI '챗GPT'는 2위로 나타났다.

2025.01.27 15:42김윤희

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

또 유찰된 국가 AI컴퓨팅센터…업계 "불확실·비현실적 사업 구조 개선해야"

"애플도 비중 100% 달성"…스마트폰용 OLED 채택률 꾸준히 확대

롤스로이스급 전기차 '셀레스틱' 만들어지는 곳…韓 최초 찾은 '캐딜락하우스'

[AI는 지금] "인터넷의 여왕, AI 공인했다"…메리 미커, 5년 만에 트렌드 리포트 발표

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현