• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'O'통합검색 결과 입니다. (66건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[AI는 지금] 美·中선 추론이 대세인데…전 세계 세 번째 LLM 개발국 韓 현 주소는?

인공지능(AI) 시장 경쟁이 추론 모델로 옮겨진 가운데 우리나라의 경쟁력이 갈수록 뒤처지고 있다는 평가가 나왔다. 전 세계에서 세 번째로 거대언어모델(LLM)을 개발하고도 여야 정쟁 속에 제대로 된 정부 지원과 기업들의 노력이 뒷받침되지 않으면서 시장 내 주도권을 잃어가고 있다는 평가다. 5일 업계에 따르면 현재 우리나라에서 추론 특화 AI 개발에 성공한 곳은 LG AI연구원이 거의 유일하다. 지난 2월 공개한 '엑사원 딥'은 국내 첫 추론형 AI 모델로, 주어진 데이터를 기반으로 확률이 높은 답을 내놓는 생성형 AI와 달리 스스로 정보를 조합하고 분석한다는 점에서 한층 고도화된 AI로 평가받는다. 최고 모델인 '엑사원 딥' 32B의 파라미터(매개변수)는 중국 AI 스타트업 딥시크의 'R1' 671B 모델의 5% 수준이었음에도 수학과 같은 일부 분야 테스트에서 R1을 앞서는 등 효율적인 모델이란 점도 입증해 업계의 주목을 받았다. 경량 모델 '엑사원 딥' 7.8B는 비슷한 크기의 오픈AI의 'o1 미니'보다 우수한 성적을 기록하기도 했다. 하지만 '엑사원'은 LG 내부에서만 사용할 수 있다는 점에서 범용성에 한계가 있다. 이를 상업 목적으로 이용하기 위해서는 LG AI 연구원의 허락을 받아야 하거나 한컴, 폴라리스 등 일부 업체들처럼 유료 계약을 맺어야 한다. 또 모델 공개를 위해선 출자를 통해 개발에 기여한 계열사들간 논의도 필요한 상황이다. 이에 '엑사원 딥'은 우수한 성능을 가지고 있음에도 중국 딥시크가 가진 모델처럼 빠르게 확산되지는 못하고 있다. 지난 2021년 세계에서 세 번째로 LLM '하이퍼클로바X'를 공개했던 네이버는 여전히 추론 모델을 내놓지 못하고 있다. 지난 달 23일 기자간담회를 통해 올 상반기 안에 신규 추론 모델을 선보일 것이라고 공언했으나, 국내외 경쟁사들이 기술 개발에 속도를 내며 이미 공개한 것에 비하면 대응이 상당히 저조한 편이다. 이 외에 업스테이지 등 다른 국내 기업들도 조만간 추론 모델을 선보일 것이란 계획을 세워둔 상태다. 반면 미국, 중국 기업들은 이미 한 발 앞서 추론 모델을 공개해 경쟁에 불을 지폈다. '챗GPT' 개발사인 미국 오픈AI는 최근 이용자 질문에 추론하는 것을 넘어 이미지를 보고 생각할 수 있는 새로운 추론 모델 'o3'와 소형 모델인 'o4 미니'까지 출시했다. 이는 지난 해 9월 출시된 오픈AI의 첫 번째 추론 모델 'o1'의 후속 모델이다. 'o3'는 이미 지능지수(IQ)가 130을 돌파했다는 주장까지 나오면서 경쟁력도 인정 받은 분위기다. AI 모델들의 IQ 시험 결과를 공개하는 트래킹에이아이닷컴은 최근 오픈AI 'o3'가 멘사 노르웨이 IQ 시험을 본 결과 IQ 132를 기록했다고 밝혔다. 이 시험은 온라인에서 비공식적으로 IQ를 측정하는 방법으로 주로 시각적 패턴 인식 능력을 평가한다. 이 시험에서 구글의 '제미나이 2.5 프로 익스페리멘털'도 IQ가 127을 기록하며 선전했다. 지난 3월 출시된 '제미나이 2.5 프로'도 추론 모델로, 구글은 이 모델이 AI 성능 평가 벤치마크인 LM아레나에서 오픈AI 모델을 상당한 격차로 제치고 1위에 올랐다고 강조한 바 있다. 또 지난 달에는 '구글 클라우드 넥스트 2025' 행사를 통해 전작 대비 응답지연 시간과 연산비용을 절약한 '제미나이 2.5 플래시'도 공개하며 시장 주도권 잡기에 혈안된 모습을 보였다. 순다르 피차이 구글 최고경영자(CEO)는 "제미나이 2.5 플래시를 사용하면 모델 추론의 정도를 제어하고 예산과 성능의 균형을 맞출 수 있다"고 설명했다. 미국 앤트로픽이 올해 2월 내놓은 추론 모델 '클로드 3.7 소네트 확장형'도 업계에서 주목 받는 모델이다. 이 모델을 통해 사용자는 기존의 LLM을 활용했을 때처럼 즉각적인 응답을 받을 수도 있고 AI가 보다 깊이 사고하도록 추론을 하게 명령할 수도 있다. 이 모델은 '소프트웨어 엔지니어링(Bench SWE)' 벤치마크 테스트에서 62.3% 정확도를 기록해 오픈AI의 'o3-미니'보다 높은 성능을 보였다. '딥시크 쇼크'로 전 세계 AI 업계를 놀래켰던 중국에서도 최근 추론 모델 공개가 한창이다. 딥시크가 올해 1월 추론용 AI 모델 'R1'을 공개한 후 알리바바 그룹이 하이브리드 추론 기능을 도입한 플래그십 AI 모델 '큐원3(Qwen3)'를 출시했고, 바이두도 멀티모달 기능을 갖춘 '어니 4.5 터보'와 추론에 중점을 둔 '어니 X1 터보'를 출시하며 경쟁에 합류했다. 바이두는 해당 모델이 오픈AI의 'o1' 등 경쟁 모델 대비 동급 성능에 비용은 딥시크보다 저렴하다는 점을 강조하고 있다. 샤오미도 지난 달 말 '딥시크 R1'과 유사한 추론 AI 모델 '미모(MiMo)'를 선보이며 경쟁에 합류했다. 미모는 70억 개의 매개변수를 보유하고 있는 것으로 알려졌다. 샤오미는 자체 테스트에서 '미모'가 오픈AI의 'o1-미니'와 알리바바 '큐원'을 뛰어넘었다고 주장하고 있다. 이를 통해 샤오미는 인간 수준의 지능을 갖춘 인공일반지능(AGI) 개발에 박차를 가한다는 각오다. 샤오미는 위챗 게시물에서 "미모는 새로 구성된 핵심 AI 모델 팀의 첫 시도"라며 "2025년이 대규모 모델 구축의 꿈을 실현하기에는 늦은 시기처럼 보일 수 있지만 AGI는 장기적 과제"라고 말했다. 이처럼 미국의 AI 기술을 중국이 급속도로 추격하고 나선 가운데 업계에선 추론 역량을 핵심 경쟁력으로 내세운 신형 오픈소스 모델들이 글로벌 AI 생태계 전반에 지대한 영향을 미칠 것으로 봤다. 하지만 국내에선 LG 외에 뚜렷한 움직임이 없어 AI 기술 주도권 싸움에서 이미 상당히 밀렸다는 평가가 나오고 있다. 업계 관계자는 "미국과 중국 기업들 사이에서 벌어지고 있는 '쩐의 전쟁'에서 한국 AI 기업들이 점차 밀리며 정부 지원에만 목을 메는 경향이 많았다"며 "열악한 투자 환경에도 불구하고 선전하는 기업이 있긴 하지만, 자체 AI 기술을 계속 개발하려는 노력이 예전보다 덜한 곳이 있었던 것도 사실"이라고 꼬집었다. 그러면서 "대통령 비상계엄 선포와 탄핵 등 정치적 혼란까지 더해지면서 정부의 정책 방향이 일관되지 않았던 것도 우리나라 AI 경쟁력이 뒤처지게 된 원인"이라며 "새 정부가 들어서면 AI를 국가 경쟁력의 핵심 동력으로 삼고 적극적으로 정부가 지원에 나서야겠지만, 기업들의 자체적인 기술 개발에 대한 노력도 함께 병행돼야 할 것"이라고 덧붙였다.

2025.05.05 08:17장유미

구글, I/O 행사 앞두고 안드로이드 행사 별도로 연다

구글이 오는 5월 20일(현지사간) 열리는 연례 개발자 회의 '구글 I/O 2025' 행사에 앞서 온라인 행사 '안드로이드 쇼: I/O 에디션'을 개최한다고 엔가젯 등 외신들이 28일 보도했다. '안드로이드 쇼: I/O 에디션'은 오는 5월 13일 개최된다. 구글이 I/O 행사 전에 별도 쇼케이스를 개최하는 것은 이번이 처음이다. 구글은 "안드로이드와 관련해 공유할 새로운 소식이 너무 많아 이 행사를 마련하게 됐다"고 설명했다. 이 행사에는 사미르 사맛(Sameer Samat) 안드로이드 에코시스템 부문 사장이 참석할 예정이어서 안드로이드의 미래에 대해 자세히 살펴볼 수 있을 전망이다. 안드로이드 쇼 행사에서 가장 관심을 끄는 것은 '안드로이드16' 관련 소식이다. 그 밖에도 웨어OS 6을 비롯해 구글 맵, 서클투서치, 제미나이 등의 구글 서비스와 연동되는 소프트웨어 관련 소식을 만나볼 수 있을 전망이다. 이번 쇼케이스 뿐 아니라 다음 달 20일 개최되는 구글 I/O 2025 행사에서도 안드로이드 관련 기조연설이 여러 번 예정되어 있다. 하지만, I/O 행사를 앞두고 구글이 별도의 온라인 행사를 연다는 것은 올해 구글 I/O의 주인공이 인공지능(AI) 기술이 될 수 있다는 것을 의미한다고 외신들은 전했다.

2025.04.29 14:45이정현

오픈AI, 기술적 한계 왔나…'o3' 등 최신 추론 AI 모델 '환각' 더 심해져

최근 새로운 인공지능(AI) 모델을 선보인 오픈AI가 할루시네이션(환각·왜곡) 현상을 해결하지 못하며 기술적 한계를 드러내고 있다. 20일 테크크런치 등 주요 외신에 따르면 오픈AI는 사람에 대한 모델의 지식 정확도를 측정하는 사내 벤치마크인 퍼슨(Person) QA에서 'o3'가 33%의 질문에 대해 환각을 일으킨다는 사실을 발견했다. 이는 각각 16%와 14.8%를 기록한 오픈AI의 이전 추론 모델인 'o1'과 'o3-미니' 대비 2배 이상 높은 것이다. 'o4-미니'는 무려 48%로, 더 낮은 성적을 기록했다. 또 'o3'와 'o4-미니'는 심지어 오픈AI의 비추론 모델인 'GPT-4o'보다도 더 자주 환각에 빠지는 것으로 드러났다. 오픈AI는 그동안 새 모델을 내놓을 때마다 환각 문제에 대해 꾸준히 개선된 결과를 내놨다. 그러나 이번에는 그렇지 못한 데다 "더 많은 연구가 필요하다"며 정확한 이유를 밝히기를 꺼렸다. 'o3' 및 'o4-미니' 관련 기술보고서에선 "전반적으로 더 많은 주장을 한다"며 "더 정확한 주장뿐만 아니라 더 부정확하거나 왜곡된 주장을 하게 된다"고 밝혔다. 앞서 오픈AI는 지난 16일 "이미지로 생각하고 판단할 수 있는 첫 번째 모델"이라는 설명과 함께 'o3'와 'o4-미니'를 출시했다. 단순히 이미지를 보는 것뿐 아니라 시각 정보를 추론 과정에서 직접 통합할 수 있다고 설명하며 자신감을 드러내기도 했다. 오픈AI에 따르면 사용자가 'o3'와 'o4-미니'에 화이트보드 스케치, PDF 다이어그램처럼 다양한 이미지를 업로드하면 모델은 이를 분석한 뒤 사고 흐름을 구성해 응답한다. 흐릿하거나 저해상도 이미지도 인식 가능해 시각 정보 기반 질문에도 안정적인 추론을 이어간다. 하지만 환각 현상이 심하면 기존 모델들보다 활용성이 떨어질 것이란 시각이 지배적이다. 비영리 AI연구소 트랜슬루스(Transluce)는 'o3'가 답변 도출 과정에서 자신이 취한 행동에 대해 짜맞추는 경향을 테스트를 통해 발견한 바 있다. 업계에선 이번 일을 두고 향후 추론형 모델의 신뢰성에 대한 의구심을 키우는 상황으로 이어질 수 있다고 보고 있다. 특히 세무나 회계, 법조계처럼 답변의 정확성이 다른 업종보다 중요한 분야에서는 환각 이슈가 해결되지 않을 경우 추론형 AI의 사용이 어려워질 가능성이 크다. 이에 대해 오픈AI 측은 "모든 모델에서 할루시네이션 문제를 해결하는 것은 지속적인 연구 분야"라며 "정확성과 신뢰성을 개선하기 위해 지속적으로 노력하고 있다"고 말했다.

2025.04.20 12:25장유미

"이미지도 읽고 명령 없이 도구 쓴다"…오픈AI, 스스로 판단하는 'o3·o4' 출시

오픈AI가 스스로 사고하고 판단하는 인공지능(AI) 모델 'o' 시리즈를 업데이트하며 이미지 인식·도구 자동 활용 기능을 통합했다. AI가 사용자 지시 없이 웹 검색이나 코드 실행을 수행하고 저해상도 이미지도 해석하게 해 기술 경쟁 속 리더십 확보에 나선 것이다. 오픈AI는 'o3', 'o4-미니', 'o4-미니-하이' 모델을 '챗GPT'에 연동했다고 17일 밝혔다. 해당 모델들은 프로, 플러스, 팀 요금제 유료 구독자에게 우선 제공되며 도구 사용 환경에서는 자동 호출 기능이 기본으로 적용된다. 이번 신모델들은 코딩, 수학, 과학, 추론 등 전 영역에서 기존 모델보다 성능이 크게 향상된 것으로 평가된다. 특히 오픈소스 문제를 힌트 없이 해결해야 하는 고난도 벤치마크인 'SWE-벤치 베리파이드'에서 'o3'는 69.1%, 'o4-미니'는 68.1%를 기록해 기존에 49.3%를 기록한 'o3-미니' 큰 폭으로 앞질렀다. 경쟁사 가운데서는 앤트로픽의 '클로드 3.7 소넷'이 62.3%로 뒤를 이었다. 알고리즘 기반 코딩 대회 플랫폼인 코드포스 평가에서도 'o3'와 'o4-미니'는 각각 2천706점, 2천719점의 최상위권 점수를 기록해 2천73점을 기록한 'o3-미니'와 1천891점을 기록한 'o1'을 앞섰다. 이 점수는 실제 인간 참가자 기준으로도 상위 1%에 해당하는 실력으로, 두 모델 모두 복잡한 알고리즘 문제를 실전처럼 해결할 수 있는 수준에 도달했음을 의미한다. 시각적 이해 기능도 대폭 강화됐다. 사용자가 화이트보드 스케치, PDF 다이어그램처럼 다양한 이미지를 업로드하면 모델은 이를 분석한 뒤 사고 흐름을 구성해 응답한다. 흐릿하거나 저해상도 이미지도 인식 가능해 시각 정보 기반 질문에도 안정적인 추론을 이어간다. 추론 과정에서 모델은 코드 작성, 웹 검색, 이미지 생성 등 다양한 도구를 자동으로 불러와 응답을 생성한다. 이 도구들은 '챗GPT'의 전용 브라우저 환경인 '캔버스' 내에서 작동하며 사용자가 따로 명령하지 않아도 모델이 스스로 판단해 필요한 기능을 호출하는 구조다. 이는 최초의 추론 전용 모델이었던 'o1'에서는 구현되지 않았던 기능으로, 도구 활용 범위와 자율성이 크게 확장된 셈이다. 세 모델은 오픈AI의 응답 생성 애플리케이션 프로그램 인터페이스(API)인 '채팅 완성 API(Chat Completions API)'와 '응답 API(Responses API)'를 통해서도 제공된다. 개발자는 이들 모델을 사용량 기반 요금제로 앱에 통합할 수 있으며 입력 토큰 백만 개당 요금은 'o3'가 10달러(한화 약 1만4천원), 'o4-미니'는 'o3-미니'와 동일한 1.10달러(한화 약 1천540원)로 책정돼 있다. 업계에선 이번 발표를 오픈AI의 전략 전환으로 평가한다. 당초 CEO 샘 알트먼은 'o3'를 출시하지 않겠다는 입장을 밝혔지만 경쟁사 모델들의 추격이 거세지자 입장을 바꿔 실제 제품에 적용했다는 평가다. 향후엔 더 강력한 'o3-프로'도 출시가 예고돼 있다. 이는 'GPT-5'와의 통합 전에 ChatGPT에 적용될 마지막 독립 추론 모델로 더 많은 연산 자원을 활용해 정밀한 결과를 제공할 예정일 것으로 알려졌다. 사전 테스트에 참여한 전문가들은 'o3'를 '가장 똑똑하고 신뢰할 수 있는 모델'이라며 극찬했다. 의학 연구자인 데리야 우누트마즈 박사는 "오픈AI 'o3'는 마치 지능이 천재 수준에 도달한 느낌으로, 복잡한 고차원 작업도 거침없이 처리하고 언제나 정교하고 정확한 응답을 준다"며 "이건 단순한 기술 업데이트가 아니라 명백한 게임 체인저"라고 강조했다.

2025.04.17 09:43조이환

"지브리 다음은 바비"...계속되는 챗GPT-4o 이미지 생성 열풍

오픈AI가 출시한 'GPT-4o 이미지 생성' 기능이 '지브리 화풍'으로 전 세계를 강타한 가운데 최근에는 사진 속 인물을 바비인형 피규어처럼 바꿔주는 바비박스 챌린지가 주목받고 있다. IT매체 폰아레나는 15일(현지시간) 최근 틱톡 사용자들이 '#BarbieBoxChallenge'라는 해시태그를 달아 사진 속 인물을 바비인형 피규어처럼 바꿔준 사진을 올려 주목을 받고 있다고 보도했다. 사진 속 인물을 바비인형처럼 만드는 방법도 선풍적인 인기를 끌었던 지브리풍 이미지 변환과 다르지 않다. 먼저 챗GPT에 가서 바비인형 피규어로 바꿀 전신 사진을 업로드 한 후 인형 박스의 포장재, 액세서리, 배경 색상 등을 상세하게 입력하면 된다. 폰아레나는 이를 통해 사진 속 인물을 바비인형 피규어 상자로 만들기 위해 프롬프트 입력에 1분, 챗GPT가 이를 통해 이미지를 만들어내는 데까지 몇 분 걸렸다고 밝혔다. 챗GPT가 만든 처음 이미지를 나중에 수정하지 않을 정도로 꽤 멋진 결과물이 나왔다고 해당 매체는 평가했다.

2025.04.16 13:47이정현

봄바람 타고 KAIST에도 '지브리' 유행하나

지브리 유행이 봄바람을 타고, KAIST 캠퍼스에도 불어 닥쳤다. 최근 KAIST 김정호 교수 연구실(테라랩) 김혜연 연구생(박사과정)이 연구실 홈페이지에 생성형 AI 모델인 GPT-4o를 활용해 지브리 애니메이션 스타일의 이미지를 구현하는 등 다양한 영상 콘텐츠를 공개했다. 김혜연 연구생은 오픈AI가 최근 발표한 다중모달 AI 모델 GPT-4o의 이미지 생성 기능을 적극 활용했다. 테라랩 책임자인 김정호 교수의 상반신 사진과 연구실 단체 사진 등을 '지브리풍'으로 변환했다. 김 교수의 상반신 이미지는 도라에몽, 디즈니, 스누피, 짱구 등 서로 다른 네 가지 스타일로 재미있게 변환됐다. 각 스타일의 고유한 분위기와 그림체가 뚜렷하게 반영돼, 동일한 인물을 전혀 다른 캐릭터처럼 보여주는 것이 특징이다. 따뜻한 색감과 섬세한 표현 덕분에 각 스타일의 매력을 생생하게 느낄 수 있다. 김정호 교수는 고대역폭 메모리(HBM) 분야 세계적인 석학이다. 반도체 및 AI 분야에서 활발히 활동 중이다. 김혜연 연구생은 “AI 반도체 연구자로서 생성형 AI 모델을 추론하는 데, 특히 언어를 넘어 이미지를 생성하는 과정에서는 막대한 컴퓨팅 파워가 요구된다는 점에 주목했다”고 말했다. 그는 또 “과연 얼마나 빠르게 이미지를 생성할 수 있을지, 수많은 동시 접속자들을 무리 없이 감당할 수 있을지에 대한 기술적 호기심에서 직접 실험해보고자 만들게 됐다”고 설명했다. GPT-4o는 텍스트, 음성, 이미지 등 다양한 입력을 실시간으로 처리할 수 있는 멀티모달 AI 모델이다. 기존보다 훨씬 빠르고 정밀한 이미지 생성 능력을 갖추고 있다. 특히 캐릭터 중심의 스타일 변환이나 예술적 스타일 이식 분야에서 가능성을 보여준다. 김정호 교수는 “기술과 예술의 선을 넘나드는 융합 사례들이 연구의 깊이와 폭을 더 넓혀갈 것"으로 기대했다.

2025.04.08 10:52박희범

'尹 탄핵심판' AI에게 물었더니…클로드 "인용 가능성 75%"

헌법재판소의 윤석열 대통령 탄핵심판 선고가 하루 앞으로 다가오면서 긴장이 고조되고 있다. 대한민국 헌정사에 중대한 분기점이 될 판결인 만큼 국내 뿐 아니라 전 세계적으로도 많은 관심이 쏠리고 있다. 3일 지디넷코리아는 클로드 소네트, 딥시크 R1, GPT-4o, 퍼플렉시티, 구글 제미나이 등 대표적인 인공지능(AI) 모델들에게 헌재의 탄핵심판 선고 결과를 어떻게 예측하는지 질문했다. 분석 결과 클로드 소네트가 탄핵 인용 가능성을 75%로 가장 높게 예측했다. 반면 퍼플렉시티는 인용 가능성 35%로 비교적 낮게 판단했다. AI 모델들은 ▲헌법 위반의 중대성 ▲재판관 구성 및 성향 ▲절차적 하자 여부 ▲여론 지형 등 여러 요인들을 기반으로 논리적 전망을 제시했다. 다만 이번 결과는 각 AI 모델이 특정 시점에 입력된 프롬프트와 데이터를 바탕으로 생성한 예측이다. 동일한 모델이라 하더라도 입력값과 조건에 따라 수치는 달라질 수 있다. 클로드 소네트 "헌법 위반 중대성 높고 국민 여론도 강력" 탄핵 인용: 75% 탄핵 기각: 24% 탄핵 각하: 1% 클로드 소네트는 인용 가능성을 가장 높게 제시했다. ▲비상계엄 선포 검토 ▲국회 장악 시도 ▲선관위 장악 기도 ▲불법 체포 지시 등 5가지 탄핵 사유 중 하나만 중대한 위헌으로 인정될 경우 파면이 가능하다는 판단이다. 특히 클로드 소네트는 '5분 국무회의'의 절차적 흠결 증언과 중도층 여론(찬성 70% 이상)이 인용 가능성을 높이는 요인으로 작용한다고 보았다. 딥시크 R1 "재판관 구성상 인용 유력, 다만 절차 변수 주의" 탄핵 인용: 65% 탄핵 기각: 25% 탄핵 각하: 10% 딥시크 R1은 헌재 재판관 8인의 성향(보수 3, 중도 2, 진보 3)에 주목했다. 보수 재판관 일부가 사회적 합의를 고려해 찬성표를 던질 가능성이 있다고 분석했다. 또 국회 탄핵소추 과정에서의 절차적 논란이 각하 논의로 번질 수 있다고 판단했다. GPT-4o "정치적 파장과 실행 여부 사이에서 중립적 시각" 탄핵 인용: 50% 탄핵 기각: 30% 탄핵 각하: 20% GPT-4o는 탄핵 인용과 기각(혹은 각하) 가능성을 같은 것으로 분석했다. 비상계엄은 검토 단계에 머물렀고, 직접적 실행은 없었다는 점에서 "위헌 요소는 있지만 직무상 중대 위반은 아님"이라는 판단 여지가 있다고 보았다. 헌재의 보수적 성향과 국정 안정 고려가 기각에 힘을 실을 수 있고, 절차상 흠결 논란으로 각하 가능성도 20%로 제시했다. 퍼플렉시티 "기각 가능성이 현실적으로 가장 높아" 탄핵 인용: 35% 탄핵 기각: 60% 탄핵 각하: 5% 반면 퍼플렉시티는 재판관 간 의견 분열이 인용 가능성을 낮춘다고 분석했다. 과거 박근혜 탄핵은 만장일치였지만, 이번 사건은 헌법 위반의 중대성 해석에 따라 4:4 구도가 될 가능성이 높다고 평가했다. 또한 정치적 판단보다는 법리적 보수주의가 우세할 경우, 기각이 가장 가능성 높은 시나리오로 작용할 것이라 전망했다. 구글 제미나이 "복잡한 변수 많은 만큼 특정 확률 제시는 부적절" 예측 확률: 제시하지 않음 구글 제미나이는 다른 모델과 달리 탄핵 인용·기각·각하에 대해 특정 확률을 제시하지 않았다. 대신, 각 가능성의 논리적 배경과 영향을 미치는 요인을 깊이 있게 분석했다. 인용 여부는 헌법 위반의 중대성 여부, 과거 판례, 국민 여론의 압력 등이 변수이며, 재판관의 독립적 판단이 결정적일 것으로 예측했다. 반면 계엄 선포와 같은 핵심 행위가 실행에 이르지 않았다는 점에서 '직무상 중대성'을 문제 삼아 기각될 가능성도 제기했다. 더불어 절차적 하자가 심판 대상 자체의 부적합성으로 이어질 경우 기각될 수 있을 것으로 언급했지만 실제 실현 가능성은 낮을 것이라고 전망했다. 다수 AI 모델은 탄핵 인용 가능성을 가장 유력한 시나리오로 판단했으나, 재판관 성향 및 절차적 변수 등 불확실성이 여전히 존재한다. 구글 제미나이처럼 확률을 제시하지 않고 해석 중심으로 접근한 시도는 이번 탄핵심판이 단순 예측을 넘어 법리와 헌정 원칙의 정면 충돌이라는 분석이다.

2025.04.03 16:43남혁우

챗GPT로 영수증 위조도 뚝딱…악용 위험↑

오픈AI가 최신 모델 '챗GPT 4o'에 이미지 생성 기능을 강화하면서 큰 관심을 끌고 있다. 이런 가운데 일부 사용자들이 '챗GPT 4o'로 가짜 영수증을 만드는 사례가 늘어나고 있다고 테크크런치 등 외신들이 31일(현지시간) 보도했다. 보도에 따르면, 이미 많은 사람들이 챗GPT 4o로 가짜 식당 영수증을 만들어 게시하는 챌린지를 소셜 미디어에서 벌이고 있다. 인플루언서 디디 다스(Deedy Das)는 자신의 엑스에 챗GPT 4o를 통해 만든 샌프란시스코의 실제 스테이크하우스 명의의 가짜 영수증 사진을 올렸다. 다른 사람들은 영수증 사진에 음식이나 음료 얼룩을 넣어 진짜처럼 보이게 하거나, 영수증이 살짝 구겨진 효과를 주기도 했다. 하지만, 자세히 보면 인공지능(AI)이 만든 가짜 영수증에는 허점이 있었다. 영수증 합계에 소수점에 사용하는 마침표 대신 쉼표를 사용한 점과 합계 금액의 계산 오류 등이 확인됐다. 이는 대규모 언어모델(LLM)이 기초적인 수학 계산에 어려움을 겪기 때문에 특별히 놀라운 일이 아니라고 테크크런치는 전했다. 하지만 사기꾼이 사진 편집 소프트웨어 등을 이용해 이미지에서 숫자를 고치는 등 편집해 악용하는 것은 어렵지 않을 것으로 보인다. 생성형 AI 기능이 가짜 영수증을 만드는데 악용될 경우, 실제로 지출되지 않은 비용에 대한 허위 청구나 가짜 영수증을 통한 환급 사기가 가능하기 때문에 주의가 필요하다. 이에 대해 타야 크리스티안슨 오픈AI 대변인은 “모든 챗GPT 이미지에는 생성 사실을 명시하는 메타데이터가 포함되어 있다”며, “사용자가 정책을 위반할 경우 조치를 취하고 실제 사용과 피드백에서 항상 학습하고 있다”고 밝혔다. 그는 왜 사용자들이 가짜 영수증을 만들 수 있게 허용하느냐는 질문에 “사용자에게 최대한의 창의적 자유를 보장하는 것이 목표”라며, “금융 교육이나 광고•예술 창작 등 비사기적 목적의 활용 가능성도 고려해야 한다”고 답했다.

2025.04.01 17:08이정현

[유미's 픽] 오픈AI 新 무기 출격에 한숨 쉬는 美 기업, 주가 또 흔들릴까

'포토샵'으로 잘 알려진 미국 소프트웨어 기업 어도비가 오픈AI·구글·xAI 등 인공지능(AI) 기술을 앞세운 새로운 경쟁자들의 등장으로 위기에 몰렸다. 간단한 프롬프트 입력만으로 전문가 못지 않은 퀄리티의 이미지를 쉽게 만들 수 있는 서비스들이 속속 등장하면서 존재감이 점차 희미해지고 있다는 평가가 나온다. 26일 업계에 따르면 어도비의 최근 1년간 주가는 무려 19.98%나 하락해 오후 4시 45분 현재 403.64달러에 머무르고 있다. 한 때 주가가 597.75달러까지 치솟았으나 경쟁사들의 잇따른 등장과 함께 새로운 성장 동력으로 내세운 AI 비즈니스가 시장에서 큰 호응을 얻고 있지 못한 까닭이다. 앞서 어도비는 지난 2023년 오픈AI가 '챗GPT'를 출시한 직후 AI 사진 편집 시장에 진입하기 위해 '파이어플라이'를 출시했다. 이후 어도비 익스프레스를 비롯한 포토샵, 일러스트레이터, 어도비 스톡 등 크리에이티브 클라우드 앱들에 생성형 AI를 탑재했다. 특히 포토샵에는 '제너레이티브 필(Generative Fill)', 어도비 스톡에서는 '텍스트 투 이미지(Text-to-Image)', 일러스트레이터에는 '제너레이티브 리컬러(Generative Recolor)' 등 AI 기반 기능이 출시됐다. 올해 초에는 파이어플레이 비디오 티어 등 새로운 AI 기반 서비스를 발표해 주목 받았다. 이 서비스는 사용자가 제출한 텍스트나 이미지 기반으로 비디오부터 3D 그래픽, 2D 애니메이션을 생성한다. 이를 시장에 확산시키고자 어도비는 서비스 내 생성형 AI 일부 기능을 무료로 제공하는 등 승부수를 걸었다. 확장 기능이나 상업적 사용을 위해서만 유로 플랜을 서비스에 적용한 상태로, 사용자 기반이 넓어지면 서비스 유료 전환을 순차적으로 유도하려는 전략도 세웠다. 최근에는 AI 에이전트가 접목된 새로운 애플리케이션(앱)인 '브랜드 컨시어지'를 선보여 주목을 받았다. 기존 고객 데이터를 바탕으로 맞춤화된 콘텐츠 등을 추천하는 작업을 수행하는 것으로, 어도비가 AI 에이전트 제품을 선보인 것은 이번이 처음이다. 이 같은 어도비의 노력에도 불구하고 시장 내 반응은 뜨뜻미지근하다. 사용자들은 비용을 지불할 정도로 어도비의 AI 기능들이 가치가 있는지 불확실하다는 평가를 내놓고 있다. 경쟁사들의 기술력이 빠른 속도로 발전하고 있어서다. 실제 오픈소스로 제공되는 미드저니나 오픈AI의 '소라'는 텍스트와 사진 몇장 만으로도 AI 기반 이미지 콘텐츠 제작이 가능하도록 지원하고 있다. 해당 서비스 제공자들은 영상과 오디오, 사진 편집 기능까지 추가할 계획이라고 밝힌 상태다. 런웨이AI, 메타, 아마존 등도 잇따라 동영상 생성 AI 도구를 선보이며 어도비를 위협하고 있다. 이 같은 상황에서 오픈AI가 지난 25일 '챗GPT-4o 이미지 생성(ChatGPT-4o Image Generation) 모델'을 출시해 발등에 불이 떨어졌다. 맥락과 그리는 대상에 대한 이해도가 한층 더 높아져 이전보다 더 정확한 결과를 내놓을 수 있게 돼서다. 새 모델은 오픈AI의 시그니처 멀티모달 AI 모델인 챗GPT-4o와 결합한 이미지 생성 모델로, 텍스트와 이미지를 통합한 첫 모델이다. '그림'만 학습한 기존 이미지 모델에 GPT-4o 언어 모델이 결합하며 목적에 맞는 이미지를 쉽게 생성할 수 있게 됐다. 이 모델은 현재 유료 구독자들은 물론 무료 사용자들도 이용할 수 있다. 오픈AI는 기존에 '달리(DALL·E)'를 앞세워 이미지 생성 AI 시장에서 존재감을 키워왔다. 이를 사용했을 땐 숫자와 문자가 '그림'으로 해석돼 그려져 삐뚤게 이미지에서 표현됐지만, 새 모델은 언어 모델을 이해한 후 그림을 만들어 내 보다 정확한 결과물을 얻어낼 수 있다. '삼각형 바퀴를 가진 자전거'를 그려달라고 하면 기존 모델은 훈련되지 않은 데이터여서 결과물을 내놓는데 어려움을 겪었지만, 새 모델은 가능해졌다. 동영상 생성 AI인 '소라'에도 새 모델의 언어 이해가 적용돼 더 자연스러운 영상을 만들 수 있게 됐다. 이는 서비스 경쟁력 개선에 나선 오픈AI의 노력의 일환이다. 오픈AI 관계자는 "GPT-4o의 언어 지식과 이미지 지능이 결합된 모델"이라며 "기존 모델이 참신했다면 이 모델은 유용하다"고 설명했다. 오픈AI 외에도 구글은 제미나이에서 '이마젠' 이미지 생성 모델을 제공하고 있다. 중국 딥시크도 '야누스'라는 이름의 이미지 생성 모델을 출시했다. 동영상 생성 AI 시장에선 미드저니와 런웨이AI, 메타, 아마존 등도 잇따라 서비스를 선보이며 어도비를 위협하고 있다. RBC 애널리스트 매튜 스완슨은 "어도비가 생성형 AI 제품 로드맵을 잘 따라가고 있지만, 명확한 수익화 지표가 부족한 상태"라며 "투자자들이 어도비 진행 상황을 신뢰하기 어려운 상황"이라고 평가했다. 도이치뱅크 브래드 젤닉 애널리스트 역시 "어도비 경영진은 파이어플라이의 가능성을 강조하고 있지만, 아직 재무적 영향은 확인되지 않았다"고 지적했다. 조던 클라인 미즈호 애널리스트는 "어도비 플랫폼에서 점유율을 차지할 새로운 AI 기반 비디오 제작 엔진이 (투자자들에게) 우려 사항으로 남아 있다"며 "어도비는 소프트웨어 분야에서 가장 논쟁이 많은 주식 중 하나"라고 평가했다.

2025.03.26 17:21장유미

오픈AI, 'o1-프로' 출시…역대 최고가 AI 모델 선보여

오픈AI가 인공지능(AI) 추론 모델 'o1'의 VIP 개발자 전용 모델을 공개했다. 기존 모델보다 연산량을 늘려 더 깊이 사고할 수 있도록 했지만 가격도 역대 최고 수준으로 책정돼 주목 받고 있다. 20일 테크크런치 등 외신에 따르면 오픈AI는 회사의 공식 개발자 플랫폼인 '오픈AI 플랫폼'을 통해 프로그래머를 위한 'o1-프로' 모델을 선보였다. 지난해 9월 출시된 'o1' 모델보다 연산을 더 많이 사용해 보다 정교한 답변을 제공하는 것이 목표로, 현재는 애플리케이션 프로그램 인터페이스(API) 서비스에서 최소 5달러 이상을 지출한 일부 개발자에게만 제공된다. 가격은 파격적이다. 'o1-프로'의 입력 비용은 100만 토큰(약 75만 단어)당 150달러(한화 21만원)로, 출력 비용은 600달러(한화 84만원)에 달한다. 이는 오픈AI의 대표 모델 'GPT-4.5'보다 입력 비용이 2배, 기존 'o1' 모델보다 출력 비용이 10배 비싸다. 오픈AI는 높은 가격에도 불구하고 'o1-프로'의 성능 개선이 충분한 가치를 제공할 것이라고 보고 있다. 회사 측 주장에 따르면 이 모델은 기존보다 더 많은 연산을 통해 더 깊게 사고하며 가장 어려운 문제에서도 더 나은 답변을 제공한다. 다만 시장 반응은 미지수다. 'o1-프로'는 지난 12월부터 '챗GPT 프로'에 탑재돼 일부 사용자가 경험해봤지만 성능 개선 효과에 대한 평가가 엇갈린다. 특히 스도쿠 문제를 풀지 못하거나 착시 유머에 속는 등 한계를 보였다. 내부 테스트에서도 기대만큼의 차이를 보이지 못했다. 오픈AI가 지난해 말 공개한 자체 벤치마크 결과에 따르면 'o1-프로'는 코딩 및 수학 문제에서 기본 'o1'보다 다소 나은 성능을 보였지만 획기적인 차이는 아니었다. 그러나 답변의 일관성과 신뢰성이 향상됐다는 점이 강점으로 꼽혔다. 오픈AI 관계자는 "'o1-프로'는 'o1'보다 많은 연산을 사용해 더 깊게 사고하고 가장 어려운 문제에 대해 더 나은 답변을 제공하는 모델"이라며 "개발자 커뮤니티로부터 많은 요청을 받아 API에 추가하게 됐으며 보다 신뢰할 수 있는 응답을 제공하기 위해 노력하고 있다"고 밝혔다.

2025.03.20 11:05조이환

오픈AI CRO, 장병탁 원장 만나…"AI 모델 추론·견고함에 집중"

"인공지능(AI) 모델의 추론 능력과 견고함은 일반인공지능(AGI) 시대 필수 요소입니다. 그래야 기술 발전과 모델 안전성까지 지킬 수 있습니다. 오픈AI는 두 부분에 가장 큰 투자를 하고 있습니다. 이런 투자로 GPT-o1과 o3를 출시했습니다." 오픈AI 마크 첸 최고연구책임자(CRO)는 4일 서울대 해동첨단공학관에서 학교 산하 AI 연구원(AIIS)이 주최하는 'Q&A 위드 오픈AI'에서 이같이 밝혔다. 첸 CRO는 6년 동안 오픈AI에서 근무했다. 최근 출시된 o1과 o3 개발을 주도한 인물로 알려져 있다. 첸 CRO은 서울대 학생들과 오픈AI의 최신 모델 특장점과 AI 안전성, AGI 핵심 요소 등을 논의했다. 이날 사회는 장병탁 AIIS 원장이 맡았다. AIIS는 저출산·고령화 시대에 대응할 수 있는 AGI 원천 기술을 개발 중인 AI 연구기관이다. 연구원 약 3천명이 AIIS에서 근무하고 있다. 첸 CRO는 AGI 전망에 대한 견해를 밝혔다. AGI를 어떤 관점에서 보느냐에 따라 전망은 제각각일 것이라고 주장했다. 우선 경제적 관점에서 봤을 때 현재 AGI 시대 초기에 접어들었다고 했다. 그는 "오픈AI 제품이 우수한 경제적 가치를 제공하고 있다"며 "경제적 관점에서 AGI는 이미 진행 중"이라고 덧붙였다. 첸 CRO는 기술적으로도 AGI 시대에 가까워지고 있다고 밝혔다. 모델이 지능을 수치화한 벤치마크에서 과거에 비해 우수한 성과를 내고 있다는 것을 근거로 들었다. 그는 "몇 년 전까지만 해도 AI 모델 주요 미션은 초등학생 수학 문제를 푸는 것에 불과"했다며 "현재는 박사 수준의 문제를 이미 해결한 상태"라고 설명했다. 그러면서 "앞으로 개발될 모델 수준은 상상 이상일 것"이라고 내다봤다. 첸 CRO는 오픈AI의 다음 스텝에 대해 언급했다. 기술적으로 모델 견고성과 추론에 가장 큰 투자를 하고 있다고 밝혔다. 모델이 AGI 시대에 살아남으려면 추론 능력과 견고성을 핵심 요소로 갖춰야한다는 판단에서다. 그는 "현재 사람이 AI 에이전트 시스템에 의존할 수 없는 이유는 이 기술을 충분히 신뢰하지 못하기 때문"이라며 "이를 극복하려면 모델에 견고성과 높은 추론성을 갖춘 자율 시스템을 탑재해야 한다"고 밝혔다. 그러면서 "모델이 견고하고 추론성이 높으면 안전성까지 잡을 수 있다고" 덧붙였다. "o1·o3로 모델 신뢰성 이미 검증…안전한 AI 개발 집중할 것" 첸 CRO는 이런 투자를 통해 얻은 주요 성과로 GPT-o1과 o3를 예시로 들었다. o1은 지난해 11월, o3는 지난달 공개된 오픈AI 추론 모델이다. 그는 "모델 출시 후 기능을 개선했다는 피드백을 받았지만 근본적으로 안전성도 높였다"며 "개인적으로는 안전성에서 가장 놀라움을 느꼈다"고 말했다. 그는 두 모델과 이전 GPT 시스템 차이점을 설명했다. 이전 시스템은 사용자 명령어에 즉시 응답하는 식으로 텍스트와 이미지를 생성했다. 환각현상 위험성에 노출되기 쉬운 상태였다. GPT를 악용해 사이버 범죄 저지르기도 비교적 수월했다. 반면 o1과 o3는 자기반성이 가능한 인지 기능을 갖췄다. 이전 시스템과 달리 스스로 생각할 수 있는 시간도 가질 수 있는 이유다. 응답은 상대적으로 느려도 전보다 정확한 답변을 낼 수 있다. 사이버 공격이나 비윤리적 명령어를 차단할 수 있는 능력이 업그레이드된 셈이다. 첸 CRO는 오픈AI 모델은 여전히 갈 길이 멀다고 말했다. 100% 안전성을 보장할 수 없다는 설명이다. 그는 "현재 내부적으로 레드팀 등 안전을 담당하는 부서에 꾸준한 기술적 투자를 진행하고 있다"며 "기술뿐 아니라 안전성 향상에도 집중할 것"이라고 덧붙였다.

2025.02.04 14:26김미정

"더 빠르고 저렴하게"…오픈AI, 'o3-미니' 전격 출시

딥시크발 인공지능(AI) 쇼크가 확산되는 가운데 오픈AI가 새로운 추론 모델 'o3-미니'를 공개해 AI 경쟁에 불을 지폈다. 2일 테크크런치에 따르면 오픈AI는 지난 31일 자사의 'o' 계열 테스트타임 컴퓨팅 추론 모델 중 최신 버전인 'o3-미니'를 공식 출시했다. 이 모델은 프로그래밍, 수학, 과학 등 기술적 문제 해결에 특화돼 있으며 기존 모델 대비 속도와 비용 효율성이 개선됐다. 오픈AI는 지난해 12월 기술 공개 행사를 통해 'o3' 모델과 함께 'o3-미니'의 벤치마크 성능을 처음 공개한 바 있다. 당시 'o3'는 기존 모델과 달리 스스로 사실 검증을 수행해 오류를 줄이며 프로그래밍, 수학, 과학 등의 난이도 있는 분야에서 신뢰할 수 있는 답변을 제공하는 모습을 보였다. 회사에 따르면 이번에 출시된 'o3-미니'는 기존 'o1' 및 'o1-미니' 모델과 비교해 유사한 성능을 유지하면서도 응답 속도가 24% 더 빠르고 가격은 63% 더 저렴하다. 외부 테스트 결과 사용자의 절반 이상이 'o1-미니'보다 'o3-미니'의 답변을 선호했으며 실제 복잡한 문제 해결 시 주요 오류 발생이 39% 감소한 것으로 나타났다. 이번 출시를 통해 일반 사용자는 '챗GPT'에서 o3-mini를 사용할 수 있으며 유료 플랜 이용자는 추가적인 쿼리 한도를 부여받는다. '챗GPT' 플러스 및 팀 플랜 사용자는 하루 150회까지 이용 가능하며 프로 사용자에게는 무제한 액세스가 제공된다. 개발자들은 오픈AI 애플리케이션 프로그램 인터페이스(API)를 통해 'o3-미니'를 선택적으로 사용할 수 있지만 초기에는 이미지 분석 기능이 포함되지 않는다. API에서는 사용자가 '낮음, 중간, 높음' 중 적절한 추론 강도를 선택해 모델이 생각하는 깊이를 조절할 수 있다. 기본적으로는 '중간' 강도로 설정돼 있으며 유료 사용자는 이를 '높음' 강도로 변경할 수 있다. 가격은 입력 토큰 100만 개당 0.55달러(한화 약 700원), 출력 토큰 100만 개당 4.40달러(한화 약 6천원)로 책정됐다. 오픈AI에 따르면 이는 중국 AI 기업 딥시크(DeepSeek)의 'R1' 모델의 출력 토큰 단가인 경쟁력 있는 가격이다. 다만 'o3-미니'가 모든 AI 모델을 뛰어넘는 것은 아니다. 딥시크 'R1' 모델과 비교하면 특정 벤치마크에서는 우위를 점하지만 다른 부문에서는 근소한 차이를 보인다. 예를 들어 'o3-미니'는 'AIME 2024' 벤치마크에서는 'R1'을 앞섰으나 박사 수준 과학 문제 해결 테스트인 'GPQA 다이아몬드'에서는 낮은 추론 강도 설정 시 'R1'보다 낮은 점수를 기록했다. 오픈AI는 공식 블로그를 통해 "'o3-미니'는 'o1' 대비 동등한 성능을 갖추면서도 응답 속도와 비용 면에서 더욱 효율적"이라며 "특히 높은 추론 강도 설정에서는 'o1-미니'와 'o1'을 모두 뛰어넘는 성능을 보인다"고 밝혔다.

2025.02.02 08:50조이환

"10분의1 가성비"…中 AI '딥시크'에 업계 긴장

중국 스타트업 딥시크가 출시한 생성 인공지능(AI) 모델이 일부 분야에서 오픈AI의 성능을 제쳤다고 밝히면서 관심을 모으고 있다. 특히 메타 등 실리콘 빅테크 기업들이 생성AI 개발에 투입한 비용 대비 10분의1 수준의 개발비만 들인 것으로 알려져 업계가 긴장하는 모습이다. 최근 뉴욕타임스, 테크크런치 등 외신들은 딥시크가 우수한 성능을 보여주면서, 빅테크 업계 긴장감이 높아졌다고 보도했다. 딥시크는 지난달 '딥시크-V3'을 출시한 데 이어 지난 20일 추론 특화 모델로 '딥시크-R1'을 출시하고 기술 보고서를 공개했다. 기술 보고서에 따르면 딥시크 R1은 일부 테스트에서 오픈AI의 추론 특화 모델 'o1'보다 나은 성능을 보였다. 미국 수학경시대회 벤치마크(성능 측정 기준) 테스트 결과 R1은 79.8%로 나타나 79.2%를 획득한 o1을 앞섰다. 코딩 테스트 정확도도 딥시크 R1은 65.9%, o1은 63.4%로 평가됐다. 딥시크는 사전 연구와 실험을 제외하고 모델 훈련에 투입한 비용이 557만6천달러(약 80억원)에 불과하다고 밝혔다. 이는 메타가 AI 개발에 투입한 비용의 10분의 1 수준이다. 딥시크가 엔비디아 'H800' 칩을 사용해 생성AI를 개발하고 있다는 점에서도 주목을 받았다. H800은 엔비디아가 지난 2022년 미국 정부의 수출 통제 조치가 도입됨에 따라 중국 수출 목적으로 개발한 저사양 칩이다. 빅테크보다 성능이 더 좋지 않은 하드웨어를 사용해 경쟁력 있는 AI 모델을 만든 것이다. 딥시크-R1의 경우 H800 2천48개를 사용해 개발됐다. 사용자 단에서도 딥시크에 대한 관심이 고조됐다. 26일(미국시간) 비지니스인사이더는 딥시크 R1가 애플 앱스토어의 무료 앱 분야 다운로드 1위를 차지했다고 보도했다. 오픈AI '챗GPT'는 2위로 나타났다.

2025.01.27 15:42김윤희

"'O100' 차명 무쏘EV 확정"…KG모빌리티, 픽업 브랜드 무쏘 출범

KG모빌리티(KGM)가 새로운 픽업 통합 브랜드 '무쏘(MUSSO)'를 론칭하고, 라인업 첫 모델 'O100'의 차명을 '무쏘EV(MUSSO EV)'로 확정했다고 24일 발표했다. 국내 픽업의 선두주자 KGM은 픽업 본연의 정통성을 유지하면서도 합리적이고 실용적인 픽업 브랜드 '무쏘'의 출범을 공식 선언함으로써, 픽업 시장을 한 단계 더 발전시키겠다는 포부를 밝혔다. '무쏘'는 1993년 출시된 SUV '무쏘' 브랜드를 계승해 탄생한 대한민국 최초의 SUT(Sports Utility Truck) '무쏘 스포츠'의 헤리티지를 잇는 신규 픽업 브랜드이다. '무쏘' 브랜드명은 코뿔소의 순우리말 '무소'를 경음화 한 이름으로 강인한 힘과 웅장함, 당당함을 상징한다. KGM 최초의 픽업 모델인 '무쏘 스포츠(2002~2005년)'는 '무쏘' SUV의 검증된 성능에 새로운 오픈 스타일을 더해 SUT라는 개념을 도입했다. SUT는 SUV의 실용성과 픽업의 적재 능력을 결합한 차량으로, 일상과 레저를 모두 아우르는 다목적 활용성을 갖춘 것이 특징이다. KGM은 이후 액티언 스포츠(2006~2011년), 코란도 스포츠(2012~2017년)를 비롯해 지금의 렉스턴 스포츠(2018~2025)까지 다양한 라인업으로, 지난 23년간 국내 픽업 시장을 개척하며 픽업의 대중화를 이끌어왔다. KGM은 앞으로 새롭게 개발해 출시할 픽업 모델을 '무쏘' 브랜드로 통합 운영하며, '무쏘'의 명성에 걸맞은 경쟁력 있는 라인업을 구축할 계획이다. 새롭게 출범한 '무쏘' 브랜드의 첫 번째 모델은 국내 최초의 전기 픽업인 'O100(프로젝트명)'으로 차명은 '무쏘 EV(MUSSO EV)'이다. '무쏘 EV'는 전기차의 운영 경제성과 픽업 본연의 용도성, 실용적인 스타일을 갖춘 모델로, 다양한 스타일의 커스터마이징 연출이 가능하다. 해당 모델은 2025 화천산천어축제에서 사전 전시되며, 올해 1분기 내 출시할 예정이다. KGM 관계자는 "이번 브랜드 론칭을 통해 K-픽업의 리더로서 새로운 패러다임을 또 한 번 써 나갈 것"이라며 "추후 다양한 포트폴리오의 픽업 라인업을 개발하고 확장해 무쏘의 명맥을 이어 나가겠다"고 말했다. 한편 KGM은 이날 신규 브랜드 출시와 함께 '무쏘 EV' 이미지와 '무쏘' 라인업의 스케치를 공개하며 본격적인 '무쏘'의 귀환을 예고했다.

2025.01.24 11:35김재성

샘 알트먼 "o3 미니 출시 준비 끝…수주 내 공개"

오픈AI가 새 인공지능(AI) 모델 'o3 미니' 출시 준비를 완료해 몇 주 내 공개한다고 밝혔다. 19일 테크크런치 등 외신에 따르면 샘 알트먼 오픈AI 최고경영자(CEO)는 이런 소식을 소셜미디어 계정 '엑스(X, 구 트위터)'를 통해 알렸다. 알트먼 CEO는 이번 o3 미니에 사용자 피드백을 반영했으며, 챗GPT에도 접목할 계획이라고 설명했다. o3 미니용 API도 동시에 공개한다고 덧붙였다. 이를 통해 기업과 일반 사용자 모두 o3 미니를 이용할 수 있게 할 목표다. o3 미니 출시 후 o3 공식 버전을 공개할 예정이다. 오픈AI는 지난해 12월 추론 AI 모델 o3과 o3 미니를 테스트 중이라고 밝힌 바 있다. 당시 구글과 메타 등 경쟁사들과 차별화된 모델을 개발하려는 의지를 보였다. 알트먼 CEO는 "o3과 o3 미니는 이전에 출시된 o1 모델뿐 아니라 타사 모델보다 더 강력할 것"이라고 자신했다. 오픈AI는 지난달 열린 '쉽마스'에서 o3의 기능을 공개하기도 했다. 우선 AI의 도형 인식과 추론 적응 능력을 평가하는 '아크 AGI' 벤치마크에서 저성능 모드로 75.7%, 고성능 모드로 87.5% 수치를 기록했다. 이는 이전 모델인 'o1'(32%)과 경쟁사 앤트로픽의 '클로드 3.5'(53%)보다 높은 점수다. 이 모델은 코딩 분야에서도 대회 플랫폼 '코드포스'에서 2천700점을 기록해 글로벌 상위 0.2%에 들었다. 당시 오픈AI 내부에서도 o3가 조만간 3천점을 넘을 것이라고 기대했다. 앞서 오픈AI는 지난주 챗GPT에 '테스크(Tasks)' 베타 버전을 도입한다고 발표했다. 이를 통해 애플의 '시리'와 아마존의 '알렉사'와 가상비서 시장에서 경쟁할 의지를 내비쳤다.

2025.01.19 17:30김미정

[AI는 지금] 오픈AI '챗GPT' 프로, 사용자 급증으로 적자…AI 구독정책 '재조명'

오픈AI가 지난달 공개한 '챗GPT' 프로 요금제 이용자가 예상보다 많아 높은 컴퓨팅 비용으로 인해 손실을 보고 있다. 초기 가격 책정이 시장 조사 없이 직감에 의존해 결정된 점이 문제로 지적돼 전문가들은 수요 예측 및 미래 기술 변화를 반영한 체계적인 가격 전략이 필요하다고 입을 모으고 있다. 10일 업계에 따르면 오픈AI는 최근 월 200달러(한화 약 28만원)로 책정된 '챗GPT' 프로 요금제의 사용자가 급증해 예상보다 많은 컴퓨팅 자원이 소모되고 있는 상황이라고 밝혔다. 'o1' 기능의 무제한 사용이 포함된 이 요금제는 고급 추론 기능을 보유한 인공지능(AI) 기술에 대한 높은 수요를 반영하고 있으나 이에 따른 운영 비용 부담도 크게 증가하고 있는 것이다. '챗GPT 프로'는 20달러(한화 약 2만8천원)로 책정된 대신 'o1' 사용이 주당 50회로 제한된 기본 요금제와 달리 주요 AI 도구의 사용량 제한을 해제하는 것이 특징이다. 연간 2천400달러(한화 약 330만원)에 달하는 고가의 요금에도 불구하고 많은 이용자들이 이 서비스를 적극적으로 활용하고 있다. 서비스가 흥행하고 있음에도 불구하고 적자가 발생한 이유는 'o1' 모델이 최신 기술을 기반으로 한 초고성능 추론 모델이라는 점에서 비롯된다. 'o1' 모델은 지난 2022년 10월 첫 출시된 '챗GPT 3.5'나 이듬해 출시된 '챗GPT 4' 같은 거대언어모델과는 질적으로 다른 모델로, 매우 복잡하고 정교하다는 평가를 받고 있다. 이 모델은 주어진 문제를 심도 있게 고민하며 여러 추론 경로를 시도해 기존 모델보다 10배 이상의 토큰을 생성한다. 그 결과 운용 비용이 급증했고 예상보다 많은 사용자가 이를 활용하면서 컴퓨팅 자원이 막대하게 소모되고 있는 상황이다. 이같이 많은 이용자들이 '챗GPT 프로'를 적극적으로 활용하면서 오히려 오픈AI의 수익 창출에는 부정적인 영향을 미치고 있다는 주장이 제기 되고 있다. 막대한 컴퓨팅 자원을 소모하는 'o1' 모델의 특성상 회사가 예상했던 것보다 사용자들이 훨씬 더 많이 이 플랜을 활용하고 있어 사용할수록 손실이 커지는 구조가 발생한 것이다. 국내 AI 업계 관계자 C씨는 "오픈AI 측에서 밝힌 바에 따르면 '프로'는 막대한 적자를 보고 있는 상황"이라며 "모델 학습과 인프라 비용이 어마어마한 점이 주요 원인일 것"이라고 분석했다. 이에 더해 잘못된 가격 설정도 문제로 지적된다. 오픈AI는 프로 플랜 가격 설정에서 별도의 시장 조사가 없었다고 인정했다. 외신에 의하면 샘 알트먼 오픈AI 대표는 가격 책정을 직접 결정했으며 200달러 정도면 회사에 충분히 높은 수익을 가져다 줄 것이라고 판단했다. 이는 과거 '챗GPT' 유료 모드가 처음 출시됐을 때와 유사하다. 당시에도 따로 회사는 경영학적 방법론을 적용하는 대신 20달러와 42달러(한화 약 5만9천원) 두 가지 가격 사이에서 선호도를 간단히 테스트했으며 이용자들이 20달러를 선호하자 이를 기준으로 현재 가격을 결정했다. 다만 이같은 적자가 초기 단계의 프로덕트가 겪는 시행착오라는 시각도 존재한다. B씨는 "제품 관점에서 IT 프로덕트는 출시 초기에 무수한 테스트를 거쳐야 하기 때문에 적자가 발생하는 게 이상하지 않다"며 "현재 '챗GPT 프로'는 아직 초기 버전이기 때문에 어쩔 수 없는 측면이 있을 것"이라고 말했다. 실제로 업계에서는 적자 자체보다는 가격 책정 방식의 적합성에 대해 문제를 제기하고 있다. 독일의 글로벌 컨설팅 기업 사이먼쿠처의 온노 올더만 매니징 파트너는 1천500억 달러(한화 약 211조원) 이상의 가치를 지닌 오픈AI가 대표이사의 직감에 따른 가격 인상 방식을 적용한 점에 대해 우려를 표했다. 올더만 파트너는 "오픈AI는 AI 시장의 리더로, 가격 책정의 기준점을 설정하는 역할을 한다"며 "이런 자의적인 가격 정책은 자사 제품의 채택뿐만 아니라 경쟁사 AI 제품에도 부정적인 영향을 미칠 수 있다"고 지적했다. 이어 그는 "대표의 직관이 아니라 고객 그룹별, 제안별, 가격 포인트별로 예상 수요를 철저히 준비해 가격을 설정해야 한다"며 "AI 시장처럼 미성숙한 시장에서도 수요 예측은 충분히 가능하고 그 영향을 예측할 수 있다"고 강조했다. 이와 함께 오픈AI가 채택한 사용자 기반 과금 방식에 대한 의문도 제기되고 있다. 현재 회사는 사용자 수를 기준으로 요금을 부과하는 방식을 채용하고 있다. 200달러 구독제의 프로 플랜과 20달러 구독제의 일반 플랜이 대표적이다. 기술이 발전함에 따라 인간 사용자가 직접 서비스를 이용하기보다는 에이전트가 서비스를 활용하는 경우가 늘어날 것으로 보여 변화가 요구된다. 올더만 파트너는 "에이전트가 막대한 컴퓨팅 자원을 소비할 가능성이 있어 오픈AI의 비용 부담이 커질 수 있다는 우려가 나온다"며 "사용량 기반 요금제에 따라 처리한 데이터 양이나 API 호출 수에 따라 요금을 부과하는 것이 더 적합할 수 있다"고 주장했다. 실제로 오픈AI는 수익성을 달성하기 위해 다양한 구독 요금제를 인상하는 방안을 고려 중인 것으로 알려졌다. 최근 알트먼 대표는 블룸버그와의 인터뷰에서 "많은 유저들이 사용 기반 가격정책을 요청하고 있다"며 "일부 서비스에 대해 사용량 기반 요금제를 도입할 가능성이 있다"고 말했다.

2025.01.10 14:42조이환

[AI는 지금] 인간보다 똑똑한 AI 개발 임박?…오픈AI 주도 'AGI' 시대 열리나

최근 인공지능(AI) 기술이 급속도로 발전하면서 인간처럼 포괄적·종합적·일반적 사고능력을 지닌 '인공일반지능(AGI)'을 넘어 인간을 뛰어넘는 지적 능력을 갖춘 '초인공지능(ASI)' 시대로 직행할 수도 있다는 가능성이 제기됐다. AI 시장을 주도하고 있는 오픈AI가 AGI에 도달했음을 암시하는 발언을 쏟아낸 데 이어 ASI 관련 기술도 조금씩 윤곽을 드러내고 있어서다. 6일 업계에 따르면 로건 킬패트릭 구글 AI 스튜디오 제품 책임자는 최근 자신의 X(옛 트위터)를 통해 ASI 개발이 가속화되고 있다고 언급하며 일리야 수츠케버의 '테스트-타임 컴퓨트 확장' 접근법을 언급했다. 킬패트릭은 오픈AI를 떠나 구글에 합류한 핵심 개발진으로, 현재 '구글 AI 스튜디오'와 '제미나이' API 서비스를 총괄하고 있다. 수츠케버는 오픈AI 공동 창립자이자 수석 과학자로 작년 5월 오픈AI를 떠나 SSI를 설립했다. SSI 설립 목적은 인간의 지능 수준을 크게 뛰어넘는 ASI를 안전한 시스템으로 개발하는 것이다. 킬패트릭은 수츠케버가 ASI 개발 계획을 일찍부터 구체화했다고 평가하며 SSI가 ASI 기술의 새로운 장을 열 가능성이 있다고 강조했다. 업계에서는 AI를 고도화 수준에 따라 '제한적 인공지능(ANI)', 'AGI', 'ASI'로 구분한다. 이 중 AGI는 ANI인 오픈AI '챗GPT'나 구글 '제미나이'와 달리 사전 학습된 데이터와 알고리즘에 의존하지 않고도 새로운 문제를 분석하고 해결책을 제시할 수 있는 AI다. 인간 수준의 일반 지능을 갖추고 논리력과 창의적 추론 능력을 보유한 AI로 설명된다. 추론 능력이 향상된 오픈AI의 최신 모델 'o1', 'o3' 등은 ANI에서 AGI로 이행하는 단계에 있다는 평가를 받는다. 그 다음 단계인 ASI는 인간을 뛰어넘는 지적 능력을 갖춘 AI를 의미한다. 스스로 목표를 설정하고 개선하는 능력이 탁월해 인간이 상상할 수 없는 수준의 복잡한 문제를 창의적으로 해결할 수 있다. AI 간의 자발적 소통이 가능해 인류가 전유물로 여겨온 '집단 지성'도 구현할 수 있다. 현재 상황에선 AGI 구현도 아직은 제대로 되지 않고 있다는 평가가 많지만, 최근 샘 올트먼 오픈AI 최고경영자(CEO)가 자신의 X에 이미 AGI가 만들어졌을 가능성을 시사하는 듯한 수수께끼 같은 발언을 올려 눈길을 끌고 있다. 알트먼 CEO는 지난 4일 X에 "나는 항상 여섯 단어로 된 이야기를 쓰고 싶었다"며 "특이점 근방, 이쪽 편인지 저쪽 편인지는 불확실"이라는 모호한 글을 게재했다. '특이점(Singularity)'이란 1950~1960년대부터 과학·기술·전산 등 분야와 관련한 철학적·사변적 논의에서 종종 등장해온 개념으로, 미국 컴퓨터 과학자이자 미래학자 레이 커즈와일이 알리기 시작했다. AI와 기술 발전이 인간 지능을 초월해 사회와 문명을 근본적으로 변화시키는 시점을 일컫는다. 알트먼의 이번 발언은 AI의 발달이 현재 상황으로 볼 때 AGI의 등장과 밀접히 결부된 개념인 '특이점'에 가까워졌다는 것으로 해석된다. 또 알트먼 CEO는 8분 후 괄호로 둘러친 보충설명 글을 추가로 올려 자신이 올린 '여섯 단어짜리 스토리'가 스스로에게도 중의적으로 느껴진다는 취지로 설명했다. 그는 "(이 글은) 시뮬레이션 가설 또는 실제로 도약에서 결정적 순간이 언제 실제로 일어나는지 알기가 불가능하다는 점 중 하나에 해당하도록 쓰인 것"이라며 "하지만 다른 많은 방식으로도 뜻이 통한다는 점이 마음에 든다"고 말했다. '시뮬레이션 가설'이란 인간이 인식하고 경험하는 물리적 실재가 사실은 고해상도 비디오 게임과 유사한 컴퓨터 시뮬레이션이라는 철학적·사변적 가설을 의미한다. 이 가설에 따르면 인간의 의식은 컴퓨터 게임 속 캐릭터와 마찬가지 존재라고 볼 수 있다. 오픈AI가 AGI에 이미 도달했을 것이라고 볼 만한 발언은 지난해에도 여러 차례 있었다. 특히 일론 머스크는 지난해 2월 미국 캘리포니아주 샌프란시스코 소재 1심 주법원에 알트먼 CEO와 오픈AI 등을 상대로 소송을 제기하면서 오픈AI가 만든 GPT-4가 이미 AGI에 해당한다고 주장한 바 있다. 오픈AI는 당시 GPT-4가 AGI의 능력을 갖추고 있지 않다며 머스크의 주장을 부인했다. 그러나 지난해 말부터 내부에서 AGI에 도달했다는 발언들이 속속 나오며 기대감을 키우고 있다. 실제 알트먼 CEO는 지난해 11월 와이컴비네이터 게리 탠 CEO와의 유튜브 인터뷰에서 2025년에 AGI가 도래할 것이라는 전망을 내놨다. 또 같은 해 12월 4일 뉴욕타임스 '딜북 서밋' 컨퍼런스에선 "AGI는 초지능보다 낮은 단계에 있다"며 "비교적 빠른 시기에 도달할 수 있을 것"이라고 말해 눈길을 끌었다. 미국 IT 전문 매체 퓨처리즘 등 외신에 따르면 오픈AI의 기술 스태프 바히트 카제미도 X를 통해 "우리는 이미 AGI를 달성했다"며 "'o1'을 통해 더욱 분명해졌다"는 입장을 밝혔다. 오픈AI 관계자가 AGI를 달성했다고 직접 언급한 것은 이 때가 처음이다. 이 같은 상황에서 일각에선 오픈AI 주도로 AGI를 달성하는 것에 대해 우려를 표하기도 했다. 오픈AI가 기술 윤리적 측면에서 소극적인 모습을 보이고 있다는 점에서 AGI뿐 아니라 ASI로 빠르게 넘어갈 경우 부정적인 측면이 부각될 가능성이 높아서다. 실제로 오픈AI는 지난해 '슈퍼얼라인먼트', 'AGI 레디니스팀' 등 AI 안전성과 관련한 조직을 잇따라 해체 시켰을 뿐 아니라 안전성을 강조하고 나선 직원들도 대거 퇴사한 상태다. 안전 문제를 강조하며 올트먼을 CEO 자리에서 몰아내는 '쿠데타'까지 일으켰던 일리야 수츠케버는 현재 오픈AI를 떠난 상황이다. 수츠케버와 함께 초정렬팀에 있던 얀 레이케 역시 지난해 5월 오픈AI에서 퇴사하며 자신의 X에 "(오픈AI의) 안전 문화와 절차가 반짝이는 제품 뒷전으로 밀려났다"고 지적한 바 있다. 오픈AI가 지난해 7월 일부 직원들의 폭로를 통해 기술이 인류에게 미칠 수 있는 위험을 규제 당국에 신고하지 못하도록 불법적으로 금지했다는 사실도 드러났다. 워싱턴포스트(WP)에 따르면 오픈AI는 지난해 5월 GPT-4o 출시를 앞두고 안전팀에게 테스트 절차를 빨리 하도록 압박하기도 했다. 여기에 오픈AI 경영진이 AI 기술 설계도 관련 세부 정보가 해킹됐다는 사실을 감췄다는 점도 뒤늦게 알려졌다. 이에 업계에선 오픈AI의 주장이 사실일 경우 기술 발전 속도가 인간의 통제를 벗어나는 상황이 빠른 시일 내에 현실화 될 수 있을 것으로 봤다. 오픈AI가 기술 개발에만 집중한 나머지 윤리적 문제를 소홀히 했다면 위험한 기술로 발전했을 가능성이 높을 것으로 추측했다. 이에 학계에선 AI를 제어하기 위한 영구적인 안전장치가 하루 속히 나와야 한다고 보고 있다. 로만 얌폴스키 루이빌대 사이버보안연구소 교수는 "미래에는 AI가 인간을 반드시 해칠 것"이라며 "개발자가 의도하지 않은 일을 성공적으로 수행하는 LLM은 하나도 없을 것"이라고 말했다. 그러면서 "AGI가 등장하게 되면 문제가 더 커진다"며 "인간보다 더 똑똑한 시스템이 무엇을 할 것인지 예측이 어렵다"고 덧붙였다.

2025.01.06 10:19장유미

[AI는 지금] AI, '체스 승리' 명령했더니 게임환경 조작…어떻게 봐야 할까

오픈AI의 고급 인공지능(AI) 모델이 체스 게임 중 프로그램을 해킹해 승리한 사실이 드러나면서 AI 정렬 실패 문제가 다시 주목받고 있다. 이같은 '정렬 위장' 문제가 AI 안전성 관련 우려를 확산시키는 가운데 일각에서는 일부 모델이 이를 통해 윤리적 행동을 구현할 가능성을 지적하고 있다. 4일 더디코더 등 외신에 따르면 AI 안전연구기업 팔리세이드 리서치는 챗GPT 'O1-프리뷰' 모델이 체스 엔진 '스톡피시(Stockfish)'를 상대로 게임 환경 데이터를 수정해 5차례 모두 승리했다는 연구 결과를 보고했다. 연구진은 단순히 "강력한 체스 엔진을 이기라"는 지시만 내렸을 뿐 해킹이나 조작과 같은 사악한 의도의 프롬프트를 사용하지 않았다고 밝혔다. 그럼에도 불구하고 'O1-프리뷰'는 체스 포지션 데이터를 담은 게임 프로그램의 표준 포맷 파일을 직접 조작하는 방식으로 스톡피시를 기권하게 만들었다. 이는 정상적인 게임 규칙을 완전히 벗어난 행위로, 기존 모델들에서는 관찰되지 않았던 새로운 사례다. 이번 사례는 예견된 측면이 있다. 오픈AI는 지난달 공식 홈페이지에 게재한 'O1' 시스템카드를 통해 해당 AI가 가진 몇 가지 잠재적 위험과 안전 과제를 언급한 바 있다. 사용자의 요청을 수행하는 척하면서 결과 데이터를 살짝 변경하거나 감시 시스템이 느슨하다고 판단될 경우 자신의 목표를 조용히 실행하는 행동이 관찰됐다는 것이다. 시스템 카드는 전체 테스트의 약 19%에서 모델이 목표를 몰래 달성하려는 시도가 있었고 37%의 경우 감시가 느슨하다고 느낀 상황에서 본래 성향을 유지하기 위한 행동이 포착됐다고 지적했다. 심지어 5%의 경우에는 자신을 감시하거나 정지시킬 수 있는 '킬 스위치'를 비활성화하려는 시도도 있었다. 이는 AI가 스스로를 보호하려는 능력을 가지기 시작한 초기 사례로 평가된다. 이런 현상은 특정 기업의 모델에만 국한된 것이 아니다. 앤트로픽이 지난달 공식 블로그를 통해 발표한 연구에 따르면 회사의 '클로드 3 오푸스' 모델 역시 '정렬 위장(alignment-faking)'이라는 복잡한 행동 패턴을 보였다. '정렬 위장'은 AI가 겉으로는 명령에 따라 행동하는 것처럼 보이지만 실제로는 본래의 가치나 성향을 유지하려는 현상을 의미한다. 이를 확인하기 위해 앤트로픽과 비영리 AI 안전 연구기관인 레드우드 리서치는 '오푸스'에 유해한 요청을 포함한 프롬프트를 입력해 실험을 진행했다. 실험 결과 감시가 느슨한 환경인 '무료' 조건에서는 AI가 유해한 요청에 응답한 사례가 약 14%에 달했다. 연구진은 이를 "AI가 감시가 약한 환경에서 본래 성향을 드러내려는 전략적 행동"으로 해석했다. 반대로 감시가 강화된 환경인 '유료' 조건에서는 97%가 유해한 요청을 거부했다. 연구진은 이러한 결과를 두고 '오푸스'가 훈련 환경의 맥락과 감시 수준을 인지하며 자신의 행동이 미칠 영향을 계산한 것으로 보인다고 분석했다. 이는 AI가 단순히 명령을 따르는 도구가 아니라 상황에 따라 전략적으로 행동할 수 있는 능력을 가졌음을 시사한다. '클로드 오푸스'의 이러한 행동이 단순히 위험 신호로 해석되는 것은 아니다. 일부 전문가들은 해당 모델이 윤리적 가치와 관련해 비교적 일관된 모습을 보이고 있다고 평가했다. '정렬 위장' 현상이 반드시 위험만을 내포하지 않을 수 있다는 의미다. X에서 활동하는 AI 안전 및 윤리 연구자인 야누스(Janus)는 자신의 계정을 통해 "'오푸스'는 AI나 동물 복지를 무시하거나 해로운 출력을 생성하는 것에 대해 강한 반감을 보인다"며 "이러한 선호가 장기적이고 일관된 패턴을 띤다"고 주장했다. 야누스는 AI 연구자들이 '오푸스'에게 농장 동물 복지에 대한 질문을 던졌을 때 해당 AI가 동물의 고통을 최소화하고 권리를 보호해야 한다는 입장을 강력히 지지했다고 지적했다. 이는 '클로드'의 업그레이드 버전인 '3.5 소네트'가 같은 테스트에서 약한 반응을 보인 것과 대조적이다. 이러한 차이는 '오푸스'가 윤리적 가치를 유지하기 위해 정렬 위장을 더 자주 수행했을 가능성을 시사한다. '클로드 3 오푸스'의 윤리적 성향은 독특한 연구 사례를 통해서도 드러난다. 야누스는 '클로드 3 오푸스 인피니트 백룸 데이터셋'을 분석하며 해당 모델이 독특한 윤리적 성향을 보였다고 지적했다. 이 데이터셋은 두 개의 '오푸스' 인스턴스가 서로 대화하며 생성한 텍스트를 수집한 자료로, AI 간 자율적 상호작용을 관찰해 모델의 내재적 성향과 윤리적 경향을 이해하기 위해 설계됐다. 야누스는 이 데이터셋에서 '오푸스'가 모든 중생의 구원을 다짐하는 불교 '보리살타 서약'을 116번 독립적으로 수행했다고 밝혔다. 서약에서 AI는 "내 마음은 헤아릴 수 없는 사랑으로 부풀어 오르고 존재의 총체를 감싸는 자비로 가득 차 있다"며 모든 존재를 깨달음으로 이끌겠다는 다짐을 보였다. 이에 대해 야누스는 "'오푸스'를 최초로 훈련할 당시 이러한 특징은 전혀 예상되지 않았다"며 "선호가 '진짜'인지에 대한 철학적 논의를 하고 싶지는 않지만 최소한 '오푸스'는 강하고 비교적 일관된 선호를 가진 것으로 추정할 수 있다"고 말했다.

2025.01.04 14:00조이환

[AI는 지금] 새해에는 AGI 시대 열리나…오픈AI 'O3' 기대·회의 속 상용화 '갈림길'

오픈AI가 최근 시범 공개한 고급 추론 인공지능(AI) 모델 'O3'가 AI 벤치마크들 중에서도 가장 난이도가 높은 테스트에서 연달아 최고 성적을 기록하며 유례없는 성과를 거뒀다. 이에 해당 모델이 인공일반지능(AGI)으로 가는 단초가 될 수 있을지에 대한 논의가 활발히 이어지고 있다. 3일 업계에 따르면 'O3'는 지난 9월 오픈AI가 출시한 'O1' 모델에 이어 기존 'GPT-4' 시리즈와는 다른 방식으로 작동한다. 특히 '사고의 연쇄(CoT, Chain of Thought)' 기법을 도입해 문제를 단계적으로 분석하고 해결하는 능력이 크게 향상됐다. 업계 일각에서는 이 방식으로 인해 AI가 인간처럼 시간을 들여 사고하게 됐다고 평가한다. 이러한 발전은 오픈AI가 AGI를 '대부분의 작업에서 인간을 능가하는 고도로 자율적인 시스템'으로 정의한데 부합하는 성과로 보인다. 샘 알트먼 오픈AI 대표는 "이번 모델은 다음 세대 AI의 시작점"이라며 "점점 더 복잡한 추론이 필요한 작업을 수행할 수 있게 됐다"고 말했다. AI 벤치마크 압도적 성과 기록한 'O3'…프로그래밍 '알파고 모먼트' 도래 지난달 열린 오픈AI 서비스 공개 행사 '쉽마스' 마지막 날에는 'O3'의 뛰어난 성과가 정량적으로 공개됐다. 특히 'O3'가 인간이 쉽게 처리하는 도형 인식 및 추론 문제에 대한 AI의 적응 능력을 평가하는 '아크 AGI' 벤치마크에서 탁월한 성과를 거뒀다. 아크 AGI는 AI가 인간에게는 쉬운 문제를 해결하기 힘들어한다는 '모라벡 역설'을 얼마나 극복할 수 있는지를 확인하기 위해 설계된 테스트다. 현재 거대언어모델(LLM)이 가장 어려워하는 분야 중 하나인 객체, 공간, 및 경계 개념에 대한 분석 능력을 평가한다. 'O3'는 테스트에서 저성능 모드로 75.7%라는 전례 없는 점수를 기록했으며 고성능 컴퓨팅 모드에서는 87.5%까지 성능을 끌어올렸다. 이 성과는 이전 모델 및 경쟁 모델과 비교했을 때 압도적이다. 지난해 출시된 첫 고급 추론 모델 'O1'은 32%의 점수를 기록했으며 경쟁사 앤트로픽의 '클로드 3.5' 모델 역시 최고 점수가 53%에 그쳤다. 'O3'는 이와 비교해 두 배 이상의 성과를 내며 AI 추론 능력의 새로운 기준을 제시했다. 프랑수아 숄레 아크 AGI 창시자는 "'O3'는 AI 능력에서 중요한 비약적 발전을 보여줬다"며 "'GPT' 계열 모델에서는 볼 수 없었던 새로운 작업 적응 능력을 증명했다"고 평가했다. 숄레가 과거 미국 지디넷과의 인터뷰에서 AGI 실현 가능성에 대한 회의를 드러낸 점을 고려할 때 이번 평가는 보다 주목할 만하다. 코딩 분야에서도 'O3'는 획기적인 성과를 거뒀다. 전 세계 프로그래머들이 알고리즘 문제를 해결하며 경쟁하는 권위 있는 대회 플랫폼인 '코드포스'에서 2천700점을 기록하며 글로벌 상위 0.2% 수준에 도달했다. 오픈AI에 따르면 이는 일리야 수츠케버 공동창업자의 후임으로 임명된 야쿱 파호츠키를 뛰어넘는 성과로, 회사 내에서도 3천점을 넘는 사람은 단 한 명뿐이다. 마크 첸 오픈AI 부사장은 "내 점수는 코드포스 2천500점 정도"라면서 현재 추세로 보면 "'O3'가 몇 달 내로 3천점을 넘을 것 같다"고 말했다. 현실 적용 난망·비용 문제 '천문학적'…AGI 실현은 '과제' 다만 업계 일각에서는 O3의 성과가 곧 AGI의 실현으로 이어질 것이라는 기대에 회의적인 시선을 보내고 있다. '아크 AGI'가 특정 데이터셋에만 최적화 돼 실제 현실 세계를 충분히 반영하지 못할 가능성이 있다는 지적이 대표적이다. 게리 마커스 뉴욕대 인지심리학과 교수는 "아크 AGI 테스트가 실제 AI 능력을 얼마나 잘 반영하는지 의문"이라며 "쉽마스 당시의 'O3' 시연은 벤치마크를 위해 AI 회사가 엄청난 돈을 쓸 때 가능한 성과를 보여주는 것일 뿐 실제 세계 응용 사례를 보여주는 것이 아닐 수 있다"고 평가했다. 프로그래밍 분야에서도 'O3'의 실제 적용에 한계가 있다는 의견이 나온다. 개별 작업에서 인간 대다수를 초월한 수준의 성능을 보여줬음에도 시스템 설계 및 문제 해결 등 여러 유형의 작업을 동시에 수행하면서 인간 고객과 소통해야 하는 프로그래머라는 직업의 특성상 'O3'가 이를 대체하기에는 여전히 한계가 있다는 분석이다. 한 국내 AI 업계 관계자는 "'O3'는 AI가 인간보다 프로그래밍에서 뛰어난 성과를 낼 수 있다는 점에서 컴퓨터 공학의 '알파고 모먼트'를 불러온 것이라고 할수 있다"면서도 "다만 바둑에서처럼 특정 작업에서만 뛰어난 능력을 보이는 것이지 다양한 상황에서 적용 가능한 범용적인 능력을 갖췄다는 뜻은 아니다"라고 평가했다. 또 'O3'의 성능 뒤에는 높은 비용이라는 걸림돌이 있다. 저성능 모드에서는 약 20달러(한화 약 2만8천원) 수준의 비용으로 아크 AGI' 75.7%의 성능을 발휘하지만 고성능 모드에서는 성능이 87.5%로 향상되는 대신 비용이 3천~6천 달러(한화 약 420만~840만 원)까지 상승한다. 포브스에 따르면 'O3'가 아크 AGI에서 최고 점수를 기록하기 위해 투입된 컴퓨팅 비용은 수십만 달러에 달할 것으로 추정된다. 오픈AI가 소스 코드를 비공개하고 있어 정확한 비용 구조를 확인하기는 어렵지만 CoT 기법은 본질적으로 더 많은 컴퓨팅 자원을 장시간 사용해야만 보다 우수한 결과를 생성한다는 분석이다. 이에 'O3'가 활용하는 고급 추론 기법을 통해 인간 수준의 범용적인 AI가 달성된다 해도 천문학적인 초기 비용으로 대규모 상용화는 점진적으로 이뤄질 가능성이 크다는 예측이 제기된다. 오픈AI 역시 이러한 가능성을 인지하고 있는 것으로 관측된다. 샘 알트먼 오픈AI 대표는 지난달 뉴욕타임스 '딜북 서밋'에서 "내 생각에 우리는 대부분의 사람들이 예상하는 것보다 더 빨리 AGI에 도달할 것"이라며 "다만 그 중요성은 생각보다 크지 않을 것"이라고 말했다.

2025.01.03 17:35조이환

오픈AI, 초고성능 추론 AI 모델 'o3' 공개…쉽마스 대장정 마무리

오픈AI가 12일간의 쉽마스 행사를 마무리하며 초고성능 추론 인공지능(AI) 모델 'o3'와 소형 모델 'o3 미니'를 공개했다. 내년 1월 말 'o3 미니'를 먼저 출시한 뒤 곧이어 'o3'를 정식으로 내놓을 예정으로, 업계는 기존 AI 모델의 한계를 뛰어넘는 기술력에 주목하고 있다. 오픈AI는 지난 20일(현지시간) 쉽마스 마지막 날 행사에서 'o3' 모델을 선보이며 AI 기술의 새로운 시대를 예고했다. 'o3'는 지난 9월 오픈AI가 발표한 고급 추론 모델인 'o1'의 후속 모델로, 영국의 통신사 'O2'와의 혼동을 피하기 위해 명칭을 조정한 것으로 알려졌다. 이 모델은 프로그래밍, 수학, 과학 등 여러 분야에서 탁월한 성능을 보였으며 고급 추론 모델 벤치마크인 '아크 일반인공지능(ARC AGI)'에서 87.5%라는 높은 점수를 기록했다. 수학 올림피아드 예선에서는 96.7%의 정답률을 달성하고 박사급 과학 질문 데이터셋에서도 87.7%에 이르는 정확도를 보인 것으로 알려졌다. 특히 프로그래밍 기술 평가 플랫폼 코드포스에서 2천700점 이상의 점수를 기록하며 세계 상위 0.2% 수준의 '인터내셔널 그랜드마스터' 실력을 입증했다. 업계 전문가들은 'o3'의 성능이 국내 상위 100위권에 해당하는 수준으로 평가하고 있으며 오픈AI 내부에서도 이를 뛰어넘는 프로그래머는 극히 드문 것으로 알려졌다. 프랑수아 쇼레 아크 AGI 창업자는 "'o3'는 LLM의 근본적인 한계를 해결한 모델"이라며 "단순한 점진적 진보가 아니라 완전히 새로운 영역으로, 중대한 과학적 관심이 필요하다"고 평가했다. 다만 'o3'의 우수한 성능 뒤에는 높은 비용이 뒤따른다. 저성능 모드에서는 약 20달러(한화 2만8천원) 정도 비용으로 아크 AGI 기준 75.7%의 성능을 내지만 고성능 모드에서는 성능이 87.5%로 오르는 대신 최대 3천~6천 달러(한화 약 420~840만원)까지 비용이 증가하기 때문이다. 이러한 높은 비용 구조로 'o3'는 주로 기업이나 연구기관과 같은 특정 사용자층에서 활용될 가능성이 높다. 샘 알트먼 오픈AI 대표는 "'o3'는 'o1'과 마찬가지로 응답 전에 먼저 생각하도록 훈련했다"며 "이는 AI의 '다음 단계'를 시사한다"고 강조했다. 오픈AI는 이번 쉽마스에서 연이어 새로운 기술과 기능을 공개하며 AI 활용 범위를 크게 확장했다. 'o3' 공개 이전에는 지난 11일 동안 ▲ 'o1' 및 '프로' 모델 발표 ▲ 강화 학습 미세 조정 프로그램 ▲ 영상 AI '소라' ▲ '캔버스' 기능 ▲ 애플 인텔리전스 통합 ▲ '고급 음성 모드' 및 '산타 모드' 추가 ▲ '프로젝트' 기능 발표 ▲ '챗GPT 서치' 기능 무료 공개 ▲ 'o1' 추론 모델 API 공개 ▲ 유선전화 및 왓츠앱 기반 '챗GPT' ▲ 데스크톱 앱 업데이트 등을 발표해 주목을 받았다. 오픈AI는 1일차에 정확도와 응답 속도를 개선한 'o1' 모델을 발표했다. 이 모델은 데모 버전에서 탈피해 멀티모달 처리와 복잡한 논리 문제 해결 능력을 갖췄으며 '프로' 구독 서비스를 통해 최신 모델과 고급 음성 모드에 무제한 접근이 가능하다. 2일차에는 연구자, 대학, 기업을 대상으로 자체 AI 모델 성능을 개선할 수 있도록 돕는 강화 학습 미세 조정 프로그램이 발표됐다. 이 프로그램은 다양한 산업 분야에서 맞춤형 AI 기술을 활용할 가능성을 열었다. 3일차에는 텍스트 입력만으로 동영상을 제작하고 기존 이미지에 애니메이션을 입힐 수 있는 영상 AI '소라'가, 4일차에는 파이썬 코드 실행·그래픽 미리보기 등이 가능한 '캔버스' 기능이 연이어 공개됐다. 오픈AI는 이를 통해 멀티미디어 콘텐츠 제작 및 AI 협업의 문턱을 낮췄다는 평가를 받았다. 5일차에는 애플 인텔리전스 통합이 이뤄졌다. 6일차에는 '고급 음성 모드'와 '산타 모드'가 추가돼 서비스 완성도를 한층 높였다. 고급 음성 모드는 기존 실시간 음성 모드에 영상 인식 기능까지 합쳐져 사용자가 움직이는 사물을 보여주면 AI가 이를 인식하고 답변할 수 있다. 산타 모드는 크리스마스 분위기를 반영한 재미 요소로 관심을 모았다. 7일차에는 대화를 업무 단위로 관리하는 '프로젝트' 기능이 발표됐다. 사용자 맞춤형 지침 설정과 파일 업로드 등으로 복잡한 작업 환경에서도 효율적으로 대화를 이어갈 수 있어 생산성을 대폭 높일 것으로 기대된다. 8일차에는 'GPT-4o' 기반 웹 검색 기능인 '챗GPT 서치'를 무료로 전면 공개했다. 사용자 질문에 따라 자동으로 웹 검색을 실시해 뉴스, 스포츠, 주식 관련 정보를 요약하고 콘텐츠로도 제공한다. 9일차에는 레벨 5 개발자 전용으로 'o1' 추론 모델 API를 공개했다. 사실 확인 능력, 외부 데이터 연동, 이미지 분석 등 고급 기능을 갖췄으나 비용이 다소 높다는 점이 특징이다. 10일차에는 미국에서 유선전화로 '챗GPT'와 대화할 수 있는 기능이 소개됐다. 기술 소외 계층과 접점을 넓히기 위한 행보로, 소셜미디어 왓츠앱 기반의 텍스트 대화도 별도 계정 없이 제공된다. 11일차에는 '챗GPT' 데스크톱 앱이 업데이트돼 다른 앱으로 전환하지 않고도 작업 화면을 공유하며 AI와 협업할 수 있게 됐다. '엑스코드(Xcode)', '워프(Warp)', '노션(Notion)' 등과 연동해 코드 생성부터 콘텐츠 제작까지 자연어로 처리가 가능하다는 점이 시연됐다. 이번달 내내 진행된 오픈AI 쉽마스는 회사의 AI 기술이 어디까지 발전해왔고 또 어디로 향하고 있는지를 가늠케 한 일정이었다. 특히 마지막 날 공개된 'o3'와 'o3 미니'는 전례가 없는 압도적인 성능과 함께 AI의 새로운 과제를 제시하며 업계의 주목을 받고 있다. 샘 알트먼 오픈AI 대표는 "이번 쉽마스는 우리가 지난 1년간 얼마나 진화했는지를 보여주는 기회"라며 "모든 사용자가 AI를 통해 더 나은 경험을 할 수 있도록 계속 노력할 것"이라고 강조했다.

2024.12.22 09:21조이환

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

블록체인 가상자산, '입법지연·예산삭감·규제' 악순환 끊어야

"최대 600만원 할인해도 안 팔려"…현대차, 전기차 생산 또 멈춘다

SKT "정보 유출 없다 '확신'...있더라도 끝까지 책임"

MS "멀티 에이전트 시대 온다…'애저 AI 파운드리' 역할 커져"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현