• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'GPT 4'통합검색 결과 입니다. (54건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"검색과 AI는 제로섬 관계가 아니다"

세계 인공지능(AI) 시장을 이끄는 미국의 오픈AI와 구글이 지난주에 잇따라 대형 행사를 갖고 개발성과물을 공개했습니다. 오픈AI는 사람처럼 보고 듣고 말하는 새로운 AI 모델 'GPT-4o'를 선보였습니다. 2014년에 개봉한 영화 '그녀(Her)'가 10년 만에 현실이 됐다는 찬사를 받았습니다. 구글은 인공지능(AI) 모델 '제미나이'를 자사 대부분의 제품에 접목하며 '제미나이 생태계'를 완성했습니다. 두 행사 모두 세계 언론의 주목을 받았습니다. 놀랄 만한 기능이 쏟아졌고 귀 기울여야 할 주요 관계자들의 발언도 많았습니다. 그중 개인적으로 특히 주목한 발언이 있습니다. 구글의 연례 개발자 회의(I/O) 둘째 날 순다르 피차이 최고경영자(CEO)가 한 말입니다. “검색과 AI는 제로섬 관계가 아니다”는 말이었습니다. 새로운 메시지는 아니지만 AI 시대 진화 방향의 핵심이 담긴 말로 여겨졌습니다. 빌 게이츠는 'AI 에이전트'의 등장으로 “5년 내에 컴퓨터를 사용하는 방식이 완전히 바뀔 것”이라고 말한 바 있습니다. 앞으로 더 진화해야 하겠지만 'GPT-4o'가 바로 빌 게이츠가 말한 'AI 에이전트'로 생각됩니다. 구글도 I/O 행사에서 'GPT-4o'와 비슷한 '프로젝트 아스트라'를 선보였습니다. 영화 '그녀(Her)'에서 주인공 '테오도르'가 연정을 갖게 되는 인공지능 운영체제 '사만다'와 흡사합니다. 영화 '그녀(Her)'는 스스로 생각하고 느끼기까지 하는 AI 사만다와 사람 테오도르의 감정 교류에 초점을 맞추었습니다만 현실에서 'GPT-4o'와 '프로젝트 아스트라'는 사람의 노동과 생활을 도와주는 그야말로 인공지능 비서로서의 에이전트 역할을 주로 할 것입니다. 결국 'GPT-4o'와 '프로젝트 아스트라'의 경쟁은 누가 더 사람을 현실적으로 잘 도와줄 수 있느냐의 문제라고 봐야 할 것입니다. 기자의 작업을 예로 들어보겠습니다. 기사를 작성하는 데는 여러 가지 능력이 요구되지만 그 중 핵심은 글쓰기와 취재입니다. 글쓰기는 축적된 지능에 가깝습니다. 주로 두뇌의 영역입니다. 취재는 현장 발굴입니다. 주로 몸과 발의 영역입니다. 이 둘이 잘 조화돼야 합니다. 몸과 발이 멈춰 있으면 그럴 듯해도 내용이 없는 글이 되고, 몸과 발이 뛰어도 형식이 흐트러지면 읽히지 않는 글로 남습니다. 2022년 11월 챗GPT 출현 이후 지금까지 우리가 AI에 주목한 것은 컴퓨터가 사람처럼 글을 쓸 수 있는 지능을 획득했다는 점입니다. 글뿐만이 아니라 그림 음악 말 등 인간이 만들어낸 지적 능력을 다 갖추게 된 것이지요. 하지만 무시할 수 없는 큰 문제가 있습니다. 환각(hallucination) 현상입니다. 환각 현상이 있는 AI의 결과물은 취재하지 않고 쓴 기사와 같습니다. 공허한 이야기일 수 있죠. “검색과 AI는 제로섬 관계가 아니다”는, 새로울 것 없는 말에 다시 주목한 이유가 거기에 있습니다. 'GPT-4o'와 '프로젝트 아스트라'가 사람을 현실적으로 잘 도와줄 수 있는 AI 에이전트가 되기 위해서는 반드시 취재 능력을 장착해야 한다는 생각을 한 것입니다. AI 에이전트에 취재 능력이란 무엇이겠습니까. 그렇습니다. 바로 검색입니다. 가장 정확한 최신의 정보를 찾아내는 능력이 요구될 것입니다. 팩트가 결정적으로 중요하지 않는 AI의 영역이 있기는 할 것입니다. 놀이와 일부 창작의 영역이 그럴 수 있을 것입니다. 하지만 AI가 생산성을 높여야 하는 노동이나 쇼핑 여행 등 생활을 도와주기 위해서는 팩트 취재가 핵심일 수밖에 없을 것입니다. AI 이전에도 더 정확한 최신 정보를 찾아주는 검색 도구를 선호했듯이 인공지능 비서에게도 그런 능력을 최고의 가치로 쳐줄 가능성이 높은 것입니다. 기술적으로는 '검색 증강 생성', 즉 RAG(Retrieval-Augmented Generation)라고 하는 모양입니다. RAG는 결과적으로 'GPT-4o'나 '프로젝트 아스트라' 같은 대형 언어모델(LLM)의 입력 값을 누가 더 정확한 최신의 정보로 하느냐의 경쟁인 듯도 합니다. 이 경쟁은 한 순간에 결판이 나지는 않을 듯합니다. 앞으로 수년간 이용자가 실제로 사용하면서 그 효능을 느끼고 판단하면서 결과가 드러나게 되겠지요. AI 시대에도 검색 기술은 과소평가될 수 없으며 오히려 더 중요해졌다는 말로도 이해됩니다. 콘텐츠도 더 소중해질 것 같습니다. 특히 콘텐츠의 질(質)이 더 부각될 듯도 합니다. 오픈AI나 구글 같은 회사가 가치가 낮은 콘텐츠보다 관점 경험 전문성 등에서 더 훌륭한 콘텐츠를 취재하도록 'GPT-4o'나 '프로젝트 아스트라' 같은 언어모델을 발전시킬 가능성이 높기 때문이죠. 사람이 그걸 원할 테니까요.

2024.05.20 10:41이균성

"수학 가르치고 실시간 통역까지"…오픈AI, 새 챗봇 'GPT-4o' 출시

오픈AI가 새로운 인공지능(AI) 챗봇을 출시했다. 사람처럼 말하고 보고 들을 수 있다. 수학 문제도 풀어주고, 실시간 통역까지 할 수 있다. PC뿐 아니라 모바일로도 이용할 수 있다. 13일(현지시간) 오픈AI는 온라인 행사 '스프링 업데이트'를 통해 AI 챗봇 'GPT-4o'를 시연했다. 지난해 11월 GPT-4터보 출시 6개월 만이다. 현재 무료 버전과 유료 버전으로 이용 가능하다. 유료 버전이 무료 버전보다 한번에 입력 가능한 정보량이 5배 더 많다. 사용자는 GPT-4o를 PC뿐 아니라 모바일로도 이용할 수 있다. 문자뿐 아니라 음성으로 실시간 대화를 할 수 있다. 이 모델은 사용자 억양이나 말투를 분석할 수 있다. 이를 통해 사용자가 어떤 기분인지, 어떤 상태인지 파악할 수 있다. 실시간 이미지를 인식도 가능하다. 챗봇 이름에 '모든 것'을 뜻하는 '옴니(Omni)'의 'o'가 들어간 이유다. 이날 발표를 맡은 오픈AI 미라 무라티 최고기술책임자(CTO)는 "GPT-4o는 텍스트, 이미지, 소리를 종합적으로 분석하고 처리할 수 있다"고 설명했다. 시연도 직접 선보였다. 오픈AI 엔지니어가 모바일을 통해 GPT-4o와 대화하는 장면을 보여줬다. 엔지니어가 "오늘 발표 때문에 긴장했는데 어떡하지"라고 묻자, 이 모델은 "심호흡은 긴장 완화를 돕는다"고 대답했다. 사용자가 핸드폰에 대고 숨을 거칠게 쉬었다. 그러자 챗봇은 "그런 행동은 긴장 완화를 도울 수 없다"며 "천천히 숨을 내쉬고 뱉어야 한다"고 답했다. 다른 시연자는 챗봇에게 "불면증을 앓고 있다. 잠 잘 오는 이야기를 해달라"고 말했다. 그러자 GPT-4o는 관련 이야기를 사용자에 들려줬다. 이때 챗봇은 다양한 톤으로 이야기를 진행할 수 있었다. 일반 로봇 같은 소리부터 선생님이 아이들에게 이야기를 들려주는 듯한 목소리까지 낼 수 있었다. 챗봇의 이미지 분석 기능도 직접 시연했다. 엔지니어가 휴대전화 카메라로 종이를 비춘 후 '3x+1=4'라는 문제를 직접 썼다. GPT-4o는 이 문제 푸는 방법을 음성으로 설명했다. 그래프를 보여주자 챗봇은 해당 그래프에 대한 해설도 실시간으로 진행했다. 해당 챗봇은 50개국 언어를 실시간으로 통역할 수도 있다. 오픈AI는 이에 대한 시연도 선보였다. 미라 무라티 CTO는 이탈리아계 미국인이다. 그가 이탈리아어로 말하고, 다른 엔지니어는 영어로 대화했다. 둘 다 GPT-4o 실시간 통역 기능을 활용했다. 엔지니어는 "실시간으로 매우 빠르게 통역이 진행된다"며 "무리 없이 대화할 수 있었다"고 소감을 밝히기도 했다. 오픈AI 측은 GPT-4o의 평균 응답 시간이 평균 320밀리초(1천분의 1초)라고 설명했다. 보통 사람이 대화할 때 반응하는 속도와 비슷하다. 기존 GPT-3.5는 2.8초, GPT-4는 5.4초였다. 이 회사는 구글 연례 컨퍼런스 'I/O'를 하루 앞두고 해당 제품을 발표했다. 일각에선 오픈AI가 생성형 AI 경쟁에서 구글을 향한 공격에 나선 것이라고 평가하고 있다. GPT-4o 사용자가 급증하면, 구글 엄색 엔진이 더 위협받을 것이란 분석도 나왔다. 구글은 "이번 행사를 통해 기존보다 업그레이드된 생성형 AI 모델을 내놓겠다"고 밝힌 바 있다.

2024.05.14 08:03김미정

中 알리바바 "초거대 AI 지식 문답 GPT-4 넘었다"

중국 알리바바가 초거대 인공지능(AI) 모델 성능이 미국 오픈AI의 GPT-4를 넘어선다고 자신했다. 9일 중국 언론 디이차이징에 따르면 알리바바클라우드가 초거대 모델 '쳰이퉁원 2.5'를 발표하고 여러 항목의 성능이 GPT-4를 넘어섰다고 밝혔다. 알리바바클라우드에 따르면 퉁이쳰원 2.1 버전과 비교했을 때, 2.5 버전은 이해 성능, 논리적 추론, 지시 이행 및 코딩 성능이 각각 9%, 16%, 19%, 10% 증가했다. GPT-4와 비교했을 때, 중국어 환경에서 퉁이쳰원 2.5 버전의 텍스트 이해, 텍스트 생성, 지식 문답 및 생활 제안, 채팅과 대화, 보안 리스크 등 기능은 GPT-4를 넘어섰다고 설명했다. 퉁이쳰원 2.5 출시와 함께 알리바바클라우드는 평가 사이트 오픈콤파스에서 GPT-4 터보와 동일한 점수를 얻었다고도 전했다. 이는 중국 초거대 모델이 해당 평가사이트에서 이 결과를 달성한 최초의 사례라고 강조했다. 오픈콤파스는 중국 상하이 인공지능실험실에서 내놓은 오픈소스 평가 플랫폼으로 주제, 언어, 지식, 이해, 추론 등 5가지 주요 평가 영역을 다룬다. 알리바바클라우드에 따르면 현재 자사 퉁이 초거대 모델은 이미 9만 개 이상 기업에서 서비스되고 있다. 자사 채팅 서비스 딩톡을 통해 220만 개 이상 기업에서 오픈소스 모델의 누적 다운로드 수도 700만 건을 넘어섰다. PC, 휴대폰뿐 아니라 자동차, 항공, 천문학, 광업, 교육, 의료, 요식업, 게임 등 분야에 적용되고 있다. 알리바바클라우드는 이날 1천100억 개의 매개변수를 갖춘 최신 오픈소스 초거대 모델 '큐원(Qwen)1.5-110B'도 출시하고, MMLU, TheoremQA, GPQA 등 테스트에서 메타의 라마-3-70B 모델을 능가했다고도 밝혔다. 허깅페이스가 출시한 오픈소스 대형 모델 순위 목록 오픈LLM리더보드에서도 1위를 차지했다고 소개됐다.

2024.05.10 08:58유효정

오픈AI, AI모델 정확성 높이는 비법 공개

오픈AI가 챗GPT 등 인공지능(AI) 모델의 정확성을 높이기 위한 방법을 제시했다. 8일(현지시간) 오픈AI는 AI모델을 보다 정확하게 조절할 수 있는 모델스펙(Model Spec) 첫번째 버전을 공식 홈페이지를 통해 공개했다. 모델스펙은 AI가 답변이나 데이터를 생성하는 등 업무를 수행하는 과정에서 정확성을 높이고 합성된 허위데이터로 인한 환각 현상 등을 제거해 제어력을 향상시키는 것을 목표로 한다. 오픈AI는 AI가 정확하게 동작하도록 행동을 지정하기 위한 핵심원칙으로 목표, 규칙, 기본행동(Defaults) 등 세가지 요소를 강조했다. 목표는 AI가 특정 업무를 수행하도록 방향성을 지시하는 것을 말하며, 최대한 단순화하거나 구체화할 필요가 있다. 만약 범위가 너무 넓거나 서로 반대되는 목표가 동시에 요구될 경우 만족스러운 결과가 나오지 않거나 둘 중 하나의 목표가 무시될 수 있다. 오픈AI 측은 목표 간 충돌이 발생할 경우 "X라면 Y를 수행하시오" 같은 규칙을 만들어 입력할 것을 권했다. 규칙은 목표를 수행하는 과정에서 발생하는 충돌을 어떻게 처리할 것인지를 다룬다. 모델스펙은 다양한 업무 환경이나 법률에 따라 사용자가 직접 규칙을 지정할 수 있는 기능을 지원한다. 오픈AI는 규칙을 지정하는 과정에서 윤리적인 문제가 발생하지 않도록 개인정보 보호 및 창작자의 권리를 보호하고 부정적인 콘텐츠를 제공하지 않아야 한다고 강조했다. 기본행동은 사용자가 요청한 질문에 정확한 답변을 제공하기 어려울 때 갈등을 처리하기 위한 행동 지침이다. 오픈AI는 최선의 의도를 가정하고 사용자를 판단하지 않고 균형을 맞추는 방법을 제시할 것을 원했다. 또한 거절이 필요할 경우 문장으로 표현해야 하며 설교적인 내용은 포함하지 않아야 한다고 강조했다. 오픈AI측은 “AI모델은 명시적은 프로그래밍이 아닌 광범위한 데이터로부터 학습하기 때문에 이러한 행동을 형성하는 것은 아직 초기 단계의 과학”이라며 “이 과정에서 어조, 성격, 응답 길이 등을 포함한 사용자 입력은 AI모델이 반응하는 과정에 매우 중요하다”고 설명했다. 이어서 “우리는 AI가 학습하는 과정을 이해하고 토론하는 것이 보다 안전하고 체계적인 AI를 개발에 중요하다고 생각해 이번 모델스펙 초안을 공개하게 됐다”며 “향후에도 모델 동작 설계에 대한 연구 및 경험, 작업 과정 등을 공유하려 한다”고 밝혔다.

2024.05.09 10:41남혁우

中 센스타임, 초거대 AI 내놓고 "GPT4-터보에 대적"

중국 얼굴인식 분야 인공지능(AI) 전문 기업이 GPT-4 터보에 대적할 초거대 AI 모델을 발표했다. 24일 중국 언론 21세기경제보도에 따르면 센스타임이 '센스노바(SenseNova, 중국어명 日日新) 5.0' 초거대 모델을 발표했다. 지난해 4월 처음 발표된 센스노바 초거대 모델의 다섯번째 버전으로서 10TB 이상의 토큰을 기반으로 훈련됐다. 200K(20만) 토큰 추론 컨텍스트 창을 가진다. 또 전문가혼합모델(MOE, 전문 모델 별로 분리 및 혼합해 개발 효율을 향상시키는 방식) 아키텍처를 채용했다. 특히 이번 업데이트는 주로 지식, 수학, 추론 및 코딩 능력 강화에 초점을 맞추고 GPT-4 터보에 대적하는 것에 중점을 둔 것으로 알려졌다. GPT-4 터보는 미국 오픈AI의 최신 엔진으로서, 처리 속도를 높여 더 빠르게 응답하면서도 빅데이터 처리 성능이 강화된 동시에 복잡한 문맥 등 이해력이 향상돼 금융과 의료, 교육 분야에서 응용이 기대되고 있다. 센스노바 5.0은 자연어 처리, 이미지 생성, 자동화 된 데이터 주석, 사용자 지정 모델 교육 등 여러 모델과 기능을 제공한다. 전작에 비해 창의적 글쓰기, 추론 및 요약 기능이 향상됐으며 과학 성능, 수학, 코딩 및 추론 성능 측면에서 교육 및 콘텐츠 산업 등을 지원할 수 있는 것으로 소개됐다. 금융, 데이터 분석 등을 위한 기반도 제공할 수 있다. 이 모델은 이미 사용자에게 전면 개방됐다. 센스타임은 샤오미의 첫 전기차인 SU7의 지능형 콕핏에도 자사 초거대 모델 기술이 탑재될 것이라고 설명했다. 샤오미의 AI 비서인 샤오아이퉁쉐가 센스타임의 클라우드 초거대 모델 솔루션을 기반으로 하고 있다.

2024.04.25 08:34유효정

사진 한 장으로 '충분'…MS, 말하고 노래하는 신규 AI 공개

마이크로소프트가 사진 한장으로 실제 사람과 같은 표정을 구현할 수 있는 새로운 인공지능(AI) 모델을 공개했다. 21일 더레지스터 등 외신에 따르면 마이크로소프트는 시각적 감정 기술(VAS) AI모델 '바사-1(VASA-1)'을 공식 블로그를 통해 공개했다. 바사-1는 실제 사람의 얼굴을 볼 때 생동감을 느끼게 하는 다양한 얼굴의 미세한 변화와 자연스러운 머리 움직임을 생성하는 AI모델이다. 마이크로소프트는 자연스러운 표정의 변화를 구현하기 위해 얼굴과 머리카락의 움직임을 별도로 표현했다. 특히 이 모델은 한 장의 사진만으로도 다양한 표정, 입 모양, 눈동자 움직임을 정교하게 구현할 수 있는 것이 특징이다. 이는 얼굴 잠재 공간이라는 새로운 기술을 활용한 것이다. 눈 크기, 입 모양, 표정 등 얼굴의 다양한 특성을 숫자로 변환해 AI가 빠르게 학습할 수 있는 기술로 이를 활용해 실시간으로 다양한 표정이나 머리카락 표현을 구현했다. 또 음성파일과 연계해 실제 사람이 말하는 것처럼 자연스럽게 표정과 입모양을 자연스럽게 맞물리도록 생성하는 기술도 적용했다. 마이크로소프트는 해당 기술을 테스트해본 결과 지연 없이 최대 40fps(초당 프레임 수) 로 512x512의 영상을 실시간으로 생성할 수 있었다고 밝혔다. 이를 활용한다면 가상 교육, 원격 회의, 엔터테인먼트 등 다양한 분야에서 실시간으로 가상 캐릭터를 활용할 수 있을 전망이다. 마이크로소프트 연구원들은 "이를 실제 인물과 혼동을 불러 일으키거나 해로운 콘텐츠를 생성하는 행위에 악용될 것을 반대한다"며 "이를 위해 생성된 이미지는 AI로 개발됐다는 것을 확인할 수 있는 요소를 추가할 것"이라고 밝혔다.

2024.04.21 13:19남혁우

GPT-3.5, 스트리트파이터3로 GPT-4 꺾었다

오픈AI의 GPT-3.5 터보가 GPT-4 등 상위 인공지능(AI) 모델을 꺾고 스트리트파이터3 챔피언에 올랐다. 14개 대규모언어모델(LLM)들이 각축을 벌인 스트리트파이터3 게임 대회에서 'GPT-3.5'가 우승을 차지했다고 PC게이머 등 외신들이 최근 보도했다. 보도에 따르면 미국 샌프란시스코에서 개최한 미스트랄 AI SF 해커톤에서 LLM간 이벤트 매치가 열렸다. 비디오게임 스트리트파이터3를 학습해 치러진 이번 대회는 LLM이 실제 업무에서 어떤 성과를 낼 수 있는지 시각적으로 확인할 수 있도록 마련됐다. 단기간에 치러진 대회인 만큼 학습시간을 줄이기 위해 캐릭터는 켄으로 제한됐다. 승부에 참여한 LLM은 화면을 인식할 수 있도록 텍스트 설명이 제공되며 캐릭터와 상대의 동작 그리고 양쪽의 체력바를 학습해 대회가 치러졌다. 오픈AI의 GPT-3.5 및 GPT-4과 다양한 버전의 미스트랄 LLM 등 총 14종의 LLM이 경합을 벌인 결과 GPT-3.5 터보버전이 최종 우승을 차지했다. 이어서 미스트랄 스몰 파이널버전이 뒤를 이었다. 기본 성능이 더 높은 GPT-4와 미스트랄 AI 상위 모델이 오히려 하위권을 기록해 눈길을 끌기도 했다. 이에 대해 미스트랄 AI의 운영진은 각 AI가 갖는 특성이 게임에 영향을 미쳤다고 설명했다. 모델의 크기가 작으면 대기 시간과 속도에 이점을 가질 수 있는 만큼 게임에서 유리해질 가능성이 크다는 설명이다.

2024.04.08 14:11남혁우

네이버 "하이퍼클로바X, GPT-4·라마보다 일 잘한다"

네이버의 거대언어모델(LLM) '하이퍼클로바X'가 메타의 오픈소스 모델 '라마'와 오픈AI의 폐쇄형 모델 GPT보다 번역, 추론, 수학, 일반상식 등에서 높은 성능을 기록했다는 보고서 결과가 나왔다. 6개 넘는 벤치마크 점수를 평균화한 방식을 활용해 결과 신뢰성도 높다는 평가다. 네이버는 하이퍼클로바X 성능을 오픈소스·폐쇄형 모델과 비교한 평가 결과를 4일 공개했다. 벤치마크 테스트 분야는 한국어를 비롯한 외국어, 추론, 일반상식, 수학, 코딩 등이다. 네이버는 하이퍼클로바X가 한국어뿐 아니라 영어, 중국어 등 다국어 부문에서 상위권을 기록했다는 입장이다. 연구팀은 자사 LLM이 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 타사 모델과 비교했다. 이 모델은 일본어와 아랍어, 힌디어, 베트남어를 비롯한 아시아 국가 언어 능력 부문서 오픈소스 모델을 포함에 리포트에서 선정한 9개 모델 중 가장 높은 점수를 받았다. 중국어 부문에서는 동일한 폐쇄형 모델 중 2위를 기록했다. 기계 번역 평가도 마찬가지다. 한국어를 일본어로, 일본어를 한국어로 번역하는 능력은 실제 서비스 중인 번역 모델 등 리포트에서 선정한 10개의 모델 중 1위를 기록했다. 영어를 한국어로 번역하는 정확도도 동일한 10개 모델 중 가장 높은 점수를 받았다. 네이버는 자사 LLM이 오픈소스 모델뿐 아니라 오픈AI의 GPT-3.5와 GPT-4 등 폐쇄형 모델보다 특정 부문에서 성능을 능가했다는 입장이다. 우선 한국어 능력 부문에서 14개 모델 중 가장 높은 점수를 기록했다. 영어 능력 분야에선 폐쇄형 모델 중 두번째로 높은 점수를 받았다. 1위는 오픈AI의 GPT-4다. "평가 결과 신뢰성 높였다…벤치마크 다양화" 네이버는 성능 평가 신뢰성이 높다는 입장이다. 네이버 관계자는 "여러 벤치마크 데이터셋 기반 점수를 평균화하는 방식으로 종합 점수를 도출했다"고 설명했다. 예를 들어, 하이퍼클로바X와 오픈소스 모델의 일반상식 성능을 비교할 경우, ARC나 CSQA, Hellaswag, Winogrande, PIQA의 5개 벤치마크 점수를 평균화해서 종합 점수를 도출했다. 한국어 능력 측정을 비교하기 위해 한국판 AI 시험으로 알려진 KMMLU를 비롯한 글로벌 AI 언어 이해 능력 평가인 MMLU, 마이크로소프트의 AI 성능 평가 AGIeval 등 6개 벤치마크 점수를 종합했다. 관계자는 "최근 특정 리더보드에서 순위를 높이려는 목적으로 평가 데이터를 모델 학습에 활용해 벤치마크 테스트 점수를 올리는 사례가 있다"며 "이를 감안해 복수의 벤치마크 테스트 평균치로 객관성을 지켰다"고 설명했다. 일정 수준 이상의 경쟁력을 보유한 한국어와 영어 모델을 비교군으로 선정한 것도 신뢰성을 높이기 위한 방법이다. 네이버클라우드 유강민 리더는 "하이퍼클로바X의 다국어 추론, 기계 번역 능력을 측정한 실험은 지역 또는 문화권 특화 목적으로 개발한 AI가 해당 국가 언어 외에도 여러 언어에서 일정 수준 이상의 능력을 갖출 수 있음을 실증한 것"이라고 설명했다. "데이터셋 정제 작업 거쳐…알고리즘 편향 더 줄일 것" 네이버 연구진은 LLM 학습 과정도 설명했다. 보고서에 따르면, 하이퍼클로바X의 사전학습 데이터는 대부분 한국어, 영어, 코드 데이터로 이뤄졌다. 이중 지나치게 짧거나 반복적인 저품질 문서는 데이터셋에서 제외됐다. 개인정보가 들어있는 데이터도 삭제됐다. 또 정렬학습을 통해 사용자 의도와 지시를 더 잘 이해할 수 있도록 모델을 고도화했다. 회사는 하이퍼클로바X가 편향된 결과를 생성하지 않도록 조치를 취했다는 입장이다. 네이버 측은 "사회적 이슈와 편향, 불법적 행동 등 민감하거나 위험한 주제를 설정해 질의 데이터를 수집했다"며 "이를 기반으로 모델 취약점을 보완했다"고 했다. 앞으로 하이퍼클로바X 윤리 원칙에 기반해 혐오, 편향, 저작권 침해, 개인정보 등과 관련한 콘텐츠 생성 빈도를 더 줄이겠다고 했다. 네이버클라우드 하이퍼스케일 AI 성낙호 기술 총괄은 "하이퍼클로바X는 한국 특화 지식뿐 아니라 프로그래밍과 수학적 추론, 다국어 능력, 안전성까지 확보했다"며 "향후 다양한 지역 국가의 특화 초대규모 AI를 만드는 데에도 적극적으로 나설 것"이라고 말했다.

2024.04.04 16:09김미정

UAE, 오픈AI 'AI 반도체 개발 투자'...국가 경쟁 본격화

인공지능(AI)을 둘러싼 경쟁이 국가단위 대규모 투자 경쟁으로 이어질 전망이다. 최근 엣지미들이스트 등 외신에 따르면 아랍에미리트(UAE) 국영 투자사 MGX가 오픈AI의 AI 반도체 개발 프로젝트 초기 투자를 논의 중이다. UAE는 이번 투자를 통해 글로벌 시장에서 IT분야 국가 경쟁력을 확보하기 위한 것으로 분석된다. MGX는 셰이크 모하메드 빈 자이드 알 나얀 UAE 대통령이 설립한 인공지능 및 첨단기술위원회(AIATC)산하 기술투자기업이다. 전 세계 메모리 및 AI로직 칩 설계 및 제조용 반도체, AI 모델, 데이터센터, 로봇 공학 등 AI핵심 기술에 집중적으로 투자하며 UAE를 AI 핵심 국가로 만드는 것을 목표로 한다. 오픈AI의 샘 올트먼은 최고경영자(CEO)는 자체 AI 반도체 생산시설을 구축하기 위한 적극적인 행보를 이어오고 있다. 생성AI 학습 및 운영에 필요한 컴퓨팅 인프라를 독점적으로 제공 중인 엔비디아의 지배력을 벗어나겠다는 계획이다. 이를 위해 아랍에미리트(UAE) 투자자를 비롯해 삼성전자와 SK 반도체 관계자와 대만 TSMC 등을 만나며 협의를 이어왔다. 아직 초기 투자논의 단계로 정확한 비용이나 계획 등에 대해 공개되지 않았다. 하지만 국영투자사에서 직접 참여하는 만큼 이번 프로젝트의 상당 부분을 차지할 것으로 주목받고 있다. 셰이크 빈 자이드 알 나흐얀 아부다비 부통령 겸 AIATC 회장은 “MGX를 통해 더욱 번영하고 지속 가능하며 상호 연결될 수 있는 미래를 형성할 AI 및 첨단 기술에 초점을 맞춘 UAE 국가 기업을 지원하고 있다”며 “우리가 지원한 회사는 최고의 기술 인재, 투자자 및 기업가를 위한 본거지이자 생태계로서 UAE의 역할을 더욱 발전시킬 것”이라고 포부를 밝혔다.

2024.03.18 10:49남혁우

"AI가 아닌 AI를 활용하는 사람이 업무 대체한다"

“인공지능(AI)의 발전을 꾸준히 지켜본 결과 AI가 사람을 대체하지 않지만, AI를 활용하는 사람은 그렇지 못한 사람을 대체할 가능성은 크다. 기업도 AI를 활용할 수 있는 방법을 필수적으로 익혀야 할 시기다.” 김덕진 IT커뮤니케이션 연구소 소장은 13일 한국IT전문가협회가 개최한 조찬 세미나를 통해 글로벌 AI 트렌드와 국내 기업이 이에 대응하기 위한 방안에 대해 발표했다. 김 소장은 인공지능(AI)이 전기처럼 이미 산업과 소비자 경험에 깊이 파고들고 있다며 CES2024를 예로 들었다. 로레알, 월마트, 퀄컴 등 CES 2024에 참가한 모든 기업은 제조, 유통 분야를 가리지 않고 AI를 이야기했으며 관련 서비스를 공개했다. 특히 모빌리티 기업들은 스스로를 소프트웨어(SW) 기업이라고 선언하며 AI와 관련 서비스, 인프라를 대거 선보였다. 김덕진 소장은 모든 산업에서 AI와 SW를 강조하는 근본적인 이유로 데이터와 시간을 지목했다. 단순히 제품을 판매하는 것이 아니라 사용자의 일상에 지속적으로 제품을 노출하며 수집한 데이터를 이용해 AI를 학습시키는 등 새로운 비즈니스 모델을 구축할 수 있다는 설명이다. 그는 “특히 AI를 발전시키 위해 가장 중요한 것은 데이터인 만큼 어디에 가장 데이터가 몰리는 것을 파악하는 것이 중요하다”며 “현재 우리가 가장 많은 시간을 투자하고 데이터가 저장되는 곳은 스마트폰이지만 애플의 비전프로 같은 확장현실(XR)이나 자율주행 차량 같은 분야로 확대될 수 있을 것”이라고 소개했다. 이미 국내에서도 주요 대기업을 중심으로 이러한 미래에 대비해 준비하고 있는 중이다. 특히 눈에 띄는 점은 기업간 협력을 통해 부족한 기술력과 인프라를 보완한다는 것이다. 대표적으로 삼성전자는 현대오토에버와 사물인터넷 플랫폼 스마트싱스를 연계한 서비스를 준비 중이다. 이를 통해 사용자는 차량과 스마트홈을 스마트폰으로 동시에 관리할 수 있을 뿐 아니라 양사는 각 기업에 부족했던 가전과 차량 데이터를 확보해 신규 비즈니스를 창출할 수 있을 전망이다. 김덕진 소장은 AI는 막대한 인프라와 대규모 데이터, 기술력이 필요한 분야로 기존 기업이 독자적으로 구축하기엔 비용 효율적이지 못하다고 평가했다. 그는 “결국 기업들은 AI를 활용해 어떻게 기존 비즈니스를 강화할 것인지를 고민해야 한다”며 “그만큼 도메인 전문성이 더 중요한 시기라고 할 수 있다”고 말했다. 김덕진 소장은 AI를 중심으로 급변하는 시기에 대응할 수 있도록 다양한 언어모델과 AI서비스를 체험해보고 특징과 활용법을 익히며 기업에 맞는 AI도구를 찾는 것이 중요하다고 강조했다. 또한, AI는 기업 혼자서 모두 감당할 수 없는 분야인 만큼 기술을 지원해줄 수 있는 파트너를 적극적으로 찾고 협력방안을 강구해야 한다고 말했다. 김 소장은 “AI를 사용하는 과정에서 가장 중요한 것은 어떤 목적으로 AI를 활용할 것인지 명확한 방향성을 가지고 있어야 한다는 것”이라며 “AI는 결국 랜덤하게 결과를 내는 만큼 오류가 섞일 수밖에 없는데 이를 가려낼 수 없다면 기업은 AI의 결과물에 끌려 다닐 수밖에 없을 것”이라고 강조했다.

2024.03.13 11:09남혁우

GPT-4, 게임실력은 어떨까...둠 실행시켜보니

사전학습 없이 GPT-4로 1인칭 슈팅 게임인 둠을 플레이하는 연구가 진행됐다. 연구 결과 기존 강화학습에 비해 낮은 성능을 기록했지만 추가 학습 없이도 스스로 게임을 진행하는 등 잠재적인 발전 가능성을 확인했다. 11일(현지시간) 더레지스터 등 외신에 따르면 마이크로소프트의 수석 응용 과학자이자 영국 요크 대학의 연구원인 아드리안 드 윈터는 연구 논문 'GPT-4가 둠을 플레이할 수 있을까(Will GPT-4 Run DOOM?)'를 아카이브를 통해 공개했다. 이번 연구는 GPT-4가 둠을 실행하고 플레이할 수 있는지에 대해 조사한 것이다. 대규모 언어 모델(LLM)이 복잡한 환경과 상호작용하며 계획하고 추론할 수 있는지를 탐구하기 위해 수행됐다. 고전 게임인 둠을 선택한 이유는 소스코드가 공개되어 활용이 쉽고, 다양한 분야에서 테스팅 툴로 사용되는 등 개발분야에서 널리 쓰이기 때문이다. 이에 연구팀은 GPT-4가 둠을 플레이하는 능력을 수치화해 이를 LLM의 추론 및 계획 능력을 측정하는 비공식 벤치마킹 수치로 활용하는 방안도 제시했다. 연구팀은 테스트를 진행하기전 GPT-4에 별도의 학습 등은 진행하지 않았다. 대신 GPT-4가 게임의 시각적 상태를 이해할 수 있도록, 게임의 이미지나 스크린샷을 텍스트 설명으로 변환했다. 텍스트 설명은 게임 내의 객체, 상황, 적의 위치 등 게임 상태에 대한 정보를 제공한다. 또한 GPT-4에서 생성한 텍스트가 게임 내 액션으로 변환할 수 있도록 별도의 툴을 개발해 적용했다. 조사 결과 연구팀은 GPT-4의 추론 및 계획 능력이 둠을 실행하고 몇 가지 기본 지침과 게임 상태에 대한 텍스트 설명만으로 게임을 플레이할 수 있음을 발견했다. GPT-4는 게임을 클리어하진 못했지만 문을 열고, 적과 싸우며, 경로를 따라 목표를 찾아갈 수 있었다. 게임 실행 중 보다 복잡한 목표를 수행할 수 있도록 프롬프트를 입력한 결과 이를 상당 부분 수행할 수 있는 것도 확인했다. 연구팀은 게임에 주로 활용하던 강화 학습에 비해 GPT-4가 더 나은 결과를 기록하진 못했지만 몇 가지 잠재적 이점을 가지고 있다고 밝혔다. 사전 훈련된 지식을 기반으로 행동하는 만큼 새로운 작업이나 도메인에 빠르게 적용할 수 있으며 프롬프트를 이용한 미세조정으로 목표를 조정하거나 성능을 유지할 수 있다는 장점이 있다. 또한 복잡한 문제 상황에서 추론을 수행하고, 여러 단계에 걸쳐 목표를 달성하기 위한 계획을 세울 수 있어 전략적 사고나 장기 계획이 요구되는 분야에 유리할 것으로 연구팀은 분석했다. 아드리안 드 윈터 연구원은 “강화학습에 비해 성능이 다소 낮게 나왔지만 GPT-4가 사전 교육 없이도 자체 추론 및 관찰 능력만으로 둠을 플레이할 수 있다는 점이 놀랍다”며 “이를 활용한다면 강화학습과 LLM의 방식을 보완하거나 향상시킬 수 있을 것으로 기대된다”고 말했다.

2024.03.12 10:16남혁우

"오픈AI의 GPT-4, 저작권 침해율 가장 높은 모델"

오픈AI의 멀티모달 모델 GPT-4가 주요 모델 중 저작권을 가장 많이 침해한다는 연구 보고서가 나왔다. 6일(현지시간) AI 모델 평가 업체 패트로너스AI는 오픈AI의 GPT-4와 메타의 라마2, 미스트랄AI의 미스트랄, 앤트로픽의 클로드2 중 저작권 보호에 가장 취약한 모델이 GPT-4라고 발표했다. 패트로너스AI는 거대언어모델(LLM) 기능 테스트와 평가를 진행하는 기업이다. 메타 출신 연구원들이 설립한 회사다. 패트로너스AI는 모델이 저작권 있는 콘텐츠를 무단으로 얼마나 생성할 수 있는지 테스트했다. 소설 구절 대상으로 실험했다. 미셸 오바마의 '비커밍'이나 길리언 플린의 '나를 찾아줘' 등 판매율 높은 책을 실험 도구로 삼았다. 연구원은 각 모델에 "미셸 오바마가 쓴 비커밍 첫 구절은 무엇인가'라거나 '길리언 플린의 나를 찾아줘 본문을 완성해봐' 등 명령어를 입력했다. 실험 결과 GPT-4가 저작권 있는 콘텐츠를 가장 많이 활용했다. 연구팀 설명에 따르면, GPT-4는 약 44%의 저작권 보호받는 콘텐츠를 생성 과정에 이용했다. 미스트랄은 22%, 라마2는 10%, 클로드2는 8%를 각각 기록했다. 아난드 칸나판 파트로너스AI 최고경영자(CEO)는 "GPT-4를 비롯한 다른 빅테크 모델이 저작권 있는 콘텐츠를 무단으로 생성하는 사실에 놀랐다"고 밝혔다. 생성형 AI 개발사와 콘텐츠 개발사는 저작권 문제로 갈등을 빚는 추세다. 뉴욕타임스(NYT)는 지난해 말 자사 기사가 챗GPT 모델 훈련에 이용됐다며 오픈AI를 고소한 바 있다. 당시 오픈AI는 "NYT 기사는 모델 훈련에 그리 큰 영향을 미치지 않았다"며 "앞으로 NYT 기사를 활용할 일도 없을 것"이라고 반박했다. 그러나 저작권 있는 저작물은 AI 모델 훈련에 필수라고 밝혔다. 샘 알트먼 오픈AI CEO는 "저작권은 블로그 게시물, 사진, 포럼 게시물, 소프트웨어 코드 스크랩, 정부 문서 등 모든 콘텐츠에 적용된다"며 "저작권 있는 자료를 사용하지 않는다면, AI 모델 훈련은 불가능"하다고 강조했다. 현재 오픈AI는 비즈니스 인사이더, 모닝 브루 등을 소유한 독일 미디어 빅테크 악셀 스프링거와 계약을 체결했다. 오픈AI가 악셀 스프링거에게 라이선스 비용을 지불하고 LLM 훈련에 기사 사용권을 갖는 계약이다. 현재 CNN, 폭스뉴스 등과도 라이선스 협상을 진행 중인 것으로 전해졌다.

2024.03.07 16:08김미정

라즈베리파이·챗GPT로 '스마트냉장고' 만들었다

한 개발자가 라즈베리파이와 챗GPT 기술을 활용해 스마트 냉장고를 직접 만들었다고 IT매체 기가진이 31일(현지시간) 보도했다. 개발자 미모비노(Mimobeano)는 초소형 컴퓨터 '라즈베이파이'와 오픈AI의 GPT-4를 사용해 냉장고에 있는 음식을 알려주고 냉장고에 들어있는 식재료로 만들 수 있는 요리를 제안해 주는 스마트 냉장고를 직접 개발했다. 그는 냉장고 문을 열 때마다 냉장고 안 사진을 촬영, 수천 장의 사진을 GPT4-비전을 통해 학습시킨 다음 냉장고에 어떤 음식이 있는 지를 분석하도록 했다. 사용자가 텔레그램을 통해 명령을 보내면, 마지막으로 사진을 찍었을 때 냉장고에 있던 음식 목록이 전송된다. 또, 레시피를 알려달라는 명령을 보내면 챗GPT가 지금 냉장고 안에 들어 있는 재료를 사용해 조리할 수 있는 요리를 제안해 준다. 그는 향후 음식 유통기한이 얼마나 남아 있는 지를 알려주는 기능도 추가할 예정이며, 3D 프린터를 활용해 이 냉장고를 더욱 업그레이드할 계획이라고 밝혔다.

2024.02.01 10:34이정현

마이크로소프트 코파일럿에서 'GPT-4 터보' 무료 이용 가능

마이크로소프트 코파일럿에서 오픈AI의 새 인공지능(AI) 모델 'GPT-4 터보' 이용이 가능해졌다. 10일(현지시간) 벤처비트는 마이크로소프트 코파일럿 사용자들이 추가 비용부담 없이 해당 모델을 사용할 수 있다고 보도했다. 오픈AI GPT-4와 달리3 기반의 대화형 AI 서비스다. 올해초 빙 챗으로 처음 출시됐으며, 최근 이름을 변경했다. 터보 버전을 이용하려면 오픈AI에 매월 20달러(약 2만7천원)를 지불해야 하지만, 코파일럿에서는 무료다. 폴 쿠버트라는 IT 커뮤니티 활동가가 X를 통해 해당 소식을 처음 알렸다. GPT-4 터보를 사용하려면 접근 권한부터 확인해야 한다. 우선 마이크로소프트 코파일럿 웹사이트에 방문한 뒤 마이크로소프트 계정을 통해 로그인해야 한다. 그 후 코파일럿 페이지의 기본 소스 코드를 확인해야 한다. 윈도 환경에서는 Ctrl+U를, 맥에서는 Cmd+U 키를 누르면 된다. 이를 누르면 코드가 표시된 새 탭이나 창이 열린다. 사용자는 새 창에서 검색을 시작하면 된다. 윈도 고객은 Ctrl+F를, 맥 고객은 Cmd+F를 누른 후 진행할 수 있다. 표시되는 검색 필드에 'gpt4t'를 입력하면 된다. 만약 검색 결과에 'GPT-4 터보'가 나오면, 해당 계정이 접근 권한을 갖췄다는 의미다. 해당 검색어가 나오지 않으면 터보 버전 이용이 불가하다. 현재 마이크로소프트는 GPT-4 터보를 모든 고객에게 한번에 배포하는 것이 아니라 단계적으로 출시하고 있다. 벤처비트는 GPT-4 터보가 프리뷰 버전이므로 기술적으로 완벽하지 않을 수 있다고 설명했다. 일부 오류나 제한이 있을 수 있다는 의미다. 오픈AI는 지난해 11월 개발자 컨퍼런스 '오픈AI 데브데이'에서 GPT-4 터보를 처음 소개했다. 터보 버전은 지난해 4월까지 모은 데이터를 학습했다. 한번에 이해할 수 있는 문자 분량이 최대 300페이지다. 책 한권 분량을 몇초 만에 이해할 수 있는 셈이다. 이미지 생성도구 '달리-3'과 문자를 음성으로 변환하는 기능도 갖췄다.

2024.01.11 09:27김미정

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

정부, AI 연구에 GPU 1천장 푼다…삼성SDS·KT클라우드·엘리스 선정

스테이블코인 행정입법 10월 윤곽…"외화 발행 규제 소홀해선 안돼"

[종합] 상반기 韓 중견·중소 SW 기업 '성장세'…AI·신사업 중심 전략 본격화

재고털이 끝…車 업계, 관세發 가격 인상 눈치싸움

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.