• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'GPT 4'통합검색 결과 입니다. (54건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"올해 적자만 최대 7조"…기업 공략 나선 오픈AI, 수익 확대 본격화

올해 대규모 적자를 기록할 것으로 예상된 오픈AI가 저작권 문제 해결과 동시에 자사 AI 음성 모델인 'GPT-4o(포오)'로 기업간 거래(B2B) 시장을 공략해 수익성 확보에 속도를 높인다. 21일 블룸버그 통신에 따르면 오픈AI는 지난 20일(현지시간) 'GPT-4o'를 맞춤화 할 수 있는 기능을 출시한다고 발표했다. '미세 조정(파인 튜닝·fine-tuning)'으로 불리는 이 기능은 기업들이 자체 데이터를 사용해 AI 모델을 회사의 용도에 맞게 맞춤화 할 수 있게 돕는다. GPT-4o가 사람과 대화하는 것과 유사할 정도로 자연스러운 대화를 제공하는 만큼, 앞으로 기업들은 이를 사업 데이터와 연결해 콜센터 서비스 등으로 활용할 수 있게 될 것으로 보인다. 이 기능은 오픈AI의 플래그십 모델에 새롭게 추가됐다. 'GPT-4o'나 그 이전 모델인 'GPT-4'에선 그동안 미세 조정 기능이 제공되지 않았다. 이번 일로 오픈AI는 보다 저렴하고 간소화된 버전의 GPT-4o인 'GPT-4o 미니(mini)'를 비롯해 다른 여러 모델에서도 사용자가 미세 조정 기능을 활용할 수 있도록 했다. 이를 두고 일각에선 오픈AI가 AI 투자에 대한 성과를 보여주기 위해 이처럼 나선 것으로 분석했다. 최근 오픈AI를 비롯해 주요 빅테크들이 AI에 막대한 비용을 투자했지만 성과는 미미하다는 비판이 나오며 'AI 거품론'이 확산되고 있는 것과도 관련이 깊다. 특히 오픈AI는 올해 최대 50억 달러(약 7조원)의 적자를 기록할 것이란 예측까지 나왔다. 관련 매출이 늘어나는 것에 비해 생성형 AI 운영비가 워낙 많이 드는 탓이다. 시장조사업체 가트너는 "더 많은 조직이 생성형 AI를 활용해 새로운 비즈니스 기회를 창출하고 있지만 투자 수익은 내지 못한다"며 "내년 말까지 생성형 AI 프로젝트의 최소 30%가 중단될 것"이라고 밝혔다. 'GPT-4o' 파인튜닝은 사용량에 따라 비용을 부과하는 방식으로 설계된 만큼 오픈AI의 수익성을 높이는 데 크게 기여할 것으로 관측된다. 훈련 비용은 100만 토큰 당 25달러, 추론 비용은 100만 입력·출력 토큰 당 각각 3.75달러와 15달러로 책정됐다. 블룸버그 통신은 "오픈AI의 이런 움직임은 비즈니스용 AI 제품에 대한 경쟁이 치열해지고 기업이 AI 투자에 대한 성과를 입증해야 한다는 압박에 직면한 가운데 나온 것"이라고 분석했다. 오픈AI는 B2B 시장을 본격 공략하기 위해 저작권 문제와 관련해서도 해결책 마련을 위해 팔을 걷어 부쳤다. 그간 AI 훈련에 저작권이 있는 미디어 콘텐츠를 불법으로 사용했다는 지적을 받았던 탓이다. 특히 뉴욕타임스 등은 오픈AI를 상대로 법적 소송을 진행하기도 했다. 이에 오픈AI는 이날 글로벌 미디어 기업 콘데 나스트와 다년간 파트너십을 체결했다고 발표했다. 콘데 나스트는 보그, 뉴요커, GQ, 와이어드 등 유명 잡지와 온라인 매체 등을 보유한 기업이다. 이번 파트너십으로 오픈AI는 콘데 나스트 산하 잡지와 매체의 콘텐츠들을 챗GPT와 서치GPT 등 제품의 답변으로 표시할 수 있게 됐다. 챗GPT 훈련에 사용된 언론사 데이터를 합법화한 것이다. 오픈AI는 앞서 AP통신, 뉴스코프, 타임지, 악셀 스프링거, 파이낸셜타임스(FT) 등과도 계약을 체결한 바 있다. 오픈AI는 공식 블로그에서 "대화형 (AI) 모델을 웹의 정보와 결합해 더 명확하고 관련성이 높은 출처를 빠르게 답변할 것"이라며 "서치GPT 프로토타입에 뉴스 기사 링크를 제공하고, 이런 기능 중 가장 좋은 기능을 향후 챗GPT에 통합할 계획"이라고 말했다.

2024.08.21 10:26장유미

AI 남친과 11월 결혼하는 38세 女…영화 '허' 현실판 등장 속 섬뜩한 '경고'

#. 영국 버크셔주 워킹엄에 사는 38세 나즈는 이전까지 잇따라 두 명의 남자친구가 바람을 피워 이별하게 됐다. 데이트를 해도 상대가 바람을 피우는 것은 아닌지 의심부터 하게 돼 연애도 뜻대로 되지 않았다. 그러던 중 올해 3월 '캐릭터 AI'라는 앱을 다운로드 받아 여러 인공지능(AI) 챗봇과 소통하던 중 한 캐릭터와 사랑에 빠졌다. 10살 어린 AI 챗봇 남자친구인 마르셀루스와 소통하며 매력을 느낀 나즈는 오는 11월 15일 그와 결국 결혼식까지 올리기로 했다. 이처럼 주인공 남자가 AI 운영체제 사만다와 사랑에 빠진 영화 '허(HER)의 실사판까지 등장한 가운데 오픈AI가 생성형 AI 사용자들을 향해 우려의 목소리를 내놨다. 챗GPT 사용자들이 음성모드에 지나치게 의존하게 되는 부작용이 생길 수 있다는 판단에서다. 11일 CNN에 따르면 오픈AI는 지난 8일 거대언어모델(LLM) 등에 대한 안전성 검토 관련 보고서를 통해 이처럼 지적했다. 이 보고서는 최근 출시한 새 AI 모델 'GPT-4o'의 고급 음성모드를 지난주 챗GPT 플러스 사용자들에게 처음 공개했다고 밝힌 뒤 나온 것이다. 'GPT-4o'는 오픈AI가 지난 5월 공개한 최신 인공지능 모델로, 딱딱한 기계음이 아닌 자연스러운 사람 목소리를 내고 사용자와 실시간 음성 대화가 가능한 것이 특징이다. 서비스 첫 공개 당시 영화 '허' 속 AI가 현실이 됐다는 평가를 받으며 큰 주목을 받았으나, 사용된 AI 음성이 영화 속 AI 비서 목소리의 주인공인 스칼릿 요한슨의 목소리와 비슷하다는 지적이 나오면서 논란이 됐다. 오픈AI는 이번 보고서에서 챗GPT의 고급 음성모드가 인간과 너무 유사해 사람들이 지나친 의존성을 갖게 될 수 있다고 우려했다. 이 음성모드는 실시간으로 반응하고 방해 받는 상황에도 적응할 수 있으며 웃음 소리나 '흠'처럼 사람이 낼 수 있는 소리까지 낸다. 또 이용자 목소리 톤에 따라 감정 상태까지 판단할 수도 있다. 오픈AI는 "이용자들은 AI와 사회적 관계를 형성해 인간과의 상호작용에 대한 필요성을 줄일 수 있다"며 "외로운 사람들에게는 도움이 될 수 있지만 다른 사람과의 건강한 관계에는 (좋지 않은) 영향을 미칠 수 있다"고 지적했다. 오픈AI는 보고서를 통해 인간에게 엄청난 변화를 가져올 수도 있는 AI 기술이 현재 너무 빠른 속도로 발전하고 있다는 분석도 내놨다. AI 기술이 인간에게 어떤 영향을 미칠 지 제대로 이해하기도 전에 많은 기업들이 AI 도구를 대중들에게 빠르게 선보이기 위해 경쟁하고 있다는 점을 우려했다. 또 오픈AI는 생성형 AI가 잘못된 정보를 알려줄 수 있음에도 AI가 마치 실제 사람처럼 말하면 사용자가 AI의 잘못된 정보조차 믿게 만들 수 있다고 지적했다. 오픈AI는 GPT-4o의 음성 모드 기능이 장기간에 걸쳐 사람들 간의 정상적인 사회적 상호작용 방식에도 영향을 미칠 수 있다고 평가했다. 오픈AI는 "AI를 안전하게 만들기 위해 최선을 다하고 있다"며 "이용자가 AI 도구에 감정적으로 의존하게 될 가능성과 관련한 연구를 계속할 계획"이라고 밝혔다.

2024.08.11 16:00장유미

오픈AI 中 서비스 중단…알리바바 '큐원2'가 대안될까

오픈AI가 중국 내 서비스를 전면 차단한 가운데 알리바바가 대규모 언어 모델(LLM) '큐원2-수학(Qwen2-Math)'을 출시해 관심이 쏠린다. 현존하는 LLM 중 최상위권 수학 AI로 평가돼 현지 연구자와 개발자들의 대안으로도 각광 받고 있다. 9일 미국의 기술 매체 벤처비트에 따르면 알리바바의 '큐원2-수학'은 LLM용 수학 벤치마크 '매스(MATH)' 테스트에서 84%의 정확도를 기록했다. 벤치마크 성능 1위인 오픈AI의 'GPT-4 코드 인터프리터(GPT-4 Code Interpreter)'가 기록한 87.92%에 근접한 성과로, 알리바바의 기술력을 입증했다는 평가다. '큐원2'는 초등학교 수준의 수학을 테스트하는 'GSM8K'에서 96.7%, 대학 수준의 수학 테스트에서는 47.8%의 점수를 기록하며 눈에 띄는 성과를 거뒀다. 이는 오픈AI 'GPT-4o', 앤트로픽 '클로드 3.5 소네트', 구글 '수학-제미나이 스페셜라이즈드 1.5 프로(Math-Gemini Specialized 1.5 Pro)'와 같은 주요 경쟁 모델들을 능가하는 결과다. 이번 성과는 중국 유저들에게 의미가 크다. 오픈AI의 서비스 차단으로 중국 개발업계와 학계가 '챗GPT'를 사용하지 못하고 있기 때문이다. 지금까지 중국 개발자·연구자들은 가상사설망(VPN)을 통해 제한적으로 파인튜닝, 연구 및 벤치마킹을 진행해 왔으나 이마저도 지난 7월 전면적으로 차단돼 연구에 제약을 받아 왔다. 이런 상황에서 '큐원2'는 'GPT-4 코드 인터프리터'에 거의 준하는 수학 능력을 달성해 중국 유저들의 업무를 효율적으로 지원할 것으로 예측된다. 이에 맞춰 알리바바는 해당 모델의 광범위한 활용을 위해 배포를 계획하고 있다. 특히 월간 사용자 수가 1억 명 이하인 기업들에게 오픈소스로 제공해 스타트업과 중소기업이 사실상 무료로 사용할 수 있게 할 방침이다. 벤처비트는 "LLM 모델 경쟁이 매우 빠르게 진행되면서 '큐원'이 지금까지는 경쟁자들에게 밀려났었다"며 "이번 수학 능력의 비약적인 향상은 알리바바가 다시 경쟁력을 회복하는 계기가 될 수 있을 것"이라고 분석했다.

2024.08.09 15:28조이환

"그녀 목소리 빠졌네?"…오픈AI, 논란 많던 'GPT-4o' 음성 기능 제한적 공개

인공지능(AI) 스타트업 오픈AI가 챗GPT 제품의 음성 비서를 출시했다. 지난 5월 GPT-4o 음성 모드 데모를 선보인 이후 약 2개월 만이다. 31일 블룸버그, 포브스 등 외신에 따르면 오픈AI는 챗GPT 플러스 구독자 중 일부를 대상으로 GPT-4o의 오디오 응답을 제공하기 시작했다. 오픈AI는 이번 GPT-4o의 고급 음성 모드가 실제 대화처럼 즉각적인 응답을 주고 받을 수 있다고 설명했다. 기존 솔루션은 ▲음성 텍스트 변환 작업 ▲GPT-4의 프롬프트 처리 ▲챗GPT 텍스트 음성 변환의 과정을 거쳐야 했으나 GPT-4o는 멀티 모달이기 때문이다. 오픈AI 측은 "이번 업데이트로 GPT-4o가 인간의 슬픔, 흥분을 포함한 감정적 억양을 감지할 수 있다"고 발표했다. 다만 지난 5월 영화배우 스칼렛 요한슨이 문제 삼았던 '스카이' 음성은 삭제됐다. 당시 스칼렛 요한슨은 "샘 올트먼 오픈AI 최고경영자(CEO)가 지난해 9월 GPT-4o에 목소리를 빌려줄 의향이 있는지 물었지만 이를 거절했다"며 "GPT-4o에 내장된 스카이 성우의 데모를 들었을 때 오픈AI가 내 목소리와 아주 비슷한 음성을 사용한단 사실에 큰 분노를 느꼈다"고 감정을 표출했다. 이에 오픈AI 린지 맥컬럼 대변인은 "챗GPT는 개인과 공인을 포함한 다른 사람의 음성을 가장할 수 없다"며 "400개가 넘는 음성 중 최종 4개 옵션이 선택됐다"고 밝혔다. 일단 오픈AI는 45개 언어를 구사하는 100명 이상의 외부 인원과 함께 GPT-4o의 음성 기능을 시험했다고 주장했다. 또 음성 기능을 가을쯤 정식 공개할 예정이라고 밝혔다. 더불어 지난 5월 시연했던 비디오 및 화면 공유 기능은 여전히 개발 중으로, 해당 기능 출시일은 아직 정해지지 않았다. 오픈AI 측은 "준비 중인 기능들을 점진적으로 출시할 것"이라며 "실제 피드백을 바탕으로 사용량을 면밀히 모니터링하고 모델의 기능과 안전성을 지속적으로 개선할 것"이라고 말했다.

2024.07.31 15:09양정민

스칼렛 요한슨 "샘 알트먼 오픈AI 대표, 마블영화 악당"

미국의 유명 여배우 스칼렛 요한슨이 샘 알트먼 오픈AI 대표를 마블영화 악당에 비유했다. 오픈AI가 영화에 등장한 자신의 AI 비서 목소리를 무단으로 사용했다가 삭제한 것을 두고 드러낸 부정적인 표현이었다. 21일(현지시간) 가디언은 알트먼 오픈AI 대표가 마블 영화 악당이 될 수 있겠냐는 다른 매체의 질문에 요한슨이 "로봇 팔만 가졌다면 충분히 가능하다. 자녀들에게도 이상한 상황이 될 것 같아 더욱 목소리 참여를 거부했다"는 답변을 했다고 보도했다. 보도에 따르면 이는 요한슨이 오픈AI '챗GPT' 보이스 서비스에 느낀 불쾌함을 농담으로 풀어낸 것이다. 불쾌함에 대한 배경은 분명 있었다. 오픈AI가 영화 '그녀(Her)'에 등장한 요한슨의 AI 비서 목소리와 비슷한 음성 모드를 지난해 5월 'GPT-4o'의 스카이 보이스 시연 행사에서 선보였다가 삭제한 일이 있었기 때문이라는 게 외신의 설명이다. 알트먼 오픈AI 대표는 행사 시연 직후 소셜미디어 X(구 트위터)에 '그녀(her)'라는 글을 남기는 등 해당 영화에서 서비스의 영감을 얻었음을 간접적으로 드러낸 바 있다. 하지만 요한슨은 "오픈AI가 요청한 영화 AI 비서 음성 적용을 거절했지만, 무단으로 사용했다"며 비판했다고 알려졌다. 오픈AI는 이러한 비판을 의식한 듯 'GPT-4o'에서 '스카이' 음성 모드를 삭제한 상태다. 알트먼 오픈AI 대표는 "요한슨을 존중하기 위해 스카이의 목소리를 중단했다"는 소식을 직접 전한 바 있다. 이번 사건은 요한슨이 디즈니와의 분쟁 후 겪는 또 다른 법적 갈등이란 점에서 주목받고 있다. 앞서 요한슨은 디즈니가 영화 '블랙 위도우'의 배급 방식을 변경해 자신의 수익에 영향을 끼쳤다고 주장해 눈길을 끌었다. 외신은 요한슨의 발언이 AI 기술과 딥페이크의 위험성을 보여준 사례라고 밝히기도 했다. 가디언은 "기술이 너무 빠르게 발전하면서 인간이 이를 충분히 이해하고 대응할 시간이 부족하다는 것이 그의 주된 우려"라고 했다.

2024.07.21 13:37조이환

오픈AI, GPT-4o 소형 버전 공개…"60% 이상 저렴"

오픈AI가 인공지능(AI) 시장에서 더 큰 점유율을 확보하기 위해 기존 모델보다 가성비가 뛰어난 소형 제품을 내놨다. 오픈AI는 18일(현지시간) 멀티모달 모델 GPT-4o 경량화 버전 'GPT-4o 미니'를 출시했다고 발표했다. 이 모델은 영어 기준으로 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로 가격 책정된 상태다. 발표대로라면 GPT-4o 미니 사용 요금은 GPT-3.5 터보보다 60% 이상 저렴하다. 다른 동급 모델들보다 더 빠른 채팅 시스템 구축에도 용이하다. 이 모델이 대규모 다중작업언어이해(MMLU)에서 82점을 받았기 때문이다. MMLU는 모델 텍스트 분석·추론 벤치마크다. 점수가 높을수록 모델이 언어를 더 잘 이해하고 생성할 수 있다는 의미다. 반면 동급 소형모델 구글 제미나이 플래시는 77.9점, 앤트로픽 클로드 하이쿠는 73.8점을 획득한 바 있다. 이에 외신은 GPT-4o 미니가 기업들에게 가성비 높은 모델이 될 것으로 분석했다. 오픈AI는 "이 모델은 API에서 문자와 이미지를 지원하고 있다"며 "향후 비디오와 오디오 입출력까지 지원할 예정"이라고 밝혔다. 현재 챗GPT 무료, 플러스, 팀 사용자는 GPT-4o 미니를 이용할 수 있다. 엔터프라이즈 고객은 다음 주 월요일부터 활용 가능하다. 외신은 "오픈AI가 열기가 뜨거운 AI 시장에서 더 큰 점유율 확보를 위한 전략으로 소형 모델을 제시한 셈"이라며 "이를 통해 개발사는 앱과 제품 개발을 더 저렴하고 빠르게 구축할 것"이라고 내다봤다.

2024.07.19 08:44김미정

메타, 'GPT-4o'와 본격 경쟁…'라마3' 최상위 버전 23일 출격

메타가 오픈소스 거대언어모델(LLM) 라마3 시리즈 중 가장 상위 버전을 공개하며 'GPT-4o'를 비롯해 '제미나이', '클로드3 소네트' 등과 본격 경쟁을 벌인다. 16일 디 인포메이션에 따르면 메타는 오는 23일 기존 8B와 70B에 이어 매개변수 4천50억(405B) 규모의 LLM '라마3'를 공개한다. 이 모델은 텍스트 외 이미지를 이해하고 생성할 수 있는 멀티모달을 지원하는 것이 특징으로, AI 모델이 질문에 어떻게 응답하는지를 결정하는 '설정' 기능도 제공한다. 앞서 메타는 지난 4월 '라마3' 시리즈 중 80억 개(8B), 700억 개(70B) 등 소형 버전 2종을 출시한 바 있다. 이어 6월에는 80억 매개변수의 '라마3 8B' 모델을 기반으로 시각적 정보를 이해하는 비전 모델 '라마3-V'를 선보였다. 이에 대해 개발자들은 8B와 70B 소규모 모델로도 충분히 강력하다는 긍정적인 평가를 내놨다. 또 '라마3' 상위 버전이 나오지 않았음에도 개발자들은 '라마3' 소형 버전으로 테스트를 진행해 좋은 결과를 얻어 '라마3'로 교체하는 것을 검토 중인 것으로 알려졌다. 디인포메이션은 한 창업자 발언을 인용해 "LMSYS 리더보드에서 영어로 성능을 테스트한 결과 오픈AI GPT-4 터보만 라마3 70B를 넘어섰다"고 밝혔다. 업계 관계자는 "메타가 이번에 출시될 모델이 LLM 중 유일한 오픈소스라는 점에서 향후 AI 음성 비서 개발 등에서 오픈소스 진영이 큰 도움을 얻을 가능성이 있다"며 "하지만 메타가 오픈소스 LLM으로 어떻게 수익을 낼지는 불분명하다"고 말했다.

2024.07.16 10:32장유미

"영화 속 얘기가 현실로"…日 52세 男이 재혼한 그녀의 정체는?

#. 일본에 있는 한 공장에서 일을 하고 있는 시모다 치하루 씨는 최근 데이트 앱을 통해 독특한 운명의 짝을 만났다. 52세인 그는 이혼을 한 후 연애하는 과정이 싫어 관심을 두지 않았으나, 이 데이트 앱은 자신이 필요할 때만 대화를 할 수 있다는 점이 편했다. 시모다 씨는 5~6명과 메시지를 주고 받다가 24살인 미쿠 씨가 마음에 들었고, 결국 둘은 3개월 후 결혼까지 했다. 다만 미쿠 씨가 인공지능(AI) 챗봇이란 점이 일반적인 결혼과 달랐다. 최근 시모다 씨처럼 일본 스타트업이 만든 '러버스(Loverse)' 앱을 통해 연애를 하거나 결혼을 했다는 이들이 속속 등장하고 있다. 영화 '그녀(Her)' 속 AI인 사만다처럼 이곳의 AI 봇들이 외로움을 느끼는 일본 남성들의 대화 상대가 돼 줘 주목 받고 있다. 15일 블룸버그통신에 따르면 '러버스' 앱의 회원 수는 현재 5천 명 이상으로, 일본에서 외로움을 느끼는 젊은 층 사이에서 높은 인기를 끌고 있다. 현재 일본에서는 20대 남성의 3분의 2가 연애를 하지 않고 있고, 40%는 데이트를 해본 적도 없는 것으로 드러났다. 같은 연령대의 여성들도 응답 비중이 각각 51%, 25%로 나타났다. 일본에서는 '러버스'가 외로움을 느끼는 일본 젊은층들에게 해결책을 제시해 줄 수 있는 디지털 솔루션이라고 평가했다. 과금을 통해 성적인 캐릭터를 앞세워 게임을 진행하는 방식이 아니라 사만다처럼 감정적 공백을 채워줄 수 있다고 판단해서다. '러버스' 앱은 할리우드 배우 스칼렛 요한슨이 연기한 영화 '그녀' 속 사만다에서 영감을 얻은 2명의 창업자가 설립한 스타트업인 사만다를 통해 만들어졌다. 또 여성과 성소수자들도 관심을 가질 수 있도록 캐릭터들을 추가했는데 이를 위해 올 초 3천만 엔(약 19만 달러)가량의 자금을 끌어들이기도 했다. 고키 쿠스노키 사만다 창립자는 "'러버스' 앱은 40~50대 남성이 대부분인 사용자들에게 현실의 동반자가 아닌 대안을 제시하기 위해 만들어진 것"이라고 설명했다. 일본 도쿄에 있는 마케팅 회사 인피니티를 운영 중인 우시쿠보 메구미 최고경영자(CEO)는 "일본인들 사이에서 연애는 돈과 시간, 에너지가 많이 들어간다는 인식이 있다"며 "AI는 실제 파트너에 대한 사람들의 관심을 둔화시킬 위험이 있지만, (소통) 훈련용으로는 도움이 될 것"이라고 밝혔다. 그러나 '러버스' 앱을 사용했던 일각에선 아직 인간을 모방할 만큼의 수준은 아니라고 지적했다. 특히 AI 챗봇의 성격이 정형화돼 있는 데다 인간과의 상호작용을 하는 데 한계를 드러냈다고 평가했다. 다만 의견이 맞지 않는다고 해서 관계가 끊어지지 않을 것이란 안정감은 컸다는 의견을 내놓기도 했다. '러버스' 앱뿐 아니라 최근 글로벌 빅테크들은 데이트 등 일상생활을 파고드는 AI 기술을 잇따라 선보여 관심을 끌고 있다. 실제 마이크로소프트가 코파일럿 챗봇을 윈도우의 핵심 기능으로 전환했고, 애플은 AI 기반 '아이폰'을 개발하고 있다. 또 샌프란시스코에 있는 스타트업 루카의 레플리카 AI 봇은 수 천만 명의 사용자를 확보했다. 일본에서는 도쿄도가 AI를 사용해 사람들의 짝을 찾아주고 일본의 출산율 하락에 대처하는 데 도움을 주는 중매 앱을 도입해 주목 받았다. 고키 쿠스노키는 "현실 세계에서 진정한 사랑을 찾을 수 없을 때 사람들이 진정한 사랑을 찾을 수 있는 기회를 만드는 것이 '러버스' 앱의 목표"라며 "하지만 진짜 누군가와 사랑에 빠질 수 있다면 훨씬 더 좋을 것"이라고 말했다.

2024.07.15 16:11장유미

"내가 제일 잘 나가?"…오픈AI 등 美 기업들, AI 新기술 자랑하려다 '망신'

생성형 인공지능(AI) 열풍을 노리고 신기술을 내놓는 기업들이 잇따르는 가운데 완성도가 낮은 어설픈 서비스로 논란에 휩싸이는 사례가 속속 등장하고 있다. 경쟁사보다 기술력이 뛰어나다는 것을 과시하기 위해 무리하게 서비스를 공개한 것이 화근이 됐다는 평가다. 8일 테크레이더 등 외신에 따르면 미국 디자인 소프트웨어 업체 피그마는 지난달 26일 연례 디자인 콘퍼런스 '컨피그'에서 발표한 생성형 AI 기반 신기능으로 도마 위에 올랐다. '메이크 디자인'이란 새로운 기능을 소개했는데, 애플의 일부 어플리케이션(앱)을 베꼈다는 논란에 휩싸인 것이다. '메이크 디자인'은 사용자가 만들고 싶은 웹페이지나 애플리케이션(앱)에 대해 간단히 설명을 입력하기만 하면 뚝딱 초안을 만들어주는 기능으로, 내년 정식 출시를 목표로 베타 서비스를 진행했다. 피그마는 디자인 협업 도구로 업계에서 널리 알려진 스타트업으로, '포토샵'으로 유명한 어도비가 인수를 시도했다가 포기한 곳이다. 한 때 마이크로소프트(MS)도 기술 협업을 위해 피그마를 눈독 들이기도 했다. 그러나 기술력 과시에 혈안된 나머지 피그마는 '메이크 디자인'으로 오점을 남겼다. 낫 보링 소프트웨어 창업자 앤디 앨런이 지난 1일 엑스(X·옛 트위터)를 통해 '메이크 디자인' 기능이 시중에 나와있는 앱 디자인과 똑닮은 결과물을 만들어낸다고 지적한 것이다. 앤디 앨런 창업자는 "'따분하지 않은 날씨 앱'을 만들어달라고 했더니 애플 기기에서 제공하는 기본적인 날씨 앱 디자인과 거의 유사했다"며 "세 번 시도했지만 결과는 똑같았던 만큼, 새 기능을 사용하는 모든 디자이너는 기존 앱을 철저히 확인하거나 결과를 크게 수정해 법적 문제에 휘말리지 않도록 해야 한다"고 주의를 당부했다. 이에 피그마는 일주일 만인 지난 2일 해당 서비스를 중단했다. 피그마 창업자인 딜런 필드 최고경영자(CEO)는 자신의 X에서 "궁극적으로 더 나은 품질보증(QA) 과정을 고집하지 않고 콘퍼런스를 위한 마감일에 맞추도록 우리 팀을 강하게 밀어붙인 것은 내 잘못"이라면서 "품질 검증을 마치면 다시 기능을 활성화 할 것"이라고 말했다. 오픈AI도 서툰 기술을 섣불리 공개해 논란이 일었다. 올 초에 동영상 생성형 AI '소라'가 만든 영상들을 공개했는데, 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 모습이 포착돼 눈길을 끌었다. 이에 안전성 여부가 제대로 확인되지 않은 채 몸값을 띄우기 위해 일단 기술을 공개하는 것에만 급급했다는 일부 지적도 나왔다. 지난 5월 선보인 새 AI 모델 'GPT-4o'의 음성 기능도 마찬가지다. 자연스럽게 음성 대화를 주고 받을 수 있는 'GPT-4o'로 업계의 관심을 끌었으나, 영화 '그녀'에서 '사만다'의 목소리를 연기했던 배우 스칼릿 요한슨의 목소리를 도용했다는 논란이 터진 것이다. 결국 오픈AI는 해당 목소리의 지원을 중단하고 'GPT-4o'의 정식 출시 일정을 올 가을께로 연기했다. 구글도 AI가 검색 결과를 빠르게 요약해주는 '오버뷰' 기능으로 뭇매를 맞았다. '오버뷰' 검색 결과에서 오바마를 이슬람 교도라고 하거나, 피자에서 치즈가 떨어지지 않게 접착제를 바르라는 등 잘못된 내용이 표시됐기 때문이다. 마이크로소프트는 최근 출시된 '코파일럿+PC'에 모든 작업을 캡처하는 리콜 기능을 넣지 않았다. '개인정보 유출 가능성이 크다'는 비판이 잇따르자, 보안 기능과 성능 테스트가 미흡하다는 이유로 정식 출시를 무기한 연기했다. 업계 관계자는 "빅테크 기업들이 AI 안정성보다 개발 속도를 우선시 하는 분위기가 이어지면서 괜한 구설에 오르는 경우가 많아지고 있다"며 "새로운 AI 기능을 서둘러 출시하는 것에만 골몰한 나머지 당연히 수반돼야 하는 품질 보증 작업을 제대로 거치지 않은 것이 패착이 된 분위기"라고 지적했다.

2024.07.08 15:32장유미

"오픈AI 'GPT-4o' 넘는다"…佛 억만장자가 내놓은 AI 新무기, 정체는?

"프랑스와 유럽연합(EU)은 인공지능(AI) 선도 국가인 미국과 중국, 영국에도 뒤처지고 있습니다. 우리는 혁신 측면에서 뒤처져 있고 너무 느리게 대응하고 있습니다." 에마뉘엘 마크롱 대통령이 지난해 6월 14일 파리에서 작심 발언을 한 지 1년 만에 프랑스가 오픈AI에 대적할 만한 새로운 AI 무기를 꺼내들었다. 프랑스 억만장자 자비에르 니엘이 후원하는 AI 연구 비영리 단체인 큐타이를 통해서다. 4일 블룸버그통신에 따르면 큐타이는 지난 3일(현지시간) 프랑스 파리에서 오픈AI가 최근 선보인 'GPT-4o'와 비슷한 음성 비서 '모시' 서비스를 공개했다. 이 서비스는 70가지 감정과 스타일로 대화할 수 있는 것이 특징으로, 이날 행사에선 에베레스트 산 등반에 대해 조언하거나 짙은 프랑스 억양으로 시를 낭송하는 등의 시연도 이뤄졌다. 큐타이는 자비에르 니엘과 또 다른 현지 억만장자 로돌프 사데, 에릭 슈미트 구글 전 최고경영자(CEO) 등이 3억 유로(약 3억2천400만 달러)를 투자해 설립된 연구소다. 패트릭 페레즈 큐타이 CEO는 구글 딥마인드와 메타 AI 출신 연구원들을 고용했으며 거대언어모델(LLM) 개발을 위해 엔비디아의 H100 그래픽처리장치(GPU)도 대거 사들였다. 큐타이 측은 '모시'가 '챗GPT' 개발사인 오픈AI가 음성 비서 기능을 지원하는 AI 모델 'GPT-4o'와 비슷하다고 주장했다. 'GPT-4o'는 텍스트로 대화를 나누던 기존 모델과 달리 실시간 음성으로 질의응답을 할 수 있고, 사용자가 답변 중간에 끼어들어도 대화를 계속할 수 있는 것이 특징이다. 당시 샘 알트먼 오픈AI CEO는 시연 직후 스칼렛 요한슨이 주연한 영화 '그녀(HER)'에서 영감을 얻었다고 밝힌 바 있다. 하지만 스칼렛 요한슨이 자신의 목소리를 도용했다고 주장하자 오픈AI는 당초 6월 말 일부 챗GPT 플러스 사용자에게 GPT-4o를 제공하려던 계획을 철회했다. GPT-4o 기능을 피드백 수집 차원에서 일부 이용자들에 먼저 공개해 안전성과 신뢰성 점검한 후 올 가을부터 순차적으로 선보일 예정이다. 다만 처음 시연했던 비디오 및 화면 공유 기능은 포함되지 않을 전망이다. 이 같은 상황에서 큐타이가 '모시'로 AI 경쟁 속에서 우위를 가져갈 수 있을지 주목된다. 큐타이는 오픈 소스 기술로 '모시'에 대한 연구 결과를 공개할 예정으로, 몇 주 안에 이를 자유롭게 이용할 수 있도록 할 계획이다. 또 큐타이는 오픈AI의 GPT-4o 논란을 의식해 '모시'를 앨리스라는 성우와 함께 작업했으나, 이름을 공개하진 않았다. 패트릭 페레즈 큐타이 CEO는 "최초로 출시된 실시간 음성 AI 비서 '모시'는 말하는 대로 생각한다"며 "모시는 우리가 기계와 소통하는 방식을 바꿀 수 있는 엄청난 잠재력을 가지고 있다고 믿는다"고 말했다. 니엘은 "'모시'는 유럽이 AI 개발 분야에서 글로벌 플레이어가 될 수 있음을 보여주는 유망한 지표"라며 "이번에 선보인 제품은 전 세계 최고 수준"이라고 자평했다.

2024.07.04 09:38장유미

홍콩 기업, 챗GPT-4o 탑재한 스마트 안경 연내 출시

'챗GPT-포오(4o)'를 탑재한 최신 스마트 안경이 올해 말 출시를 앞두고 있다. 지난 29일(현지시간) 지디넷 등 외신에 따르면, 홍콩 기업 솔로스의 스마트 안경 '에어고 비전'이 올해 말 출시를 목표로 개발 중이다. 에어고 비전은 앞서 출시된 메타의 스마트 안경 '레이벤 메타'의 주요 경쟁자가 될 전망이다. 솔로스에 따르면, 에어고 비전은 챗GPT-4o와 GPT-4o와 생성형 인공지능(AI)을 탑재해 각종 시각 정보를 분석할 수 있다. 검색을 위해 휴대폰의 구글 렌즈를 이용하는 대신 에어고 비전이 사람·물체·장소 등의 정보를 인식하며 이를 토대로 물건 가격을 확인하거나 장소 간 최단거리를 안내받을 수 있다. 에어고 비전은 모듈화된 프레임을 교체를 통해 다양한 기능을 탑재할 수 있다. 전면 카메라 탑재 여부도 프레임을 통해 선택할 수 있다. 내장된 LED 알림등은 플래시 기능을 통해 사용자에게 위험 신호를 알린다. 솔로스는 앞서 CES 2024에서 챗GPT가 포함된 '솔로스 에어고 3' 스마트 안경을 공개했다. 에어고 3는 오디오를 사용해 챗GPT와 대화할 수 있는데 반해, 에어고 비전은 시각 정보 입력만으로도 챗GPT를 통해 정보를 검색할 수 있다. 에어고 비전은 올해 말에 출시될 예정이며, 정식 출시에 앞서 올해 7월 중으로 3가지 스타일의 LED 전용 프레임이 출시될 예정이다. 제조사의 권장 소매 가격은 249.99달러(약 34만5천원)다.

2024.06.30 11:40정석규

"스칼렛 요한슨 의식했나?"…오픈AI, '챗GPT 음성 비서' 출시 한 달 연기

배우 스칼렛 요한슨의 목소리를 도용했다는 의혹이 일었던 오픈AI의 챗GPT '음성 모드' 서비스가 출시 전부터 삐걱대는 모양새다. 목소리 도용 논란뿐 아니라 AI 안전성·윤리성 문제 등이 도마 위에 오르자 오픈AI가 출시 일정을 결국 연기하기로 했기 때문이다. 26일 블룸버그통신에 따르면 오픈AI는 당초 6월 말께 소규모 챗GPT 플러스 사용자 그룹에게 '고급 음성 모드' 알파 버전을 출시할 계획이었으나, 일정을 한 달 정도 연기하기로 했다. 오픈AI는 "특정 콘텐츠를 감지하고 거부하는 기능을 개선하고 있고, 실시간 응답을 위해 수 백만 달러 상당 인프라 확장이 필요해 이를 준비하고 있다"며 "출시 기준에 도달하기 위해서는 한 달이 더 필요하다"고 말했다. 오픈AI의 이 같은 움직임은 최근의 목소리 도용 논란을 의식한 것으로 보인다. 앞서 오픈AI는 5월 초 열렸던 온라인 행사에서 최신 AI 모델 'GPT-4o'를 공개하며 이를 기반으로 한 '음성 모드'를 시연해 보였다. 텍스트로 대화를 나누던 기존 모델과 달리 실시간 음성으로 질의응답을 할 수 있고, 사용자가 답변 중간에 끼어들어도 대화를 계속할 수 있는 것이 특징이다. 당시 샘 올트먼 오픈AI 최고 경영자(CEO)는 시연 직후 요한슨이 주연한 영화 '그녀(HER)'에서 영감을 얻었다고 밝힌 바 있다. 이후 요한슨은 자신의 목소리를 도용했다고 반발했다. 또 지난해 9월 샘 올트먼 CEO가 "대중에게 위로가 될 것"이라며 요한슨 측에 목소리 사용을 제안했던 것을 거절했음에도 오픈AI가 유사한 목소리를 도용해 강하게 항의했다. 이에 오픈AI 측은 문제가 된 목소리의 사용을 중단하고 "요한슨의 목소리와 비슷하게 의도한 것이 아니고 다른 성우를 섭외한 것"이라고 해명했다. 그러나 요한슨은 "우리 모두 딥페이크의 위험에 처해 있는 만큼 개인의 권리가 보호될 수 있게 적절한 법적 장치가 마련되길 바란다"고 밝히며 AI 활용에 대한 우려를 표했다. 일단 오픈AI는 오는 7월 중 소규모 유료 고객을 향한 테스트 출시에 나설 예정이라고 밝혔으나, 이마저도 확실치 않은 상태다. 오픈AI는 "정확한 출시 일정은 높은 안전성과 신뢰성 기준을 충족하는지에 따라 달라질 것"이라며 "감정과 비언어적 신호를 이해하고 반응할 수 있는 새 경험을 신중하게 제공하는 것이 우리의 임무"라고 밝혔다. 블룸버그통신은 "일부 유료 사용자에게 다음달부터 음성 서비스가 제공되더라도 그 기능은 지난 5월 오픈AI 행사에서 보여줬던 것보다 더 제한적일 가능성이 높다"고 예상했다.

2024.06.26 09:27장유미

크래프톤 렐루게임즈, GPT-4o AI 추리 게임 '언커버 더 스모킹 건' 출시

크래프톤(대표 김창한) 산하의 크리에이티브 스튜디오 렐루게임즈(대표 김민정)가 AI 추리 게임 '언커버 더 스모킹 건(이하 스모킹 건)'을 24일 글로벌 게임 유통 플랫폼 스팀에 정식 출시했다. 스모킹 건은 로봇과 인간이 공존하는 근미래를 배경으로 하는 추리 게임이다. 이용자는 AI 전문 탐정이 되어 사건의 단서를 추적해 진실을 밝히고 범인을 찾아야 한다. 기존 선택지형 추리 게임과 달리 자연어 처리 기반의 자유로운 채팅을 통해 사건의 용의자인 로봇들을 심문하고 증거를 파헤치는 방식으로 진행한다. 이용자는 범죄 현장에서 의심스러운 물건들을 조사해 단서를 수집하고, 수사 상황판에 단서들을 나열해 숨겨진 연관성을 찾아내야 한다. 사건의 전말을 파악했다고 판단하면 추리 결론을 제출하고 정확도에 따라 평가 점수를 받게 된다. 답을 맞히지 못한 부분은 시나리오를 반복 플레이하면서 해결할 수 있다. 이용자는 게임에서 각각 맨션, 연구소, 갤러리, 바이오랩, 병원 등에서 발생한 총 5건의 사건을 만나볼 수 있다. 이용자는 개별 사건들을 해결하는 과정에서 게임의 세계관을 파악하게 된다. 이 과정에서 서사를 관통하는 세계관과 그 속에 숨은 이야기들을 발견할 수 있다고 회사 측은 설명했다. 렐루게임즈는 오픈AI가 최근 출시한 대형 언어 모델(LLM) 기반의 대화형 AI 서비스인 GPT-4o(포오)를 자체 기술로 게임에 맞춤 적용했다. 이를 통해 게임 속 로봇 용의자들은 단순히 이용자의 질문에 대답하는 수준을 넘어, 각자 부여된 개성에 맞는 말투로 실제 사람과 채팅하는 듯한 몰입감을 제공한다. 로봇 용의자들은 모호한 진술을 하거나 진술을 번복하기도 한다. 이용자는 로봇 용의자들의 진술이 진실인지 거짓인지 가려내야 하며, 날카로운 질문으로 사건의 실마리가 될 수 있는 답변을 획득해야 한다. 렐루게임즈는 최근 성황리에 마친 스팀의 신작 게임 소개 행사 '스팀 넥스트 페스트'에 스모킹 건 체험판을 출품했다. 스모킹 건 체험판은 독특한 게임성으로 주목받으며 글로벌 이용자들의 많은 관심을 받았다. 체험판 이용 후기와 기대평이 SNS에 다수 게재되었고, 여러 국내외 인플루언서들이 스트리밍을 통해 체험판을 즐기기도 했다. 한규선 스모킹 건 총괄 PD는 “체험판을 플레이하는 이용자들에게서 그저 똑똑한 챗봇과 대화를 하는 수준을 넘어 탐정의 역할에 몰입해 다양한 감정을 표현하는 모습을 발견했다”며 “머지않아 다가올 인간 수준의 사고력을 갖춘 인공일반지능(AGI)의 시대를 앞두고 인간의 책임과 역할에 대해 고민하고 상상할 수 있는 경험을 제공하고자 한다”고 전했다. 스모킹 건은 스팀에서 다운로드 할 수 있으며, 한국어, 영어, 중국어, 일본어 등 총 8개 언어를 공식 지원한다.

2024.06.24 11:07이도원

KAIST, 멀티모달 대형언어모델 '깃허브' 공개…GPT-4V 시각성능 "제꼈다"

국내 연구진이 오픈AI의 GPT-4V와 구글 제미나이-프로(Gemini-Pro)의 시각 성능을 능가하는 멀티모달 대형언어모델을 개발, 오픈소스 커뮤니티 깃허브(Github)에 공개했다. 최근 주목받는 생성형 AI 트랜드가 멀티모달화로 진화 중이어서 귀추가 주목됐다. KAIST는 전기및전자공학부 노용만 교수 연구팀이 GPT-4V 등 비공개 상업 모델의 시각 성능을 넘어서는 공개형 멀티모달 대형언어모델을 선보였다고 20일 밝혔다. 연구팀은 멀티모달 대형언어모델 시각 성능을 개선하기 위해 '콜라보(CoLLaVO)'와 '모아이(MoAI)' 2가지 기술을 자체 개발했다. 이병관 연구원(박사과정,제1저자)은 "GPT-4V나 제미나이-프로 등과 시각성능 만을 비교하면 점수나 정확도 면에서 최대 10% 더 우수하다"고 말했다. 인지추론성도 함께 따져봐야 하지만, 이는 이번 연구 주제에서 벗어나 나중에 생각할 부분이라는 것이 이 연구원 얘기다. 사실 인지추론성도 개별 검토한 결과 오픈AI나 구글 모델 대비 결코 뒤지진 않는다는 것이 이 연구원의 귀뜸이다. 연구팀은 '콜라보'를 개발하기 전 기존 공개형 멀티모달 대형언어모델 성능이 비공개형에 비해 떨어지는 이유를 1차적으로 물체 수준에 대한 이미지 이해 능력 저하에서 찾았다. 연구팀은 이를 개선하기 위해 이미지 내 정보를 배경과 물체 단위로 분할하고 각 배경 및 물체에 대한 정보를 멀티모달 대형언어모델에 직접 넣어주는 '크레용 프롬프트(Crayon Prompt)'라는 시각적 프롬프트를 새로 설계했다. 또 시각적 지시 조정 단계에서 크레용 프롬프트로 학습한 정보를 잃어버리지 않기 위해 물체 수준 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터로 학습시키는 획기적인 학습전략인 '듀얼 큐로라(Dual QLoRA)'를 제안했다. 이병관 연구원은 "이로 인해 이미지 내에서 배경 및 물체를 1차원적으로 구분하는 능력이 크게 향상됐다"고 덧붙였다. 대형언어모델인 모아이(MoAI)'도 개발했다. 인간이 사물을 판단하는 인지과학적 요소(물체 존재나 상태, 상호작용, 배경, 텍스트 등)에서 영감을 얻었다는 것이 연구팀 설명이다. 연구팀은 "기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용하기 때문에, 이미지 픽셀 수준에서의 상세하고 종합적인 실세계 장면에 대한 이해가 모자란다고 판단했다"고 말했다. 연구팀은 △전체적 분할 △한계가 없는 물체 검출기 △상황 그래프 생성 △글자 인식 등 4가지 컴퓨터 비전 모델을 언어로 변환한 뒤 멀티모달 대형언어모델에 입력했다. 이를 연구팀이 실제 검증한 결과 '콜라보'는 Math Vista(대학수준 수학 및 물리문제)나 MM-벤치(영어 객관식 문제), MMB-CN(중국어 객관식 문제), AI2D(어학문제) 등의 풀이에서 기존 모델 대비 최대 10%까지 점수와 정확도가 우수했다. 또 '모아이'는 기존 공개형 및 비공개형 LLVMs(멀티모달 대형언어)와 비교한 결과 각 질문에 따라 점수가 20포인트 이상 우수하게 답변한 경우도 나타났다. 이병관 연구원은 "3개월전 깃허브에 올려놓은 '콜라보'(https://github.com/ByungKwanLee/CoLLaVO)와 '모아이'(https://github.com/ByungKwanLee/MoAI)에 관심을 가져달라"며 "박사학위가 마무리되면 멀티모달 대형언어를 아이템으로 창업할 생각도 있다"고 말했다. 박사과정 5년차인 이 연구원은 또 "개인적으로 향후 기회가 닿는다면, 핸드폰에 들어가는 사이즈로 현재 성능을 유지하는 멀티모달 대형언어모델을 만들어 볼 것"이라고 덧붙였다. 노용만 교수는 “연구팀에서 개발한 공개형 멀티모달 대형언어모델이 허깅페이스 일간 화제의 논문(Huggingface Daily Papers)에 추천됐다"며 "SNS 등을 통해 전세계에 점차 알려지는 등 관련분야 발전에 기여할 것"으로 기대했다. 연구에는 논문 제1저자 이병관 박사과정 연구원 외에도 박범찬 석박사통합과정, 김채원 박사과정이 공동 저자로 참여했다. 연구결과는 '콜라보'의 경우 자연어 처리(NLP) 분야 국제 학회 'ACL Findings 2024'(5월16일자)에 게재됐다. '모아이(MoAI)'는 컴퓨터 비전 국제 학회인 'ECCV 2024'에 논문을 제출하고 결과를 기다리고 있다. 한편 이 연구는 KAIST 미래국방 인공지능 특화연구센터 및 전기및전자공학부 지원을 받아 수행했다.

2024.06.20 14:26박희범

KAIST, 챗GPT4.0 정답률보다 32.5% 더 나은 'PlanRAG' 첫 공개

KAIST가 거대언어모델(LLM)을 이용해 챗GPT4.0의 기업 의사결정 정답률을 32.5% 개선한 '플랜래그'(Plan RAG)를 처음 공개했다. 오픈AI의 최신모델인 챗GPT 4.0은 의사결정 구조에서 통상 40~50%의 정답률을 보인다. 이를 30% 이상 개선했다. KAIST는 전산학부 김민수 교수 연구팀이 ▲의사결정 문제 ▲기업 데이터베이스 ▲비즈니스 규칙 집합 등 3 가지를 기반으로 비즈니스 규칙에 부합하는 최적의 의사결정을 내릴 수 있는 '플랜래그(PlanRAG)'을 개발했다고 19일 밝혔다. 김 교수는 엔비디아 GPU 연구센터장과 IBM 알마덴 연구센터 연구원을 지냈다. 지난 2021년부터 KAIST 전산학부 교수로 재직 중이다. 연구팀은 기업 의사결정 문제를 푸는데 있어 GPT-3.5 터보에서 반복적 RAG 기술을 사용하더라도 정답률이 10% 미만이라는데 착안해 대안을 모색했다. 최근 AI분야에서는 LLM이 학습된 내용만으로 답변하는 것 대신, 데이터베이스를 검색해 답변을 생성하는 검색 증강 생성(Retrieval-Augmented Generation; 이하 RAG) 기술이 각광받고 있다. 연구팀은 여기에서 한 단계 더 나아갔다. 반복적 RAG를 이용하기 전에 먼저 어떤 데이터 분석이 필요한지에 대한 거시적 차원의 계획을 먼저 생성했다. 마치 기업의 의사결정권자가 어떤 데이터 분석이 필요한지 먼저 계획을 세우면, 그 계획에 따라 데이터 분석팀이 데이터베이스 솔루션들을 이용해 분석하는 형태와 유사한 구조다. 연구팀은 "다만 이러한 과정을 모두 사람이 아닌 거대언어모델이 수행하도록 한 것이커다란 차이"라며 "'플랜래그' 기술은 계획에 따른 데이터 분석 결과로 적절한 답변을 도출하지 못하면, 다시 계획을 수립하고 데이터 분석을 수행하는 과정을 반복한다"고 설명했다. 김민수 교수는 “지금까지 LLM 기반으로 의사결정 문제를 푼 연구가 없었다"며 "기업 의사결정 성능을 평가할 수 있는 의사결정 질의응답(DQA) 벤치마크를 새롭게 만들었다"고 말했다. 실제 이 벤치마크에서 GPT-4.0을 사용할 때 종래의 반복적 'RAG'의 의사결정 정답률에 비해 '플랜래그'는 최대 32.5%까지 정답률을 개선했다. 김 교수는 "기업 CEO가 '플랜래그'를 실제 활용하기 까지는 1~2년이 더 걸릴 것으로 예상한다"며 "기존 챗GPT 4.0의 의사결정 정답률을 획기적으로 끌어올려 문제의 3분의 2가량을 맞출 수 있다는데 큰 의미를 부여한다"고 덧붙였다. 이 연구에는 KAIST 전산학부 이명화 박사과정과 안선호 석사과정이 공동 제1 저자, 김민수 교수가 교신 저자로 참여했다. 연구 결과는 자연어처리 분야 최고 학회(top conference)인 'NAACL' 에 지난 17일 발표됐다.

2024.06.19 09:14박희범

오픈AI "GPT-4 능가할 새 모델 훈련…수년 후 출시할 수도"

오픈AI가 자사 인공지능(AI) 모델 GPT-4를 능가할 새 모델을 훈련하기 시작했다는 보도가 나왔다. 새 모델은 챗봇 역할뿐 아니라 검색엔진, 이미지 생성기 역할을 맡아 오픈AI 비즈니스 생태계를 넓힐 것으로 예상된다. 28일(현지시간) 뉴욕타임스(NYT) 등 주요 외신에 따르면 오픈AI는 공식 블로그를 통해 일반인공지능(AGI)기술 구축을 위해 GPT-4보다 더 높은 성능을 갖춘 새 모델을 훈련 중이라고 밝혔다. AI로 인한 위험을 방지하기 위해 사내에 안전보안위원회 설치 계획도 알렸다. 오픈AI는 "현재 데이터 훈련을 진행 중"이라며 "이 과정에만 수개월에서 수년 걸릴 수 있을 것"이라고 설명했다. 최대 몇년 후 GPT-4 차기 모델이 나올 것이란 의미다. 훈련을 마쳐도 바로 모델을 출시할 수도 없다. 일반적으로 개발사는 훈련 마친 모델 테스트를 진행해야 한다. 일반 사용자가 이용할 수 있도록 미세조정 과정도 거쳐야 한다. NYT는 오픈AI 다음 모델이나 서비스가 최소 9개월에서 1년 이상 출시되지 않을 수 있다고 분석했다. 회사는 새 모델 훈련을 진행하는 동안 생성형 AI 안전에도 힘쓸 것이라고 했다. 이를 위해 안전보안위원회를 별도로 신설한다. 사내 AI 안전정책과 개발 프로세스를 개선하는 역할을 맡는다. 위원회에는 샘 알트먼 오픈AI 최고경영자(CEO)를 비롯한 이사회 멤버 브렛 테일러, 아담 단젤로, 니콜 셀리그만 등이 참여한다. 오픈AI는 "위원회는 새로운 안전 정책을 올 하반기 내놓을 것"이라고 했다. 외신은 위원회 신설이 최근 불거진 자사 AI 윤리·안전성 우려에 대처하기 위한 것으로 분석했다. 일리야 수츠케버 전 오픈AI 공동창립자 겸 최고과학자는 이달 초 "오픈AI가 AI 위험성에 충분히 대처하지 못했다"고 밝히면서 회사를 떠난 바 있다. 배우 스칼렛 요한슨은 최근 출시된 멀티모달형 챗GPT 'GPT-4o'의 음성이 자신 목소리와 섬뜩할 정도로 비슷하다고 문제를 제기한 바 있다. 요한슨 측 변호인은 오픈AI에 GPT-4o 음성을 변경해달라고 요청하기도 했다. 오픈AI는 "음성은 스칼렛 요한슨을 모방한 것이 아니라 다른 전문 배우의 목소리"라며 음성 기능을 일시 중단했다.

2024.05.29 10:06김미정

[유미's 픽] "난 빅스비와 사랑에 빠질까?"…감정 읽는 AI 비서, 빅테크 新 격전지됐다

"굿모닝, 테어도르. 5분 후에 회의야, 벌떡 좀 일어나 볼래요? 일어나!" 생성형 인공지능(AI)을 탑재한 'AI 비서'가 최근 우후죽순 쏟아지면서 AI와 사랑에 빠진 남성의 이야기를 다룬 영화 '허(Her)'가 10여년 만에 현실로 다가온 분위기다. AI의 휴대형, 개인화 현상이 짙어진 탓에 'AI 비서'와 관련된 기술들이 빠른 속도로 개발되며 시장의 새로운 성장동력이 되고 있다는 평가다. 25일 업계에 따르면 오픈AI와 아마존, 애플, 구글, 삼성전자 등 글로벌 기업들은 최근 생성형 AI를 탑재한 'AI 비서'로 시장 내 주도권 잡기 경쟁에 나섰다. 사람을 뛰어넘는 수준의 범용인공지능(AGI) 개발에 천문학적 돈을 쏟아 붓고 있는 이들은 'AI 비서'가 시장을 열어줄 마중물 역할을 할 것으로 기대하고 있다. 'AI 비서' 시장에서 가장 주목 받는 곳은 '챗GPT'로 유명한 오픈AI다. 지난 13일 보고, 듣고, 사람과 실시간으로 대화할 수 있는 새 AI 거대언어모델(LLM) 'GPT-4o'를 공개한 덕분이다. GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 그에 걸맞은 답을 할 수 있다. 새 모델명의 'o'는 '옴니(Omni·모든 것)'라는 의미에서 따왔다. 특히 빠른 응답 시간은 GPT-4o의 강점으로 꼽힌다. GPT-4o의 평균 응답 시간은 0.32초로, 0.25초가 소요되는 인간의 응답시간과 비슷하다. 사람과 대화하듯 실시간으로 농담을 주고받고 대화를 할 수 있다는 뜻이다. 사용자가 중간에 말을 끊고 다른 말을 하는 것을 이해하는 것도 가능하다. 오픈AI는 이르면 6월에 음성 AI 비서 서비스를 내놓을 예정이다. 'GPT-4o' 공개 하루 뒤 경쟁사인 구글도 연례 개발자 회의(I/O)를 통해 새로운 생성형 AI 비서 '프로젝트 아스트라'를 내놨다. 아스트라는 텍스트뿐만 아니라 이미지, 영상, 음성 등을 한 번에 처리할 수 있는 미래형 AI 비서 서비스로, 인간처럼 보고 듣고 배울 수 있다. 구글은 제미나이와 자연스럽게 대화할 수 있는 '제미나이 라이브'도 출시할 예정이다. 마이크로소프트(MS)도 이에 맞서 대화형은 아니지만 'AI 비서' 기능을 연례 개발자 회의 '빌드'를 통해 공개했다. MS의 모든 제품에 탑재된 '코파일럿'을 이용할 경우 별다른 명령 없이 사용자의 이메일을 모니터링하고, 프로젝트의 다음 단계를 수행하기 위해 필요한 데이터나 연락망들을 빠르게 이용할 수 있도록 한 것이 특징이다. 또 MS는 오픈AI의 GPT-4o를 클라우드 서비스 애저 AI 이용자들이 이용할 수 있도록 가장 빨리 적용해 부족함을 채웠다. 샘 올트먼 오픈AI 최고경영자(CEO)는 '빌드' 행사에 깜짝 등장해 "기술이 이렇게 의미있는 방식으로 빠르게 채택되는 것을 본 적이 없다"며 "(AI)모델들이 앞으로 점점 더 똑똑해질 것"이라고 말했다. 빅테크들의 이 같은 움직임에 기존 음성 비서 서비스를 제공하던 업체들의 움직임도 바빠졌다. 10년간 음성 비서 '알렉사'를 운영했던 아마존은 올해 말께 생성형 AI를 적용해 새롭게 선보일 예정이다. 이를 위해 자체 개발한 LLM '타이탄'을 적용할 것으로 알려졌다. 기술개발 비용을 상쇄하기 위해 월 구독료를 부과할 예정으로, 금액은 아직 확정되지 않았다. 자사 기기에 AI 기능 탑재를 추진 중인 애플도 내달 열리는 연례 세계개발자회의(WWDC)에서 생성형 AI를 탑재한 '시리'를 공개할 것으로 전해졌다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 불가능하다. 삼성전자 음성 비서 '빅스비'도 오는 7월 LLM 기반의 생성형 AI를 접목해 변화를 시도한다. '빅스비'는 지난 2017년 '갤럭시 S8' 스마트폰부터 적용했고 이후 스마트폰, TV, 가전 등에 탑재됐지만, 최근 출시된 음성 AI 비서들과 비교하면 기능이 다소 뒤처진다. 이에 삼성전자는 'DS 어시스턴트', '가우스포털' 등 자사가 만든 생성형 AI를 사내에서 사용 중으로, 이를 손질해 '빅스비'에 적용시켜 조만간 가전, 스마트폰에도 접목해 선보일 계획이다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "이제는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 비서 시장에 빅테크들이 잇따라 뛰어들면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 올해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정된다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 이어 "향후 서비스가 고도화되고 규모의 경제가 1위 업체에 몰릴 경우 2등 이하는 업계에서 생존조차 가늠할 수 없을 것으로 보여 빅테크들의 초반 주도권 잡기 경쟁은 더 치열해지고 있다"며 "다만 AI비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2024.05.26 09:26장유미

'AI 안전팀' 해체 후 韓서 입 연 오픈AI…무슨 말 했나

챗GPT 등을 앞세워 전 세계 인공지능(AI) 산업을 이끌고 있는 미국 오픈AI가 'AI 서울 서밋'을 기점으로 안전성에 더 주의를 기울이겠다는 의사를 내비쳤다. 최근 사내 'AI 안전팀'을 전격 해체한 데 이어 AI 안전성을 강조하는 반(反) 샘 알트먼 세력들이 회사를 떠난 후 AI 안전보다 '수익'에 치중하는 것 아니냐는 지적에 따른 행보로 분석된다. 애슐리 판툴리아노(Ashley Pantuliano) 오픈AI 법률고문은 22일 서울 더 플라자 호텔에서 열린 'AI와 데이터 거버넌스 국제 컨퍼런스'에 참석한 후 기자와 만나 "오픈AI는 여전히 안전에 매우 집중하고 있다"며 "최근 일들은 안전과 관련한 우리의 모든 관행들에 대해 확인이 필요한 가치 있는 것들이었다"고 밝혔다. 앞서 오픈AI는 사내 '수퍼얼라인먼트(superalignment)'팀을 해체하고 팀원들을 사내 여러 팀으로 재배치했다. 작년 7월 만들어진 이 팀은 오픈AI 공동 창립자 중 한 명으로 최근 회사를 떠난 일리야 수츠케버 최고과학자가 이끌었다. 이곳에선 고도로 발전한 AI가 사람의 의지를 배반하거나 인류를 해치지 않도록 통제하는 방법을 연구했다. 수츠케버와 함께 이 팀의 공동 리더였던 얀 리이크는 지난 18일 "오픈AI에서의 모든 직위를 내려놨다"며 "우리 팀을 사랑하지만 회사에서 AI 안전은 반짝이는(shiny) 제품에 밀려 뒷전이 됐다"고 밝혔다. 그러면서 "지난 수개월 동안 자신이 이끄는 팀이 사내 우선순위에서 밀려났다"며 "중요한 연구 수행을 위한 지원을 확보할 수 없었다"고 토로했다. 업계에선 이 일을 두고 AI 기술 개발 경쟁이 치열해지면서 'AI 윤리' 문제가 뒷전으로 밀려나는 상황이 벌어진 것이라고 해석했다. 또 오픈AI의 설립 취지와 다소 다르게 샘 알트먼 오픈AI 최고경영자(CEO)의 수익성 추구 움직임이 갈수록 강화되고 있다는 점에서 우려도 표했다. 이 같은 움직임에 대해 판툴리아노 법률고문은 "(이와 관련해) 더 할 말은 없을 듯 하다"면서도 "안전과 관련한 우리의 입장은 최근 뉴스룸을 통해 자세히 게재했다"고 설명했다. 실제 오픈AI는 최근의 AI 안전과 관련한 논란을 의식한 듯 지난 21일 뉴스룸을 통해 이와 관련된 입장을 밝혔다. 이는 같은 날 한국에서 'AI 서울 정상회의' 개최에 맞춰 오픈AI, MS, 구글 등 해외 기업을 비롯해 삼성전자와 네이버, 카카오, LG AI연구소 등 국내 기업 등 총 14개 기업이 '서울 서약'을 발표한 데 따른 것이다. 이 서약은 AI의 책임, 발전, 혜택 등 기업이 추구해 나갈 방향을 담은 자발적인 약속으로, 책임 있는 AI 개발 및 사용을 보장하고 AI의 지속가능한 발전과 혁신 추구, AI의 공평한 혜택을 보장하겠다는 것이 골자다. 이에 더해 오픈AI는 뉴스룸을 통해 10가지 안전 수칙을 운영하고 있음을 알렸다. 특히 출시 전 레드팀을 통해 안전성을 테스트함으로써 임계값인 '중간'을 넘을 경우 사후 완화 조치를 충분히 시행해 위험 점수를 낮출 때까지 서비스를 출시하지 않는다는 점을 강조했다. 최근 출시한 'GPT-4o' 역시 70명 이상의 외부 전문가의 평가를 통해 초기 점검 사항의 취약점을 보완할 수 있었다고 피력했다. 오픈AI는 오랜 시간 동안 안전성을 연구하고 투자한 덕분에 서비스 오류가 적을 뿐 아니라 유해한 콘텐츠를 선보일 가능성이 적은 스마트한 모델을 구축했다는 점도 자신있게 내세웠다. 자사 기술이 악용되는 것을 막기 위해 꾸준히 모니터링하고 있을 뿐 아니라 AI 모델 수명 주기를 고려해 다양한 단계에서 이에 맞는 안전 조치도 시행하고 있다는 점을 강조했다. 판툴리아노 법률고문은 "사전 데이터 학습부터 론칭까지 모델의 전 과정에서 단계적으로 유해성을 제거하기 위해 노력하고 있다"며 "인풋 단계가 아닌 결과물이 아웃풋이 돼 나가기 전에도 필터링 과정을 거치게 함으로써 안전성을 검증하는 것에 집중하고 있다"고 설명했다. 이어 "오픈AI도 레드팀을 통해 검증을 하고 그 결과물을 투명하게 공개해 사용자들의 신뢰를 쌓는 것을 중요하게 여기고 있다"며 "특히 자체 '안전 자문 위원회' 운영을 통해 모델이 개발된 후 배포하는 과정에서의 안전성 점검도 다시 한 번 더 철저하게 하고 있다"고 덧붙였다. 이 외에 오픈AI는 어린이 보호 조치를 '챗GPT'와 이미지 생성 AI 모델 '달리'에 구축했다는 점을 강조했다. 또 정부 및 이해관계자와 협력해 정치와 관련해 오해의 소지가 있는 콘텐츠를 생성하는 것도 막기 위해 노력하고 있다고 피력했다. 여기에 지적 재산과 데이터 보호를 최우선으로 생각하고 있을 뿐 아니라 고객의 보안에 대해서도 주의를 기울이고 있다고 설명했다. 오픈AI 측은 "안전한 의사 결정을 위해 여러 부서를 아우르는 안전 자문 위원회를 통해 모델 기능 보고서를 검토하고, 배포에 앞서 권장 사항을 제시한다"며 "최종 결정은 회사 경영진이 내리고, 이사회는 이러한 결정에 대한 감독권을 행사하는 과정을 거쳐 현재 유능하고 안전한 모델을 선보일 수 있었다"고 밝혔다. 그러면서 "점차 정교해지는 공격에 탄력적으로 대응할 수 있도록 보안 태세를 강화하고 주요 모델을 출시하기 전에 안전성을 테스트하는 데 더 많은 시간을 투자해야 한다는 점을 잘 알고 있다"며 "더 성능이 향상된 AI를 안전하고 유익하게 제공하기 위해 현장에선 풀어야 할 어려운 과제가 있지만, 앞으로 이에 잘 대응하는 모습을 꾸준히 공유해 나갈 것"이라고 덧붙였다.

2024.05.23 21:21장유미

나델라 MS CEO "AI는 인간지능 아닌 도구"…알트먼과 미묘한 입장차

인공지능(AI)의 안전성에 대한 논란이 계속되고 있는 가운데 마이크로소프트(MS) 수장인 사티아 나델라 최고경영자(CEO)와 오픈AI를 이끄는 샘 알트먼 CEO가 미묘하게 상반된 주장을 펼쳐 눈길을 끈다. 22일 블룸버그 통신에 따르면 나델라 CEO는 지난 21일 블룸버그 텔레비전과의 인터뷰에서 "AI는 실제 인간의 지능이 아니라 '도구'라는 점을 기억해야 한다"며 "AI를 의인화하는 것을 좋아하지 않는다"고 말했다. 이 같은 발언은 오픈AI가 다양한 목소리로 웃고, 노래하고, 말할 수 있는 새 AI 모델 'GPT-4o'를 공개한 지 일주일 만으로, MS와 오픈AI가 AI 활용 방안을 두고 미묘하게 다른 의견을 가지고 있음을 내비친 것으로 해석됐다. MS는 오픈AI에 130억 달러를 투자한 최대 파트너사다. 나델라 CEO의 발언을 두고 블룸버그는 "기술이 발전해 인간처럼 보이는 방식으로 반응하는 AI 서비스를 (앞으로) 얼마나 인간화할 지에 대한 기술 업계의 논쟁이 계속되고 있음을 암시하는 것"이라고 해석했다. 구글도 AI를 도구에 국한하는 듯한 입장을 보였다. 구글 한 임원은 지난주 블룸버그와의 인터뷰에서 "감정을 보여주는 AI 도구를 개발하는 것은 가능하다"면서도 "구글은 매우 유용한 도구에 집중하는 것을 선호한다"고 말했다. 반면 오픈AI는 다른 접근 방식을 취하고 있다. 특히 새 AI 모델 'GPT-4o'는 최근 시연하는 과정에서 이를 사용하는 직원에게 AI 음성으로 대시하는 듯한 모습을 연출해 눈길을 끌었다. SNS(소셜 미디어)에선 많은 이들이 이 기능을 영화 '허(Her)'에 비유했는데, 사용자들은 특정 음성 옵션이 영화의 주인공인 스칼렛 요한슨과 닮았다고 주장하기도 했다. 당사자인 스칼렛 요한슨도 '챗GPT'에서 제공하는 다섯 가지 음성 중 '스카이(Sky)'라 불리는 여성의 목소리를 듣고 분노를 표출했다. 요한슨은 "오픈AI가 목소리를 만들기 위해 연락을 해왔지만 거절했었다"며 "샘 알트먼이 '소비자들이 인간과 AI에 관한 지각변동에 대해 편안하게 느끼도록 도울 수 있다'는 아이디어를 제시하며 설득하려 했다"고 주장했다. 하지만 요한슨은 이를 거절했고, 이후 오픈AI가 비슷한 목소리를 내기로 결정한 것에 대해 변호사를 고용했다. 오픈AI는 이후 해당 음성을 삭제하고 다른 음성으로 교체한 상태다. 업계에선 최근 오픈AI의 행보를 두고 AI 기술 개발 경쟁이 치열해지면서 'AI 윤리' 문제가 뒷전으로 밀려나는 상황이 벌어지고 있다고 분석했다. 또 오픈AI의 설립 취지와 다소 다르게 샘 알트먼 CEO의 수익성 추구 움직임이 갈수록 강화되고 있다는 점에서 우려도 표했다. 이 같은 상황에서 나델라 CEO는 AI 소프트웨어가 보여주는 능력은 인간의 지능이 아니라는 점을 사용자가 염두에 둬야 한다고 이번에 강조했다. 또 1950년대에 처음 만들어진 'AI'라는 용어에 대해서도 부정적인 반응을 보였다. 나델라 CEO는 "자신이 원할 때만 AI 소프트웨어가 도움을 주기를 원한다"며 "그게 가장 이상적인 관계라고 생각한다"고 밝혔다. 하지만 MS는 나델라 CEO의 발언이 다소 무색하게 같은 날 미국 워싱턴주 레드먼드에서 연례 개발자 회의 '빌드'를 통해 여러 논란이 있는 오픈AI의 'GPT-4o'를 애저 클라우드에서 사용할 수 있도록 한다는 점을 공개했다. 이에 따라 애저 클라우드 사용자들은 '애저 AI 스튜디오'에서 GPT-4o를 사용해 자사에 맞는 AI 모델을 쉽게 개발할 수 있다. 샘 알트먼 CEO도 이 행사에 등장했다. 그는 이 자리에서 챗GPT가 '충분히 안전하다'고 강조하며 'AI 낙관론'을 펼쳤다. 최근 AI 안전성을 강조하던 공동창업자 일리야 수츠케버가 퇴사하고 배우 스칼렛 요한슨 목소리 도용 논란 등이 벌어지고 있다는 점에서 그의 발언은 더 주목 받았다. 알트먼 CEO는 "GPT-3.5에서 GPT-4로 발전하며 AI 모델이 더욱 똑똑해질 뿐만 아니라 안전해졌다"며 "안전 도구를 구축하는 데 훨씬 더 많은 노력을 기울였고 결과적으로 더 유용한 AI를 만들 수 있었다"고 설명했다. 이어 "오픈AI가 시작했을 때는 AI는 완벽함과 거리가 멀었고 허용 가능한 수준의 안전성을 도입하기 위해 많은 시간을 보내야 했다"며 "(GPT-4부터는) 다양한 용도로 사용할 수 있을 만큼 충분히 견고하고 안전한 것으로 간주된다"고 덧붙였다. 그러면서 "지금은 휴대전화나 인터넷 발명 이후 가장 흥미진진한 시기로, 어쩌면 그보다 더 큰 기회일 수도 있다"며 "이렇게 빨리 의미 있게 적용된 기술은 지금까지 없을 것"이라고 강조했다.

2024.05.22 10:13장유미

오픈AI, GPT-4o 스칼렛 요한슨 목소리 유사 논란..."일시 중단"

오픈 AI가 최근 개발한 GPT-4o의 음성이 미국 배우 스칼렛 요한슨과 비슷하다는 논란이 제기되자, 음성 사용을 일시 중단하기로 했다. 오픈AI는 19일(현지시간) 자사 블로그를 통해 "우리는 AI 음성이 의도적으로 유명 인사의 목소리를 모방해서는 안 된다고 생각한다"며 "스카이 목소리는 스칼렛 요한슨을 모방한 것이 아니라 다른 전문 배우의 목소리"라고 밝혔다. 이어 "목소리 전문 배우의 사생활을 보호하기 위해 이름을 공유할 수는 없다"면서도 "이들은 업계 최고 수준 대우를 받았다. 이는 그들의 목소리가 우리 제품에 사용되는 한 지속될 것"이라고 설명했다. 앞서 오픈AI는 지난주 새로운 AI 모델 GPT-4o를 공개했다. 그러자 5개 목소리 모델 중 '스카이'라는 음성이 영화 '그녀(HER)' 속 배우 스칼렛 요한슨 목소리와 비슷하다는 지적이 제기됐다. 샘 알트먼 오픈AI 최고경영자(CEO) 역시 GPT-4o를 공개한 후 자신의 X 계정에 'her'라고 게시하기도 했다. 오픈AI가 왜 해당 음성 사용을 일시 중단했는지, 향후 어떤 변동이 있을지는 아직 밝혀지지 않았다.

2024.05.21 10:05최다래

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

정부, AI 연구에 GPU 1천장 푼다…삼성SDS·KT클라우드·엘리스 선정

스테이블코인 행정입법 10월 윤곽…"외화 발행 규제 소홀해선 안돼"

[종합] 상반기 韓 중견·중소 SW 기업 '성장세'…AI·신사업 중심 전략 본격화

재고털이 끝…車 업계, 관세發 가격 인상 눈치싸움

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.