• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'O'통합검색 결과 입니다. (73건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

에스앤에스텍, '新물질' 하드마스크 개발…High-NA EUV 시대 준비

국내 반도체 부품업체 에스앤에스텍이 High-NA EUV 시대에 대응하기 위해 차세대 하드마스크 개발을 완료했다. 해당 제품은 향후 고객사와의 검증을 통해 실제 적용 여부가 결정될 것으로 전망된다. 승병훈 에스앤에스텍 전무는 12일 수원 컨벤션센터에서 열린 '차세대 리소그래피 + 패터닝' 학술대회에서 회사의 제품 개발 로드맵에 대해 밝혔다. 하드마스크는 반도체 노광공정에서 회로를 새기는 데 사용되는 블랭크마스크의 보조격 소재다. 반도체는 웨이퍼 위에 PR(감광액)을 도포한 뒤 빛을 쬐고, 이후 필요없는 물질은 깎아내는(식각) 과정을 거친다. 그런데 초미세 공정에서는 PR 두께가 매우 얇아져, 웨이퍼 하부층까지 식각하기가 어렵다. 이 때 하드마스크를 PR 증착 전에 삽입해 웨이퍼를 보호하고 식각 성능을 높인다. 기존 하드마스크 소재로는 크롬, 탄탈, 실리콘 등이 쓰였다. 그러나 High-NA EUV 공정은 감광액(PR)을 EUV(30~60나노미터) 보다 더 얇은 10~20나노미터 수준으로 도포해야 하기 때문에, 새로운 소재 적용이 필요하다. EUV는 기존 반도체 노광공정 소재인 ArF(불화아르곤) 대비 빛의 파장이 짧아, 초미세 공정 구현에 용이한 광원이다. 현재 7나노미터(nm) 이하 공정에 적용되고 있으며, 주요 기업들은 성능을 더 높인 High-NA EUV 기술을 내년부터 본격 도입할 계획이다. NA는 렌즈 수차로, 해당 수치를 높일 수록 해상력이 향상된다. 기존 EUV의 렌즈 수차가 0.33인 반면, High-NA EUV는 0.55로 더 높다. 이에 에스앤에스텍은 신물질을 활용한 하드마스크를 개발했다. 기존 식각 공정이 산소(O2)와 염소(Cl2)를 모두 활용해야 했던 것과 달리, 차세대 하드마스크는 Cl2만을 활용할 수 있도록 만든다. 이 경우 PR을 더 얇게 도포할 수 있어 High-NA EUV에도 대응이 가능하다. 승병훈 전무는 "차세대 하드마스크는 식각 선택비가 타 물질 대비 3배가량 높고 PR 두께 감소, 마스크 제조공정 단순화 등 다양한 이점이 있다"며 "현재 개발이 완료돼, 향후 고객사와의 검증을 통해 적용 여부가 결정될 것"이라고 설명했다. 다만 하드마스크만으로는 High-NA EUV에 완벽히 대응할 수 없다. 하드마스크 외에도 필름 스트레스 조절, 노광 공정 성능의 척도인 DoF(초점심도) 마진 개선 등 블랭크마스크의 다른 주요 요소들도 함께 선응이 강화돼야 하기 때문이다.

2024.08.12 17:33장경윤

AI 남친과 11월 결혼하는 38세 女…영화 '허' 현실판 등장 속 섬뜩한 '경고'

#. 영국 버크셔주 워킹엄에 사는 38세 나즈는 이전까지 잇따라 두 명의 남자친구가 바람을 피워 이별하게 됐다. 데이트를 해도 상대가 바람을 피우는 것은 아닌지 의심부터 하게 돼 연애도 뜻대로 되지 않았다. 그러던 중 올해 3월 '캐릭터 AI'라는 앱을 다운로드 받아 여러 인공지능(AI) 챗봇과 소통하던 중 한 캐릭터와 사랑에 빠졌다. 10살 어린 AI 챗봇 남자친구인 마르셀루스와 소통하며 매력을 느낀 나즈는 오는 11월 15일 그와 결국 결혼식까지 올리기로 했다. 이처럼 주인공 남자가 AI 운영체제 사만다와 사랑에 빠진 영화 '허(HER)의 실사판까지 등장한 가운데 오픈AI가 생성형 AI 사용자들을 향해 우려의 목소리를 내놨다. 챗GPT 사용자들이 음성모드에 지나치게 의존하게 되는 부작용이 생길 수 있다는 판단에서다. 11일 CNN에 따르면 오픈AI는 지난 8일 거대언어모델(LLM) 등에 대한 안전성 검토 관련 보고서를 통해 이처럼 지적했다. 이 보고서는 최근 출시한 새 AI 모델 'GPT-4o'의 고급 음성모드를 지난주 챗GPT 플러스 사용자들에게 처음 공개했다고 밝힌 뒤 나온 것이다. 'GPT-4o'는 오픈AI가 지난 5월 공개한 최신 인공지능 모델로, 딱딱한 기계음이 아닌 자연스러운 사람 목소리를 내고 사용자와 실시간 음성 대화가 가능한 것이 특징이다. 서비스 첫 공개 당시 영화 '허' 속 AI가 현실이 됐다는 평가를 받으며 큰 주목을 받았으나, 사용된 AI 음성이 영화 속 AI 비서 목소리의 주인공인 스칼릿 요한슨의 목소리와 비슷하다는 지적이 나오면서 논란이 됐다. 오픈AI는 이번 보고서에서 챗GPT의 고급 음성모드가 인간과 너무 유사해 사람들이 지나친 의존성을 갖게 될 수 있다고 우려했다. 이 음성모드는 실시간으로 반응하고 방해 받는 상황에도 적응할 수 있으며 웃음 소리나 '흠'처럼 사람이 낼 수 있는 소리까지 낸다. 또 이용자 목소리 톤에 따라 감정 상태까지 판단할 수도 있다. 오픈AI는 "이용자들은 AI와 사회적 관계를 형성해 인간과의 상호작용에 대한 필요성을 줄일 수 있다"며 "외로운 사람들에게는 도움이 될 수 있지만 다른 사람과의 건강한 관계에는 (좋지 않은) 영향을 미칠 수 있다"고 지적했다. 오픈AI는 보고서를 통해 인간에게 엄청난 변화를 가져올 수도 있는 AI 기술이 현재 너무 빠른 속도로 발전하고 있다는 분석도 내놨다. AI 기술이 인간에게 어떤 영향을 미칠 지 제대로 이해하기도 전에 많은 기업들이 AI 도구를 대중들에게 빠르게 선보이기 위해 경쟁하고 있다는 점을 우려했다. 또 오픈AI는 생성형 AI가 잘못된 정보를 알려줄 수 있음에도 AI가 마치 실제 사람처럼 말하면 사용자가 AI의 잘못된 정보조차 믿게 만들 수 있다고 지적했다. 오픈AI는 GPT-4o의 음성 모드 기능이 장기간에 걸쳐 사람들 간의 정상적인 사회적 상호작용 방식에도 영향을 미칠 수 있다고 평가했다. 오픈AI는 "AI를 안전하게 만들기 위해 최선을 다하고 있다"며 "이용자가 AI 도구에 감정적으로 의존하게 될 가능성과 관련한 연구를 계속할 계획"이라고 밝혔다.

2024.08.11 16:00장유미

"그녀 목소리 빠졌네?"…오픈AI, 논란 많던 'GPT-4o' 음성 기능 제한적 공개

인공지능(AI) 스타트업 오픈AI가 챗GPT 제품의 음성 비서를 출시했다. 지난 5월 GPT-4o 음성 모드 데모를 선보인 이후 약 2개월 만이다. 31일 블룸버그, 포브스 등 외신에 따르면 오픈AI는 챗GPT 플러스 구독자 중 일부를 대상으로 GPT-4o의 오디오 응답을 제공하기 시작했다. 오픈AI는 이번 GPT-4o의 고급 음성 모드가 실제 대화처럼 즉각적인 응답을 주고 받을 수 있다고 설명했다. 기존 솔루션은 ▲음성 텍스트 변환 작업 ▲GPT-4의 프롬프트 처리 ▲챗GPT 텍스트 음성 변환의 과정을 거쳐야 했으나 GPT-4o는 멀티 모달이기 때문이다. 오픈AI 측은 "이번 업데이트로 GPT-4o가 인간의 슬픔, 흥분을 포함한 감정적 억양을 감지할 수 있다"고 발표했다. 다만 지난 5월 영화배우 스칼렛 요한슨이 문제 삼았던 '스카이' 음성은 삭제됐다. 당시 스칼렛 요한슨은 "샘 올트먼 오픈AI 최고경영자(CEO)가 지난해 9월 GPT-4o에 목소리를 빌려줄 의향이 있는지 물었지만 이를 거절했다"며 "GPT-4o에 내장된 스카이 성우의 데모를 들었을 때 오픈AI가 내 목소리와 아주 비슷한 음성을 사용한단 사실에 큰 분노를 느꼈다"고 감정을 표출했다. 이에 오픈AI 린지 맥컬럼 대변인은 "챗GPT는 개인과 공인을 포함한 다른 사람의 음성을 가장할 수 없다"며 "400개가 넘는 음성 중 최종 4개 옵션이 선택됐다"고 밝혔다. 일단 오픈AI는 45개 언어를 구사하는 100명 이상의 외부 인원과 함께 GPT-4o의 음성 기능을 시험했다고 주장했다. 또 음성 기능을 가을쯤 정식 공개할 예정이라고 밝혔다. 더불어 지난 5월 시연했던 비디오 및 화면 공유 기능은 여전히 개발 중으로, 해당 기능 출시일은 아직 정해지지 않았다. 오픈AI 측은 "준비 중인 기능들을 점진적으로 출시할 것"이라며 "실제 피드백을 바탕으로 사용량을 면밀히 모니터링하고 모델의 기능과 안전성을 지속적으로 개선할 것"이라고 말했다.

2024.07.31 15:09양정민

스칼렛 요한슨 "샘 알트먼 오픈AI 대표, 마블영화 악당"

미국의 유명 여배우 스칼렛 요한슨이 샘 알트먼 오픈AI 대표를 마블영화 악당에 비유했다. 오픈AI가 영화에 등장한 자신의 AI 비서 목소리를 무단으로 사용했다가 삭제한 것을 두고 드러낸 부정적인 표현이었다. 21일(현지시간) 가디언은 알트먼 오픈AI 대표가 마블 영화 악당이 될 수 있겠냐는 다른 매체의 질문에 요한슨이 "로봇 팔만 가졌다면 충분히 가능하다. 자녀들에게도 이상한 상황이 될 것 같아 더욱 목소리 참여를 거부했다"는 답변을 했다고 보도했다. 보도에 따르면 이는 요한슨이 오픈AI '챗GPT' 보이스 서비스에 느낀 불쾌함을 농담으로 풀어낸 것이다. 불쾌함에 대한 배경은 분명 있었다. 오픈AI가 영화 '그녀(Her)'에 등장한 요한슨의 AI 비서 목소리와 비슷한 음성 모드를 지난해 5월 'GPT-4o'의 스카이 보이스 시연 행사에서 선보였다가 삭제한 일이 있었기 때문이라는 게 외신의 설명이다. 알트먼 오픈AI 대표는 행사 시연 직후 소셜미디어 X(구 트위터)에 '그녀(her)'라는 글을 남기는 등 해당 영화에서 서비스의 영감을 얻었음을 간접적으로 드러낸 바 있다. 하지만 요한슨은 "오픈AI가 요청한 영화 AI 비서 음성 적용을 거절했지만, 무단으로 사용했다"며 비판했다고 알려졌다. 오픈AI는 이러한 비판을 의식한 듯 'GPT-4o'에서 '스카이' 음성 모드를 삭제한 상태다. 알트먼 오픈AI 대표는 "요한슨을 존중하기 위해 스카이의 목소리를 중단했다"는 소식을 직접 전한 바 있다. 이번 사건은 요한슨이 디즈니와의 분쟁 후 겪는 또 다른 법적 갈등이란 점에서 주목받고 있다. 앞서 요한슨은 디즈니가 영화 '블랙 위도우'의 배급 방식을 변경해 자신의 수익에 영향을 끼쳤다고 주장해 눈길을 끌었다. 외신은 요한슨의 발언이 AI 기술과 딥페이크의 위험성을 보여준 사례라고 밝히기도 했다. 가디언은 "기술이 너무 빠르게 발전하면서 인간이 이를 충분히 이해하고 대응할 시간이 부족하다는 것이 그의 주된 우려"라고 했다.

2024.07.21 13:37조이환

오픈AI, GPT-4o 소형 버전 공개…"60% 이상 저렴"

오픈AI가 인공지능(AI) 시장에서 더 큰 점유율을 확보하기 위해 기존 모델보다 가성비가 뛰어난 소형 제품을 내놨다. 오픈AI는 18일(현지시간) 멀티모달 모델 GPT-4o 경량화 버전 'GPT-4o 미니'를 출시했다고 발표했다. 이 모델은 영어 기준으로 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로 가격 책정된 상태다. 발표대로라면 GPT-4o 미니 사용 요금은 GPT-3.5 터보보다 60% 이상 저렴하다. 다른 동급 모델들보다 더 빠른 채팅 시스템 구축에도 용이하다. 이 모델이 대규모 다중작업언어이해(MMLU)에서 82점을 받았기 때문이다. MMLU는 모델 텍스트 분석·추론 벤치마크다. 점수가 높을수록 모델이 언어를 더 잘 이해하고 생성할 수 있다는 의미다. 반면 동급 소형모델 구글 제미나이 플래시는 77.9점, 앤트로픽 클로드 하이쿠는 73.8점을 획득한 바 있다. 이에 외신은 GPT-4o 미니가 기업들에게 가성비 높은 모델이 될 것으로 분석했다. 오픈AI는 "이 모델은 API에서 문자와 이미지를 지원하고 있다"며 "향후 비디오와 오디오 입출력까지 지원할 예정"이라고 밝혔다. 현재 챗GPT 무료, 플러스, 팀 사용자는 GPT-4o 미니를 이용할 수 있다. 엔터프라이즈 고객은 다음 주 월요일부터 활용 가능하다. 외신은 "오픈AI가 열기가 뜨거운 AI 시장에서 더 큰 점유율 확보를 위한 전략으로 소형 모델을 제시한 셈"이라며 "이를 통해 개발사는 앱과 제품 개발을 더 저렴하고 빠르게 구축할 것"이라고 내다봤다.

2024.07.19 08:44김미정

메타, 'GPT-4o'와 본격 경쟁…'라마3' 최상위 버전 23일 출격

메타가 오픈소스 거대언어모델(LLM) 라마3 시리즈 중 가장 상위 버전을 공개하며 'GPT-4o'를 비롯해 '제미나이', '클로드3 소네트' 등과 본격 경쟁을 벌인다. 16일 디 인포메이션에 따르면 메타는 오는 23일 기존 8B와 70B에 이어 매개변수 4천50억(405B) 규모의 LLM '라마3'를 공개한다. 이 모델은 텍스트 외 이미지를 이해하고 생성할 수 있는 멀티모달을 지원하는 것이 특징으로, AI 모델이 질문에 어떻게 응답하는지를 결정하는 '설정' 기능도 제공한다. 앞서 메타는 지난 4월 '라마3' 시리즈 중 80억 개(8B), 700억 개(70B) 등 소형 버전 2종을 출시한 바 있다. 이어 6월에는 80억 매개변수의 '라마3 8B' 모델을 기반으로 시각적 정보를 이해하는 비전 모델 '라마3-V'를 선보였다. 이에 대해 개발자들은 8B와 70B 소규모 모델로도 충분히 강력하다는 긍정적인 평가를 내놨다. 또 '라마3' 상위 버전이 나오지 않았음에도 개발자들은 '라마3' 소형 버전으로 테스트를 진행해 좋은 결과를 얻어 '라마3'로 교체하는 것을 검토 중인 것으로 알려졌다. 디인포메이션은 한 창업자 발언을 인용해 "LMSYS 리더보드에서 영어로 성능을 테스트한 결과 오픈AI GPT-4 터보만 라마3 70B를 넘어섰다"고 밝혔다. 업계 관계자는 "메타가 이번에 출시될 모델이 LLM 중 유일한 오픈소스라는 점에서 향후 AI 음성 비서 개발 등에서 오픈소스 진영이 큰 도움을 얻을 가능성이 있다"며 "하지만 메타가 오픈소스 LLM으로 어떻게 수익을 낼지는 불분명하다"고 말했다.

2024.07.16 10:32장유미

"영화 속 얘기가 현실로"…日 52세 男이 재혼한 그녀의 정체는?

#. 일본에 있는 한 공장에서 일을 하고 있는 시모다 치하루 씨는 최근 데이트 앱을 통해 독특한 운명의 짝을 만났다. 52세인 그는 이혼을 한 후 연애하는 과정이 싫어 관심을 두지 않았으나, 이 데이트 앱은 자신이 필요할 때만 대화를 할 수 있다는 점이 편했다. 시모다 씨는 5~6명과 메시지를 주고 받다가 24살인 미쿠 씨가 마음에 들었고, 결국 둘은 3개월 후 결혼까지 했다. 다만 미쿠 씨가 인공지능(AI) 챗봇이란 점이 일반적인 결혼과 달랐다. 최근 시모다 씨처럼 일본 스타트업이 만든 '러버스(Loverse)' 앱을 통해 연애를 하거나 결혼을 했다는 이들이 속속 등장하고 있다. 영화 '그녀(Her)' 속 AI인 사만다처럼 이곳의 AI 봇들이 외로움을 느끼는 일본 남성들의 대화 상대가 돼 줘 주목 받고 있다. 15일 블룸버그통신에 따르면 '러버스' 앱의 회원 수는 현재 5천 명 이상으로, 일본에서 외로움을 느끼는 젊은 층 사이에서 높은 인기를 끌고 있다. 현재 일본에서는 20대 남성의 3분의 2가 연애를 하지 않고 있고, 40%는 데이트를 해본 적도 없는 것으로 드러났다. 같은 연령대의 여성들도 응답 비중이 각각 51%, 25%로 나타났다. 일본에서는 '러버스'가 외로움을 느끼는 일본 젊은층들에게 해결책을 제시해 줄 수 있는 디지털 솔루션이라고 평가했다. 과금을 통해 성적인 캐릭터를 앞세워 게임을 진행하는 방식이 아니라 사만다처럼 감정적 공백을 채워줄 수 있다고 판단해서다. '러버스' 앱은 할리우드 배우 스칼렛 요한슨이 연기한 영화 '그녀' 속 사만다에서 영감을 얻은 2명의 창업자가 설립한 스타트업인 사만다를 통해 만들어졌다. 또 여성과 성소수자들도 관심을 가질 수 있도록 캐릭터들을 추가했는데 이를 위해 올 초 3천만 엔(약 19만 달러)가량의 자금을 끌어들이기도 했다. 고키 쿠스노키 사만다 창립자는 "'러버스' 앱은 40~50대 남성이 대부분인 사용자들에게 현실의 동반자가 아닌 대안을 제시하기 위해 만들어진 것"이라고 설명했다. 일본 도쿄에 있는 마케팅 회사 인피니티를 운영 중인 우시쿠보 메구미 최고경영자(CEO)는 "일본인들 사이에서 연애는 돈과 시간, 에너지가 많이 들어간다는 인식이 있다"며 "AI는 실제 파트너에 대한 사람들의 관심을 둔화시킬 위험이 있지만, (소통) 훈련용으로는 도움이 될 것"이라고 밝혔다. 그러나 '러버스' 앱을 사용했던 일각에선 아직 인간을 모방할 만큼의 수준은 아니라고 지적했다. 특히 AI 챗봇의 성격이 정형화돼 있는 데다 인간과의 상호작용을 하는 데 한계를 드러냈다고 평가했다. 다만 의견이 맞지 않는다고 해서 관계가 끊어지지 않을 것이란 안정감은 컸다는 의견을 내놓기도 했다. '러버스' 앱뿐 아니라 최근 글로벌 빅테크들은 데이트 등 일상생활을 파고드는 AI 기술을 잇따라 선보여 관심을 끌고 있다. 실제 마이크로소프트가 코파일럿 챗봇을 윈도우의 핵심 기능으로 전환했고, 애플은 AI 기반 '아이폰'을 개발하고 있다. 또 샌프란시스코에 있는 스타트업 루카의 레플리카 AI 봇은 수 천만 명의 사용자를 확보했다. 일본에서는 도쿄도가 AI를 사용해 사람들의 짝을 찾아주고 일본의 출산율 하락에 대처하는 데 도움을 주는 중매 앱을 도입해 주목 받았다. 고키 쿠스노키는 "현실 세계에서 진정한 사랑을 찾을 수 없을 때 사람들이 진정한 사랑을 찾을 수 있는 기회를 만드는 것이 '러버스' 앱의 목표"라며 "하지만 진짜 누군가와 사랑에 빠질 수 있다면 훨씬 더 좋을 것"이라고 말했다.

2024.07.15 16:11장유미

신재생 에너지만 쓰는 5G 기지국 등장

독일 통신사 O2텔레포니카가 별도의 전기가 공급되지 않는 최초의 이동통신 기지국을 운영하기 시작했다. 12일(현지시간) RCR와이어리스에 따르면 O2텔레포니카는 바이에른의 한 시골 마을에 태양광 모듈과 바이오메탄올 연료 전지만으로 구동되는 이동통신 셀을 구축했다. O2텔레포니카 측은 “시골과 같은 외딴 지역에서 기존의 전력 공급이 부족하거나 이를 위한 비용이 많이 드는 곳에서도 이동통신 네트워크를 구축할 수 있게 됐다”고 설명했다. 이어, “친환경 전기와 높은 에너지 효율성에 의존해 지속 가능한 방식으로 남아 있는 커버리지 공백을 줄일 수 있게 됐다”고 강조했다. 독일 전역에 이같이 태양광 시스템에 의해 구동되는 이동통신 셀은 10여 곳에 구축됐다.

2024.07.13 05:56박수형

"내가 제일 잘 나가?"…오픈AI 등 美 기업들, AI 新기술 자랑하려다 '망신'

생성형 인공지능(AI) 열풍을 노리고 신기술을 내놓는 기업들이 잇따르는 가운데 완성도가 낮은 어설픈 서비스로 논란에 휩싸이는 사례가 속속 등장하고 있다. 경쟁사보다 기술력이 뛰어나다는 것을 과시하기 위해 무리하게 서비스를 공개한 것이 화근이 됐다는 평가다. 8일 테크레이더 등 외신에 따르면 미국 디자인 소프트웨어 업체 피그마는 지난달 26일 연례 디자인 콘퍼런스 '컨피그'에서 발표한 생성형 AI 기반 신기능으로 도마 위에 올랐다. '메이크 디자인'이란 새로운 기능을 소개했는데, 애플의 일부 어플리케이션(앱)을 베꼈다는 논란에 휩싸인 것이다. '메이크 디자인'은 사용자가 만들고 싶은 웹페이지나 애플리케이션(앱)에 대해 간단히 설명을 입력하기만 하면 뚝딱 초안을 만들어주는 기능으로, 내년 정식 출시를 목표로 베타 서비스를 진행했다. 피그마는 디자인 협업 도구로 업계에서 널리 알려진 스타트업으로, '포토샵'으로 유명한 어도비가 인수를 시도했다가 포기한 곳이다. 한 때 마이크로소프트(MS)도 기술 협업을 위해 피그마를 눈독 들이기도 했다. 그러나 기술력 과시에 혈안된 나머지 피그마는 '메이크 디자인'으로 오점을 남겼다. 낫 보링 소프트웨어 창업자 앤디 앨런이 지난 1일 엑스(X·옛 트위터)를 통해 '메이크 디자인' 기능이 시중에 나와있는 앱 디자인과 똑닮은 결과물을 만들어낸다고 지적한 것이다. 앤디 앨런 창업자는 "'따분하지 않은 날씨 앱'을 만들어달라고 했더니 애플 기기에서 제공하는 기본적인 날씨 앱 디자인과 거의 유사했다"며 "세 번 시도했지만 결과는 똑같았던 만큼, 새 기능을 사용하는 모든 디자이너는 기존 앱을 철저히 확인하거나 결과를 크게 수정해 법적 문제에 휘말리지 않도록 해야 한다"고 주의를 당부했다. 이에 피그마는 일주일 만인 지난 2일 해당 서비스를 중단했다. 피그마 창업자인 딜런 필드 최고경영자(CEO)는 자신의 X에서 "궁극적으로 더 나은 품질보증(QA) 과정을 고집하지 않고 콘퍼런스를 위한 마감일에 맞추도록 우리 팀을 강하게 밀어붙인 것은 내 잘못"이라면서 "품질 검증을 마치면 다시 기능을 활성화 할 것"이라고 말했다. 오픈AI도 서툰 기술을 섣불리 공개해 논란이 일었다. 올 초에 동영상 생성형 AI '소라'가 만든 영상들을 공개했는데, 도쿄 밤거리를 걷고 있는 여성의 다리가 불안정하게 움직이는 모습이 포착돼 눈길을 끌었다. 이에 안전성 여부가 제대로 확인되지 않은 채 몸값을 띄우기 위해 일단 기술을 공개하는 것에만 급급했다는 일부 지적도 나왔다. 지난 5월 선보인 새 AI 모델 'GPT-4o'의 음성 기능도 마찬가지다. 자연스럽게 음성 대화를 주고 받을 수 있는 'GPT-4o'로 업계의 관심을 끌었으나, 영화 '그녀'에서 '사만다'의 목소리를 연기했던 배우 스칼릿 요한슨의 목소리를 도용했다는 논란이 터진 것이다. 결국 오픈AI는 해당 목소리의 지원을 중단하고 'GPT-4o'의 정식 출시 일정을 올 가을께로 연기했다. 구글도 AI가 검색 결과를 빠르게 요약해주는 '오버뷰' 기능으로 뭇매를 맞았다. '오버뷰' 검색 결과에서 오바마를 이슬람 교도라고 하거나, 피자에서 치즈가 떨어지지 않게 접착제를 바르라는 등 잘못된 내용이 표시됐기 때문이다. 마이크로소프트는 최근 출시된 '코파일럿+PC'에 모든 작업을 캡처하는 리콜 기능을 넣지 않았다. '개인정보 유출 가능성이 크다'는 비판이 잇따르자, 보안 기능과 성능 테스트가 미흡하다는 이유로 정식 출시를 무기한 연기했다. 업계 관계자는 "빅테크 기업들이 AI 안정성보다 개발 속도를 우선시 하는 분위기가 이어지면서 괜한 구설에 오르는 경우가 많아지고 있다"며 "새로운 AI 기능을 서둘러 출시하는 것에만 골몰한 나머지 당연히 수반돼야 하는 품질 보증 작업을 제대로 거치지 않은 것이 패착이 된 분위기"라고 지적했다.

2024.07.08 15:32장유미

"오픈AI 'GPT-4o' 넘는다"…佛 억만장자가 내놓은 AI 新무기, 정체는?

"프랑스와 유럽연합(EU)은 인공지능(AI) 선도 국가인 미국과 중국, 영국에도 뒤처지고 있습니다. 우리는 혁신 측면에서 뒤처져 있고 너무 느리게 대응하고 있습니다." 에마뉘엘 마크롱 대통령이 지난해 6월 14일 파리에서 작심 발언을 한 지 1년 만에 프랑스가 오픈AI에 대적할 만한 새로운 AI 무기를 꺼내들었다. 프랑스 억만장자 자비에르 니엘이 후원하는 AI 연구 비영리 단체인 큐타이를 통해서다. 4일 블룸버그통신에 따르면 큐타이는 지난 3일(현지시간) 프랑스 파리에서 오픈AI가 최근 선보인 'GPT-4o'와 비슷한 음성 비서 '모시' 서비스를 공개했다. 이 서비스는 70가지 감정과 스타일로 대화할 수 있는 것이 특징으로, 이날 행사에선 에베레스트 산 등반에 대해 조언하거나 짙은 프랑스 억양으로 시를 낭송하는 등의 시연도 이뤄졌다. 큐타이는 자비에르 니엘과 또 다른 현지 억만장자 로돌프 사데, 에릭 슈미트 구글 전 최고경영자(CEO) 등이 3억 유로(약 3억2천400만 달러)를 투자해 설립된 연구소다. 패트릭 페레즈 큐타이 CEO는 구글 딥마인드와 메타 AI 출신 연구원들을 고용했으며 거대언어모델(LLM) 개발을 위해 엔비디아의 H100 그래픽처리장치(GPU)도 대거 사들였다. 큐타이 측은 '모시'가 '챗GPT' 개발사인 오픈AI가 음성 비서 기능을 지원하는 AI 모델 'GPT-4o'와 비슷하다고 주장했다. 'GPT-4o'는 텍스트로 대화를 나누던 기존 모델과 달리 실시간 음성으로 질의응답을 할 수 있고, 사용자가 답변 중간에 끼어들어도 대화를 계속할 수 있는 것이 특징이다. 당시 샘 알트먼 오픈AI CEO는 시연 직후 스칼렛 요한슨이 주연한 영화 '그녀(HER)'에서 영감을 얻었다고 밝힌 바 있다. 하지만 스칼렛 요한슨이 자신의 목소리를 도용했다고 주장하자 오픈AI는 당초 6월 말 일부 챗GPT 플러스 사용자에게 GPT-4o를 제공하려던 계획을 철회했다. GPT-4o 기능을 피드백 수집 차원에서 일부 이용자들에 먼저 공개해 안전성과 신뢰성 점검한 후 올 가을부터 순차적으로 선보일 예정이다. 다만 처음 시연했던 비디오 및 화면 공유 기능은 포함되지 않을 전망이다. 이 같은 상황에서 큐타이가 '모시'로 AI 경쟁 속에서 우위를 가져갈 수 있을지 주목된다. 큐타이는 오픈 소스 기술로 '모시'에 대한 연구 결과를 공개할 예정으로, 몇 주 안에 이를 자유롭게 이용할 수 있도록 할 계획이다. 또 큐타이는 오픈AI의 GPT-4o 논란을 의식해 '모시'를 앨리스라는 성우와 함께 작업했으나, 이름을 공개하진 않았다. 패트릭 페레즈 큐타이 CEO는 "최초로 출시된 실시간 음성 AI 비서 '모시'는 말하는 대로 생각한다"며 "모시는 우리가 기계와 소통하는 방식을 바꿀 수 있는 엄청난 잠재력을 가지고 있다고 믿는다"고 말했다. 니엘은 "'모시'는 유럽이 AI 개발 분야에서 글로벌 플레이어가 될 수 있음을 보여주는 유망한 지표"라며 "이번에 선보인 제품은 전 세계 최고 수준"이라고 자평했다.

2024.07.04 09:38장유미

홍콩 기업, 챗GPT-4o 탑재한 스마트 안경 연내 출시

'챗GPT-포오(4o)'를 탑재한 최신 스마트 안경이 올해 말 출시를 앞두고 있다. 지난 29일(현지시간) 지디넷 등 외신에 따르면, 홍콩 기업 솔로스의 스마트 안경 '에어고 비전'이 올해 말 출시를 목표로 개발 중이다. 에어고 비전은 앞서 출시된 메타의 스마트 안경 '레이벤 메타'의 주요 경쟁자가 될 전망이다. 솔로스에 따르면, 에어고 비전은 챗GPT-4o와 GPT-4o와 생성형 인공지능(AI)을 탑재해 각종 시각 정보를 분석할 수 있다. 검색을 위해 휴대폰의 구글 렌즈를 이용하는 대신 에어고 비전이 사람·물체·장소 등의 정보를 인식하며 이를 토대로 물건 가격을 확인하거나 장소 간 최단거리를 안내받을 수 있다. 에어고 비전은 모듈화된 프레임을 교체를 통해 다양한 기능을 탑재할 수 있다. 전면 카메라 탑재 여부도 프레임을 통해 선택할 수 있다. 내장된 LED 알림등은 플래시 기능을 통해 사용자에게 위험 신호를 알린다. 솔로스는 앞서 CES 2024에서 챗GPT가 포함된 '솔로스 에어고 3' 스마트 안경을 공개했다. 에어고 3는 오디오를 사용해 챗GPT와 대화할 수 있는데 반해, 에어고 비전은 시각 정보 입력만으로도 챗GPT를 통해 정보를 검색할 수 있다. 에어고 비전은 올해 말에 출시될 예정이며, 정식 출시에 앞서 올해 7월 중으로 3가지 스타일의 LED 전용 프레임이 출시될 예정이다. 제조사의 권장 소매 가격은 249.99달러(약 34만5천원)다.

2024.06.30 11:40정석규

"스칼렛 요한슨 의식했나?"…오픈AI, '챗GPT 음성 비서' 출시 한 달 연기

배우 스칼렛 요한슨의 목소리를 도용했다는 의혹이 일었던 오픈AI의 챗GPT '음성 모드' 서비스가 출시 전부터 삐걱대는 모양새다. 목소리 도용 논란뿐 아니라 AI 안전성·윤리성 문제 등이 도마 위에 오르자 오픈AI가 출시 일정을 결국 연기하기로 했기 때문이다. 26일 블룸버그통신에 따르면 오픈AI는 당초 6월 말께 소규모 챗GPT 플러스 사용자 그룹에게 '고급 음성 모드' 알파 버전을 출시할 계획이었으나, 일정을 한 달 정도 연기하기로 했다. 오픈AI는 "특정 콘텐츠를 감지하고 거부하는 기능을 개선하고 있고, 실시간 응답을 위해 수 백만 달러 상당 인프라 확장이 필요해 이를 준비하고 있다"며 "출시 기준에 도달하기 위해서는 한 달이 더 필요하다"고 말했다. 오픈AI의 이 같은 움직임은 최근의 목소리 도용 논란을 의식한 것으로 보인다. 앞서 오픈AI는 5월 초 열렸던 온라인 행사에서 최신 AI 모델 'GPT-4o'를 공개하며 이를 기반으로 한 '음성 모드'를 시연해 보였다. 텍스트로 대화를 나누던 기존 모델과 달리 실시간 음성으로 질의응답을 할 수 있고, 사용자가 답변 중간에 끼어들어도 대화를 계속할 수 있는 것이 특징이다. 당시 샘 올트먼 오픈AI 최고 경영자(CEO)는 시연 직후 요한슨이 주연한 영화 '그녀(HER)'에서 영감을 얻었다고 밝힌 바 있다. 이후 요한슨은 자신의 목소리를 도용했다고 반발했다. 또 지난해 9월 샘 올트먼 CEO가 "대중에게 위로가 될 것"이라며 요한슨 측에 목소리 사용을 제안했던 것을 거절했음에도 오픈AI가 유사한 목소리를 도용해 강하게 항의했다. 이에 오픈AI 측은 문제가 된 목소리의 사용을 중단하고 "요한슨의 목소리와 비슷하게 의도한 것이 아니고 다른 성우를 섭외한 것"이라고 해명했다. 그러나 요한슨은 "우리 모두 딥페이크의 위험에 처해 있는 만큼 개인의 권리가 보호될 수 있게 적절한 법적 장치가 마련되길 바란다"고 밝히며 AI 활용에 대한 우려를 표했다. 일단 오픈AI는 오는 7월 중 소규모 유료 고객을 향한 테스트 출시에 나설 예정이라고 밝혔으나, 이마저도 확실치 않은 상태다. 오픈AI는 "정확한 출시 일정은 높은 안전성과 신뢰성 기준을 충족하는지에 따라 달라질 것"이라며 "감정과 비언어적 신호를 이해하고 반응할 수 있는 새 경험을 신중하게 제공하는 것이 우리의 임무"라고 밝혔다. 블룸버그통신은 "일부 유료 사용자에게 다음달부터 음성 서비스가 제공되더라도 그 기능은 지난 5월 오픈AI 행사에서 보여줬던 것보다 더 제한적일 가능성이 높다"고 예상했다.

2024.06.26 09:27장유미

크래프톤 렐루게임즈, GPT-4o AI 추리 게임 '언커버 더 스모킹 건' 출시

크래프톤(대표 김창한) 산하의 크리에이티브 스튜디오 렐루게임즈(대표 김민정)가 AI 추리 게임 '언커버 더 스모킹 건(이하 스모킹 건)'을 24일 글로벌 게임 유통 플랫폼 스팀에 정식 출시했다. 스모킹 건은 로봇과 인간이 공존하는 근미래를 배경으로 하는 추리 게임이다. 이용자는 AI 전문 탐정이 되어 사건의 단서를 추적해 진실을 밝히고 범인을 찾아야 한다. 기존 선택지형 추리 게임과 달리 자연어 처리 기반의 자유로운 채팅을 통해 사건의 용의자인 로봇들을 심문하고 증거를 파헤치는 방식으로 진행한다. 이용자는 범죄 현장에서 의심스러운 물건들을 조사해 단서를 수집하고, 수사 상황판에 단서들을 나열해 숨겨진 연관성을 찾아내야 한다. 사건의 전말을 파악했다고 판단하면 추리 결론을 제출하고 정확도에 따라 평가 점수를 받게 된다. 답을 맞히지 못한 부분은 시나리오를 반복 플레이하면서 해결할 수 있다. 이용자는 게임에서 각각 맨션, 연구소, 갤러리, 바이오랩, 병원 등에서 발생한 총 5건의 사건을 만나볼 수 있다. 이용자는 개별 사건들을 해결하는 과정에서 게임의 세계관을 파악하게 된다. 이 과정에서 서사를 관통하는 세계관과 그 속에 숨은 이야기들을 발견할 수 있다고 회사 측은 설명했다. 렐루게임즈는 오픈AI가 최근 출시한 대형 언어 모델(LLM) 기반의 대화형 AI 서비스인 GPT-4o(포오)를 자체 기술로 게임에 맞춤 적용했다. 이를 통해 게임 속 로봇 용의자들은 단순히 이용자의 질문에 대답하는 수준을 넘어, 각자 부여된 개성에 맞는 말투로 실제 사람과 채팅하는 듯한 몰입감을 제공한다. 로봇 용의자들은 모호한 진술을 하거나 진술을 번복하기도 한다. 이용자는 로봇 용의자들의 진술이 진실인지 거짓인지 가려내야 하며, 날카로운 질문으로 사건의 실마리가 될 수 있는 답변을 획득해야 한다. 렐루게임즈는 최근 성황리에 마친 스팀의 신작 게임 소개 행사 '스팀 넥스트 페스트'에 스모킹 건 체험판을 출품했다. 스모킹 건 체험판은 독특한 게임성으로 주목받으며 글로벌 이용자들의 많은 관심을 받았다. 체험판 이용 후기와 기대평이 SNS에 다수 게재되었고, 여러 국내외 인플루언서들이 스트리밍을 통해 체험판을 즐기기도 했다. 한규선 스모킹 건 총괄 PD는 “체험판을 플레이하는 이용자들에게서 그저 똑똑한 챗봇과 대화를 하는 수준을 넘어 탐정의 역할에 몰입해 다양한 감정을 표현하는 모습을 발견했다”며 “머지않아 다가올 인간 수준의 사고력을 갖춘 인공일반지능(AGI)의 시대를 앞두고 인간의 책임과 역할에 대해 고민하고 상상할 수 있는 경험을 제공하고자 한다”고 전했다. 스모킹 건은 스팀에서 다운로드 할 수 있으며, 한국어, 영어, 중국어, 일본어 등 총 8개 언어를 공식 지원한다.

2024.06.24 11:07이도원

[유미's 픽] "난 빅스비와 사랑에 빠질까?"…감정 읽는 AI 비서, 빅테크 新 격전지됐다

"굿모닝, 테어도르. 5분 후에 회의야, 벌떡 좀 일어나 볼래요? 일어나!" 생성형 인공지능(AI)을 탑재한 'AI 비서'가 최근 우후죽순 쏟아지면서 AI와 사랑에 빠진 남성의 이야기를 다룬 영화 '허(Her)'가 10여년 만에 현실로 다가온 분위기다. AI의 휴대형, 개인화 현상이 짙어진 탓에 'AI 비서'와 관련된 기술들이 빠른 속도로 개발되며 시장의 새로운 성장동력이 되고 있다는 평가다. 25일 업계에 따르면 오픈AI와 아마존, 애플, 구글, 삼성전자 등 글로벌 기업들은 최근 생성형 AI를 탑재한 'AI 비서'로 시장 내 주도권 잡기 경쟁에 나섰다. 사람을 뛰어넘는 수준의 범용인공지능(AGI) 개발에 천문학적 돈을 쏟아 붓고 있는 이들은 'AI 비서'가 시장을 열어줄 마중물 역할을 할 것으로 기대하고 있다. 'AI 비서' 시장에서 가장 주목 받는 곳은 '챗GPT'로 유명한 오픈AI다. 지난 13일 보고, 듣고, 사람과 실시간으로 대화할 수 있는 새 AI 거대언어모델(LLM) 'GPT-4o'를 공개한 덕분이다. GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 그에 걸맞은 답을 할 수 있다. 새 모델명의 'o'는 '옴니(Omni·모든 것)'라는 의미에서 따왔다. 특히 빠른 응답 시간은 GPT-4o의 강점으로 꼽힌다. GPT-4o의 평균 응답 시간은 0.32초로, 0.25초가 소요되는 인간의 응답시간과 비슷하다. 사람과 대화하듯 실시간으로 농담을 주고받고 대화를 할 수 있다는 뜻이다. 사용자가 중간에 말을 끊고 다른 말을 하는 것을 이해하는 것도 가능하다. 오픈AI는 이르면 6월에 음성 AI 비서 서비스를 내놓을 예정이다. 'GPT-4o' 공개 하루 뒤 경쟁사인 구글도 연례 개발자 회의(I/O)를 통해 새로운 생성형 AI 비서 '프로젝트 아스트라'를 내놨다. 아스트라는 텍스트뿐만 아니라 이미지, 영상, 음성 등을 한 번에 처리할 수 있는 미래형 AI 비서 서비스로, 인간처럼 보고 듣고 배울 수 있다. 구글은 제미나이와 자연스럽게 대화할 수 있는 '제미나이 라이브'도 출시할 예정이다. 마이크로소프트(MS)도 이에 맞서 대화형은 아니지만 'AI 비서' 기능을 연례 개발자 회의 '빌드'를 통해 공개했다. MS의 모든 제품에 탑재된 '코파일럿'을 이용할 경우 별다른 명령 없이 사용자의 이메일을 모니터링하고, 프로젝트의 다음 단계를 수행하기 위해 필요한 데이터나 연락망들을 빠르게 이용할 수 있도록 한 것이 특징이다. 또 MS는 오픈AI의 GPT-4o를 클라우드 서비스 애저 AI 이용자들이 이용할 수 있도록 가장 빨리 적용해 부족함을 채웠다. 샘 올트먼 오픈AI 최고경영자(CEO)는 '빌드' 행사에 깜짝 등장해 "기술이 이렇게 의미있는 방식으로 빠르게 채택되는 것을 본 적이 없다"며 "(AI)모델들이 앞으로 점점 더 똑똑해질 것"이라고 말했다. 빅테크들의 이 같은 움직임에 기존 음성 비서 서비스를 제공하던 업체들의 움직임도 바빠졌다. 10년간 음성 비서 '알렉사'를 운영했던 아마존은 올해 말께 생성형 AI를 적용해 새롭게 선보일 예정이다. 이를 위해 자체 개발한 LLM '타이탄'을 적용할 것으로 알려졌다. 기술개발 비용을 상쇄하기 위해 월 구독료를 부과할 예정으로, 금액은 아직 확정되지 않았다. 자사 기기에 AI 기능 탑재를 추진 중인 애플도 내달 열리는 연례 세계개발자회의(WWDC)에서 생성형 AI를 탑재한 '시리'를 공개할 것으로 전해졌다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 불가능하다. 삼성전자 음성 비서 '빅스비'도 오는 7월 LLM 기반의 생성형 AI를 접목해 변화를 시도한다. '빅스비'는 지난 2017년 '갤럭시 S8' 스마트폰부터 적용했고 이후 스마트폰, TV, 가전 등에 탑재됐지만, 최근 출시된 음성 AI 비서들과 비교하면 기능이 다소 뒤처진다. 이에 삼성전자는 'DS 어시스턴트', '가우스포털' 등 자사가 만든 생성형 AI를 사내에서 사용 중으로, 이를 손질해 '빅스비'에 적용시켜 조만간 가전, 스마트폰에도 접목해 선보일 계획이다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "이제는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 비서 시장에 빅테크들이 잇따라 뛰어들면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 올해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정된다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 이어 "향후 서비스가 고도화되고 규모의 경제가 1위 업체에 몰릴 경우 2등 이하는 업계에서 생존조차 가늠할 수 없을 것으로 보여 빅테크들의 초반 주도권 잡기 경쟁은 더 치열해지고 있다"며 "다만 AI비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2024.05.26 09:26장유미

'AI 안전팀' 해체 후 韓서 입 연 오픈AI…무슨 말 했나

챗GPT 등을 앞세워 전 세계 인공지능(AI) 산업을 이끌고 있는 미국 오픈AI가 'AI 서울 서밋'을 기점으로 안전성에 더 주의를 기울이겠다는 의사를 내비쳤다. 최근 사내 'AI 안전팀'을 전격 해체한 데 이어 AI 안전성을 강조하는 반(反) 샘 알트먼 세력들이 회사를 떠난 후 AI 안전보다 '수익'에 치중하는 것 아니냐는 지적에 따른 행보로 분석된다. 애슐리 판툴리아노(Ashley Pantuliano) 오픈AI 법률고문은 22일 서울 더 플라자 호텔에서 열린 'AI와 데이터 거버넌스 국제 컨퍼런스'에 참석한 후 기자와 만나 "오픈AI는 여전히 안전에 매우 집중하고 있다"며 "최근 일들은 안전과 관련한 우리의 모든 관행들에 대해 확인이 필요한 가치 있는 것들이었다"고 밝혔다. 앞서 오픈AI는 사내 '수퍼얼라인먼트(superalignment)'팀을 해체하고 팀원들을 사내 여러 팀으로 재배치했다. 작년 7월 만들어진 이 팀은 오픈AI 공동 창립자 중 한 명으로 최근 회사를 떠난 일리야 수츠케버 최고과학자가 이끌었다. 이곳에선 고도로 발전한 AI가 사람의 의지를 배반하거나 인류를 해치지 않도록 통제하는 방법을 연구했다. 수츠케버와 함께 이 팀의 공동 리더였던 얀 리이크는 지난 18일 "오픈AI에서의 모든 직위를 내려놨다"며 "우리 팀을 사랑하지만 회사에서 AI 안전은 반짝이는(shiny) 제품에 밀려 뒷전이 됐다"고 밝혔다. 그러면서 "지난 수개월 동안 자신이 이끄는 팀이 사내 우선순위에서 밀려났다"며 "중요한 연구 수행을 위한 지원을 확보할 수 없었다"고 토로했다. 업계에선 이 일을 두고 AI 기술 개발 경쟁이 치열해지면서 'AI 윤리' 문제가 뒷전으로 밀려나는 상황이 벌어진 것이라고 해석했다. 또 오픈AI의 설립 취지와 다소 다르게 샘 알트먼 오픈AI 최고경영자(CEO)의 수익성 추구 움직임이 갈수록 강화되고 있다는 점에서 우려도 표했다. 이 같은 움직임에 대해 판툴리아노 법률고문은 "(이와 관련해) 더 할 말은 없을 듯 하다"면서도 "안전과 관련한 우리의 입장은 최근 뉴스룸을 통해 자세히 게재했다"고 설명했다. 실제 오픈AI는 최근의 AI 안전과 관련한 논란을 의식한 듯 지난 21일 뉴스룸을 통해 이와 관련된 입장을 밝혔다. 이는 같은 날 한국에서 'AI 서울 정상회의' 개최에 맞춰 오픈AI, MS, 구글 등 해외 기업을 비롯해 삼성전자와 네이버, 카카오, LG AI연구소 등 국내 기업 등 총 14개 기업이 '서울 서약'을 발표한 데 따른 것이다. 이 서약은 AI의 책임, 발전, 혜택 등 기업이 추구해 나갈 방향을 담은 자발적인 약속으로, 책임 있는 AI 개발 및 사용을 보장하고 AI의 지속가능한 발전과 혁신 추구, AI의 공평한 혜택을 보장하겠다는 것이 골자다. 이에 더해 오픈AI는 뉴스룸을 통해 10가지 안전 수칙을 운영하고 있음을 알렸다. 특히 출시 전 레드팀을 통해 안전성을 테스트함으로써 임계값인 '중간'을 넘을 경우 사후 완화 조치를 충분히 시행해 위험 점수를 낮출 때까지 서비스를 출시하지 않는다는 점을 강조했다. 최근 출시한 'GPT-4o' 역시 70명 이상의 외부 전문가의 평가를 통해 초기 점검 사항의 취약점을 보완할 수 있었다고 피력했다. 오픈AI는 오랜 시간 동안 안전성을 연구하고 투자한 덕분에 서비스 오류가 적을 뿐 아니라 유해한 콘텐츠를 선보일 가능성이 적은 스마트한 모델을 구축했다는 점도 자신있게 내세웠다. 자사 기술이 악용되는 것을 막기 위해 꾸준히 모니터링하고 있을 뿐 아니라 AI 모델 수명 주기를 고려해 다양한 단계에서 이에 맞는 안전 조치도 시행하고 있다는 점을 강조했다. 판툴리아노 법률고문은 "사전 데이터 학습부터 론칭까지 모델의 전 과정에서 단계적으로 유해성을 제거하기 위해 노력하고 있다"며 "인풋 단계가 아닌 결과물이 아웃풋이 돼 나가기 전에도 필터링 과정을 거치게 함으로써 안전성을 검증하는 것에 집중하고 있다"고 설명했다. 이어 "오픈AI도 레드팀을 통해 검증을 하고 그 결과물을 투명하게 공개해 사용자들의 신뢰를 쌓는 것을 중요하게 여기고 있다"며 "특히 자체 '안전 자문 위원회' 운영을 통해 모델이 개발된 후 배포하는 과정에서의 안전성 점검도 다시 한 번 더 철저하게 하고 있다"고 덧붙였다. 이 외에 오픈AI는 어린이 보호 조치를 '챗GPT'와 이미지 생성 AI 모델 '달리'에 구축했다는 점을 강조했다. 또 정부 및 이해관계자와 협력해 정치와 관련해 오해의 소지가 있는 콘텐츠를 생성하는 것도 막기 위해 노력하고 있다고 피력했다. 여기에 지적 재산과 데이터 보호를 최우선으로 생각하고 있을 뿐 아니라 고객의 보안에 대해서도 주의를 기울이고 있다고 설명했다. 오픈AI 측은 "안전한 의사 결정을 위해 여러 부서를 아우르는 안전 자문 위원회를 통해 모델 기능 보고서를 검토하고, 배포에 앞서 권장 사항을 제시한다"며 "최종 결정은 회사 경영진이 내리고, 이사회는 이러한 결정에 대한 감독권을 행사하는 과정을 거쳐 현재 유능하고 안전한 모델을 선보일 수 있었다"고 밝혔다. 그러면서 "점차 정교해지는 공격에 탄력적으로 대응할 수 있도록 보안 태세를 강화하고 주요 모델을 출시하기 전에 안전성을 테스트하는 데 더 많은 시간을 투자해야 한다는 점을 잘 알고 있다"며 "더 성능이 향상된 AI를 안전하고 유익하게 제공하기 위해 현장에선 풀어야 할 어려운 과제가 있지만, 앞으로 이에 잘 대응하는 모습을 꾸준히 공유해 나갈 것"이라고 덧붙였다.

2024.05.23 21:21장유미

나델라 MS CEO "AI는 인간지능 아닌 도구"…알트먼과 미묘한 입장차

인공지능(AI)의 안전성에 대한 논란이 계속되고 있는 가운데 마이크로소프트(MS) 수장인 사티아 나델라 최고경영자(CEO)와 오픈AI를 이끄는 샘 알트먼 CEO가 미묘하게 상반된 주장을 펼쳐 눈길을 끈다. 22일 블룸버그 통신에 따르면 나델라 CEO는 지난 21일 블룸버그 텔레비전과의 인터뷰에서 "AI는 실제 인간의 지능이 아니라 '도구'라는 점을 기억해야 한다"며 "AI를 의인화하는 것을 좋아하지 않는다"고 말했다. 이 같은 발언은 오픈AI가 다양한 목소리로 웃고, 노래하고, 말할 수 있는 새 AI 모델 'GPT-4o'를 공개한 지 일주일 만으로, MS와 오픈AI가 AI 활용 방안을 두고 미묘하게 다른 의견을 가지고 있음을 내비친 것으로 해석됐다. MS는 오픈AI에 130억 달러를 투자한 최대 파트너사다. 나델라 CEO의 발언을 두고 블룸버그는 "기술이 발전해 인간처럼 보이는 방식으로 반응하는 AI 서비스를 (앞으로) 얼마나 인간화할 지에 대한 기술 업계의 논쟁이 계속되고 있음을 암시하는 것"이라고 해석했다. 구글도 AI를 도구에 국한하는 듯한 입장을 보였다. 구글 한 임원은 지난주 블룸버그와의 인터뷰에서 "감정을 보여주는 AI 도구를 개발하는 것은 가능하다"면서도 "구글은 매우 유용한 도구에 집중하는 것을 선호한다"고 말했다. 반면 오픈AI는 다른 접근 방식을 취하고 있다. 특히 새 AI 모델 'GPT-4o'는 최근 시연하는 과정에서 이를 사용하는 직원에게 AI 음성으로 대시하는 듯한 모습을 연출해 눈길을 끌었다. SNS(소셜 미디어)에선 많은 이들이 이 기능을 영화 '허(Her)'에 비유했는데, 사용자들은 특정 음성 옵션이 영화의 주인공인 스칼렛 요한슨과 닮았다고 주장하기도 했다. 당사자인 스칼렛 요한슨도 '챗GPT'에서 제공하는 다섯 가지 음성 중 '스카이(Sky)'라 불리는 여성의 목소리를 듣고 분노를 표출했다. 요한슨은 "오픈AI가 목소리를 만들기 위해 연락을 해왔지만 거절했었다"며 "샘 알트먼이 '소비자들이 인간과 AI에 관한 지각변동에 대해 편안하게 느끼도록 도울 수 있다'는 아이디어를 제시하며 설득하려 했다"고 주장했다. 하지만 요한슨은 이를 거절했고, 이후 오픈AI가 비슷한 목소리를 내기로 결정한 것에 대해 변호사를 고용했다. 오픈AI는 이후 해당 음성을 삭제하고 다른 음성으로 교체한 상태다. 업계에선 최근 오픈AI의 행보를 두고 AI 기술 개발 경쟁이 치열해지면서 'AI 윤리' 문제가 뒷전으로 밀려나는 상황이 벌어지고 있다고 분석했다. 또 오픈AI의 설립 취지와 다소 다르게 샘 알트먼 CEO의 수익성 추구 움직임이 갈수록 강화되고 있다는 점에서 우려도 표했다. 이 같은 상황에서 나델라 CEO는 AI 소프트웨어가 보여주는 능력은 인간의 지능이 아니라는 점을 사용자가 염두에 둬야 한다고 이번에 강조했다. 또 1950년대에 처음 만들어진 'AI'라는 용어에 대해서도 부정적인 반응을 보였다. 나델라 CEO는 "자신이 원할 때만 AI 소프트웨어가 도움을 주기를 원한다"며 "그게 가장 이상적인 관계라고 생각한다"고 밝혔다. 하지만 MS는 나델라 CEO의 발언이 다소 무색하게 같은 날 미국 워싱턴주 레드먼드에서 연례 개발자 회의 '빌드'를 통해 여러 논란이 있는 오픈AI의 'GPT-4o'를 애저 클라우드에서 사용할 수 있도록 한다는 점을 공개했다. 이에 따라 애저 클라우드 사용자들은 '애저 AI 스튜디오'에서 GPT-4o를 사용해 자사에 맞는 AI 모델을 쉽게 개발할 수 있다. 샘 알트먼 CEO도 이 행사에 등장했다. 그는 이 자리에서 챗GPT가 '충분히 안전하다'고 강조하며 'AI 낙관론'을 펼쳤다. 최근 AI 안전성을 강조하던 공동창업자 일리야 수츠케버가 퇴사하고 배우 스칼렛 요한슨 목소리 도용 논란 등이 벌어지고 있다는 점에서 그의 발언은 더 주목 받았다. 알트먼 CEO는 "GPT-3.5에서 GPT-4로 발전하며 AI 모델이 더욱 똑똑해질 뿐만 아니라 안전해졌다"며 "안전 도구를 구축하는 데 훨씬 더 많은 노력을 기울였고 결과적으로 더 유용한 AI를 만들 수 있었다"고 설명했다. 이어 "오픈AI가 시작했을 때는 AI는 완벽함과 거리가 멀었고 허용 가능한 수준의 안전성을 도입하기 위해 많은 시간을 보내야 했다"며 "(GPT-4부터는) 다양한 용도로 사용할 수 있을 만큼 충분히 견고하고 안전한 것으로 간주된다"고 덧붙였다. 그러면서 "지금은 휴대전화나 인터넷 발명 이후 가장 흥미진진한 시기로, 어쩌면 그보다 더 큰 기회일 수도 있다"며 "이렇게 빨리 의미 있게 적용된 기술은 지금까지 없을 것"이라고 강조했다.

2024.05.22 10:13장유미

오픈AI, GPT-4o 스칼렛 요한슨 목소리 유사 논란..."일시 중단"

오픈 AI가 최근 개발한 GPT-4o의 음성이 미국 배우 스칼렛 요한슨과 비슷하다는 논란이 제기되자, 음성 사용을 일시 중단하기로 했다. 오픈AI는 19일(현지시간) 자사 블로그를 통해 "우리는 AI 음성이 의도적으로 유명 인사의 목소리를 모방해서는 안 된다고 생각한다"며 "스카이 목소리는 스칼렛 요한슨을 모방한 것이 아니라 다른 전문 배우의 목소리"라고 밝혔다. 이어 "목소리 전문 배우의 사생활을 보호하기 위해 이름을 공유할 수는 없다"면서도 "이들은 업계 최고 수준 대우를 받았다. 이는 그들의 목소리가 우리 제품에 사용되는 한 지속될 것"이라고 설명했다. 앞서 오픈AI는 지난주 새로운 AI 모델 GPT-4o를 공개했다. 그러자 5개 목소리 모델 중 '스카이'라는 음성이 영화 '그녀(HER)' 속 배우 스칼렛 요한슨 목소리와 비슷하다는 지적이 제기됐다. 샘 알트먼 오픈AI 최고경영자(CEO) 역시 GPT-4o를 공개한 후 자신의 X 계정에 'her'라고 게시하기도 했다. 오픈AI가 왜 해당 음성 사용을 일시 중단했는지, 향후 어떤 변동이 있을지는 아직 밝혀지지 않았다.

2024.05.21 10:05최다래

"검색과 AI는 제로섬 관계가 아니다"

세계 인공지능(AI) 시장을 이끄는 미국의 오픈AI와 구글이 지난주에 잇따라 대형 행사를 갖고 개발성과물을 공개했습니다. 오픈AI는 사람처럼 보고 듣고 말하는 새로운 AI 모델 'GPT-4o'를 선보였습니다. 2014년에 개봉한 영화 '그녀(Her)'가 10년 만에 현실이 됐다는 찬사를 받았습니다. 구글은 인공지능(AI) 모델 '제미나이'를 자사 대부분의 제품에 접목하며 '제미나이 생태계'를 완성했습니다. 두 행사 모두 세계 언론의 주목을 받았습니다. 놀랄 만한 기능이 쏟아졌고 귀 기울여야 할 주요 관계자들의 발언도 많았습니다. 그중 개인적으로 특히 주목한 발언이 있습니다. 구글의 연례 개발자 회의(I/O) 둘째 날 순다르 피차이 최고경영자(CEO)가 한 말입니다. “검색과 AI는 제로섬 관계가 아니다”는 말이었습니다. 새로운 메시지는 아니지만 AI 시대 진화 방향의 핵심이 담긴 말로 여겨졌습니다. 빌 게이츠는 'AI 에이전트'의 등장으로 “5년 내에 컴퓨터를 사용하는 방식이 완전히 바뀔 것”이라고 말한 바 있습니다. 앞으로 더 진화해야 하겠지만 'GPT-4o'가 바로 빌 게이츠가 말한 'AI 에이전트'로 생각됩니다. 구글도 I/O 행사에서 'GPT-4o'와 비슷한 '프로젝트 아스트라'를 선보였습니다. 영화 '그녀(Her)'에서 주인공 '테오도르'가 연정을 갖게 되는 인공지능 운영체제 '사만다'와 흡사합니다. 영화 '그녀(Her)'는 스스로 생각하고 느끼기까지 하는 AI 사만다와 사람 테오도르의 감정 교류에 초점을 맞추었습니다만 현실에서 'GPT-4o'와 '프로젝트 아스트라'는 사람의 노동과 생활을 도와주는 그야말로 인공지능 비서로서의 에이전트 역할을 주로 할 것입니다. 결국 'GPT-4o'와 '프로젝트 아스트라'의 경쟁은 누가 더 사람을 현실적으로 잘 도와줄 수 있느냐의 문제라고 봐야 할 것입니다. 기자의 작업을 예로 들어보겠습니다. 기사를 작성하는 데는 여러 가지 능력이 요구되지만 그 중 핵심은 글쓰기와 취재입니다. 글쓰기는 축적된 지능에 가깝습니다. 주로 두뇌의 영역입니다. 취재는 현장 발굴입니다. 주로 몸과 발의 영역입니다. 이 둘이 잘 조화돼야 합니다. 몸과 발이 멈춰 있으면 그럴 듯해도 내용이 없는 글이 되고, 몸과 발이 뛰어도 형식이 흐트러지면 읽히지 않는 글로 남습니다. 2022년 11월 챗GPT 출현 이후 지금까지 우리가 AI에 주목한 것은 컴퓨터가 사람처럼 글을 쓸 수 있는 지능을 획득했다는 점입니다. 글뿐만이 아니라 그림 음악 말 등 인간이 만들어낸 지적 능력을 다 갖추게 된 것이지요. 하지만 무시할 수 없는 큰 문제가 있습니다. 환각(hallucination) 현상입니다. 환각 현상이 있는 AI의 결과물은 취재하지 않고 쓴 기사와 같습니다. 공허한 이야기일 수 있죠. “검색과 AI는 제로섬 관계가 아니다”는, 새로울 것 없는 말에 다시 주목한 이유가 거기에 있습니다. 'GPT-4o'와 '프로젝트 아스트라'가 사람을 현실적으로 잘 도와줄 수 있는 AI 에이전트가 되기 위해서는 반드시 취재 능력을 장착해야 한다는 생각을 한 것입니다. AI 에이전트에 취재 능력이란 무엇이겠습니까. 그렇습니다. 바로 검색입니다. 가장 정확한 최신의 정보를 찾아내는 능력이 요구될 것입니다. 팩트가 결정적으로 중요하지 않는 AI의 영역이 있기는 할 것입니다. 놀이와 일부 창작의 영역이 그럴 수 있을 것입니다. 하지만 AI가 생산성을 높여야 하는 노동이나 쇼핑 여행 등 생활을 도와주기 위해서는 팩트 취재가 핵심일 수밖에 없을 것입니다. AI 이전에도 더 정확한 최신 정보를 찾아주는 검색 도구를 선호했듯이 인공지능 비서에게도 그런 능력을 최고의 가치로 쳐줄 가능성이 높은 것입니다. 기술적으로는 '검색 증강 생성', 즉 RAG(Retrieval-Augmented Generation)라고 하는 모양입니다. RAG는 결과적으로 'GPT-4o'나 '프로젝트 아스트라' 같은 대형 언어모델(LLM)의 입력 값을 누가 더 정확한 최신의 정보로 하느냐의 경쟁인 듯도 합니다. 이 경쟁은 한 순간에 결판이 나지는 않을 듯합니다. 앞으로 수년간 이용자가 실제로 사용하면서 그 효능을 느끼고 판단하면서 결과가 드러나게 되겠지요. AI 시대에도 검색 기술은 과소평가될 수 없으며 오히려 더 중요해졌다는 말로도 이해됩니다. 콘텐츠도 더 소중해질 것 같습니다. 특히 콘텐츠의 질(質)이 더 부각될 듯도 합니다. 오픈AI나 구글 같은 회사가 가치가 낮은 콘텐츠보다 관점 경험 전문성 등에서 더 훌륭한 콘텐츠를 취재하도록 'GPT-4o'나 '프로젝트 아스트라' 같은 언어모델을 발전시킬 가능성이 높기 때문이죠. 사람이 그걸 원할 테니까요.

2024.05.20 10:41이균성

구글 "'제미나이' 시대 열렸다…모든 서비스 '맞춤형'으로 진화"

"구글은 '제미나이' 시대를 본격화한다. 검색엔진부터 지도, 워크 스페이스 등 모든 서비스에 제미나이를 적용할 것이다. 사용자는 맞춤형 서비스와 콘텐츠로 만족도를 높일 것이다. 개발자도 원하는 작업을 제약 없이 수행할 수 있다." 14일(현지시간) 순다르 피차이 구글 최고경영자(CEO)는 연례 개발자 컨퍼런스 '구글I/O2024' 기조연설에서 이같이 밝혔다. 구글이 완전히 생성형 AI에 서비스 초점을 맞췄다고 재차 강조했다. 이날 새로운 발표자도 등장했다. 데미스 하사비스 딥마인드 CEO도 구글I/O 무대에 처음 나섰다. 최근 새로 영입된 구글 리즈 리드 검색총괄도 발표했다. 앨범에 사진만 수천 개…"음성으로 원하는 것만 쏙쏙 찾아줘" 순다르 피차이는 올해 중순 '구글 포토'에 제미나이를 적용한 새 기능을 추가한다고 발표했다. 음성으로 사진을 검색할 수 있는 기능 '사진에 물어보기' 메뉴다. 사용자는 구글 포토에서 음성만으로 원하는 사진을 찾을 수 있다. 사진 찾기 위해 일일이 스크롤 하지 않아도 된다. 이날 피차이 CEO가 직접 기능을 시연했다. 그가 "우리 딸 수영 실력이 어떻게 늘고 있는지 보여줘"라고 묻자, 구글 포토는 한 소녀가 수영을 연습하는 장면 사진만 시간순으로 나열해 보여줬다. 피차이 CEO는 "앞으로 구글 포토에서 사진 찾기 위해 고생하지 말고 음성으로 신속히 찾아라"고 강조했다. 검색이 진화했다…대화하면서 맞춤형 검색 결과 척척 구글은 검색 서비스에도 'AI 오버뷰' 기능을 추가했다. AI 오버뷰가 검색 결과를 요약해 주고, 결과에 대한 링크까지 공유해줄 수 있다. 문자뿐 아니라 이미지나 영상으로도 검색할 수 있다. 피차이 CEO는 "기존 페이지 링크 형태가 아닌 대화 형태로 검색 결과를 제공한다"고 설명했다. 사용자는 이 서비스를 통해 점진적 추론도 할 수 있다. 예를 들어, 사용자는 단순히 '미용실'만 검색하는 것이 아니라 '서울에서 파마를 가장 잘하는 미용실은 어딘가' '집에서 가장 가깝고, 서울에서 가장 높은 평가를 받은 미용실은 어딘가' 등 종합 검색을 할 수 있다. AI 오버뷰는 해당 내용을 기반으로 사용자 맞춤형 검색 결과와 링크를 제공한다. 구글 챗봇 '제미나이'에 제미나이 1.5프로 적용 구글은 자사 AI 챗봇 '제미나이'에 제미나이 1.5프로를 적용했다. 챗봇 제미나이는 지구글 드라이브를 비롯한, 지메일, 구글독스, 슬라이드, 스프레드시트 등에서도 작동해 왔다. 사용자가 챗봇에 '병원에서 온 최근 메일' 등 특정 내용에 대한 메일을 요약해달라고 요청하면, 챗봇은 관련 메일을 골라 핵심 내용을 요약해 준다. 이때 제미나이 프로1.5는 관련 이메일을 자동으로 분류할 수 있고, PDF 등 특정 파일 내 있는 내용까지 인식할 수 있다. 이 외에도 구글 '밋' 녹화본을 요약하거나 이메일 답변 초안 등을 생성할 수 있다. 몇달 내 구글 밋에 60개 언어 실시간 통번역 기능도 추가된다. 구글의 제미나이 시리즈는 크기나 학습양에따라 울트라, 프로, 나노로 이뤄졌다. 제미나이 1.5는 프로 버전의 차세대 모델이다. 올해 2월 출시됐다. 구글은 제미나이 1.5프로가 기존 프로 버전보다 정보를 동시 처리할 수 있는 능력이 늘었다고 설명했다. 우선 모델 토큰 처리량이 100만에서 200만으로 늘었다. 긴 문맥을 이해하는 능력이 기존 버전보다 약 87% 더 높다는 설명이다. 순다르 피차이 구글 CEO는 "제미나이 1.5프로는 더 적은 컴퓨팅 자원으로 제미나이 울트라를 맞먹는 성능을 보일 수 있다"고 설명했다. 올 여름 크롬에 제미나이 나노 적용…젬마2.0 출시 예정 이 회사는 올 여름 계획도 알렸다. 우선 크롬에 제미나이 나노를 적용할 예정이다. 현재 파인튜닝 작업 중이다.경량화 모델 '제미나이 1.5 플래시'도 공개했다. 제미나이 1.5 플래시는 반복 작업을 자동화하는 데 최적화된 모델이다. 오픈소스 소형언어모델(SLM) 업그레이드 버전 '젬마2.0'은 올 여름 출시할 예정이라고 발표했다. 사용자는 젬마를 허깅페이스, 엔비디아 니모, 버텍스AI, 캐글 등 오픈소스 플랫폼에서 이용할 수 있다. 피차이 구글 CEO는 "개발자는 젬마를 온디바이스AI 형태로 인터넷 연결 없이 유용하게 활용할 수 있을 것"이라고 설명했다. 제미나이로 이미지·영상도 간편히 편집하세요 구글은 이날 이미지와 영상을 생성·편집을 돕는 AI 도구도 공개했다. 비디오 생성 모델인 '비오'를 가장 앞세워 소개했다. 비오는 1분 이상의 고화질 동영상을 생성하는 모델이다. 다양한 효과로 영상을 제작할 수 있다. 피차이는 "비오는 문자와 이미지에 대한 이해도가 높다"며 "긴 프롬프트 내용도 정확하게 비디오에 반영할 수 있을 것"이라고 했다. 이 외에도 구글은 문자를 이미지로 바꿔주는 최신 모델 '이마젠3', AI반도체 가속기 TPU의 6세대 모델 '트릴리움' 등도 공개했다. 구글 '핵심인재' 딥마인드 CEO, 무대 첫 등장 이날 구글 I/O에 새 인물이 무대에 올랐다. 데미스 하사비스 딥마인드 CEO다. 하사비스 CEO는 멀티모달 AI인 '프로젝트 아스트라'와 이달 8일 출시한 '알파폴드3'를 소개했다. 프로젝트 아스트라는 멀티모달형 AI 비서다. 사람처럼 보고, 듣고, 말할 수 있는 형태다. 구글 앱에서 개인 정보를 활용해 사용자 스케줄을 세워주고 일정을 제안할 수도 있다. 하사비스 CEO는 프로젝트 아스트라를 영화 '스타트렉'에 나오는 커뮤니케이터에 비유했다. 그는 "인류는 이러한 AI 비서를 맞춤형으로 가질 것"이라며 "멀티플레이어로 항상 사용자 곁에 있을 것"이라고 했다. 알파폴드는 신약 개발과 연구에 활용되는 AI 모델이다. 이날 하사비스 CEO는 알파폴드3로 물질 분자 구조를 예측하는 시연을 진행했다. 알파폴드3는 단백질 분자 구조뿐 아니라 물질 간 상호작용까지 분석할 수 있었다. 그는 "알파폴드3는 기존 버전보다 예측 정확도가 50% 이상 높아졌다"고 강조했다. 구글은 새로 영입한 리즈 리드 검색총괄도 소개했다. 리드 검색총괄은 "AI 검색 활용이 향후 서비스 강점을 보일 것"이라고 예측했다. 그는 "AI 검색을 통해 질 높은 웹사이트만 살아남을 것"이라며 "이를 통해 고품질 웹사이트 클릭빈도는 더 늘어날 예정"이라고 했다.

2024.05.15 09:45김미정

'오픈AI 소라 경쟁자 등장'...구글, 동영상 생성 모델 '비오' 공개

구글이 동영상 생성모델 '비오'를 공개하며 오픈AI의 '소라'와 맞서기에 나선다. 14일(현지시간) 구글은 연례개발자 컨퍼런스 구글 I/O를 통해 동영상 생성모델 '비오'를 선보였다. 비오는 1080p해상도로 1분 이상 길이의 영상을 생성할 수 있다. 이 동영상 생성모델은 프롬프트를 보다 정확하게 이해하고 따를 수 있도록 교육 데이터의 각 비디오 캡션에 더 많은 세부 정보를 추가해 개발된 것이 특징이다. 또한 고품질의 압축된 비디오 표현을 사용해 효율성도 향상시켰으며 영상 생성 시간도 단축됐다. 자연어와 시각적 의미에 대한 높은 이해도를 갖춘 만큼 사용자가 프롬프터를 통해 세부적으로 작성하는 요구사항을 파악하고 이를 영상에 반영할 수 있다. 예를 들어 타입랩스, 항공촬영 등 영화 촬영 기법 등을 프롬프터로 입력하면 이를 파악해 그대로 적용 가능하다. 비오는 실제 영상 제작이나 편집을 보다 적극적으로 지원하는 것을 목표로 개발됐다. 이를 위해 텍스트 프롬프트와 함께 이미지를 입력으로 사용하여 비디오를 생성할 수 있는 기능을 지원한다. 영상 제작의 기준이 되는 참조 이미지를 지원함으로써 사용자는 보다 일관성 있고 의도한 비디오를 생성할 수 있다. 더불어 원활한 편집을 위해 영상에서 특정 부분만 지정하는 마스크 영역 기능도 지원한다. 또한 프롬프터를 이용해 스토리를 시리즈 형식으로 제작하면 1분으로 제한된 영상 길이를 넘어 연속성 있는 영상도 제작 가능하다. 이를 활용한다면 실제 영화 같은 영상물도 제작 가능하다는 것이 구글 측의 설명이다. 구글은 실제로 비오를 이용한 영화 제작을 준비 중으로 영화 제작자 도널드 글로버 및 그의 크리에이티브 스튜디오인 길가(Gilga)와 함께 작업을 진행하고 있다. 구글의 엘리 콜린스 제품 관리 부사장은 "비오는 전례 없는 수준의 창의적인 제어 기능을 제공한다"며 "창작자가 제작 과정에서 기술 개발 방식에 대해 목소리를 낼 수 있도록 지원할 것"이라고 설명했다.

2024.05.15 09:11남혁우

  Prev 1 2 3 4 Next  

지금 뜨는 기사

이시각 헤드라인

또 유찰된 국가 AI컴퓨팅센터…업계 "불확실·비현실적 사업 구조 개선해야"

여름 무더위 시작…유통가는 ‘수박 전쟁’ 돌입

"확실히 GD는 GD구나"...지드래곤 하이볼 흥행에 기부 선행까지

케이뱅크, KT와 손잡고 ‘AI 금융 혁신’ 속도

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현