• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
APEC2025
국감2025
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'제미나이 2.5 플래시 이미지'통합검색 결과 입니다. (328건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

EU, 구글-삼성전자 'AI 동맹' 제동 거나

유럽연합(EU) 경쟁당국이 삼성전자와 구글 간 인공지능(AI) 협에 대한 반독점 조사 가능성을 시사했다. 28일(현지시간) 로이터통신에 따르면 EU 경쟁 정책을 총괄하고 있는 마르그레테 베스타게르 부위원장은 한 콘퍼런스에 참가해 “삼성전자 특정 기기에 구글 제미나이 나노를 사전 탑재할 경우 어떤 영향이 있는 지 파악하기 위한 정보를 요청했다”고 밝혔다. 삼성전자는 올해 처음으로 AI 폰 '갤럭시S24 시리즈'에 구글 생성형 AI '제미나이 나노'를 탑재했다. EU의 이 같은 행보는 디지털시장법(DMA)을 기반으로 한 것이다. DMA는 구글, 애플 등 '게이트키퍼'로 지정된 기업들의 독점 행위를 엄격하게 규제한다. EU가 삼성과 구글 간의 AI 협력에 관심을 갖는 것도 이 같은 문제의식에서 출발한 것으로 풀이된다. 거대 IT 기업 간 협력이 중소 AI 기업들의 기회 박탈로 이어지는 것을 막기 위한 조치일 수 있다는 것이다. 이번 조치는 DMA 규제 대상인 '게이트키퍼'로 지정된 구글을 겨냥한 것이다. 하지만 실제 조사로 이어질 경우 삼성전자에도 불똥이 튈 수 있다. 갤럭시 AI 폰 신제품에 들어가는 생성형 AI 서비스를 구글이 아니라 다른 회사 제품으로 대체하거나, 자체 AI 기능을 강화에 나서는 등 대안을 마련해야 하는 상황이 생길 수 있기 때문이다. 하지만 업계에서는 애플도 하반기 오픈AI 등과 협력해 생성형 AI 기능을 접목한 아이폰을 선보일 예정인 만큼 애플 독점을 저지할 수 있는 삼성전자와 구글의 협력을 문제 삼기 어려울 것으로 보는 시각도 있다. 한편, 이날 베스타게르 수석 부집행위원장은 마이크로소프트(MS)와 오픈AI 간의 파트너십과 관련해서도 추가적인 조사가 진행될 것이라고 예고하기도 했다. 그는 "MS가 수년간 오픈 AI에 130억 달러를 투자했는데 우리는 이와 같은 협력 관계가 한 파트너가 다른 파트너에게 통제적인 영향력을 가지기 위한 위장인지 여부를 확실히 할 필요가 있다"고 말했다. 로이터 통신은 이같은 EU 움직임이 거대 정보기술 기업들이 신기술에 대한 지배력을 행사하는 것에 대한 세계 규제 당국의 불안감을 반영하는 것이라고 전했다.

2024.07.01 14:06류은주

LG전자, 구글 제미나이 탑재한 'AI 클로이 로봇' 연내 출시

LG전자가 구글의 AI 거대언어모델(LLM) '제미나이(Gemini)'를 탑재한 'LG 클로이(CLOi)' 로봇을 연내 출시한다고 밝혔다. LG전자는 출시에 앞서 27일 서울 신라호텔에서 열리는 '구글 클라우드 서밋 서울'에서 제미나이를 탑재한 '클로이 로봇'을 첫 공개한다. 이날 LG전자는 'AI 클로이 로봇'의 ▲고객의 질문에 자연스럽게 답변하는 AI 챗봇 기능 ▲음성 명령으로 원하는 사진 배경 이미지 생성 등을 시연할 예정이다. '제미나이'는 구글의 머신러닝(ML) 및 AI 앱 개발 플랫폼 '버텍스(Vertex) AI'에 탑재된 생성형 AI 모델이다. 텍스트를 비롯해 음성, 이미지, 코딩 등 다양한 방식으로 명령을 받는 멀티모달리티 성능이 특징이다. 클로이 로봇에 생성형 AI가 탑재되는 것은 이번이 처음이다. LG전자는 연내 구글의 생성형 AI를 탑재한 'LG 클로이 가이드봇(GuideBot)'을 출시한다. 또 기존 출시된 안내 로봇에도 무선 소프트웨어(SW) 업데이트를 통해 생성형 AI 기능을 확대 적용할 예정이다. 기존 클로이 로봇은 사전에 입력된 데이터를 기반으로 방문객 안내, 광고, 보안, 도슨트 등 다양한 역할을 수행할 수 있지만, 미리 등록되지 않은 질문에 대해서는 답변이 한정적이었다. 생성형 AI로 언어 능력을 강화한 LG 클로이 로봇은 고객과 대화에서 발생하는 각종 유사 질문을 스스로 생성해 커뮤니케이션 기능을 강화한다. 또 사전에 예측하지 못한 돌발 질문에도 검색을 통해 자연스러운 답변이 가능해 고객의 질문에 보다 정확하게 대답할 수 있다. 예를 들어, 기존에는 '운영 시간 안내해 줘'라고 질문하면 사전에 입력된 답변을 전달하는 데 그쳤다. 생성형 AI가 적용된 클로이는 “언제까지 입장 가능해?”, “오늘 영업 중이야?” 등 유사 질문을 스스로 생성하며 다양한 형태의 질문에 답한다. 또 현재 로봇을 운영 중인 공간과 무관한 “가장 큰 고래는 뭐야?” 등의 돌발 질문에도 “가장 큰 고래는 대왕고래로 몸길이가 24~33m까지 자란다”라고 자연스럽게 답변한다. LG전자는 구글과 협업을 통해 AI 로봇 생태계 구축에 속도를 낸다. 일찍이 로봇을 미래사업의 한 축으로 삼고 공항, 호텔, 식당, 병원, 리테일 매장, 스마트 물류창고 등 다양한 공간에서 쌓아온 로봇 솔루션 데이터와 빅테크의 AI 플랫폼 기술간 시너지로 미래 사업에서 한발 앞서 나간다는 계획이다. LG전자 노규찬 로봇사업담당은 “LG전자가 쌓아온 고도화된 AI 로봇 기술 역량과 빅테크 기업의 AI 플랫폼 기술 시너지를 통해 미래 신사업인 로봇 분야에서 고객경험 혁신을 주도할 것”이라고 말했다. 시장조사기관 스태티스타에 따르면 글로벌 AI 로봇 시장 규모는 연평균 약 25% 성장세를 이어가며 오는 2030년 약 643억5천만 달러(한화 약 90조)에 달할 전망이다.

2024.06.27 10:00이나리

삼성전자, '2억 화소' 망원용 이미지센서 아이소셀 HP9 공개

삼성전자는 스마트폰의 메인 카메라와 서브 카메라에 다양하게 적용할 수 있는 플래그십 이미지센서 3종을 공개한다고 27일 밝혔다. '아이소셀 HP9'은 0.56㎛(마이크로미터) 크기의 픽셀 2억개를 1/1.4"(1.4분의 1인치) 옵티컬 포맷에 구현한 망원용 이미지센서 제품이다. 옵티컬 포맷은 이미지 센서 규격으로, 카메라 모듈에서 외부 렌즈가 영상을 맺히게 하는 영역의 지름을 인치(Inch)로 변환한 값을 뜻한다. 아이소셀 HP9은 삼성전자가 신규 소재를 적용해 독자 개발한 고굴절 마이크로 렌즈를 활용해 빛을 모으는 능력을 향상시켜 각 컬러 필터에 해당하는 빛 정보를 더욱 정확하게 전달할 수 있다. 이를 통해 전작 대비 약 12% 개선된 감광 능력(SNR 10; 신호 대 잡음비가 10이 되는 조도 값)과 약 10% 향상된 '자동초점 분리비(AF Contrast)' 성능으로 더욱 선명한 색감 표현이 가능하다. 신호 대 잡음비는 하나의 픽셀에서 생성된 신호 대비 각종 노이즈의 양을 수치화한 값이다. 노이즈에 의해 손실되지 않는 순수한 신호의 강도로, SNR이 큰 이미지 센서일수록 이미지의 품질이 향상된다. 특히 아이소셀 HP9은 저조도 환경에서 상대적으로 취약한 망원 카메라의 감도를 개선하였으며, 인접 픽셀 16개(4x4)를 묶은 '테트라 스퀘어드 픽셀(Tetra2pixel)' 기술을 적용했다. 이를 기반으로 12Mp(Megapixel) 빅픽셀(2.24㎛) 인물 모드에서 저조도 감도 향상 뿐만 아니라 드라마틱한 아웃포커싱 효과인 보케(Bokeh)를 경험할 수 있다. 또한 아이소셀 HP9은 화질, 자동 초점, HDR(High Dynamic Range) 및 FPS(FRAMEs Per Second) 측면에서도 프리미엄 광각 센서에 준하는 성능을 갖췄다. 망원 카메라로 활용시 모든 배율에서 더욱 선명한 화질 경험을 선사할 것으로 기대된다. '아이소셀 GNJ'는 1/1.57"(1.57분의 1인치) 크기의 옵티컬 포맷에 1.0㎛ 픽셀 5천만개를 구현한 '듀얼 픽셀' 제품이다. '듀얼 픽셀'은 모든 픽셀이 두 개의 포토다이오드를 탑재해 초점을 맞추는 동시에 색 정보도 받아들일 수 있어 화질 손상 없이 빠르고 정확한 자동 초점 기능을 구현할 수 있다는 장점이 있다. 또한 센서 자체 줌(In-Sensor Zoom) 모드 동작시 비디오 모드에서 한층 선명한 화질 촬영과 함께 이미지 캡쳐 모드에서도 잔상과 모아레(Moire) 현상이 없는 선명한 해상력을 제공한다. 모아레 현상은 특정 주파수에서 반복되는 두 가지 이상의 패턴 간 상호 간섭으로 인해 시각적으로 왜곡되는 현상을 뜻한다. 특히 프리뷰 모드에서는 전작 대비 약 29%, 비디오 모드에서는 4K 60fps 기준 약 34%의 소비 전력이 개선됐다. 아이소셀 GNJ는 '고굴절 마이크로 렌즈'와 함께 삼성전자가 신규 개발한 '고투과 ARL' 소재를 적용해, 어두운 부분에도 선명한 화질을 제공하도록 개선했다. 고투과 ARL은 컬러 필터를 투과한 입사광을 최대화하기 위해 반사 또는 산란되는 광량을 줄이고 투과율을 높이는 기술이다. 또한 아이소셀 GNJ는 픽셀과 픽셀 사이 격벽 물질을 폴리 실리콘(Poly Si)에서 산화물(Oxide)로 변경해 투과된 빛의 손실을 줄이고 픽셀 간 간섭 현상을 줄여 더욱 선명한 이미지를 구현했다. 마지막으로 아이소셀 JN5는 1/2.76"(2.76분의 1인치) 크기의 옵티컬 포맷에 0.64㎛ 픽셀 5천만개를 구현한 제품이다. 듀얼 VTG(Vertical Transfer Gate)' 기술을 도입해, 픽셀에 들어온 빛이 변환된 전하의 전송 능력을 높이고 극 저조도에서의 노이즈 특성을 대폭 개선한 것이 특징이다. 듀얼 VTG는 포토다이오드에서 회로로 전자를 이동시키는 수직 구조의 게이트를 2개 배치해 전자 신호 전달 효율을 극대화하는 기술이다. 또한 좌·우, 상·하의 위상차를 모두 이용하는 위상차 자동 초점 기술인 '슈퍼 QPD(Quad Phase Detection)'기술을 적용해 빠르게 움직이는 피사체의 작은 디테일까지도 흔들림 없이 포착할 수 있다. 아이소셀 JN5에는 HDR 기능을 강화한 '듀얼 슬로프 게인(Dual Slope Gain)' 기술도 적용됐다. 듀얼 슬로프 게인 기술은 픽셀에 들어온 빛의 아날로그 정보를 서로 다른 2개의 신호로 증폭하고 이를 디지털 신호로 변환해 하나의 데이터로 합성하는 기술로, 센서가 표현할 수 있는 색의 범위를 넓혀 준다. 이 밖에도 하드웨어 리모자이크 알고리즘을 적용해 카메라 촬영 속도가 향상됐고, 프리뷰와 캡쳐 모드에서 실시간 줌 동작이 가능하다. 하드웨어 리모자이크 알고리즘은 컬러 픽셀을 재정렬해 디테일을 살리는 기술로, 픽셀을 기존 RGB 패턴으로 다시 맵핑해 풍부한 디테일을 살려내는 알고리즘이다. 이제석 삼성전자 시스템LSI사업부 Sensor사업팀 부사장은 "전통적인 이미지센서의 성능을 고도화하는 것은 물론, 메인과 서브 카메라의 격차를 줄여 모든 화각에서 일관된 촬영 경험을 선사하는 것이 업계의 새로운 방향으로 자리잡고 있다"며 "삼성전자는 최신 기술이 집약된 새로운 모바일 이미지센서 라인업을 통해 업계 표준을 리드하고, 센서 혁신 기술 개발을 지속해 한계를 돌파해 나갈 것"이라고 밝혔다.

2024.06.27 08:53장경윤

구글, 유명인 캐릭터와 대화하는 'AI 챗봇' 만든다

구글이 실존 인물 기반 캐릭터와 대화하는 인공지능(AI) 챗봇을 만들고 있는 것으로 알려졌다. 지난 25일(현지시간) 엔가젯 등 외신에 따르면, 구글은 연예인과 유튜브 인플루언서를 기반으로 새로운 AI 챗봇을 개발하는 중이다. '캐릭터AI'와 '메타' 등의 회사가 유명인이나 가상의 인물을 담은 AI 챗봇을 출시한 데 이어 구글도 자사의 데이터와 기반 기술을 활용해 챗봇 서비스를 준비하는 것이다. 구글의 '유명인 챗봇'은 자사의 생성형 AI '제미나이'로 구동될 예정이다. 현재 구글은 유명인 뿐 아니라 유튜버 등의 인플루언서들과도 파트너십을 맺어 자사 챗봇의 캐릭터를 늘리려 하고 있다. 아울러 사람의 성격과 외모를 입력하기만 해도 특정인의 챗봇 캐릭터를 만들 수 있는 기능을 개발 중이다. 동종업계를 살펴보면, 메타의 챗봇은 유튜버 ▲미스터 비스트 ▲스눕 독 ▲톰 브래디 ▲패리스 힐튼 등의 인물을 캐릭터로 만들었다. AI 챗봇 서비스 기업 '캐릭터AI'는 각종 정치인·철학자·가상의 인물로 만든 챗봇까지 있다. 구글이 구체적으로 어떤 유명인이나 인플루언서의 챗봇을 출시할 지는 아직 공개되지 않않다. 구글의 챗봇 프로젝트는 자회사 '구글 두들스'의 임원 '라이언 저믹'과 그의 팀이 진행하는 것으로 알려졌다.

2024.06.26 09:42정석규

'AI 시대' HBM 이을 주자는 QLC 낸드…삼성·SK·엔비디아도 주목

최첨단 낸드 기술을 조망하는 국제 메모리 행사가 오는 8월 미국에서 열린다. 이번 행사는 AI 산업을 위한 낸드 솔루션에 초점을 맞출 예정으로, 삼성전자와 엔비디아 등도 이 같은 주제로 함께 담론을 나눌 것으로 알려졌다. 낸드는 데이터센터에 탑재되는 SSD(솔리드 스테이트 드라이브)에 활용되는 메모리반도체다. 최근 AI 산업의 발달로 D램 기반의 HBM(고대역폭메모리)가 각광받고 있으나, 낸드 역시 고용량 데이터를 효율적으로 저장하기 위한 요소로 떠오르고 있다. 25일 업계에 따르면 8월 6일부터 8일까지 미국 캘리포니아주 산타클라라시에서는 '플래시 메모리 서밋 2024(FMS 2024)'가 개최될 예정이다. FMS는 낸드 및 낸드 기반의 스토리지(저장장치)를 중심으로 한 세계 최대의 메모리 행사다. 고적층 3D 낸드, NVMe(비휘발성 메모리 익스프레스) 등은 물론, CXL(컴퓨트 익스프레스 링크)나 UCIe 표준 칩렛 인터페이스와 같은 최첨단 기술의 동향도 조망한다. 이번 FMS 2024에는 전 세계 주요 메모리 기업들이 대거 참여할 예정이다. 메모리 소자업체인 삼성전자·SK하이닉스, 팹리스인 파두 등 국내 업체들도 주요 경영진의 기조연설(executive Premier Keynotes)을 진행한다. 이외에도 마이크론, 키오시아, 웨스턴디지털, 마이크로칩 등이 이름을 올리고 있다. 구체적인 연설 주제는 아직 발표되지 않았으나, 이번 행사의 주제는 AI에 초점이 맞춰질 것으로 전망된다. 반도체 업계 관계자는 "낸드는 데이터센터 산업의 핵심 요소로, 지난해 행사에서도 AI가 최대 화두로 오른 바 있다"며 "올해도 각 기업이 AI를 주제로 각종 발표를 준비하고 있는 것으로 안다"고 말했다. 특히 이번 FMS 2024에서 주목할 만한 행사는 주요 경영진의 AI 기술 관련 토의다. 해당 토의는 주요 AI 반도체 팹리스 기업인 엔비디아가 주최를 맡고, 삼성전자와 키오시아, 슈퍼마이크로, VAST가 패널로 참여한다. 토의 주제는 'AI 워크로드를 위한 메모리 및 스토리지 혁신'이다. 한편 삼성전자, SK하이닉스 등 국내 주요 메모리 기업들은 AI 산업에 요구되는 방대한 양의 데이터를 관리하기 위한 최신 낸드 솔루션 개발에 열을 올리고 있다. 삼성전자의 경우 지난 4월 업계 최초로 1Tb(테라비트) TLC(트리플 레벨 셀)의 9세대 V낸드 양산을 시작한 바 있다. 290단대의 9세대 낸드는 업계 최소 크기의 셀과 몰드 두께 구현으로 이전 세대 대비 약 1.5배 높은 비트 밀도를 구현한 것이 특징이다. 나아가 삼성전자는 올 하반기 QLC(쿼드 레벨 셀) 9세대 V낸드도 본격 양산할 계획이다. QLC는 셀 하나에 4비트를 저장해, 3비트를 저장하는 TLC보다 데이터 저장량이 많다. SK하이닉스도 자회사 솔리다임을 통해 데이터센터용 QLC 낸드 사업을 적극 확장하고 있다. 현재 60TB eSSD의 출시를 계획 중인 단계로, 내년에는 300TB 제품 개발을 목표로 하고 있다.

2024.06.25 13:55장경윤

"애플, AI 챗봇에 '라마' 활용하자는 메타 제안 거절"

애플이 메타의 인공지능(AI) 협력 제안을 거절한 것으로 알려졌다. 앞서 월스트리트저널(WSJ)은 복수의 소식통을 인용해 애플이 자사 AI 시스템 '애플 인텔리전스'에 메타의 생성형 AI를 통합하는 방안에 대해 논의 중이라고 보도했다. 하지만 블룸버그에서 이미 양 사의 협상이 이미 결렬됐다는 정반대의 보도를 한 것이다. 25일(현지시간) 블룸버그 통신 마크 거먼은 익명의 소식통을 인용해 지난 3월 애플은 메타의 AI 모델 라마를 활용하는 것에 대해 짧게 논의하긴 했으나, 공식적인 대화로 이어지지 않았으며 최종적으로 메타의 제안을 거절했다고 전했다. 양측 대화는 지난 3월 애플이 구글·오픈AI 등 빅테크 기업의 AI 모델을 도입할 무렵 시작됐으나, 애플은 메타의 개인정보 보호 정책이 충분하지 않다고 판단해 메타와 논의를 진전하지 않은 것으로 전해진다. 애플은 지난 10일 열린 '연례 세계개발자회의(WWDC)'에서 자사 음성 비서 '시리'에 오픈AI의 챗GPT 탑재를 발표하며 향후 제휴 업체를 확대하겠다는 의사를 밝혔다. 애플 인텔리전스는 하반기 선보일 아이폰16 시리즈에 처음으로 탑재될 예정이다. 하지만 애플 인텔리전스는 아직 글로벌 빅테크 수준의 기술력을 갖추지 못해 애플은 AI 선도기업과 파트너십을 체결 중이다. 블룸버그는 구글은 이미 애플 사파리 웹 브라우저 검색 파트너이기 때문에 구글 제미나이와 협업할 가능성이 높다고 봤다.

2024.06.25 09:47류은주

KAIST, 멀티모달 대형언어모델 '깃허브' 공개…GPT-4V 시각성능 "제꼈다"

국내 연구진이 오픈AI의 GPT-4V와 구글 제미나이-프로(Gemini-Pro)의 시각 성능을 능가하는 멀티모달 대형언어모델을 개발, 오픈소스 커뮤니티 깃허브(Github)에 공개했다. 최근 주목받는 생성형 AI 트랜드가 멀티모달화로 진화 중이어서 귀추가 주목됐다. KAIST는 전기및전자공학부 노용만 교수 연구팀이 GPT-4V 등 비공개 상업 모델의 시각 성능을 넘어서는 공개형 멀티모달 대형언어모델을 선보였다고 20일 밝혔다. 연구팀은 멀티모달 대형언어모델 시각 성능을 개선하기 위해 '콜라보(CoLLaVO)'와 '모아이(MoAI)' 2가지 기술을 자체 개발했다. 이병관 연구원(박사과정,제1저자)은 "GPT-4V나 제미나이-프로 등과 시각성능 만을 비교하면 점수나 정확도 면에서 최대 10% 더 우수하다"고 말했다. 인지추론성도 함께 따져봐야 하지만, 이는 이번 연구 주제에서 벗어나 나중에 생각할 부분이라는 것이 이 연구원 얘기다. 사실 인지추론성도 개별 검토한 결과 오픈AI나 구글 모델 대비 결코 뒤지진 않는다는 것이 이 연구원의 귀뜸이다. 연구팀은 '콜라보'를 개발하기 전 기존 공개형 멀티모달 대형언어모델 성능이 비공개형에 비해 떨어지는 이유를 1차적으로 물체 수준에 대한 이미지 이해 능력 저하에서 찾았다. 연구팀은 이를 개선하기 위해 이미지 내 정보를 배경과 물체 단위로 분할하고 각 배경 및 물체에 대한 정보를 멀티모달 대형언어모델에 직접 넣어주는 '크레용 프롬프트(Crayon Prompt)'라는 시각적 프롬프트를 새로 설계했다. 또 시각적 지시 조정 단계에서 크레용 프롬프트로 학습한 정보를 잃어버리지 않기 위해 물체 수준 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터로 학습시키는 획기적인 학습전략인 '듀얼 큐로라(Dual QLoRA)'를 제안했다. 이병관 연구원은 "이로 인해 이미지 내에서 배경 및 물체를 1차원적으로 구분하는 능력이 크게 향상됐다"고 덧붙였다. 대형언어모델인 모아이(MoAI)'도 개발했다. 인간이 사물을 판단하는 인지과학적 요소(물체 존재나 상태, 상호작용, 배경, 텍스트 등)에서 영감을 얻었다는 것이 연구팀 설명이다. 연구팀은 "기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용하기 때문에, 이미지 픽셀 수준에서의 상세하고 종합적인 실세계 장면에 대한 이해가 모자란다고 판단했다"고 말했다. 연구팀은 △전체적 분할 △한계가 없는 물체 검출기 △상황 그래프 생성 △글자 인식 등 4가지 컴퓨터 비전 모델을 언어로 변환한 뒤 멀티모달 대형언어모델에 입력했다. 이를 연구팀이 실제 검증한 결과 '콜라보'는 Math Vista(대학수준 수학 및 물리문제)나 MM-벤치(영어 객관식 문제), MMB-CN(중국어 객관식 문제), AI2D(어학문제) 등의 풀이에서 기존 모델 대비 최대 10%까지 점수와 정확도가 우수했다. 또 '모아이'는 기존 공개형 및 비공개형 LLVMs(멀티모달 대형언어)와 비교한 결과 각 질문에 따라 점수가 20포인트 이상 우수하게 답변한 경우도 나타났다. 이병관 연구원은 "3개월전 깃허브에 올려놓은 '콜라보'(https://github.com/ByungKwanLee/CoLLaVO)와 '모아이'(https://github.com/ByungKwanLee/MoAI)에 관심을 가져달라"며 "박사학위가 마무리되면 멀티모달 대형언어를 아이템으로 창업할 생각도 있다"고 말했다. 박사과정 5년차인 이 연구원은 또 "개인적으로 향후 기회가 닿는다면, 핸드폰에 들어가는 사이즈로 현재 성능을 유지하는 멀티모달 대형언어모델을 만들어 볼 것"이라고 덧붙였다. 노용만 교수는 “연구팀에서 개발한 공개형 멀티모달 대형언어모델이 허깅페이스 일간 화제의 논문(Huggingface Daily Papers)에 추천됐다"며 "SNS 등을 통해 전세계에 점차 알려지는 등 관련분야 발전에 기여할 것"으로 기대했다. 연구에는 논문 제1저자 이병관 박사과정 연구원 외에도 박범찬 석박사통합과정, 김채원 박사과정이 공동 저자로 참여했다. 연구결과는 '콜라보'의 경우 자연어 처리(NLP) 분야 국제 학회 'ACL Findings 2024'(5월16일자)에 게재됐다. '모아이(MoAI)'는 컴퓨터 비전 국제 학회인 'ECCV 2024'에 논문을 제출하고 결과를 기다리고 있다. 한편 이 연구는 KAIST 미래국방 인공지능 특화연구센터 및 전기및전자공학부 지원을 받아 수행했다.

2024.06.20 14:26박희범

노키아-구글, 5G 앱 개발 박차

글로벌 통신장비 제조사 노키아가 구글과 제휴를 맺고 5G 앱 개발에 나선다. 20일(현지시간) 잭스에쿼티리서치 등 외신에 따르면, 노키아는 자사의 소프트웨어 개발자들이 5G 앱 개발을 가속화할 수 있도록 구글 클라우드 플랫폼과 협력을 확대했다. 이 협업으로 인해 노키아의 개발자들은 구글 클라우드의 자원과 최첨단 기술을 활용해 5G 앱을 개발하게 된다. 구글 클라우드는 노키아 개발자에게 ▲소프트웨어 개발 키트 ▲네트워크 API 문서 ▲시뮬레이션 ▲테스트 샌드박스 등의 도구를 제공해 앱 개발을 돕는다. 또 노키아는 구글 클라우드의 플랫폼 '버텍스 AI'와 '제미나이 1.5 프로'를 사용해 개발자들에게 풍부한 경험을 제공할 계획이다. 이 두 플랫폼은 ▲텍스트 ▲이미지 ▲비디오 ▲코드 등 다양한 유형의 정보를 결합하고, 여러 형태로 정보를 출력할 수 있다. 노키아는 구글 클라우드의 네트워크를 활용해 전 세계의 통신 네트워크·시스템 관련 기업·소프트웨어 개발자를 자사 생태계로 통합하는 것을 목표로 한다. 잭스에쿼티리서치는 노키아는 이번 협력을 통해 다양한 산업 분야에서 글로벌 네트워크를 확대할 것으로 분석했다. 노키아의 주가는 지난 1년 동안 12.2% 하락했지만, 노키아가 속한 글로벌 통신 업계는 53.0%의 성장률을 기록했다.

2024.06.20 10:01정석규

어도비 애크로뱃, 파이어플라이 AI 달았다

어도비는 파이어플라이 AI를 통합한 '어도비 애크로뱃'의 혁신을 19일 발표했다. 새로운 애크로뱃 기능을 통해 사용자는 생성형 AI로 기존 이미지를 손쉽게 개선하거나 새로운 이미지를 생성할 수 있다. 이 업데이트는 PDF 솔루션 최초의 인-앱(in-app) 이미지 생성 역량을 제공한다. 고객은 현재 유통되는 약 3 조 개의 PDF에서 어도비 파이어플라이로 구동되는 텍스트 프롬프트를 사용한 이미지 생성 및 편집을 할 수 있다. 어도비는 어도비 애크로뱃 리더 및 애크로뱃 워크플로우에 긴밀히 통합된 대화형 엔진인 애크로뱃 AI 어시스턴트 신규 기능을 통해 여러 PDF 그룹은 물론 마이크로소프트 워드 및 파워포인트, 텍스트 파일 등 다양한 유형의 문서에 걸친 정보를 바탕으로 사용자 질문에 답하고 인사이트를 제공하며 콘텐츠 제작을 지원하고, 한층 향상된 회의 기록 역량도 추가했다. 이미지 편집(Edit Image)은 파이어플라이 구동 생성형 채우기(Generative Fill), 배경 제거(Remove background), 지우기(Erase), 자르기(Crop) 등 용이한 툴을 통해 문서에 콘텐츠를 쉽게 추가, 제거 및 활성화할 수 있는 기능을 제공한다. 사용자는 원하지 않는 개체나 배경을 제거하고 새로운 이미지를 추가하며 PDF의 시각적 요소를 간편하게 제어할 수 있다. 어도비 파이어플라이 이미지 3 모델(로 구동되는 이미지 생성(Generate Image)은 PDF문서 내 어디든지 손쉽게 이미지를 추가할 수 있다. 사용하기 쉬운 강력한 디자인 툴을 통해 이미지로 문서에 전문적이며 창의적인 분위기를 더할 수 있다. 새로운 이미지 편집 및 이미지 생성을 통해 크리에이티브 전문성 없이도 누구나 쉽고 빠르게 애크로뱃에서 뛰어난 시각적 요소를 제작할 수 있다. 기업 영업팀의 경우, 텍스트가 많은 사업 계획서에 이미지 생성으로 이미지를 추가해 가독성과 영향력을 높일 수 있다. 이미지 생성 및 이미지 편집을 통해 기업은 투자자용 발표자료에서 기존 시각 요소를 업데이트 및 맞춤화하고, 홍보자료의 배경이 계절감과 문화적 요소를 반영하도록 쉽고 빠르게 업데이트하는 것도 가능하다. 리서치, 시험 준비, 데이터 분석, 회의록 작성 등의 작업 시 단일 문서 또는 파일 유형 내 있는 정보만 사용하는 경우는 드물다. 새로운 애크로뱃 AI 어시스턴트 기능은 누구나 쉽고 빠르게 문서 내 정보에서 인사이트를 얻고 서식을 만들며, 콘텐츠를 공유할 수 있도록 돕는다. 사용자는 간단한 답변부터 심도있는 리서치에 이르기까지, 선택한 여러 문서에서 주요 주제, 트렌드 및 관계를 파악하고 다양한 출처의 정보를 종합해 영향력 있는 콘텐츠로 만들 수 있다. 가령 Z세대 고객 접근 방법을 찾기 위해 PDF, 워드 및 파워포인트 등의 문서를 가지고 있는 마케터라면 애크로뱃 AI 어시스턴트에 해당 문서들을 드래그 앤 드롭 후 '해당 문서에 나타나는 주요 주제에 대한 개요 제공'과 같은 질문 제안을 빠르게 생성하고, 'Z세대의 소셜 미디어 습관은 무엇인가?'와 같은 질문도 할 수 있다. AI 어시스턴트는 문서 내 정보에 기반한 답변을 생성하고, 지능형 인용(Intelligent citations)을 포함해 마케터가 답변의 출처를 쉽게 확인하거나, 특정 위치로 빠르게 이동(quickly navigate)해 더 자세히 알아볼 수 있도록 돕는다. 이 밖에 '문서 내 핵심 내용을 이메일 형식으로 제작'과 같이 특정 목적에 맞게 정보를 보다 매력적인 콘텐츠(compelling content)로 만들 수 있게끔 서식화해달라는 요청도 가능하다. 새롭게 향상된 회의록 작성 역량은 주요 주제, 핵심 사항 및 실행 항목을 빠르게 이해할 수 있도록 자동으로 생성형 요약(generative summaries)을 제공해, 회의 참가자들이 최신 정보를 파악하며 팀이 일관된 방향으로 나아갈 수 있도록 지원한다. 어도비는 어도비 고객 데이터에 대해 자사의 생성형 AI 모델을 학습시키지 않는다. 파이어플라이 및 애크로뱃 AI 어시스턴트를 포함한 어도비 AI 기능은 책임, 의무 및 투명성이라는 어도비의 AI 윤리 원칙에 따라 개발됐다. 어도비 파이어플라이는 조정을 거친 어도비 스톡 콘텐츠와 저작권 만료된 퍼블릭 도메인 이미지를 포함한 라이선스 콘텐츠에 대해 학습하며 상업적으로 안전하게 사용하도록 설계된다. 어도비는 크리에이티브 과정에서 생성형 AI 사용에 대한 투명성을 제공하기 위해, 어도비 애크로뱃의 파이어플라이 구동 기능으로 제작 및 편집한 디지털 콘텐츠에 디지털 '영양 성분 표시' 역할을 하는 콘텐츠 자격증명(CC)을 자동 첨부해 사용자와 신뢰를 구축하고 있다. 어도비는 고객이 안심하고 기능을 사용할 수 있도록 학습, 테스트, AI 윤리 검토 위원회가 감독하는 검토 프로세스를 포함해 디자인에서부터 개발, 배포에 이르는 표준화된 과정을 구축했다. 애크로뱃의 새로운 이미지 편집 및 이미지 생성 기능은 초기에는 데스크톱에서 영어로 제공된다. 애크로뱃 AI 어시스턴트는 데스크톱, 웹 및 모바일에서 영어로 제공되며 이외 언어는 추후 제공될 예정이다. 아비간 모디 어도비 도큐먼트 클라우드 수석 부사장은 “어도비는 편집, 공유, 보호, 내보내기 등 PDF를 지속적으로 혁신하며 정적인 페이지에서 협업을 위한 작업 공간으로 변화시켜 왔다”며 “이제 생성형 AI를 통해 새로운 문서 유형 전반에 걸쳐 이미지 생성 및 인사이트를 제공하며 이 분야를 한 단계 더 발전시키고, 모든 사용자가 간단한 프롬프트를 사용해 쉽고 빠르게 정보를 더 잘 이해하고 정보를 매력적인 콘텐츠로 변환할 수 있도록 지원할 것”이라고 밝혔다.

2024.06.19 09:06김우용

20년차 홍보인의 AI 도구로 스마트한 척 글쓰기

2004년 신문기자로 사회에 발을 디디며, 기사 작성법을 배웠다. 신박한 '법'이랄 게 없었다. 선배들 글을 흉내내 원고지에 채워 넣었다. 이를 '붉은펜' 선배에게 들고 가면, 원고지는 으레 난도질 당했다. 여러 손을 거쳐, 편집장에게 도달한다고 끝이 아니다. 200자 원고지는 최종 보스 손에서 '쫙쫙' 갈라진다. 하얀 먹물을 맞으며, 퍼즐 맞추기를 반복했다. 강산이 두 번 변했다. 글밥으로 배를 채운 지 21년째다. 모니터에 글자 새기기는 여전히 부담스럽다. 실력이 퇴화된 게 분명하다. 후배 글의 완성도를 높이거나, 타 부서 업무 메일을 수정하는 글 작업이 대부분이었기 때문이다. '새로 쓰는 게 낫겠다'며 들릴듯 말듯 투덜 대는 건 힘없는 핑계다. 이런 중년 꼰대에게 구세주가 강림했다. 챗지피티(ChatGPT)와 같은 인공지능 도구다. 남다르게, 앞서가는 척 시작할 수 있다. 일단 '글쓰기 부담이 줄어든다'. 10여년 전, S사 홍보실 후배 하나는 모니터에 띄운 빈 워드 화면이 그렇게나 두려웠다고 한다. 키보드에 손 올리기 전, 머릿속으로 문장을 수백 번 고쳐 쓰고, 지웠다. 온종일 모니터를 노려보던 그는 퇴근시간이 임박해서야 손가락을 움직이고는 했다. 챗지피티를 빌리면, 초안을 깔고 시작할 수 있다. 후배가 작성한 보도자료도 돌려 보자. 정신 건강에 아주 좋다. 시간을 절약하고, 잔소리도 아끼게 된다. 둘째로, '퇴고 작업 효율화'다. 과거, 홍보실 '왕고참' 하나는 매일 50개의 서술어 채워넣기를 주문했다. ~밝혔다, 설명했다, 강조했다, 제언했다, 덧붙였다, 해석했다 등. 세종대왕의 위대함을 새삼 느끼며, '다쓴 치약'을 짜내야 했다. 챗지피티는 같은 문장의 다양한 서술어를 제시한다. 문법 및 문장 구조 개선에 탁월하다. 동시에 글의 논리적 흐름을 유지한다. 자연스럽고, 읽기 쉬운 문장을 만들어 준다. 맞춤법 검사는 덤이다. '창의적인 아이디어 생성'이 세 번째 이유다. 미디어에 제공하는 자료는 창의성과 신선함이 생명이다. 챗지피티는 여러 주제에 대한 인사이트를 제시한다. 페르소나와 구체적인 설정을 제시하면, 독창적이고 흥미로운 콘텐츠가 생성된다. 기획기사나, 마케팅PR 전략 설계를 위한 백업 자료에 주로 활용한다. 넷째로, '자료 조사와 풍성한 사례 제시'다. 사례를 찾기 위해 회사 홈페이지를 뒤지거나, PDF 소개서를 훑었다. 연구소의 리포트나, 사전을 돌려가며 영어 논문을 검색하기도 했다. 정보의 홍수 속에 챗지피티는 필요한 자료만 요약 정리해 수초 내로 안겨주는 '알프레도'다. 한글로 명령을 내리면서, 영어로 답해달라는 주문을 넣어보자. 정확도 높은 풍성한 답변을 쥐게 된다. 챗지피티를 활용하면, 창의적이고 효과적인 홍보 활동을 펼칠 수 있다. 이러한 목표를 달성하는 데 분명 강력한 도구다. 미디어 업계에서 많은 변화를 겪었다. 의외로, 세상의 변화 속도에 가장 늦는 게 언론사, 그리고 이를 상대하는 홍보인이라고들 한다. 취향껏 클로드(Claude), 제미나이(Gemini), 큐(Cue:)를 업무에 조금씩 적용해 보자. 미팅을 앞둔 기자의 최근 작성 기사 요약 및 관심사를 얻을 수 있다. 회의록을 정리하고, 하루를 마감하는 퇴근일기도 좋다. Ai 모니터링은 훌륭하다. 많은 일을 적은 시간에, 높은 품질로 해낼 수 있다.

2024.06.16 08:00문지형

삼성전자, 북미 통합 'AI 연구센터' 신설...애플 '시리' 담당임원 영입

삼성전자가 캐나다와 미국의 인공지능(AI) 연구센터 2곳을 통합해 '북미 AI 센터를 신설한다. 더불어 애플에서 음성비서 '시리' 업무를 담당했던 임원을 영입해 새로운 북미 AI 센터 총괄을 맡긴다. 12일 블룸버그통신에 따르면 삼성전자는 캐나다 토론토와 미국 캘리포니아주 마운틴뷰에 있는 연구소를 통합해 북미 AI 센터라는 새 조직을 만들었다. 각 AI 센터를 유지하면서 양사를 총괄하는 컨트롤타워를 세워 조직을 효율적으로 운영하고 연구 시너지를 모색하기 위한 방침이다. 또 삼성전자는 북미 AI 센터 수장으로 애플 전 임원인 무라트 아크바칵을 영입했다. 그는 애플에서 음성비서 시리의 사업모델과 실행 전략을 세우는 업무를 맡았고, 애플에 합류하기 전 마이크로소프트(MS)에서 음성 비서 관련 AI를 연구하며 챗봇을 개발했다. 블룸버그는 "이런 움직임은 세계 최대의 기술 기업들이 AI 분야에서 더욱 공격적으로 변하고 있음을 보여주는 신호"라며 "삼성이나 애플 같은 기기 제조업체는 AI 기능을 제공해 소비자가 더 자주 제품을 교체하도록 유도하는 방법으로 보여진다"고 진단했다. 삼성과 애플은 관련 내용에 대한 논평을 거부했다. 한편 애플은 지난 10일 세계개발자회의(WWDC) 2024를 열고 아이폰·맥 등 기기 전반에 자체 '애플 인텔리전스'를 도입한다고 밝혔다. 애프은 자사의 음성비서 '시리'에 오픈AI의 '챗GPT'를 도입한다는 방침이다. 다만 애플은 챗봇을 구동하기 위해 오픈AI의 기술을 사용하지만 나머지 대부분 기능은 자체 개발했다. 반면 삼성전자는 구글 '제미나이'를 통해 AI 챗봇 서비스를 제공한다.

2024.06.12 11:16이나리

애플, 구글표 생성형 AI '제미나이'와 통합 시사

애플이 WWDC24에서 자체 음성비서 '시리'에 오픈AI의 AI 챗봇 '챗GPT'를 통합한다고 밝혔다. 이런 가운데 애플의 핵심 경영자가 다른 회사 AI와의 통합 가능성을 언급했다고 IT매체 맥루머스가 11일(현지시간) 보도했다. 애플 소프트웨어 엔지니어링 담당 크레이그 페더리기 수석 부사장은 WWDC24 기조연설 후 기자들과의 대화에서 애플표 AI '애플 인텔리전스'가 발전함에 따라 이용자들에게 다양한 AI 모델 중에서 선택할 수 있는 기회를 제공하고 싶다고 밝혔다. 이어 구글 제미나이가 또 하나의 후보가 될 수 있다고 덧붙였다. 그는 “궁극적으로 사람들은 창의적인 글쓰기에 적합한 모델이나 코딩에 적합한 모델 등 자신이 원하는 특정 모델을 선호하게 될 것”이라며, "앞으로는 구글 제미나이가 나올 수도 있다. 지금 당장 발표할 내용은 없지만 이것이 우리의 방향"이라고 밝혔다. 페더리기는 애플이 챗GPT를 처음 도입하기로 한 것은 "최고부터 시작하고 싶었기 때문”이라고 설명했다. 시리는 별도 계정을 만들 필요 없이 GPT-4o를 무료로 활용한다. 애플 인텔리전스 기능은 iOS18의 첫 번째 베타 버전에는 포함되지 않고, 미국에서 올 여름 테스트를 진행할 예정이며 iOS 18 정식 출시는 오는 9월이 될 예정이다.

2024.06.12 09:08이정현

파두, 美 WD과 차세대 SSD 기술 개발 나서

시스템 반도체 팹리스(Fabless) 기업 파두는 미국 스토리지 전문기업 웨스턴디지털과 파트너십을 맺고 기업용 SSD(솔리드 스테이트 드라이브)에서 사용되는 차세대 기술인 'FDP(Flexible Data Placement)'을 공동 개발한다고 10일 밝혔다. FDP는 빅테크 기업들이 모여서 차세대 데이터센터의 표준을 논의하는 OCP(Open Compute Project)의 표준으로 제시된 기술로서, 특히 메타가 제안해 구글 등의 빅테크들도 앞다퉈 채택하고 있다. FDP 기술을 적용하면 데이터센터에서 사용되는 핵심 저장장치인 SSD에서 데이터를 기록하는 방법을 새로운 방식으로 구조화한다. 이를 통해 SSD의 성능개선은 물론 사용 수명을 크게 연장하는 효과를 얻을 수 있다. 또한 FDP는 실제 고객의 데이터보다 더 많은 양의 데이터가 기록돼 SSD의 수명과 성능에 영향을 주는 문제인 '쓰기증폭(write Amplification) 현상'을 크게 줄여줌으로써 SSD의 쓰기 성능을 최대 2~3배까지 향상한다. SSD의 수명 또한 대폭 늘려줄 수 있어 막대한 데이터가 오가는 초대형 데이터센터 환경에서 매우 중요한 기술적 혁신으로 평가받고 있다. 에릭 스패넛 웨스턴디지털 마케팅 담당 부사장은 “초대형 데이터센터 고객들의 경우 SSD의 전폭적인 성능 개선은 물론 더 긴 수명과 더 낮은 전력소비를 요청하고 있다”며 “파두와의 협력을 통해 이러한 목표를 달성할 수 있을 것으로 기대하고 있고 이는 고객들에게도 매우 큰 의미가 있을 것”이라고 밝혔다. 이지효 파두 대표는 “FDP 기술을 통해 SSD 저장공간에 데이터배치를 최적화할 수 있고 이는 스토리지 기술 분야에서 매우 중요한 성과라고 볼 수 있다”며 “웨스턴디지털과의 파트너십을 통해 최고 수준의 FDP기술을 구현함으로써 획기적인 성능개선은 물론 SSD의 수명 또한 크게 증가시킬 수 있는 스토리지 솔루션을 공급해 나가겠다”고 말했다. 파두와 웨스턴디지털은 FDP 기술이 널리 보급된다면 총투자비용(TCO) 감소는 물론 스토리지 효율성 면에서 새로운 표준을 수립하는데 기여하게 될 것으로 전망하고 있다. 파두는 이번 웨스턴디지털과의 협력과 함께 앞으로도 획기적인 데이터관리는 물론 보다 지속가능한 데이터센터 건설에 기여할 수 있는 SSD 솔루션을 지속적으로 제공할 예정이다.

2024.06.10 10:32장경윤

"자료 팩트체크도 가능"…구글, AI 비서 '노트북LM' 업그레이드

구글이 사용자 노트북에서 작동하는 메모 애플리케이션 기능을 업그레이드했다. 7일 더 버지에 따르면 구글은 메모 앱 '노트북LM'에 자사 멀티모달 모델 제미나이1.5 프로를 탑재하고 답변 출처 기능을 추가해 전 세계 200곳에 배포했다. 노트북LM은 사용자 노트북에 저장된 메일이나 자료, 메모, 논문 등을 결합해 요약하거나 정리하는 앱이다. 개인 노트북마다 맞춤형 AI 비서가 탑재된 것과 같은 이치다. 이번 업그레이드를 통해 노트북LM은 사용자 문서 기반으로 질문에 답변을 생성하거나 자료 분석도 가능하다. 인터뷰 녹취록이나 이미지 요약도 할 수 있다. 웹 URL을 비롯한 PDF, 구글 슬라이드 내 콘텐츠 인식도 할 수 있다. 요약이나 정리에 사용된 출처 표시 기능도 제공한다. 사용자는 AI가 준 자료 내용이 맞는지 팩트체크하거나 원본 텍스트를 살펴볼 수 있다. 이번 제미나이 1.5프로가 노트북LM에 들어가면서 한 번에 처리하는 용량도 늘었다. 영어 기준으로 2천500만 단어를 한 번에 분석·생성할 수 있다. 이를 통해 노트북에 저장된 자료 기반으로 특정 분야 학습 가이드, 목자, 용어집 등을 만들어 줄 수 있다. 예를 들어 의대생이 신경과학에 대한 기사를 PDF로 저장한 뒤 노트북LM에 '도파민 관련된 용어집을 만들어줘'라고 요청하면, 노트북LM은 PDF에 저장된 기사나 논문 기반으로 용어집을 생성해 준다. 구글랩스 스티브 존슨 에디토리얼 디렉터는 "노트북LM 목표는 이용자들에게 쉬운 정보 접근과 빠른 초안 작성 환경을 지원하는 것"이라고 온라인 기자간담회서 밝혔다.

2024.06.07 10:02김미정

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

구글, AI 도구로 개발자 혁신 지원

구글이 개발자 서비스를 더 쉽게 활용할 수 있도록 해주는 프로그램을 출시했다. 4일(현지시간) SDT 등 외신에 따르면 구글이 개발자를 위한 생성형 인공지능(AI) 제미나이 기반 개발 도구 및 리소스를 통합 제공하는 지원 프로그램을 선보인다. 구글 개발자 프로그램은 파이어베이스, 구글 클라우드 등 개발자 중심 컴포넌트가 있는 여러 웹사이트에서 AI 챗봇 인터페이스에 접근할 수 있도록 한다. 이를 통해 문서 페이지에서 코드 스니펫의 설명을 얻는 등 더 많은 정보를 학습할 수 있다. 개발자들은 구글 도구에 대해 질문하거나 구글 API를 사용하기 전에 시험해 볼 수 있다. 또 샘플 코드를 생성하고 문제를 해결할 수도 있다. 개발자 프로그램은 참가자들이 프로젝트IDX에 접근할 수 있는 다섯 개의 작업 공간을 제공합니다. 프로젝트IDX는 크로스 플랫폼 개발을 위한 클라우드 기반 작업 공간이다. 그동안 개발자는 두 개의 작업 공간만 생성할 수 있지만, 이를 통해 추가로 세 개 공간을 지원한다. 참여자들은 구글이 후원하는 그룹에 가입 신청을 할 수도 있다. 이러한 그룹은 비슷한 분야에서 활동하는 개발자 커뮤니티로, 독점적인 이벤트와 자원에 접근 가능하다. 멤버들은 구글 클라우드 혁신가 프로그램에 가입해 구글 클라우드 기술 승진의 실험실 크레딧을 받을 수 있다. 이 크레딧은 회사가 제공하는 모든 클라우드 트레이닝 학습 경로에 사용할 수 있다. 구글 개발자 프로그램은 참여를 원하는 모든 개발자에게 무료로 지원한다. 개발자 프로필이 아직 없다면 새로 만들고 관심사와 주제를 추가하면 된다. 구글은 수 개월 내에 프로그램에 새로운 기능을 추가할 예정이다. 구글의 크리스 데메케 수석 제품 관리자는 "개발자가 구축하고 배우고 성장할 수 있도록 돕기 위해 개발자 프로그램을 만들고 있다"며 "이 프로그램을 전 세계 모든 개발자에게 열려 있으며 사용자는 학습 여정을 관심사에 맞춰 조정하고, 작업을 조직하며, 진행 상황을 추적하고, 배지를 획득하며, 성과를 공유할 수 있다"고 말했다.

2024.06.05 09:25남혁우

[유미's 픽] "난 빅스비와 사랑에 빠질까?"…감정 읽는 AI 비서, 빅테크 新 격전지됐다

"굿모닝, 테어도르. 5분 후에 회의야, 벌떡 좀 일어나 볼래요? 일어나!" 생성형 인공지능(AI)을 탑재한 'AI 비서'가 최근 우후죽순 쏟아지면서 AI와 사랑에 빠진 남성의 이야기를 다룬 영화 '허(Her)'가 10여년 만에 현실로 다가온 분위기다. AI의 휴대형, 개인화 현상이 짙어진 탓에 'AI 비서'와 관련된 기술들이 빠른 속도로 개발되며 시장의 새로운 성장동력이 되고 있다는 평가다. 25일 업계에 따르면 오픈AI와 아마존, 애플, 구글, 삼성전자 등 글로벌 기업들은 최근 생성형 AI를 탑재한 'AI 비서'로 시장 내 주도권 잡기 경쟁에 나섰다. 사람을 뛰어넘는 수준의 범용인공지능(AGI) 개발에 천문학적 돈을 쏟아 붓고 있는 이들은 'AI 비서'가 시장을 열어줄 마중물 역할을 할 것으로 기대하고 있다. 'AI 비서' 시장에서 가장 주목 받는 곳은 '챗GPT'로 유명한 오픈AI다. 지난 13일 보고, 듣고, 사람과 실시간으로 대화할 수 있는 새 AI 거대언어모델(LLM) 'GPT-4o'를 공개한 덕분이다. GPT-4o는 텍스트를 통해 대화했던 기존 챗GPT와 달리 이용자와 실시간 음성 대화를 통해 질문을 받고 답변을 내놓는다. 텍스트·음성뿐 아니라 이미지 인식 기능까지 갖춘 멀티모달(Multimodal) 모델로, 사람이 말하는 내용이나 보여주는 이미지를 즉각 이해하고 그에 걸맞은 답을 할 수 있다. 새 모델명의 'o'는 '옴니(Omni·모든 것)'라는 의미에서 따왔다. 특히 빠른 응답 시간은 GPT-4o의 강점으로 꼽힌다. GPT-4o의 평균 응답 시간은 0.32초로, 0.25초가 소요되는 인간의 응답시간과 비슷하다. 사람과 대화하듯 실시간으로 농담을 주고받고 대화를 할 수 있다는 뜻이다. 사용자가 중간에 말을 끊고 다른 말을 하는 것을 이해하는 것도 가능하다. 오픈AI는 이르면 6월에 음성 AI 비서 서비스를 내놓을 예정이다. 'GPT-4o' 공개 하루 뒤 경쟁사인 구글도 연례 개발자 회의(I/O)를 통해 새로운 생성형 AI 비서 '프로젝트 아스트라'를 내놨다. 아스트라는 텍스트뿐만 아니라 이미지, 영상, 음성 등을 한 번에 처리할 수 있는 미래형 AI 비서 서비스로, 인간처럼 보고 듣고 배울 수 있다. 구글은 제미나이와 자연스럽게 대화할 수 있는 '제미나이 라이브'도 출시할 예정이다. 마이크로소프트(MS)도 이에 맞서 대화형은 아니지만 'AI 비서' 기능을 연례 개발자 회의 '빌드'를 통해 공개했다. MS의 모든 제품에 탑재된 '코파일럿'을 이용할 경우 별다른 명령 없이 사용자의 이메일을 모니터링하고, 프로젝트의 다음 단계를 수행하기 위해 필요한 데이터나 연락망들을 빠르게 이용할 수 있도록 한 것이 특징이다. 또 MS는 오픈AI의 GPT-4o를 클라우드 서비스 애저 AI 이용자들이 이용할 수 있도록 가장 빨리 적용해 부족함을 채웠다. 샘 올트먼 오픈AI 최고경영자(CEO)는 '빌드' 행사에 깜짝 등장해 "기술이 이렇게 의미있는 방식으로 빠르게 채택되는 것을 본 적이 없다"며 "(AI)모델들이 앞으로 점점 더 똑똑해질 것"이라고 말했다. 빅테크들의 이 같은 움직임에 기존 음성 비서 서비스를 제공하던 업체들의 움직임도 바빠졌다. 10년간 음성 비서 '알렉사'를 운영했던 아마존은 올해 말께 생성형 AI를 적용해 새롭게 선보일 예정이다. 이를 위해 자체 개발한 LLM '타이탄'을 적용할 것으로 알려졌다. 기술개발 비용을 상쇄하기 위해 월 구독료를 부과할 예정으로, 금액은 아직 확정되지 않았다. 자사 기기에 AI 기능 탑재를 추진 중인 애플도 내달 열리는 연례 세계개발자회의(WWDC)에서 생성형 AI를 탑재한 '시리'를 공개할 것으로 전해졌다. '시리'는 애플이 지난 2011년 선보인 서비스로, 이용자 요청에 타이머나 알람 설정, 날씨 등을 음성으로 알려준다. 오픈AI의 GPT-4o처럼 깊이 있는 양방향 소통은 불가능하다. 삼성전자 음성 비서 '빅스비'도 오는 7월 LLM 기반의 생성형 AI를 접목해 변화를 시도한다. '빅스비'는 지난 2017년 '갤럭시 S8' 스마트폰부터 적용했고 이후 스마트폰, TV, 가전 등에 탑재됐지만, 최근 출시된 음성 AI 비서들과 비교하면 기능이 다소 뒤처진다. 이에 삼성전자는 'DS 어시스턴트', '가우스포털' 등 자사가 만든 생성형 AI를 사내에서 사용 중으로, 이를 손질해 '빅스비'에 적용시켜 조만간 가전, 스마트폰에도 접목해 선보일 계획이다. 업계 관계자는 "알렉사, 시리, 빅스비 등 기존 음성 비서 서비스들은 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었다"며 "이제는 음성을 음성 그 자체로 인식해 처리 과정이 빨라진 데다 목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있게 됐다는 점에서 상당한 기술 차이가 있다"고 설명했다. 이처럼 생성형 AI를 활용한 음성 비서 시장에 빅테크들이 잇따라 뛰어들면서 관련 시장에 대한 전망도 긍정적이다. 실제 일본 시장조사기관 글로벌 인포메이션에 따르면 AI와 머신러닝(ML)을 사용하는 지능형 가상비서(IVA)의 올해 시장 규모는 147억7천만 달러(약 20조1천억원)로 추정된다. 2023~2030년 연평균 성장률(CAGR)은 26.2%로 2030년 시장 규모는 474억 달러(약 64조6천억원)에 달할 것으로 전망된다. 업계 관계자는 "생성형 AI 음성 비서가 앞으로 돈이 될 것으로 보고 빅테크들을 중심으로 앞 다퉈 서비스를 내놓고 있는 분위기"라며 "듣고 말하는 AI가 전 산업에 걸쳐 가져올 변화는 가늠하기 어려울 정도"라고 밝혔다. 이어 "향후 서비스가 고도화되고 규모의 경제가 1위 업체에 몰릴 경우 2등 이하는 업계에서 생존조차 가늠할 수 없을 것으로 보여 빅테크들의 초반 주도권 잡기 경쟁은 더 치열해지고 있다"며 "다만 AI비서 개발을 위해서는 개인정보와 편향성, 윤리적인 문제도 함께 고려돼야 할 것"이라고 덧붙였다.

2024.05.26 09:26장유미

"검색과 AI는 제로섬 관계가 아니다"

세계 인공지능(AI) 시장을 이끄는 미국의 오픈AI와 구글이 지난주에 잇따라 대형 행사를 갖고 개발성과물을 공개했습니다. 오픈AI는 사람처럼 보고 듣고 말하는 새로운 AI 모델 'GPT-4o'를 선보였습니다. 2014년에 개봉한 영화 '그녀(Her)'가 10년 만에 현실이 됐다는 찬사를 받았습니다. 구글은 인공지능(AI) 모델 '제미나이'를 자사 대부분의 제품에 접목하며 '제미나이 생태계'를 완성했습니다. 두 행사 모두 세계 언론의 주목을 받았습니다. 놀랄 만한 기능이 쏟아졌고 귀 기울여야 할 주요 관계자들의 발언도 많았습니다. 그중 개인적으로 특히 주목한 발언이 있습니다. 구글의 연례 개발자 회의(I/O) 둘째 날 순다르 피차이 최고경영자(CEO)가 한 말입니다. “검색과 AI는 제로섬 관계가 아니다”는 말이었습니다. 새로운 메시지는 아니지만 AI 시대 진화 방향의 핵심이 담긴 말로 여겨졌습니다. 빌 게이츠는 'AI 에이전트'의 등장으로 “5년 내에 컴퓨터를 사용하는 방식이 완전히 바뀔 것”이라고 말한 바 있습니다. 앞으로 더 진화해야 하겠지만 'GPT-4o'가 바로 빌 게이츠가 말한 'AI 에이전트'로 생각됩니다. 구글도 I/O 행사에서 'GPT-4o'와 비슷한 '프로젝트 아스트라'를 선보였습니다. 영화 '그녀(Her)'에서 주인공 '테오도르'가 연정을 갖게 되는 인공지능 운영체제 '사만다'와 흡사합니다. 영화 '그녀(Her)'는 스스로 생각하고 느끼기까지 하는 AI 사만다와 사람 테오도르의 감정 교류에 초점을 맞추었습니다만 현실에서 'GPT-4o'와 '프로젝트 아스트라'는 사람의 노동과 생활을 도와주는 그야말로 인공지능 비서로서의 에이전트 역할을 주로 할 것입니다. 결국 'GPT-4o'와 '프로젝트 아스트라'의 경쟁은 누가 더 사람을 현실적으로 잘 도와줄 수 있느냐의 문제라고 봐야 할 것입니다. 기자의 작업을 예로 들어보겠습니다. 기사를 작성하는 데는 여러 가지 능력이 요구되지만 그 중 핵심은 글쓰기와 취재입니다. 글쓰기는 축적된 지능에 가깝습니다. 주로 두뇌의 영역입니다. 취재는 현장 발굴입니다. 주로 몸과 발의 영역입니다. 이 둘이 잘 조화돼야 합니다. 몸과 발이 멈춰 있으면 그럴 듯해도 내용이 없는 글이 되고, 몸과 발이 뛰어도 형식이 흐트러지면 읽히지 않는 글로 남습니다. 2022년 11월 챗GPT 출현 이후 지금까지 우리가 AI에 주목한 것은 컴퓨터가 사람처럼 글을 쓸 수 있는 지능을 획득했다는 점입니다. 글뿐만이 아니라 그림 음악 말 등 인간이 만들어낸 지적 능력을 다 갖추게 된 것이지요. 하지만 무시할 수 없는 큰 문제가 있습니다. 환각(hallucination) 현상입니다. 환각 현상이 있는 AI의 결과물은 취재하지 않고 쓴 기사와 같습니다. 공허한 이야기일 수 있죠. “검색과 AI는 제로섬 관계가 아니다”는, 새로울 것 없는 말에 다시 주목한 이유가 거기에 있습니다. 'GPT-4o'와 '프로젝트 아스트라'가 사람을 현실적으로 잘 도와줄 수 있는 AI 에이전트가 되기 위해서는 반드시 취재 능력을 장착해야 한다는 생각을 한 것입니다. AI 에이전트에 취재 능력이란 무엇이겠습니까. 그렇습니다. 바로 검색입니다. 가장 정확한 최신의 정보를 찾아내는 능력이 요구될 것입니다. 팩트가 결정적으로 중요하지 않는 AI의 영역이 있기는 할 것입니다. 놀이와 일부 창작의 영역이 그럴 수 있을 것입니다. 하지만 AI가 생산성을 높여야 하는 노동이나 쇼핑 여행 등 생활을 도와주기 위해서는 팩트 취재가 핵심일 수밖에 없을 것입니다. AI 이전에도 더 정확한 최신 정보를 찾아주는 검색 도구를 선호했듯이 인공지능 비서에게도 그런 능력을 최고의 가치로 쳐줄 가능성이 높은 것입니다. 기술적으로는 '검색 증강 생성', 즉 RAG(Retrieval-Augmented Generation)라고 하는 모양입니다. RAG는 결과적으로 'GPT-4o'나 '프로젝트 아스트라' 같은 대형 언어모델(LLM)의 입력 값을 누가 더 정확한 최신의 정보로 하느냐의 경쟁인 듯도 합니다. 이 경쟁은 한 순간에 결판이 나지는 않을 듯합니다. 앞으로 수년간 이용자가 실제로 사용하면서 그 효능을 느끼고 판단하면서 결과가 드러나게 되겠지요. AI 시대에도 검색 기술은 과소평가될 수 없으며 오히려 더 중요해졌다는 말로도 이해됩니다. 콘텐츠도 더 소중해질 것 같습니다. 특히 콘텐츠의 질(質)이 더 부각될 듯도 합니다. 오픈AI나 구글 같은 회사가 가치가 낮은 콘텐츠보다 관점 경험 전문성 등에서 더 훌륭한 콘텐츠를 취재하도록 'GPT-4o'나 '프로젝트 아스트라' 같은 언어모델을 발전시킬 가능성이 높기 때문이죠. 사람이 그걸 원할 테니까요.

2024.05.20 10:41이균성

픽셀플러스, 1분기 영업익 1.8억원 '흑자전환'

픽셀플러스는 별도 재무제표 기준 2024년도 1분기 매출액은 약 141억4천만원, 영업이익은 약 1억8천만원을 기록했다고 17일 밝혔다. 전년동기 대비 매출액은 약 14% 증가했으며, 영업이익은 흑자로 전환했다. 픽셀플러스 관계자는 1분기 실적에 대해 “완성차 전장 시장 확대에 따른 매출처 다변화 및 수량의 증가로 인해 매출액이 증가했고, 이 같은 추세가 지속적으로 확대될 것으로 기대하고 있다”고 말했다. 픽셀플러스는 매출 구조를 수익성이 높은 비포 마켓 위주로 전환하기 위한 체질 개선 작업에 속도를 내고 있다. 비포 마켓용 자동차 이미지센서 수요가 높아지고 있는 만큼, 다양한 기술을 적용한 이미지센서 제품 사업화를 적극적으로 추진하고 있다. 나아가 비포 마켓의 티어1 업체를 대상으로 신제품 프로모션을 지속적으로 진행하고 있으며, 곧 가시적인 성과가 있을 것으로 회사 측은 기대하고 있다. 또한 신규로 개발한 FHD HDR 이미지센서를 AI 가전 및 IoT용 제품에 적용하는 등 차량 외 시장 확대를 위해 적극적으로 마케팅 활동을 전개하고 있다. 김도형 픽셀플러스 전략기획본부 상무는 “이번 1분기에는 원가비용 관리 및 수익성 확대에 집중함으로써 흑자 전환할 수 있었다”며 “픽셀플러스는 앞으로 비포 마켓향 공급망 확대 및 AI 가전 시장 공략을 위해 노력할 계획”이라고 말했다.

2024.05.17 08:44장경윤

구글 "'제미나이' 시대 열렸다…모든 서비스 '맞춤형'으로 진화"

"구글은 '제미나이' 시대를 본격화한다. 검색엔진부터 지도, 워크 스페이스 등 모든 서비스에 제미나이를 적용할 것이다. 사용자는 맞춤형 서비스와 콘텐츠로 만족도를 높일 것이다. 개발자도 원하는 작업을 제약 없이 수행할 수 있다." 14일(현지시간) 순다르 피차이 구글 최고경영자(CEO)는 연례 개발자 컨퍼런스 '구글I/O2024' 기조연설에서 이같이 밝혔다. 구글이 완전히 생성형 AI에 서비스 초점을 맞췄다고 재차 강조했다. 이날 새로운 발표자도 등장했다. 데미스 하사비스 딥마인드 CEO도 구글I/O 무대에 처음 나섰다. 최근 새로 영입된 구글 리즈 리드 검색총괄도 발표했다. 앨범에 사진만 수천 개…"음성으로 원하는 것만 쏙쏙 찾아줘" 순다르 피차이는 올해 중순 '구글 포토'에 제미나이를 적용한 새 기능을 추가한다고 발표했다. 음성으로 사진을 검색할 수 있는 기능 '사진에 물어보기' 메뉴다. 사용자는 구글 포토에서 음성만으로 원하는 사진을 찾을 수 있다. 사진 찾기 위해 일일이 스크롤 하지 않아도 된다. 이날 피차이 CEO가 직접 기능을 시연했다. 그가 "우리 딸 수영 실력이 어떻게 늘고 있는지 보여줘"라고 묻자, 구글 포토는 한 소녀가 수영을 연습하는 장면 사진만 시간순으로 나열해 보여줬다. 피차이 CEO는 "앞으로 구글 포토에서 사진 찾기 위해 고생하지 말고 음성으로 신속히 찾아라"고 강조했다. 검색이 진화했다…대화하면서 맞춤형 검색 결과 척척 구글은 검색 서비스에도 'AI 오버뷰' 기능을 추가했다. AI 오버뷰가 검색 결과를 요약해 주고, 결과에 대한 링크까지 공유해줄 수 있다. 문자뿐 아니라 이미지나 영상으로도 검색할 수 있다. 피차이 CEO는 "기존 페이지 링크 형태가 아닌 대화 형태로 검색 결과를 제공한다"고 설명했다. 사용자는 이 서비스를 통해 점진적 추론도 할 수 있다. 예를 들어, 사용자는 단순히 '미용실'만 검색하는 것이 아니라 '서울에서 파마를 가장 잘하는 미용실은 어딘가' '집에서 가장 가깝고, 서울에서 가장 높은 평가를 받은 미용실은 어딘가' 등 종합 검색을 할 수 있다. AI 오버뷰는 해당 내용을 기반으로 사용자 맞춤형 검색 결과와 링크를 제공한다. 구글 챗봇 '제미나이'에 제미나이 1.5프로 적용 구글은 자사 AI 챗봇 '제미나이'에 제미나이 1.5프로를 적용했다. 챗봇 제미나이는 지구글 드라이브를 비롯한, 지메일, 구글독스, 슬라이드, 스프레드시트 등에서도 작동해 왔다. 사용자가 챗봇에 '병원에서 온 최근 메일' 등 특정 내용에 대한 메일을 요약해달라고 요청하면, 챗봇은 관련 메일을 골라 핵심 내용을 요약해 준다. 이때 제미나이 프로1.5는 관련 이메일을 자동으로 분류할 수 있고, PDF 등 특정 파일 내 있는 내용까지 인식할 수 있다. 이 외에도 구글 '밋' 녹화본을 요약하거나 이메일 답변 초안 등을 생성할 수 있다. 몇달 내 구글 밋에 60개 언어 실시간 통번역 기능도 추가된다. 구글의 제미나이 시리즈는 크기나 학습양에따라 울트라, 프로, 나노로 이뤄졌다. 제미나이 1.5는 프로 버전의 차세대 모델이다. 올해 2월 출시됐다. 구글은 제미나이 1.5프로가 기존 프로 버전보다 정보를 동시 처리할 수 있는 능력이 늘었다고 설명했다. 우선 모델 토큰 처리량이 100만에서 200만으로 늘었다. 긴 문맥을 이해하는 능력이 기존 버전보다 약 87% 더 높다는 설명이다. 순다르 피차이 구글 CEO는 "제미나이 1.5프로는 더 적은 컴퓨팅 자원으로 제미나이 울트라를 맞먹는 성능을 보일 수 있다"고 설명했다. 올 여름 크롬에 제미나이 나노 적용…젬마2.0 출시 예정 이 회사는 올 여름 계획도 알렸다. 우선 크롬에 제미나이 나노를 적용할 예정이다. 현재 파인튜닝 작업 중이다.경량화 모델 '제미나이 1.5 플래시'도 공개했다. 제미나이 1.5 플래시는 반복 작업을 자동화하는 데 최적화된 모델이다. 오픈소스 소형언어모델(SLM) 업그레이드 버전 '젬마2.0'은 올 여름 출시할 예정이라고 발표했다. 사용자는 젬마를 허깅페이스, 엔비디아 니모, 버텍스AI, 캐글 등 오픈소스 플랫폼에서 이용할 수 있다. 피차이 구글 CEO는 "개발자는 젬마를 온디바이스AI 형태로 인터넷 연결 없이 유용하게 활용할 수 있을 것"이라고 설명했다. 제미나이로 이미지·영상도 간편히 편집하세요 구글은 이날 이미지와 영상을 생성·편집을 돕는 AI 도구도 공개했다. 비디오 생성 모델인 '비오'를 가장 앞세워 소개했다. 비오는 1분 이상의 고화질 동영상을 생성하는 모델이다. 다양한 효과로 영상을 제작할 수 있다. 피차이는 "비오는 문자와 이미지에 대한 이해도가 높다"며 "긴 프롬프트 내용도 정확하게 비디오에 반영할 수 있을 것"이라고 했다. 이 외에도 구글은 문자를 이미지로 바꿔주는 최신 모델 '이마젠3', AI반도체 가속기 TPU의 6세대 모델 '트릴리움' 등도 공개했다. 구글 '핵심인재' 딥마인드 CEO, 무대 첫 등장 이날 구글 I/O에 새 인물이 무대에 올랐다. 데미스 하사비스 딥마인드 CEO다. 하사비스 CEO는 멀티모달 AI인 '프로젝트 아스트라'와 이달 8일 출시한 '알파폴드3'를 소개했다. 프로젝트 아스트라는 멀티모달형 AI 비서다. 사람처럼 보고, 듣고, 말할 수 있는 형태다. 구글 앱에서 개인 정보를 활용해 사용자 스케줄을 세워주고 일정을 제안할 수도 있다. 하사비스 CEO는 프로젝트 아스트라를 영화 '스타트렉'에 나오는 커뮤니케이터에 비유했다. 그는 "인류는 이러한 AI 비서를 맞춤형으로 가질 것"이라며 "멀티플레이어로 항상 사용자 곁에 있을 것"이라고 했다. 알파폴드는 신약 개발과 연구에 활용되는 AI 모델이다. 이날 하사비스 CEO는 알파폴드3로 물질 분자 구조를 예측하는 시연을 진행했다. 알파폴드3는 단백질 분자 구조뿐 아니라 물질 간 상호작용까지 분석할 수 있었다. 그는 "알파폴드3는 기존 버전보다 예측 정확도가 50% 이상 높아졌다"고 강조했다. 구글은 새로 영입한 리즈 리드 검색총괄도 소개했다. 리드 검색총괄은 "AI 검색 활용이 향후 서비스 강점을 보일 것"이라고 예측했다. 그는 "AI 검색을 통해 질 높은 웹사이트만 살아남을 것"이라며 "이를 통해 고품질 웹사이트 클릭빈도는 더 늘어날 예정"이라고 했다.

2024.05.15 09:45김미정

  Prev 11 12 13 14 15 16 17 Next  

지금 뜨는 기사

이시각 헤드라인

[ZD브리핑]미중 무역 갈등 봉합 수순...SK그룹 ‘SK AI 서밋’ 개최

비트코인 11만달러 선 밑으로... 솔라나 ETF 출시에도 4% 하락

AI 해고의 역풍…구조조정 기업 절반 "결정 후회한다"

민주노총 새벽배송 금지 제안에…"건강권 보장" VS "생계수단 잃어"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.