• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'인공지능 모델'통합검색 결과 입니다. (169건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

마이크로소프트, AI 이어 범용로봇 진출한다

마이크로소프트가 오픈AI를 통해 확보한 인공지능(AI) 기술력을 바탕으로 범용 로봇분야까지 진출한다. 최근 MS파워유저 등 외신에 따르면 생츄어리AI는 마이크로소프트와 파트너십을 체결했다고 공식홈페이지를 통해 밝혔다. 이번 파트너십을 통해 양사는 범용 인간형 로봇을 위한 AI모델을 연구 개발할 예정이다. 캐나다 밴쿠버에 위치한 생츄어리AI는 인간과 유사한 지능을 갖춘 범용 로봇 개발을 목표로 하는 스타트업이다. 이들이 개발한 로봇 피닉스(Phoenix)는 카본이라는 AI제어 시스템을 적용해 인간의 행동 데이터를 정교하게 따라할 수 있다. 또한 촉각, 시각 등의 감각을 인식하며 이를 기반으로 복잡한 행동이나 업무도 수행 가능하다. 양사는 생츄어리AI가 개발한 로봇AI 노하우와 마이크로소프트의 대형 언어 모델(LLM) 기술과 애저 클라우드 인프라를 활용해 실제 산업현장 등에서 AI로 학습한 행동을 수행하는 '대형 행동 모델(LBM)'을 선보인다는 계획이다. 애쉴리 로렌스 마이크로소프트 리서치 상무이사는 "우리는 생츄어리AI와 협력해 추론, 계획, 인간-에이전트 협업과 같은 분야에서 AI 모델 혁신을 가속화하고 구체화된 AI 연구를 가속화하게 되어 기쁘게 생각한다”며 “이번 협력을 통해 다양한 산업 전반에 걸쳐 도움을 줄 수 있는 범용 로봇의 미래를 탐구할 것”이라고 말했다.

2024.05.05 09:30남혁우

어도비, '파이어플라이 이미지 3 파운데이션 모델' 공개

어도비는 포토샵과 파이어플라이 웹 애플리케이션에서 사용할 수 있는 크리에이티브 생성형 AI 모델군의 후속 릴리스인 '어도비 파이어플라이 이미지 3 파운데이션 모델' 베타 버전을 24일 공개했다. 파이어플라이 이미지 3는 고품질 이미지 생성, 프롬프트 이해도 향상, 새로운 차원의 디테일 및 다양성, 빠른 아이디어 구상과 표현에서의 개선 등 결과의 품질과 다양한 표현에 있어 고도화된 역량을 제공한다. 어도비의 최신 파이어플라이 모델은 향상된 조명, 위치, 디테일, 텍스트 표시 등을 통해 이전보다 한층 더 사실적인 품질을 제공한다. 사용자는 파이어플라이 웹 앱 내 텍스트를 이미지로 모듈의 구조 참조 및 스타일 참조와 이미지의 종횡비를 확장하고 변경할 수 있는 생성형 채우기 모듈의 새로운 생성형 확장 기능에 파이어플라이 이미지 3를 활용할 수 있다. 파이어플라이는 작년 3월 첫 선을 보인 이래 전 세계적으로 70억 개 이상의 이미지를 생성하는 데 사용됐다. 포토샵, 어도비 익스프레스, 일러스트레이터, 서브스턴스 3D, 인디자인 등 워크플로우에 직접 통합할 수 있도록 구축된 파이어플라이는 불과 1년 만에 이미지 편집, 템플릿 제작, 벡터 디자인, 3D 텍스처링 및 스테이징 작업을 눈에 띄게 개선시켰다. 어도비는 새로운 파운데이션 모델을 출시할 때마다 크리에이터 커뮤니티에 베타 버전으로 기술을 공개하고 피드백을 통해 결과물을 발전시키고 있다. 파이어플라이 이미지3는 크리에이터가 비전을 보다 쉽게 실현하고 더 생산적으로 작업하며 고품질의 디테일한 이미지를 생성할 수 있도록 빠른 아이디어 구상과 실험을 위한 역량을 제공한다. 새로운 스타일 엔진으로 구동되는 파이어플라이 이미지 3의 새로운 자동 스타일화 역량은 더욱 다양한 고품질 결과물을 제공해, 사용자가 생성하는 이미지의 스타일을 더 잘 제어하고 개인화할 수 있도록 지원한다. 새로운 스타일, 색상, 배경, 피사체 포즈 등을 포함한 이미지 결과물은 사용자에게 창의적인 아이디어를 위한 다양한 옵션을 제공하고 보다 빠른 탐색을 돕는다. 파이어플라이 이미지 3로 구동되는 구조 참조 및 스타일 참조 역량은 탁월한 사용자 제어와 최첨단 시각적 품질을 제공한다. 사용자는 구조 참조를 통해 참조 이미지의 구조를 반영한 새로운 이미지를 빠르게 생성할 수 있어, 완벽한 프롬프트를 작성해야 하는 시행착오를 줄일 수 있다. 또한 고품질의 결과물을 제공하는 스타일 참조를 활용해 맞춤화된 스타일을 생성할 수 있다. 이러한 역량의 결합으로 사용자는 이미지 구조와 스타일을 모두 참조해 아이디어를 빠르게 실현할 수 있다. 파이어플라이 이미지 3는 개선된 조명 및 포지션 등을 통해 새로운 차원의 사진 품질을 제공한다. 특히 디테일한 이목구비와 다양한 분위기 및 표정을 반영한 인물 렌더링과 복잡한 구조물 및 군중을 표현하는 데 상당히 개선된 모습을 볼 수 있다. 파이어플라이 이미지 3는 텍스트 프롬프트와 장면에 대한 이해도가 향상되어, 길고 복잡한 프롬프트를 정확하게 반영하고 보다 풍부한 디테일이 담긴 이미지를 생성할 수 있다. 개선된 텍스트 렌더링으로 텍스트가 명확하게 표기된 이미지를 생성하는 것이 가능해져, 포스터와 같은 에셋에 대한 아이디어를 보다 효율적으로 구현할 수 있다. 파이어플라이 이미지 3는 아이콘, 로고, 래스터 이미지 및 라인 아트를 빠르게 만들 수 있도록 결과물의 일러스트레이션도 대폭 개선했다. 베타 버전으로 제공되는 파이어플라이 이미지 3는 어도비 애플리케이션의 파이어플라이 구동 생성 크레딧을 포함한 유료 구독 플랜 또는 무료로 파이어플라이 웹 앱에서 이용 가능하다. 어도비 파이어플라이는 어도비 스톡과 같은 라이선스 콘텐츠를 학습했으며, 저작권 및 상표, 로고와 같은 다른 지적재산(IP)을 침해하지 않는 상업적 용도의 콘텐츠를 생성하도록 설계됐다. 어도비는 다층적이며 지속적인 검토와 조정을 통해 어도비의 정책에 위배되는 콘텐츠를 차단 및 삭제하고, 파이어플라이가 생성한 콘텐츠에 대한 지적재산 면책 기회를 기업 고객에게 제공한다. 최근 어도비는 브랜드가 대규모 개인화를 위해 콘텐츠를 제작하고 생산하는 방식을 근본적으로 변화시키기 위해 어도비 파이어플라이 서비스 및 커스텀 모델을 도입했다. 콘텐츠 제작, 편집 및 조합을 위한 생성형 크리에이티브 API, 툴 및 서비스 활용을 지원하는 파이어플라이 서비스는 모든 제작 또는 워크플로우에 통합할 수 있어 기업의 대규모 콘텐츠 제작 자동화 시 품질 유지 및 제어를 돕는다. 커스텀 모델은 기업의 IP, 제품, 브랜드 스타일을 기반으로 생성형 AI 모델을 학습해, 크리에이티브 및 마케팅 팀이 일관되게 브랜딩을 유지할 수 있도록 지원한다. 일라이 그린필드 어도비 디지털 미디어 부문 최고기술책임자는 “1년여 만에 수백만 명의 크리에이터가 매일 아이디어를 구상하기 위해 사용하는 이미지 생성 툴로 자리잡은 파이어플라이는 아직 시작 단계에 불과하다”며 “어도비는 이미지 3 파운데이션 모델을 통해 계속해서 최첨단 기술을 발전시키고 있고, 크리에이티브 커뮤니티는 이번 베타 버전을 활용해 무궁무진한 가능성을 발휘할 것으로 기대된다”고 강조했다. AI 사용에 대한 투명성을 제공하기 위해 콘텐츠 자격증명은 파이어플라이에서 생성된 콘텐츠에 자동으로 첨부되고 있다. 디지털 콘텐츠의 '영양 성분 표시'와 같은 콘텐츠 자격증명은 제작 또는 편집 과정에서 AI를 사용했는지 여부 등 디지털 콘텐츠에 대한 상세 정보를 제공할 수 있는 위변조 확인이 가능한 메타데이터다. 콘텐츠 자격증명은 C2PA 개방형 표준을 기반으로 개발됐으며, 디지털 생태계에서 신뢰를 높이기 위해 2019년 어도비 주도로 출범한 콘텐츠 진위 이니셔티브(CAI)의 지원을 받는다. 기술, 정책, 미디어 기업, 크리에이티브 전문가, 연구원 등 약 2천500개 이상의 회원사가 참여하는 글로벌 연합으로 성장한 CAI는 디지털 콘텐츠의 투명성 향상을 위해 공동 노력하고 있다.

2024.04.24 14:18김우용

GPT-3.5, 스트리트파이터3로 GPT-4 꺾었다

오픈AI의 GPT-3.5 터보가 GPT-4 등 상위 인공지능(AI) 모델을 꺾고 스트리트파이터3 챔피언에 올랐다. 14개 대규모언어모델(LLM)들이 각축을 벌인 스트리트파이터3 게임 대회에서 'GPT-3.5'가 우승을 차지했다고 PC게이머 등 외신들이 최근 보도했다. 보도에 따르면 미국 샌프란시스코에서 개최한 미스트랄 AI SF 해커톤에서 LLM간 이벤트 매치가 열렸다. 비디오게임 스트리트파이터3를 학습해 치러진 이번 대회는 LLM이 실제 업무에서 어떤 성과를 낼 수 있는지 시각적으로 확인할 수 있도록 마련됐다. 단기간에 치러진 대회인 만큼 학습시간을 줄이기 위해 캐릭터는 켄으로 제한됐다. 승부에 참여한 LLM은 화면을 인식할 수 있도록 텍스트 설명이 제공되며 캐릭터와 상대의 동작 그리고 양쪽의 체력바를 학습해 대회가 치러졌다. 오픈AI의 GPT-3.5 및 GPT-4과 다양한 버전의 미스트랄 LLM 등 총 14종의 LLM이 경합을 벌인 결과 GPT-3.5 터보버전이 최종 우승을 차지했다. 이어서 미스트랄 스몰 파이널버전이 뒤를 이었다. 기본 성능이 더 높은 GPT-4와 미스트랄 AI 상위 모델이 오히려 하위권을 기록해 눈길을 끌기도 했다. 이에 대해 미스트랄 AI의 운영진은 각 AI가 갖는 특성이 게임에 영향을 미쳤다고 설명했다. 모델의 크기가 작으면 대기 시간과 속도에 이점을 가질 수 있는 만큼 게임에서 유리해질 가능성이 크다는 설명이다.

2024.04.08 14:11남혁우

더존비즈온, 카이스트와 AI 공동 연구 '맞손' …AI 기술 경쟁력 확대

더존비즈온과 카이스트(KAIST)가 인공지능(AI) 분야 기술 확대를 위해 손을 맞잡았다. 더존비즈온은 서울 중구 더존을지타워에서 'AI 공동 연구'를 위한 업무협약을 체결했다고 5일 밝혔다. 인공지능 전환(AX·AI Transformation) 선도기업과 국제적 역량을 가진 연구중심대학이 손잡고 AI 분야 협력을 위한 첫발을 뗐다. 양사는 상호 긴밀한 협력체계를 구축하기로 약속했다. AI 연구센터 공동설립을 통해 다양한 연구과제 발굴에 나서는 것이 핵심이다. 특히 더존비즈온이 축적한 양질의 데이터와 AI 기술 경쟁력을 활용해 KAIST의 학문적인 비전을 구체화할 수 있을 것으로 기대를 모은다. 이를 위해 양측은 AI 분야 희망 연구과제 도출을 시작으로 산학협력을 통한 실질적 성과를 목표로 기존 AI 기술 및 모델의 심화 연구에 돌입한다는 방침이다. AI 분야 개발 역량 강화를 위해 교육 및 훈련을 겸한 공동연구를 진행하며 AI 학습 및 추론 능력을 극대화해 AI 모델의 성능 향상을 구현해 나간다는 방침이다. 더존비즈온 관계자는 "이번 업무협약을 시작으로 양사 간 AI 공동연구를 통해 AI 산업 혁신을 촉진할 수 있는 각종 모델을 개발해 국가 차원의 AX 혁신 생태계를 조성할 것"이라며 "국가 및 산업 전반에 걸친 정책 전략 수립에 기여하기 위한 AI 공동연구를 지속적으로 이어나가겠다"고 말했다.

2024.04.05 14:24이한얼

S2W, 기업용 AI 플랫폼 'S-AIP' 소개 행사 개최

데이터 기업 S2W가 기업용 sLLM 인공지능(AI) 플랫폼 에스에이아이피(S-AIP)를 출시한다. S2W는 S-AIP를 소개하는 행사를 3월 13일 코엑스에서 개최한다고 28일 밝혔다. 이번 행사에서 S2W는 S-AIP의 차별점과 산업에서 실제 활용 사례를 제시할 예정이다. S-AIP의 강점은 제로트러스트 관점에서 설계돼 보안성이 보장되며 다년간의 빅데이터 분석을 통해 실전에서 검증된 안정성과 성능을 보여준다는 점이다. S2W는 사이버 공간의 빅데이터를 AI로 분석하는 전문 기업이다. 지난해 S2W는 한국과학기술원(KAIST)와 공동 연구를 통해 다크웹 빅데이터 분석에 인공지능을 접목한 다크웹 전용 언어모델 다크버트(DarkBERT)를 국제학술지(ACL)에 세계 최초로 공개한 바 있다.

2024.02.28 16:46이한얼

올거나이즈-마키나락스, 금융권 LLM 인프라 최적화 전략 제시

올거나이즈(대표 이창수)가 금융업 실무자들이 LLM 솔루션을 업무에 쉽고 빠르게 적용할 수 있도록 금융권 인공지능(AI) 도입 핵심 사례와 활용 노하우를 공개한다. 올거나이즈는 마키나락스와 '알짜 기업이 쓰는 진짜 AI-금융권 LLM+AI 인프라 최적화 전략'을 주제로 세미나를 개최한다고 27일 밝혔다. 지난 1월 진행된 동명 세미나의 후속으로 진행되는 이번 세미나는 금융권 기업의 AI 실제 도입 사례를 보다 풍부하게 소개할 예정이다. 다음 달 5일 오후 6시부터 9시까지 서울 역삼동에 위치한 창업지원센터인 마루180의 이벤트홀에서 진행된다. 마키나락스의 신민석 이사가 '금융기업의 AI 자원 최적화: 하이브리드 AI 플랫폼의 구축과 운영 전략'을 주제로 강연을 시작한다. 비용 효율성, 운영의 민첩성, 유연성 측면에서 하이브리드 AI 플랫폼의 구축 및 운영 전략을 살펴본다. 금융 분야에서 AI를 활용해 비즈니스 가치를 극대화하고, 규제 준수 요건을 충족하면서도 기술적 유연성을 유지하는 전략을 공유한다. 올거나이즈의 이창수 대표는 '금융권 생성형 AI 프로젝트 성공을 위한 베스트 프랙티스'를 주제로 강연을 진행한다. 금융권 고객들과 실제 협업했던 사례를 중심으로, 금융권에서 첫 번째 생성형 AI 프로젝트를 시작할 때 내부에서 어떤 데이터를 준비하고 어떻게 팀을 꾸려 대응해야 하는지, AI 내재화와 고도화를 위해 지금 바로 사용할 수 있는 생성형 AI 애플리케이션은 어떤 것들이 있는지 등을 설명한다. 패널토론 및 질의응답은 총 1시간 진행된다. 실사례 위주로 진행되는 세미나인 만큼, 강연자 외에도 실제 금융권 AI 도입 프로젝트를 이끌었던 담당자들이 패널로 참여해 실무자들의 궁금증을 해소할 예정이다. 사례의 구체적인 내용에 대한 현장 질문도 가능하다. 올거나이즈에서 실제 금융권 AI 프로젝트를 진행중인 유태하 PM과 이창수 대표가 30분간 토론 및 질의응답을 진행한다. 금융권에서 AI를 도입할 때의 주의점, AI 프로젝트를 효율적으로 운영하고 관리하며 생산성을 혁신할 수 있는 방법 등을 중점으로 이야기 나눌 예정이다. 이어 마키나락스의 신민석 이사와 허영신 CBO가 금융권의 AI 인프라 및 플랫폼 구축에 대한 실제 사례와 장기적으로 비용 및 운영 측면에서 고려해야 할 사항 등에 대해 토론한다. 올거나이즈는 4월 4일 SK텔레콤, 마이크로소프트와 함께 '금융 AI 도입의 핵심 사례'를 주제로 세미나를 개최할 예정이다. 서울 중구에 위치한 SKT 타워에서 오후 3시부터 6시까지 진행된다. 올거나이즈의 이창수 대표는 "2024년은 4대 은행그룹 회장, 은행장들이 2024년 조직 개편과 신년사를 통해 AI 활용 확대를 선언할 정도로 금융업 전반에서 생성형 AI를 적용한 서비스가 확대되는 해"라며, "양사가 금융권 고객 기업과 실제 프로젝트를 진행하며 경험한 노하우를 벤치마킹할 수 있을 것"이라고 밝혔다.

2024.02.27 08:57남혁우

마이디포 "오픈소스 AI-LLM 잘 꿰어야 보배"

속담에 '구슬이 서 말이라도 꿰어야 보배'(아무리 좋은 것이라도 쓸모 있게 만들어 놓아야 값어치가 있다는 뜻)라 했다. 다양한 인공지능(AI) 기술들이 쏟아져 나왔지만, 아직 사람들의 일상과 업무에 눈에 띄게 사용되는 제품이나 서비스가 기대만큼 많지 않은 게 사실이다. 그나마 지난해 초거대 언어모델(LLM)과 생성형 AI 기술 고도화가 무르익으면서 실생활에 쓰이는 AI 제품과 서비스들이 하나둘 늘어나는 추세다. 이런 한계를 딛고, 개별적인 AI 기술과 서비스들을 한 데 모아 업무 효율성과 완성도를 높이는 기업이 있다. 그야말로 구슬(AI)을 하나하나 꿰어(조합) 보배(앱)로 만드는 AI 매시업 기업 '마이디포'가 그 주인공이다. 매시업이란 웹서비스 업체들이 제공하는 각종 콘텐츠와 서비스를 융합해 새로운 웹서비스를 만들어내는 것을 뜻한다. 예를 들어 AI 기술을 활용해 번역서를 출간한다고 하면, 도서 표지는 '스테이블 디퓨젼'이 디자인하고, 교정과 윤문은 '챗GPT'가, 번역은 'DeepL'이 담당하는 식이다. 그 동안에는 출판사가 디자이너·편집자·번역가 등을 채용해 번역서를 펴냈다면, 마이디포는 마치 오케스트라 지휘자처럼 결과물에 적합한 최적의 AI 서비스들을 조합해 결과물을 만들어낸다. 이처럼 마이디포는 각각의 AI 모델(서비스)들을 모듈화하고, 사용자가 필요로 하는 서비스(앱)에 적합한 모듈을 가져다 쓸 수 있도록 했다. 요청하는 작업은 각각의 모듈에 뿌려져 분산·병렬 처리되기 때문에 사용자는 시간 단축 효과를 볼 수 있다. 마이디포 솔루션은 먼저 판례 및 사건 분석 등이 필요한 변호사, 보고서 작성이 많은 금융사, 초벌 번역 등이 필요한 출판사, 외신 번역과 기사 작성이 주 업무인 언론사 등에게 유용하게 쓰일 수 있다. 또 벤처캐피털의 투자심사 보고서 작성 등에도 활용할 수 있다. 류승훈 대표, 코트라 직원서 창업가로...생성 AI 가능성 보고 '마이디포' 창업 마이디포를 창업한 류승훈 대표는 대한무역투자진흥공사(KOTRA) 출신이다. 2012년 퇴직 후 '플랫클'이란 회사를 창업해 '거인의 서재' 앱을 출시, 출판계의 디지털 마케팅을 혁신했다. 그 후 거인의 서재는 체인지그라운드에 매각됐고, 류 대표는 300명의 뛰어난 개발자를 육성하겠다는 취지로 '300Dev'라는 회사를 세웠다. 베네수엘라를 중심으로 중남미 개발자들에게 글로벌 네트워크와 글로벌 비즈니스 기회를 제공, 북미 시장에 실력 있는 각국 개발자들이 접근할 수 있는 토양을 만들었다. 류 대표의 도전은 여기에서 멈추지 않았다. 본인 지분을 매각한 뒤, 지난해 생성형 AI 가능성을 보고 마이디포를 창업했다. 류승훈 대표는 “라틴아메리카에 있는 6명의 팀원은 기술 개발과 마케팅 담당을 하고, 국내에는 3명의 직원들이 B2B 영업과 기획, 디자인 등의 업무를 맡고 있다”면서 “마이디포는 파편화된 AI 서비스들을 하나하나 모듈화 시키고 조합함으로써 대용량을 병렬, 분산처리 해 고속으로 결과물을 얻을 수 있다”고 설명했다. 류 대표에 따르면 마이디포는 현재 '팔만대장경 프로젝트'를 진행 중이다. 이 프로젝트는 1971년 미국 일리노이대 학생이던 마이클 하트가 시작한 '구텐베르크 프로젝트'라는 사회 운동을 모티브로 한다. 저작권 문제가 해결된 고전을 직접 타이핑해 모두가 무료 또는 최소한의 비용으로 읽을 수 있도록 한 이 프로젝트는 50년도 넘게 진행돼 현재 7만권이 넘는 세계 각국의 도서가 인터넷을 통해 공유되고 있다. 마이디포는 구텐베르크 프로젝트의 문서를 LLM AI를 활용해 읽기 쉬운 우리말 도서로 변환하는 작업을 하고 있다. 번역, 교정, 표지 디자인, 전자책 출간 등의 작업이 과거에는 수주에서 몇 달이 걸렸다면, 팔만대장경 프로젝트는 300페이지 외서 초벌 번역을 5분까지 단축시키는 것이 목표다. 류 대표는 “여전히 구텐베르크 프로젝트의 과실은 영어 사용자들이 주로 누리고 있는데, 생성형 AI 시대에는 모든 게 달라질 것”이라며 “언어 장벽 탓에 쉽게 접근할 수 없었던 구텐베르크 프로젝트의 문서를 읽기 쉬운 현대 우리말로 만들 것으로 기대, LLM 인공지능을 활용해 구텐베르크 도서를 한국어 도서로 변환하고 있다. 수주에서 몇 달 걸리던 작업을 단 5분으로 단축하고자 하는데 이것이 우리의 팔만대장경 프로젝트”라고 말했다. 종착지는북미 시장..."누구나 쉽게 이용하고 조합할 수 있는 AI 서비스 지향" 류 대표가 궁극적으로 바라보는 시장은 히스패닉 시장을 교두보로 한 북미 지역이다. 창업 초기부터 글로벌 개발팀을 꾸렸는데, 챗GPT 상위 국가에 미국·인도, 그 뒤로 콜롬비아와 브라질 등 히스패닉 국가가 상위 5위권에 오른 것을 눈여겨봤다. 미국 내 히스패닉 인구가 이미 6천500만을 넘었는데, 류 대표는 히스패닉 시장을 교두보 삼아 세계 최대 시장인 북미 지역으로 진출한다는 구상이다. 류 대표는 “마이디포를 지난해 3월에 개발해 그해 5월 개념증명(PoC)을 했고, 7월 최소기능제품(MVP)을 출시, 현재는 서비스 고도화에 집중하고 있다”면서 “현재 이용 고객의 70%가 히스패닉 시장에서 발생하고 있는데, 서비스 안정화와 완성도가 갖춰지면 글로벌 시장뿐 아니라 국내에서도 마케팅 활동을 펼칠 계획”이라고 밝혔다. 마이디포 AI 서비스는 크게 세 가지로 구분된다. 먼저 월 구독 모델로 AI 매시업 프레임워크를 제공한다. 또 마이디포 AI 컨설턴트들이 AI 활용 방법을 상담해준다. 끝으로 프롬프트 엔지니어링 등 기업 맞춤형 매시업 솔루션을 제작, 공급해준다. 개인 또는 기업은 필요로 하는 나만의 AI 서비스(앱)를 마이디포에 직접 제작 의뢰해 최적의 결과물을 얻을 수도 있으며, 다른 창작자들이 공개해 놓은 오픈마켓에서 적합한 서비스를 골라 유료로 구매한 크레딧을 지불하고 이용할 수도 있다. 이 때 창작자는 앱 사용 수익의 70%를 받는 구조다. 류승훈 대표는 “마이디포 서비스 고도화 맵에 있어 기술적인 목표는 LLM을 어떻게 나에게 더 잘 맞는 서비스로 만드느냐가 있다. 데이터를 양과 질을 고도화 시켜 맥락에 맞는 결과물을 얻는 것”이라면서 “각 AI 기술과 서비스들의 장점을 활용해 누구나 쉽게 이용하고 조합할 수 있도록 확장시키는 것이 마이디포의 목표”라고 말했다. 이어 “우리가 생각하는 범용인공지능(AGI)은 단순한 만물박사가 아니라, 여러 가지가 조합돼 결국은 우리가 원하는 결과를 얻어내는 것”이라며 “각 모듈들이 AGI 내에서 하나의 플러그인으로 활용될 수 있다. 마이디포의 리퀘스트 마켓이 적극 활용되고 집단적인 프롬프터들이 쌓인다면 다양한 AI 서비스들이 보다 쉽고 널리 쓰일 것”이라고 말했다.

2024.01.31 14:14백봉삼

中 AI 스피커 출하량 급감…"생성AI도 안 통했다"

중국에서 인공지능(AI) 기능을 탑재한 스마트 스피커 시장이 위축세를 면치 못하고 있다. 23일 중국 언론 콰이커지가 인용한 시장조사업체 룬토의 '중국 스마트 스피커 유통 시장 월 추적 보고서'에 따르면 2023년 중국 스마트 스피커 판매량은 2천111만 대로 전년 대비 19.8% 감소했다. 판매액은 59억4천만 위안(약 1조 1천87억 원)으로 전년 대비 21.0% 줄었다. 이 같은 현상은 올해도 계속될 전망이다. 2022년에도 전년 대비 28%의 감소한 것을 고려하면 3년 연속 감소세다. 2020년 중국 스마트 스피커 시장이 3천700만 대로 판매량 피크를 기록한 이후 매년 감소세를 기록하고 있는 셈이다. 룬토는 "스마트 스피커를 보유했다는 것이 한때 트렌드를 앞서가는 것으로 인식됐다"면서 "최근 이같은 사고 방식에 변화가 왔으며 지난해 월별 판매량은 전년 대비 모두 두 자릿 수의 판매량 하락세를 보였다"고 평가했다. 초거대 AI 모델의 등장도 AI 스피커의 판매 하락세를 막지는 못한 것으로 분석됐다. 룬토는 "챗GPT 등 AI 초거대 모델 역시 스마프 스피커의 구세주가 되지 못했다"고 평가했다. 스피커는 주로 언어를 '음성'으로 상호작용하기 때문에, AI 초거대 모델이 갖는 장점인 AI 콘텐츠 생성 기능이 제한적으로 적용될 수 밖에 없었다. 룬토는 "결국 1년이 지났지만 AI 초거대 모델이 스마트 스피커의 두번째 부상을 견인하진 못했다"고 분석했다. 이 가운데 룬토에 따르면 중국 스마트 스피커 시장에서는 소수 기업이 상위권을 형성하고 있다. 2023년 바이두(38%), 샤오미(34%), 알리바바(22%)가 시장의 90% 이상을 점유했다. 바이두는 지난해 전년 대비 점유율을 3.2%P 늘리면서 1위 자리를 굳혔고, 샤오미의 점유율도 전년 대비 3.0% 늘어나 33.7%를 차지했다. 룬토는 올해 중국 스마트 스피커 시장 규모는 2천 만대 선을 넘지 못한 1천860만 대 수준으로 지난해 보다 11.9% 줄어들 전망이다.

2024.01.24 08:50유효정

구글, 직접 학습하고 개선하는 로봇 훈련도구 공개

로봇이 주변 환경을 인식하고 스스로의 행동을 분석해 작업을 개선하는 대규모 인공지능(AI) 모델 기반 학습도구를 구글에서 공개했다. 5일 테크크런치 등 외신에 따르면 구글 딥마인드 로보틱스는 로봇 학습모델 '오토RT'와 'RT-트레젝토리' 등을 공개했다. 오토RT는 로봇에게 주어지는 다양한 환경과 목적에 따라 명령을 자연스럽게 수행할 수 있도록 개발된 기본 학습모델이다. 대규모 언어모델(LLM)과 비전 언어모델(VLM)과 로봇 제어 모델을 결합해 사전에 설정되지 않은 환경을 스스로 분석 후 주어진 목표를 적합하게 수행하기 위한 방안을 도출하고 수행한다. 예를 들어 '책상 위의 캔을 들어'라는 명령이 주어지면 언어모델이 주변 환경을 스캔한 후 모든 객체에 따른 정보를 텍스트 데이터화 한다. 이후 LLM이 책상과 캔과 관련된 데이터를 확인 후 명령을 수행하기 위한 작업 프로세스을 생성한다. 작업 프로세스는 환경을 고려해 다양하게 생성되며 부적절한 방식과 실제 업무에 필요한 작업 등을 분류하는 과정을 거친다. 실제 유효하다고 판단된 작업만이 업무 프로세스로 샘플링 된 후 로봇에 적용되어 수행된다. 또한, 수행 과정과 결과에 대한 데이터를 수집 후 분석해 이후 작업을 개선할 수 있는 기능도 갖췄다. 구글 측에 따르면 오토RT는 로봇이 얼마나 자율적으로 명령을 수행할 것인지 원하는 정도에 따라 설정할 수 있다. 또한 얼마나 안전하고, 자율적으로 업무를 수행하는지 판단하기 위해 테스트를 진행했다. 7개월에 걸쳐 한 번에 최대 20대의 로봇을 다양한 환경을 조성하며 테스트를 실시한 결과 6천650개의 고유한 언어 지침을 다루는 7만7천 개 이상의 사례를 수집할 수 있었다고 밝혔다. 구글은 로봇이 업무를 수행하는 과정에서 가장 적합한 물리적 동작을 수행하기 위한 RT-트레젝토리라는 학습모델도 도입했다. 로봇의 동작 궤도를 시각화해 반복 학습 과정에서 어떤 동작으로 업무를 수행했을 때 더 좋은 결과를 얻을 수 있는지 확인하고 개선할 수 있도록 지원한다. 훈련 데이터를 지원하지 않은 41개 작업으로 테스트한 결과 작업 성공률이 29%에서 63%로 2배 이상 향상됐다고 밝혔다. 또한 보다 안전한 로봇 활용을 위해 자체 필터링 기능 외에도 추가적인 안전조치 계층을 구성했다. 관절에 가해지는 힘이 주어진 임계값을 초과하면 자동으로 멈추도록 설정했다. 더불어 작동 중인 모든 로봇은 사람이 직접 중단한 수 있는 물리적 비활성화 스위치가 눈에 잘 띄는 곳에 위치하도록 구성할 것을 권했다. 구글 딥마인드 로보틱스 팀은 “우리는 여러 환경에서 다양한 명령을 자연스럽게 수행하기 위한 다목적 로봇개발을 목표로 하고 있다”며 “이번에 공개한 대규모 AI모델과 시스템 등을 통해 더욱 효율적인 로봇을 선보일 수 있을 것으로 기대한다”고 말했다.

2024.01.05 09:09남혁우

  Prev 1 2 3 4 5 6 7 8 9 Next  

지금 뜨는 기사

이시각 헤드라인

SK하이닉스, HBM4 개발 완료…'세계 최초' 양산 체제 구축

AI 시대 인재·성장·협업 모든 것 'HR테크 리더스 데이 4' 열린다

이마트 '트레이더스' 잘 나가네…롯데마트 ‘맥스’는?

"한 곳만 참여해도 유찰 없다"…국가AI컴퓨팅센터 신속 추진

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.