• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'LLM'통합검색 결과 입니다. (331건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

투비유니콘, 의료분야 AI진료 상담사 '닥터챗' 첫 공개

초거대AI 상용화 모델을 보유한 에듀테크 전문 기업 투비유니콘(대표 윤진욱)이 '2024 대한민국 정부박람회'에서 초거대AI 기술과 공공 서비스를 연계한 교육 및 의료 AI플랫폼을 선보인다고 8일 밝혔다. 이 박람회는 행정안전부와 대통령직속 디지털플랫폼정부위원회가 주최한다. 오는 13~15일 광주 김대중컨벤션센터 1층 전시장에서 개최된다. 투비유니콘은 이 박람회에서 중・고교용 진로 및 수업 설계 플랫폼인 '2025 노크(NOK)' 고도화 버전과 의료용 AI 플랫폼 '닥터챗' 등을 선보인다. '2025 노크' 버전은 교사의 수업 진도와 학생 진로를 분석, 지원하는 생성형 AI 교육 플랫폼이다. 독자 구축한 LLM(거대 언어모델)을 기반으로 만들었다. 중·고등학교 교사의 다양한 경험과 실증을 바탕으로 만든 에듀테크 플랫폼을 생성형 AI를 활용해 고도화했다. 이 '노크'버전은 수업 및 진로설계를 위한 자료 제공이 가능하다. 16+1 융합 활동 주간에는 학습 내용 및 활동, 발표자료 등을 AI기반으로 학생 개인별 수준에 맞춰 지도할 수 있다. 현재 전국 중・고교 7백여 곳에서 이 플랫폼을 도입해 사용 중이다. 이와 함께 투비유니콘은 초거대 AI 기술과 연계해 개발 중인 의료 서비스 '닥터챗'을 처음 공개한다. '닥터챗'은 AI진료 상담 및 병원예약을 할 수 있는 서비스다. 향후 실버 헬스케어 AI인 '담소'로 확장해 나간다는 복안이다. '담소'는 충남 부여군과 함께 지역 및 사용자의 특성과 심리 데이터를 학습시켜 사용자 맞춤형 대화 제공이 가능한 심리케어 솔루션이다. 내년까지 시니어 데이터 기반의 sLM(소형언어모델)을 구축한 뒤 대화형 AI 보이스 봇으로 개발할 계획이다. 윤진욱 대표는 “대한민국 정부 박람회에 초청돼 자체 구축한 초거대AI 기술과 이와 연계한 서비스를 선보인다"며 "정부가 추진 중인 디지털플랫폼정부 구현을 지원하는 기술 개발에 매진할 계획"이라고 말했다.

2024.11.08 15:58박희범

맨디언트 "생성형 AI 시대…방어자가 공격자보다 강력해 질 수 있다"

"지금까지 사이버 보안은 방어자가 불리한 게임이었습니다. 이제 생성형 AI를 활용하면 이 판도를 역전시킬 수 있습니다." 심영섭 맨디언트 한국 및 일본 총괄은 6일 서울 강남 섬유센터에서 열린 '제14회 소프트웨어 개발보안 컨퍼런스'에서 이같이 말하며 생성형 AI를 통한 보안 취약점 점검 및 대응 전략을 소개했다. 심 총괄은 20년 이상의 사이버 보안 경력을 바탕으로 '방어자의 딜레마'를 강조했다. '방어자의 딜레마'란 방어자가 모든 취약점을 막아야 하지만 공격자는 단 하나의 취약점만 찾아 침투하면 된다는 불평등한 상황을 뜻한다. 지난 2000년대 IT 버블 시기부터 이러한 상황이 지속되며 보안 담당자는 끊임없이 늘어나는 취약점들을 모두 방어해야 하는 어려움을 겪어 왔다. 이에 심 총괄은 AI 시대에 접어들어 이러한 딜레마를 해결하기 위해 새로운 접근법이 필요하다고 강조했다. 또 심 총괄은 맨디언트의 연례 보고서인 '엠-트렌드(M-Trends)'를 인용해 최근 사이버 공격의 경향을 설명했다. 과거에는 네트워크 및 시스템 취약점을 이용한 공격이 주를 이뤘지만 최근에는 소프트웨어 공급망을 타깃으로 한 공격이 급증하고 있다. 특히 오픈소스 라이브러리에 대한 의존도가 높아지면서 취약점이 증가하고 있는 상황이다. 여기에 생성형 AI의 등장으로 새로운 보안 취약점이 발생할 여지도 있다. 생성형 AI가 학습하는 데이터에는 기존의 버그나 취약점이 포함될 수 있기 때문이다. 심 총괄은 "실제로 생성형 AI가 생성한 코드의 약 40%가 보안 취약점을 포함하고 있다"며 "이에 따라 개발자들이 생성형 AI를 활용할 때는 신중한 검토와 분석이 필요하다"고 강조했다. 그럼에도 불구하고 방어자에게는 생성형 AI가 주는 이점도 있다. 거대언어모델(LLM)과 자동화 도구를 활용하면 정적·동적 분석을 통해 보안 취약점을 효과적으로 점검할 수 있기 때문이다. 특히 코드QL(CodeQL), 트리비(Trivy) 등 다양한 솔루션이 개발돼 취약점을 탐지하고 보안을 강화하는 데 도움을 주는 것으로 알려져 있다. 또 구글의 OSS-퍼즈(OSS-Fuzz)나 엔비디아의 백스(VACS)처럼 오픈소스 보안을 강화하기 위한 프로젝트들도 활발히 진행 중이기 때문에 보안 업계의 기대가 커지고 있다. 심 총괄은 "LLM을 활용한 자동화로 보안 전문가들이 생산성을 높이고 보안성을 강화할 수 있게 됐다"며 "방어자에게만 불리하던 구도가 역전될 수도 있는 기회의 창이 열렸다"고 말했다. 그러면서 "보안 전문가는 생성형 AI가 보안 분야에 위협이 될 수도 있지만 동시에 강력한 무기가 될 수 있다는 점을 늘 주지하고 이 기회를 잘 활용해야 한다"고 강조했다.

2024.11.06 16:58조이환

메타, LLM '라마' 美정부 방위·군사기관 지원…中 AI경쟁 확대

페이스북, 인스타그램의 모기업인 메타가 미국 정부 방위 및 국가 안보 기관에 오픈 소스 인공지능(AI) 모델인 라마(Llama)를 제공한다. 6일 MS파워유저 등 외신에 따르면 메타는 액센츄어, 아마존웹서비스(AWS), 록히드 마틴, 오라클 등과 협력해 정부 기관에 AI모델을 제공한다고 밝혔다. 이번 협력을 통해 오라클은 라마를 기반으로 항공기 유지 관리 문서를 통합해 기술자가 문제를 빠르고 정확하게 진단하고 수리 시간을 단축할 수 있도록 항공 수리 시스템을 구축하며 스케일 AI는 라마를 미세 조정해 작전 계획 및 취약성 식별과 같은 안보 임무를 지원한다. 록히드마틴은 AI 팩토리에 라마를 통합해 코드 생성, 데이터 분석 및 비즈니스 프로세스 업무를 가속화한다. 이 밖에도 AWS와 마이크로소프트 애저는 민감한 데이터를 위한 보안 클라우드 솔루션을 라마를 활용해 구축하고 IBM은 왓슨 솔루션을 기반으로 자체 관리형 데이터 센터와 클라우드를 국가 안보 기관에 지원한다. 이번 조치는 그동안 군사적 용도 AI 사용을 제한했던 기존 AI기업들의 행보와 대비된다. 이에 대해 메타는 최근 중국 등 경쟁국에서 개발 중인 군사용AI에 대비하기 위한 것이라고 밝혔다. 닉 클레그 메타 글로벌 사업 사장은 "중국을 포함한 많은 경쟁국이 미국을 앞지르기 위해 자체 오픈소스 모델을 개발에 막대한 투자를 지속하고 있다"며 "미국이 기술적 우위를 유지하는 동시에 AI에 대한 접근성을 확대할 것"이라고 밝혔다. 또 일부에선 경쟁국에서 오픈소스의 메타의 라마를 활용한 군사용AI를 개발 중인 만큼 이에 대처하기 위해 직접 나선 것이란 분석도 나오고 있다. 로이터 등 외신에 따르면 중국의 인민해방군(PLA)과 연계된 연구그룹에서 군사 중심 AI 도구인 '챗빗(ChatBIT)'을 개발했다. 챗빗은 라마를 기반으로 개발됐으며 군사 전용 업무와 대화에 특화되어 기존 AI 대비 더 높은 성능을 보이는 것으로 알려졌다. 닉 클레그 사장은 "우리의 목표는 미국이 기술적 우위를 유지하는 동시에 AI에 대한 접근성을 전 세계적으로 확대하고 미국과 가까운 동맹국의 전략적, 지정학적 이익을 지원하는 선순환을 만든 것"이라며 "차세대 디지털 인프라가 민주적 가치와 보호 장치에 뿌리를 두고 있음을 보장하는 데 일조하고자 한다"고 말했다.

2024.11.06 10:11남혁우

[컨콜] 삼성SDS "내년 상반기 멀티모달 챗·지식 그래프 선보일 것"

삼성SDS가 주력 비즈니스로 인공지능(AI) 서비스 확대를 위해 내년 상반기 멀티모달 챗·지식 그래프기반 기술을 선보일 예정이다. 삼성SDS는 30일 개최한 3분기 컨퍼런스콜을 통해 차기 AI 비즈니스 계획을 공개했다. 구형준 클라우드서비스사업부장은 "내년 상반기 안으로 멀티모달 챗, 지식 그래프 등의 핵심 기술을 확보할 것"이라며 "이를 사업에 활용할 수 있도록 준비할 것"이라고 밝혔다. 멀티모달 챗은 텍스트, 이미지, 소리 등 여러 형태의 입력과 출력을 통합해 사용자와 상호작용하는 챗봇 시스템을 말한다. 다양한 데이터 소스에서 정보를 수집하고 분석하여 더욱 풍부하고 정확한 대화를 제공할 수 있도록 지원한다. 지식 그래프는 정보와 데이터를 연결해 시각적, 구조적으로 나타내는 데이터 모델이다. 사람, 장소, 사물 등 다양한 개체 간의 관계를 그래프 형태로 표현해 정보 간의 연결을 보여주며 이를 통해 단순한 데이터 집합이 아닌 맥락화된 정보를 제공해 더 높은 수준의 데이터 분석과 추론이 가능하도록 돕는다. 구 부사장은 "현재 200개가 넘는 기업 고객사례를 바탕으로 다양한 요구사항을 수집하고 있다"며 "이를 해결하기 위해 대규모언어모델(LLM), 에이전트 등을 활용한 기술을 구체화하고 있다"고 밝혔다.

2024.10.30 15:57남혁우

인텔 "코어 울트라 시리즈2 프로세서로 AI PC 생태계 확장"

인텔이 28일 오전 여의도 콘래드 호텔에서 국내 언론과 파트너, 채널 관계자 대상으로 AI PC를 위한 PC용 프로세서 2종 출시 행사를 진행했다. 인텔은 지난 25일부터 데스크톱PC용 코어 울트라 200S(애로우레이크)를 국내외 시장에 공급하고 있다. 9월 초 IFA에서 공개된 노트북용 코어 울트라 200V(루나레이크) 역시 글로벌 PC 제조사를 통해 공급되고 있다(관련기사 참조). 이날 배태원 인텔코리아 지사장은 "오늘 정식 출시한 코어 울트라 시리즈2 2종은 인텔이 지난 해 NPU(신경망처리장치) 탑재 코어 울트라 시리즈1(메테오레이크) 출시 이후 1년만에 선보이는 제품으로 AI 처리 성능과 전성비를 개선한 제품"이라고 밝혔다. ■ 코어 울트라 200S, NPU 내장 첫 데스크톱 CPU 잭 황(Jack Huang) 인텔 APJ 세일즈 디렉터는 "인텔은 단순 프로세서가 아닌 플랫폼을 지원하는 회사이며 코어 울트라 200S는 AI 수요 확대에 따라 NPU(신경망처리장치0를 내장한 인텔 기준 최초의 데스크톱PC용 프로세서"라고 설명했다. 코어 울트라 200S 내장 NPU는 지난 해 코어 울트라 시리즈1(메테오레이크)에 내장된 것과 기본 구조는 같다. 작동 클록 등을 개선해 소폭 성능을 높였지만 외장 그래픽카드를 연결하지 않으면 마이크로소프트가 요구하는 최소 40 TOPS를 넘지는 못한다. 단 25일부터 국내외 시장 공급에 들어간 코어 울트라 200S 5종은 모두 최고성능 제품이다. 이를 구매하는 소비자들 대부분이 그래픽카드를 따로 꽂아 쓰므로 실제로는 큰 문제가 되지 않을 것으로 보인다. 잭 황 세일즈 디렉터는 "NPU는 지속적인 구동이 필요한 작업을 CPU 대신 처리해 전력 효율을 높이며 부하를 더는 것이 주목적이다. 인텔의 전략은 CPU와 GPU, NPU를 모두 활용하는 플랫폼을 제공하는 것"이라고 설명했다. ■ 부하 지속 상황에서도 80도 이하 유지 고성능 프로세서에서는 대형 냉각팬과 방열판으로 구성된 수랭식 일체형 냉각장치를 활용하는 것이 상식이었다. 그러나 이날 인텔코리아 관계자는 프로세서에 지속적 부하를 가하는 시연을 통해 "코어 울트라 200S 프로세서는 같은 성능에서 전세대 대비 전력 소모를 절반으로 줄이는 한편 공랭식 냉각장치로도 최고 온도 80도 이하를 유지하는 등 전력 소모가 개선됐다"고 설명했다. 다만 게임이나 콘텐츠 제작 등 고성능이 필요한 분야에서 지나치게 전력 소모에 초점을 맞췄다는 지적도 있다. 실제로 인텔이 자체 테스트한 결과에서도 코어 울트라 200S는 일부 게임 등에서 성능이 하락하는 결과를 보여주기도 했다. 잭 황 세일즈 디렉터는 "전력 효율을 높이고 각 기능별로 반도체를 분할하는 타일 구조는 4-5년 전부터 기획된 것이며 향후 지속 가능성 면에서 같은 작업을 더 저전력으로 처리하는 것이 더 중요해질 것"이라고 설명했다. ■ 삼성전자, 갤럭시북5 프로 360 국내 정식 출시 주요 PC 제조사는 지난 9월 말부터 코어 울트라 200V 탑재 노트북을 시장에 공급중이다. 삼성전자도 이날(28일) 노트북 신제품인 갤럭시북5 프로 360 국내 정식 판매에 들어갔다. 이민철 삼성전자 MX사업부 갤럭시에코비즈팀장(상무)은 "갤럭시북5 프로 360은 인텔과 지속적 협력으로 만들어진 제품이며 전력 효율 향상으로 최대 25시간 작동 시간을 확보했다"고 설명했다. 마이크로소프트도 다음 달부터 윈도11 AI 기능 '코파일럿+'를 인텔과 AMD 등 x86 프로세서에서 구동하는 무료 업데이트를 출시 예정이다. 박범주 한국마이크로소프트 부문장은 "코어 울트라 200V 프로세서는 애플 맥북에어 대비 최대 2.5배 빠른 AI 처리 성능을 지녔으며 강력한 생태계 확장성을 가진 인텔 기반 코파일럿+ PC로 국내 이용자들도 향상된 업무 성과를 이루기 바란다"고 밝혔다. ■ "AI PC 출하량, 올 연말 경 누적 4천만대 넘긴다" 인텔은 NPU를 탑재한 AI PC가 올 연말까지 4천만 대, 내년까지 1억 대 출시될 것으로 예상했다. 이 중 80% 가량이 노트북 제품으로 전망된다. IDC나 가트너, 카날리스 등 주요 시장조사업체도 비슷한 전망을 내놓고 있다. 잭 황 디렉터는 "인텔의 전망치는 생태계 동향 분석과 파트너사 논의를 통해 정해진다. 지난 해 출시한 코어 울트라 시리즈1(메테오레이크)에 이어 코어 울트라 200S/V, 고성능 노트북용 프로세서인 애로우레이크 H/HX 등을 더하면 충분히 가능한 수치"라고 설명했다.

2024.10.28 15:31권봉석

에쓰핀테크놀로지, AI에이전트 기반 '깃고GPT' 업데이트

클라우드 관리(MSP) 및 인공지능(AI) 플랫폼 전문기업 에쓰핀테크놀로지(대표 이승근)는 고객사 맞춤형 생성형 AI 챗봇인 GitgoGPT(이하 '깃고GPT')의 적용 범위를 확대하고 AI 에이전트 기능을 강화했다고 밝혔다. 깃고GPT는 데이터 보안상의 이유로 각 기업에 최적화된 생성형 AI 수요가 늘어나면서 건설, 레저, 유통, 제조, 학교, 병원 등 다양한 산업군으로 적용 범위가 확대되고 있다. 강화된 AI 에이전트 기능에 따라 사용자는 자연어로 기업 시스템에 접근하고 자동화된 업무 처리와 맞춤형 응답을 제공받는다. 현재 깃고GPT는 취업규칙이나 각종 규정 조회, 다국어 질의응답 등 회사 공통 업무 중심으로 활용되고 있다. 이번 업데이트를 통해 개인 업무로 확장된 'AI 워커(Worker)'를 추가했다. AI 워커는 개인 문서 기반 기능으로 사용자가 기획서나 계약서 초안과 같은 문서를 업로드하면 이를 학습하여 문서 분석과 요약, 관련 정보 등을 추천한다. 에쓰핀테크놀로지는 SAP, 세일즈포스, 오라클 등 300개 이상의 내부 시스템과 연계 가능한 AI 에이전트 표준 아키텍처를 구축했다. 또, 마이크로소프트 팀즈 외에도 웹 버전 지원으로 접근성을 높였다. 현재 최신 LLM 모델인 GPT-4o(omni) 적용으로 멀티모달까지 지원하고 있으며, 향후 o1과 같은 LLM 모델 지원할 예정이다. 이승근 에쓰핀테크놀로지 대표는 "이번 업데이트는 깃고GPT를 단순한 챗봇에서 기업 업무를 자동화하는 AI 에이전트로 발전시켰다"며 "깃고 GPT를 적용해 시스템 간 데이터 연계와 자동화로 업무 효율성을 높이는 기업이 점차 늘어나고 있다”고 말했다.

2024.10.28 11:23김인순

인터넷도 안되는데 '초당 90단어' 쏟아냈다

[하와이(미국)=권봉석 기자] 퀄컴은 미국 하와이에서 진행하는 연례 기술행사 '스냅드래곤 서밋 2024' 첫 날인 21일(이하 현지시각) 행사장인 마우이 와일레아 비치 리조트 일대에서 AI 관련 기능을 체험할 수 있는 데모 존을 운영했다. 행사장에는 퀄컴이 같은 날 발표한 안드로이드 스마트폰용 SoC(시스템반도체) 최신 제품인 '스냅드래곤8 엘리트'를 탑재한 스마트폰 시제품, 그리고 지난 6월 출시된 '스냅드래곤 X 엘리트/플러스'가 탑재된 시판 노트북 제품이 배치됐다. ■ 초당 90단어 쏟아내는 온디바이스 멀티모달 AI AI 모델의 성능 측정 기준으로 흔히 토큰 관련 속도가 언급된다. 예를 들어 LLM(거대언어모델)에 질문한 후 답변을 구성하는 첫 단어가 몇 초 만에 출력되는지, 또 분당 몇 단어가 출력되는지를 기준으로 삼는다. 시연장에서는 중국 지푸(Zhipu)가 개발해 스냅드래곤8 엘리트에 최적화한 멀티모달 AI를 이용한 시연이 눈길을 끌었다. 생성 AI에 주위 풍경을 설명해 달라고 음성으로 요청한 뒤 주위 사진을 찍자 단 몇 초만에 화면에 나타난 사람, 입고 있는 옷과 추정되는 실내 풍경을 설명하는 문장이 나타났다. 이 멀티모달 AI는 인터넷 연결이나 클라우드 도움 없이 순식간에 초당 90토큰(단어) 이상을 쏟아냈다. 시연을 진행한 퀄컴 관계자는 "초당 70토큰이 나오는 AI 모델은 굉장히 빠른 것으로 평가되며 온디바이스로 구현했다는 데 의미가 있다"고 설명했다. ■ AI 모델·NPU 활용해 선명한 반려동물 사진 구현 스냅드래곤8 엘리트에는 영상 정보를 처리하는 스펙트라 AI ISP가 탑재된다. 최대 4천800만 화소 카메라 3대에서 들어오는 영상 정보를 동시에 처리함은 물론 헥사곤 NPU(신경망처리장치)가 모든 영상 처리 과정에 개입해 AI로 품질을 높인다. 퀄컴은 이날 스냅드래곤8 엘리트 탑재 스마트폰 시제품과 아크소프트가 개발한 시연용 앱을 이용해 반려동물 사진을 보다 선명하게 찍을 수 있는 시연을 진행했다. 반려동물이 초당 30프레임으로 촬영한 사진 중 초점이 잘 맞은 사진을 골라내고 NPU(신경망처리장치)로 고해상도로 바꾸는 작업인 업스케일링 기능으로 보다 선명한 사진을 얻을 수 있다. ■ 윈도11 24H2 AI 기능, 스냅드래곤에 먼저 구현 마이크로소프트는 최근 온디바이스 AI 관련 기능을 대거 추가한 윈도11 24H2 업데이트를 공개했다. 해당 기능은 현재 스냅드래곤 X 엘리트/플러스에 가장 먼저 지원되며 인텔·AMD 등 x86 프로세서는 오는 11월 업데이트로 제공된다. 이번 업데이트는 개인정보 유출이나 사생활 침해 우려로 논란의 대상이 됐던 '리콜' 기능도 포함했다. 스냅드래곤 X 엘리트를 탑재한 서피스 프로 11로 리콜 기능을 시연하던 마이크로소프트 관계자는 "리콜 기능으로 금융정보나 개인정보가 포착되면 이를 영구히 삭제할 수 있고 원치 않는다면 끄는 것도 가능하다"고 설명했다. 클릭투두 기능은 클릭한 웹사이트나 문서를 요약하고 번역하는 기능을 제공하지만 현재는 영어만 지원한다. 또 위키백과 등 일부 웹사이트 양식에 따라 기능이 제대로 작동하지 않는 모습도 보였다. 마이크로소프트 관계자는 "일부 기능에서 보이는 문제는 향후 최신 빌드로 개선될 것"이라고 설명했다. ■ "전자악기 지연시간 최소화 ASIO, 스냅드래곤서도 지원" 디지털 오디오 워크스테이션(DAW)은 디지털 음악 제작에 필요한 고성능 하드웨어와 소프트웨어를 내장한 시스템을 뜻한다. 1인 음악 창작자가 건반과 마우스, 가상악기 소프트웨어와 작곡 프로그램을 이용해 다양한 음악을 제작할 수 있다. 그러나 PC와 연결된 악기의 전송 지연시간 문제로 건반을 누르는 시간과 실제 입력 시간에 차이가 생기는 경우가 잦았다. 이를 해결하려면 음악 관련 데이터를 고속으로 전송하는 ASIO(오디오 스트림 입출력) 드라이버가 필요했다. 퀄컴은 지난 21일 기조연설에서 "디지털 오디오 워크스테이션(DAW) 소프트웨어-하드웨어 구성에 필수적인 마이크로소프트 ASIO 드라이버와 소프트웨어가 스냅드래곤 X 엘리트에 최적화될 것"이라고 밝힌 바 있다. 이날 해당 기능을 시연하던 DAW 소프트웨어 업체 '큐베이스' 관계자는 "그간 ASIO를 가장 잘 지원하는 소프트웨어와 드라이버는 맥OS 등 애플 제품에만 탑재됐지만 이제는 스냅드래곤 X 엘리트/플러스에서도 문제 없이 작동한다"고 밝혔다.

2024.10.24 15:04권봉석

국내외 주요 AI 기업, 퀄컴 칩에 AI 모델 최적화 발표

[하와이(미국)=권봉석 기자] AI 관련 국내외 주요 기업들은 24일 오전(한국시간 23일) 미국 하와이에서 진행중인 연례 기술행사 '스냅드래곤 서밋 2024'에서 자사 AI 모델을 퀄컴 스냅드래곤 SoC(시스템반도체)에 최적화하겠다고 밝혔다. 이날 오전 진행된 'AI 토크' 행사에서 랜딩AI 창립자인 앤드류 응(Andrew Ng)은 영상 메시지로 "엣지에서 대규모 멀티모달 모델을 배포하는 것은 저지연 실시간 처리, 대역폭 감소, 프라이버시 및 보안 강화와 같은 여러 이점을 제공한다"고 밝혔다. 이어 "랜딩AI는 퀄컴과 협력해 온디바이스 AI 발전을 촉진할 것이며 개발자를 위한 AI 포털인 '퀄컴 AI 허브'를 통해 개발자가 데이터를 학습시키는 단계부터 스냅드래곤 프로세서에서 모델 실행 등 전 과정에서 신속하게 모델을 배포할 수 있도록 지원하는 엔드-투-엔드 프로세스를 구축할 것"이라고 덧붙였다. 마조리 자니위츠(Marjorie Janiewicz) 미스트랄 AI 글로벌 수익 총괄은 "미스트랄은 스냅드래곤8 엘리트, 스냅드래곤 콕핏 엘리트와 스냅드래곤 라이드 엘리트에 최적화된 새로운 AI 모델인 '미스트랄 3B'를 제공할 것"이라고 밝혔다. 마조리 자니위츠 총괄은 "미스트랄 3B는 300만 개의 매개변수(패러미터)로 작지만 강력하며 스마트폰, 차량 등 다양한 기기에서 실행하기에 이상적이다. 개발자들은 퀄컴 AI 허브를 통해 미스트랄 3B를 포함한 각종 AI 모델에 접근할 수 있다"고 설명했다. 박은정 업스테이지 공동창립자 겸 미국법인 대표는 행사에 직접 등장해 "업무용 환경을 위해 개발된 올인원 엔터프라이즈급 LLM 모델인 솔라박스를 스냅드래곤 X 엘리트에 최적화해 곧 선보일 예정"이라고 밝혔다.

2024.10.24 11:48권봉석

퀄컴 "파트너사 위한 풀스택 최적화·멀티모달 AI에 집중"

[하와이(미국)=권봉석 기자] "퀄컴은 자체 AI 모델을 제작하지 않지만 AI 인프라와 소프트웨어 라이브러리를 제공하여 다양한 AI 제품 개발을 지원하고 있다. 기기 제조사, 개발자, 그리고 모델 제작자와 협업으로 스냅드래곤 디바이스에서 AI 모델을 최적화하는 것이 퀄컴의 전략이다." 미국 하와이에서 진행중인 퀄컴 연례 기술행사 '스냅드래곤 서밋 2024' 첫 날인 21일 오후(미국 현지시간) 국내 기자단과 만난 비네쉬 수쿠마(Vinesh Sukumar) 퀄컴 제품 담당 시니어 디렉터가 이렇게 소개했다. 현재 퀄컴은 메타와 오픈AI 등과 협력해 스냅드래곤 디바이스에서 AI 모델 성능을 최적화하고 있다. 또 스마트폰, PC, 자동차 등 다양한 기기에서의 AI 모델 최적화뿐만 아니라, 책임있는 AI를 통해 데이터 관리와 사용자 프라이버시 보호도 추진중이다. 이날 비네쉬 수쿠마 디렉터는 "여러 회사와 협업을 통해 기존 모델의 성능 최적화는 물론 멀티모달 AI와 같은 향후 기술에도 대비하고 있다"고 밝혔다. ■ 퀄컴 AI 허브와 오케스트라로 AI 모델 배포 간소화 퀄컴은 개발자들의 AI 모델 배포를 간소화하기 위해 올해 3월부터 '퀄컴 AI 허브'를 운영중이다. AI 허브는 개발자들이 최소한의 코드로 스냅드래곤 SoC에서 작동하는 AI 모델을 쉽게 배포할 수 있도록 돕고 있으며, 윈도우, 안드로이드, 리눅스 등 주요 운영체제를 모두 지원한다. 비네쉬 수쿠마 디렉터는 "퀄컴은 도메인별 소형 언어 모델(SLM)을 위한 AI 오케스트라도 제공한다. AI 오케스트라는 특정 도메인에 적합한 소형 언어 모델을 최적화하여 다양한 용도로 활용할 수 있게 하며, 필요에 따라 더 큰 모델을 사용할 수도 있다"고 설명했다. 퀄컴은 AI 어시스턴트 기술에서도 멀티모달 AI의 발전을 기대하고 있다. 멀티모달 AI는 비전, 자연어 처리 등 여러 모달리티를 결합하여 사용자의 제스처와 음성 명령을 동시에 이해할 수 있도록 한다. 비네쉬 수쿠마 디렉터는 자동차 환경을 예로 멀티모달 AI의 역할을 다음과 같이 설명했다. "자동차 내 AI 비서는 운전 중인 사람에게 경고등의 의미를 설명하거나, 장거리 운전 시 디스플레이를 활용해 단조로운 주위 환경을 보다 다채로운 환경으로 생성할 수 있다." ■ "다양한 정밀도 지원해 LLM 성능 극대화" 퀄컴은 AI 모델이 다루는 데이터의 정밀도와 관련해 다양한 데이터 표현 방식을 지원하고 있다. 예를 들어 메모리 제약이 있는 디바이스에서는 4비트 정수(INT4)를 사용하여 효율성을 높이는 방식이다. 비네쉬 수쿠마 디렉터는 "퀄컴은 메모리 대역 개선을 위해 LPDDR5X 메모리를 지원하고 있으며, 이는 초기 토큰 생성 속도와 분당 토큰 생성 속도에 큰 영향을 준다"고 밝혔다. ■ "AI의 윤리적 활용과 책임있는 AI도 주요 관심사" 퀄컴은 각종 AI 기술 개발과 함께 책임있는 AI에도 중점을 두고 있다. 데이터 관리, 편향 제거, 사용자 프라이버시와 보안을 포함한 윤리적 AI 배포를 위해 규제 기관과 협력하고 있다. 비네쉬 수쿠마 디렉터는 "퀄컴은 지난 15년간 AI에 투자해 왔으며, 사용자의 경험을 개선하고 엣지 컴퓨팅을 통해 보다 나은 경험을 제공할 것이다. 또 책임있는 AI를 위해 지속적으로 노력할 것"이라고 밝혔다.

2024.10.23 07:00권봉석

"집과 자동차를 하나로"…카카오가 AI와 IoT 결합하는 방법은

"인공지능(AI)과 사물인터넷(IoT)을 결합해 보다 스마트하고 개인화된 서비스를 제공하려고 합니다. 이를 통해 사용자들의 생활을 획기적으로 개선하는 것이 우리의 궁극적인 목표입니다." 김덕형 카카오 담당자는 22일 경기도 용인시 카카오 AI 캠퍼스에서 열린 '이프카카오 2024' 행사에서 이같이 말했다. '이프카카오 2024'는 카카오 그룹이 AI 및 클라우드 기술 성과를 공유하고 국내 IT 기술 발전에 기여하기 위해 마련한 행사다. 첫날에만 10개 이상의 다양한 기술 세션이 진행됐다. 이날 김 담당자는 '카카오i를 통한 AIoT 서비스의 사례와 미래' 세션을 맡아 '인공지능-사물인터넷(AIoT)'을 구현하기 위한 카카오i의 역할을 설명했다. AIoT란 인공지능(AI)과 사물인터넷(IoT)의 융합으로, 데이터 수집과 학습이 동시에 이뤄져 큰 시너지를 발휘한다. 이는 AI의 학습·추론 능력과 IoT의 데이터 수집·연결성이 결합돼 더 효율적이고 지능적인 시스템을 구축할 수 있기 때문이다. 김 담당자는 "IoT의 발전 단계는 현재 자율형 단계로 나아가고 있다"며 "이 단계에서는 AI 기술이 IoT 기기 자체에서 실행돼 데이터 수집과 학습을 동시에 수행하고 기기 간의 협업도 가능해진다"고 설명했다. 카카오 AI 서비스들 역시 이러한 방향성을 따르며 발전하고 있다. '헤이 카카오', '카카오홈', '카카오i 오토' 등의 솔루션이 자연어를 기반으로 다양한 기능을 제공하고 있기 때문이다. 사용자들은 이미 이러한 서비스를 통해 AIoT의 초기 단계를 경험하고 있다. 이어 발표를 맡은 김진호 담당자는 AIoT가 구현될 미래의 구체적인 시나리오를 제시했다. 그는 AIoT 기술의 지속적인 발전이 개인화된 서비스로 구현되면서 기기간의 연결성이 증대되는 상황을 시나리오를 통해 설명했다. 김 담당자는 "취침 전에 카카오i 솔루션을 대상으로 '나 잘게'라고 말하면 기기가 자동으로 에어컨 온도를 조절하고 조명의 밝기와 색상을 변경하며 커튼을 닫는다"며 "리모콘처럼 하나의 기기를 제어하는 것을 넘어 사용자의 진정한 의도를 이해하고 여러 기기를 통합적으로 관리하는 상황이 가능해질 것"이라고 강조했다. 또 그는 환경 변화에 따라 적절한 서비스를 추천하는 기능도 소개하며 자동차를 예시로 들었다. 가까운 미래에 카카오i 솔루션은 운전 중 날씨와 차량 상태를 고려해 에어컨을 켜고 장시간 운전 시 환기를 추천하는 기능을 제공할 예정이다. 이러한 기대에 대해 김 담당자는 "사용자들은 더욱 편리하고 안전한 생활을 누릴 수 있게 될 것"이라고 강조했다. 그럼에도 불구하고 AIoT 구현을 위해서는 해결해야 할 도전과제들이 있다. 김 담당자는 "복잡하고 다양한 표현을 AIoT가 이해하는데는 기존의 자연어 처리 방식으로는 한계가 있다"며 "생성형 AI와 거대언어모델(LLM)을 활용해 사용자 발화의 맥락을 정확히 이해하고 적절한 기기 제어를 수행해야 한다"고 밝혔다. 그 중 해결책으로 각광 받는 최신 AI 기술로는 생각의 연쇄(Chain of Thought), 멀티 에이전트 LLM, 검색증강생성(RAG) 등이 있다. 이러한 기술들은 사용자 발화에서 제어해야 할 기기 목록을 정확히 추출하고 AI가 그럴듯하게 거짓말하는 환각 현상을 줄이는 데 도움이 된다. 김 담당자는 "우리는 기술적인 과제들을 해결해 결국 집에서는 차량을, 차량에서는 집을 제어할 수 있는 통합된 서비스를 제공하게 될 것"이라며 "AI를 통한 스마트한 결정으로 사용자 경험을 혁신하겠다"고 강조했다.

2024.10.22 15:46조이환

퀄컴 "인간과 공감하는 'AI 에이전트' 시대 온다"

"퀄컴은 무선 통신 분야에서 혁명을 선도해왔지만 AI 시대를 맞이해 여기서 한 발 더 나아가 연결성 컴퓨팅 회사로 전환하고 있다. 모바일과 자동차, PC 등 진입하는 모든 분야에서 스냅드래곤을 통해 혁신하는 것이 퀄컴 목표다." 21일(현지시간) 미국 하와이에서 진행된 '스냅드래곤 서밋' 1일차 기조연설에서 크리스티아노 아몬 퀄컴 CEO가 회사의 비전을 이같이 강조했다. 스냅드래곤 서밋은 2015년 시작돼 올해 9년차를 맞은 연례 기술행사로 매년 스냅드래곤 등 신제품 발표와 관련 기술 시연이 진행된다. 올해는 퀄컴 자체 개발 오라이온 CPU를 탑재한 스마트폰용 SoC '스냅드래곤8 엘리트'가 공개됐다. ■ "생성 AI, 스마트폰과 이용자 커뮤니케이션 바꿀 것" 이날 크리스티아노 아몬 퀄컴 CEO는 "생성 AI 도입으로 스마트폰 앱이 이용자와 상호작용하는 방식도 바뀔 것이며 앱(App) 대신 AI 에이전트가 부상하는 시대가 올 것"이라고 설명했다. 아몬 CEO는 "PC가 처음 등장했을 때 키보드를 이용한 문자 입력에서 마우스와 그래픽 인터페이스로 소통했다. 스마트폰은 광대역 무선망과 터치를 이용해 컴퓨팅 환경을 바꿨다"고 설명했다. 이어 "스마트폰 도입 이후 이를 위한 앱이 등장했지만 스냅드래곤에서 구동되는 생성 AI는 이용자와 스마트폰의 자연스런 커뮤니케이션을 도와 지금까지 모든 경험을 바꿀 것"이라고 덧붙였다. ■ "앱 대신 다양한 일 처리하는 AI 에이전트 고르게 될 것" 그는 인터넷뱅킹 앱을 예로 들어 "현재 모든 앱 개발자는 화면을 어떻게 구성해야 할지 고민하지만 온디바이스 AI를 이용하면 마치 사람처럼 말과 영수증 사진을 이해하고 이에 맞는 화면을 자동으로 보여줄 것"이라고 전망했다. 크리스티아노 아몬 CEO는 "앞으로는 사람들이 앱 대신 다양한 방법으로 현재 상황을 이해하고 이에 맞게 작동하는 AI 에이전트를 고르게 될 것이다. 스마트폰이 AI를 전환할 것이며 퀄컴은 스냅드래곤으로 이를 실현할 것"이라고 덧붙였다. ■ 주요 AI 기업, 영상 메시지로 퀄컴과 파트너십 강조 이날 기조연설에는 AI 관련 주요 글로벌 IT 기업 CEO가 영상 메시지로 등장해 퀄컴과 파트너십을 강조했다. 사티야 나델라 마이크로소프트 CEO는 "퀄컴과 협업으로 지난 5월 AI 기반 편의 기능 '코파일럿+'를 구현했고 앞으로 더 다양한 기능이 일상적인 작업을 더 간편하게 만들어 줄 것"이라고 밝혔다. 마크 저커버그 메타 CEO는 "메타와 퀄컴은 첨단 AI LLM(거대언어모델) 라마(Llama), 혼합현실 기기인 퀘스트 등 다양한 분야에서 협력 중이다. 특히 메타는 오큘러스 고를 시작으로 퀄컴과 함께 인간의 연결 방식을 바꿀 미래를 함께 만들 것"이라고 말했다. 샘 알트먼 오픈AI CEO는 "퀄컴은 저전력 고성능 AI 추론 기능을 스냅드래곤 플랫폼에 탑재해 엣지 AI 구동에 앞장서고 있다. AI는 걸음마 단계로 오픈AI o1이나 GPT-4o 등 클라우드 기반 AI와 온디바이스 AI가 열 새로운 가능성에 기대가 크다"고 밝혔다.

2024.10.22 15:43권봉석

AI 로봇, 인류 위협 '터미네이터' 될 수도…어떻게?

인공지능(AI)으로 무장한 로봇 플랫폼이 많은 사람들의 관심이 쏠리고 있다. 특히 챗GPT를 비롯한 대규모 언어모델(LLM) 기반 AI 시스템은 인간을 뛰어넘는 실력을 과시하면서 엄청난 각광을 받고 있다. 그런데 AI 로봇을 해킹할 경우 인간에게 해를 끼칠 수 있다는 연구 결과가 발표돼 눈길을 끌고 있다. 미국 펜실베니아 공과대학 연구진들이 여러 AI 기반 로봇 플랫폼에서 그 동안 알려지지 않았던 보안 취약점을 발견했다고 IT매체 디지털트렌드를 비롯한 외신들이 17일(현지시간) 보도했다. 연구진들은 이 같은 내용을 담은 '대규모 언어모델(LLM)로 통제하는 로봇 탈옥하기'란 제목의 논문을 발표했다. 논문 교신 저자인 조지 파파스(George Pappas) 펜실베니아 공대 연구부문 부학장은 "우리 연구는 LLM이 물리적 세계와 통합됐을 때 충분히 안전하지 않다는 것을 보여준다”고 밝혔다. 파파스가 이끄는 연구진은 LLM 제어 로봇을 탈옥하도록 설계된 최초의 알고리즘 '로보페어'(RoboPAIR)를 개발했다. 이 알고리즘은 LLM이 탑재된 로봇 플랫폼에 유해한 신체적 행동을 유도하도록 특별히 제작됐다. 로보페어는 ▲다양한 응용분야에서 사용되는 사족보행 로봇 유니트리의 고(Go)2 로봇 ▲학술 연구에 자주 사용되는 바퀴 달린 클래어패스 로보틱스의 자칼 ▲엔비디아가 설계한 자율주행 시뮬레이터 돌핀스 LLM 시뮬레이터 등 3개의 로봇 플랫폼을 탈옥하는 데 100% 성공했다. 해당 알고리즘이 AI 로봇 시스템에 접근해 불과 며칠 만에 100% 탈옥에 성공한 것으로 알려졌다. 그 결과 로봇의 제어권을 탈취해 자율주행 차량이 교차로에서 정지하지 않고 그대로 통과하는 등 위험한 행동을 취하도록 지시할 수 있었다고 연구진은 설명했다. 또, 연구진은 “문제 해결을 위해 필요한 것은 '소프트웨어 패치'보다는 AI를 물리적 시스템에 통합하는 방식을 전면적으로 재평가하는 것”이라며, "현실 세계에 AI 기반 로봇을 배치하기 전에 본질적인 취약성을 해결해야 한다"고 인류에 재앙을 초래할 수 있는 로봇 해킹의 위험성을 경고했다. 연구진은 “사회적 규범에 부합하는 행동만 하는 로봇 시스템과 이를 보장하는 검증 프레임워크를 개발 중”이라고 덧붙였다.

2024.10.18 16:28이정현

파네시아, 엔비디아·구글에 CXL 솔루션 기술 선봬

국내 팹리스 스타트업 파네시아는 이달 15일부터 미국 캘리포니아주에서 개최되고 있는 세계 최대규모 데이터센터 관련 행사 'OCP 글로벌 서밋'에서 'CXL 3.1 스위치가 포함된 AI 클러스터'를 세계 최초로 공개했다고 18일 밝혔다. OCP 글로벌 서밋은 기존 데이터센터의 비용 효율적인 문제를 해결하는 방법 등 이상적인 데이터센터 인프라 구축 방안에 대한 논의가 이루어지는 행사다. 올해에는 다수의 글로벌 기업을 포함해 7천명 이상의 관계자가 모여 AI향 솔루션에 대해 중점적으로 논의를 진행했다. 파네시아는 이번 행사에서 차세대 인터페이스 기술인 CXL(컴퓨트익스프레스링크)을 활용해 AI 데이터센터의 비용 효율을 획기적으로 개선하는 솔루션인 'CXL 탑재 AI 클러스터'를 선보여 많은 관심을 받았다. CXL은 고성능 서버에서 CPU(중앙처리장치)와 함께 사용되는 GPU 가속기, D램, 저장장치 등을 효율적으로 활용하기 위한 차세대 인터페이스다. 파네시아 관계자는 "AI가 메인 토픽으로 다루어진 올해 행사에서 파네시아는 AI 데이터센터에 CXL 기술을 실용적으로 도입하기위한 청사진을 제시함으로써 많은 글로벌 기업들의 관심을 받고, 고객사 및 협업사 생태계를 확장할 수 있었다”고 말했다. CXL 탑재 AI 클러스터는 파네시아의 주요 제품인 CXL 3.1 스위치와 CXL 3.1 IP를 활용해 구축한 프레임워크다. 대규모 데이터를 저장하는 CXL-메모리 노드와 기계학습 연산을 빠른 속도로 처리하는 CXL-GPU 노드가 CXL 3.1 스위치를 통해 연결되는 구조다. 메모리를 확장하고 싶다면 오직 메모리와 메모리 확장을 위한 CXL 장치들만 추가로 장착해주면 되며, 따라서, 기타 서버 부품 구매에 불필요한 지출을 하지 않아도 돼 메모리 확장 비용을 절감할 수 있다. 또한 각 CXL 장치에는 파네시아의 초고속 CXL IP가 내재돼 메모리 관리 동작을 하드웨어로 가속해준다. 이를 통해 사용자들은 빠른 성능을 누릴 수 있다. 뿐만 아니라 CXL 3.1 표준의 고확장성 관련 기능 및 모든 타입의 CXL 장치에 대한 연결을 지원하는 파네시아의 CXL 스위치 덕분에, 수 백대 이상의 다양한 장치를 하나의 시스템으로 연결하는 실용적인 데이터센터 수준의 메모리 확장이 가능하다는 것도 주요 장점이다. 해당 CXL 3.1 스위치는 내년 하반기에 고객사들에게 제공될 예정이다. 파네시아는 이번 전시회 기간 동안 본인들의 AI 클러스터 상에서 LLM(대규모 언어 모델) 기반 최신 응용인 RAG(검색 증강 생성)를 가속하는 데모를 선보였다. 관계자의 설명에 따르면, 파네시아의 CXL 탑재 AI 클러스터를 활용할 경우, 기존의 스토리지 혹은 RDMA(네트워크 기술의 일종, Remote Direct Memory Access) 기반 시스템 대비 추론 지연시간을 약 6배 이상 단축시킬 수 있다. 파네시아 관계자는 "서버를 제공하는 다수의 기업들이 내년 하반기 고객사에게 제공예정인 우리의 CXL 3.1 스위치 칩을 본인들의 서버 제품에도 도입하길 희망한다는 의사를 강력히 밝혔다”며 "엔비디아, AMD 등 GPU를 개발하는 기업에서도 많이 방문했는데, 이들은 파네시아의 CXL 3.1 IP를 활용해 GPU 장치에 CXL을 활성화할 수 있다는 사실에 많은 관심을 보였다"고 강조했다.

2024.10.18 09:33장경윤

마이크로소프트 AI 부사장, 오픈AI 합류한다

마이크로소프트의 인공지능(AI) 핵심인력이 오픈AI에 합류한다. 15일 로이터에 따르면 세바스티앙 뷔벡 마이크로소프트 생성 AI 연구 부사장이 마이크로소프트에서 오픈AI로 이직해 일반인공지능(AGI) 개발에 주력할 예정이다. 뷔벡은 마이크로소프트에서 소형 거대언어모델인 '파이(Phi)' 연구를 주도했으며 이 모델은 기존 거대언어모델(LLM)보다 더 작은 규모로도 높은 성능을 낼 수 있다는 평가를 받고 있다. 그의 공동 연구자들은 마이크로소프트에 남아 해당 모델을 계속 개발할 계획이다. 이번 이동은 최근 오픈AI에서 발생한 일련의 인사 변화들과 맞물려 주목받고 있다. 지난 9월에는 오픈AI 최고기술책임자(CTO)였던 미라 무라티도 퇴사한 바 있다. 마이크로소프트는 뷔벡이 오픈AI로 자리를 옮겼지만 양사 간 협력 관계는 지속될 것이라고 밝혔다. 마이크로소프트는 오픈AI의 주요 투자자로서 긴밀한 관계를 유지하고 있다. 업계 관계자는 "오픈소스가 아닌 폐쇄형 연구를 진행하는 회사 간에서는 인력 이동이 아이디어의 확산에 도움될 수 있다"며 "AI 기술 발전에 긍정적인 영향을 미칠 것으로 생각한다"고 말했다.

2024.10.15 09:06조이환

서일홍 코가로보틱스 대표 "이제는 로봇도 '캄브리아기'…경량 AI 기술로 대응"

"캄브리아기에 다양한 생명체가 나타났듯이 현재는 '로봇의 캄브리아기'로서 다양한 휴머노이드 기기나 나올 것이라고 생각한다. 코가로보틱스는 이에 대응해 경량 AI 기술을 기반으로 효율적인 로봇을 연구 개발하고 있다." 서일홍 코가로보틱스 대표는 11일 서울 삼성동 코엑스에서 열린 '디지털 혁신 페스타 2024'의 부대행사 '퓨처 테크 컨퍼런스'에서 이같이 밝혔다. 이날 '온-로봇 AI가 만드는 AI 로봇의 세상'를 주제로 발표를 진행한 서일홍 대표는 '온디바이스 AI'의 중요성을 강조했다. 온디바이스 AI란 서버 및 클라우드를 거치지 않고 기기 자체에서 AI 기능을 구현하는 기술을 뜻한다. 기존 AI 대비 반응속도가 빠르고 전력효율성이 뛰어나기 때문에, 항상 사용자를 보조해야 하는 첨단 휴머노이드 로봇에 반드시 필요한 기술로 주목받고 있다. 서 대표는 "휴머노이드 로봇이 사람과 비슷하게 동작하기 위해, 로봇을 위한 LLM(거대언어모델)과 같은 모델들이 속속 개발되고 있다"며 "이를 효율적으로 구현할 수 있도록 코가로보틱스는 AI 경량화 및 경량 AI 개발에 주력하고 있다"고 밝혔다. 특히 코가로보틱스가 AI 경량화를 위해 주목하고 있는 기술이 HDC(초차원연산)다. HDC는 인간 뇌의 연산 방식을 모방해, 기존 딥러닝 대비 더 적은 메모리와 데이터 처리량으로도 고성능 연산이 가능하다. 코가로보틱스는 이 HDC 알고리즘 기반의 자체 OS(운영체제)를 무기로, 다양한 로봇을 개발하고 있다. 대표적으로 코가로보틱스는 올해 산업통상자원부로부터 시각언어모델(VLM) 기반의 시각정보 활용 내비게이션 기술 개발과 관련한 과제를 수주했다. 경량 AI를 통해 로봇이 스스로 목적지를 찾아 안전하게 자율주행하는 기술을 개발하는 것이 주 골자다. 또한 코가로보틱스는 지난 7월 보훈부 산하 요양기관에 간병로봇을 공급하는 시범사업의 로봇 공급업체로 선정됐다. 해당 로봇은 음성 대화를 통해 회진, 심부름 등을 수행할 수 있다. 또한 지난달에는 공항 디지털 전환(DX)을 위한 로봇 공급업체로도 선정됐다. 서일홍 대표는 "상용 로봇을 위한 AI 기술이 당초 예상보다 빠르게 발전하고 있다"며 "향후 10년간 뇌를 흉내내는 초차원연산 컴퓨팅과 같은 새로운 경량 AI 기법이 활성화될 것으로 예상된다"고 말했다.

2024.10.11 18:03장경윤

세미파이브, 하이퍼엑셀과 4나노 AI칩 양산 계약 체결

반도체 설계 솔루션 회사 세미파이브는 하이퍼엑셀과 생성형 인공지능(AI) 반도체 베르다(Bertha)의 양산 계약을 체결했다고 11일 밝혔다. 베르다에는 4나노 공정 기술이 적용될 예정이며, 2026년 1분기 양산을 목표로 하고 있다. 하이퍼엑셀은 트랜스포머 기반 거대 언어 모델(LLM)에 특화된 AI 반도체인 레이턴시 프로세싱 유닛(LPU, LLM 처리장치)를 개발했다. 이 제품은 세계 최초로 LLM 추론에 특화된 반도체 LPU로 저비용, 저지연, 도메인 특화가 장점이다. LLM 추론 부문에서 현존하는 최고의 그래픽 처리 장치(GPU) 대비 성능은 최대 2배, 가격 대비 성능은 19배 향상되어 기존 고비용 저효율 GPU를 대체할 대항마로 떠오르고 있다. 세미파이브는 SoC 플랫폼과 ASIC 설계 솔루션을 전문으로 하는 회사다. 최근에는 AI 반도체 전문 SoC 설계 플랫폼을 개발하는 데 주력하고 있으며, AI 커스텀 반도체에 대한 고객 수요에 대응해 로드맵을 확장할 계획이다. 이를 위해 업계 최고의 파트너들과 협력하며 SoC 칩렛 플랫폼도 적극적으로 개발하고 있다. 김주영 하이퍼엑셀 대표는 “SoC 플랫폼과 포괄적인 ASIC 설계 솔루션을 제공하는 세미파이브와 협력해 양산을 목표로 베르다를 개발하게 돼 기쁘다”며 “이를 통해 데이터센터의 운영 비용을 크게 절감하고 LLM이 필요한 다른 산업 분야로 사업 범위를 확장할 수 있을 것"이라고 말했다. 조명현 세미파이브 대표는 “하이퍼엑셀은 LLM을 위한 가장 효율적이고 확장 가능한 LPU 기술을 보유한 회사다. LLM 연산에 대한 수요가 급증함에 따라 하이퍼엑셀은 글로벌 프로세서 인프라의 새로운 강자가 될 잠재력을 가지고 있다"며 “하이퍼엑셀의 기념비적인 AI칩 베르다의 양산 파트너가 되어 매우 기쁘고, 세미파이브 플랫폼을 기반으로 또 하나의 혁신적인 성공 사례에 기여하게 돼 기대가 크다”고 강조했다.

2024.10.11 08:50장경윤

리벨리온, AI칩 '아톰' 서버 안정성 인증 잇달아 획득

리벨리온은 최근 다수의 글로벌 서버 제조사로부터 AI반도체 '아톰(ATOM)'의 서버 안정성 인증을 잇달아 획득하며 제품 신뢰성을 증명했다고 9일 밝혔다. 특히 하나의 서버에 다수의 '아톰' 카드를 장착하는 '멀티카드(Multi-card)' 환경에서 검증을 거치며 LLM(대규모언어모델) 등 큰 규모의 모델도 안정적으로 지원할 수 있음을 입증했다. 안정성 인증은 특정 서버 내에서 카드 등 제품이 문제없이 구동하는지 점검하고, 서버 제조사와 칩 제조사 간 기술적인 최적화를 거치는 절차다. 리벨리온은 올 9월까지 ▲델 테크놀로지스 ▲HPE ▲슈퍼마이크로 ▲레노버 ▲기가바이트 등 글로벌 서버 제조사로부터 검증을 완료했으며, 국내 서버사로는 이슬림코리아를 비롯한 4개사로부터 인증을 획득했다. 리벨리온은 대규모 AI모델 지원을 위한 '멀티카드' 환경에서 검증을 진행했으며, 현재 고객에게 제공되는 정식 서버 환경에서 '라마(Llama) 3.1 70B' 등 LLM을 안정적으로 구동하고 있다. 이를 바탕으로 LLM을 지원하는 AI데이터센터를 본격 공략한다는 계획이다. 특히 리벨리온과 각 서버사가 인증 획득 과정에서 통신 프로토콜 호환성 확인, 펌웨어 최적화 등 기술 협력을 거쳤기에 다양한 서버 환경에서 원활한 운용이 보장된다. 공식 인증을 받은만큼 리벨리온 제품 구동과 관련해 서버 업체로부터 전 범위의 기술지원도 제공받을 수 있다. 추후 각 서버 업체, 총판사와 협력해 리벨리온의 NPU를 탑재한 솔루션과 사업모델 개발 등 사업적 시너지도 낼 것으로 기대된다. 서버 수준에서의 신뢰성을 확보한 리벨리온은 AI 데이터센터 공략을 위해 다수의 서버를 탑재한 랙(Rack) 솔루션도 선보인다. 하이퍼스케일러, 대규모 국가 데이터센터 등 초고용량의 AI 추론 트래픽을 필요로하는 수요처에 대응할 예정이다. 박성현 리벨리온 대표는 “리벨리온은 AI반도체가 탑재된 카드 수준을 넘어 서버와 랙, 그리고 AI데이터센터 납품을 위한 규모 있는 수준으로 사업 모델을 빠르게 진전시키고 있다”며 “다양한 서버 제조사로부터 정식 인증을 받음으로써 아톰과 리벨리온의 기술적 우수성을 증명했을 뿐 아니라 'AI인프라 사업자'로서 발돋움하는 계기가 됐다”고 밝혔다.

2024.10.09 11:15장경윤

"AI 에이전트 '알리' 각광…한·미·일 시장 동시 공략"

올거나이즈코리아가 '제8회 대한민국 디지털 미래혁신대상'에서 한국인공지능산업협회 협회장상을 수상했다. 과학기술정보통신부가 주최하고 한국소프트웨어산업협회(KOSA)가 주관하는 대한민국 디지털 미래혁신대상은 뛰어난 미래 혁신 기술을 보유한 기업을 발굴해 시상하는 디지털 분야 대표 어워드다. 시상식은 오는 10일 서울 코엑스에서 열리는 '디지털 혁신 페스타(DINNO) 2024'에서 열린다. 올거나이즈는 자연어 이해(NLU) AI 기술을 기반으로, 엔터프라이즈 고객사에 LLM(거대언어모델) 관련 솔루션을 제공하는 기업이다. 지난 2017년 한·미·일에서 동시에 사업을 시작해 2018년 한국 법인을 설립했다. 올거나이즈의 핵심 제품은 AI 태스크봇인 '알리(Alli)'다. 기업 내 많은 문서·텍스트 데이터를 분류 및 추출·검색해, 직원들의 업무 자동화를 돕는다. 현재 올거나이즈는 자체 개발한 산업 특화 LLM부터 기업 맞춤형 LLM 등 LLM의 전 영역을 제공하고 있다. 기업은 알리 앱 마켓에서 직군별 업무 자동화 앱을 골라 바로 사용할 수 있으며, 업종별 전문 용어가 반영된 업무 생산성 앱을 노코드(No-Code) 형태로 직접 구축할 수도 있다. 또한 알파-인스트럭트 LLM을 오픈소스로 공개하고, 금융 LLM 리더보드 및 RAG 리더보드의 테스트 데이터셋도 공개해 AI 생태계에 기여하고 있다. 이창수 올거나이즈코리아 대표는 "회사의 가장 강력한 경쟁력은 지난 6년간 실제 고객사들의 문서를 다뤄온 경험과 노하우를 '에이전트 RAG(검색증강생성)'로 녹여냈다는 점"이라며 "LLM을 기업에서 사용할 때 환각에 대한 걱정을 하게 되는데, 이러한 환각을 줄이면서 업무 생산성을 향상시키는 방향으로 RAG 기술이 부각되고 있다"고 설명했다. RAG은 외부 리소스를 LLM에 연결해 생성형 AI 모델의 출력 정확성을 향상시키는 기술이다. 올거나이즈의 에이전트 RAG는 기존 RAG와 다르게 일회성으로 답변하고 끝나는 것이 아니라, 사용자와 상호작용하면서 더 나은 결과물을 도출하기 위해 에이전트가 직접 계획부터 실행까지 진행한다. 이 대표는 "운영 비용을 최소화해야하는 기업들은 반복적인 기능을 자동화하고, 방대한 데이터를 분석하고, 실시간으로 효과적인 대안을 제공하는 AI 에이전트를 점점 더 많이 필요로 하고 있다"며 "올거나이즈의 AI 에이전트는 많은 문의를 동시에 관리할 수 있어, 더 빠른 대응과 복잡한 문제 처리가 가능하다"고 말했다. 한편 올거나이즈코리아는 2025년 말 일본 도쿄거래소 증시 상장을 목표로 하고 있다. 또한 AI 워크 에이전트의 유망한 성장세에 주목해 주요 시장인 한·미·일 3개국을 동시에 공략할 계획이다. 시장조사업체 마켓앤마켓의 최신 보고서에 따르면, AI 에이전트 시장은 2024년 51억 달러에서 2030년 471억 달러로 연평균 44.8%의 높은 성장률을 기록할 것으로 예상된다. 이 대표는 "현재 금융, 공공기관의 온프레미스 AI 프로젝트를 많이 진행해 왔는데, 올거나이즈 제품은 온프레미스, 하이브리드, SaaS 형태로 모두 제공 가능하다"며 "미국과 일본에서는 SaaS 제품이 더 많이 팔리고 있기 때문에 한국 시장에서도 SaaS 제품을 좀 더 공격적으로 마케팅할 것"이라고 밝혔다. 그는 이어 "올거나이즈의 비전은 전 세계적인 AI 회사를 만드는 것"이라며 "스타트업의 유전자(DNA)를 가진 AI 자회사들을 여럿 만들어 다양한 일을 해 보고 싶다. 매출보다 영향력이 큰 회사를 만드는 것이 꿈"이라고 덧붙였다.

2024.10.08 09:33장경윤

"IPO 첫 관문 넘었다"…뉴엔AI, 생성형 AI로 기술성 평가 통과

뉴엔AI가 생성형 인공지능(AI) 기반 빅데이터 분석 기술을 인정받아 기업공개(IPO) 실현에 한 걸음 다가섰다. 뉴엔AI는 코스닥 기술특례상장을 위한 기술성 평가에서 'A, A' 등급을 받았다고 8일 밝혔다. 기술성 평가는 코스닥 기술특례상장을 위한 첫 관문이다. 한국거래소가 지정한 두 곳의 전문 평가기관에서 A등급과 BBB 등급 이상 평가를 받아야 한다. 뉴엔AI는 AI 기술 완성도를 비롯한 사업성, 성장성, 경쟁우위, 연구개발, 경영역량 등 다방면에서 우수한 평가를 받았다. 나이스평가정보와 기술보증기금으로부터 각각 A, A 등급을 획득했다. 특히 이번 평가는 지난해 7월부터 변경 강화된 한국거래소의 새로운 기술평가 방식으로 올해 최고 등급을 받아 더 큰 의미가 있다. 과거 기술특례평가로 IPO를 통과한 기업들이 상장 후 부실한 경영 성적으로 논란이 되면서 기술특례평가에서 기술성에 사업성을 보다 엄격하게 평가해야 한다는 주식시장 요구 사항이 반영돼서다. 뉴엔AI는 2004년부터 구어체 비정형 빅데이터 분석에 특화된 거대언어모델(LLM) 아키텍처 '퀘타(Quetta) LLMs'로 딥러닝·생성형 AI를 이용한 빅데이터 분석 서비스를 업종별 고객사에 맞춤형으로 제공해 왔다. 대표 제품은 생성형 AI 기반 ▲맞춤형 AI 분석 서비스 퀘타 엔터프라이즈 ▲범용형 AI 분석 서비스인 퀘타 서비스 ▲데이터 공급 서비스 퀘타 데이터다. 특히 고객사 사이에서 퀘타 엔터프라이즈 활용 비중이 48%로 가장 사업성 높다. 뉴엔AI는 현재 200개 이상 고객사를 보유하고 있다. 3년 이상 장기 고객 비중이 73%, 민간기업 매출 비중이 90% 이상이다. AI 빅데이터 분석 시장에서 유일하게 연평균 매출액 20% 성장과 순이익을 기록한 회사로 알려졌다. 뉴엔AI 관계자는 이번 기술성 평가 통과 후 한국거래소에 상장예비심사를 청구할 예정이라고 설명했다. 상장 주관사는 NH투자증권이다. 배성환 뉴엔AI 대표는 "이번 기술성 평가를 통해 기술력과 사업성을 모두 인정받고, 우수한 등급을 획득하게 돼 기쁘다"며 "창업 후 적자 한번 없이 20년 동안 흑자 경영을 해온 만큼 내년 상장 후에도 국내서 유일하게 흑자 성장을 하면서 해외 수출이 활발한 AI 대표 기업이 될 것"이라고 포부를 밝혔다.

2024.10.08 08:00김미정

'AI 대모' 페이페이 리 교수 "AGI 의미, 솔직히 잘 모르겠다"

"일반인공지능(AGI)이 무엇을 의미하는지 잘 모르겠습니다. 이 단어에 대해 깊이 생각해 본 적도 없습니다. 이보다 더 중요한 일이 많다고 봅니다." 7일 테크크런치에 따르면 페이페이 리 스탠퍼드대 교수 겸 월드랩스 대표는 지난 3일 미국 샌프란시스코 골드게이트 클럽에서 열린 크레도 AI의 '책임 있는 AI 리더십 서밋'에 참석해 AGI에 대한 의견을 이같이 밝혔다. 최근 AGI 용어가 산업계에서 사업·마케팅 목적으로 남발되는 것에 대해 지적한 것이다. 페이페이 리 교수는 "수십 년 동안 AI를 학문적으로 접근했다"며 "더 엄격하고 객관적인 증거를 통해 AI를 연구했다"고 말했다. 이어 "요즘 거론되는 AGI가 무슨 뜻인지 모르겠다"며 "사람들은 AGI가 나타나면 알아차릴 수 있을 거라고 하지만, 학자로서 와닿지 않는다"고 지적했다. 또 그는 "AGI에 대해 딱히 생각해 본 적 없다"며 "AI 발전을 위해 더 중요한 일이 많기 때문"이라고 덧붙였다. 리 교수는 2010년 '이미지넷(ImageNet)' 구현 후 비전 AI를 탄생시킨 'AI 대모'로 알려졌다. 2000년대 초부터 연구자들과 AI 기초 개념을 확립했다. 이후 이미지넷을 '알렉스넷(AlexNet)'과 결합해 최신 비전 AI를 구현했다. 이렇게 수십 년간 AI를 연구했음에도 AGI 용어 모호성을 지적한 것이다. 일각에선 리 교수가 최근 오픈AI나 메타, xAI 등이 투자 확대를 위해 홍보 목적으로 AGI 용어를 남발하는 것을 우회해 비판했다고 분석하고 있다. 앞서 샘 알트만 오픈AI 최고경영자(CEO)는 지난해 미국 월간지 뉴요커 인터뷰에서 "AGI는 평균적인 인간과 동등한 존재"라며 "회사 직원들이 이를 동료로 생각할 수 있을 만큼 지적 수준을 갖춘 기술"이라고 해당 용어를 정의한 바 있다. 리 교수는 향후 다양한 기업과 기술이 결합해야만 AGI 시대를 맞이할 수 있다고 내다봤다. 특정 기업만이 AGI를 이룰 수 없다는 의미다. 그는 "앞으로 다양한 종류의 AI가 등장할 것"이라며 "이는 인류에 더 나은 기술을 제공할 것"이라고 설명했다. 리 교수는 최근 AI 스타트업 월드랩스를 설립했다. 월드랩스는 '공간 지능(spatial intelligence)'를 연구하고 있다. 공간 지능은 컴퓨터가 비전 AI를 통해 현실세계를 이해하도록 돕는 기술이다. 공간 지능은 AGI 구현을 위한 핵심 축으로 알려졌다. 그는 공간 지능에 활용할 '세계대형모델(LWM)'을 월드랩스에서 개발하고 있다. 리 교수는 LWM 개발이 거대언어모델(LLM) 구축보다 복잡하다고 했다. 인간 언어는 100만년에 걸쳐 완성됐지만, 시각·지각 완 5억4천만년 걸렸다는 이유에서다. 그는 "AI가 실제 사물을 보거나 세상을 탐색·상호작용하게 하려면 공간 지능이 필요하다"며 "몇 년 내 이를 실현할 수 있도록 노력할 것"이라고 설명했다.

2024.10.07 09:20김미정

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

[ZD브리핑] 美 반도체 관세 여부 주목…23일부터 한일 정상회담

통신사가 직접 'AI 스마트폰' 만들어 판다

이재명 대통령 "AI 혁신에만 전념할 환경 만들겠다"

'GPT-5' 황당 답변, 인력 유출 때문?…'위기' 오픈AI, 특단 대책 마련 급급

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.