• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
AI페스타
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'라마'통합검색 결과 입니다. (54건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

美 정부, 공무원 행정 업무에 메타 '라마' 적용

미국 정부가 공공 업무에 메타의 생성형 인공지능(AI) 모델 '라마' 활용을 승인했다. 23일 테크르런치 등 외신에 따르면 미국 일반조달청(GSA)은 라마를 정부 승인 AI 도구 목록에 추가했다. 계약 검토 자동화나 IT 장애 대응 등에 우선 활용될 방침이다. 라마는 텍스트와 이미지, 영상, 음성 데이터를 처리할 수 있는 멀티모달 AI 모델이다. GSA는 라마가 정부의 보안·법적 기준을 충족했다고 판단해 각 기관에 무료로 실험적 도입을 허용했다. 다수 외신은 이번 조치가 민간 AI 도구를 행정 업무에 통합하려는 트럼프 정책의 일환으로 봤다. 앞서 GSA는 메타뿐 아니라 아마존웹서비스(AWS), 마이크로소프트, 구글, 앤트로픽, 오픈AI의 생성형 AI 도구도 승인했다. 해당 기업은 자사 유료 AI 제품을 대폭 할인하고, 정부 보안 요건을 따른다고 밝힌 바 있다. GSA 조시 그루엔바움 조달 책임자는 "이번 라마 승인은 미국을 최고의 나라로 만들기 위한 과정"이라며 "미국 정부의 디지털 전환을 가속할 것"이라고 강조했다.

2025.09.23 10:01김미정

[유미's 픽] "수천억 줘도 싫다"…핵심 인재도 외면한 메타, AI 시장서 존재감 찾을까

한 때 혁신의 아이콘으로 주목 받았던 메타가 인공지능(AI) 시장에서 존재감을 발휘하지 못하고 있다. AI 기술력 향상을 위해 고액의 연봉을 내세워 시장 내 인재 영입 경쟁을 부추기고 대규모 투자에도 나섰지만, 마크 저커버그 메타 최고경영자(CEO)의 독단적 운영 방침과 뒤숭숭해진 조직 문화에 발목이 잡혀 갈수록 경쟁력이 뒤처지고 있다는 평가다. 2일 파이낸셜타임즈, 비즈니스인사이더, 테크크런치 등 주요 외신에 따르면 메타는 최근 핵심 인재 8명의 이탈로 AI 사업의 조직력이 약화됐다. 업계 최고 대우를 약속하며 AI 인재들을 끌어들였지만 메타 조직 내부의 관료주의와 잦은 팀 재편 등 불안정한 조직 문화가 맞물리면서 인력 이탈이 가속화된 것이다. 앞서 메타는 지난 4월 최신 거대언어모델(LLM)인 '라마4'를 공개했지만, 코딩·추론·명령 수행에서 기대 이하의 성능을 보여 개발자들로부터 다소 아쉬운 반응을 얻었다. 이에 실망한 저커버그 CEO는 당시 "용납할 수 없는 일"이라고 불만을 표출한 후 AI 전문가로 구성된 'AI 드림팀'을 직접 구축하고 나섰다. 이 과정에서 메타는 수십조원을 투자하며 AI 핵심 인재 영입에 적극적인 모습을 보였다. 저커버그 CEO는 수개월간 AI 인재들에게 직접 연락해 1억 달러(약 1천400억원)에 달하는 파격적인 조건을 제안하기도 했다. 실제 스타트업 버셉트(Vercept)를 공동 창업한 24세 AI 연구자인 맷 다이트케는 4년간 2억5천만 달러(첫 해 1억 달러 지급)를 받는 조건을 제안 받아 결국 메타로 영입됐다. 냇 프리드먼 깃허브 전 CEO와 루오밍 팡, 톰 건터, 마크 리, 보웬 장, 윤 주, 프랭크 추 등 애플 출신 AI 전문가들도 줄줄이 메타로 자리를 옮겼다. 업계에선 오픈AI에서 20여 명, 구글에서 10여 명 등 총 50명 정도가 메타에 합류한 것으로 파악했다. 지난 6월에는 데이터 라벨링 업체 스케일AI에 메타가 143억 달러(약 20조원)를 투자하면서 최고경영자(CEO) 알렉산더 왕과 주요 임원들을 영입했다. 이들에게 인간을 능가하는 AI 개발을 위한 '메타 초지능 연구소(MSL)' 운영도 맡겼다. 이후 MSL은 라마 등 메타 AI 파운데이션 모델을 담당하는 TBD랩, AI 연구 그룹, 제품 그룹, 인프라 그룹 등 4개의 조직으로 개편됐다. 메타는 지난 달 중순께 'MSL'의 기틀이 어느 정도 마련됐다고 보고 외부 인재 채용 중단 사실을 내부에 공유하며 조직 안정화에 나서는 듯 했다. 하지만 잦은 조직 개편과 불공정한 대우에 불안을 느낀 일부 직원들이 잇따라 메타를 떠나기 시작하며 내부는 다시 불안정한 상태에 놓였다. 실제 10년 가까이 메타에 장기 근무한 차야 나야크 생성 AI 제품 관리 디렉터, 12년간 근무한 버트 마허 연구원은 메타를 떠나 각각 오픈AI와 앤트로픽으로 떠났다. 8년간 메타에 재직한 베테랑 토니 리우, 메타 머신러닝을 5년간 담당한 치하오 우도 퇴사했다. 이에 지난 2023년 발표된 라마 모델 연구 논문의 공동 저자로 이름 올린 14명 중 11명이 메타를 떠난 것으로 파악됐다. 라마 모델 개발 연구원이었던 티멘 블랑케보르트는 퇴사 전 내부 게시판에 "AI 부서에서 진정 즐거워하는 사람을 만나지 못했다"며 "조직 내 두려움이 전이성 암처럼 퍼져 있다"고 말했다. 이어 "빈번한 성과평가와 반복되는 구조조정이 사기와 창의성을 저하하고 있다"며 "대부분은 우리의 미션이 무엇인지도 모른다"고 비판했다. 최근 영입됐던 인재들도 메타의 내부 정책을 못마땅해 하며 이탈했다. xAI에서 메타로 온 이선 나이트, 오픈AI 출신인 아비 베르마는 메타에 합류한 지 한 달도 안 돼 다시 오픈AI로 떠났다. 올 4월 메타에 합류한 연구원 리샤브 아가르왈은 페리오딕 랩스라는 스타트업으로 이직했다. 스케일 AI에서 합류한 루벤 마이어 전 수석 부사장도 입사 두 달 만에 퇴사했다. 그는 메타 재직 당시 AI 데이터 운영팀을 총괄했다. 여기에 스케일AI와의 파트너십도 균열 조짐을 보이고 있다. 메타 내부에서 스케일AI 데이터 품질에 대한 불만이 제기됐고 결국 서지, 머코 등 스케일AI의 경쟁사와도 협력하고 나선 것이다. 스케일AI는 메타의 투자 유치 직후 오픈AI, 구글 등의 고객사를 잃은 데다 데이터 라벨링 사업부 직원 200명을 해고하며 혼란을 겪고 있는 상태다. AI 인재 영입에 비해 기술력이나 시장에서의 영향력도 크게 향상되지 못했다. 미국 벤처캐피털 안드리센호로위츠(a16z)가 지난 달 27일 발표한 '글로벌 생성형 AI 소비자 앱 톱100'에서 메타는 웹 부문에서 '메타 AI'로 46위를 기록했으나, 모바일 부문에선 상위 50개 앱 목록에 단 한 개도 포함되지 않았다. 반면 오픈AI는 웹·모바일 부문 모두 '챗GPT'로 1위를 차지하며 독보적인 존재감을 드러냈다. 구글 역시 웹·모바일 부문에서 AI 챗봇 '제미나이'로 2위, 개발자 전용 앱 'AI 스튜디오'로 10위, '노트북LM'으로 13위, AI 실험 플랫폼 '구글 랩스'로 39위에 이름을 올렸다. 상위 50위 안에 AI 앱 4개를 올린 회사는 구글이 유일하다. 기술 및 윤리적 문제도 논란에 휩싸였다. 메타가 최근 팝스타 테일러 스위프트, 배우 앤 해서웨이 등 유명인의 이름과 모습을 당사자 동의 없이 사용해 '선정적인 챗봇' 수십 개를 무단 제작하고, 소셜 미디어를 통해 공유했기 때문이다. 이에 메타는 자체 AI 기술 개발에서 외부 협력으로 전략을 수정했다. 디 인포메이션에 따르면 메타에서 구글 '제미나이'와 오픈AI 모델을 활용해 메타 AI를 구동하는 방안을 논의했다. 또 플레이 AI, 웨이브폼스 AI 등 음성 AI 스타트업을 인수하고 미드저니와도 파트너십을 맺었다. 여기에 오픈AI와도 파트너십을 검토하고 나선 것으로 알려졌다. 메타 직원들은 이미 타사 모델을 사용하는 것으로 알려졌다. 메타의 내부 코딩 어시스턴트는 이미 앤트로픽과 오픈AI 모델을 활용하고 있는 것으로 전해졌다. 업계에선 창업자인 저커버그 CEO의 독단적인 리더십과 메타의 조직 문화가 기술력 향상의 걸림돌이 되고 있다고 분석했다. 또 제품 중심 전략을 가진 오픈AI와 달리 본업인 소셜 네트워크와 광고 사업을 활성화시키기 위해 AI를 도구로 활용하려는 메타의 전략이 시장의 설득력을 얻지 못하고 있다는 평가도 내놨다. 더불어 '라마' 등을 오픈소스로 공개해 연구자, 스타트업 커뮤니티에서의 영향력은 크지만 기업·소비자간거래(B2C) 서비스화에 소극적이어서 브랜드 파워와 수익화가 약하다는 점도 존재감을 키우지 못한 요인으로 봤다. 업계 관계자는 "오픈AI는 'AI 혁신 기업'이라는 명확한 브랜드를 시장에 각인시켰지만, 메타는 메타버스 사업 실패 이미지가 강한데다 대중 친화적 제품이 없고 브랜드 신뢰가 약하다는 점이 AI 시장에서의 매력을 떨어뜨렸다"며 "오픈AI, 앤트로픽 등에 비해 전략적 파트너십이 열악하다는 점도 시장 지배력을 키우지 못하는 요인"이라고 짚었다. 일각에선 메타가 AI 시장에서 경쟁력을 갖기 위해 좀 더 세밀한 전략이 필요하다고 지적했다. 특히 '라마'를 단순한 오픈소스가 아닌 ▲라마 앱스토어 모델 도입 ▲메타 AI SDK(소프트웨어 개발 키트) 제공 등을 통해 생태계 플랫폼으로 확장시키는 방안을 고려해 볼 것을 조언했다. 업계 관계자는 "현재 오픈AI '챗GPT'를 비롯해 앤트로픽 '클로드', 구글 '제미나이' 등이 범용 LLM 및 개발자 생태계를 이미 선점하고 있어 메타가 승부를 걸어야 할 곳은 이 분야가 아니다"며 "메타는 세계 최대 소셜 네트워크를 활용한 AI 플랫폼으로의 차별화 전략과 함께 확장현실(XR)·광고·크리에이터 툴까지 AI로 재구성해 나갈 필요가 있다"고 말했다.

2025.09.02 17:15장유미

전 세계 개발자 10명 중 8명 "업무에 AI 도구 활용"…코딩 시장서 '클로드·파이썬' 대세

전 세계 개발자 절반 이상이 이미 업무에 인공지능(AI) 도구를 활용하고 있는 것으로 나타났다. AI 활용 능력을 기업들이 요구하면서 개발자의 필수 역량으로도 점차 자리 잡는 모양새다. 21일 사이트 운영업체 스택 익스체인지가 공개한 '스택 오퍼플로우 디벨로퍼 서베이 2025'에 따르면 개발자 10명 중 8명은 이미 업무에 AI 도구를 활용 중인 상태다. 특히 AI 코드 어시스턴트를 사용하는 기업 소프트웨어 엔지니어는 2023년 초 10% 미만이었으나, 2028년에는 75%까지 증가할 것으로 전망됐다. 미국 벤처 캐피탈(VC)인 멘로 벤처스가 공개한 '2025 미드-이어 거대언어모델 시장 업데이트(2025 Mid-Year LLM Market Update)'에선 개발자들이 앤트로픽의 '클로드'를 코딩에 가장 많이 활용하고 있는 것으로 드러났다. 클로드는 전체 42%로, 오픈AI 챗GPT를 제치고 코딩 분야 1위로 부상했다. 2위는 21%를 차지한 '챗GPT', 3위는 구글 '제미나이(16%)' 순으로 나타났다. LLM에 가장 많이 활용되는 개발언어는 '파이톤(Python)'으로 조사됐다. 학습데이터의 절대 다수가 '파이톤' 기반으로, 자연어와 유사한 문법, 풍부한 라이브러리 생태계와 실행 난이도 등의 이유로 LLM에서 개발자들이 가장 많이 활용하고 있는 것으로 나타났다. 개발 업무 활용분야에서는 ▲설계 단계에서 아키텍처 설계 아이디어 제안 및 기능 정의서 작성 ▲코딩 단계에서 기초코딩 작성, 로직 개선, 다른 개발언어로 코드 이식 ▲디버깅 및 테스트 단계에서 에러메세지 해석, 단위 테스트 코드 생성, 코드 리뷰 보조 ▲문서화 및 커뮤니케이션 단계에서 주석 자동 생성, 리드미(README.md) 자동 작성, 코드요약본 생성 등 각 단계별로 작업을 효율화, 자동화하고 있는 것으로 드러났다. 개발자 AI 활용 역량 평가 솔루션 '아이사(AISA)'를 출시한 구름은 이번 보고서를 분석하며 "LLM 활용에 있어 단순히 '코드 생성'을 주문하기보다는 '단계별 요청, 설명 요청, 비교 요청, 예외 처리 추가 요청' 등 맥락을 부여하는 질문이 더 좋은 결과를 얻을 수 있었다"며 "다만 AI 도구의 사용률은 급격히 증가했지만 신뢰도와 활용 역량 측면에서는 여전히 큰 격차를 보였다"고 밝혔다. 실제 AI 출력 정확성에 대한 개발자들의 신뢰도는 33%에 그쳤다. 46%는 AI 결과에 대해 의문을 제기한다고 응답했다. AI 도구의 신뢰성 부족으로 인해 디버깅 시간이 증가하는 등 경험 많은 개발자가 오히려 작업 시간이 19% 증가하기도 했다. 구름은 "최근 다양한 산업 분야에서 전사적인 AI 도입이 늘어나고 있다"며 "그러면서 객관적인 AI 활용 역량 평가에 대한 수요도 동반해 증가하고 있다"고 밝혔다.

2025.08.21 16:06장유미

저커버그의 'AGI 집착'…메타, 내부 불만 커지는 조직 재편

메타가 인공지능(AI) 경쟁 심화에 대응하기 위해 6개월 만에 네 번째 AI 조직개편에 나섰다. 주요 연구·개발 부서를 재편해 효율성을 높이고 차세대 AI 모델 및 인프라 투자에 속도를 내겠다는 전략으로 풀이된다. 다만 이 과정에서 발생하는 혼선이 내부 불안정성과 피로를 키워 직원들의 불만으로 이어질 수 있다는 우려도 나온다. 18일 더인포메이션 등 외신에 따르면 메타가 지난해 신설한 슈퍼인텔리전스 랩을 네 개의 별도 팀으로 분할할 예정이다. 더인포메이션이 인용한 세 명의 관계자에 따르면 분할되는 4개 팀은 아직 명칭이 정해지지 않은 가칭인 TBD 랩을 비롯해 제품 팀, 인프라 팀, 그리고 기초 AI 연구소(FAIR)다. 제품 팀은 메타 AI 어시스턴트 같은 실제 소비자가 사용하는 서비스를 맡는다. 인프라 팀은 대규모 데이터센터와 컴퓨팅 자원을 효율적으로 관리하는 역할을 한다. FAIR는 단기 성과보다는 차세대 AI 알고리즘과 기초 과학적 탐구와 같은 장기적 연구에 집중한다. TBD 랩은 아직 구체적 역할이 정해지지 않았지만 메타의 새로운 실험적 프로젝트를 담당할 가능성이 크다. AI 연구, 제품화, 인프라, 기초 과학을 전문화해 역할을 명확히 하고 속도를 높이려는 시도로 풀이된다. 이번 변화는 불과 6개월 동안 네 차례나 이어진 조직 재편의 연장선에 있다. 그만큼 메타가 AI 경쟁에서 불확실성과 조급함을 동시에 안고 있다는 방증이기도 하다. 특히 내부적으로는 오픈소스로 공개된 라마4 모델에 대한 시장 반응이 기대만큼 뜨겁지 않았던 점, 주요 연구 인력의 이탈, AI 제품 상용화 과정에서의 시행착오 등이 복합적으로 작용한 것으로 분석된다. 메타의 창업자이자 CEO인 마크 저커버그는 인공 일반 지능(AGI) 개발을 장기 목표로 내걸고 있다. 이번 조직 재편은 AGI 현실화를 위한 선택과 집중 과정으로 풀이된다. 조직 재편과 동시에 메타는 인프라 투자에도 박차를 가하고 있다. 루이지애나주 농촌 지역에 약 290억 달러(약 39조원) 규모의 데이터센터 건설 프로젝트를 추진 중이다. 지난 7월에는 "향후 수백억 달러에 달하는 AI 데이터센터 건설에 나서겠다"고 공식 발표했다. 이 가운데는 '프로메테우스(Prometheus)'와 '하이페리온(Hyperion)'이라는 이름의 초대형 슈퍼클러스터가 포함돼 있으며 규모는 맨해튼 일부와 맞먹을 정도이며 내년 가동이 목표다. 대규모 투자는 곧 막대한 비용을 의미한다. 메타는 AI 인프라 확충으로 인해 연간 자본 지출 전망치를 660억에서 720억 달러(약 90조~99조원)로 상향 조정했다. 내년에는 인프라 투자와 인건비 부담으로 인해 비용 증가율이 올해보다 높아질 것이란 전망도 나왔다. 이를 감당하기 위해 메타는 일부 데이터센터 자산을 약 20억 달러 규모로 매각하고, 외부 파트너와 공동 개발하는 방식을 병행하고 있다. 메타 최고재무책임자(CFO) 수잔 리는 "일부 프로젝트에선 금융 파트너의 참여가 위험 관리와 유연성 측면에서 유리하다"고 설명했다. 관련 업계에서는 메타의 이번 행보를 구글, 마이크로소프트, 오픈AI 등과의 경쟁 구도 속에서 해석하고 있다. 마이크로소프트는 오픈AI와 협력하며 기업용 AI 솔루션 시장을 빠르게 장악하고 있고 구글은 자체 개발 모델을 자사 서비스 전반에 통합하며 AI 퍼스트 전략을 강화하고 있다. 메타는 소셜미디어 플랫폼에 AI를 접목하고 대규모 오픈소스 모델을 공개해 AI 생태계를 주도하려는 접근을 하고 있다. 하지만 오픈소스 전략만으로는 직접적인 수익 창출에 한계가 있다는 지적도 나온다. 따라서 이번 조직 재편은 연구개발·제품화·인프라 투자를 유기적으로 연결해 실질적 성과를 내는 구조를 마련하는 데 초점이 맞춰져 있다는 분석이다. 일부 업계 전문가들은 이번 개편이 속도와 효율을 동시에 추구하기 위한 불가피한 조정이라고 평가한다. 반면 잦은 개편과 최근 대규모 비용을 투입한 외부 인재 영입이 내부 불안정성과 피로를 유발하며 불만을 키우고 있다는 지적도 제기된다. 실제로 메타 내부 연구자들 사이에서는 "연구 인력 대우가 형편없다"는 불만이 나오기도 했다. 전문가들은 잦은 조직 재편이 전략적 선택인 동시에 내부 갈등의 불씨로 작용할 수 있다고 지적한다.

2025.08.18 14:50남혁우

KT "AI 전략...글로벌 협력·자체 개발·내부 혁신 삼각편대"

KT가 글로벌 협력, 자체 AI 개발을 병행하는 멀티 모델 전략과 네트워크‧미디어 서비스 혁신을 중심으로 한 3대 AI 사업 방향성을 제시했다. 대표적으로 마이크로소프트(MS)와의 협력을 통해 AI 역량을 보완하고, 자체 개발과 오픈소스 모델을 통해 차별화된 AI 서비스를 선보이겠다는 구상이다. 장민 KT 최고재무책임자(CFO)는 11일 진행한 2분기 실적 컨퍼런스콜에서 “MS와의 파트너십, 팔란티어와의 독점 솔루션 공급 계약을 통해 부족한 역량을 채우고, 이를 기반으로 시큐어 퍼블릭 클라우드나 한국형 챗GPT 같은 서비스를 제공할 것”이라며 첫 번째 전략을 소개했다. 두 번째 전략은 멀티모델 전략이다. 장 CFO는 “MS와의 협력 모델뿐 아니라 자체 개발한 '믿음:2.0'을 지속 개선해 이용자에게 다가갈 것”이라며, 라마(LLaMA) 같은 오픈소스 모델도 활용할 계획을 밝혔다. 마지막 세 번째 전략은 AI를 KT의 네트워크 관리나 미디어 서비스에 접목하는 것이다. 지니TV 셋톱박스에 MS 애저 오픈서비스 기반 AI 에이전트를 적용하거나, 기지국 운영 효율화를 위한 AI 역량을 결합하는 혁신이 그 예다. KT는 이번 3대 전략을 통해 AI를 기업 성장의 핵심 축으로 삼고, 이용자 서비스부터 내부 운영까지 전방위적 혁신을 추진한다는 방침이다.

2025.08.11 16:12진성우

개방형 AI 모델도 급이 있다…'오픈소스'와 '오픈웨이트' 차이는?

인공지능(AI) 기업들이 잇따라 개방형 AI 모델을 공개하는 가운데 '오픈소스'와 '오픈웨이트' 개념 구분이 모호해지면서 혼란이 커질 수 있다는 우려가 나왔다. 6일 IT 업계에 따르면 공개 범위나 활용 가능성에서 오픈소스와 오픈웨이트 모델은 큰 차이를 보임에도 개발사 사이에선 이를 모두 오픈소스로 홍보하고 있다는 지적이 나오고 있다. 우선 오픈소스는 모델의 구조를 비롯한 학습 코드, 데이터셋 정보, 파라미터 등 전 요소를 투명하게 공개하는 방식이다. 사용자는 모델 작동 원리를 분석하고 수정할 수 있다. 모델을 아예 처음부터 다시 학습시킬 수도 있다. 대표적인 오픈소스 모델은 프랑스 미스트랄AI의 '미스트랄', GPT-3의 오픈소스 버전 'GPT-J' 등이다. 오픈웨이트는 말 그대로 학습 가중치만 외부에 제공하는 식이다. 제한적 공개 모델이라고 부르기도 한다. 공개 범위에 모델의 설계 코드나 학습 데이터는 포함되지 않는다. 사용자는 모델 파인튜닝이나 추론은 가능하지만 구조 변경이나 재학습을 할 수 없다. 메타의 '라마' 시리즈, 중국 제트에이아이(Z.ai)의 'GLM-4.5'는 모델이 대표적이다. 개방형 모델을 모두 오픈소스로 명칭할 경우 심각한 문제가 발생할 수 있다는 지적이 나오고 있다. 사용자가 오픈웨이트를 오픈소스로 오인하고 모델 구조 변경이나 재학습을 시도할 수 있어서다. 이럴 경우 코드와 데이터가 없어 프로젝트 전체가 중단될 수 있다. 파인튜닝만 가능한 오픈웨이트 모델 기반으로 개발을 기획하는 것은 일정·예산 낭비로 이어질 수 있다. 또 오픈웨이트 모델 중 다수는 상업적 이용을 제한하거나 별도 계약을 요구하는 라이선스를 포함한다. 이를 인지하지 못하고 상업 서비스에 통합할 경우, 라이선스 위반 소송이나 손해배상 문제가 발생할 수 있다. AI 모델의 공공성, 책임성 평가에 있어서도 두 모델 차이는 크다. 업계 관계자는 "보통 오픈소스 모델은 학습 데이터와 알고리즘을 검토할 수 있어 편향성과 투명성 문제에 대한 검증이 가능하지만, 오픈웨이트 모델은 내부 구조가 불분명해 윤리적 책임소재를 따지기 어렵고, AI 거버넌스 기준을 충족하지 못할 수 있다"고 지적했다. 또 다른 업계 관계자는 "오픈소스 모델로 기대하고 프로젝트에 참여했지만, 실상 오픈웨이트였던 경우가 있다"며 "이를 커뮤니티 사이에선 '가짜 오픈소스'라고 부르기도 한다"고 설명했다. 이어 "이는 모델을 만든 기업 신뢰도 하락까지 이어질 수 있을 것"이라고 덧붙였다. 그러면서 "오픈소스와 오픈웨이트는 공개 범위와 활용 가능성, 법적 조건이 전혀 다르다"며 "개발사는 학계와 산업계가 이를 처음부터 정확히 인지할 수 있도록 책임감 있는 안내를 진행해야 할 것"이라고 강조했다.

2025.08.07 09:28김미정

[SW키트] 개방형 AI 전략 바꾸는 메타...'라마' 경쟁력 흔들리나

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 메타가 개방형 인공지능(AI) 사업 변화 의지를 보인 가운데 글로벌 오픈소스 생태계가 바뀔 것이란 전망이 나왔다. 특히 올해 중국 기업이 개방형 AI 모델을 잇따라 출시하면서 중국이 해당 생태계를 휩쓸 것이란 예측까지 등장하고 있다. 4일 업계에 따르면 메타는 지난 달 30일 실적 발표를 통해 초지능 구현을 위한 기술적·인프라에 대규모 투자를 진행하겠다고 발표했다. 다만 초지능이 기존 AI와는 다른 차원의 위험을 유발할 수 있다는 점에서 모델 개방 전략을 그대로 유지하기는 어려울 것이라고 밝혔다. 이날 마크 저커버그 메타 최고경영자(CEO)는 "초지능은 새로운 형태의 안전 문제를 불러올 수 있다"며 "우리는 이런 위험을 철저히 막기 위해 향후 모델을 오픈소스로 공개할지 고민할 것"이라며 개방형 전략에 대해 신중한 입장을 내놨다. 그동안 메타는 라마 모델을 앞세워 개방형 AI를 핵심 전략으로 삼았다. 2023년부터 라마를 '오픈웨이트' 형식으로 공개해 왔다. 오픈웨이트는 단순 오픈소스와는 다른 개념이다. 오픈소스는 모델의 구조와 학습 알고리즘, 가중치 등 모든 요소를 자유롭게 수정·재배포할 수 있도록 완전히 공개하는 형태다. 오픈웨이트는 모델 가중치만을 조건부로 제공해 사용에 일정 제약을 두는 식이다. 비록 라마가 오픈소스 AI 조건을 완전히 충족하진 않지만, 모든 정보를 공개하지 않는 상용 모델보다 산업계와 학계에 득을 준다는 평가를 받았다. 사용자가 값비싼 비용을 지불하지 않아도 성능 높은 모델을 무료로 활용할 수 있어서다. 메타는 오픈AI를 비롯한 폐쇄형 모델에 맞설 수 있는 수준의 공개 모델을 통해 AI 생태계 범위를 넓혔다. 그러나 초지능 개발에 시동 걸면서 기존 개방형 AI 사업 전략 재검토에 나선 것이다. 업계에선 메타가 개방형 전략을 폐쇄하거나 줄일 경우 라마 모델 영향력이 대폭 축소될 수 있다는 우려가 나오고 있다. 그동안 전 세계 기업과 연구소가 라마 기반으로 AI 모델을 개발한 만큼 글로벌 오픈소스 생태계에 큰 타격을 줄 수 있다는 전망이다. 중국산 개방 모델 물밀듯 등장…"시장 휩쓸수도" 업계에선 향후 오픈소스 생태계 주도권이 중국으로 아예 넘어갈 수 있다는 예측도 나오고 있다. 실제 올해 중국 AI 기업들이 고성능 모델을 오픈소스 또는 오픈웨이트 형식으로 연달아 공개했다. 대표적으로 지푸는 'GLM-4.5'를, 딥시크는 'R1' 모델을, 알리바바는 큐원3'와 코딩 특화 모델인 '큐원3-코더'까지 오픈소스로 내놓으면서 개방형 AI 전략을 강화하고 있다. 현재 해당 모델은 모두 고성능 추론 능력과 대규모 문맥 처리, 에이전틱 AI 기능 등을 갖췄다. 실제 '큐원3-코더'는 주요 성능 평가에서 오픈AI와 구글 모델보다 높은 점수를 받은 것으로 나타났다. 일각에선 중국의 개방형 모델이 메타의 라마 시리즈와 경쟁 가능한 수준이란 평가도 나오고 있다. 이에 국내 업계 관계자는 "다수 중국 모델은 상업적 사용까지 허용하는 '아파치 2.0' 기반 라이선스를 채택한다"며 "모델 접근성과 활용 가능성이 라마보다 더 높다는 점이 특징"이라고 설명했다. 또 다른 업계 관계자는 "특히 중국 기업은 자국 내 그래픽처리장치(GPU) 자원에 최적화된 모델을 공개할뿐 아니라 글로벌 개발자 커뮤니티까지 적극 포섭하고 있는 추세"라며 "향후 미국보다 오픈소스 생태계에 실질적 영향력을 더 확대할 수 있는 위치"라고 평가했다.

2025.08.04 17:16김미정

업스테이지, 실력 또 입증…메타·딥시크와 글로벌 AI 성능 평가서 어깨 나란히

최근 차세대 거대언어모델(LLM) '솔라 프로 2'로 일론 머스크의 견제를 받았던 업스테이지가 또 한 번 더 글로벌 시장에서 경쟁력을 입증하며 주목 받고 있다. 정부가 추진하는 '독자 AI 파운데이션 모델 개발 프로젝트'에 컨소시엄 주관사로 참여한 업스테이지가 이번에 기술력을 제대로 과시했다는 평가다. 25일 업계에 따르면 업스테이지의 '솔라 프로 2'는 지난 24일 크라우드 소싱 기반인 새로운 리더보드 '유프(Yupp)'에서 중국 딥시크 'v3', 메타 '라마 3 70B' 모델과 나란히 공동 18위에 올랐다. '유프'는 실제 사용자들이 써본 후 실시간으로 AI 모델을 평가하는 곳으로, 지난 해 6월 코인베이스와 구글, X 등을 거친 출신들이 설립했다. 구글 최고과학자인 제프 딘과 트위터 공동창업자 비즈 스톤, 핀터레스트 공동창업자 에반 샤프, 퍼플렉시티 최고경영자(CEO) 아라빈드 스리니바스 등은 이곳에 대규모 자금을 투자했다. 유프는 챗GPT, 클로드, 제미나이, 그록, 딥시크, 라마 등 주요 AI 모델들이 내놓는 답변을 비교할 수 있는 기능을 제공한다. 사용자는 각 모델들 응답을 평가하고 피드백을 준다. 이 과정에서 베이스와 솔라나 기반 스테이블 코인뿐 아니라 법정 화폐로 리워드 크레딧을 획득할 수 있다. 이에 업계에선 사용자들의 실사용 트렌드를 파악할 수 있다는 점에서 유프의 AI 모델 순위를 주목하고 있다. 업스테이지는 네이버에서 AI 개발을 총괄했던 김성훈 대표가 2020년 창업한 스타트업으로, 2022년 국내 기업 최초로 캐글에서 10회 금메달을 수상하며 기술력을 인정받았다. 김 대표는 이날 자신의 소셜미디어(SNS)를 통해 '솔라 프로 2'가 유프 순위 20위 안에 들었다는 사실을 직접 알리며 자축하기도 했다. 김 대표는 "'솔라 프로 2'가 LLM 아레나에서 프론티어 모델 중 상위 18위 안에 들며 최고의 사용자 만족도로 인정받았다는 소식을 전하게 돼 기쁘다"며 "이 순위는 직접적인 사용자 피드백과 투표를 반영하며 LLM에 대한 가장 객관적인 평가 방법으로 널리 알려져 있다"고 설명했다. 업스테이지는 최근 독립 LLM 성능 분석기관 '아티피셜 애널리시스'가 발표한 '지능 지표(Intelligence Index)'에서도 국내 유일의 프런티어 모델로 선정돼 화제가 됐다. '솔라 프로 2'는 여기서 58점을 기록하며 ▲미스트랄 스몰(55) ▲GPT-4.1(53) ▲라마 4 매버릭(51) ▲GPT-4o(41) 등 빅테크 LLM을 제치고 더 높은 성능을 기록했다. 또 ▲딥시크 V3(53) ▲문샷 AI 키미 K2(57.59) 등 중국 모델도 모두 추월하며 상위권에 안착했다. 주요 프런티어 모델 대부분은 1천억~2천억 매개변수(파라미터)를 탑재한 대형 모델이다. 가장 높은 성능을 기록한 xAI의 '그록-4'는 1조7천억(1.7T)에 달한다. 반면 '솔라 프로 2'는 310억 매개변수로 이들과 어깨를 나란히 했다는 점에서 업스테이지의 소형 언어모델 기술 경쟁력과 효율성을 입증했다는 평가를 받는다. 특히 '솔라 프로 2'는 현재 기업 환경에서 가장 널리 쓰이는 범용 모델 GPT-4.1을 넘어서면서 고난도 추론 능력에서 우위를 차지했다. 비용 대비 성능 평가에서도 '클로드 4 소넷', '마지스트랄 스몰' 등 주요 모델보다 효율적인 것으로 평가됐다. xAI의 '그록-4'는 성능 지표에선 1위였지만 '구동비용 대비 성능(Intelligence vs. Cost to Run)' 지표에서는 '가장 매력적인 구간(Most Attractive quadrant)'에 포함되지 못하면서 상대적으로 '솔라 프로 2'에 비해 부족하다는 평가를 받았다. 이에 xAI를 설립한 일론 머스크는 '아티피셜 애널리시스'가 업스테이지 모델을 언급한 게시글을 공유하며 견제하는 모습을 보였다. 머스크는 "xAI의 '그록'이 여전히 1위"라며 "'그록'은 빠르게 개선하는 중"이라고 강조했다. 그러자 김성훈 업스테이지 대표도 "xAI가 1등인 것을 축하한다. 하지만 오래가진 않을 것"이라며 "솔라 LLM이 아주 빠르게 개선해서 따라잡겠다"는 답글을 남겼다. 이같은 분위기 속에 업스테이지는 기술력이 충분히 검증됐다고 보고 향후 '독자 AI 파운데이션 모델' 사업자로 선정되면 '프롬 스크래치' 방식으로 '전 국민 AI' 콘셉트에 맞춰 새로운 모델 개발에 나설 것으로 알려졌다. 또 업스테이지는 향후 후속 모델로 1천억 파라미터 규모의 차세대 LLM을 개발할 계획으로, 향후 프런티어 인덱스 최상위권 진입도 기대하고 있다. 이에 대해 김 대표는 "(유프 순위에) 곧 상위 10위 안에 들기 위해 '솔라 프로 3'를 준비하고 있다"며 "앞으로도 독자적인 기술력으로 자체 모델을 더욱 고도화해 대한민국이 AI 3강을 넘어 글로벌 시장에서 기술 주도권을 차지할 수 있도록 기여하겠다"고 밝혔다.

2025.07.25 16:20장유미

"AI 추론 최적"…레드햇, 메타와 오픈소스 AI 협력

레드햇이 엔터프라이즈용 생성형 인공지능(AI) 개방성과 확장성을 높이기 위해 메타와 손잡았다. 레드햇은 메타의 라마 스택과 고성능 추론 엔진 가상거대언어모델(vLLM) 중심으로 생성형 AI 통합 프레임워크를 구현하기 위한 공동 프로젝트를 메타와 시작했다고 10일 밝혔다. 이를 통해 다양한 하드웨어와 클라우드 환경 전반에서 일관된 AI 애플리케이션 구축 기반이 마련될 전망이다. 이번 협력은 AI 가속기와 클라우드, 하드웨어 환경에 최적화된 추론 기능을 구현하는 데 초점 맞췄다. 특히 기업용 생성형 AI의 상용화를 위해서는 표준화된 API 계층과 추론 기술의 상호운용성이 중요하다는 점에서, 이번 협력이 실질적인 기술적 해법으로 주목받고 있다. 레드햇은 라마 스택과 AI 플랫폼을 통합해 에이전틱 AI 프레임워크 전반의 지원 범위를 넓힐 방침이다. 이를 통해 개발자들은 다양한 생성형 AI 애플리케이션을 보다 유연하게 설계하고 배포할 수 있는 환경을 확보할 계획이다. 마이크 페리스 레드햇 수석 부사장 겸 최고 전략 책임자는 "이번 협력은 라마 스택과 vLLM을 통해 어디서든 더 빠르고 비용 효율적인 생성형 AI 구현이 가능하도록 도울 것"이라고 강조했다. 애시 자베리 메타 AI·리얼리티 랩스 파트너십 부문 부사장은 "라마 스택을 산업 전반의 생성형 AI 애플리케이션 표준으로 자리잡게 하는 데 있어 이번 협력은 큰 의미가 있다"며 "우리는 AI 기술의 잠재력을 현실화하는 확장 가능한 솔루션 개발에 공동 노력하고 있다"고 말했다.

2025.06.10 11:37김미정

"이러다 지겠다"…AI팀 둘로 쪼갠 메타, 구글·오픈AI 따라잡기 '총력'

메타가 자사 인공지능(AI) 조직을 두 개의 독립 부문으로 나누는 개편을 단행했다. 경쟁사와의 기술 격차를 좁히고 시장 대응 속도를 높이기 위한 전략이다. 28일 테크크런치에 따르면 메타는 기존 AI 부서를 'AI 제품팀'과 '범용 인공지능(AGI) 파운데이션 유닛'으로 재편했다. 이번 개편에서 인력 감축은 없는 것으로 알려졌다. 'AI 제품팀'은 페이스북, 인스타그램, 왓츠앱 등 메타의 주요 플랫폼에서 제공되는 AI 기능 전반을 맡는다. 최근 공개된 메타의 독립형 AI 앱도 이 부문에서 주도한다. 반대로 'AGI 파운데이션 유닛'은 '라마(LLAMA)' 모델 고도화와 같은 중장기 핵심 기술 개발에 집중한다. 메타는 조직개편 외에도 최근 '라마 포 스타트업스' 프로그램을 시작했다. 생성형 AI 기반 서비스를 개발하는 초기 스타트업을 대상으로 자사 모델 활용을 유도하는 방식이다. 지난 4월 개최된 개발자 행사 '라마콘' 역시 오픈AI와 대등한 기술력을 과시하는 자리로 활용됐다. 제품 데모와 기술 세션은 대부분 라마 모델과 이를 활용한 다양한 사례로 구성됐다. 테크크런치는 "메타가 보다 신속한 제품 개발을 위해 AI 팀을 분할한 것으로 보인다"며 "오픈AI, 구글, 앤트로픽 등과의 경쟁에서 지지 않기 위해 최선을 다하는 중"이라고 평가했다.

2025.05.28 09:26조이환

"개발자 잡아야 살아남는다"…메타, 라마콘서 'AI 총력전' 선언

메타가 인공지능(AI) 개발자들을 위해 대규모 행사를 열어 생태계 확장에 나섰다. AI 앱, 모델 응용 프로그램 인터페이스(API), 개인 정보 보호형 연산 기능을 잇달아 내놓으며 폐쇄형 경쟁자보다 먼저 시장 선점을 시도하겠다는 의도로 해석된다. 29일 테크크런치 등 외신에 따르면 메타는 지난 28일 미국 멘로파크 본사에서 '라마콘' 개발자 컨퍼런스를 열고 라마 API와 독립형 AI 앱, 왓츠앱 전용 기능 등을 발표했다. 참석자들은 이날 마크 저커버그 메타 최고경영자(CEO)와 사티아 나델라 마이크로소프트 CEO 간의 대담, 기술 세션 등을 통해 최근 '라마4' 발표 이후 메타의 로드맵에 대한 구상을 확인했다. 가장 관심을 모은 발표는 '라마 API'였다. 이 도구를 사용하면 개발자가 데이터를 직접 만들어 모델을 학습시키고 결과를 평가하는 전 과정을 한 곳에서 처리할 수 있다. 학습된 모델은 메타의 서버에 종속되지 않아 다른 클라우드 환경으로 자유롭게 옮길 수 있다. 또 세레브라스(Cerebras)나 그록(Groq) 같은 파트너 서버를 API 옵션으로 제공해 실시간 응답이 중요한 대화형 AI 서비스도 손쉽게 구현할 수 있도록 했다. 추가 공개된 독립형 '메타 AI 앱'은 개인화 기능을 강화한 것이 특징이다. 페이스북이나 인스타그램에서 생성된 소셜 데이터, 사용자의 콘텐츠 반응 기록 등을 활용해 응답의 정확도를 높이도록 설계됐다. 음성 채팅과 프롬프트 공유용 디스커버 피드도 포함돼 '챗GPT'와의 정면 대결을 염두에 둔 구성이란 분석이 나온다. 메타는 자사 소셜미디어인 '왓츠앱'에도 생성형 AI를 적용하기 위한 별도 기술을 공개했다. '프라이빗 프로세싱'으로 명명된 이 기능은 메시지를 요약하거나 정리하는 과정에서도 종단간 암호화 구조를 그대로 유지하도록 설계됐다. 이는 사용자가 직접 설정을 통해 켜야 작동하며 암호화된 채팅 내용을 외부 서버에 노출하지 않고 AI 기능을 제공하는 방식이다. AI 보조 기능과 개인정보 보호를 동시에 충족시킨 첫 사례로, 유럽연합(EU)이나 인도처럼 규제가 강한 시장에서 메타 AI의 확장 가능성을 높였다는 평가가 나온다. 모델 로드맵에서는 경량형 라마4인 '리틀 라마', 미출시 상태인 대형 모델 '비히모스', '라마4' 모델 마이너 업그레이드(dot release) 등이 언급됐다. 특히 '리틀 라마'는 모바일 기반 저전력 응용에 활용될 가능성이 높다. '비히모스'는 아직 비공개 상태이나 메타는 이를 세계 최고 성능의 베이스 모델로 표현했다. 현재 메타는 최근 '라마4' 모델 출시 후 성능 논란에 휘말린 상태다. 대화 최적화 버전인 '매버릭'은 벤치마크 '언어모델 아레나(LM 아레나)'에서 좋은 점수를 받았지만 실제 배포된 모델은 해당 성능을 내지 못했다. 추론 능력을 갖춘 모델이 없다는 점도 비판을 받았다. 출시 직후 한 테크 비평가는 "모든 경쟁자가 추론 모델을 내놓고 있는 상황에서 메타는 무리하게 출시를 서둘렀다"고 말한 바 있다. 마크 저커버그 메타 CEO는 라마콘에서 "우리 모두가 AI 변화가 50년이나 걸리지는 않을 거라는 전제로 현재 수준의 투자를 지속하고 있다"고 강조했다.

2025.04.30 10:38조이환

中 '딥시크'에 자극 받은 메타, 첫 AI 개발자 회의로 주도권 잡기 본격화

'페이스북' 모회사 메타플랫폼이 첫 인공지능(AI) 개발자 회의를 열고 최신 AI 모델인 '라마4'를 앞세워 시장 공략에 본격 나선다. 29일 블룸버그통신, CNBC, 엔가젯 등 주요 외신에 따르면 메타플랫폼은 이날 미국 동부시간 기준 오후 1시(현지시간) 온라인을 통해 AI 개발자 회의인 '라마 컨퍼런스'를 개최한다. '라마(Llama)'는 메타의 오픈소스 거대언어모델(LLM)로, 메타는 이달 초 최신 버전인 '라마4'를 공개한 바 있다. '메타 포 디벨로퍼즈(Meta for Developers)' 공식 페이스북 페이지를 통해 생중계되는 이번 행사에선 향후 메타의 AI 전략이 공개될 예정이다. 메타는 그동안 매년 9월 신제품 발표 행사인 '메타 커넥트(connect)' 컨퍼런스를 통해 '라마' 모델을 소개해왔으나, 올해부터는 이를 분리해 독립적인 행사로 개최한다. 메타의 오픈소스AI 개발 현황을 공유하고 개발자들이 이를 활용해 혁신적인 앱과 제품을 만들 수 있도록 지원하기 위해서다. 메타는 AI 시장에서 오픈소스 전략을 고수하고 있는 상태로, 현재 골드만삭스와 노무라홀딩스, AT&T, 도어대시, 액센추어 등 다양한 글로벌 기업들이 '라마' 모델을 활용 중이다. 또 엔비디아와 데이터브릭스, 그록, 델, 스노우플레이크 등 최소 25개 파트너사가 '라마' 모델을 호스팅하고 있다. 이번 회의에선 크리스 콕스 메타 최고제품책임자를 비롯해 마노하르 팔루리 AI 부사장, 안젤라 팬 연구 과학자 등이 기조연설에 나선다. 이들은 메타의 오픈소스 AI 커뮤니티 최신 동향과 '라마' 모델 업데이트, 메타의 AI 전략 등을 발표한다. 이후 마크 저커버그 메타 최고경영자(CEO)는 데이터 분석기업 데이터브릭스 CEO 알리 고드시와 'AI 기반 애플리케이션 구축'을 주제로 대담에 나선다. 또 사티아 나델라 마이크로소프트(MS) CEO와 'AI의 최신 트렌드'에 관해서도 논의한다. 업계 관계자는 "데이터브릭스, MS 측과의 대화가 모두 공식적인 신제품 발표를 위한 세션은 아닌 것으로 보인다"면서도 "다만 MS와 메타가 이미 여러 차례 협업한 전례가 있어 깜짝 발표 가능성도 배제할 수 없다"고 봤다. 업계에선 메타가 AI 개발자 회의를 독립적으로 개최하게 된 배경으로 중국 AI 스타트업인 '딥시크'가 자극이 됐을 것으로 봤다. '딥시크'가 메타의 '라마' 모델과 경쟁하거나 이를 넘어설 수 있는 오픈소스 AI 모델을 출시하며 올 초부터 주목 받기 시작해서다. 이에 메타는 '딥시크'가 모델 운영 및 배포 비용을 대폭 낮춘 방식을 분석하기 위해 긴급 태스크포스(TF)도 구성한 것으로 알려졌다. 또 메타는 AI에 대한 대규모 투자를 통해 시장의 선두 주자로 올라서겠다는 계획도 세웠다. 이를 위해 올해는 AI 관련 프로젝트에만 최대 800억 달러(약 110조원) 가량을 투자할 예정이다. 이 자금은 AI 전문 인재 채용과 신형 AI 데이터센터 건설, 라마 시리즈 강화 등에 쓰일 것으로 알려졌다. 더불어 메타는 라마 기반의 AI 챗봇 '메타 AI'를 페이스북과 인스타그램, 왓츠앱 등 자사가 보유한 소셜미디어(SNS)에 접목하며 이용자 수를 늘리고 있다. 또 조만간 별도의 메타 AI 앱도 출시해 사용자 확장을 꾀할 계획이다. '메타 AI'의 월간 활성 사용자 수는 지난해 9월 기준 5억 명에 육박했다. 저커버그 CEO도 AI 시장에서 메타의 주도권을 잡기 위해 적극 나설 것임을 시사했다. 앞서 지난 1월에는 "2025년은 고도로 지능적이고 개인화된 AI 어시스턴트가 10억 명 이상에게 도달하는 해가 될 것"이라며 "메타 AI가 그 선두 주자가 될 것"이라고 말한 바 있다. 저커버그 CEO는 '라마4' 외에 올해 추론 능력과 멀티모달 기능을 갖춘 다양한 신형 AI 모델 출시도 예고했다. 또 '라마' 모델이 향후 자율적으로 작업을 수행할 수 있는 '에이전틱 AI' 기능도 지원할 것임을 예고했다. 다만 일각에선 메타가 AI 학습 과정에서 저작권이 있는 서적 자료를 무단 사용했다는 소송과 EU 일부 국가의 개인정보 보호 규제로 인한 모델 출시 연기, 취소 등 여러 도전에 직면하고 있다고 지적했다. 또 도널드 트럼프 행정부의 관세 여파도 우려되는 부분이라고 봤다. 업계 관계자는 "이 같은 상황 속에 메타가 '라마4'와 '라마 컨퍼런스'를 통해 시장을 이끌 수 있을 지 주목된다"며 "트럼프 행정부의 관세 영향도 다소 있을 것으로 보여 메타의 올해 AI 투자가 유지될지 지켜봐야 할 듯 하다"고 말했다.

2025.04.29 10:06장유미

1분기 실적 앞둔 메타, AI 시장 주도권 확보 방안 제시

메타가 1분기 실적 발표를 앞두고 글로벌 인공지능(AI) 시장 주도권 확보 방안을 제시한다. 29일 CNBC는 메타가 미국 캘리포니아 멘로파크 본사에서 첫 AI 개발자 컨퍼런스 '라마콘'을 열고 글로벌 오픈소스 AI 생태계 강화 전략을 공유한다고 밝혔다. 이후 31일(현지시간) 실적을 발표한다. 이번 라마콘에서는 메타의 최신 AI 모델인 '라마 4' 시리즈가 소개된다. 특히 주요 시리즈인 멀티모달 모델 '스카우트'와 '매버릭'도 공개된다. 2조개 파라미터로 이뤄진 모델 '비히모스'에 대한 정보도 공유될 예정이다. 이번 행사에는 마크 저커버그 메타 최고경영자(CEO)와 사티아 나델라 CEO 간 대담 세션도 포함됐다. 이에 두 CEO가 AI 분야 미래와 협업에 대한 논의를 진행할 가능성도 높다. 외신은 이번 행사에서 메타의 AI 투자 현황과 미국 관세 정책 대응안 이어질 것으로 봤다. 앞서 메타는 올해 AI 인프라 구축을 위해 올해 최대 650억 달러를 지출한다고 밝혔다. 분석가들은 메타가 투자 금액을 상향 조정할 가능성 있다고 내다봤다. 미국 투자은행 니드햄은 메타가 올해 600~650억 달러 자본 지출 계획을 변경하지 않을 것으로 예상했다. 다만 관세로 인해 향후 비용이 추가로 증가할 수 있다는 리스크를 지적했다. 앞서 인텔은 이번 1분기 실적 발표에서 무역정책이 경기 둔화 가능성을 높였다고 밝혔으며, 구글도 설비 투자 계획은 변함없지만 공급 일정 변동 가능성을 언급한 바 있다. 투자자들은 메타가 보유한 글로벌 사용자 기반으로 AI 시장에서 우위를 점할 것으로 기대하고 있다. 수조 달러 규모 시장을 겨냥한 만큼 라마 투자 지속 여부는 중장기적으로 실적과 직결될 전망이라는 이유에서다. 현재 메타는 라마4 모델을 출시해 AI 에이전트 개발에 속도를 내고 있다. 이를 통해 웹 브라우저나 앱에서 사용자 업무를 자동화하는 기능을 강화하고 있다. 최근 메타AI 디지털 어시스턴트 사업도 시작했다. 올해 2분기 중 독립형 메타AI 앱 출시와 유료 구독 서비스 테스트를 계획 중이다. 업계는 별도 앱 출시에 따라 메타AI가 차별화된 브랜드 가치를 확보할 수 있을 것으로 보고 있다. 다만 페이스북이나 인스타그램 사용자가 현재처럼 단순히 콘텐츠 소비에 집중할 경우 AI 서비스 확산에는 시간이 걸릴 수 있다는 분위기다. 윌리엄 블레어의 랄프 샤카트 연구원은 "메타는 다수 플랫폼을 통해 수십억 사용자 기반을 활용할 수 있는 좋은 위치에 있다"며 "초기 선점 효과를 바탕으로 AI 시장에서 강력한 존재감을 가질 것으로 본다"고 밝혔다. 웰스파고의 켄 가웰스키 전무는 "메타는 라마 모델이 최첨단 모델과 경쟁할 수 있는지 지속적으로 평가해야 한다"며 "아직까지 메타는 구글처럼 직접적으로 모델을 수익화하지 못했다"고 밝혔다.

2025.04.29 09:05김미정

"AI 에이전트 구축 속도↑"…엔비디아, '니모 마이크로서비스' 출시

"인공지능(AI) 에이전트 구축 핵심은 속도와 안전성입니다. '니모(NeMo) 마이크로서비스'는 AI 에이전트 제작에 필요한 데이터부터 모델 학습, 평가, 보안, 정보 검색까지 전 과정을 지원합니다. 기업은 다양한 환경에서 AI 에이전트를 빠르고 안전하게 운영할 것입니다." 엔비디아 조이 콘웨이 AI 소프트웨어 부문 수석 디렉터는 23일 온라인으로 진행한 아시아·태평양 미디어 프리프리핑을 통해 대규모 AI 에이전트 구축 플랫폼 니모 마이크로서비스를 처음 공개하며 이같이 밝혔다. 이날 소개된 니모 마이크로서비스는 기업들이 대규모 AI 에이전트를 신속히 구축하고 운영할 수 있도록 지원하는 통합 플랫폼이다. 이 시스템은 비즈니스 인텔리전스와 사용자 피드백, 추론 데이터 등으로 구성됐다. 해당 서비스는 데이터 준비를 위한 '니모 큐레이터'와 AI 모델을 교육하고 역량을 키우는 '니모 커스터마이저', 모델 성능 검증하는 '니모 평가자'로 이뤄졌다. 여기에 에이전트 운영 안전성을 보장하는 '니모 가드레일', 정보 검색 정확도를 높이는 '니모 리트리버'까지 결합돼 구축 효율성을 높일 수 있다. 콘웨이 디렉터는 "특히 커스터마이저는 학습 후 처리 속도를 기존 대비 최대 두 배 올릴 수 있다"고 강조했다. 또 "서비스 구성 요소인 '니모 평가 자동화' 도구는 오픈소스의 모범 사례를 집약해 API 호출량을 3분의 1로 줄일 수 있다"고 서비스 강점을 소개했다. 이어 그는 "가드레일은 에이전트 집중도 유지를 돕고, 리트리버는 내부 지식 기반에서 정확한 정보를 찾아 제공하는 역할을 한다"고 덧붙였다. 콘웨이 디렉터는 니모 마이크로서비스가 이미 AT&T와 시스코 등에 적용돼 고객 상담 정확도와 소프트웨어 개발 효율성을 높였다고 강조했다. 실제 AT&T는 에이전트 정확도를 40% 끌어올렸고, 시스코는 응답 시간을 10배 낮춰 에러율을 줄였다. 해당 서비스는 SAP, 서비스나우, 액센추어, 딜로이트 등 대기업 업무 환경과 통합돼 클라우드 환경에서도 작동 가능하다. 이를 통해 AI 팀원의 성능을 전반적으로 높이고, 에이전트가 데이터 기반으로 지속 성장할 수 있는 여건을 조성한다. 또 이날 발표된 '라마 니모트론'은 추론 기능에 특화된 오픈모델이다. 이는 화학, 물리, 생물 등 과학적 질문에 대응하거나 수천 줄의 코드 리뷰처럼 복잡한 문제 해결 능력을 강화하는 데 활용된다. 콘웨이 디렉터는 "라마 니모트론은 유사 모델보다 최대 4배 빠른 처리량을 보여준다"며 "AI 에이전트 핵심 추론 기능 강화를 통해 고객의 실질적 문제 해결력을 높일 수 있다"고 밝혔다.

2025.04.23 22:01김미정

스포츠보다 힙합?…게토레이, 켄드릭 라마 모델 선임

그래미상과 퓰리처상을 모두 수상한 래퍼 켄드릭 라마가 게토레이의 대규모 마케팅 캠페인의 주인공으로 나선다. 이는 모기업 펩시코가 갈수록 치열해지는 스포츠음료 시장에서 자사 브랜드의 선두 자리를 지키기 위한 전략의 일환이다. 18일(현지시간) 블룸버그통신에 따르면 이번 캠페인은 켄드릭 외에도 케이틀린 클라크, 루카 돈치치, 제이슨 테이텀, 아자 윌슨, 셰듀어 샌더스 등 게토레이 소속 운동선수들이 함께 등장한다. 광고는 이번 주말부터 열리는 NBA 플레이오프 기간에 처음 공개된다. 이후 메이저리그(MLB) 올스타전, 미식축구리그(NFL) 드래프트 등 다양한 스포츠 이벤트를 겨냥한 마케팅도 준비 중이다. 음료 업계 전문 매체 베버리지 데일리에 따르면 게토레이는 미국 스포츠음료 시장에서 약 62%의 점유율을 기록하며 압도적인 1위를 지키고 있다. 하지만 최근 들어 수많은 경쟁 브랜드들이 시장에 뛰어들면서 상황이 예전만큼 녹록지는 않다고 외신은 설명했다. 실제 코카콜라가 소유한 바디아머와 파워에이드는 유명 스포츠 스타들을 속속 영입하고 있다. 유니레버의 리퀴드 IV와 인플루언서 로건 폴의 프라임 등 신생 브랜드도 빠르게 점유율을 늘리고 있다. 바디아머 역시 조 버로우, 코너 맥데이비드 등과 함께한 광고 캠페인을 최근 공개했다. 게토레이의 브랜드 총괄 아누즈 바신은 "스포츠음료 시장이 지금 전환점에 있다"며 "수 많은 신생 브랜드들 사이에서 소비자들이 스포츠음료는 과학적으로 설계돼 운동 능력을 향상시키는 데 초점을 둔 제품이라는 점을 잊어가고 있다"고 우려했다. 이번 캠페인은 게토레이 역사상 가장 큰 규모의 셀러브리티 브랜드 캠페인으로, 뮤지션이 광고 모델로 나서는 것은 이번이 처음이다. 라마와의 계약 조건은 비공개다. 켄드릭 라마는 최근 1년 사이 여러 차례 1위를 기록한 히트곡과 2월 NFL 슈퍼볼 하프타임 공연을 통해 입지를 더욱 넓혔다. 그는 과거 나이키와 아메리칸 익스프레스 등과도 협업한 바 있으며 미네소타를 시작으로 글로벌 콘서트 투어에 나설 예정이다. 바신은 "힙합 문화는 스포츠 문화의 중요한 축"이라며 "회사가 Z세대와의 소통 방식을 근본적으로 바꾸기 위해 노력 중"이라고 말했다.

2025.04.20 15:00류승현

新 LLM 내놓은 메타, 벤치마크 모델 성능 조정 의혹…"일반 버전과 달라"

메타가 새 인공지능(AI) 모델 성능 테스트에 사용한 모델과 실제 일반 버전이 다른 정황이 포착됐다. 7일 테크크런치에 따르면 메타가 챗봇 성능을 비교하는 'LM 아레나' 테스트에서 2위를 차지한 모델 '매버릭'이 일반 매버릭 버전과 다르다는 의혹이 개발자들 사이에서 나왔다. 테스트 버전과 일반 개발자가 다운로드할 수 있는 버전 구성이 다른 셈이다. 현재 LM 아레나에 적용된 매버릭 버전은 '실험적인 챗 전용 버전'으로 명시됐다. 반면 배포용 버전은 정교한 대화 조정이 적용되지 않은 것으로 드러났다. 결과적으로 LM 아레나에 등록된 모델은 공개 모델보다 더 사람처럼 반응할 수 있도록 설계된 셈이다. 실제 사용 환경에서 두 버전은 성능 차이를 보일 수 있다. 다수 외신은 벤치마크용 모델과 실제 공개 모델이 다를 경우 생기는 혼란을 우려했다. 특정 벤치마크에 맞춰 성능 높인 모델이 실제로 제공되지 않거나, 동일한 이름으로 배포될 때 사용자 혼동이 발생한다는 지적이다. 실제 개발자들도 LM 아레나에 올라간 매버릭은 공개 다운로드 버전과 크게 다르다고 입을 모았다. LM 아레나에 올라간 버전은 이모티콘을 과도하게 쓰거나 응답이 지나치게 길었다는 의견이 이어졌다. 이들은 해당 버전이 대화 특화형 조정을 거친 것으로 파악했다. 미국 AI 정보 플랫폼 세마포어 관계자는 "메타가 테스트용 버전을 숨긴 채 일반 버전과 구분하지 않고 공개한 것은 큰 오해를 불러올 수 있다"며 "벤치마크는 다양한 작업에서 장단점을 파악할 수 있는 기준이 돼야 한다"고 지적했다.

2025.04.07 10:48김미정

"비용 줄이고 성능 높여"…메타, '라마 4' 공개로 딥시크 정면돌파

메타가 중국발 오픈소스 인공지능(AI) 모델 급부상에 대응하기 위해 새 AI 모델 시리즈 '라마 4'를 공개했다. 6일 테크크런치 등 외신에 따르면 메타는 멀티모달 기반 라마 4 모델 '스카우트'와 '매버릭' '비히모스'를 출시했다. 스카우트와 매버릭은 공식 웹사이트와 허깅페이스를 통해 이용 가능하다. 비히모스는 현재 훈련 중이다. 메타는 라마 4 전 모델에 '전문가 혼합(MoE)' 구조를 처음 도입했다. MoE는 질문에 따라 필요한 AI만 활용하는 방식이다. 예를 들어 코딩 질문에는 코딩 전문 AI가, 창작 요청에는 창작 전문 AI만 작동한다. 이를 통해 연산 자원을 줄이고 속도와 비용을 개선할 수 있다. 매버릭은 MoE 구조를 통해 4천억개 전체 매개변수를 갖췄지만 사용자 질문에는 170억개 매개변수만 활성화된다. 메타는 "이 모델이 일반적인 AI 어시스턴트 용도로 활용된다"며 "창작, 코딩, 다국어 처리 등에서 GPT-4o와 제미나이 2.0을 능가했다"고 밝혔다. 스카우트는 그래픽처리장치(GPU) 한장으로 작동 가능하다. 매개변수는 1천90억개며 한 번에 최대 1천만 토큰을 처리할 수 있는 장문 이해 능력을 갖췄다. 논문 수십 편, 대형 코드베이스, 법률 문서 등 장문 자료를 한 번에 읽고 분석할 수 있다. 비히모스는 매개변수 약 2조개로 구성됐다. 수학, 과학 분야에서 GPT-4.5, 클로드 3.7, 제미나이 2.0 프로보다 높은 테스트 점수를 받았다. 메타는 이번 모델에서 응답 거부 기준도 완화했다고 밝혔다. 이전보다 정치적·사회적 논쟁을 포함한 질문에 더 많은 응답이 가능하도록 조정했으며 특정 관점을 배제하지 않는다는 설명이다. 유럽연합(EU) 사용자는 라마 4를 사용할 수 없다. 메타가 본사나 주사업장이 EU에 있는 사용자·기업의 사용과 배포를 금지해서다. 다수 외신은 메타가 AI법과 개인정보보호법(GDPR)에 따른 법적 리스크를 피하기 위한 조치라고 분석했다. 월간 7억명 이상 활성 사용자를 보유한 기업도 메타의 별도 승인 없이 모델을 사용할 수 없다. 승인 여부는 메타 재량에 따른다. 테크크런치는 메타의 라마 4 시리즈 공개가 중국발 오픈소스 AI 모델 위협에 대응하기 위한 전략이라고 봤다. 특히 올해 1월 딥시크가 공개한 R1과 V3 모델이 성능과 효율성에서 기존 라마를 뛰어넘었다는 평가가 이어지면서 메타 모델 출시 일정이 당겨졌다는 분석도 나오고 있다. 메타는 "이번 모델 시리즈는 라마 생태계의 새로운 시대를 여는 시작점"이라며 "논쟁적 질문에 더 응답하고 다양한 견해를 수용하려는 조정이 이뤄졌다"고 공식 홈페이지에서 밝혔다.

2025.04.06 10:03김미정

'라마'와 '파이토치' 이끈 주역 떠난다…메타 AI 수장, 퇴사 이유는?

메타의 인공지능(AI) 전략을 이끌어온 핵심 리더가 조직을 떠난다. 급변하는 기술 환경 속 리더십 세대교체 신호로 읽힌다. 2일 업계에 따르면 조엘 피노 메타 AI 부문 부사장은 자신의 링크드인을 통해 다음달 30일 퇴사한다고 밝혔다. 지난 2017년 입사한 그는 메타의 AI 핵심 연구 조직인 AI 기초연구소(FAIR)를 이끌며 오픈소스 거대언어모델 '라마', 라이브러리 '파이토치' 등 핵심 기술 프로젝트를 주도해왔다. 피노 부사장은 메타에서의 8년을 '인생 최고의 직업적 경험'으로 평가하며 FAIR의 연구 성과가 학계와 산업계를 아우르는 생태계로 확산됐다고 강조했다. 그는 수많은 연구자와 실무자들이 메타의 도구를 활용하고 있다며 '라마·코드젠·오디오박스' 등 대표 모델들을 거론했다. 메타는 이번 지도부 교체에도 AI 분야에서 전방위적인 투자를 이어갈 예정이다. 회사는 올해 AI 인프라에만 650억 달러(한화 약 87조원)를 투입할 계획이다. 이와 함께 FAIR 조직은 크리스 콕스 최고제품책임자(CPO)에게 직접 보고하는 구조로 재편된 상태다. 회사 측은 피노의 후임 인사를 아직 확정하지 못했다. 현재 후계자를 물색 중이며 공식 발표는 추후 이뤄질 전망이다. FAIR는 설립자인 얀 르쿤이 여전히 이끄는 가운데 조직 안정성 유지가 당분간 과제로 떠오를 것으로 보인다. 피노 부사장은 퇴사 이후 일정 기간 휴식을 취할 예정이다. 향후 행보에 대한 구체적 언급은 피했지만 연구 및 기술 생태계 내 영향력을 유지할 가능성이 높게 점쳐진다. 그는 "이제는 다른 이들이 이 여정을 이어가야 할 때"라며 "메타는 세계 최고 수준의 AI 시스템을 구축할 역량을 충분히 갖췄다"고 밝혔다.

2025.04.02 09:18조이환

[AI는 지금] 中 딥시크 파장 컸나…폐쇄형 고집하던 오픈AI, '오픈소스 모델' 출시

중국 인공지능(AI) 기업 딥시크의 부상에 자극을 받은 오픈AI가 폐쇄 정책에서 벗어나 오픈소스 전략에 힘을 주고 있다. 오픈소스 진영과 폐쇄형 진영의 기술 격차가 점차 줄어들며 오픈소스 생태계가 빠르게 확산되자 위기감을 느낀 것으로 분석된다. 1일 테크크런치 등 주요 외신에 따르면 오픈AI는 몇 달 안에 'GPT-2' 이후 첫 개방형 AI 언어 모델 '오픈웨이트 AI'를 출시할 것으로 알려졌다. 'GPT-3'부터 폐쇄형 모델 전략을 고수했지만, 최근 미국 메타와 프랑스 미스트랄, 중국 딥시크, 알리바바 등 경쟁사들이 오픈소스 모델을 통해 빠르게 시장을 잠식하자 다급히 전략 수정에 나선 분위기다. 오픈소스는 소프트웨어 설계도라 할 수 있는 '소스 코드'를 공개해 누구나 수정·배포할 수 있게 하는 것을 뜻한다. 연구원, 개발자 등이 소스 코드를 자유롭게 활용하면서 AI 성능 개선이 매우 빠르게 이뤄지는 효과를 얻을 수 있는 동시에 이를 가져다 튜닝해 쓰는 기업들에겐 개발비 부담도 크게 줄일 수 있다는 장점이 있다. 또 GPT(오픈AI), 제미나이(구글) 등 폐쇄형은 데이터를 해당 모델의 서버로 전송해야 해 보안 및 데이터 유출 문제가 발생할 수 있는 데 반해 오픈소스는 보안 측면에서도 자유롭다. 다만 오픈소스를 활용해 개인정보를 탈취하는 악성 AI '웜GPT(WormGPT)'를 만들어낸 사례처럼 범죄에 악용될 수 있다는 단점도 있다. 하지만 최근 오픈소스 전략을 채택하는 기업들은 점차 늘어나는 추세다. 미국 휴머노이드 기업 피규어 AI는 오픈AI와의 파트너십을 끝내며 오픈소스 모델을 사용하겠다고 공식 선언했다. 국내 기업과 후발주자들도 낮은 비용으로도 고성능 언어모델을 개발할 가능성을 열게 되면서 점차 값 비싼 오픈AI의 AI 모델을 써야할지에 대한 의문을 드러내고 있다. 개인정보보호위원회 조사 결과 우리나라에서도 AI 스타트업 10곳 중 6곳이 오픈소스 모델에 기반한 응용 서비스를 출시했거나 자사 서비스 성능 개선에 오픈소스를 활용한 적이 있는 것으로 나타났다. 이에 메타 라마 모델은 이달 초 기준 10억 다운로드를 기록할 정도로 많이 활용되고 있는 것으로 나타났다. 딥시크 역시 전 세계적으로 빠르게 사용자 기반을 구축하며 투자자들의 많은 관심을 받았다. 업계 관계자는 "지금까진 대규모 자본을 바탕으로 AI 모델을 개발해야 한다는 생각을 가졌지만, 딥시크 등장 이후 실용성, 효율성을 따지기 시작한 듯 하다"며 "우리나라 AI 기업들도 이미 우수한 기술을 보유하고 있는 만큼 기술력과 창의성을 앞세워 모델 개발에 나설 필요가 있다"고 말했다. 이 탓에 샘 알트먼 오픈AI 최고경영자(CEO)는 오픈소스 전략을 수용하는 것으로 점차 방향을 틀고 있다. 지난 1월 말에는 레딧 '뭐든지 물어봐(AMA)' 게시판에서 오픈AI의 오픈소스 전략이 "역사의 잘못된 편에 있었다"고 평가하며 기술 공개 방식에 대한 변화를 예고하기도 했다. 이후 오픈AI는 지난 달 31일 공식 웹사이트에 개발자, 연구원 등을 대상으로 오픈소스와 관련된 질문을 게재해 눈길을 끌었다. 해당 질문에는 오픈AI의 개방형 모델에서 무엇을 원하는지, 과거 오픈소스 모델을 사용한 적이 있는지 등과 관련한 내용이 포함돼 있는 것으로 파악됐다. 여기에 오픈AI는 오픈소스 모델을 출시하기 앞서 피드백을 수집하고 프로토타입을 시연하기 위해 개발자 이벤트를 개최할 계획을 갖고 있는 것으로 알려졌다. 이 행사는 몇 주 내 미국 샌프란시스코를 시작으로 유럽, 아시아-태평양 지역에서 열릴 예정이다. 오픈AI가 개발할 예정인 '오픈웨이트' 모델은 일부 코드와 가중치를 공개하는 것으로 알려져 있으며 개발자들이 모델을 분석하고 미세조정(파인튜닝) 할 수 있을 것으로 보인다. 알트먼 CEO는 자신의 소셜 미디어 X(옛 트위터)를 통해 "다른 오픈소스 전략을 찾아내야 한다고 생각한다"며 "오픈AI에서 곧 출시될 개방형 모델은 'o3-미니'와 같은 추론 기능을 가질 것"이라고 밝혔다. 그러면서 "출시 전에 우리의 프레임워크에 따라 이 모델을 평가할 것"이라며 "개발자들이 무엇을 구축하는지, 여러 기업과 정부가 어떤 곳에서 실행하는 것을 선호하고 사용하는지 지켜볼 것"이라고 덧붙였다.

2025.04.01 10:10장유미

"AI 에이전트 시대 주도"…엔비디아, 추론 강화 돕는 SW 공개

엔비디아가 인공지능(AI) 에이전트 시대 본격화를 위한 기술 로드맵을 공개했다. AI 에이전트 개발·유지에 필요한 소프트웨어(SW) 기술을 비롯한 오픈소스 추론 모델 시리즈, 기업용 AI 워크플로 솔루션까지 잇따라 선보였다. 엔비디아는 17~21일까지(현지시간) 미국 새너제이에서 열리는 개발자 회의 'GTC 2025' 미디어 프리브리핑에서 AI 에이전트 개발·추론 강화에 필요한 SW 기술을 공개했다. 이를 통해 AI 에이전트 기술 생태계를 선점하고 기업용 AI 시장에서 주도권을 확보 하려는 전략이다. 이번에 발표할 주요 SW 제품으로는 AI 추론 모델 성능 강화를 돕는 '엔비디아 다이나모(NVIDIA Dynamo)'와 오픈소스 모델 '라마 네모트톤(Llama Nemotron)' 시리즈, '엔비디아 IQ 블루프린트'다. 엔비디아는 해당 제품 모두 AI 에이전트 구축 필수 요소로 자리잡을 것이라 재차 강조했다. '엔비디아 다이나모'로 AI 모델 추론 강화 이번 행사에서 엔비디아는 '엔비디아 다이나모'를 발표한다. 엔비디아 다니어모는 대규모 AI 추론 모델 성능을 올리는 오픈소스 소프트웨어(SW)다. 엔비디아 다이나모는 전체 데이터센터에서 분산·분해 방식으로 작동한다. 분산 방식은 하나의 AI 작업을 여러 개 GPU로 나눠 동시 처리하는 식이다. 기존에는 단일 GPU가 연산을 수행하는 방식이었다면, 다이나모는 동일 작업을 여러 GPU가 협력해 처리하도록 설계됐다. 이를 통해 대량 데이터를 더 빠르고 효율적으로 분석할 수 있다는 설명이다. 엔비디아는 다이나모 분해 방식도 핵심 요소로 꼽았다. 이 방식은 AI 모델이 하나의 질문을 받으면 이를 작은 단위로 쪼개 여러 GPU에 나눠 연산을 수행한다. 이후 최종 결과를 합치는 식이다. 이는 GPU 간 연산 부담을 줄이고 처리 속도를 높일 수 있다. 특히 데이터센터 내 수백~수천 개 GPU가 동시에 운영될 경우, 다이나모 최적화 기술이 GPU 성능 향상을 극대화할 수 있다. 다이나모는 해당 작동방식에 기반해 쿼리 하나를 최대 1천개 그래픽장치(GPU)로 확장할 수 있도록 설계됐다. 기존 방식보다 GPU 활용도를 높여 동일 개수의 GPU로도 처리량을 두 배까지 늘릴 수 있다. AI 모델이 데이터 처리하는 속도가 늘면 자연스럽게 비용 절감 효과와 처리 가능한 데이터 양도 는다. 향후 AI 기반 서비스 운영 효율성을 높이는 핵심 요소로 작용할 전망이다. 여기에 엔비디아의 최신 GPU 네트워크 기술 'NY링크'를 결합하면 성능 향상 폭이 더욱 커진다. NY링크는 GPU 간 데이터 전송 속도를 높이는 기술이다. AI 모델 연산 과정에서 병목현상을 줄이는 역할을 한다. 이를 통해 같은 개수의 GPU를 사용하면서도 최대 30배까지 처리 성능을 끌어올릴 수 있다. 이 외에도 다이나모는 파이토치(PyTorch)를 비롯한 텐서RT, sglang 등 다양한 AI 프레임워크와 호환되는 개방형 아키텍처를 지원한다. 이를 통해 기존 AI 모델을 변경하지 않고도 성능을 개선할 수 있다. 엔비디아는 "딥시크처럼 대규모 데이터를 처리하는 모델은 연산량이 많아 GPU의 확장성이 중요하다"며 "다이나모는 이런 대형 모델 연산 부담을 효과적으로 분산시키는 역할을 한다"고 강조했다. "똑똑한 AI 에이전트 구축"…오픈소스 모델 '라마 네모트론' 시리즈 엔비디아는 AI 에이전트 추론 능력 강화를 위해 새 오픈소스 AI 모델 '라마 니모트론(Llama Nemotron)' 시리즈를 내놨다. 이는 비즈니스 환경에서 즉시 활용 가능한 AI 추론 모델이다. 주로 복잡한 문제 해결을 위한 고급 AI 에이전트 구축에 사용된다. 메타의 오픈소스 모델 '라마' 기반으로 작동한다. 엔비디아는 "해당 모델은 알고리즘적으로 가지치기 과정을 거쳐 모델 크기를 줄였다"며 "이로 인해 컴퓨팅 자원을 덜 소모하면서도 정확도를 유지할 수 있게 최적화됐다"고 설명했다. 또 "사후학습 기법을 통해 라마 니모트론 모델을 더욱 개선했다"고 말했다. 그러면서 "주로 수학 문제 해결과 도구 호출, 명령어 처리, 대화 기능 등 여러 분야에서 최상의 추론 성능을 발휘할 수 있다"고 말했다. 라마 니모트론 모델군은 '나노(Nano)'와 '수퍼(Super)' '울트라(Ultra)' 버전으로 이뤄졌다. 나노는 해당 모델 크기에서 가장 높은 추론 정확도를 제공한다. 수퍼는 단일 데이터센터 GPU에서 가장 빠른 처리 속도를 제공한다. 울트라는 데이터센터급 멀티 GPU 환경에서 AI 에이전트 추론 정확도 극대화를 돕는 모델이다. 나노와 수퍼는 이번 GTC에서 NIM 마이크로서비스 형태로 제공된다. 울트라 모델은 추후 공개된다. 해당 모델 시리즈는 데이터셋 관련 기술과 패키지 형태로 제공된다. 이 데이터셋은 엔비디아가 생성한 600억 개 토큰으로 구성한 합성 데이터셋이다. 약 36만 시간의 H100 GPU 추론 수행과 4만 5천 시간의 인간 주석 작업을 통해 개발됐다. 이 외에도 해당 모델 시리즈는 추론 기능을 온·오프(toggle on/off)할 수 있는 옵션도 제공한다. 이는 오픈 모델에서는 드문 기능인 것으로 평가받고 있다. '엔비디아 IQ 블루프린트'로 AI 에이전트 유연성 높였다 엔비디아는 '엔비디아 IQ 블루프린트'를 출시했다. 해당 솔루션은 4월부터 이용 가능하다. IQ 블루프린트는 개발자가 NIM으로 AI 에이전트를 구축하고 이를 엔터프라이즈 비즈니스 시스템과 연결하게 돕는 AI 워크플로 도구다. 이를 통해 AI 에이전트가 텍스트, 이미지, 영상 등 여러 데이터 유형을 검색·활용할 수 있게 지원한다. 웹 검색이나 다른 AI 에이전트와 같은 외부 도구 활용도 가능하다. 또 다수 AI 에이전트가 팀을 이뤄 협력할 때 개발자가 AI 시스템 작동 과정을 모니터링하고 성능을 개선할 수 있도록 가시성과 투명성을 제공한다. 엔비디아는 "IQ 블루프린트를 활용하면 AI 에이전트 정확도를 높이고, 복잡한 작업 처리 시간을 몇 시간에서 몇 분으로 단축할 수 있다"고 강조했다. 또 엔비디아는 주요 데이터 스토리지 기업과 협력해 AI 데이터 플랫폼을 개발 중이라고 밝혔다. 해당 플랫폼에는 네모 리트리버와 IQ 블루프린트, 블랙웰 GPU, 스펙트럼-X 네트워킹, 블루필드 DPU 등이 포함된다. 이를 통해 실시간에 가까운 데이터 기능을 제공할 방침이다. 엔비디아는 "앞으로 엔터프라이즈 데이터가 AI 에이전트를 위한 핵심 자원으로 활용될 전망"이리며 데이터 플랫폼 개발 배경을 밝혔다. 그러면서 "현재 기업 데이터 저장 시스템은 단순히 파일을 저장하고 제공하는 역할만 수행하고 있다"며 "AI 에이전트가 도입되면, 기업은 데이터 저장·관리 시스템을 지식 제공 시스템으로 전환할 수 있다"고 강조했다.

2025.03.19 05:02김미정

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

韓 최대 AI 행사 'AI 페스타' 개막…배경훈 장관 "AI, 국가 성장 핵심 축으로 삼을 것"

AI페스타, 공공·금융·제조 전방위 AI 혁신 제품 한자리에

최우혁 과기정통부 국장 "AI기술 확산, 보안 패러다임 전환 가속화"

오픈AI "韓 소버린 AI는 경쟁 아닌 파트너십…AI G3 도약 함께할 것"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.