검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'라마'통합검색 결과 입니다. (50건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

KT "AI 전략...글로벌 협력·자체 개발·내부 혁신 삼각편대"

KT가 글로벌 협력, 자체 AI 개발을 병행하는 멀티 모델 전략과 네트워크‧미디어 서비스 혁신을 중심으로 한 3대 AI 사업 방향성을 제시했다. 대표적으로 마이크로소프트(MS)와의 협력을 통해 AI 역량을 보완하고, 자체 개발과 오픈소스 모델을 통해 차별화된 AI 서비스를 선보이겠다는 구상이다. 장민 KT 최고재무책임자(CFO)는 11일 진행한 2분기 실적 컨퍼런스콜에서 “MS와의 파트너십, 팔란티어와의 독점 솔루션 공급 계약을 통해 부족한 역량을 채우고, 이를 기반으로 시큐어 퍼블릭 클라우드나 한국형 챗GPT 같은 서비스를 제공할 것”이라며 첫 번째 전략을 소개했다. 두 번째 전략은 멀티모델 전략이다. 장 CFO는 “MS와의 협력 모델뿐 아니라 자체 개발한 '믿음:2.0'을 지속 개선해 이용자에게 다가갈 것”이라며, 라마(LLaMA) 같은 오픈소스 모델도 활용할 계획을 밝혔다. 마지막 세 번째 전략은 AI를 KT의 네트워크 관리나 미디어 서비스에 접목하는 것이다. 지니TV 셋톱박스에 MS 애저 오픈서비스 기반 AI 에이전트를 적용하거나, 기지국 운영 효율화를 위한 AI 역량을 결합하는 혁신이 그 예다. KT는 이번 3대 전략을 통해 AI를 기업 성장의 핵심 축으로 삼고, 이용자 서비스부터 내부 운영까지 전방위적 혁신을 추진한다는 방침이다.

2025.08.11 16:12진성우

개방형 AI 모델도 급이 있다…'오픈소스'와 '오픈웨이트' 차이는?

인공지능(AI) 기업들이 잇따라 개방형 AI 모델을 공개하는 가운데 '오픈소스'와 '오픈웨이트' 개념 구분이 모호해지면서 혼란이 커질 수 있다는 우려가 나왔다. 6일 IT 업계에 따르면 공개 범위나 활용 가능성에서 오픈소스와 오픈웨이트 모델은 큰 차이를 보임에도 개발사 사이에선 이를 모두 오픈소스로 홍보하고 있다는 지적이 나오고 있다. 우선 오픈소스는 모델의 구조를 비롯한 학습 코드, 데이터셋 정보, 파라미터 등 전 요소를 투명하게 공개하는 방식이다. 사용자는 모델 작동 원리를 분석하고 수정할 수 있다. 모델을 아예 처음부터 다시 학습시킬 수도 있다. 대표적인 오픈소스 모델은 프랑스 미스트랄AI의 '미스트랄', GPT-3의 오픈소스 버전 'GPT-J' 등이다. 오픈웨이트는 말 그대로 학습 가중치만 외부에 제공하는 식이다. 제한적 공개 모델이라고 부르기도 한다. 공개 범위에 모델의 설계 코드나 학습 데이터는 포함되지 않는다. 사용자는 모델 파인튜닝이나 추론은 가능하지만 구조 변경이나 재학습을 할 수 없다. 메타의 '라마' 시리즈, 중국 제트에이아이(Z.ai)의 'GLM-4.5'는 모델이 대표적이다. 개방형 모델을 모두 오픈소스로 명칭할 경우 심각한 문제가 발생할 수 있다는 지적이 나오고 있다. 사용자가 오픈웨이트를 오픈소스로 오인하고 모델 구조 변경이나 재학습을 시도할 수 있어서다. 이럴 경우 코드와 데이터가 없어 프로젝트 전체가 중단될 수 있다. 파인튜닝만 가능한 오픈웨이트 모델 기반으로 개발을 기획하는 것은 일정·예산 낭비로 이어질 수 있다. 또 오픈웨이트 모델 중 다수는 상업적 이용을 제한하거나 별도 계약을 요구하는 라이선스를 포함한다. 이를 인지하지 못하고 상업 서비스에 통합할 경우, 라이선스 위반 소송이나 손해배상 문제가 발생할 수 있다. AI 모델의 공공성, 책임성 평가에 있어서도 두 모델 차이는 크다. 업계 관계자는 "보통 오픈소스 모델은 학습 데이터와 알고리즘을 검토할 수 있어 편향성과 투명성 문제에 대한 검증이 가능하지만, 오픈웨이트 모델은 내부 구조가 불분명해 윤리적 책임소재를 따지기 어렵고, AI 거버넌스 기준을 충족하지 못할 수 있다"고 지적했다. 또 다른 업계 관계자는 "오픈소스 모델로 기대하고 프로젝트에 참여했지만, 실상 오픈웨이트였던 경우가 있다"며 "이를 커뮤니티 사이에선 '가짜 오픈소스'라고 부르기도 한다"고 설명했다. 이어 "이는 모델을 만든 기업 신뢰도 하락까지 이어질 수 있을 것"이라고 덧붙였다. 그러면서 "오픈소스와 오픈웨이트는 공개 범위와 활용 가능성, 법적 조건이 전혀 다르다"며 "개발사는 학계와 산업계가 이를 처음부터 정확히 인지할 수 있도록 책임감 있는 안내를 진행해야 할 것"이라고 강조했다.

2025.08.07 09:28김미정

[SW키트] 개방형 AI 전략 바꾸는 메타...'라마' 경쟁력 흔들리나

밀키트는 손질된 식재료와 양념을 알맞게 담은 간편식입니다. 누구나 밀키트만 있으면 별도 과정 없이 편리하게 맛있는 식사를 할 수 있습니다. [SW키트]도 마찬가지입니다. 누구나 매일 쏟아지는 소프트웨어(SW) 기사를 [SW키트]로 한눈에 볼 수 있습니다. SW 분야에서 가장 주목받는 인공지능(AI), 보안, 클라우드 관련 이야기를 이해하기 쉽고 맛있게 보도하겠습니다. [편집자주] 메타가 개방형 인공지능(AI) 사업 변화 의지를 보인 가운데 글로벌 오픈소스 생태계가 바뀔 것이란 전망이 나왔다. 특히 올해 중국 기업이 개방형 AI 모델을 잇따라 출시하면서 중국이 해당 생태계를 휩쓸 것이란 예측까지 등장하고 있다. 4일 업계에 따르면 메타는 지난 달 30일 실적 발표를 통해 초지능 구현을 위한 기술적·인프라에 대규모 투자를 진행하겠다고 발표했다. 다만 초지능이 기존 AI와는 다른 차원의 위험을 유발할 수 있다는 점에서 모델 개방 전략을 그대로 유지하기는 어려울 것이라고 밝혔다. 이날 마크 저커버그 메타 최고경영자(CEO)는 "초지능은 새로운 형태의 안전 문제를 불러올 수 있다"며 "우리는 이런 위험을 철저히 막기 위해 향후 모델을 오픈소스로 공개할지 고민할 것"이라며 개방형 전략에 대해 신중한 입장을 내놨다. 그동안 메타는 라마 모델을 앞세워 개방형 AI를 핵심 전략으로 삼았다. 2023년부터 라마를 '오픈웨이트' 형식으로 공개해 왔다. 오픈웨이트는 단순 오픈소스와는 다른 개념이다. 오픈소스는 모델의 구조와 학습 알고리즘, 가중치 등 모든 요소를 자유롭게 수정·재배포할 수 있도록 완전히 공개하는 형태다. 오픈웨이트는 모델 가중치만을 조건부로 제공해 사용에 일정 제약을 두는 식이다. 비록 라마가 오픈소스 AI 조건을 완전히 충족하진 않지만, 모든 정보를 공개하지 않는 상용 모델보다 산업계와 학계에 득을 준다는 평가를 받았다. 사용자가 값비싼 비용을 지불하지 않아도 성능 높은 모델을 무료로 활용할 수 있어서다. 메타는 오픈AI를 비롯한 폐쇄형 모델에 맞설 수 있는 수준의 공개 모델을 통해 AI 생태계 범위를 넓혔다. 그러나 초지능 개발에 시동 걸면서 기존 개방형 AI 사업 전략 재검토에 나선 것이다. 업계에선 메타가 개방형 전략을 폐쇄하거나 줄일 경우 라마 모델 영향력이 대폭 축소될 수 있다는 우려가 나오고 있다. 그동안 전 세계 기업과 연구소가 라마 기반으로 AI 모델을 개발한 만큼 글로벌 오픈소스 생태계에 큰 타격을 줄 수 있다는 전망이다. 중국산 개방 모델 물밀듯 등장…"시장 휩쓸수도" 업계에선 향후 오픈소스 생태계 주도권이 중국으로 아예 넘어갈 수 있다는 예측도 나오고 있다. 실제 올해 중국 AI 기업들이 고성능 모델을 오픈소스 또는 오픈웨이트 형식으로 연달아 공개했다. 대표적으로 지푸는 'GLM-4.5'를, 딥시크는 'R1' 모델을, 알리바바는 큐원3'와 코딩 특화 모델인 '큐원3-코더'까지 오픈소스로 내놓으면서 개방형 AI 전략을 강화하고 있다. 현재 해당 모델은 모두 고성능 추론 능력과 대규모 문맥 처리, 에이전틱 AI 기능 등을 갖췄다. 실제 '큐원3-코더'는 주요 성능 평가에서 오픈AI와 구글 모델보다 높은 점수를 받은 것으로 나타났다. 일각에선 중국의 개방형 모델이 메타의 라마 시리즈와 경쟁 가능한 수준이란 평가도 나오고 있다. 이에 국내 업계 관계자는 "다수 중국 모델은 상업적 사용까지 허용하는 '아파치 2.0' 기반 라이선스를 채택한다"며 "모델 접근성과 활용 가능성이 라마보다 더 높다는 점이 특징"이라고 설명했다. 또 다른 업계 관계자는 "특히 중국 기업은 자국 내 그래픽처리장치(GPU) 자원에 최적화된 모델을 공개할뿐 아니라 글로벌 개발자 커뮤니티까지 적극 포섭하고 있는 추세"라며 "향후 미국보다 오픈소스 생태계에 실질적 영향력을 더 확대할 수 있는 위치"라고 평가했다.

2025.08.04 17:16김미정

업스테이지, 실력 또 입증…메타·딥시크와 글로벌 AI 성능 평가서 어깨 나란히

최근 차세대 거대언어모델(LLM) '솔라 프로 2'로 일론 머스크의 견제를 받았던 업스테이지가 또 한 번 더 글로벌 시장에서 경쟁력을 입증하며 주목 받고 있다. 정부가 추진하는 '독자 AI 파운데이션 모델 개발 프로젝트'에 컨소시엄 주관사로 참여한 업스테이지가 이번에 기술력을 제대로 과시했다는 평가다. 25일 업계에 따르면 업스테이지의 '솔라 프로 2'는 지난 24일 크라우드 소싱 기반인 새로운 리더보드 '유프(Yupp)'에서 중국 딥시크 'v3', 메타 '라마 3 70B' 모델과 나란히 공동 18위에 올랐다. '유프'는 실제 사용자들이 써본 후 실시간으로 AI 모델을 평가하는 곳으로, 지난 해 6월 코인베이스와 구글, X 등을 거친 출신들이 설립했다. 구글 최고과학자인 제프 딘과 트위터 공동창업자 비즈 스톤, 핀터레스트 공동창업자 에반 샤프, 퍼플렉시티 최고경영자(CEO) 아라빈드 스리니바스 등은 이곳에 대규모 자금을 투자했다. 유프는 챗GPT, 클로드, 제미나이, 그록, 딥시크, 라마 등 주요 AI 모델들이 내놓는 답변을 비교할 수 있는 기능을 제공한다. 사용자는 각 모델들 응답을 평가하고 피드백을 준다. 이 과정에서 베이스와 솔라나 기반 스테이블 코인뿐 아니라 법정 화폐로 리워드 크레딧을 획득할 수 있다. 이에 업계에선 사용자들의 실사용 트렌드를 파악할 수 있다는 점에서 유프의 AI 모델 순위를 주목하고 있다. 업스테이지는 네이버에서 AI 개발을 총괄했던 김성훈 대표가 2020년 창업한 스타트업으로, 2022년 국내 기업 최초로 캐글에서 10회 금메달을 수상하며 기술력을 인정받았다. 김 대표는 이날 자신의 소셜미디어(SNS)를 통해 '솔라 프로 2'가 유프 순위 20위 안에 들었다는 사실을 직접 알리며 자축하기도 했다. 김 대표는 "'솔라 프로 2'가 LLM 아레나에서 프론티어 모델 중 상위 18위 안에 들며 최고의 사용자 만족도로 인정받았다는 소식을 전하게 돼 기쁘다"며 "이 순위는 직접적인 사용자 피드백과 투표를 반영하며 LLM에 대한 가장 객관적인 평가 방법으로 널리 알려져 있다"고 설명했다. 업스테이지는 최근 독립 LLM 성능 분석기관 '아티피셜 애널리시스'가 발표한 '지능 지표(Intelligence Index)'에서도 국내 유일의 프런티어 모델로 선정돼 화제가 됐다. '솔라 프로 2'는 여기서 58점을 기록하며 ▲미스트랄 스몰(55) ▲GPT-4.1(53) ▲라마 4 매버릭(51) ▲GPT-4o(41) 등 빅테크 LLM을 제치고 더 높은 성능을 기록했다. 또 ▲딥시크 V3(53) ▲문샷 AI 키미 K2(57.59) 등 중국 모델도 모두 추월하며 상위권에 안착했다. 주요 프런티어 모델 대부분은 1천억~2천억 매개변수(파라미터)를 탑재한 대형 모델이다. 가장 높은 성능을 기록한 xAI의 '그록-4'는 1조7천억(1.7T)에 달한다. 반면 '솔라 프로 2'는 310억 매개변수로 이들과 어깨를 나란히 했다는 점에서 업스테이지의 소형 언어모델 기술 경쟁력과 효율성을 입증했다는 평가를 받는다. 특히 '솔라 프로 2'는 현재 기업 환경에서 가장 널리 쓰이는 범용 모델 GPT-4.1을 넘어서면서 고난도 추론 능력에서 우위를 차지했다. 비용 대비 성능 평가에서도 '클로드 4 소넷', '마지스트랄 스몰' 등 주요 모델보다 효율적인 것으로 평가됐다. xAI의 '그록-4'는 성능 지표에선 1위였지만 '구동비용 대비 성능(Intelligence vs. Cost to Run)' 지표에서는 '가장 매력적인 구간(Most Attractive quadrant)'에 포함되지 못하면서 상대적으로 '솔라 프로 2'에 비해 부족하다는 평가를 받았다. 이에 xAI를 설립한 일론 머스크는 '아티피셜 애널리시스'가 업스테이지 모델을 언급한 게시글을 공유하며 견제하는 모습을 보였다. 머스크는 "xAI의 '그록'이 여전히 1위"라며 "'그록'은 빠르게 개선하는 중"이라고 강조했다. 그러자 김성훈 업스테이지 대표도 "xAI가 1등인 것을 축하한다. 하지만 오래가진 않을 것"이라며 "솔라 LLM이 아주 빠르게 개선해서 따라잡겠다"는 답글을 남겼다. 이같은 분위기 속에 업스테이지는 기술력이 충분히 검증됐다고 보고 향후 '독자 AI 파운데이션 모델' 사업자로 선정되면 '프롬 스크래치' 방식으로 '전 국민 AI' 콘셉트에 맞춰 새로운 모델 개발에 나설 것으로 알려졌다. 또 업스테이지는 향후 후속 모델로 1천억 파라미터 규모의 차세대 LLM을 개발할 계획으로, 향후 프런티어 인덱스 최상위권 진입도 기대하고 있다. 이에 대해 김 대표는 "(유프 순위에) 곧 상위 10위 안에 들기 위해 '솔라 프로 3'를 준비하고 있다"며 "앞으로도 독자적인 기술력으로 자체 모델을 더욱 고도화해 대한민국이 AI 3강을 넘어 글로벌 시장에서 기술 주도권을 차지할 수 있도록 기여하겠다"고 밝혔다.

2025.07.25 16:20장유미

"AI 추론 최적"…레드햇, 메타와 오픈소스 AI 협력

레드햇이 엔터프라이즈용 생성형 인공지능(AI) 개방성과 확장성을 높이기 위해 메타와 손잡았다. 레드햇은 메타의 라마 스택과 고성능 추론 엔진 가상거대언어모델(vLLM) 중심으로 생성형 AI 통합 프레임워크를 구현하기 위한 공동 프로젝트를 메타와 시작했다고 10일 밝혔다. 이를 통해 다양한 하드웨어와 클라우드 환경 전반에서 일관된 AI 애플리케이션 구축 기반이 마련될 전망이다. 이번 협력은 AI 가속기와 클라우드, 하드웨어 환경에 최적화된 추론 기능을 구현하는 데 초점 맞췄다. 특히 기업용 생성형 AI의 상용화를 위해서는 표준화된 API 계층과 추론 기술의 상호운용성이 중요하다는 점에서, 이번 협력이 실질적인 기술적 해법으로 주목받고 있다. 레드햇은 라마 스택과 AI 플랫폼을 통합해 에이전틱 AI 프레임워크 전반의 지원 범위를 넓힐 방침이다. 이를 통해 개발자들은 다양한 생성형 AI 애플리케이션을 보다 유연하게 설계하고 배포할 수 있는 환경을 확보할 계획이다. 마이크 페리스 레드햇 수석 부사장 겸 최고 전략 책임자는 "이번 협력은 라마 스택과 vLLM을 통해 어디서든 더 빠르고 비용 효율적인 생성형 AI 구현이 가능하도록 도울 것"이라고 강조했다. 애시 자베리 메타 AI·리얼리티 랩스 파트너십 부문 부사장은 "라마 스택을 산업 전반의 생성형 AI 애플리케이션 표준으로 자리잡게 하는 데 있어 이번 협력은 큰 의미가 있다"며 "우리는 AI 기술의 잠재력을 현실화하는 확장 가능한 솔루션 개발에 공동 노력하고 있다"고 말했다.

2025.06.10 11:37김미정

"이러다 지겠다"…AI팀 둘로 쪼갠 메타, 구글·오픈AI 따라잡기 '총력'

메타가 자사 인공지능(AI) 조직을 두 개의 독립 부문으로 나누는 개편을 단행했다. 경쟁사와의 기술 격차를 좁히고 시장 대응 속도를 높이기 위한 전략이다. 28일 테크크런치에 따르면 메타는 기존 AI 부서를 'AI 제품팀'과 '범용 인공지능(AGI) 파운데이션 유닛'으로 재편했다. 이번 개편에서 인력 감축은 없는 것으로 알려졌다. 'AI 제품팀'은 페이스북, 인스타그램, 왓츠앱 등 메타의 주요 플랫폼에서 제공되는 AI 기능 전반을 맡는다. 최근 공개된 메타의 독립형 AI 앱도 이 부문에서 주도한다. 반대로 'AGI 파운데이션 유닛'은 '라마(LLAMA)' 모델 고도화와 같은 중장기 핵심 기술 개발에 집중한다. 메타는 조직개편 외에도 최근 '라마 포 스타트업스' 프로그램을 시작했다. 생성형 AI 기반 서비스를 개발하는 초기 스타트업을 대상으로 자사 모델 활용을 유도하는 방식이다. 지난 4월 개최된 개발자 행사 '라마콘' 역시 오픈AI와 대등한 기술력을 과시하는 자리로 활용됐다. 제품 데모와 기술 세션은 대부분 라마 모델과 이를 활용한 다양한 사례로 구성됐다. 테크크런치는 "메타가 보다 신속한 제품 개발을 위해 AI 팀을 분할한 것으로 보인다"며 "오픈AI, 구글, 앤트로픽 등과의 경쟁에서 지지 않기 위해 최선을 다하는 중"이라고 평가했다.

2025.05.28 09:26조이환

"개발자 잡아야 살아남는다"…메타, 라마콘서 'AI 총력전' 선언

메타가 인공지능(AI) 개발자들을 위해 대규모 행사를 열어 생태계 확장에 나섰다. AI 앱, 모델 응용 프로그램 인터페이스(API), 개인 정보 보호형 연산 기능을 잇달아 내놓으며 폐쇄형 경쟁자보다 먼저 시장 선점을 시도하겠다는 의도로 해석된다. 29일 테크크런치 등 외신에 따르면 메타는 지난 28일 미국 멘로파크 본사에서 '라마콘' 개발자 컨퍼런스를 열고 라마 API와 독립형 AI 앱, 왓츠앱 전용 기능 등을 발표했다. 참석자들은 이날 마크 저커버그 메타 최고경영자(CEO)와 사티아 나델라 마이크로소프트 CEO 간의 대담, 기술 세션 등을 통해 최근 '라마4' 발표 이후 메타의 로드맵에 대한 구상을 확인했다. 가장 관심을 모은 발표는 '라마 API'였다. 이 도구를 사용하면 개발자가 데이터를 직접 만들어 모델을 학습시키고 결과를 평가하는 전 과정을 한 곳에서 처리할 수 있다. 학습된 모델은 메타의 서버에 종속되지 않아 다른 클라우드 환경으로 자유롭게 옮길 수 있다. 또 세레브라스(Cerebras)나 그록(Groq) 같은 파트너 서버를 API 옵션으로 제공해 실시간 응답이 중요한 대화형 AI 서비스도 손쉽게 구현할 수 있도록 했다. 추가 공개된 독립형 '메타 AI 앱'은 개인화 기능을 강화한 것이 특징이다. 페이스북이나 인스타그램에서 생성된 소셜 데이터, 사용자의 콘텐츠 반응 기록 등을 활용해 응답의 정확도를 높이도록 설계됐다. 음성 채팅과 프롬프트 공유용 디스커버 피드도 포함돼 '챗GPT'와의 정면 대결을 염두에 둔 구성이란 분석이 나온다. 메타는 자사 소셜미디어인 '왓츠앱'에도 생성형 AI를 적용하기 위한 별도 기술을 공개했다. '프라이빗 프로세싱'으로 명명된 이 기능은 메시지를 요약하거나 정리하는 과정에서도 종단간 암호화 구조를 그대로 유지하도록 설계됐다. 이는 사용자가 직접 설정을 통해 켜야 작동하며 암호화된 채팅 내용을 외부 서버에 노출하지 않고 AI 기능을 제공하는 방식이다. AI 보조 기능과 개인정보 보호를 동시에 충족시킨 첫 사례로, 유럽연합(EU)이나 인도처럼 규제가 강한 시장에서 메타 AI의 확장 가능성을 높였다는 평가가 나온다. 모델 로드맵에서는 경량형 라마4인 '리틀 라마', 미출시 상태인 대형 모델 '비히모스', '라마4' 모델 마이너 업그레이드(dot release) 등이 언급됐다. 특히 '리틀 라마'는 모바일 기반 저전력 응용에 활용될 가능성이 높다. '비히모스'는 아직 비공개 상태이나 메타는 이를 세계 최고 성능의 베이스 모델로 표현했다. 현재 메타는 최근 '라마4' 모델 출시 후 성능 논란에 휘말린 상태다. 대화 최적화 버전인 '매버릭'은 벤치마크 '언어모델 아레나(LM 아레나)'에서 좋은 점수를 받았지만 실제 배포된 모델은 해당 성능을 내지 못했다. 추론 능력을 갖춘 모델이 없다는 점도 비판을 받았다. 출시 직후 한 테크 비평가는 "모든 경쟁자가 추론 모델을 내놓고 있는 상황에서 메타는 무리하게 출시를 서둘렀다"고 말한 바 있다. 마크 저커버그 메타 CEO는 라마콘에서 "우리 모두가 AI 변화가 50년이나 걸리지는 않을 거라는 전제로 현재 수준의 투자를 지속하고 있다"고 강조했다.

2025.04.30 10:38조이환

中 '딥시크'에 자극 받은 메타, 첫 AI 개발자 회의로 주도권 잡기 본격화

'페이스북' 모회사 메타플랫폼이 첫 인공지능(AI) 개발자 회의를 열고 최신 AI 모델인 '라마4'를 앞세워 시장 공략에 본격 나선다. 29일 블룸버그통신, CNBC, 엔가젯 등 주요 외신에 따르면 메타플랫폼은 이날 미국 동부시간 기준 오후 1시(현지시간) 온라인을 통해 AI 개발자 회의인 '라마 컨퍼런스'를 개최한다. '라마(Llama)'는 메타의 오픈소스 거대언어모델(LLM)로, 메타는 이달 초 최신 버전인 '라마4'를 공개한 바 있다. '메타 포 디벨로퍼즈(Meta for Developers)' 공식 페이스북 페이지를 통해 생중계되는 이번 행사에선 향후 메타의 AI 전략이 공개될 예정이다. 메타는 그동안 매년 9월 신제품 발표 행사인 '메타 커넥트(connect)' 컨퍼런스를 통해 '라마' 모델을 소개해왔으나, 올해부터는 이를 분리해 독립적인 행사로 개최한다. 메타의 오픈소스AI 개발 현황을 공유하고 개발자들이 이를 활용해 혁신적인 앱과 제품을 만들 수 있도록 지원하기 위해서다. 메타는 AI 시장에서 오픈소스 전략을 고수하고 있는 상태로, 현재 골드만삭스와 노무라홀딩스, AT&T, 도어대시, 액센추어 등 다양한 글로벌 기업들이 '라마' 모델을 활용 중이다. 또 엔비디아와 데이터브릭스, 그록, 델, 스노우플레이크 등 최소 25개 파트너사가 '라마' 모델을 호스팅하고 있다. 이번 회의에선 크리스 콕스 메타 최고제품책임자를 비롯해 마노하르 팔루리 AI 부사장, 안젤라 팬 연구 과학자 등이 기조연설에 나선다. 이들은 메타의 오픈소스 AI 커뮤니티 최신 동향과 '라마' 모델 업데이트, 메타의 AI 전략 등을 발표한다. 이후 마크 저커버그 메타 최고경영자(CEO)는 데이터 분석기업 데이터브릭스 CEO 알리 고드시와 'AI 기반 애플리케이션 구축'을 주제로 대담에 나선다. 또 사티아 나델라 마이크로소프트(MS) CEO와 'AI의 최신 트렌드'에 관해서도 논의한다. 업계 관계자는 "데이터브릭스, MS 측과의 대화가 모두 공식적인 신제품 발표를 위한 세션은 아닌 것으로 보인다"면서도 "다만 MS와 메타가 이미 여러 차례 협업한 전례가 있어 깜짝 발표 가능성도 배제할 수 없다"고 봤다. 업계에선 메타가 AI 개발자 회의를 독립적으로 개최하게 된 배경으로 중국 AI 스타트업인 '딥시크'가 자극이 됐을 것으로 봤다. '딥시크'가 메타의 '라마' 모델과 경쟁하거나 이를 넘어설 수 있는 오픈소스 AI 모델을 출시하며 올 초부터 주목 받기 시작해서다. 이에 메타는 '딥시크'가 모델 운영 및 배포 비용을 대폭 낮춘 방식을 분석하기 위해 긴급 태스크포스(TF)도 구성한 것으로 알려졌다. 또 메타는 AI에 대한 대규모 투자를 통해 시장의 선두 주자로 올라서겠다는 계획도 세웠다. 이를 위해 올해는 AI 관련 프로젝트에만 최대 800억 달러(약 110조원) 가량을 투자할 예정이다. 이 자금은 AI 전문 인재 채용과 신형 AI 데이터센터 건설, 라마 시리즈 강화 등에 쓰일 것으로 알려졌다. 더불어 메타는 라마 기반의 AI 챗봇 '메타 AI'를 페이스북과 인스타그램, 왓츠앱 등 자사가 보유한 소셜미디어(SNS)에 접목하며 이용자 수를 늘리고 있다. 또 조만간 별도의 메타 AI 앱도 출시해 사용자 확장을 꾀할 계획이다. '메타 AI'의 월간 활성 사용자 수는 지난해 9월 기준 5억 명에 육박했다. 저커버그 CEO도 AI 시장에서 메타의 주도권을 잡기 위해 적극 나설 것임을 시사했다. 앞서 지난 1월에는 "2025년은 고도로 지능적이고 개인화된 AI 어시스턴트가 10억 명 이상에게 도달하는 해가 될 것"이라며 "메타 AI가 그 선두 주자가 될 것"이라고 말한 바 있다. 저커버그 CEO는 '라마4' 외에 올해 추론 능력과 멀티모달 기능을 갖춘 다양한 신형 AI 모델 출시도 예고했다. 또 '라마' 모델이 향후 자율적으로 작업을 수행할 수 있는 '에이전틱 AI' 기능도 지원할 것임을 예고했다. 다만 일각에선 메타가 AI 학습 과정에서 저작권이 있는 서적 자료를 무단 사용했다는 소송과 EU 일부 국가의 개인정보 보호 규제로 인한 모델 출시 연기, 취소 등 여러 도전에 직면하고 있다고 지적했다. 또 도널드 트럼프 행정부의 관세 여파도 우려되는 부분이라고 봤다. 업계 관계자는 "이 같은 상황 속에 메타가 '라마4'와 '라마 컨퍼런스'를 통해 시장을 이끌 수 있을 지 주목된다"며 "트럼프 행정부의 관세 영향도 다소 있을 것으로 보여 메타의 올해 AI 투자가 유지될지 지켜봐야 할 듯 하다"고 말했다.

2025.04.29 10:06장유미

1분기 실적 앞둔 메타, AI 시장 주도권 확보 방안 제시

메타가 1분기 실적 발표를 앞두고 글로벌 인공지능(AI) 시장 주도권 확보 방안을 제시한다. 29일 CNBC는 메타가 미국 캘리포니아 멘로파크 본사에서 첫 AI 개발자 컨퍼런스 '라마콘'을 열고 글로벌 오픈소스 AI 생태계 강화 전략을 공유한다고 밝혔다. 이후 31일(현지시간) 실적을 발표한다. 이번 라마콘에서는 메타의 최신 AI 모델인 '라마 4' 시리즈가 소개된다. 특히 주요 시리즈인 멀티모달 모델 '스카우트'와 '매버릭'도 공개된다. 2조개 파라미터로 이뤄진 모델 '비히모스'에 대한 정보도 공유될 예정이다. 이번 행사에는 마크 저커버그 메타 최고경영자(CEO)와 사티아 나델라 CEO 간 대담 세션도 포함됐다. 이에 두 CEO가 AI 분야 미래와 협업에 대한 논의를 진행할 가능성도 높다. 외신은 이번 행사에서 메타의 AI 투자 현황과 미국 관세 정책 대응안 이어질 것으로 봤다. 앞서 메타는 올해 AI 인프라 구축을 위해 올해 최대 650억 달러를 지출한다고 밝혔다. 분석가들은 메타가 투자 금액을 상향 조정할 가능성 있다고 내다봤다. 미국 투자은행 니드햄은 메타가 올해 600~650억 달러 자본 지출 계획을 변경하지 않을 것으로 예상했다. 다만 관세로 인해 향후 비용이 추가로 증가할 수 있다는 리스크를 지적했다. 앞서 인텔은 이번 1분기 실적 발표에서 무역정책이 경기 둔화 가능성을 높였다고 밝혔으며, 구글도 설비 투자 계획은 변함없지만 공급 일정 변동 가능성을 언급한 바 있다. 투자자들은 메타가 보유한 글로벌 사용자 기반으로 AI 시장에서 우위를 점할 것으로 기대하고 있다. 수조 달러 규모 시장을 겨냥한 만큼 라마 투자 지속 여부는 중장기적으로 실적과 직결될 전망이라는 이유에서다. 현재 메타는 라마4 모델을 출시해 AI 에이전트 개발에 속도를 내고 있다. 이를 통해 웹 브라우저나 앱에서 사용자 업무를 자동화하는 기능을 강화하고 있다. 최근 메타AI 디지털 어시스턴트 사업도 시작했다. 올해 2분기 중 독립형 메타AI 앱 출시와 유료 구독 서비스 테스트를 계획 중이다. 업계는 별도 앱 출시에 따라 메타AI가 차별화된 브랜드 가치를 확보할 수 있을 것으로 보고 있다. 다만 페이스북이나 인스타그램 사용자가 현재처럼 단순히 콘텐츠 소비에 집중할 경우 AI 서비스 확산에는 시간이 걸릴 수 있다는 분위기다. 윌리엄 블레어의 랄프 샤카트 연구원은 "메타는 다수 플랫폼을 통해 수십억 사용자 기반을 활용할 수 있는 좋은 위치에 있다"며 "초기 선점 효과를 바탕으로 AI 시장에서 강력한 존재감을 가질 것으로 본다"고 밝혔다. 웰스파고의 켄 가웰스키 전무는 "메타는 라마 모델이 최첨단 모델과 경쟁할 수 있는지 지속적으로 평가해야 한다"며 "아직까지 메타는 구글처럼 직접적으로 모델을 수익화하지 못했다"고 밝혔다.

2025.04.29 09:05김미정

"AI 에이전트 구축 속도↑"…엔비디아, '니모 마이크로서비스' 출시

"인공지능(AI) 에이전트 구축 핵심은 속도와 안전성입니다. '니모(NeMo) 마이크로서비스'는 AI 에이전트 제작에 필요한 데이터부터 모델 학습, 평가, 보안, 정보 검색까지 전 과정을 지원합니다. 기업은 다양한 환경에서 AI 에이전트를 빠르고 안전하게 운영할 것입니다." 엔비디아 조이 콘웨이 AI 소프트웨어 부문 수석 디렉터는 23일 온라인으로 진행한 아시아·태평양 미디어 프리프리핑을 통해 대규모 AI 에이전트 구축 플랫폼 니모 마이크로서비스를 처음 공개하며 이같이 밝혔다. 이날 소개된 니모 마이크로서비스는 기업들이 대규모 AI 에이전트를 신속히 구축하고 운영할 수 있도록 지원하는 통합 플랫폼이다. 이 시스템은 비즈니스 인텔리전스와 사용자 피드백, 추론 데이터 등으로 구성됐다. 해당 서비스는 데이터 준비를 위한 '니모 큐레이터'와 AI 모델을 교육하고 역량을 키우는 '니모 커스터마이저', 모델 성능 검증하는 '니모 평가자'로 이뤄졌다. 여기에 에이전트 운영 안전성을 보장하는 '니모 가드레일', 정보 검색 정확도를 높이는 '니모 리트리버'까지 결합돼 구축 효율성을 높일 수 있다. 콘웨이 디렉터는 "특히 커스터마이저는 학습 후 처리 속도를 기존 대비 최대 두 배 올릴 수 있다"고 강조했다. 또 "서비스 구성 요소인 '니모 평가 자동화' 도구는 오픈소스의 모범 사례를 집약해 API 호출량을 3분의 1로 줄일 수 있다"고 서비스 강점을 소개했다. 이어 그는 "가드레일은 에이전트 집중도 유지를 돕고, 리트리버는 내부 지식 기반에서 정확한 정보를 찾아 제공하는 역할을 한다"고 덧붙였다. 콘웨이 디렉터는 니모 마이크로서비스가 이미 AT&T와 시스코 등에 적용돼 고객 상담 정확도와 소프트웨어 개발 효율성을 높였다고 강조했다. 실제 AT&T는 에이전트 정확도를 40% 끌어올렸고, 시스코는 응답 시간을 10배 낮춰 에러율을 줄였다. 해당 서비스는 SAP, 서비스나우, 액센추어, 딜로이트 등 대기업 업무 환경과 통합돼 클라우드 환경에서도 작동 가능하다. 이를 통해 AI 팀원의 성능을 전반적으로 높이고, 에이전트가 데이터 기반으로 지속 성장할 수 있는 여건을 조성한다. 또 이날 발표된 '라마 니모트론'은 추론 기능에 특화된 오픈모델이다. 이는 화학, 물리, 생물 등 과학적 질문에 대응하거나 수천 줄의 코드 리뷰처럼 복잡한 문제 해결 능력을 강화하는 데 활용된다. 콘웨이 디렉터는 "라마 니모트론은 유사 모델보다 최대 4배 빠른 처리량을 보여준다"며 "AI 에이전트 핵심 추론 기능 강화를 통해 고객의 실질적 문제 해결력을 높일 수 있다"고 밝혔다.

2025.04.23 22:01김미정

스포츠보다 힙합?…게토레이, 켄드릭 라마 모델 선임

그래미상과 퓰리처상을 모두 수상한 래퍼 켄드릭 라마가 게토레이의 대규모 마케팅 캠페인의 주인공으로 나선다. 이는 모기업 펩시코가 갈수록 치열해지는 스포츠음료 시장에서 자사 브랜드의 선두 자리를 지키기 위한 전략의 일환이다. 18일(현지시간) 블룸버그통신에 따르면 이번 캠페인은 켄드릭 외에도 케이틀린 클라크, 루카 돈치치, 제이슨 테이텀, 아자 윌슨, 셰듀어 샌더스 등 게토레이 소속 운동선수들이 함께 등장한다. 광고는 이번 주말부터 열리는 NBA 플레이오프 기간에 처음 공개된다. 이후 메이저리그(MLB) 올스타전, 미식축구리그(NFL) 드래프트 등 다양한 스포츠 이벤트를 겨냥한 마케팅도 준비 중이다. 음료 업계 전문 매체 베버리지 데일리에 따르면 게토레이는 미국 스포츠음료 시장에서 약 62%의 점유율을 기록하며 압도적인 1위를 지키고 있다. 하지만 최근 들어 수많은 경쟁 브랜드들이 시장에 뛰어들면서 상황이 예전만큼 녹록지는 않다고 외신은 설명했다. 실제 코카콜라가 소유한 바디아머와 파워에이드는 유명 스포츠 스타들을 속속 영입하고 있다. 유니레버의 리퀴드 IV와 인플루언서 로건 폴의 프라임 등 신생 브랜드도 빠르게 점유율을 늘리고 있다. 바디아머 역시 조 버로우, 코너 맥데이비드 등과 함께한 광고 캠페인을 최근 공개했다. 게토레이의 브랜드 총괄 아누즈 바신은 "스포츠음료 시장이 지금 전환점에 있다"며 "수 많은 신생 브랜드들 사이에서 소비자들이 스포츠음료는 과학적으로 설계돼 운동 능력을 향상시키는 데 초점을 둔 제품이라는 점을 잊어가고 있다"고 우려했다. 이번 캠페인은 게토레이 역사상 가장 큰 규모의 셀러브리티 브랜드 캠페인으로, 뮤지션이 광고 모델로 나서는 것은 이번이 처음이다. 라마와의 계약 조건은 비공개다. 켄드릭 라마는 최근 1년 사이 여러 차례 1위를 기록한 히트곡과 2월 NFL 슈퍼볼 하프타임 공연을 통해 입지를 더욱 넓혔다. 그는 과거 나이키와 아메리칸 익스프레스 등과도 협업한 바 있으며 미네소타를 시작으로 글로벌 콘서트 투어에 나설 예정이다. 바신은 "힙합 문화는 스포츠 문화의 중요한 축"이라며 "회사가 Z세대와의 소통 방식을 근본적으로 바꾸기 위해 노력 중"이라고 말했다.

2025.04.20 15:00류승현

新 LLM 내놓은 메타, 벤치마크 모델 성능 조정 의혹…"일반 버전과 달라"

메타가 새 인공지능(AI) 모델 성능 테스트에 사용한 모델과 실제 일반 버전이 다른 정황이 포착됐다. 7일 테크크런치에 따르면 메타가 챗봇 성능을 비교하는 'LM 아레나' 테스트에서 2위를 차지한 모델 '매버릭'이 일반 매버릭 버전과 다르다는 의혹이 개발자들 사이에서 나왔다. 테스트 버전과 일반 개발자가 다운로드할 수 있는 버전 구성이 다른 셈이다. 현재 LM 아레나에 적용된 매버릭 버전은 '실험적인 챗 전용 버전'으로 명시됐다. 반면 배포용 버전은 정교한 대화 조정이 적용되지 않은 것으로 드러났다. 결과적으로 LM 아레나에 등록된 모델은 공개 모델보다 더 사람처럼 반응할 수 있도록 설계된 셈이다. 실제 사용 환경에서 두 버전은 성능 차이를 보일 수 있다. 다수 외신은 벤치마크용 모델과 실제 공개 모델이 다를 경우 생기는 혼란을 우려했다. 특정 벤치마크에 맞춰 성능 높인 모델이 실제로 제공되지 않거나, 동일한 이름으로 배포될 때 사용자 혼동이 발생한다는 지적이다. 실제 개발자들도 LM 아레나에 올라간 매버릭은 공개 다운로드 버전과 크게 다르다고 입을 모았다. LM 아레나에 올라간 버전은 이모티콘을 과도하게 쓰거나 응답이 지나치게 길었다는 의견이 이어졌다. 이들은 해당 버전이 대화 특화형 조정을 거친 것으로 파악했다. 미국 AI 정보 플랫폼 세마포어 관계자는 "메타가 테스트용 버전을 숨긴 채 일반 버전과 구분하지 않고 공개한 것은 큰 오해를 불러올 수 있다"며 "벤치마크는 다양한 작업에서 장단점을 파악할 수 있는 기준이 돼야 한다"고 지적했다.

2025.04.07 10:48김미정

"비용 줄이고 성능 높여"…메타, '라마 4' 공개로 딥시크 정면돌파

메타가 중국발 오픈소스 인공지능(AI) 모델 급부상에 대응하기 위해 새 AI 모델 시리즈 '라마 4'를 공개했다. 6일 테크크런치 등 외신에 따르면 메타는 멀티모달 기반 라마 4 모델 '스카우트'와 '매버릭' '비히모스'를 출시했다. 스카우트와 매버릭은 공식 웹사이트와 허깅페이스를 통해 이용 가능하다. 비히모스는 현재 훈련 중이다. 메타는 라마 4 전 모델에 '전문가 혼합(MoE)' 구조를 처음 도입했다. MoE는 질문에 따라 필요한 AI만 활용하는 방식이다. 예를 들어 코딩 질문에는 코딩 전문 AI가, 창작 요청에는 창작 전문 AI만 작동한다. 이를 통해 연산 자원을 줄이고 속도와 비용을 개선할 수 있다. 매버릭은 MoE 구조를 통해 4천억개 전체 매개변수를 갖췄지만 사용자 질문에는 170억개 매개변수만 활성화된다. 메타는 "이 모델이 일반적인 AI 어시스턴트 용도로 활용된다"며 "창작, 코딩, 다국어 처리 등에서 GPT-4o와 제미나이 2.0을 능가했다"고 밝혔다. 스카우트는 그래픽처리장치(GPU) 한장으로 작동 가능하다. 매개변수는 1천90억개며 한 번에 최대 1천만 토큰을 처리할 수 있는 장문 이해 능력을 갖췄다. 논문 수십 편, 대형 코드베이스, 법률 문서 등 장문 자료를 한 번에 읽고 분석할 수 있다. 비히모스는 매개변수 약 2조개로 구성됐다. 수학, 과학 분야에서 GPT-4.5, 클로드 3.7, 제미나이 2.0 프로보다 높은 테스트 점수를 받았다. 메타는 이번 모델에서 응답 거부 기준도 완화했다고 밝혔다. 이전보다 정치적·사회적 논쟁을 포함한 질문에 더 많은 응답이 가능하도록 조정했으며 특정 관점을 배제하지 않는다는 설명이다. 유럽연합(EU) 사용자는 라마 4를 사용할 수 없다. 메타가 본사나 주사업장이 EU에 있는 사용자·기업의 사용과 배포를 금지해서다. 다수 외신은 메타가 AI법과 개인정보보호법(GDPR)에 따른 법적 리스크를 피하기 위한 조치라고 분석했다. 월간 7억명 이상 활성 사용자를 보유한 기업도 메타의 별도 승인 없이 모델을 사용할 수 없다. 승인 여부는 메타 재량에 따른다. 테크크런치는 메타의 라마 4 시리즈 공개가 중국발 오픈소스 AI 모델 위협에 대응하기 위한 전략이라고 봤다. 특히 올해 1월 딥시크가 공개한 R1과 V3 모델이 성능과 효율성에서 기존 라마를 뛰어넘었다는 평가가 이어지면서 메타 모델 출시 일정이 당겨졌다는 분석도 나오고 있다. 메타는 "이번 모델 시리즈는 라마 생태계의 새로운 시대를 여는 시작점"이라며 "논쟁적 질문에 더 응답하고 다양한 견해를 수용하려는 조정이 이뤄졌다"고 공식 홈페이지에서 밝혔다.

2025.04.06 10:03김미정

'라마'와 '파이토치' 이끈 주역 떠난다…메타 AI 수장, 퇴사 이유는?

메타의 인공지능(AI) 전략을 이끌어온 핵심 리더가 조직을 떠난다. 급변하는 기술 환경 속 리더십 세대교체 신호로 읽힌다. 2일 업계에 따르면 조엘 피노 메타 AI 부문 부사장은 자신의 링크드인을 통해 다음달 30일 퇴사한다고 밝혔다. 지난 2017년 입사한 그는 메타의 AI 핵심 연구 조직인 AI 기초연구소(FAIR)를 이끌며 오픈소스 거대언어모델 '라마', 라이브러리 '파이토치' 등 핵심 기술 프로젝트를 주도해왔다. 피노 부사장은 메타에서의 8년을 '인생 최고의 직업적 경험'으로 평가하며 FAIR의 연구 성과가 학계와 산업계를 아우르는 생태계로 확산됐다고 강조했다. 그는 수많은 연구자와 실무자들이 메타의 도구를 활용하고 있다며 '라마·코드젠·오디오박스' 등 대표 모델들을 거론했다. 메타는 이번 지도부 교체에도 AI 분야에서 전방위적인 투자를 이어갈 예정이다. 회사는 올해 AI 인프라에만 650억 달러(한화 약 87조원)를 투입할 계획이다. 이와 함께 FAIR 조직은 크리스 콕스 최고제품책임자(CPO)에게 직접 보고하는 구조로 재편된 상태다. 회사 측은 피노의 후임 인사를 아직 확정하지 못했다. 현재 후계자를 물색 중이며 공식 발표는 추후 이뤄질 전망이다. FAIR는 설립자인 얀 르쿤이 여전히 이끄는 가운데 조직 안정성 유지가 당분간 과제로 떠오를 것으로 보인다. 피노 부사장은 퇴사 이후 일정 기간 휴식을 취할 예정이다. 향후 행보에 대한 구체적 언급은 피했지만 연구 및 기술 생태계 내 영향력을 유지할 가능성이 높게 점쳐진다. 그는 "이제는 다른 이들이 이 여정을 이어가야 할 때"라며 "메타는 세계 최고 수준의 AI 시스템을 구축할 역량을 충분히 갖췄다"고 밝혔다.

2025.04.02 09:18조이환

[AI는 지금] 中 딥시크 파장 컸나…폐쇄형 고집하던 오픈AI, '오픈소스 모델' 출시

중국 인공지능(AI) 기업 딥시크의 부상에 자극을 받은 오픈AI가 폐쇄 정책에서 벗어나 오픈소스 전략에 힘을 주고 있다. 오픈소스 진영과 폐쇄형 진영의 기술 격차가 점차 줄어들며 오픈소스 생태계가 빠르게 확산되자 위기감을 느낀 것으로 분석된다. 1일 테크크런치 등 주요 외신에 따르면 오픈AI는 몇 달 안에 'GPT-2' 이후 첫 개방형 AI 언어 모델 '오픈웨이트 AI'를 출시할 것으로 알려졌다. 'GPT-3'부터 폐쇄형 모델 전략을 고수했지만, 최근 미국 메타와 프랑스 미스트랄, 중국 딥시크, 알리바바 등 경쟁사들이 오픈소스 모델을 통해 빠르게 시장을 잠식하자 다급히 전략 수정에 나선 분위기다. 오픈소스는 소프트웨어 설계도라 할 수 있는 '소스 코드'를 공개해 누구나 수정·배포할 수 있게 하는 것을 뜻한다. 연구원, 개발자 등이 소스 코드를 자유롭게 활용하면서 AI 성능 개선이 매우 빠르게 이뤄지는 효과를 얻을 수 있는 동시에 이를 가져다 튜닝해 쓰는 기업들에겐 개발비 부담도 크게 줄일 수 있다는 장점이 있다. 또 GPT(오픈AI), 제미나이(구글) 등 폐쇄형은 데이터를 해당 모델의 서버로 전송해야 해 보안 및 데이터 유출 문제가 발생할 수 있는 데 반해 오픈소스는 보안 측면에서도 자유롭다. 다만 오픈소스를 활용해 개인정보를 탈취하는 악성 AI '웜GPT(WormGPT)'를 만들어낸 사례처럼 범죄에 악용될 수 있다는 단점도 있다. 하지만 최근 오픈소스 전략을 채택하는 기업들은 점차 늘어나는 추세다. 미국 휴머노이드 기업 피규어 AI는 오픈AI와의 파트너십을 끝내며 오픈소스 모델을 사용하겠다고 공식 선언했다. 국내 기업과 후발주자들도 낮은 비용으로도 고성능 언어모델을 개발할 가능성을 열게 되면서 점차 값 비싼 오픈AI의 AI 모델을 써야할지에 대한 의문을 드러내고 있다. 개인정보보호위원회 조사 결과 우리나라에서도 AI 스타트업 10곳 중 6곳이 오픈소스 모델에 기반한 응용 서비스를 출시했거나 자사 서비스 성능 개선에 오픈소스를 활용한 적이 있는 것으로 나타났다. 이에 메타 라마 모델은 이달 초 기준 10억 다운로드를 기록할 정도로 많이 활용되고 있는 것으로 나타났다. 딥시크 역시 전 세계적으로 빠르게 사용자 기반을 구축하며 투자자들의 많은 관심을 받았다. 업계 관계자는 "지금까진 대규모 자본을 바탕으로 AI 모델을 개발해야 한다는 생각을 가졌지만, 딥시크 등장 이후 실용성, 효율성을 따지기 시작한 듯 하다"며 "우리나라 AI 기업들도 이미 우수한 기술을 보유하고 있는 만큼 기술력과 창의성을 앞세워 모델 개발에 나설 필요가 있다"고 말했다. 이 탓에 샘 알트먼 오픈AI 최고경영자(CEO)는 오픈소스 전략을 수용하는 것으로 점차 방향을 틀고 있다. 지난 1월 말에는 레딧 '뭐든지 물어봐(AMA)' 게시판에서 오픈AI의 오픈소스 전략이 "역사의 잘못된 편에 있었다"고 평가하며 기술 공개 방식에 대한 변화를 예고하기도 했다. 이후 오픈AI는 지난 달 31일 공식 웹사이트에 개발자, 연구원 등을 대상으로 오픈소스와 관련된 질문을 게재해 눈길을 끌었다. 해당 질문에는 오픈AI의 개방형 모델에서 무엇을 원하는지, 과거 오픈소스 모델을 사용한 적이 있는지 등과 관련한 내용이 포함돼 있는 것으로 파악됐다. 여기에 오픈AI는 오픈소스 모델을 출시하기 앞서 피드백을 수집하고 프로토타입을 시연하기 위해 개발자 이벤트를 개최할 계획을 갖고 있는 것으로 알려졌다. 이 행사는 몇 주 내 미국 샌프란시스코를 시작으로 유럽, 아시아-태평양 지역에서 열릴 예정이다. 오픈AI가 개발할 예정인 '오픈웨이트' 모델은 일부 코드와 가중치를 공개하는 것으로 알려져 있으며 개발자들이 모델을 분석하고 미세조정(파인튜닝) 할 수 있을 것으로 보인다. 알트먼 CEO는 자신의 소셜 미디어 X(옛 트위터)를 통해 "다른 오픈소스 전략을 찾아내야 한다고 생각한다"며 "오픈AI에서 곧 출시될 개방형 모델은 'o3-미니'와 같은 추론 기능을 가질 것"이라고 밝혔다. 그러면서 "출시 전에 우리의 프레임워크에 따라 이 모델을 평가할 것"이라며 "개발자들이 무엇을 구축하는지, 여러 기업과 정부가 어떤 곳에서 실행하는 것을 선호하고 사용하는지 지켜볼 것"이라고 덧붙였다.

2025.04.01 10:10장유미

"AI 에이전트 시대 주도"…엔비디아, 추론 강화 돕는 SW 공개

엔비디아가 인공지능(AI) 에이전트 시대 본격화를 위한 기술 로드맵을 공개했다. AI 에이전트 개발·유지에 필요한 소프트웨어(SW) 기술을 비롯한 오픈소스 추론 모델 시리즈, 기업용 AI 워크플로 솔루션까지 잇따라 선보였다. 엔비디아는 17~21일까지(현지시간) 미국 새너제이에서 열리는 개발자 회의 'GTC 2025' 미디어 프리브리핑에서 AI 에이전트 개발·추론 강화에 필요한 SW 기술을 공개했다. 이를 통해 AI 에이전트 기술 생태계를 선점하고 기업용 AI 시장에서 주도권을 확보 하려는 전략이다. 이번에 발표할 주요 SW 제품으로는 AI 추론 모델 성능 강화를 돕는 '엔비디아 다이나모(NVIDIA Dynamo)'와 오픈소스 모델 '라마 네모트톤(Llama Nemotron)' 시리즈, '엔비디아 IQ 블루프린트'다. 엔비디아는 해당 제품 모두 AI 에이전트 구축 필수 요소로 자리잡을 것이라 재차 강조했다. '엔비디아 다이나모'로 AI 모델 추론 강화 이번 행사에서 엔비디아는 '엔비디아 다이나모'를 발표한다. 엔비디아 다니어모는 대규모 AI 추론 모델 성능을 올리는 오픈소스 소프트웨어(SW)다. 엔비디아 다이나모는 전체 데이터센터에서 분산·분해 방식으로 작동한다. 분산 방식은 하나의 AI 작업을 여러 개 GPU로 나눠 동시 처리하는 식이다. 기존에는 단일 GPU가 연산을 수행하는 방식이었다면, 다이나모는 동일 작업을 여러 GPU가 협력해 처리하도록 설계됐다. 이를 통해 대량 데이터를 더 빠르고 효율적으로 분석할 수 있다는 설명이다. 엔비디아는 다이나모 분해 방식도 핵심 요소로 꼽았다. 이 방식은 AI 모델이 하나의 질문을 받으면 이를 작은 단위로 쪼개 여러 GPU에 나눠 연산을 수행한다. 이후 최종 결과를 합치는 식이다. 이는 GPU 간 연산 부담을 줄이고 처리 속도를 높일 수 있다. 특히 데이터센터 내 수백~수천 개 GPU가 동시에 운영될 경우, 다이나모 최적화 기술이 GPU 성능 향상을 극대화할 수 있다. 다이나모는 해당 작동방식에 기반해 쿼리 하나를 최대 1천개 그래픽장치(GPU)로 확장할 수 있도록 설계됐다. 기존 방식보다 GPU 활용도를 높여 동일 개수의 GPU로도 처리량을 두 배까지 늘릴 수 있다. AI 모델이 데이터 처리하는 속도가 늘면 자연스럽게 비용 절감 효과와 처리 가능한 데이터 양도 는다. 향후 AI 기반 서비스 운영 효율성을 높이는 핵심 요소로 작용할 전망이다. 여기에 엔비디아의 최신 GPU 네트워크 기술 'NY링크'를 결합하면 성능 향상 폭이 더욱 커진다. NY링크는 GPU 간 데이터 전송 속도를 높이는 기술이다. AI 모델 연산 과정에서 병목현상을 줄이는 역할을 한다. 이를 통해 같은 개수의 GPU를 사용하면서도 최대 30배까지 처리 성능을 끌어올릴 수 있다. 이 외에도 다이나모는 파이토치(PyTorch)를 비롯한 텐서RT, sglang 등 다양한 AI 프레임워크와 호환되는 개방형 아키텍처를 지원한다. 이를 통해 기존 AI 모델을 변경하지 않고도 성능을 개선할 수 있다. 엔비디아는 "딥시크처럼 대규모 데이터를 처리하는 모델은 연산량이 많아 GPU의 확장성이 중요하다"며 "다이나모는 이런 대형 모델 연산 부담을 효과적으로 분산시키는 역할을 한다"고 강조했다. "똑똑한 AI 에이전트 구축"…오픈소스 모델 '라마 네모트론' 시리즈 엔비디아는 AI 에이전트 추론 능력 강화를 위해 새 오픈소스 AI 모델 '라마 니모트론(Llama Nemotron)' 시리즈를 내놨다. 이는 비즈니스 환경에서 즉시 활용 가능한 AI 추론 모델이다. 주로 복잡한 문제 해결을 위한 고급 AI 에이전트 구축에 사용된다. 메타의 오픈소스 모델 '라마' 기반으로 작동한다. 엔비디아는 "해당 모델은 알고리즘적으로 가지치기 과정을 거쳐 모델 크기를 줄였다"며 "이로 인해 컴퓨팅 자원을 덜 소모하면서도 정확도를 유지할 수 있게 최적화됐다"고 설명했다. 또 "사후학습 기법을 통해 라마 니모트론 모델을 더욱 개선했다"고 말했다. 그러면서 "주로 수학 문제 해결과 도구 호출, 명령어 처리, 대화 기능 등 여러 분야에서 최상의 추론 성능을 발휘할 수 있다"고 말했다. 라마 니모트론 모델군은 '나노(Nano)'와 '수퍼(Super)' '울트라(Ultra)' 버전으로 이뤄졌다. 나노는 해당 모델 크기에서 가장 높은 추론 정확도를 제공한다. 수퍼는 단일 데이터센터 GPU에서 가장 빠른 처리 속도를 제공한다. 울트라는 데이터센터급 멀티 GPU 환경에서 AI 에이전트 추론 정확도 극대화를 돕는 모델이다. 나노와 수퍼는 이번 GTC에서 NIM 마이크로서비스 형태로 제공된다. 울트라 모델은 추후 공개된다. 해당 모델 시리즈는 데이터셋 관련 기술과 패키지 형태로 제공된다. 이 데이터셋은 엔비디아가 생성한 600억 개 토큰으로 구성한 합성 데이터셋이다. 약 36만 시간의 H100 GPU 추론 수행과 4만 5천 시간의 인간 주석 작업을 통해 개발됐다. 이 외에도 해당 모델 시리즈는 추론 기능을 온·오프(toggle on/off)할 수 있는 옵션도 제공한다. 이는 오픈 모델에서는 드문 기능인 것으로 평가받고 있다. '엔비디아 IQ 블루프린트'로 AI 에이전트 유연성 높였다 엔비디아는 '엔비디아 IQ 블루프린트'를 출시했다. 해당 솔루션은 4월부터 이용 가능하다. IQ 블루프린트는 개발자가 NIM으로 AI 에이전트를 구축하고 이를 엔터프라이즈 비즈니스 시스템과 연결하게 돕는 AI 워크플로 도구다. 이를 통해 AI 에이전트가 텍스트, 이미지, 영상 등 여러 데이터 유형을 검색·활용할 수 있게 지원한다. 웹 검색이나 다른 AI 에이전트와 같은 외부 도구 활용도 가능하다. 또 다수 AI 에이전트가 팀을 이뤄 협력할 때 개발자가 AI 시스템 작동 과정을 모니터링하고 성능을 개선할 수 있도록 가시성과 투명성을 제공한다. 엔비디아는 "IQ 블루프린트를 활용하면 AI 에이전트 정확도를 높이고, 복잡한 작업 처리 시간을 몇 시간에서 몇 분으로 단축할 수 있다"고 강조했다. 또 엔비디아는 주요 데이터 스토리지 기업과 협력해 AI 데이터 플랫폼을 개발 중이라고 밝혔다. 해당 플랫폼에는 네모 리트리버와 IQ 블루프린트, 블랙웰 GPU, 스펙트럼-X 네트워킹, 블루필드 DPU 등이 포함된다. 이를 통해 실시간에 가까운 데이터 기능을 제공할 방침이다. 엔비디아는 "앞으로 엔터프라이즈 데이터가 AI 에이전트를 위한 핵심 자원으로 활용될 전망"이리며 데이터 플랫폼 개발 배경을 밝혔다. 그러면서 "현재 기업 데이터 저장 시스템은 단순히 파일을 저장하고 제공하는 역할만 수행하고 있다"며 "AI 에이전트가 도입되면, 기업은 데이터 저장·관리 시스템을 지식 제공 시스템으로 전환할 수 있다"고 강조했다.

2025.03.19 05:02김미정

효성중공업, '일렉라마 2025' 참가…"인도 핵심 전력회사 자리매김"

효성중공업이 인도 최대 전력산업 전시회에서 최첨단 전력 솔루션을 선보였다. 효성중공업은 22일부터 26일까지 인도 뉴델리에서 개최되는 '일렉라마 2025'에 참가했다고 밝혔다. '일렉라마 2025'는 2년마다 개최되는 세계적인 전력산업 전시회로, 약 1천여개 기업이 참여하고 40만명 이상이 방문하는 대규모 행사다. 효성중공업은 이번 전시회에서 '에너지 전환 시대의 신뢰할 수 있는 파트너, 그리드 안정성을 책임지겠습니다'라는 주제로 최신 전력 기술과 제품을 선보였다. 주요 전시 제품으로는 ▲온실가스 배출량은 줄이고 고성능 절연 기술은 높인 SF6 Free GIS▲신속한 설치 및 이동으로 긴급상황 대처에 용이한 이동형 변전소 ▲신재생에너지 발전, 데이터센터 등에 안정적인 전력 공급을 돕는 STATCOM(정지형 무효 전력 보상장치) ▲효율적인 장거리 대용량 전력 전송이 가능한 미래 전력망 핵심 기술 HVDC(초고압 직류 송전 시스템) 등이 있다. 우태희 효성중공업 대표는 “인도는 세계에서 가장 빠르게 성장하고 있는 전력시장 중 하나”라며 “이번 전시회에 선보인 효성중공업의 전력 솔루션을 통해 인도 시장 내 선도적 입지를 더욱 강화하겠다”고 밝혔다. 한편, 효성중공업은 일찍이 인도 전력기기 시장의 잠재력을 파악해 2007년 뉴델리에 지사를 세웠고, 2015년에는 인도 중서부 푸네에 GIS 생산 공장을 준공하며 지속적으로 시장을 공략해왔다. 효성중공업은 인도 GIS 시장에서 점유율 50%가 넘는 1위를 차지하고 있고, 특히 800kv 이상 초고압 GIS 부문에서는 95% 이상의 점유율을 기록하고 있다. 2024년 기준 인도법인 매출이 전년 대비 2배 이상 성장했다.

2025.02.25 13:18류은주

"oo은행, '엑사원 3.5'가 딱이네"…금융권 노린 LG CNS, 최적 AI 모델 골라준다

LG CNS가 금융 맞춤형 인공지능(AI) 평가 도구를 앞세워 생성형 AI를 도입하고자 하는 금융 기업 공략에 나선다. LG CNS는 미리 구축한 데이터셋으로 시중에 공개된 수십 개의 개방형 거대언어모델(LLM)을 평가해 뱅킹, 보험, 증권 등 각 금융 서비스에 가장 적합한 AI 모델을 찾아주는 주는 서비스를 개발했다고 24일 밝혔다. 개방형 LLM은 공개된 소스코드나 알고리즘으로 누구나 자유롭게 수정하고 활용할 수 있는 거대언어모델(LLM)이다. 대표적으로 LG AI연구원의 엑사원(EXAONE) 3.5, 메타(Meta)의 라마(Llama), 알리바바(Alibaba)의 큐원(Qwen) 2.5 등이 있다. 금융 기업은 데이터 유출 등 보안의 이유로 AI 도입 시 개방형 LLM을 파인튜닝해 자체 모델을 구축한다. 파인튜닝은 AI 모델에 별도의 데이터를 학습시켜 특정한 목적에 맞게 만드는 과정을 의미한다. 오픈AI의 챗GPT나 구글의 제미나이(Gemini)같은 폐쇄형 LLM은 내부 소스코드가 공개되지 않아 기업이 자체 AI 모델로 구축해 활용할 수 없으며 돈을 내고 서비스를 이용하는 형태로만 사용 가능하다. LG CNS의 금융 특화 평가 도구는 29가지 평가지표와 약 1천200개의 데이터셋으로 구성돼 있다. 주요 평가 항목은 ▲금융 지식을 기반으로 추론하는 능력 ▲수학적 추론 능력 ▲복잡한 질문 이해력 ▲문서요약 능력 ▲금융 용어 이해도 ▲AI 에이전트(Agentic Tool) 사용 능력 등을 종합적으로 테스트한다. LG CNS는 특히 AI가 답변하기 어려워하는 금융 관련 추론 문제들을 29개 평가지표에 적용해 더 정확한 성능 검증이 가능하도록 했다. LG CNS는 금융 전문가들과의 협업을 통해 데이터셋의 평가 데이터에 실제 금융 현장에서 사용하는 서비스 정보나 전문 지식 등이 정확히 반영됐는지 점검하며 완성도를 높였다. 이를 통해 AI가 금융 산업 내 규제 요건이나 복잡한 서비스 구조 안에서도 정확한 답변을 하는지 판단할 수 있게 했다. LG CNS는 이 평가 도구를 통해 금융기업들이 AI를 도입할 때 최적의 LLM 선정부터 커스터마이징, 안정적인 운영까지 금융권에 특화된 생성형 AI 도입 전 단계에서 차별화된 고객가치를 제공해 나갈 계획이다. LG CNS는 다수의 금융 기업을 대상으로 생성형 AI를 활용한 비즈니스 혁신을 지속하며 금융 AX를 선도하고 있다. 최근 NH농협은행과 생성형 AI 플랫폼 구축 프로젝트에 착수했고, 신한카드와 생성형 AI 기반의 상담사 응대 시스템을 구축 중이다. 작년에는 신한은행과 함께 거대언어모델(LLM) 기반 미래형 영업점인 'AI 브랜치'를 개발했고, KB금융그룹에 AI, 클라우드 등 디지털 기술을 접목시킨 미래형고객센터(FCC, Future Contact Center)를 구축해 운영 중이다. 현신균 LG CNS 사장은 "금융 서비스에 생성형 AI를 도입하고자 하는 기업의 가장 큰 고민은 어떤 AI 모델이 서비스에 가장 적합할 지 파악하는 것"이라며 "자사금융 특화 AI 평가 도구는 금융 기업들의 고민을 빠르게 해결할 수 있는 최적의 솔루션이 될 것"이라고 말했다.

2025.02.24 10:00장유미

[남기자의 비욘드IT] 딥시크가 촉발한 '오픈워싱' 논란, 오픈소스의 미래는

중국 스타트업 딥시크(DeepSeek)가 'R1' 등 자체 개발한 인공지능(AI) 모델을 오픈소스로 공개하면서 논란이 일고 있다. AI모델의 코드와 가중치를 공개했지만, 학습 데이터와 훈련 과정은 비공개이기 때문이다. 이에 일부 개발자들은 '오픈소스'라고 부르기에 부족하다는 비판에 나섰다. AI오픈소스 커뮤니티인 허깅페이스 측은 R1의 숨겨진 요소를 모두 분석해 재구축하는 '오픈-R1(Open-R1)'를 진행 중이기도 하다. 문제는 구글과 메타 등 빅테크 기업 역시 이런 논란에서 자유롭지 않아 관련 업계에서 '오픈소스'라는 용어가 마케팅 도구로 전락하는 것 아니냐는 '오픈워싱(Openwashing)'에 대한 우려의 목소리가 나오고 있다. 7일 업계에 따르면 최근 AI 오픈소스의 정의와 방향에 대해 기업과 사용자간 논쟁이 치열하게 일고 있다. 오픈소스 생태계 위협하는 오픈워싱 AI 모델을 '오픈소스'로 공개하는 것은 연구자들과 개발자들이 자유롭게 활용하고 발전시킬 수 있도록 하기 위한 취지다. 그러나 최근 많은 기업들이 핵심 기술을 비공개로 유지한 채 '부분적 개방'만을 내세우고 있다. 해당 논란이 거세지는 이유는 오픈소스 철학의 핵심인 개방성과 투명성이 훼손되며 개발 생태계를 악화시킨다는 지적이다. 이로 인해 오픈소스 AI의 의미와 방향을 둘러싼 논쟁은 단순한 기술적 논의에서 벗어나, AI 생태계 전체의 구조를 결정하는 중요한 요소로 자리 잡고 있다. AI 발전 과정에서 오픈소스는 중요한 역할을 해왔다. 초기 AI 연구자들은 개방된 모델과 데이터를 활용해 기술을 발전시키고 협업을 통해 새로운 혁신을 이끌어냈다. 대표적으로 구글과 메타 같은 기업들은 AI 연구에 필수적인 오픈소스 프레임워크와 모델을 공개하면서 생태계를 확장했다. 구글은 2015년 텐서플로를 공개해 AI 연구 및 개발의 표준을 만들었고, 2014년에는 쿠버네티스(Kubernetes)를 통해 클라우드 환경에서 AI 모델을 효율적으로 운영할 수 있도록 했다. 메타 역시 AI 오픈소스를 적극적으로 활용한 기업으로 꼽힌다. 2016년 공개한 파이토치(PyTorch)는 현재 가장 널리 사용되는 AI 개발 프레임워크 중 하나다. 2022년에는 리눅스 재단 산하 파이토치 재단으로 이관해 커뮤니티 주도의 발전을 지원하고 있다. 오픈소스 생태계 이끌어온 빅테크의 달라진 행보 하지만 이렇게 AI오픈소스 생태계를 이끌어온 기업들이 본격적인 AI모델 출시와 함께 행보가 달라지고 있다. 구글은 젬마(Gemma)라는 AI 모델을 공개했지만, 학습 데이터와 훈련 코드는 공개하지 않고 있다. 또 구글의 AI전용 프로세서인 TPU에 최적화돼 특정 클라우드 종속성을 강화하는 방식으로 운영되고 있다. 메타도 라마를 오픈소스로 제공하고 있다고 밝혔지만 훈련 데이터와 세부 알고리즘은 비공개로 유지하고 있는 추세다. 이에 비영리 오픈소스 표준화 단체인 오픈소스 이니셔티브(OSI) 측은 '오픈소스'란 용어를 사용해 사용자를 혼란스럽게 하고 오픈소스를 오염시켰다며 강도 높게 비판했다. AI 오픈소스 커뮤니티인 허깅페이스도 오픈워싱 논란에 대해 비판적인 입장을 보이고 있다. 클레망 들랑브 최고경영자(CEO)는 AI 기업들이 오픈 모델이라는 용어를 남용하고 있으며, 진정한 오픈소스 AI는 학습 데이터와 훈련 과정까지 포함돼야 한다고 주장했다. 기술경쟁 심화된 AI, 기술 보호 중요성 커저 AI 오픈소스 생태계를 적극적으로 지원하며 생태계를 주도하던 기업들이 점점 폐쇄적인 방향으로 돌아서고 있는 이유는 AI 기술 경쟁이 심화되면서 '기술 보호'가 더 중요한 요소로 떠올랐기 때문이다. 오픈AI가 GPT-2까지는 공개했지만, GPT-3부터 모델을 비공개로 운영하며 API 기반 서비스로 전환한 것은 대표적인 사례다. 오픈AI는 학습 데이터와 훈련 알고리즘을 비공개로 유지하면서도 GPT 기반의 유료 API 서비스를 제공하며 AI 생태계를 선점하는 전략을 택했다. 마이크로소프트의 대규모 투자 이후 GPT-4는 완전히 비공개 모델이 됐다. 오픈AI 역시 연구 초기에는 'AI 기술을 모두에게 개방한다'는 비전을 내세웠지만, AI 기술이 상업화되면서 기업 중심의 폐쇄적인 운영 방식을 선택했다. 구글과 메타는 기술보호와 함께 AI 클라우드 서비스와의 연계를 강화하는 전략적 요소가 더 강해졌다. 막대한 비용이 소비되는 AI 연구 비용 지출을 클라우드 서비스와의 결합을 통해 완화할 수 있기 때문이다. AI 모델의 훈련과 운영에는 막대한 비용이 소요된다. GPT-4의 훈련 비용은 수억 달러(수천억원)로 추정되며, 기업이 AI 모델을 공개하면 경쟁사들이 해당 모델을 무료로 사용할 가능성이 높아진다. 이에 따라 기업은 비용을 부담하고 연구한 기술을 다른 기업들이 쉽게 복제해 경쟁력을 갖출 수 있게 된다. 이런 이유로 AI 기업들은 오픈소스보다는 '부분적 공개' 또는 '제한된 라이선스' 전략을 선택하는 추세다. 특히 딥시크 사례는 AI 모델이 공개되지 않아도 충분히 복제될 수 있다는 가능성을 보여줬다. 이에 따라 기업들은 AI 모델을 더욱 폐쇄적으로 운영할 가능성이 높아졌으며, AI 오픈소스 시장 자체가 위축될 가능성이 커진다는 지적이다. 모두 공개보다 제한적 공개로 전환할 가능성 높아진 빅테크 AI 모델을 오픈한다는 것이 곧바로 기술 공유를 의미하지 않는다는 점이 분명해지면서, AI 기업들은 '어떤 부분을 공개할 것인가'에 대한 전략적 판단을 더욱 신중하게 내릴 것으로 보인다. 특히 관련 업계에선 AI 모델의 소스코드가 모두 공개되지 않아도 복제될 수 있다는 점이 확인되면서, 기업들은 오픈소스 전략을 제한적으로 운영할 가능성이 높을 것이란 전망이다. 이러한 흐름에 따라 최근 샘 알트먼 오픈AI CEO가 발언도 오픈워싱 전략이 포함된 것이란 해석이 제기되고 있다. 최근 샘 알트먼은 레딧에서 진행한 '무엇이든 물어보세요(AMA)' 코너에서 딥시크의 부상을 보며 현재 오픈소스 전략이 잘못된 것 같다며 더 개방적인 방향을 고려할 것이라고 밝힌 바 있다. 하지만 완전한 오픈소스로 전환할 경우 오픈AI의 수익 모델에 악영향을 미칠 가능성이 있고 1위를 유지하고 있는 상황에서 굳이 경쟁자에게 최신 기술을 공유할 이유가 없다는 분석이다. 국내 한 AI전문가는 "현재 오픈AI의 AI모델이 가장 좋은 성능을 보유한 것은 알려져 있지만 자세한 정보를 공개하고 있지 않아 기업들과 개발자들의 불만이 큰 상황"이라며 "이런 불만을 잠재우고 여론을 돌리기 위해서라도 긍정적인 발언을 할 필요가 있었을 것"이라고 분석했다. AI 오픈소스 이끌 것으로 주목 받는 AI스타트업 다만 딥시크를 비롯해 미스트랄 등 AI스타트업을 중심으로 AI 오픈소스 생태계가 변화할 것이란 전망도 나온다. AI모델을 오픈소스로 공개하면 누구나 부담 없이 활용할 수 있을 뿐 아니라 외부 개발자들의 기여를 통해 개발 비용을 줄이고, 모델 개선 속도를 높일 수 있다는 장점이 있다. 또 오픈소스 프로젝트에 적극적으로 참여하는 AI 분야의 우수한 인재를 자연스럽게 확보하며 개발 생태계를 구축 가능하다. 더불어 개방적이고 투명한 AI 생태계를 지향하며 기존 AI기업과 차별화된 브랜드 이미지를 확보할 수 있다. 구글과 메타 역시 이러한 전략을 바탕으로 클라우드를 비롯해 웹브라우저, 가상현실(VR), 데이터 인프라스트럭처 등의 분야에서 안정적인 생태계를 구축한 바 있다. 한 AI 전문가는 "미스트랄이나 딥시크가 오픈소스로 공개되면서 오픈AI와 비교되며 관심을 끌고 있지, 기술독점 방식이었다면 지금 같은 반응은 끌어내지 못했을 것"이라며 "앞으로의 AI 시장은 자본과 인프라를 앞세운 빅테크와 오픈소스를 강조하는 스타트업 간의 경쟁 구도가 될 것으로 예상된다"고 전망했다.

2025.02.07 18:05남혁우

"AI 추론 비용 낮추는 양자화, 모델 성능까지 떨어뜨려"

인공지능(AI) 모델 추론 비용을 낮추기 위해 활용되는 '양자화' 기술이 오히려 모델 성능을 떨어뜨릴 수 있다는 의견이 나왔다. 29일 업계에 따르면 AI 모델 효율성을 높이기 위해 사용되는 양자화가 한계에 직면했다는 지적이 이어지고 있다. AI 모델 추론과 훈련 비용 문제를 해결하기 위한 수단으로 평가받았지만, 오히려 모델 성능을 저하할 수 있다는 평가다. 최근 AI 복잡성과 훈련 데이터 규모가 늘면서 모델 추론·운영에 드는 비용이 기하급수적으로 늘고 있는 것으로 전해졌다. 업계에서는 AI 모델이 질문에 답하거나 결과를 생성하는 추론 과정에 드는 비용이 늘었다는 분위기다. 이를 해결하기 위한 수단으로 양자화 기술이 활용되기 시작했다. 양자화는 모델이 데이터를 처리할 때 사용하는 숫자 정밀도를 낮추는 기술이다. 이는 모델 추론·계산 과정을 기존보다 빠르게 처리할 수 있게 돕는다. 예를 들어 사람이 AI 챗봇에 "지금 몇 시입니까?"라고 물었을 때 챗봇이 "12시 0분 1초 4밀리초" 대신 "12시"라고 답한다. 챗봇에 탑재된 모델이 양자화 과정을 거쳤기 때문에 답변을 간략히 내놓을 수 있다. 모델은 해당 방식으로 복잡한 추론 과정과 데이터 처리에 드는 정밀도를 줄여 업무를 진행한다. 이를 통해 추론·훈련 비용뿐 아니라 전력 소비까지 줄일 수 있다. 학계에선 AI 양자화가 모델 성능 자체를 떨어뜨릴 수 있다는 지적이 이어지고 있다. 추론 과정서 생기는 정밀도를 줄이면 비용을 낮출 순 있지만 환각현상이 생기거나 복잡한 업무 자체를 처리할 수 없다는 이유에서다. 지난 4월 메타의 '라마3' 성능이 양자화를 거친 후 타사 모델보다 성능 저하를 크게 보인다는 연구 결과가 나오기도 했다. 최근 하버드대와 스탠퍼드대, 메사추세츠 공대, 데이터브릭스, 카네기멜런이 공동 연구한 논문에 따르면 모델 규모가 클수록 양자화로 인한 부정적 영향을 받을 확률이 높은 것으로 전해졌다. 특히 오랜 시간 많은 데이터를 학습한 모델일수록 양자화 과정을 거친 후 성능 저하를 보일 수 있다는 연구 결과다. 해당 연구 1 저자인 하버드대 타니시 쿠마르 수학과 학생은 "양자화를 통해 모델 정밀도를 계속 낮추면 모델 성능이 낮아질 수밖에 없다"며 "모델 추론 비용을 줄이기 위한 지나친 양자화는 장기적으로 문제가 될 수 있다"고 지적했다. 그러면서 "높은 품질 데이터를 선별적으로 사용하거나 저정밀도 환경에서도 안정적으로 작동할 수 있는 새 AI 아키텍처가 필요한 시점"이라고 주장했다. 또 "기업이 대형 모델을 양자화하는 것보다 처음부터 소형 모델 개발하는 것이 이득일 수 있다"고 덧붙였다.

2024.12.29 10:15김미정

Prev 1 2 3 Next