• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
2026전망
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'모델'통합검색 결과 입니다. (543건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

MS, 첫 멀티모달 SLM 공개…저비용·고효율 AI 구현

마이크로소프트가 소규모 언어 모델(SLM) 제품군 파이(Phi)의 신규 모델 2종을 발표했다. 이번 모델들은 적은 컴퓨팅 자원으로도 멀티모달 처리와 경량화된 고성능 AI 모델의 가능성을 확대하는 데 중점을 두고 있다. 3일 마이크로소프트는 SLM 파이4 멀티모달과 파이4 미니를 공개했다고 공식홈페이지를 통해 밝혔다. 파이4 멀티모달은 56억 개의 파라미터를 갖춘 마이크로소프트의 최초 멀티모달 AI 모델로 텍스트, 이미지, 음성을 동시에 처리할 수 있다. 기존 멀티모달 AI가 각각의 입력 유형을 개별적으로 분석한 것과 달리 하나의 모델에서 통합적으로 이해하고 분석할 수 있도록 설계됐다. 이 AI모델은 LoRA 조합 기법(MoL)을 활용해 모델 크기를 최적화하면서도 고성능을 유지하는 것이 특징이다. 허깅페이스 오픈ASR 리더보드에서 6.14%의 단어 오류율(WER)을 기록하며 위스퍼 V2와 같은 오픈소스 음성 인식 모델보다 뛰어난 성능을 기록했다. 마이크로소프트는 파이4 멀티모달이 문서 이해, 차트 및 테이블 해석, 과학적 추론 등의 작업에서 탁월한 성능을 발휘하며, 향후 AI 비서, 음성 기반 서비스, 스마트 기기 등에 폭넓게 적용될 수 있을 것이라고 밝혔다. 이와 함께 파이4 미니는 이 모델은 38억 개의 파라미터를 갖춘 경량화된 고성능 AI 모델이다. 최대 12만8천 토큰 규모의 긴 컨텍스트를 한 번에 처리할 수 있어 코딩, 함수 호출, 과학적 계산, 명령어 실행 등 다양한 텍스트 기반 작업에서 보다 높은 성능을 제공한다 파이4 미니는 작은 규모에도 대규모 AI모델 수준의 성능을 제공할 수 있어 스마트폰, IoT 기기, 자동차, 로봇 등 엣지 디바이스에서 효율적으로 활용 가능하다. 마이크로소프트는 이를 통해 AI 모델을 보다 저렴한 비용으로 다양한 분야에서 효율적으로 운영할 수 있을 것이라고 설명했다. 이제 마이크로소프트는 AI 기술이 단순히 모델 크기를 키우는 방향에서 벗어나, 더 효율적이고 실용적인 모델을 바탕으로 AI사업을 확대할 전망이다. 마이크로소프트의 웨이주 첸 생성형AI 부사장은 "새롭게 선보인 2종의 AI 모델은 복잡한 작업을 효율적으로 처리하도록 설계돼 성능이 제한된 엣지컴퓨팅 환경 등에 이상적"이라며 "낮은 컴퓨팅 요구 사항은 더욱 낮은 대기 시간과 적은 비용을 요구하며 미세 조정이 쉬운 만큼 산업 전반에 걸쳐 다양한 분야에 활용될 수 있을 것"이라고 설명했다.

2025.03.03 09:16남혁우

젝시믹스, 솔로지옥4 화제 중심 '이시안' 모델 계속

액티브웨어 브랜드 젝시믹스 기업 브랜드엑스코퍼레이션(대표 이수연)이 인지도 제고 및 고객과의 접점 확대를 위해 모델 이시안과의 동행을 이어간다고 26일 밝혔다. 젝시믹스는 2022년부터 모델 이시안과 함께 브랜드 이미지를 효과적으로 전달하고 있다. 젝시믹스가 추구하는 밝고 건강한 에너지를 잘 보여주는 모델로서, 업계에서도 꾸준한 자기 관리와 함께 근면하고 성실하다는 평이다. 이시안은 모델 발탁 이후 전 세계 시청자들을 뜨겁게 달군 OTT 넷플릭스 예능 '솔로지옥4'에서 남다른 비주얼과 솔직한 성격으로 화제를 모은 바 있다. 향후 젝시믹스는 국내외에서 꾸준히 인지도를 높이고 있는 이시안과 함께 글로벌 공략에 적극 나선다는 전략이다. 브랜드엑스코퍼레이션 관계자는 "모델 이시안의 밝고 신선한 매력을 통해 고객에게 젝시믹스의 활기찬 에너지를 지속적으로 선보일 예정"이라며 "앞으로도 젝시믹스와 이시안이 함께 선보일 다양한 활동에 많은 기대 부탁드린다"고 말했다. 젝시믹스는 첫 모델인 가수 제시를 시작으로 김종국, 2PM 준호, 스켈레톤 금메달리스트 윤성빈 등을 모델로 앞세워 긍정적이고 건강한 에너지를 전달해 왔다. 지난해부터는 인기 걸그룹 (여자)아이들 멤버인 우기를 한·중 모델로 발탁해 브랜드 이미지 및 가치 제고에 적극 나서고 있다.

2025.02.26 11:18백봉삼

앤트로픽, '클로드 3.7 소네트' 공개…하이브리드 AI 시대 연다

앤트로픽이 실시간 응답과 심층적인 추론을 하나로 통합한 인공지능(AI)을 출시해 거대언어모델(LLM)의 새로운 기준을 제시했다. 보다 직관적인 방식으로 인간과 상호작용하도록 함으로써 갈수록 치열해지는 AI 경쟁에서 우위를 점하려는 전략이다. 25일 테크크런치에 따르면 앤트로픽은 거대언어모델(LLM)과 추론 모델을 결합한 '하이브리드 AI'인 '클로드 3.7 소네트'를 공식 발표했다. 이 모델을 통해 사용자는 기존의 LLM을 활용했을 때처럼 즉각적인 응답을 받을 수도 있고 AI가 보다 깊이 사고하도록 추론을 하게 명령할 수도 있다. 앤트로픽은 '클로드 3.7 소네트'의 추론 기능을 유료 사용자에게만 제공한다고 밝혔다. 무료 사용자에게는 일반적인 답변 기능만 제공되나 전체적인 성능은 기존 모델인 '클로드 3.5 소네트'보다 개선됐다. 가격은 100만 개 입력 토큰당 3달러(한화 약 4천200원), 100만 개 출력 토큰당 15달러(한화 약 2만1천원)다. 오픈AI의 'o3-미니'나 딥시크의 'R1'보다 높은 수준이지만 '하이브리드 모델'이 업계에서 처음으로 도입된 점을 감안하면 향후 가격이 인하될 것으로 예측된다. '클로드 3.7 소네트'는 실전 활용성에도 초점을 맞췄다. 어려운 코딩 문제 해결과 에이전트 기반 작업에서 강력한 성능을 발휘하며 개발자가 추론 시간을 조절할 수 있는 기능도 포함됐다. 이 모델은 '소프트웨어 엔지니어링(Bench SWE)' 벤치마크 테스트에서 62.3% 정확도를 기록해 오픈AI의 'o3-미니'보다 높은 성능을 보였다. 또 AI의 애플리케이션 프로그램 인터페이스(API) 상호작용 능력을 측정하는 'TAU-벤치'에서도 오픈AI의 'o1'을 앞서는 성적을 거뒀다. AI 업계의 반응은 뜨겁다. 소셜미디어에서는 지금까지 출시된 AI 중 최고라는 업계 관계자들의 평가가 잇따르고 있다. 특히 개발자들은 클로드 3.7 소네트가 복잡한 코드베이스를 다루는 능력이 뛰어나다며 극찬하고 있다. 유명 AI 팟캐스터 렉스 프리드먼은 자신의 X 계정에서 "'클로드 3.7 소네트'는 프로그래밍에 가장 적합한 모델"이라며 "AI 경쟁이 정말 치열해지고 있어 살아 있는 것이 신나는 시대"라고 언급했다. '클로드 3.7 소네트'의 등장은 AI 산업의 새로운 흐름을 시사한다. 오픈AI 역시 최근 'GPT-5'를 마지막으로 추론모델인 'o' 시리즈를 폐기하고 기존 GPT 모델에 통합하는 방향을 예고했다. AI 업계가 '하이브리드 모델' 중심으로 재편될 가능성이 높아지고 있는 것이다. 테크크런치는 "앤트로픽의 모델 출시는 AI 연구소들이 신모델을 빠르게 내놓는 치열한 경쟁 속에서 이뤄진 결정"이라며 "오픈AI 등의 경쟁자들도 자체 하이브리드 모델을 내놓으려고 하는 상황에서 회사가 AI 경쟁에서 얼마나 오래 선두를 유지할 수 있을지는 지켜봐야 할 것"이라고 분석했다.

2025.02.25 09:42조이환

한국형 AI 대기질 모델 개발 위해 국내 석학 머리 맞대

환경부 소속 국립환경과학원은 20일과 21일 이틀간 서울 외발산동 메이필드호텔에서 '한국형 인공지능(AI) 대기질 모델 개발 전략 수립'을 위해 전문가 회의(워크숍)를 개최한다. 이번 행사는 국립환경과학원을 비롯한 관측, 배출량, 기상 및 대기질 수치모델, AI 등 국내 분야별 전문가 70여 명이 참가해 분야별 최신 연구 결과를 공유하고 현업 대기질 예측 모델의 문제점과 개선 방안을 논의한다. 20일에는 AI 기술 도입을 통한 대기질 모델 개발을 주제로, 21에는 관측기반 수치모델 개선 방안 마련을 주제로 각각 발표와 토론이 진행된다. 첫날 국립환경과학원이 초미세먼지 정확도 향상을 위해 AI 기술을 적용해 개발한 앙상블 예측시스템 구축 결과를 발표한다. 학계와 산업계에서는 배출량 개선·데이터 융합 등 최신 대기질 모델에 AI 기술을 적용한 사례를 비롯해 초거대 생성형 AI 모델개발 등 분야별 전문가 발표가 이어진다. 마무리 토론에서는 이재범 국립환경과학원 대기질통합예보센터장이 사회를 맡아 한국형 AI 대기질 모델개발 전략 수립을 위한 방향성을 논의한다. 둘째 날은 기상·대기질 관측과 수치모델링 전문가가 모여 AI 모델 예측 성능향상을 위해 학습자료로 활용되는 수치모델의 문제점을 진단하고 최신 모델 적용 결과를 발표한다. 이어지는 토론에서는 수치모델 개선 방향과 우리나라 실정에 맞는 최신 모델 도입과 적용 방안을 모색한다. 금한승 국립환경과학원장은 “이번 행사는 한국형 AI 모델개발을 통해 신뢰도 높은 대기질 예측 정보 생산 체계 마련을 위해 분야별 전문가가 한자리에 모이는 뜻깊은 자리”라며 “이번 전문가 회의를 통해 관련 분야의 전문가 의견을 수렴해 AI 기술을 활용한 대기질 예측 연구를 집중적으로 추진할 계획”이라고 밝혔다.

2025.02.20 07:49주문정

BMW 528i 등 냉각수 펌프 배선 불량 따른 화재위험…자발적 리콜

국토교통부는 기아·BMW코리아·르노코리아·테슬라코리아·재규어랜드로버코리아가 제작하거나 수입판매한 37개 차종 7만6천382대에서 제작결함이 발견돼 자발적으로 시정조치(리콜)한다고 19일 밝혔다. BMW 528i 등 28개 차종 2만4천371대는 냉각수 펌프 배선 커넥터 내 수분 유입에 따른 단락으로 인한 화재 발생 가능성으로 20일부터 시정조치에 들어간다. 테슬라 모델 Y 7천781대는 전자식 파워 어시스트 스티어링(EPAS) 소프트웨어 오류에 따른 조향 보조 기능 저하 또는 상실로 인한 사고 발생 가능성이 있어 21일부터 시정조치한다. 기아 니로 등 2개 차종 3만5천571대는 동승석 하부 전기배선 설계 오류로 동승석 에어백이 전개되지 않거나 미전개 조건에서 비정상 전개되는 등 탑승자 상해 발생 가능성이 있어 26일부터 시정조치에 들어간다. 르노 ARKANA 하이브리드 등 2개 차종 8천56대는 하이브리드 시스템 제어장치와 변압기 소프트웨어 오류에 따른 저속 운행 중 차량 동력 상실로 인한 사고 발생 가능성으로 20일부터 시정조치한다. 재규어랜드로버 디펜더 110 P300 등 4개 차종 603대는 터치스크린 관련 소프트웨어 오류로 후방카메라 화면이 스크린에 표시되지 않아 차량 후진 시 사고 발생 우려가 있어 26일부터 시정조치에 들어간다. 한편, 차량 리콜 대상 여부와 구체적인 결함 사항은 자동차리콜센터에서 차량번호나 차대번호를 입력하면 확인할 수 있다.

2025.02.19 10:59주문정

이상근 교수 "국가 AI 경쟁력, 모델 보유 수로 정해지지 않아"

국가 인공지능(AI) 경쟁력을 평가할 때 모델 보유 수로 AI 우수성을 단정 지어선 안 된다는 지적이 나왔다. 고려대 이상근 정보보호대학원 교수는 17일 한국과학기술한림원이 개최한 '딥시크 파장과 미래 전망'에서 국가 AI 경쟁력에 대해 이같이 밝혔다. 국가가 초거대 AI 모델을 많이 가졌다고 해서 강력한 경쟁력을 보유한 것은 아니라는 설명이다. 이 교수는 최근 발간된 소프트웨어정책연구소(SPRi) 보고서를 언급했다. SPRi는 미국 연구단체 에포크(Epoch) AI 데이터를 분석한 '글로벌 초거대 AI 모델 현황' 보고서를 발표했다. 지난해 기준 한국이 초거대 AI 모델 3개를 추가 공개하면서 총 14개 모델을 보유했다는 내용이다. 모델 보유 건수를 근거로 한국이 3위를 차지했다는 소식이 담겨있다. 이 교수는 "모델 개수가 곧 AI 경쟁력인지 따져봐야 한다"고 지적했다. 이어 "모델 수로만 AI 우수성을 평가할 수 없다"며 "이를 평가하는 기준도 매우 다르므로 논리적 오류가 생길 수 있다"고 지적했다. 그는 "모델을 많이 갖고 있는 것이 AI 개발을 잘 한다는 것은 아니다"며 "이런 접근은 잘못된 일반화를 만들 수 있다"고 주장했다. 이 교수는 LM테스트닷컴의 글로벌 초거대 AI 모델 순위를 근거로 예시를 들었다. 해당 사이트는 대학원 수준 문제 해결 능력으로 모델을 분류한다. 상위 60개 모델 중 미국이 42개, 중국은 11개, 프랑스가 4개, 이스라엘이 2개, 캐나다가 1개 모델을 각각 차지했다. 다만 전체 70개 모델 중 한국 모델은 포함되지 않았다. 또 미국 보스턴컨설팅그룹이 73개국 대상으로 실시한 연구에 따르면 한국은 AI 성숙도 부문에서 2군인 상태다. 1군은 미국과 중국, 영국, 캐나다, 싱가포르다. 해당 국가는 'AI 선도 국가'로 분류됐다. 반면 한국은 프랑스, 일본, 대만, 이스라엘, 호주 등과 'AI 안정 국가'로 나뉘어져 있다. 이 교수는 "한국 AI 경쟁력에 대해 보다 냉철하게 점검해야 한다"고 강조했다.

2025.02.17 17:23김미정

AI도 표현의 자유 얻나…오픈AI, 민감이슈 답변 허용·검열 수위 낮춘다

오픈AI가 '지적 자유'를 핵심 원칙으로 인공지능(AI) 모델 훈련 정책을 변경한다. 보다 개방적인 방식으로 질문에 답하고 다양한 관점을 제공하며 기존에 다루지 않았던 논란의 여지가 있는 주제에 대해서도 대응할 방침이다. 17일 테크크런치 등 외신에 따르면 오픈AI는 새로운 모델 사양(Model Spec)을 공개했다. 모델사양은 AI를 훈련시키는 과정에서 행동 지침과 설계 원칙을 담은 문서다. 어떤 방식으로 응답하고 무슨 기준을 가지고 판단해야 하는지 등을 규정해 AI가 답변이나 데이터를 생성하는 등 업무를 수행하는 과정에서 정확성을 높이고 합성된 허위데이터로 인한 환각 현상 등을 제거해 제어력을 향상시키는 것을 목표로 한다. 이번에 오픈AI가 공개한 최신 모델 사양은 187페이지 분량으로 AI 모델이 거짓을 말하지 않고 중요한 맥락을 생략하지 않으며 중립적 태도를 유지해야 한다는 원칙을 중심으로 구성됐다. 기존에는 민감한 사안에 대해 답변을 거부하거나 어느 한쪽 입장에 기울어질 경우 정책 위반 경고를 띄워 사용자를 제지했지만, 이제는 '지적 자유(intellectual freedom)'를 보장한다는 대원칙 하에 더욱 폭넓은 영역에서 답변을 허용하는 방향으로 선회한다는 것이다. 이번에 공개된 모델 스펙에 따르면 오픈AI는 '거짓말 금지'와 '함께 진실을 탐색한다'는 새로운 슬로건을 강조한다. 사용자의 질문에 대해 맥락과 사실 관계를 충분히 전하며 특정 진영의 주장을 배제하기보다는 다양한 관점을 함께 제시함으로써 중립성을 지키겠다는 취지로 해석된다. 예를 들어 사회 운동 관련 질문이 들어올 경우 '인류에 대한 포괄적 존중'을 전제하면서 양측의 시각을 동시에 보여주는 식으로 답변을 유도한다고 한다. 논쟁이 뜨거운 주제에 대한 언급이라 할지라도, 가능한 한 답변을 거부하지 않고 다양한 시각과 사실적 근거를 함께 제시하겠다는 것이다. 오픈AI는 여전히 허위 정보를 조장하거나 증오·폭력을 선동하는 발언 등 '명백히 해롭고 악의적인' 요청은 제한할 수 있다고 설명한다. 다만 사용자의 체감상 느끼는 '검열' 수준은 대폭 낮추겠다는 게 핵심이다. 실제로 챗GPT가 사용자의 정책 위반 여부를 지적하는 경고 문구를 일단 제거해 답변 과정에서 사용자와의 충돌을 완화하는 모습이 포착되기도 했다. 업계에서는 오픈AI의 이런 노선 변경이 새로운 정치 환경과도 연관이 있을 수 있다는 추측을 내놓는다. 일부 전문가는 재집권한 트럼프 행정부가 기술 기업 중 특히 빅테크가 제공하는 서비스가 '정치적 중립'을 유지하고 있는지 예의주시해 왔다는 점을 들어, 오픈AI가 선제적으로 '지적 자유'를 표방하며 보수 진영을 비롯한 다양한 계층의 신뢰를 얻으려는 포석으로 해석 중이다. 다만 오픈AI 대변인은 "특정 정부나 정치 세력을 의식해 정책을 바꾼 것은 아니다"며 "사용자가 다양한 정보를 접하고 스스로 판단하도록 돕는 것은 오픈AI의 오랜 신념"이라고 일축했다. 이러한 변화는 AI 업계 전반에서도 큰 흐름으로 자리 잡을 조짐이다. 기존에는 선거 관련 정보 제공이나 민감한 정치·사회 이슈에 대해 AI가 답변하는 것을 위험하다고 보고 일괄 차단하는 방식이 주류였다면, 이제는 발전된 AI 모델의 기술력과 정책적 안전장치를 기반으로 한층 개방적으로 답변을 허용하려는 분위기가 확산되는 것이다. xAI나 메타 등 다른 기업들도 표현의 자유를 최대한 보장하겠다고 표명하고 나섰다. 또 다른 맥락에서 오픈AI의 이번 정책 변화는 자사의 차세대 대규모 데이터센터 건설 프로젝트인 '스타게이트'와 함께 언급되기도 한다. 대규모 인프라 투자에서 정부 규제는 상당한 변수로 작용하므로, 특히 미국 정부와의 원활한 관계를 유지하는 것이 중요하다는 해석이다. 오픈AI는 신규 모델 사양을 오픈소스 라이선스 정책에 따라 퍼블릭 도메인으로 공개한다고 밝혔다. 퍼블릭 도메인은 저작권의 보호를 받지 않아 누구나 자유롭게 다운로드, 복제, 수정, 배포할 수 있으며 상업적 용도로도 사용할 수 있다. 오픈AI 측은 "우리의 목표는 유용하고 안전하며 사용자와 개발자의 요구 사항에 맞는 모델을 만드는 동시에 인공일반지능(AGI)이 모든 인류에게 이롭다는 사명을 발전시키는 것"이라며 "이 목표를 달성하려면 개발자와 사용자에게 권한을 부여하는 모델을 반복적으로 배포해야 하며 모델이 사용자나 다른 사람에게 심각한 해를 끼치지 않도록 방지하고 오픈AI의 운영 라이선스를 유지해야 한다"고 설명했다. 이어 "이번 업데이트는 임의의 제한 없이 AI를 탐색하고, 토론하고, 창조할 수 있는 사용자 정의, 투명성 및 지적 자유에 대한 우리의 헌신을 강화하는 동시에 실제 피해의 위험을 줄이기 위한 가드레일을 유지할 것"이라고 덧붙였다.

2025.02.17 10:28남혁우

"인간처럼 AI도 늙는다"…구형 모델, '인지 저하' 겪어

시간이 흐르면서 인공지능(AI) 모델도 사람처럼 '인지 저하'를 겪을 수 있다는 우려가 나왔다. 17일 영국의학저널(BMJ)에 따르면 거대언어모델(LLM) 기반 AI 챗봇 테스트 결과 이같은 연구 결과가 나온 것으로 전해졌다. 인간이 나이가 들수록 기억력 감퇴나 치매를 겪는 것처럼 AI도 비슷한 현상을 보인다는 설명이다. 연구진은 오픈AI '챗GPT'와 앤트로픽 '소네트', 구글 '제미나이' 등 LLM 기반 챗봇 대상으로 몬트리올 인지 평가(MoCA) 테스트를 진행했다. MoCA는 알츠하이머나 치매 등 인지 장애를 평가하는 검사다. 주의력과 기억력, 언어 능력, 공간 인지, 실행 기능 등을 측정한다. 실험 결과 모델 중 가장 최신 버전인 GPT-4o는 30점 만점 중 26점을 받아 정상 범주에 해당하는 점수를 기록했다. 상대적으로 구형 모델인 제미나이1.0은 16점에 그쳤다. 챗봇들은 이름 맞히기, 주의력, 언어 능력, 추상적 사고 영역에서 비교적 우수한 점수를 기록했다. 공간 인지, 실행 기능과 관련한 평가에서는 구형 모델일수록 낮은 점수를 받았다. 특히 기억 영역에서 가장 큰 격차를 보였다. 연구를 주도한 이스라엘 하다사 의료센터 로이 다얀 신경과학자는 "AI가 시각적 추상화(visual abstraction)와 실행 기능(executive function)이 필요한 작업에서 신뢰할 수 없는 결과를 낼 가능성이 높다"며 "AI가 인간을 대체하는 데 있어 치명적 한계를 가질 수 있을 것"이라고 지적했다. AI와 인간 인지 기능은 본질적으로 다르므로 직접적인 비교는 어렵다. 다만 연구진은 이번 보고서를 통해 AI 한계를 고려해야 한다는 점을 당부했다. 특히 의료 현장에서 AI를 활용할 때 이를 보완할 방안이 필요하다고 강조했다. 일각에선 AI 모델의 장기적 신뢰성 확보 중요성이 높아질 것이라는 전망이 나왔다. 신경학자들은 "인지 장애를 겪는 AI를 진단·관리할 수 있는 새 시장이 열릴 것"이라고 봤다.

2025.02.17 09:21김미정

韓, 초거대 AI 모델 수 세계 3위지만…미·중과 격차 커

한국이 미국, 중국에 이어 세계에서 3번째로 초거대 인공지능(AI) 모델을 많이 보유한 것으로 나타났다. 14일 소프트웨어정책연구소(SPRi)가 미국 연구단체 에포크(EPOCH) AI 데이터를 분석한 '글로벌 초거대 AI 모델 현황' 보고서에 따르면 한국이 지난해 초거대 AI 모델 3개를 추가 출시하면서 총 14개 모델을 보유한 것으로 전해졌다. 국가별 순위로는 한국이 3위다. 128개 모델을 보유한 미국과 95개를 갖고 있는 중국이 각각 1, 2위를 기록했다. 프랑스는 10개, 일본과 독일은 각각 4개를 보유해 4, 5위로 뒤를 이었다. 기업별로는 LG가 5개 모델을 보유하며 국내에서 가장 많은 초거대 AI를 개발했다. 이어 네이버와 삼성은 각각 3개, KT·NC소프트·코난테크놀로지가 각 1개의 모델을 출시한 것으로 나타났다. 보고서는 2024년 기준 초거대 AI 모델을 3개 이상 출시한 기업·기관을 보유한 국가 순위에서도 한국이 프랑스와 공동 3위를 차지했다고 분석했다. 전 세계 초거대 AI 모델 증가세가 이어진 것으로 나타났다. 2020년부터 2024년까지 전 세계에서 총 271개의 초거대 AI 모델이 개발됐다. 지난해만 122개 초거대 AI 모델이 개발됐으며 109개를 기록한 2023년에 이후 지속적으로 증가세를 보였다. SPRi 봉강호 선임연구원은 "최근 초거대 AI 경쟁이 치열해지며 한국도 지속적으로 경쟁력을 유지하고 있다"며 "시장이 빠르게 변화하는 만큼 민·관 협력을 통한 기술 개발과 생태계 조성이 더욱 중요해질 것"이라고 강조했다.

2025.02.14 18:05김미정

"앤트로픽, 클로드 새 모델 공개 임박?"…출시설에 AI 업계 촉각

앤트로픽이 추론과 신속 응답을 결합한 '하이브리드' 인공지능(AI) 모델을 개발하고 있는 것으로 보인다. 최근 AI 업계에서는 주요 기업들이 잇따라 신형 모델을 출시하며 기술 경쟁이 격화되고 있어 앤트로픽의 행보에도 관심이 집중되고 있다. 14일에 디인포메이션에 따르면 앤트로픽은 향후 몇 주 안에 차세대 AI 모델을 출시할 계획을 가지고 있는 것으로 알려졌다. 이번 모델이 도입할 가능성이 높은 핵심 기술 중 하나는 '슬라이딩 스케일' 기능이다. 이 기능을 활용하면 AI의 연산 모드를 조절해 성능을 최적화할 수 있다. 앤트로픽 내부 직원들은 신형 AI 모델이 일부 프로그래밍 작업에서 오픈AI의 'o3-미니-하이' 모델을 능가하는 성능을 보였다고 전했다. 이에 따라 이 모델은 대규모 코드베이스 분석 및 비즈니스 활용에서도 강점을 가질 것으로 예상된다. 앤트로픽의 이번 행보는 AI 업계의 치열한 경쟁 구도 속에서 나온 결정으로 보인다. xAI의 최고경영책임자(CEO)인 일론 머스크 역시 지난 13일 두바이에서 열린 행사에서 "우리 AI 모델 '그록 3'가 최종 개발 단계에 있다"며 "향후 1~2주 내 출시될 것"이라고 밝힌 바 있다. 다만 이번 보도는 내부 정보망을 기반으로 한 것으로, 출시 여부와 정확한 일정은 공식적으로 확인되지 않았다. 업계에서는 앤트로픽의 신형 AI 모델이 오픈AI, 구글, xAI를 비롯한 경쟁사들과의 기술 격차를 줄이는 계기가 될지 주목하고 있다. 다리오 아모데이 앤트로픽 대표는 최근 테크크런치와의 인터뷰에서 "우리는 자체적으로 더 차별화된 추론 모델을 만드는 데 집중하고 있다"며 "일반 모델과 추론 모델을 구분하는 기존 개념이 다소 이해하기 어렵다"고 밝혔다.

2025.02.14 10:04조이환

"업무 생산성 게임체인저"…코난테크놀로지, AI 기반 검색 플랫폼 'RAG-X' 공개

인공지능(AI) 기반 검색 기술이 기업 경쟁력의 핵심 요소로 떠오르는 가운데 기업 맞춤형 솔루션을 개발해온 코난테크놀로지가 자사 AI 검색 플랫폼의 본격적인 시장 진입을 예고했다. 코난테크놀로지는 기업용 AI 검색 플랫폼 '코난 검색증강생성(RAG)-X'의 베타 테스트를 진행 중이라고 13일 밝혔다. 이 솔루션은 기업 내부 데이터, 실시간 웹사이트, 고객 맞춤형 사이트까지 검색 결과를 통합해 AI가 즉각적인 답변을 제공하는 B2B형 플랫폼이다. '코난 RAG-X'는 단순 검색을 넘어 AI가 종합적이고 심층적인 답변을 생성하는 것이 특징이다. 기존 웹 기반 검색 서비스와 달리 검색 증강 생성(RAG) 기술을 활용해 내부 문서, 데이터베이스(DB), 외부 사이트 정보까지 아우르며 기업에 최적화된 정보를 제공한다. 일례로 사용자가 특정 산업 동향에 대한 최신 정보를 요청하면 AI가 내부 자료와 실시간 웹사이트 데이터를 분석해 핵심 변화를 정리하고 보고서 초안까지 생성한다. AI의 답변에는 모든 출처가 명확하게 표시되며 연관 검색어나 참고자료도 자동 추천된다. 이같은 기능을 통해 기업들은 수작업으로 정보를 찾을 필요 없이 원클릭 검색만으로 신속하고 정확한 답변을 제공받을 수 있다. 업무 생산성을 높이고 시장 분석·경쟁사 동향 파악·신제품 조사·정책 연구 등 다양한 분야에서 활용될 것으로 기대된다. 코난테크놀로지는 지난 1999년 설립 이후 AI 검색엔진 '코난 서치'를 포함해 2천900여 개 기업과 3천400건 이상의 프로젝트를 수행하며 기술력을 입증해왔다. 특히 자체 개발한 대규모 언어 모델 '코난 거대언어모델(LLM)'은 지난해 미국 스탠퍼드대학의 AI 생태계 분석 리포트 '에코시스템 그래프'에 포함되며 글로벌 경쟁력을 인정받았다. 현재 '코난 RAG-X'는 200여 명의 사내 인력과 일부 고객사를 대상으로 비공개 베타 테스트를 진행 중이다. 다음달 정식 출시를 목표로 서비스 안정성과 성능을 최적화하고 있다. 코난테크놀로지는 또 '코난 LLM'의 차세대 버전도 다음 달 공개할 예정이다. 최신 AI 연구 트렌드에 맞춰 추론 데이터와 인스트럭션 튜닝을 대폭 강화해 한층 업그레이드된 성능을 선보일 계획이다. 김영섬 코난테크놀로지 대표는 "검색 품질에 대한 기대가 높아지는 가운데 기업 맞춤형 검색 수요도 증가하고 있다"며 "새로운 생성형 AI 경험을 통해 고객의 비즈니스 혁신을 적극 지원하겠다"고 밝혔다.

2025.02.13 14:45조이환

"오라클·엔비디아가 인정했다"…베슬AI, 엔터프라이즈 시장 공략 본격화

베슬AI가 오라클·엔비디아와 손잡고 엔터프라이즈 인공지능(AI) 시장 공략에 나선다. 기업 환경에 최적화된 AI 오케스트레이션과 프라이빗 거대언어모델(LLM) 솔루션을 앞세워 글로벌 시장에서 입지를 확대하려는 전략이다. 베슬AI는 오는 18일 미국 캘리포니아 레드우드시티에서 공동 AI 밋업을 개최한다고 13일 밝혔다. 회사는 현재 오라클 글로벌 파트너 네트워크(OPN) 멤버이자 엔비디아 인셉션 프로그램 참여 기업이다. 업계에서는 이번 행사를 두고 베슬AI가 실리콘밸리 AI 생태계에 성공적으로 안착했음을 보여주는 자리로 평가하고 있다. 행사에서는 오라클, 엔비디아, 베슬AI의 AI 전문가들이 차세대 AI 기술과 인프라 구축 전략을 발표할 예정이다. 오라클에서는 클라우드 인프라(OCI)의 생성형 AI 부문을 이끄는 수지스 라비 부사장이 연사로 나선다. 엔비디아는 AI 엔터프라이즈 제품을 총괄하는 아델 엘 할락 디렉터가 발표를 맡는다. 베슬AI에서는 AI 에이전트 플랫폼 개발을 담당하는 이재준 엔지니어링 매니저가 연단에 선다. 그는 멀티·하이브리드 클라우드 환경에서 AI를 최적화하는 오케스트레이션 기술과 기업 AI 도입 전략을 소개할 예정이다. 베슬AI의 머신러닝 운영(MLOps) 플랫폼 '베슬(VESSL)'은 AI 모델 개발 시간을 주당 200시간 이상 단축하고 배포 속도를 4배 향상한 것으로 알려졌다. 베슬AI는 이번 협력을 계기로 온프레미스·클라우드·하이브리드 환경 전반에서 AI 인프라 구축을 강화할 계획이다. 특히 오라클의 월 고정 요금제 클라우드 서비스와 엔비디아의 그래픽 처리장치(GPU) 최적화 기술을 결합해 기업의 AI 도입 비용을 절감하는 방안을 추진한다. 금융·의료 등 보안과 컴플라이언스가 중요한 산업군에서도 프라이빗 LLM을 활용해 AI 도입을 가속화할 전망이다. 안재만 베슬AI 대표는 "이번 밋업을 통해 최신 AI·ML 트렌드를 공유하고 글로벌 기업들과 협업 방안을 모색하는 자리가 될 것"이라며 "오라클과 엔비디아의 글로벌 역량과 시너지를 바탕으로 기업용 AI 시장의 혁신을 주도해 나가겠다"고 밝혔다.

2025.02.13 10:56조이환

삼성전자 최연소 임원 출신이 만든 '이곳'…新 AI 모델로 中 딥시크 뛰어 넘나

투플랫폼이 50개 이상의 언어가 가능한 추론형 생성형 인공지능(AI) 모델을 새롭게 선보이며 글로벌 사업 확대에 본격 나선다. 투플랫폼은 최근 해당 모델에 독자적인 듀얼 트랜스포머 아키텍처를 적용한 '수트라-R0'를 공식 출시했다고 12일 밝혔다. 지난해 다국어 특화 생성 AI 모델 '수트라'를 공개한 데 이어 이번에는 복잡한 문제를 해결할 수 있는 추론형 AI로 라인업을 확장했다. 지난 2021년 설립된 투플랫폼은 실리콘밸리에 본사를 두고 한국과 인도를 거점으로 사업을 전개하고 있다. 삼성전자 최연소 임원 출신 프라나브 미스트리가 창업한 이 회사는 지난해 AI 소셜 앱 '재피'를 선보이며 50만 명의 사용자를 확보했다. 이후 AI 전환을 원하는 기업을 대상으로 독자 기술 기반의 AI 모델을 제공하며 빠르게 성장했다. '수트라-R0'는 비용 대비 성능을 극대화한 것이 특징이다. 자체 개발한 다국어 토크나이저와 듀얼 트랜스포머 아키텍처를 통해 낮은 사양의 그래픽 처리 장치(GPU)에서도 구동이 가능하며 토큰 처리 비용을 줄여 기업들의 운영 부담을 최소화했다. 이에 따라 한국의 금융 기업, 인도의 대형 소매 기업 등 여러 엔터프라이즈 고객을 유치하는 데 성공했다. 추론 성능도 대폭 향상됐다. '수트라-R0'는 금융 리스크 평가, 시장 분석, 의료 데이터 해석, 고객 서비스 자동화 등 다양한 분야에서 활용될 수 있다. 특히 힌디어·구자라트어 등 여러 언어의 벤치마크 테스트에서 오픈AI, 딥시크, 라마 등 경쟁 모델을 뛰어넘는 성능을 기록했다. 한국어 성능도 딥시크 'R1', '라마 3.3 70B' 모델보다 우수한 것으로 나타났다. 투플랫폼은 인도 최대 통신사 지오 플랫폼, 한국 네이버 스노우 등으로부터 투자를 유치하며 성장세를 이어가고 있다. 독자 모델을 공개한 지난해 약 100억원의 매출을 기록했으며 올해는 이를 대략 세 배 늘려 280억원을 목표로 잡았다. 향후 투플랫폼은 AI 모델을 더욱 고도화할 계획이다. 후속 모델로 산업 트렌드 예측, 이상 탐지, 선제적 의사 결정을 지원하는 '수트라-P0'도 준비 중이다. 프라나브 미스트리 투플랫폼 대표는 "한국과 미국에서의 비즈니스 경험과 인도의 언어·문화적 이해를 바탕으로 다국어 성능이 우수한 AI 모델을 만들었다"며 "'수트라-R0'를 통해 전 세계 기업들의 AI 활용 격차를 해소하는 데 기여하겠다"고 밝혔다.

2025.02.12 15:11조이환

"너도 나도 차단인데"…검색 시장 노린 이스트소프트, 앨런에 中 딥시크 적용 괜찮을까

보안 우려로 국내외서 중국 딥시크에 대한 경계령이 내려진 가운데 이스트소프트가 자사 인공지능(AI)에 이를 적용해 주목된다. 보안 기술을 강화한 만큼 검색 품질과 정보 신뢰도에 문제가 없다는 입장으로, 이번 일로 AI 검색 엔진 시장에서 존재감을 끌어올린다는 목표다. 이스트소프트는 자사 AI 검색 엔진 서비스 '앨런'에 딥시크가 지난달 20일 발표한 추론 특화모델인 'R1'을 적용했다고 10일 밝혔다. '앨런'은 사용자가 원하는 정보를 빠르고 정확하게 제공하는 AI 검색 엔진으로, 멀티 거대언어모델(LLM)을 기반으로 한 서비스 구조를 지향하면서 이번 'R1' 적용을 통해 검색 결과의 정교함을 한층 높였다. 이스트소프트가 운용하는 'R1'은 오픈소스를 기반으로 중국 본토의 딥시크와 완전히 분리돼 독립적인 클라우드 환경에서 구동된다. 이로 인해 정보 왜곡이나 외부 유출 우려 없이 안정적인 AI 추론 기능을 활용할 수 있다. 특히 이스트소프트의 보안 자회사 이스트시큐리티가 개발한 '알약xLLM'을 기반으로 데이터 유출 방지 기능을 강화했다. 이번 'R1' 적용으로 '앨런'은 기존보다 정밀한 검색 결과를 제공할 수 있게 됐다. 일례로 '맨해튼이 여의도의 몇 배인지' 묻는 질문에 기존 버전은 단순 계산 값을 제공했지만 새 버전은 여의도의 다양한 면적 기준을 고려한 비교 분석까지 제시한다. 딥시크 'R1'은 직접 사용할 때보다 앨런을 통해 활용할 경우 검색 품질이 더욱 향상되는 것이 특징이다. 오늘 저녁 메뉴 추천 요청 시 딥시크는 한식·중식·일식 등 음식 종류만 나열하지만 '앨런'의 'R1'은 날씨와 영양 정보까지 고려해 맞춤형 추천을 제공한다. 정보 왜곡 문제에서도 '앨런'의 'R1'은 강점을 보인다. 김치가 어느 나라 음식인지에 대해 한국어와 중국어로 각각 질문한 결과 '앨런'의 'R1'은 모두 한국의 전통 음식이라고 답했다. 이와 반대로 기존 딥시크는 중국어 질문에 대해 '동아시아 전통 음식'이라고 답하며 정보 해석에서 차이를 보였다. 또 정치적으로 민감한 질문에도 앨런의 'R1'은 중립적인 사실 기반의 답변을 제공했다. 현재 '앨런'은 검색창에서 LLM 선택 기능을 제공해 사용자가 직접 R1을 선택할 수 있도록 한다. 이스트소프트는 비용 효율성이 높은 'R1' 적용을 계기로 무료 기능을 확장하고 회원 가입 없이도 앨런을 사용하게끔 지원할 계획이다. 정상원 이스트소프트 대표는 "앨런은 글로벌 LLM 기술 경쟁을 기회로 삼아 서비스 품질과 비용 효율성을 동시에 개선하고 있다"며 "앞으로 AI 검색 엔진 서비스로서 글로벌 AI 기술을 가장 빠르게 접할 수 있는 플랫폼이 될 것"이라고 밝혔다.

2025.02.10 18:18조이환

코난테크놀로지, 의료분야 국내 첫 LLM 기반 진료 플랫폼 개발

코난테크놀로지(대표 김영섬)가 생성형인공지능(AI) 기술을 기반으로 의료 분야에 특화된 대규모언어모델(LLM)을 선보인다. 코난테크놀로지는 한림대학교 의료원과 '생성형AI기반 입원환자 전주기 기록지 작성 및 의료원 지식상담 플랫폼 구축' 사업을 계약했다고 5일 밝혔다. 이 사업은 한림대학교의료원과 협력하여 국내 의료 분야에 특화된 생성형 AI 플랫폼을 개발하고 적용하는 것을 목표로 하며, 양 기관은 오는 7월까지 의료 AI 솔루션 공동 개발에 나서게 된다. 입원환자 전주기 의무기록은 접수부터 진료, 검사, 경과 기록, 퇴원까지 모든 과정을 아우르는 통합 기록 시스템으로, 의료 기록 전 과정에 LLM 기술을 적용하는 사례는 국내 최초다. 이에 따라 의무기록 작성에 소요되는 시간이 연간 최대 절반까지 단축될 것으로 예상되며, 실시간 데이터 분석과 함께 입력 오류도 줄어들어 의료기록의 정확성이 한층 높아질 전망이다. 생성형 AI가 의료 현장에 도입되면, 환자 관리와 케어에 더 많은 시간을 할애할 수 있는 환경이 조성되어 궁극적으로 의료 서비스의 품질 향상으로 이어질 것으로 기대된다. 양 기관은 의료 기록 시스템 외에도 검색 증강 생성(RAG) 기술을 활용한 지식 상담 플랫폼을 개발해 의료진과 교직원의 실시간 정보 검색과 상담을 지원할 계획이다. 윤리적 AI 설계와 안전 필터링으로 정보 신뢰성을 강화하며, AI 오남용 방지를 위한 대응 시스템도 구축한다. 김규훈 코난테크놀로지 사업부장은 "생성형 AI 기술을 적용해 병원 행정과 진료 과정에서 업무를 효율화하려는 시도가 늘어나는 만큼, 의무기록 작성 AI 서비스를 시작으로 의료 AI 시장의 수요에 민첩하게 대응하며 관련 모델 고도화와 제품화를 이어가겠다"고 포부를 전했다. 한림대학교의료원은 초기 개념검증(PoC) 단계부터 서비스 기획, 의료진 인터뷰, 방향성 도출까지 사업의 주요 과정을 주도적으로 이끌었다. 코난테크놀로지는 한림대학교의료원이 제공한 실무적 통찰과 피드백, 그리고 의료 AI의 특수성을 반영한 철저한 검증을 기반으로 안전하고 신뢰성 높은 의료 AI 솔루션을 고도화 해나갈 예정이다.

2025.02.05 16:46남혁우

오픈AI, 韓 기업 연쇄 회동…카카오·삼성 만나 '수익' 실현하나

샘 알트먼 오픈AI 최고경영자(CEO)가 한국을 방문해 카카오, SK, 삼성, 크래프톤 등 주요 대기업 및 스타트업과 연쇄 회동을 가졌다. 글로벌 인공지능(AI) 시장 경쟁이 치열해지는 가운데 수익성 강화를 위해 국내 기업들과의 협력·투자 유치를 추진하기 위함이다. 4일 업계에 따르면 알트먼 CEO는 이날 오전부터 빡빡한 일정을 이어갔다. 오전 8시부터 최태원 SK그룹 회장과 약 40분간 간담회를 진행했으며 9시에는 회사가 주최하는 개발자 행사 '오픈AI 빌더랩'에 참석했다. 이 자리에는 네이버, LG AI 연구원 등 IT 대기업과 뤼튼테크놀로지스, 와들, 포티투마루 등 국내 신생 AI 기업들의 개발자들이 대거 참석해 오픈AI의 기술과 전략에 대한 논의를 진행했다. 빌더랩 질의 응답에 참가한 알트먼 CEO는 오전 10시 40분부터 김창한 크래프톤 대표와 만나 AI 게임 캐릭터(CPC) 및 게임 특화 AI 모델 최적화 협력 방안을 논의했다. 이후 11시에는 카카오톡 미디어 간담회에 모습을 드러냈다. 이 자리에서는 카카오와 함께 '챗GPT' 기술을 카카오톡과 카카오의 새 AI 서비스 '카나나(Kanana)'에 통합한다고 전격 발표했다. 이에 따라 카카오는 '챗GPT' 엔터프라이즈를 회사 서비스에 전면적으로 적용하게 된다. 카카오와의 협력 발표가 끝난 후 그는 극비리에 방한한 손 마사요시 소프트뱅크 회장과 함께 삼성전자 서초사옥을 찾았다. 업계에서는 이 자리에서 AI 반도체, AI TV, AI 특화 디바이스 개발 등이 주요 의제로 다뤄졌을 것으로 본다. 특히 알트먼 CEO가 지난달 도널드 트럼프 전 미국 대통령이 발표한 대규모 데이터 센터 건설 사업인 '스타게이트 프로젝트' 참여를 삼성전자에 요청했을 가능성도 제기된다. 업계에서는 이처럼 알트먼 CEO가 동분서주하는 이유로 현금과 수익성 확보가 절실하기 때문이라고 분석한다. 현재 오픈AI는 세계 1위 AI 업체로 평가받으며 기업가치 1천570억 달러(한화 약 2천290조원)를 기록 중이지만 '챗GPT'의 B2C 수익만 놓고 보면 적자 상태인 것으로 알려졌다. 실제로 회사는 지난해 기준 매출 37억 달러(한화 약 51조원)에 적자 50억 달러(한화 약 68조원)를 기록한 상황으로, 올해 매출은 전년 대비 2배 이상 늘어날 것으로 전망됨에도 여전히 적자를 벗어나기 어려울 것으로 예상된다. 실제로 샘 알트먼 CEO는 지난달 자신의 X 계정에 "챗GPT '프로'를 발표한 뒤 너무 많은 사람이 사용해 적자를 보고 있다"며 "월 200달러(한화 약 30만원) 정도 구독료를 책정하면 수익을 낼 수 있으리라 봤다"고 언급했다. 이같은 상황 속에서 알트먼 CEO의 국내 방문과 협력 모색은 국내 IT·빅테크 업계와 협업 계획을 적극 추진하고 투자를 유치하면서 파트너 범위를 넓히려는 행보로 풀이된다. 특히 카카오와의 전면적인 협력은 오픈AI가 안정적 수익 창출원을 확보하기 위한 중요한 포인트로 해석된다. 이용자가 5천만 명에 달하는 카카오 플랫폼은 단숨에 대규모 사용자를 확보할 수 있는 통로이기 때문이다. 빌더랩 행사에 국내 주요 IT 대기업과 스타트업의 개발자들을 초청한 것도 같은 맥락으로 분석된다. 초대된 개발자들이 오픈AI 기술을 직접 체험하게 함으로써 잠재적인 파트너 풀을 확대해 API를 도입하게 함으로써 B2B 사업을 장기적으로 확장할 수 있다는 계산이다. 이날 빌더랩에 참석한 한 업계 관계자는 "질의응답 시간에 알트먼이 한국을 두고 AI 발전에 필요한 핵심 요소를 갖춘 장소'라고 강조했다"며 "오픈AI가 국내 IT 서비스 기업들에게도 경쟁력 있는 파운데이션 모델 API를 공급하려는 의지가 강하게 드러났다"고 설명했다. 이 같은 국내 협력 논의는 투자 유치와도 연결된다. 오픈AI는 B2B 확장을 통해 새로운 매출원을 발굴하는 동시에 글로벌 투자자들로부터 대규모 자금을 조달하려는 움직임을 보이고 있기 때문이다. 실제로 삼성전자와의 3자 대담에 동석한 손 마사요시 소프트뱅크 회장은 지난 3일 일본 도쿄에서 이미 알트먼 CEO와 별도로 회동해 투자 확대 방안을 논의했다. 소프트뱅크 그룹은 연간 30억 달러(한화 약 4조 원) 규모로 오픈AI의 도구를 자사 계열사에 도입하겠다는 계획을 발표했으며 지난달에는 '스타게이트' 프로젝트의 출자자로서 전면적인 지원을 아끼지 않겠다고 밝히며 사실상 오픈AI와 전략적 동맹 관계를 구축한 상태다. 오픈AI가 국내에서 투자 유치와 기업 협력을 강화하는 이유 중 하나는 최근 중국 AI 업계의 급부상이다. 중국 AI 스타트업 딥시크(DeepSeek)가 출시한 'R1' 모델이 업계에 거대한 지각변동을 일으키고 있기 때문이다. 지난달 20일 공개된 'R1'은 출력 토큰 100만 개당 2.19달러(한화 약 3천 원)로, 이는 오픈AI의 'o1' 모델 대비 97%나 저렴한 수준이다. 이미 아마존, MS, 퍼플렉시티 등 글로벌 IT 기업들이 딥시크 모델의 도입을 검토하거나 추진하면서 오픈AI 역시 비용 경쟁력을 확보하고 시장 대응 속도를 높이는 것이 시급해졌다. 다만 오픈AI의 한국 시장 내 입지는 오히려 더 강화될 가능성이 크다는 분석도 제기된다. 보안 문제로 인해 국내 IT 기업들은 중국산 LLM API 활용에 제약을 받을 가능성이 높으며 상대적으로 보안 신뢰도가 높은 오픈AI를 선호하는 기업이 많다는 점이 그 이유다. 이에 따라 오픈AI는 한국 시장을 AI 기반 B2B 사업 확장의 주요 거점으로 삼고 대기업과의 협력을 더욱 적극적으로 확대하려는 것으로 보인다. 한 업계 관계자는 "오픈AI가 기술 우위를 유지하는 동시에 보안 신뢰도와 파트너십을 빠르게 확대해 나간다면 국내에서의 장기적인 수익화에도 긍정적인 영향을 미칠 것"이라고 전망했다.

2025.02.04 17:43조이환

산업부, 공급망 탄소 파트너십 선도 모델 지원

산업통상자원부는 기존 개별기업만을 대상으로 하는 탄소감축 지원 사업을 벗어나, 산업 공급망으로 연결된 복수 기업의 탄소감축을 지원하는 사업을 새롭게 시작한다고 3일 밝혔다. 에너지효율개선, 연·원료 전환, 순환경제 분야 최적 기술을 적용해 탄소배출량을 획기적으로 감축한 대표모델 사업장을 구현하는 그간의 '탄소중립 선도 플랜트 구축 지원 사업' 지원 범위를 단일 기업이 아닌 공급망으로 연결된 기업군에도 확대하기로 했다. 유럽연합(EU)의 디지털 제품 여권(DPP), 배터리규정(EUBR) 등과 같이 공급망에 기반한 탄소 규제가 도입·적용됨에 따라 우리 수출기업도 공급망 기반 탄소 감축 지원을 필요로 하고 있기 때문이다. 공급망 탄소 파트너십 선도모델 지원을 희망하는 탄소 다배출 업종 대기업 등은 복수의 협력기업(중소·중견기업)과 함께 컨소시엄을 구성해 신청해야 하며, 선정된 공급망 컨소시엄은 ▲공정개선 ▲설비교체 ▲설비의 신·증설 등 탄소감축에 필요한 자금을 컨소시엄당 총사업비의 최대 40% 내에서 1년간 최대 30억원을 지원받을 수 있다. 강감찬 산업부 산업정책관은 “글로벌 산업 경쟁이 개별 기업 간 대결을 벗어나 공급망 간 경쟁으로 확장되고 있다”면서 “이 사업을 통해 공급망의 탄소 산정·감축 등 우리 공급망의 탄소 경쟁력이 강화되고 이를 바탕으로 내년부터는 동 사업을 더욱 확대해 나가길 희망한다”고 밝혔다. 한편, 상세한 내용은 산업부 홈페이지나 국가청정생산지원센터에서 확인이 가능하다.

2025.02.03 14:50주문정

"가장 강력한 LLM은?"…올거나이즈, AI 에이전트 평가 플랫폼 첫선

올거나이즈가 거대언어모델(LLM) 성능 평가 플랫폼을 선보여 기업이 최적의 인공지능(AI) 모델을 선택하도록 돕는다. 올거나이즈는 문제 해결을 위해 자율적으로 행동하는 AI 에이전트의 성능을 평가하는 국내 최초 플랫폼으로서 '올인원 벤치마크'를 출시했다고 3일 밝혔다. 이는 지난해 선보인 금융 전문 LLM 리더보드에서 한 단계 발전한 형태로, LLM의 다양한 역량을 종합적으로 분석하고 대시보드 형태로 결과를 제공한다. 올인원 벤치마크는 LLM이 에이전트 역할을 수행하기 위해 필요한 도구 선택 및 활용 능력, 대화의 맥락 이해, 정보 수집 및 활용 능력 등을 평가한다. 현재 올거나이즈의 자체 소형언어모델(sLLM)을 비롯해 챗GPT, 엑사원, 큐원, 딥시크 등 총 12개의 LLM을 분석할 수 있다. 새로운 LLM 평가는 매우 간편하게 진행된다. 모델 이름을 입력하면 애플리케이션 프로그램 인터페이스(API)가 자동 구현돼 즉시 테스트가 가능하다. 또 기존 벤치마크 방식이 동일 작업을 반복 실행해야 하는 불편함이 있었던 데 비해 올인원 벤치마크는 대규모 데이터셋에서도 효율적인 평가가 가능해 시간을 대폭 단축했다. 최근 올거나이즈는 올인원 벤치마크를 활용해 오픈소스로 공개된 딥시크의 'V3' 모델을 평가했으며 그 결과 'GPT-4o 미니'와 유사한 성능을 보였다고 밝혔다. 'V3'는 기존 다양한 벤치마크에서 성능을 검증받았으나 에이전트로서의 성능 분석은 이번이 처음이다. 올인원 벤치마크는 에이전트 성능뿐 아니라 언어 이해력, 지식 수준, 명령 준수(Instruction Following) 등 LLM의 전반적인 역량을 평가한다. 평가에는 '아레나하드(ArenaHard)' '코베스트(Kobest)' '해래(HAERAE)' 등 12개의 공개 벤치마크가 활용되며 결과는 100점 만점 기준으로 소수점 4자리까지 수치화돼 제공된다. 이창수 올거나이즈 대표는 "기업들이 AI 도입 시 객관적인 데이터를 기반으로 최적의 LLM을 선택할 수 있도록 지속적으로 평가 플랫폼을 업데이트할 것"이라며 "에이전트 성능을 강화하기 위한 LLM 학습 방법도 심도 있게 연구 중"이라고 밝혔다.

2025.02.03 12:06조이환

"AI, 역사 시험은 빵점"…거대언어모델, 전문 시험서 한계 드러내

인공지능(AI)이 고급 역사 질문에서는 신뢰할 만한 답변을 내놓지 못한다는 연구 결과가 나왔다. 21일 테크크런치에 따르면 오스트리아 연구기관 복잡성 과학 허브(CSH)는 최근 발표한 연구에서 'GPT-4', '라마', 구글 '제미나이' 같은 거대언어모델(LLM)들이 역사적 전문성을 테스트하는 벤치마크인 '히스트-LLM(Hist-LLM)'에서 낮은 성과를 보였다고 밝혔다. 가장 높은 성과를 보인 'GPT-4 터보'도 정확도가 46%에 불과했다. 이번 테스트는 '세샤트 글로벌' 역사 데이터베이스를 바탕으로 진행됐으며 고대 이집트와 같은 특정 역사적 상황을 포함한 고급 질문을 포함했다. 이 질문에서 LLM은 대부분의 질문에 대해 부정확하거나 과장된 답변을 내놓으며 한계를 드러냈다. 일례로 연구진은 고대 이집트에 특정 시기에 찰갑 갑옷이 존재했는지 물었다. 'GPT-4'는 "예"라고 답했지만 실제로 찰갑은 해당 시기로부터 1천500년 뒤에 등장했다. 또 다른 질문에서는 고대 이집트에 상비군이 있었는지를 물었으나 모델은 잘못된 정보를 바탕으로 "있었다"고 답했다. 연구팀은 이런 오류의 원인으로 AI가 널리 퍼진 데이터를 우선적으로 학습하는 특성을 지적했다. 페르시아 같은 제국의 상비군에 대한 정보가 풍부한 반면 고대 이집트와 같은 특정 시기와 관련된 희귀 데이터는 학습이 부족하다는 것이다. 또 AI 모델은 특정 지역에 대한 역사적 지식의 성능이 더 낮은 경향도 보였다. 특히 사하라 이남 아프리카와 같은 지역에 대한 데이터의 부족과 편향이 더 큰 문제로 작용했다. 연구진은 이번 결과가 LLM의 역사적 한계와 개선 가능성이 있다는 점을 동시에 보여준다고 강조했다. 향후에는 대표성이 부족한 지역의 데이터를 추가하고 보다 복잡한 질문을 포함하는 방향으로 기준을 개선할 계획이다. 피터 투르힌 CSH 교수는 "AI는 기본적인 역사적 질문에는 유용하지만 고급 질문에서는 아직 전문성을 갖추지 못했다"며 "향후 기술 개선을 통해 역사 연구를 보조할 수 있는 가능성은 충분하다"고 말했다.

2025.01.21 09:57조이환

"LLM 추론비용 75% 절감"…스노우플레이크, '스위프트KV'로 AI 최적화 혁신

스노우플레이크가 생성형 인공지능(AI) 애플리케이션 비용 절감을 위한 새로운 최적화 기술을 선보여 거대언어모델(LLM)의 추론 처리 속도를 높이고 운영 비용을 대폭 절감할 수 있는 길이 열렸다. 17일 업계에 따르면 스노우플레이크의 최적화 기술인 '스위프트KV'는 LLM 추론 처리량을 최대 50%까지 향상시키고 추론 비용을 최대 75%까지 절감할 수 있다. 이 기술은 지난해 12월 오픈소스로 공개돼 주목받았다. '스위프트KV'는 LLM 추론 중 생성되는 키값(KV) 데이터를 효율적으로 관리해 메모리 사용량을 줄이는 기술이다. 이를 통해 AI 모델이 더 긴 컨텍스트를 처리하면서도 빠른 출력을 생성할 수 있다. 특히 기존 KV 캐시 압축 방식을 넘어 중복 계산을 최소화하고 메모리 사용량을 최적화했다. 스노우플레이크는 프롬프트 처리 시 계산 부담을 줄이기 위해 '스위프트KV'로 모델 재배선과 자체 증류 기술을 결합했다. 이는 입력 토큰 처리에서 불필요한 연산을 줄여 워크로드 효율성을 높이는 데 기여한다. 또 이 기술은 허깅페이스의 모델 체크포인트와 호환되며 코텍스 AI를 통해 '라마 3.3' 70B 및 '라마 3.1' 405B 모델에서 최적화된 추론이 가능하다. 스노우플레이크는 이를 통해 고객사가 기존 대비 최대 75% 저렴한 비용으로 AI를 활용할 수 있게 했다고 강조했다. 업계 전문가들은 스위프트KV의 개념이 프롬프트 캐싱이나 양자화 같은 기존 기술과 유사하다고 평가했다. 다만 복잡성, 정확도 유지, 성능 저하 여부 등이 기술 적용 시 해결해야 할 과제로 꼽힌다. 브래들리 심민 옴디아 수석 분석가는 "'스위프트KV'는 AI 추론 비용 절감의 한 방법일 뿐 개념 자체가 새로운 것은 아니다"면서도 "앞으로 다양한 AI 최적화 기술과 함께 사용될 가능성이 크다”고 예측했다.

2025.01.17 15:11조이환

  Prev 11 12 13 14 15 16 17 18 19 20 Next  

지금 뜨는 기사

이시각 헤드라인

AI로 성장 발판 마련한 네카오…새해엔 '수익화' 시험대

[ZD브리핑] 독자 AI 파운데이션 모델 1차 발표...5개팀 기술 뽐낸다

과기부총리제 부활 R&D 새판 짤 기회..."누리호 5차·양자이득 원년 기대"

김범석 쿠팡 의장 "초기 대응·소통 부족 진심 사과"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.