• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
CES2026
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'LLM'통합검색 결과 입니다. (226건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"AI 인프라 대안 나올까"…망고부스트, 엔비디아 넘은 추론 성과 공개

망고부스트가 업계 표준 성능 테스트에서 인공지능(AI) 추론(inference) 분야의 신기록을 세우며 거대언어모델(LLM) 시대에 대응할 수 있는 새로운 기술적 대안을 제시했다. AI 데이터센터의 성능, 비용 효율성, 개방형 아키텍처를 두루 갖춘 조합으로 가능성을 입증하며 시장의 주목을 받고 있다. 망고부스트는 지난 2일 미국 워싱턴주 벨뷰에서 실시된 ML퍼프 인퍼런스(MLPerf Inference) v5.0 테스트에서 자사의 AI 추론 소프트웨어 '망고 LLM부스트'와 AMD 'MI300X' 그래픽처리장치(GPU) 조합으로 라마2-70B(Llama2-70B) 모델 오프라인 추론 부문에서 가장 높은 성능을 기록했다고 5일 밝혔다. 이번 테스트는 총 32개의 'MI300X' GPU를 4개 서버 노드에 분산한 다중 노드 구성에서 이뤄졌으며 'MI300X' 기반 시스템의 첫 ML퍼프 멀티노드 제출 사례로도 주목된다. 망고부스트는 '라마2-70B' 오프라인 추론 시나리오에서 초당 10만3천182 토큰(TPS)을 처리해 이전 최고였던 8만2천749 TPS 기록을 넘어섰다. 서버 시나리오에서도 9만3천39 TPS를 기록해 엔비디아 'H100' 기반 시스템 성능을 뛰어넘는 성과를 입증했다. 비용 구조 개선 효과도 눈에 띈다. 'MI300X' GPU는 H100 대비 최대 62% 저렴한 가격에 공급되며 '망고 LLM부스트'와의 조합으로 동일 GPU 수 기준 2.8배 더 높은 가격 대비 성능을 기록했다. 일각에서는 이를 고성능 AI 인프라의 비용 구조를 재편할 수 있는 가능성으로 보고 있다. 이 같은 성과는 AMD와의 긴밀한 협업을 통해 라데온 오픈 컴퓨트(ROCm) 소프트웨어 스택을 최적화한 결과다. 망고부스트는 'MI300X'의 성능을 극대화하는 동시에 단일 노드부터 멀티 노드 클러스터까지 유연하게 확장 가능한 AI 추론 솔루션을 구현했다. 클라우드 환경에서도 경쟁 우위가 확인됐다. 망고부스트는 AWS의 'A100' 기반 환경에서 오픈소스 프레임워크 '오라마(Ollama)' 대비 최대 138배 빠른 AI 추론 성능을 보였으며 허깅페이스의 '텍스트 생성 추론(TGI)'와 vLLM을 포함한 주요 프레임워크와 비교해 성능 및 비용 측면에서 모두 우위를 입증했다. 특히 라마3.1-70B, 큐원-32B, 딥시크-R1-디스틸 등 최신 LLM 모델을 대상으로도 성능 저하 없이 일관된 결과를 유지했다. 이는 다양한 워크로드에 대응 가능한 범용 추론 솔루션으로서의 강점을 보여준다. '망고LLM부스트'는 50개 이상의 오픈 거대언어모델(LLM)을 지원하며 도커 기반의 원라인(one-line) 배포 방식, 오픈AI 애플리케이션 프로그램 인터페이스(API) 호환성 등을 제공해 기존 시스템을 유지하면서도 손쉽게 도입 가능하다. 아마존웹서비스(AWS), 애저(Azure), 구글클라우드플랫폼(GCP) 등 주요 퍼블릭 클라우드뿐 아니라 보안 요구가 높은 온프레미스 환경에서도 통합 운용이 용이하다. 기술적 차별성은 자체 개발한 하드웨어 IP에 기반한다. 이 회사의 데이터처리장치(DPU)는 GPU, 스토리지, 네트워크 가속기 간 데이터 흐름을 최적화해 AI 인프라의 성능과 비용 효율을 동시에 높이는 역할을 한다. 관련 기술은 30건 이상의 특허로 보호받고 있으며 국제 컴퓨터 아키텍처 학술대회(ISCA) 등에서 발표된 10여 년간의 연구 성과를 바탕으로 개발됐다. 망고부스트는 현재 미국, 캐나다, 한국 등을 거점으로 빠르게 사업을 확장하고 있으며 6천만 달러(한화 약 810억원) 이상의 투자를 유치한 상태다. 당초에는 고성능 DPU 반도체로 주목받았지만 창업 초기부터 AI 인프라 전반을 아우르는 풀스택 시스템 솔루션 기업으로의 전환을 준비해왔다. 이번 '망고LLM부스트'는 이러한 소프트웨어 역량의 대표적인 결과물이다. 김장우 망고부스트 대표는 "이번 ML퍼프 결과는 글로벌 AI 인프라 시장에서 망고부스트의 기술력이 공식적으로 인정받았다는 의미"라며 "DPU 기반 하드웨어와 LLM 추론 최적화 소프트웨어가 결합된 풀스택 솔루션으로 AI 데이터센터의 성능과 비용 문제를 동시에 해결해 나가겠다"고 말했다.

2025.04.05 13:52조이환

[AI 리더스] S2W "지식그래프·온톨로지로 무장한 AI"…다크웹 넘어 산업까지 확장

"우리가 지향하는 궁극적인 목표는 의사결정을 지원하는 인공지능(AI)으로, 복잡한 현실 문제에 실질적인 해답을 제시하는 AI입니다. 기존의 생성형 AI가 평균 80~90%의 정확도를 보인다면 도메인 특화 지식그래프와 온톨로지는 이에 더해 95% 이상의 정밀 자동화를 실현합니다. 분야별 AI들이 협업해 해법을 찾아가는 구조는 진정한 문제 해결형 AI로 나아가기 위한 실질적 경로로, 우리의 기술적 목표입니다." 박근태 S2W 최고기술책임자(CTO)는 최근 경기도 판교시 회사 사옥에서 진행된 기자와의 인터뷰에서 이같이 말했다. 그는 복잡한 현실 문제를 단순 자동화가 아닌 분야별 AI 에이전트 간의 협업을 통해 해결하려는 구조야말로 S2W 기술의 핵심 가치라고 설명했다. 또 이를 위해 도메인 특화 '지식그래프'와 정밀 전처리 인프라를 함께 구축해 생성형 AI가 혼자서는 넘기 어려운 정확도 한계를 기술적으로 보완하고 있다고 강조했다. 28일 업계에 따르면 최근 생성형 AI의 한계를 보완하고 정밀한 의사결정까지 지원하는 기술로 '도메인 특화 지식그래프'와 '온톨로지' 개념이 주목받고 있다. 단순 정보 생성에서 나아가 복잡한 산업 문제를 다각도로 분석해 해법을 제시하려는 시도가 늘고 있는 가운데 이 두 요소는 기술 신뢰성과 실효성을 동시에 확보할 수 있는 기반으로 평가된다. S2W가 말하는 'AI의 눈'…지식그래프와 온톨로지의 진화 과정은 '지식그래프'와 '온톨로지'는 S2W가 산업 영역으로 확장하는 과정에서 가장 전면에 내세우는 기술이다. 생성형 AI가 말 그대로 '생성'에 강하다면 지식그래프는 '정확한 연결'을 책임지는 구조적 기반이다. 데이터를 단순히 나열하거나 열람하는 것이 아니라 AI가 그 의미와 관계를 맥락 속에서 파악할 수 있게 해준다는 것이 박 CTO의 설명이다. 지식그래프는 정보를 '노드'와 '엣지(연결관계)'로 표현해 데이터 간의 숨겨진 인과성과 유사성을 구조화한다. 일례로 반도체 사업에서 '공급망 이슈 → 재료 부족 → 생산 중단'이라는 흐름을 벡터 안의 그래프 형태로 구성하면 인간 분석가보다 더 빠르고 정확하게 AI가 리스크를 예측할 수 있다. 단순히 데이터를 모으는 데 그치지 않고 실시간으로 이들의 관계성까지 해석하는 것이 핵심이다. '온톨로지'는 이 지식그래프가 혼란 없이 작동하도록 만드는 개념 사전이다. 산업별 주요 개념들을 정의하고 그 계층구조와 속성, 분류 기준을 정형화한다. 일례로 철강 산업 공정에 도입된다면 '롤링', '주조', '냉각' 같은 개념이 각각 어떤 역할이고 어떤 순서로 진행되는지를 AI가 이해할 수 있게 만드는 것이 온톨로지의 역할이다. 박 CTO는 "우리는 이 두 기술을 결합해 단순 검색 기반 AI에서 '의미 기반 추론형 AI'로 진화하는 구조를 구현하고 있다"며 "이는 특히 거대언어모델(LLM)의 고질적인 문제인 환각(hallucination)을 줄여 기존 생성형 AI가 자동화한 80% 업무를 95%까지 자동화할 가능성을 제공한다"고 강조했다. 이어 "AI가 그럴듯한 답을 넘어서 왜 그런 답을 도출했는지까지 설명할 수 있으려면 지식 구조가 반드시 뒷받침돼야 한다"고 설명했다. 다만 기존 산업에서 지식그래프는 오랫동안 수작업 중심으로 구축돼 왔다. 산업에 본격 도입하기엔 시간과 비용 부담이 컸고 설계 인력도 많이 필요했다. 팔란티어 같은 글로벌 기업은 이 분야의 선두주자로 꼽히지만 수십 명 단위의 인력을 투입해 대규모 온톨로지를 구축하는 방식이어서 비용 장벽이 높다는 한계가 있었다. S2W는 이같은 구조적 한계를 AI 기반 자동화로 극복하고 있다. 자연어처리(NLP), 분류 모델, 임베딩 기반 유사도 분석 등 여러 기술을 통해 개체 간 관계를 자동으로 추출한다. 반복적이고 규칙 기반의 매핑 작업은 AI가 맡고 도메인 전문가가 최종 검증만 수행하는 하이브리드 프로세스를 구축해 효율성과 정확도를 동시에 확보했다. "팔란티어와는 다른 길"…경량형 AI 통해 산업과 안보 동시 '공략' 이러한 구조화 기반 기술은 산업 쪽에서도 빠르게 적용 중이다. S2W가 국내에서 쌓은 대표적인 사례는 현대제철이다. 압연기, 냉각라인 등 설비 정보를 지식그래프로 연결해, 공정 이상이 발생한 경우 영향을 받는 설비나 지역 정보까지 결합하여 분석할 수 있도록 했다. 과거 다양한 관련 시스템에 각각 접속해야하고 관련된 모든 정보를 파악하기도 힘들었던 작업이 AI 기반으로 수초 내에 해결되고 있다. 롯데멤버스 역시 대표적인 지식그래프 기반 AI 도입 사례다. S2W는 롯데멤버스와 함께 회원 소비 데이터와 뉴스 데이터를 연계한 트렌드 분석 플랫폼을 개발 완료했으며 오는 2분기 중 롯데그룹 제휴사를 대상으로 시범 도입할 예정이다. 두 기업 모두 고객 맞춤형 인사이트 도출과 자동화된 의사결정 기반 확보에 효과를 보고 있다. 이외에도 회사는 공공기관, 금융사 등과 협업해 지식그래프 기반 AI 솔루션을 테스트하거나 납품하고 있다. 금융권에서는 계좌 간 이동 경로와 거래 내역을 그래프화해 자금세탁이나 투자사기 등의 이상 패턴을 조기 탐지하는 데 적용되고 있다. AI가 정황상 수상한 자금 흐름을 실시간으로 식별함으로써 기존 룰베이스 시스템보다 정밀한 경보 시스템이 가능하다는 평가다. 해외 진출 역시 보안과 국방 분야에서 활발히 진행되고 있다. 회사는 인도네시아·싱가포르 등 아시아권 정부기관과 협력해 사이버보안 기반 정보 인텔리전스 플랫폼을 구축했고 중동 정보기관 및 동남아 국가의 군사 정보기구 등과도 기술 검토 단계에 있다. AI가 직접 정보를 수집하고 위험을 추론하는 구조는 국경을 넘는 디지털 위협에 빠르게 대응할 수 있는 수단으로 평가받고 있다. 군·정보기관의 특성상 폐쇄망이나 열악한 통신 환경에서도 작동 가능한 분석 체계가 필수다. 이에 박 CTO는 "우리가 가진 다크웹 기반 실시간 수집 역량과 결합된 지식그래프 기반 분석 시스템이 이런 조건에 적합하다"고 강조했다. 업계에서는 이같은 S2W의 해외 전략이 팔란티어와 같은 미국계 보안 AI 기업들과는 궤를 달리한다고 분석한다. 팔란티어가 대규모 인력 투입과 고비용 프로젝트 중심이라면 S2W는 상대적으로 '가성비' 있는 경량 구조와 유연한 도입 모델을 내세운다는 것이다. 특히 아시아권 정부기관이나 정보기관과의 협력에서 문화적 유사성과 민첩한 기술 지원이 시너지를 낸다는 평가다. 박 CTO는 "우리는 고객 피드백을 반영해 신속하게 서비스를 튜닝해주는 대응력을 가지고 있다"며 "특히 아시아 국가들과는 워크플로우나 의사결정 방식에서 유사한 부분이 많아 우리가 기술 도입을 적극적으로 지원한 점이 어필한 것 같다"고 설명했다. 이어 "공공·보안 시장에서 쌓은 신뢰를 바탕으로 제조업과 같은 산업 영역까지 해외 확장을 이어가는 것이 목표"라고 밝혔다. 보안 AI 넘은 산업 AI…의미를 추론하는 '에이전트'로 진화 이 같은 전략이 가능했던 것은 S2W가 태생부터 '정보의 하수도'라 불리는 다크웹을 정면 돌파하겠다는 목표로 시작된 회사이기 때문이다. 창업자 서상덕 대표는 카이스트를 졸업하고 롯데그룹 미래전략연구소와 보스턴컨설팅그룹(BCG)을 거치며 전략기획과 AI 기술에 모두 정통한 인물이다. "가장 복잡하고 지저분한 데이터를 다룰 수 있어야 진짜 AI 기술력이라 할 수 있다"는 그의 판단 아래 회사는 다크웹이라는 난제를 선택했다. 박근태 CTO 역시 카이스트 전기전자 박사 출신으로, SK텔레콤에서 AI·빅데이터 개발 조직을 이끌던 경력을 갖고 있다. 그는 보안이라는 극한의 도메인 안에서 강건한 AI 시스템을 만든다면 이를 산업 전반으로 확장할 수 있다는 구조적 자신감을 갖고 있었다. 이에 회사는 초기부터 구글 BERT 기반의 경량 자연어처리 모델을 활용해 다크웹 데이터를 정제했고 이후 LLM을 병렬적으로 활용하며 기술의 확장성을 키워나갔다. 다크웹은 단순한 범죄 채널이 아닌 수많은 언어·텍스트·이미지가 얽힌 비정형 데이터의 보고다. S2W는 이를 수년간 실시간으로 크롤링하며 자연어처리, 전처리, 데이터 구조화 기술을 축적했고 이는 현재 산업 데이터로 확장 가능한 기술적 기반이 됐다. 박 CTO는 "다크웹 보안이라는 가장 척박한 환경에서 출발했기에 제조·유통·금융 데이터는 오히려 '정돈된 정보'처럼 느껴졌다"고 말했다. 현재 S2W는 이러한 기술 구조를 기반으로 '에이전트 기반 의사결정 AI'로의 진화를 추진 중이다. 박 CTO는 "AI가 하나의 지시만 받고 단일 작업을 수행하는 시대는 지났다"며 "복잡한 산업 환경에서는 다양한 전문 에이전트가 협업하는 '멀티에이전트' 구조가 필요하다"고 강조했다. 일례로 제조업에선 '설비 진단 에이전트', '수요 예측 에이전트', '스케줄링 에이전트'가 각각 데이터를 분석한 후 서로의 분석 결과를 공유하고 결론을 도출한다. 이때 지식그래프는 이질적인 데이터를 하나의 언어로 통합하는 '지도'이자 '중재자' 역할을 할 수 있다는 것이다. 이미 S2W는 자사 인텔리전스 조직 '탈론(TALON)'을 통해 AI 에이전트 파일럿을 개발 중이다. 다크웹에서 특정 키워드가 탐지되면 에이전트가 관련 지표를 자동 분석하고 보고서를 생성해 인간 분석가에게 전달하는 방식이다. 이는 향후 기업 내 부서 간의 단절된 정보흐름을 AI가 논리적으로 통합해주는 시스템으로 확장될 수 있다. 이같은 기술적 기반과 사업 확장을 바탕으로 S2W는 올해 하반기 코스닥 기술특례상장을 목표로 IPO를 추진 중이다. 지난해 12월 기술성 평가를 통과했으며 현재는 한국거래소의 예비심사 청구를 마쳤다. 주관사는 대신증권으로, 이번 IPO를 통해 글로벌 보안 AI 기업으로의 도약을 본격화할 계획이다. 특히 아시아와 중동 지역을 1차 타깃 시장으로 삼고 IPO 자금을 현지 인재 유치, 지사 설립, 기술 고도화 등에 전략적으로 활용할 방침이다. 박 CTO는 "우리 목표는 AI가 인간의 결정을 대체하는 것이 아니라 보다 정밀하고 빠른 결정을 가능하게 하는 파트너로 진화하게 하는 것"이라며 "보안에서 시작된 우리 기술이 산업 전반의 디지털 의사결정을 뒷받침할 수 있을 것"이라고 강조했다.

2025.03.28 16:27조이환

대만만 쳐도 '삭제'...中, AI로 비판 글 '실시간 감시' 훈련했다

중국이 민감 콘텐츠를 탐지·차단하는 인공지능(AI) 기반의 검열 체계를 구축한 정황이 드러났다. 사회적 불만이나 정치적 비판을 효율적으로 관리하려는 목적이 반영된 것으로, 권위주의 정부가 최신 생성형 AI 기술을 억압 수단으로 전환하고 있다는 정황을 뒷받침하는 사례란 분석이 나온다. 26일 테크크런치에 따르면 보안 연구자 '넷아스카리(NetAskari)'는 최근 중국 바이두 서버에서 보안 설정 없이 공개된 엘라스틱서치 데이터베이스를 발견했다. 이 데이터는 약 13만3천 건의 텍스트를 기반으로 거대언어모델(LLM)이 콘텐츠를 실시간으로 검열하도록 훈련된 것으로 확인됐다. 유출된 데이터는 군사 정보부터 노동 분쟁, 환경오염, 식품 안전, 정치 풍자, 대만 관련 이슈까지 폭넓게 포함돼 있다. 심지어는 "나무가 쓰러지면 원숭이가 흩어진다"는 중국 속담처럼 우회적 표현도 검열 대상에 포함되며 감정적 불만과 체제 비판을 구분 없이 탐지하도록 설계됐다. 이 같은 방식이 가능한 것은 LLM이 단순한 키워드가 아닌 표현의 맥락을 이해하고 판단하기 때문이다. 시스템은 이를 토대로 콘텐츠를 정치, 사회, 군사 이슈 중 하나로 분류해 '즉시 조치 대상'으로 삼는다. 대표적 사례로는 부패 경찰에 대한 기업인의 고발, 농촌 빈곤에 대한 호소, 미신을 믿는 공산당 간부의 부패 보도 등이 포함됐다. 대만 관련 키워드는 1만5천 회 이상 등장했으며 신형 전투기 정보 등 군사 움직임까지 정밀하게 추적 대상에 올랐다. 데이터 속 LLM 명령어에는 '프롬프트 토큰' 등 '챗GPT'류 모델과 유사한 지시어가 포함돼 있었다. 이는 중국 정부가 최신 AI 기술을 활용해 여론 통제를 체계화하고 있음을 뒷받침한다. 데이터의 활용 목적은 '여론 작업'으로 명시돼 있다. 이는 중국 중앙인터넷정보판공실(CAC)이 주도하는 국가 검열·선전 활동을 지칭하는 용어로 알려져 있다. UC버클리 샤오 치앙 연구원은 "전통적 검열을 넘어 AI가 국가 통제를 한층 정교하게 만든다"며 "중국 정부가 AI를 억압 도구로 활용하려는 증거"라고 밝혔다. 오픈AI 역시 지난달 보고서를 통해 "중국 기반 행위자가 AI로 인권 시위 감시, 반체제 인사 음해까지 시도한 정황이 있다"고 밝혔다.

2025.03.27 10:58조이환

아토믹GPT, AI 에이전트로 진화하나

한국원자력연구원이 자체 개발한 '아토믹 GPT'가 지능형 에이전트로 진화 중이다. 한국원자력연구원은 인공지능(AI) 스타트업인 ㈜젠티(대표 최은진)와 거대언어모델(LLM) 기술 활용에 관한 업무협약(MOA)을 체결했다고 27일 밝혔다. 이번 협약은 연구원이 최근 선보인 원자력 특화 AI 솔루션 '아토믹GPT'와 ㈜젠티의 강력한 거대언어모델 기술을 결합하자는 것. 원자력과 관련된 방대한 자료를 신속하게 분석해 활용할 수 있도록 도와주는 혁신적 AI 솔루션인 지능형 에이전트를 구축하는 것이 목표다. '아토믹 GPT'는 원자력 기술 문서 분석, 연구 정보 검색, 연구 문서 자동 요약 및 생성 등 연구자들이 겪는 다양한 어려움을 해소하기 위해 연구원이 자체 개발한 AI 프로그램이다. 현재 연구원 내부 직원들을 위한 전용 서비스로도 제공 중이다. ㈜젠티는자연어 처리와 의미 기반 검색 기술로 정리되지 않은 복잡한 문서를 분석해 원하는 정보를 신속․정확하게 제공하는 플랫폼을 보유했다. 지난 2021년 한국원자력연구원과 과학기술정보통신부가 주관한 인공지능그랜드챌린지에 참가해 대상을 차지했다. 이번 협약을 통해 양 기관은 표와 그림 등이 포함된 복잡한 원자력 관련 문서에서 핵심 정보를 빠르게 찾아 정리해주고, 자연어 기반의 질의응답 챗봇 등을 갖춘 AI 에이전트 서비스를 구축할 계획이다. 특히, 연구원의 외부와 분리된 네트워크 환경에서도 보안과 독립성을 유지하면서 서비스 이용이 가능하도록 개발해 연구자들의 활용성을 높인다는 복안이다. 원자력연구원 유용균 인공지능응용연구실장은 "원자력 연구에서 기초적인 문서작업 소요 시간을 최소화함으로써 연구자들이 창의적 연구 활동에 전념할 수 있도록 도울 것"이라고 말했다. ㈜젠티 최은진 대표는 “다년간 축적된 문서 분석 기술을 바탕으로 원자력연구원이 혁신적인 정보처리 및 연구지원 시스템을 구축할 수 있도록 기술적 협력과 맞춤형 솔루션을 제공할 것”이라고 덧붙였다. 원자력연구원 조윤제 디지털원자로․AI연구센터장은 “원자력과 같이 데이터가 방대하고 전문성이 요구되는 분야일수록 문서 분석 AI 기술의 효과가 클 것”이라며, “앞으로도 인공지능을 통해 산업 현장에서 실질적 변화를 만들어 갈 것"이라고 밝혔다.

2025.03.27 09:22박희범

[AI는 지금] "개보위, 中 AI 옹호"…딥시크에 긍정 신호 보낸 고학수 위원장, 이유는?

중국 딥시크의 국내 진출 여부를 둘러싼 논란이 이어지는 가운데 개인정보보호위원회가 오픈소스 기반 인공지능(AI) 모델 활용에 긍정적인 입장을 밝혔다. 중국 기업의 앱 자체를 옹호한 것이 아니라 딥시크 등의 오픈소스 생태계 확장이라는 기술 전략에 지지를 표한 것으로 보인다. 24일 업계에 따르면 고학수 개인정보보호위원회 위원장은 최근 한 세미나에서 딥시크 오픈소스 모델의 활용 가능성을 언급하며 '글로벌 빅테크가 아닌 기업도 도전할 수 있는 기회'라고 표현했다. 해당 발언은 지난달 국내 앱스토어에서 자진 철수한 딥시크 앱과는 별개로 발전하고 있는 오픈소스 기술 흐름을 짚은 것으로 평가된다. 딥시크는 중국발 오픈소스 거대언어모델(LLM) 스타트업으로, 지난 1월 이후 전 세계 AI 생태계를 신속히 장악했다. 오픈AI, 앤트로픽, 구글 딥마인드 등 미국·영국 프런티어 AI 기업들이 천문학적 자금을 투입한 것과 달리 적은 비용으로 고성능 모델을 구현한 데다 오픈소스로 공개돼 폭발적인 관심을 받았다. 퍼플렉시티 등 해외 LLM 서비스 기업들은 이미 딥시크를 로컬 환경에 설치해 운영 중이다. 최근에는 국내 기업들도 이를 기반으로 특화 모델 개발에 나서고 있다. 뤼튼테크놀로지스와 이스트소프트는 지난 2월 딥시크 모델을 자체 클라우드 환경에 구축해 운영을 시작했다. 크라우드웍스는 일본 법인을 통해 딥시크 R1 기반 일본어 모델을 개발한 뒤 이를 한국어로 확장할 계획이다. 일각에선 크라우드웍스가 딥시크 본사와 직접 계약을 맺고 한국어 모델을 공동 개발했다고 주장했지만 이는 사실이 아닌 것으로 확인됐다. 크라우드웍스 측이 지난 23일 딥시크 본사와 계약한 적이 없으며 회사가 활용 중인 모델은 앱이 아닌 설치형 B2B 버전이라고 해명했기 때문이다. 데이터가 중국 서버로 전송되는 B2C 앱과는 구조적으로 다르다는 설명이다. 실제로 퍼플렉시티, 뤼튼, 이스트소프트 등의 국내 설치형 모델은 외부 인터넷과 연결되지 않는 제한된 환경에서 구동된다. 이에 따라 중국 서버로 정보가 전송될 가능성은 원천적으로 차단된다. 다만 보안업계에서는 딥시크처럼 오픈소스로 제공되는 모델이라도 로컬 환경에 도입할 경우 여전히 위험 요소가 존재한다고 지적한다. 오픈소스 특성상 코드나 가중치 파일에 악성 코드가 삽입될 수 있으며 모델 로딩 과정에서 시스템 취약점을 노린 침투 가능성도 배제할 수 없기 때문이다. 또 일부 개발자가 모델에 내장된 안전 장치를 우회하거나 변형 모델을 제작할 경우 유해한 콘텐츠나 악성 코드를 생성하는 방식으로 악용될 수 있다. 특히 딥시크는 경쟁 모델에 비해 보안 업데이트나 코드 감사가 부족하다는 평가도 있어 도입 시 철저한 검증과 보안 관리가 필요하다는 지적이 잇따른다. 실제로 김승주 고려대학교 정보보호대학원 교수는 최근 자신의 링크드인을 통해 "딥시크를 PC나 클라우드에 설치해서 쓰면 운영주체가 중국이 아니기 때문에 안전하다는 말이 돈다"며 "이는 굉장히 위험한 생각"이라고 지적했다. 그럼에도 고 위원장이 딥시크를 위시한 오픈소스 LLM에 주목한 이유는 분명하다. 자본과 인프라가 부족한 국내 AI 생태계가 낮은 진입 장벽을 바탕으로 글로벌 경쟁에 도전할 수 있다는 점 때문이다. 업계에선 이 같은 메시지를 한국 정부가 추진 중인 '월드 베스트 LLM' 프로젝트와 맞물려 해석하는 분위기다. 정부는 국가 차원의 대규모 언어모델 개발을 위해 파운데이션 모델을 오픈소스로 공개하고 공공 중심의 활용 사례를 확산하겠다는 계획을 밝힌 바 있다. 이 프로젝트는 지난 2월 과학기술정보통신부가 발표한 'AI R&D 전략 고도화 방안'에 핵심 과제로 포함됐다. 정부는 향후 3개월 이내 'AI 국가대표팀'을 선발해 연구 자원과 데이터를 집중 지원하고 공공 데이터를 기반으로 한 특화 모델 개발을 유도할 방침이다. 업계에선 딥시크 사례가 이 같은 흐름을 촉발하는 계기가 됐다는 평가도 나온다. 고성능 언어모델을 오픈소스를 통해 낮은 비용으로 구현할 수 있다는 점이 확인되면서 '챗GPT'나 '클로드' 등 프런티어 AI를 빠르게 따라잡을 수 있다는 기대가 생겼다는 분석으로, 보안만 보장된다면 무료로 실사용도 가능하다는 인식이 퍼진 것이 정책 전환에 영향을 미쳤다는 해석도 제기된다. 고학수 개인정보보호위원회 위원장은 "딥시크 등의 모델에는 분명 잠재적인 불안 요소가 있지만 빅테크가 아니어도 적은 투자를 통해 세계 시장에 도전할 수 있다는 메시지를 줬다"며 "이러한 오픈소스를 통해 국내에서도 다양한 앱 서비스를 만들 수 있을 것"이라고 말했다. 이어 "향후에 보다 넓은 생태계를 구축해야 한다고 믿는다"며 "자유로운 혁신의 한 축은 열린 모델을 통해 새로운 응용 생태계를 형성하는 것이라 생각한다"고 말했다.

2025.03.24 16:16조이환

버즈니 고재현 팀장 "10년 쌓은 쇼핑데이터 ,타사 AI와 한끗 차 만들어"

“버즈니는 단순히 '영상의 핵심을 요약해줘'와 같은 동작을 수행하는 제품을 개발하지 않는다. 어떤 유형의 하이라이트가 적합한지 사전에 정의하고 실제 홈쇼핑 업계에서 고급 PD 인력들이 하이라이트라고 평가한 구간 대상으로 학습된 모델을 통해 정교한 자체 평가 기준을 보유하고 있다. 일반적인 LLM으로 구축된 프로덕트들이 잡아내지 못하는 어떤 '한 끗'의 가치를 제공할 수 있다.” 버즈니는 10년 이상 쇼핑 관련 데이터 축적과 경험을 바탕으로 빠르고 효과적인 AI 솔루션을 제공하고 있다. 버즈니 에이플러스AI 사업부 고재현 팀장 설명처럼, 버즈니의 풍부한 자체 데이터로 학습된 AI 기술은 차별화된 성능을 자랑한다. 버즈니의 커머스AI 구독 서비스인 에이플러스AI는 AI 전문가 없이도 쉽게 도입할 수 있는 서비스로, 숏폼AI, 챗봇, 추천, 리뷰 등 다양한 기술을 제공한다. 그 결과 서비스 1년 만에 주요 이커머스 기업들과 계약을 체결하며 초기 대비 10배 이상의 매출 성장을 이뤘다. 이 제품의 경쟁력은 다년간 축적된 방대한 커머스 데이터와 이를 활용한 기술력에 있다. 에이플러스AI의 숏폼AI는 이커머스 영상 데이터를 기반으로 자동 영상 편집을 지원하며, B2B 및 B2C 제품으로 개발되고 있다. 고재현 팀장은 AI 사업부 에이플러스AI에서 이커머스 데이터를 활용한 서비스형 소프트웨어(SaaS) 및 인공지능(AI) 제품 개발을 주도하고 있다. 그는 최근 거대언어모델(LLM)과 같은 범용 AI 기술이 비약적으로 발전하고 있으나, AI의 성공적 도입을 위해서는 문제정의, 데이터, 모델적용이라는 세 가지 요소가 조화를 이뤄야 한다는 생각이다. 고 팀장에 따르면 에이플러스 AI의 기술은 영상 제작 도메인에서의 피드백을 통해 발전해 왔다. 비전문가도 쉽게 짧은 형식 영상을 제작할 수 있도록 하는 것이 서비스 목표다. 특히 영상 제작 과정의 효율성을 크게 향상하는 데 기여하고 있다. 고 팀장은 “숏폼AI를 도입한 기업들은 100% 자동화된 프로세스를 통해 제작 인력을 최소화하고 높은 효율성을 달성했다. 또 홈쇼핑모아의 '30초 홈쇼핑' 같은 서비스는 높은 참여도를 기록하며 숏폼 영상의 강력한 서비스 효과를 입증했다”면서 “이런 성공 사례는 숏폼AI 도입을 고려하는 기업들에게 긍정적인 영향을 미치고 있다”고 설명했다. 이어 그는 “버즈니는 text-to-video 기술 발전과 같은 시장 흐름에 맞춰 다양한 기능을 개발하고 있다”며 “특히 URL 기반 숏폼 생성, 클립 최적화 기능, 워크플로우 UI 등 새로운 기술을 통해 숏폼AI의 활용도를 확대할 계획이다. 고객사가 지속 가능한 이익을 창출할 수 있도록 제품을 고도화할 예정”이라고 밝혔다. [다음은 고재현 팀장과의 일문일답] Q. 간단한 자기소개 한다면? 버즈니의 AI 사업부인 에이플러스AI에서 프로덕트팀 팀장을 맡고 있다. 버즈니가 10여 년 동안 모바일 홈쇼핑 플랫폼 홈쇼핑모아를 운영하며 축적한 데이터를 바탕으로 실용인공지능 기술을 연구 및 개발해, 이커머스향 서비스형 소프트웨어(SaaS)로 제품화하는 역할을 담당하고 있고, 다양한 AI(AIaaS)제품을 시장에 공급하고 있다. 최근 몇 년 새 LLM을 필두로 API레벨에서 활용할 수 있는 범용 AI기술이 비약적으로 발전하면서 많은 기업이 AI Native를 천명하고 있다. 하지만 도메인의 특수성을 띠고 있는 대부분 기업에서의 AI 활용 로드맵을 고려하면, 기업의 AI 비즈니스 적용은 '문제정의, 데이터, 모델적용'의 삼박자가 맞아떨어져야 한다고 생각한다. 그런 면에서 이미 이커머스 분야에서 10년 넘게 축적한 데이터와, 그 데이터를 활용해 특수한 문제(예를 들면 이커머스 검색이나 추천, 리뷰 분석과 같은)를 정의하고 해결해 본 경험이 있는 버즈니는 LLM을 위시한 AI 기술을 통해 가장 빠른 성공 경험을 제공할 수 있다는 강한 자신감을 갖고 있다. Q. 버즈니 신규 비즈니스인 '에이플러스AI'를 설명한다면? '에이플러스AI'는 내부에 AI 전문가가 없어도 구독 방식으로 쉽게 원하는 커머스AI 기술을 도입할 수 있는 커머스AI 구독 서비스다. 에이플러스AI는 크게 ▲숏폼AI ▲챗봇 ▲상품요약 ▲상품 카탈로그 ▲추천 ▲검색 ▲리뷰 ▲상품 마케팅 AI 기술로 구성돼 있다. 해당 기술들은 버즈니가 실제 커머스 서비스(홈쇼핑모아)를 운영하며 '매출 증대', '비용 감축', '효율성 향상' 효과를 냈던 커머스 AI 기술로 구성돼 있다. 버즈니 에이플러스AI는 출시 1년 만에 CJ온스타일 등 주요 이커머스사 8곳에 커머스AI 기술 공급 계약을 체결했다. 이 기간 버즈니의 AI 비즈니스 매출도 출시 초기 대비 10배 이상 증가했다. AI의 성능은 양질의 대규모 데이터 유무가 결정한다. 버즈니 에이플러스AI의 경쟁력은 다년간 쌓아온 커머스AI 기반 기술로 대규모 정제된 커머스 데이터를 확보하고 있다는 점이다. 18개 홈쇼핑사(데이터홈쇼핑사 포함)의 1억 건 이상의 상품 데이터, 월간 1천만 명에 달하는 사용자 데이터, 100만개 상품 이미지 학습 데이터, 14만개 영상 데이터 등 있다. Q. 에이플러스AI가 제공하는 기술 중 숏폼AI는? 에이플러스 숏폼AI는 AI 에이전트 시장에서 버즈니가 전략적으로 집중하고 있는 제품 중 하나다. 버즈니가 보유한 수많은 이커머스 영상데이터(홈쇼핑 라이브 방송 영상)를 바탕으로 개발한 영상 하이라이트 베이스라인 모델을 근간으로 현재 자동 영상 편집 에이전트라는 방향성을 가지고 지속적인 개발을 진행하고 있다. 지난해 처음 출시한 숏폼AI는 상품의 소구를 중심으로 하는 이커머스 영역에서 버즈니가 그동안 쌓아온 도메인 지식(Domain Knowledge)을 바탕으로 탄생했다. 출시 이후 4개 이상의 홈쇼핑업체와 개념증명(PoC)를 진행했다. 해당 PoC의 목적은 단순 소구력이 아닌 영상언어에 대한 이해와 실제 영상제작 프로세스에 대한 도메인 학습이었다. 이 PoC 과정을 통해 모델의 영상 산업 내 범용성을 확장했고, 이렇게 개선된 모델을 바탕으로 올해는 숏폼AI를 구독형 B2C 프로덕트로도 개발 중이다. 이와 별개로 B2B영역에서는 현재 CJ온스타일 등 3개의 홈쇼핑사에 자동 또는 반자동 AI 숏폼 편집툴을 제공하고 있다. 숏폼AI는 Long-form to Short-form에 대한 편집 및 자동생성에 대한 기능을 지원하고 있다. 그밖에 이커머스 영상 도메인에 대한 이해와, 실제 영상 제작 산업과의 끊임없는 피드백루프에 근거해 영상문법을 이해하지 못하는 일반 크리에이터라도 손쉽게 숏폼 영상을 제작할 수 있는 툴을 만드는 것이 우리의 비전이다. Q. 고객사는 어떤 이유로 숏폼AI를 도입하려고 하나. 그들이 기술로 풀고 싶어 하는 문제는? 2024년 말 기준 쇼핑, 패션 카테고리 상위 20개 앱을 살펴보면 12개 앱에서 별도의 숏폼지면을 운영하며, 숏폼콘텐츠 기반의 플랫폼 체질 변화를 도모하고 있다. 실제로 숏폼 중심으로 개편된 서비스 지면에서 기존 대비 거래액 및 리텐션이 크게 향상된 사례들이 속속 등장하고 있다. 이처럼 숏폼 중심의 서비스 개편을 도모하기 위한 핵심 키워드는 '숏폼의 양'이다. 숏폼 지면이란 결국 기존 클릭베이스의 사용자 경험이 아닌 스와이프 베이스의 사용자 경험으로의 전환을 의미하기 때문에, 무한 스와이프 환경에서 탐색 가능한 대상 숏폼의 수가 많아야만 시도할 수 있는 전략이기 때문이다. 그리고 바로 이 지점이 기업들이 버즈니 숏폼AI를 찾는 이유다. 긴 영상을 숏폼 영상으로 제작하는 것은 아예 새로운 영상을 창작하는 것에 비해 간단한 작업이리라 생각되지만, 실제 이 업무를 사람 실무자가 수행하게 되면, 업무의 효율성을 높이기 어렵다. 일단 1시간여의 원본영상에서 어떤 구간들을 선택해야 하는지, 또 선택했다면 어떤 디자인 에셋들을 올려야 하는지, 자막은 어떻게 입힐지 등 생각보다 많은 영역에서 사람의 품이 든다. 그러나 우리 숏폼AI를 사용하게 되면, 5분 안에 자동으로 숏폼 영상이 생성된다. 만약 추가 편집이 필요한 경우에는 자체적으로 구축한 편집 UI상에서 미리 선별된 하이라이트 구간들에 대한 편집을 추가로 할 수 있어 고효율의 작업환경 구축이 가능하다. 만약 원본 영상 데이터를 연동하게 되면 별도의 업로드 절차도 필요 없이 미리 생성된 영상들을 바로 자사 서비스에 전시할 수 있는 형태다. 결국 빠르게 숏폼 리소스를 확보해야 하지만 관련 인력이 부족한 기업들이 주로 버즈니 숏폼AI를 찾고있다. Q. 여러 숏폼AI 관련 기술 중 버즈니 숏폼AI를 도입해야 하는 이유 혹은 버즈니만의 경쟁력은? 시장에는 이미 Long-form to Short-form과 관련된 다양한 서비스들이 존재한다. 그런데도 기업들이 버즈니 숏폼AI를 찾는 이유는 명확하다. '서비스' 즉 최종적으로 숏폼이 활용될 지면과 그 시나리오를 이해하고 있는 제품이기 때문이다. 버즈니는 단순히 '영상의 핵심을 요약해줘'와 같은 동작을 수행하는 제품을 개발하지 않는다. 완성된 숏폼이 전시될 지면에 따라 어떤 유형의 하이라이트가 적합한지 사전에 정의하고 실제 홈쇼핑 업계에서 고급 PD인력들이 하이라이트라고 평가한 하이라이트 구간들을 대상으로 학습된 모델을 통해 정교한 자체 평가기준을 보유하고 있다. 따라서 일반적인 LLM으로 구축된 프로덕트들이 잡아내지 못하는 어떤 '한 끗'의 가치를 제공할 수 있다. 커머스 영상의 하이라이트를 찾는 것은 생각보다 복잡한 문제다. 스포츠 영상처럼 득점 장면이라는 명확한 하이라이트 기준이 없다. 한 시간 내내 상품의 장점을 설명하기 때문에 어떤 구간이 하이라이트인지 판단하기가 쉽지 않다. 게다가 자연어만으로는 시각적으로 의미 있는 장면을 찾기 어렵고, 카테고리별로도 하이라이트의 기준이 다르다는 점까지 더해져 복잡성이 높다. 버즈니는 홈쇼핑모아를 통해 홈쇼핑사에서 제공받는 다양한 데이터(원본 영상, 하이라이트 영상, 상품 정보, 리뷰 정보 등)를 복합적으로 활용해 카테고리별 평가 항목을 정의하고, 이를 기반으로 복합적인 모델을 개발했다. 시각 정보를 우선으로 하되, 쇼호스트의 멘트를 기반으로 의미론적 보충을 하는 방식을 택했으며, 특히 사용자의 의도를 더 정확히 파악하기 위한 연구가 2024 EMNLP industry track에 채택되기도 했다. 또한 제품 기획 초기부터 MVP를 바탕으로 실제 업계의 피드백을 획득하며 발전한 형태의 제품으로 기업레벨에서 '숏폼을 만든다'고 했을 때의 프로세스를 제품 내에서 충분히 만족시켜 줄 수 있는 형태의 프로덕트라고 자부한다. Q. 실제로 숏폼AI를 도입한 고객사가 실제 얻은 효과는? 현재 버즈니 숏폼AI는 CJ 온스타일, 신세계라이브쇼핑과 쇼핑엔티에 적용돼 있고, 콘텐츠 제작 업체와도 PoC를 진행하고 있다. 숏폼AI를 도입한 고객사가 얻은 가장 큰 효과는 '100% 자동화'다. 실제 신세계라이브쇼핑의 경우 별도의 제작인력 없이 기획 인력만으로 100% 자동화된 숏폼 생성 프로세스(방송종료-데이터인입-분석-생성-다운로드)를 통해 획득한 숏폼 클립들을 별도의 지면에서 전시해 활용하며 리소스 효율을 극대화하고 있다. 또 홈쇼핑모아에서도 숏폼AI 기술이 들어간 '30초 홈쇼핑'을 운영 중이다. 30초 홈쇼핑의 경우 실제 홈쇼핑모아에서 운영중인 모든 탐색 영역을 통틀어 가장 높은 서비스 참여도(Engagement Depth, PV/UV)를 기록하고 있을 정도로 이용자의 반응이 좋다. '30초 홈쇼핑'의 참여도는 배포 첫 주 대비 35%이상 증가하며 지속적인 향상 추세를 보이고 있다. '30초 홈쇼핑'에 진입한 이용자는 타 영역대비 가장 많은 상품을 탐색하고 있으며, 홈쇼핑의 꽃인 생방송 상품이 포함되지 않았음에도 홈쇼핑 시청자들이 주인 홈쇼핑모아 이용자를 대상으로 이러한 성과를 도출해 냈다는 점에서 숏폼이 지닌 서비스 파워를 체감할 수 있다. 이처럼 숏폼을 도입한 기업들의 성과는 매우 고무적이며, 이러한 시장의 전반적인 분위기 속에서 올해도 숏폼AI에 대한 많은 도입 문의가 이어지고 있다. Q. 올해 숏폼AI 관련 계획이나 앞으로 관련 시장 전망은? 올해는 구글의 VEO2, 오픈AI의 소라(SORA)와 같은 text-to-video 모델들이 본격적으로 서비스화될 것으로 보인다. 이에 따라 영상 도메인에서의 AI 전환 또한 시장에서 중요한 화두가 될 것으로 보인다. 텍스트 프롬프트 중심의 영상제어가 아직은 보편화되지 않았지만 빅테크의 이러한 모델들이 보편화됨에 따라 영상 툴 이용자들의 작업 루틴에도 상당 부분 변화가 점진적으로 일어날 것으로 보인다. 버즈니도 이러한 변화의 흐름에 맞춰 Long-form to Short-form을 넘어 text기반 영상 편집 에이전트로의 발전을 염두에 두고 다양한 기능들을 출시하려고 한다. 상품상세 URL삽입 시, 숏폼으로 소구 될만한 다양한 추천페르소나별 시나리오를 생성하고, 이에 맞는 클립들을 구성해 컷편집 해주는 'URL to Short-form', 그리고 여러 건의 짧은 클립과 판매하고자 하는 상품URL을 함께 제공하면 제공된 클립들을 가장 숏폼에 적합한 형태로 정제해주는 'Clip to Short-form' 기능을 하반기에 출시할 예정이다. 기존의 편집 시나리오를 보다 자동화된 에이전트 형태로 UI에 구현한 '워크플로우' 기능은 2분기 출시 예정이다. 또 기존의 이커머스 산업을 넘어 유튜브 또는 틱톡 생태계로 확장을 위해 보다 다양한 AI 하이라이트 추천 페르소나를 계속 추가하고 있기 때문에 올 하반기에는 크레딧 구독 기반으로도 준비 중이다. 마지막으로 버즈니는 실제 제품과 산출물이 활용될 영역에 대한 깊은 이해와 연구를 바탕으로 숏폼AI를 도입한 고객사가 영상 콘텐츠의 확대재생산 영역에서 확실한 이윤을 창출할 수 있도록 지속 고도화해 나갈 계획이다.

2025.03.23 08:49백봉삼

SKT "클로드로 만든 텔코 LLM, 고객상담 효율성 높였다"

“앤트로픽 클로드를 파인튜닝한 텔코 LLM 도입으로 고객 상담 시 상담원이 더욱 효율적으로 상담에 필요한 정보를 찾을 수 있게 됐다.” 에릭 데이비스 SK텔레콤 AI테크콜라보레이션 본부장은 지난 19일 서울에서 열린 '앤트로픽 코리아 빌더 서밋'에서 클로드 활용 사례로 텔코 LLM 도입 건을 이같이 설명했다. 앤트로픽 코리아 빌더 서밋은 앤트로픽이 AI 제품 분석 플랫폼 운영사 콕스웨이브와 함께 개최한 개발자 행사로, 앤트로픽이 한국에서 처음으로 개최한 공식 행사다. 데이비스 본부장은 이날 패널 토의를 통해 SK텔레콤이 고객센터에 도입한 텔코 LLM의 사례를 소개하며 “고객센터에 적용한 텔코 LLM은 내부 상담원들이 사용하지만 결국 고객들에게 영향을 미치는 서비스”라고 소개했다. 이어, “SK텔레콤은 텔코 LLM을 사용하는 것이 실제로 고객을 만족시킬 수 있는 것인지에 대해 고민했고, 고객 만족도를 높이기 위한 형태로 엔지니어링을 계속 하고 있다”고 설명했다. SK텔레콤은 지난해 자체 개발 AI 모델 에이닷엑스(A.X)와 클로드 등을 포함, 멀티 LLM을 기반으로 텔코 LLM을 개발해 다양한 사내 운영 업무와 비즈니스에 활용하고 있고 이 가운데 고객센터에는 클로드를 적용한 텔코 LLM이 활용되고 있다. 서밋에 앞서 SK텔레콤은 앤트로픽 블로그를 통해 클로드를 베이스 모델로 파인튜닝된 텔코 LLM의 성과를 알리기도 했다. SK텔레콤은 고객센터에 텔코 LLM을 적용한 후 고객센터에 적용된 LLM의 저품질 응답 비율이 68% 감소했고, 통화 후처리에서 AI의 응답 품질이 인간 상담원의 약 89% 수준으로 올라왔으며, 고객센터 상담원이 상담에 활용한 후 평가한 점수도 기존 서비스에 비해 34% 높아졌다. SK텔레콤은 텔코 LLM 고객센터 도입이 상담원들을 지원하고 보조하기 위한 것임을 강조했다. 데이비스 본부장은 “우리의 목표는 사용자의 업무 능력을 보강해 고객센터 상담원들의 스트레스를 줄이고 일하는 즐거움을 찾아주는 것”이라며 “이러한 행위는 궁극적으로 SK텔레콤 가입자의 상담 경험 개선으로 이어져 상담원와 고객 모두에게 도움이 될 것”이라고 밝혔다. 그러면서 “과거에는 고객센터 직원들에게 고객들의 불만 제기에 어떻게 대응하면 좋을지를 교육했다면, 지금은 AI를 활용해 고객이 원하는 것에 대한 정보를 탐색하고 대응하는 데 도움을 주고있다”며 “우리의 AI는 인간을 대체하는 것이 아니고 사람들의 삶의 질을 개선하는 것”이라고 밝혔다. 한편 AI의 발전으로 인한 환경 변화에 대한 질문에 “SK텔레콤은 다양한 기업들과의 협업을 통해 각각의 상황에 따라 알맞은 모델을 활용할 수 있도록 멀티 LLM 전략을 진행하고 더욱 빠르고 더욱 효과적으로 일을 해결할 수 있도록 하고 있다”고 답했다.

2025.03.21 10:15박수형

"10년 뒤 인류 멸망할 수 있다"…국내 1세대 AI 연구자, 섬뜩한 발언한 이유는

"미국 트럼프 행정부가 들어서면서 인공지능(AI) 안전보다 발전에 더 주안점을 두기 시작했다는 점이 우려됩니다. 이렇게 되면 10년 뒤에 인류는 멸망할 수 있습니다." 한상기 테크프론티어 대표는 최근 서울 강남구 모두의연구소 강남캠퍼스에서 진행된 '국방 인공지능 혁신 네트워크' 행사에 연사로 참석해 이처럼 강조했다. 한 대표는 서울대 컴퓨터공학과를 졸업하고 카이스트에서 전산학 석·박사를 마친 국내 1세대 AI 연구자다. 이날 'AI 안전 : 주요 토픽과 해결할 문제들'이란 주제로 발표에 나선 한 대표는 최근 범용인공지능(AGI)의 능력이 향상되면서 추가적인 리스크들이 점진적으로 나타나는 것에 대해 우려를 표했다. 20일 업계에 따르면 AI는 고도화 수준에 따라 '제한적 인공지능(ANI)', 'AGI', 'ASI'로 구분한다. 이 중 AGI는 ANI인 오픈AI '챗GPT'나 구글 '제미나이'와 달리 사전 학습된 데이터와 알고리즘에 의존하지 않고도 새로운 문제를 분석하고 해결책을 제시할 수 있는 AI다. 인간 수준의 일반 지능을 갖추고 논리력과 창의적 추론 능력을 보유한 AI로 설명된다. 추론 능력이 향상된 오픈AI의 최신 모델 'o1', 'o3' 등은 ANI에서 AGI로 이행하는 단계에 있다는 평가를 받는다. 그 다음 단계인 ASI는 인간을 뛰어넘는 지적 능력을 갖춘 AI를 의미한다. 스스로 목표를 설정하고 개선하는 능력이 탁월해 인간이 상상할 수 없는 수준의 복잡한 문제를 창의적으로 해결할 수 있다. AI 간의 자발적 소통이 가능해 인류가 전유물로 여겨온 '집단 지성'도 구현할 수 있다. 한 대표는 "데미스 하사비스 구글 딥마인드 최고경영자(CEO)는 5년, 다리오 아모데이 앤트로픽 CEO는 2~3년 안에 AGI 시대가 올 것이라고 얘기하고 있다"며 "적어도 10년 안에 온다고 보면 이에 대한 (안전성과 관련해) 대비를 해 나갈 필요가 있다"고 강조했다. 또 한 대표는 AI를 '핵무기' 수준으로 봐야 한다고 강조하며 AI 발전과 함께 안전성도 같이 고려해 나가야 한다고 주장했다. 그는 "최근 앤트로픽 클로드 3.7이나 오픈AI o3 같은 모델들이 출시되면서 인터넷에 존재하지 않는 정보를 추론 능력으로 답변을 만들어지는 사례들이 늘어나고 있다"며 "생화학 무기, 핵무기 등에 이 같은 AI가 사용되기 시작할 경우 안전성이 확보되지 않으면 큰 문제가 될 것"이라고 지적했다. 그러면서 "이제는 AI 모델뿐 아니라 시스템, 애플리케이션까지 확대해 AI와 관련된 범죄 가능성에 대해 고민해봐야 할 시점"이라며 "영국 등에선 이미 안전성뿐 아니라 국가안보적인 관점에서 AI를 들여다 보기 시작했다는 점에서 우리나라도 함께 고민해 봐야 할 것"이라고 덧붙였다. 이날 '딥시크를 포함한 추론형 AI에 대한 이해'를 주제로 강연에 나선 이진원 하이퍼엑셀 CTO는 AI가 점차 발전하면서 인간이 통제할 수 있는 영역을 점차 벗어나고 있다는 점을 주목했다. 또 앞으로는 AI가 AI를 컨트롤하는 방향으로 기술 발전을 해 나가야 하지만 데이터가 AI 발전 속도를 따라가지 못하고 있다는 점에서 우려를 표했다. 더불어 이 CTO는 오픈AI가 생각하는 AI 5단계를 소개하며 현재 AI가 ANI에서 AGI로 넘어가는 과정에서 데이터 학습량을 더 늘리기 위해 엔비디아가 그래픽처리장치(GPU)를 더 크게 만들 필요가 있다는 점도 강조했다. 이 CTO는 "딥시크처럼 저렴한 모델들이 나오면서 앞으로 AI가 실제 산업에 더 다양하게 활용될 것으로 보인다"며 "GPU 수요는 앞으로 더 폭발적으로 늘어날 것으로 보인다"고 관측했다. 이어 "딥시크 같은 기업들이 속속 나오고 있지만 오픈AI, 구글 등 빅테크의 AI 기술력을 따라가기에는 쉽지 않을 것"이라며 "다만 우리나라가 AI 경쟁력을 키우기 위해선 중국 딥시크 같은 모델을 벤치마킹해야 한다"고 주장했다. 이날 행사에선 국방기술진흥연구소 박삼준 AI PD와 김일환 삼성SDS 그룹장, 최민석 ETRI AI 안전연구소 박사 등이 참여한 패널 토의도 '국방분야 생성형 AI 도입 및 활용 방향'을 주제로 진행됐다. 각 패널들은 AI의 통제력 상실을 막지 않으면 국방분야에 생성형 AI를 도입하는 것이 쉽지 않을 것으로 봤다. 최 박사는 "무기 체계가 알고리즘으로 움직여지는 상황에서 사람 통제를 벗어나 (AI를 통해) 자의적으로 움직여질 경우 상대뿐 아니라 우리에게도 그 피해가 발생할 것이란 점이 우려된다"며 "이를 막기 위해 여러 단계의 안전장치를 고려해야 하지 않을까 싶다"고 강조했다. 김 그룹장은 우리나라가 국방 분야에서 AI를 활용하기 위해선 양질의 데이터를 안전하게 확보하는 동시에 클라우드로 전환하는 것이 가장 중요하다고 주장했다. 또 미군이 팔란티어와 손잡고 국방 전 분야를 클라우드로 전환해 활용하는 사례를 들어 우리나라도 클라우드로 점차 전환해 나갈 필요가 있다고 지적했다. 현재 미군은 팔란티어의 SaaS(클라우드 기반 서비스형 SW)를 구독해 매일 시스템을 업데이트 하고 활용하고 있다. 김 그룹장은 "우리 군 역시 JADC2(합동 전 영역 동시통합지휘통제) 등을 추진하며 국방 AI에 대한 구체적인 계획을 가지고 있는 것으로 안다"며 "이를 실행하기 위해선 예산 확보가 필수적으로, 이 문제만 해결되면 우리나라군도 굉장히 빠르게 (미군 수준으로) 따라갈 수 있을 것이라고 생각한다"고 말했다.

2025.03.20 17:13장유미

디노티시아·하이퍼엑셀, AI칩 결합해 최적 추론 시스템 개발

인공지능(AI)·반도체 통합 솔루션 전문기업 디노티시아는 AI 반도체 설계 팹리스 스타트업 하이퍼엑셀과 공동으로 'RAG(검색증강생성) 최적화 AI 추론 시스템' 개발에 나선다고 20일 밝혔다. 이번 협력은 디노티시아의 벡터 데이터 연산 가속기 칩(VDPU)과 하이퍼엑셀의 거대언어모델(LLM) 가속기 칩인 'LLM 프로세싱 유닛(LPU)'을 결합해 하나의 통합 시스템으로 구현하는 방식으로 진행된다. AI 서비스 분야에서 데이터 검색의 중요성이 점차 커지고, 데이터의 모달리티(modality)도 다양해지며 양이 늘어나면서, 더 빠른 데이터 검색이 점점 더 요구되고 있다. 기존 시스템은 소프트웨어에 의존해 데이터를 검색하고, LLM 기반의 GenAI 과정을 별도로 처리해 응답 속도가 느리고 전력 소모가 많았다. 디노티시아는 벡터 데이터베이스 연산 가속기 칩, VDPU를 활용해 AI가 대규모 멀티모달 (Multi-modal) 데이터를 실시간으로 검색·활용할 수 있도록 제공하고, 하이퍼엑셀은 LPU 칩을 통해 AI 모델의 연산 성능을 극대화 한다. 양사는 이 두 칩을 결합해, 검색과 추론을 동시에 처리하는 세계 최초의 RAG 특화 AI 시스템을 완성할 계획이다. 정무경 디노티시아 대표는 “LLM 서비스가 확산되면서 데이터 검색에 대한 요구사항이 급격히 늘어나고 있다”며 “이번 협력을 통해 AI 모델의 추론뿐 아니라 데이터 검색 기능까지 최적화한 새로운 개념의 AI 시스템을 선보이겠다”고 말했다. 김주영 하이퍼엑셀 대표는 “AI 연산의 병목 현상을 해결하고, 성능과 효율성을 동시에 확보하는 것이 AI 반도체의 핵심 과제”라며 “이번 협력을 통해 RAG와 LLM을 최적화한 AI 시스템을 구축함으로써, AI 시스템 운영 방식을 혁신하는 중요한 전환점이 될 것”이라고 말했다.

2025.03.20 10:42장경윤

[현장] 이경일 솔트룩스 대표 "초거대 AI 대신 에이전트로 돌파구 찾아야"

"한국이 초거대 AI 모델 경쟁에서 살아남기 위해서는 소형 모델 최적화와 데이터 활용 전략이 필수적입니다. 단순한 거대 모델 구축이 아니라 에이전트 AI와 같은 차별화된 기술을 통해 비용을 절감하고 성능을 극대화해야 합니다. 당장 이 변화를 준비하지 않으면 글로벌 AI 시장에서 도태될 것입니다." 이경일 솔트룩스 대표는 14일 강남 해성빌딩에서 열린 '한국데이터산업협회(KODIA) 정기총회'에서 '생성형 AI와 데이터 산업의 미래'를 주제로 특별 강연을 진행하며 이같이 말했다. 이날 행사는 국내 데이터 산업의 발전 방향을 모색하고 업계 관계자들이 최신 AI 트렌드를 공유하기 위해 KODIA가 마련했다. 이 대표는 행사에서 거대언어모델(LLM) 중심의 경쟁이 아닌 에이전트 AI를 기반으로 한 차별화 전략이 필요하다는 점을 강조했다. 글로벌 기업들과 정면 승부하기보다는 데이터 활용 최적화와 협업형 AI 모델로 새로운 시장 기회를 모색해야 한다는 주장이다. 지난 2022년 '챗GPT' 출시 이후 AI 산업은 PC·인터넷·스마트폰 시대를 거쳐 또 한 번의 변곡점을 맞았다. 기술 패러다임이 변화할 때마다 기존 강자들이 몰락하거나 새로운 기업들이 부상했는데 생성형 AI는 이 흐름을 이어받아 새로운 혁신을 이끌고 있다. 지난 1980년대 유닉스 기반 기업들의 쇠퇴, 1990년대 인터넷 기업의 등장, 2010년대 스마트폰 혁명이 대표적인 사례다. 현재 생성형 AI는 지난 2022년 이후 급격한 성장세를 보이며 또 하나의 기술 혁신 시점을 맞고 있다. 이 대표는 "단순히 오픈AI '챗GPT' 같은 거대 모델을 구축하는 방식은 비용과 인프라 측면에서 한계가 크기 때문에 국내 기업들은 소형 모델 최적화 및 데이터 기반 전략으로 경쟁력을 확보해야 한다"고 주장했다. 이어 "트랜스포머(Transformer) 모델의 발전과 초거대 모델의 등장으로 AI 성능이 폭발적으로 증가하고 있지만 그에 따른 문제점도 함께 발생하고 있다"고 지적했다. 그는 ▲환각(Hallucination) ▲최신 정보 부족 ▲보안 문제를 생성형 AI의 주요 한계점으로 꼽았다. 생성형 AI가 확률 통계적으로 답변을 생성하는 방식 때문에 존재하지 않는 사실을 말하는 문제가 빈번히 발생하며 이는 AI 신뢰성을 저하시킨다. 이를 해결하기 위해 검색증강생성(RAG)이 기본적으로 적용되고 있으며 솔트룩스도 이를 기반으로 한 에이전트 AI 개발에 집중하고 있다고 밝혔다. 이 대표는 국내에서 초거대 모델을 구축하기에는 비용과 인프라 측면에서 현실적인 한계가 있다며 대안으로 ▲믹스오브엑스퍼드(MoE) ▲지식 증류(Knowledge Distillation) ▲양자화(Quantization) 등의 기술을 활용한 비용 절감 및 성능 최적화 전략이 필요하다는 점을 강조했다. MoE는 거대 모델 하나에 모든 기능을 몰아넣기보다 여러 개의 소형 특화 모델을 협업하게 만드는 방식이다. 이를 통해 비용을 절감하면서도 고성능 AI 서비스를 제공할 수 있다. 지식 증류는 이미 학습된 대형 모델에서 중요한 지식만을 추출해 더 작은 모델에 적용하는 기술로, 연산량을 줄이면서도 학습된 정보의 핵심을 유지할 수 있는 방식이다. 이를 통해 경량 모델이 대형 모델 수준의 성능을 갖추도록 만들 수 있다. 양자화는 AI 모델이 사용하는 수치 연산을 더 작은 비트(bit)로 변환해 메모리 사용량을 줄이고 연산 속도를 향상시키는 기법이다. AI 시스템의 전력 소모를 줄이는 동시에 제한된 컴퓨팅 자원에서도 보다 효율적인 추론이 가능해진다. 에이전트 AI가 차세대 기술로 부상하는 이유에 대해 그는 "단순 질의응답이 아닌 다단계 추론과 문제 해결이 가능한 AI가 필요하기 때문"이라고 설명했다. 기존 LLM 기반 서비스가 사용자의 질문에 바로 답하는 방식이었다면 에이전트 AI는 검색·추론·결정 과정을 거쳐 최적의 솔루션을 제공하는 구조다. 이에 따라 마이크로소프트(MS), 구글, 오픈소스 커뮤니티 등이 에이전트 AI 개발을 가속화하고 있다. 솔트룩스 역시 '구버(Guber)'라는 에이전트 AI 서비스를 개발하고 있다. 이 대표에 따르면 '구버'는 사용자의 질문을 받아 분석한 후 검색증강생성(RAG)과 다단계 추론을 거쳐 최적의 답변을 제공하는 시스템으로, 회사는 이를 챗봇을 넘어 전문적인 데이터 활용이 가능한 AI로 발전시킬 계획을 세우고 있다. AI 생태계에서 데이터의 중요성도 강조됐다. 이 대표는 "AI는 결국 데이터 산업"이라며 "모델은 알고리즘을 통과한 숫자 데이터 덩어리일 뿐으로, 이는 결국 데이터가 곧 AI 경쟁력을 좌우함을 의미한다"고 강조했다. 행사를 마치며 그는 한국 AI 산업이 글로벌 시장에서 생존하기 위한 조건으로 ▲GPU 인프라 확충 ▲도메인 특화 AI 사례 확보 ▲공공 부문 AI 국산화 가속화 ▲글로벌 AI 스타트업 지원 ▲AI 투자 환경 개선 등을 제안했다. 이 대표는 "AI 산업이 변화하는 속도가 매우 빠르다"며 "신속히 에이전트 AI 기반 서비스 및 데이터 최적화 전략을 도입하지 않으면 글로벌 경쟁에서 뒤처질 것"이라고 말했다.

2025.03.14 16:55조이환

KETI, 'AW 2025'서 LLM·모방학습 이용한 조립공정 자동화 기술 공개

한국전자기술연구원(KETI·원장 신희동)이 12일 서울 코엑스에서 개최한 '2025 스마트공장·자동화산업전(AW 2025)'에서 '거대언어모델(LLM) 및 모방학습을 이용한 조립 공정 자동화 기술' 등 총 13개의 로봇·인공지능(AI) 기술을 선보였다. KETI 지능로보틱스연구센터가 선보인 'LLM 및 모방학습을 이용한 조립 공정 자동화 기술'은 별도 작업 지시나 프로그래밍 없이 사용자가 자연어 형태로 입력하면 직관적으로 로봇을 제어할 수 있도록 구현했다. 이 기술은 모방학습을 활용해 복잡한 공정을 자동화할 수 있다. 또 LLM을 통해 다양한 형태의 사용자 명령에도 유연하게 대응할 수 있다. KETI 관계자는 “모방학습 네트워크는 사용자 시연을 통해 학습 데이터를 획득하고 로봇의 위치 정보와 3개의 카메라 정보를 활용해 학습을 수행했고 LLM은 사용자의 자연어 명령을 모방학습 네트워크가 이해할 수 있는 형태로 변환해 직관적인 로봇 제어를 구현한다”고 설명했다. 이번 연구는 산업통상자원부와 한국산업기술기획평가원(KEIT)이 지원하는 로봇산업기술개발 사업의 '고난도 조립작업 교시 및 작업상태 인지 기반 자율작업 계획 솔루션 개발' 과제를 통해 추진됐다. 한편, KETI는 'AW 2025' 컨퍼런스인 'AI‧로봇이 열어가는 자율제조 혁신포럼'을 개최, 자율제조의 핵심 기술인 AI·지능형 로봇·로봇AI 기반 자동화·디지털 트윈 등의 최신 연구와 산업 동향을 공유하고, 제조업의 혁신 방향을 모색한다. 행사에는 국내 로봇산업 주요 산학연 전문가들이 참여해 실제 제조업에서 적용된 로봇 기반 자율제조 사례와 성과를 분석하고, 도입 과정에서의 문제점과 해결 방안을 논의할 계획이다. 임태범 KETI 지능정보연구본부장은 “이번 포럼은 산업계·학계·연구기관 사이 로봇 기술 협력과 확산을 촉진하는 계기가 됐다”며 “로봇 기반 자율제조가 국내 제조업의 글로벌 경쟁력 강화를 위한 핵심 전략이 될 수 있도록 적극 지원하겠다”고 밝혔다. 포럼은 산업부와 한국산업기술진흥원(KIAT)이 지원하는 로봇산업기술개발 사업의 '빅데이터 활용 마이스터 로봇화 기반 구축' 과제와 '협업지능 기반 로봇플러스 경쟁력 지원 사업' 과제를 통해 진행했다.

2025.03.12 17:48주문정

"연내 韓 특화 LLM 출시"…'오픈AI 대항마' 코히어가 찍은 LG CNS, 글로벌 사업 날개

"코히어와 LG CNS의 파트너십을 발표하게 돼 매우 기쁩니다. LG CNS와 함께 한국 기업들이 우리 기술이 적용된 인공지능(AI) 에이전트를 업무에 도입할 수 있게 열심히 돕겠습니다" '오픈AI 대항마'로 여겨지는 캐나다 AI 스타트업 코히어를 설립한 에이단 고메즈 최고경영자(CEO)가 한국 사업 확장을 위한 파트너로 LG CNS를 택했다. LG CNS이 그동안 '인공지능 전환(AX)' 전문기업으로서 경쟁력을 높여왔던 데다 수년간 노하우를 축적해 기업 고객들에게 최적의 기술을 제공하며 신뢰를 쌓아왔던 만큼 코히어의 한국 사업에 보탬이 될 것으로 여겨서다. 9일 업계에 따르면 고메즈 CEO는 지난 6일 서울 서초구 양재동 엘타워에서 진행된 LG CNS AX(AI 전환) 세미나에 연사로 참석한 후 국내 에이전틱(Agentic) AI 시장 선점을 위한 파트너십을 체결했다. 코히어가 국내 기업과 AX 파트너십을 맺은 것은 이번이 최초다. 고메즈 CEO는 "한국에선 LG CNS 외에 파트너십을 맺는 기업이 없을 것"이라며 "앞으로 LG CNS와 원팀으로 계속 협업을 이어가며 한국 특화 거대언어모델(LLM)을 만들 뿐 아니라 풀스택을 갖추고 있는 만큼 고객에게 맞는 최적화 된 모델을 선보일 것"이라고 강조했다. 코히어는 2019년 구글 출신 AI 연구원들이 설립한 캐나다 기반 AI 유니콘 기업이다. 창업자 고메즈 CEO는 LLM의 근간이 된 트랜스포머 논문의 공동저자이자 'AI의 대부'로 불리는 제프리 힌턴의 제자다. 코히어의 에이전트 디렉터인 패트릭 루이스는 LLM 적용에 핵심 기능인 검색증강생성(RAG)을 최초로 제시한 인물이다. 코히어는 기업을 위해 구축한 데이터 보안 기반의 AI 모델과 솔루션을 보유하고 있다. 이에 시장에선 오픈AI, 앤트로픽 만큼 큰 주목을 받고 있다. 엔비디아를 비롯해 세일즈포스, AMD, 시스코, 일본 후지쯔 등 글로벌 기업들로부터 자금을 지원 받고 있는 상태로, 현재 조달한 자금은 총 9억7천만 달러(약 1조3천468억원)인 것으로 알려졌다. 이곳의 기업 가치는 55억 달러(약 8조원)에 이른다. 또 코히어는 자체 LLM과 에이전틱 AI 솔루션을 기반으로 금융, 제조, 공공, 헬스케어, 에너지 등 다양한 산업 영역에서 AX 사업을 진행하고 있다. 이에 캐나다 최대은행 RBC(Royal Bank of Canada), 일본 후지쯔, 사우디아라비아 STC 그룹과도 AX 협력을 체결했다. 진요한 LG CNS AI센터장은 "글로벌 톱 AI 기업인 코히어와 국내 최초이자 독점적 파트너십을 체결하게 돼 뜻깊다"며 "국내에서 본격적인 에이전틱 AI가 시작되지 않은 시점에서 우리가 코히어와 함께 시장을 선도해 나갈 것"이라고 밝혔다. 코히어는 LG CNS와 함께 올해 안에 한국 특화 LLM을 선보일 뿐 아니라 한국 기업 맞춤형 에이전틱 AI 서비스 공동 개발에도 나선다. 최근 업계 화두인 에이전틱 AI는 단순히 질문에 답변하고 보고서를 생성해주는 AI를 넘어 목표를 달성하기 위해 자율적으로 계획, 실행, 평가를 반복하며 스스로 판단하고 복잡한 문제를 해결하는 기술이다. 예를 들어 기존의 금융 기업 AI 챗봇은 보험 상품 추천 관련 요청을 받았을 때 학습된 데이터를 바탕으로 질문에 대한 답변을 요약·생성한다. 반면 에이전틱 AI는 한 단계 나아가 인터넷에서 추가 정보를 검색하거나, 해당 상품을 가장 잘 설명해줄 수 있는 담당자와 미팅 가능한 시간을 탐색해 예약까지 해줄 수 있다. 에이전틱 AI는 보다 근본적이고 자율적인 문제 해결이 가능하다. 업계에선 양사가 성능, 효율, 보안, 비용 요소를 모두 충족하는 AI 서비스를 제공해야 하는 기업 대상의 AI 사업에 집중하고 있다는 공통점에 주목해 이번 협업의 성과를 기대하고 있다. 특히 LG CNS는 코히어의 에이전틱 AI 솔루션 '노스(North)'를 국내에서 가장 먼저 커스터마이징해 기업 맞춤형 에이전틱 AI 서비스를 구축하고 온프레미스(구축형) 방식으로 안전하게 제공할 예정이다. 노스에는 인사관리, 재무, 고객지원 등 기업의 핵심 업무를 담당하는 AI 에이전트와 다양한 LLM이 탑재돼 있어 기업이 필요로 하는 에이전틱 AI 서비스를 손쉽게 만들 수 있다. '노스'는 지난 1월 출시됐다. 또 LG CNS는 이번 파트너십을 통해 코히어의 LLM을 파인튜닝해 한국어·금융 특화 에이전트 모델을 공동으로 개발하고 노스에 탑재할 계획이다. 이를 위해 LG CNS는 축적된 금융 분야 전문 지식과 데이터를 이 모델에 학습시킬 예정이다. 이 모델은 ▲산업별·업무별 최적화 ▲빠른 처리 속도 ▲우수한 보안성 ▲비용 효율성 등의 장점을 갖추고 있어 에이전틱 AI 서비스에 효과적으로 적용될 수 있다. 양사는 금융 분야 AX 시장 공략을 시작으로 제조, 유통·서비스 등으로 산업 영역을 확장하고 향후 글로벌 에이전틱 AI 시장 진출도 모색할 계획이다. 고메즈 CEO는 "LG CNS는 (코히어와 파트너십을 맺고 있는) 오라클과 또 다르게 (여러 기업들의) 대규모 솔루션을 기반으로 고객에게 최적화된 에이전틱 AI를 구축해 배포하고, 이 사업을 더 키우려는 의지를 강하게 갖고 있다"며 "오라클은 자신들이 가진 소프트웨어에 맞춰 (AI) 기능을 활용하려는 느낌이 있다는 점에서 차별화된 것 같다"고 설명했다. 그러면서 "국내 대표 AX 기업 LG CNS와 함께할 앞으로의 여정이 기대가 된다"며 "한국 금융 기업을 시작으로 여러 산업 영역의 기업에게 꼭 필요한 에이전틱 AI 서비스를 LG CNS와 함께 제공해 나가겠다"고 밝혔다.

2025.03.10 10:02장유미

[현장] 엔비디아가 찍은 'AI 천재' 에이단 고메즈 코히어 CEO, 韓 찾아 금융시장에 '러브콜'

"금융 서비스와 의료, 공공 부문과 같은 산업을 중심으로 한국에서도 성과를 낼 수 있었으면 합니다." 캐나다 인공지능(AI) 스타트업 코히어 창업자 에이단 고메즈 최고경영자(CEO)가 한국 시장 공략에 대한 의지를 드러냈다. 오픈AI, 구글 등 미국 빅테크들과 달리 기업 시장을 주로 공략하며 수익 효율화에 나선 코히어가 향후 어떤 전략으로 국내 고객 확보에 나설 지 주목된다. 고메즈 CEO는 6일 서울 서초구 양재동 엘타워에서 진행된 LG CNS AX(AI 전환) 세미나에 연사로 참석해 "우리 고객들은 글로벌 경제의 주요 부문에서 자사 솔루션을 활용하고 있다"며 "금융, 의료, 제조, 에너지, 정부, 통신 등 모든 산업이 우리의 주력 분야"라고 강조했다. 코히어는 지난 2019년 구글 전 연구원 출신인 에이단 고메즈, 닉 프로스트와 캐나다 기업가인 이반 장이 설립한 곳으로, 오픈AI, 앤트로픽 등을 경쟁사로 두고 있다. 엔비디아를 비롯해 세일즈포스, AMD, 시스코, 일본 후지쯔 등 글로벌 기업들로부터 자금을 지원 받고 있는 상태로, 현재 조달한 자금은 총 9억7천만 달러(약 1조3천468억원)인 것으로 알려졌다. 이곳의 기업 가치는 55억 달러(약 8조원)에 이른다. IT 전문 매체 디인포메이션에 따르면 코히어의 지난해 3월 기준 연 매출은 3천500만 달러로, 오픈AI에는 한참 못미치고 있다. 오픈AI의 매출은 지난해 40억 달러, 오는 2029년에는 1천억 달러에 이를 것으로 예상됐다. 경쟁사인 앤트로픽과 비교해도 지난해 매출이 최소 5배 이상 앞선 것으로 분석됐다. 이 같은 상황 속에 코히어는 올해부터 글로벌 사업 확장을 통해 매출 확대를 추진하는 분위기다. 이를 위해 국내에서도 LG CNS와 향후 협업을 추진할 계획이다. 올해 1월에는 기업 고객을 집중 공략하기 위해 AI 워크스페이스 플랫폼 '노스'도 출시했다. '노스'는 기업이 '커맨드(Command)' 모델 시리즈와 상호작용할 수 있는 챗봇 인터페이스를 제공한다. 이 도구를 통해 직원들은 수익 보고서를 분석하거나 문서를 찾는 등 비즈니스 작업을 수행할 수 있다. 특히 텍스트뿐 아니라 그래프와 같은 데이터도 출력할 수 있다는 점이 장점이다. 고메즈 CEO는 '에이전트 AI, 비즈니스의 새로운 동력'이라는 주제를 앞세워 진행된 이날 세미나에서 '노스'를 직접 소개하며 한국 기업을 고객사로 확보하기 위해 노력했다. 이번 세미나에는 LG CNS 임직원들과 고객사 220여 명이 참석해 코히어의 제품과 향후 전략에 대해 높은 관심을 보였다. 고메즈 CEO는 "5년 반 전 창업해 현재 엔터프라이즈에 초점을 맞춘 선도적인 글로벌 대규모 언어 모델(LLM) 기업 AI 회사로 성장했다"며 "강력한 기관 투자자들과 전략적 비즈니스 파트너들의 지원을 받고 있는 상태로, 미국 오라클, 캐나다 RBC, 일본 후지쯔, 사우디아라비아 STC 등 전 세계 유슈의 기업들과 협력하고 있다"고 운을 띄웠다. 이어 "우리의 사명은 일상적인 업무를 사람이 아닌 기계에 맡겨 비즈니스 생산성과 효율성을 높이는 것"이라며 "이에 맞춰 두 가지 최첨단 (AI) 기본 모델을 구축하고 있는 상태로, 최근 선보인 '에이전틱 AI' 플랫폼 (노스)도 주력으로 내세우고 있다"고 소개했다. 그러면서 "(자사) 기업 중심의 AI 솔루션은 매우 정확하고 다국어를 지원하며 특정 비즈니스 요구사항에 맞게 맞춤화할 수 있다는 것이 장점"이라며 "특히 데이터 보안과 데이터 프라이버시를 최우선으로 생각하고 있고 클라우드부터 온프레미스에 이르기까지 매우 유연하게 배포할 수 있다는 것도 강점"이라고 덧붙였다. 코히어는 이날 첫 번째 비전언어모델(VLM)인 '아야 비전'도 오픈 소스로 출시해 주목 받았다. 이 모델은 다국어 텍스트 생성과 이미지 이해 관련 벤치마크에서 최상위 성능을 기록했으며 8B와 32B 두 가지 버전으로 제공된다. 지원 언어는 한국어를 포함해 총 23개로, 현재 출시된 오픈소스 멀티모달 AI 모델 중 가장 많다. 고메즈 CEO는 "AI 기술은 단순한 채팅 봇을 넘어 복잡한 작업을 실제로 자동화할 수 있는 시스템으로 발전하고 있다"며 "우리는 이러한 기술이 모든 중요한 데이터와 시스템에 안전하게 액세스해 업무의 품질과 속도를 개선할 수 있도록 하는 데 중점을 두고 있다"고 밝혔다. 이어 "'노스'를 포함해 고객들의 비즈니스 운영을 간소화하고 작업자의 생산성 높이는 데 도움이 되는 새로운 기능을 꾸준히 제공할 것"이라며 "보안, 개인정보 보호에 대한 해결책을 갖고 있는 자사의 솔루션을 통해 (한국 기업들도) 반복적인 업무를 자동화하는 맞춤형 AI 에이전트를 빠르게 구축할 수 있을 것"이라고 덧붙였다.

2025.03.06 15:34장유미

[현장] 진요한 LG CNS AI 센터장 "韓 AI 3대 강국 도약, 기업 AX 성과에 달렸다"

"국내 기업들이 인공지능 전환(AX) 부문에서 성과를 내는 것에 집중한다면 우리나라가 인공지능(AI) 3대 강국으로 도약할 수 있을 것이라고 생각합니다." 진요한 LG CNS AI 센터장은 6일 서울 서초구 양재동 엘타워에서 진행된 LG CNS AX(AI 전환) 세미나에서 각 기업들이 미래 지향적인 AI 로드맵을 어떻게 가져가야 할 지를 설명하며 이처럼 강조했다. 진 센터장은 미국의 모바일 광고 플랫폼 기업인 탭조이에서 데이터 사이언스 분야와 SK텔레콤, 이마트 등에서 디지털 사업을 총괄하던 인물로, 지난 2023년 11월 LG CNS에 합류했다. LG CNS에선 지난해 출범한 AI센터를 이끌며 생성형 AI 사업에 주력하고 있다. '에이전트 AI, 비즈니스의 새로운 동력'이라는 전체 주제를 앞세워 진행된 이날 세미나에는 진 센터장을 포함한 LG CNS 임직원들과 고객사 220여 명이 참석했다. 이 자리에는 캐나다 AI 스타트업 코히어를 설립한 에이단 고메즈 최고경영자(CEO)도 강연자로 참여해 주목 받았다. 진 센터장은 "자사는 300여 명의 AI 전문가를 포함해 AI 클라우드 사업부에는 2천 명 정도의 직원들이 AX 사업을 확대하기 위해 노력 중"이라며 "하루가 멀다하고 경쟁적으로 새로운 AI 모델이 나오고 있는 상황에서 AGI(범용인공지능) 등의 등장으로 앞으로 많은 변화를 겪게 될 기업 고객들을 도울 것"이라고 강조했다. 또 진 센터장은 올해 AI 코딩 분야에서 구글 바둑 AI 프로그램인 '알파고'만큼 시장에 큰 충격이 있을 것이라고 전망했다. 특히 지난해 출시된 오픈AI의 추론 모델인 'o3'의 등장 후 기술 변화가 갈수록 빨라지고 있다고 진단했다. 진 센터장은 "올해 말이 되면 전 세계에서 코딩을 가장 잘하는 사람보다도 더 코딩을 잘하는 AI 모델이 나올 것이란 얘기가 나오고 있다"며 "이를 앞으로 어떻게 도입할 수 있을까에 대해선 기업들이 많이 고민하고 있는 상황"이라고 설명했다. 그러면서 "기업들이 거대언어모델(LLM)을 도입해 AX에서 성과를 내기 위해선 비용, 성과, 보안 등 3가지 요건을 갖춰야 한다"며 "자사는 기업만을 대상으로 한 생성형 AI 기술을 개발하는 한편, 'AI 에이전트'를 넘어 '에이전틱 AI' 시대에 맞춘 솔루션을 제공함으로써 기업들이 실질적인 효과를 얻을 수 있도록 지원할 것"이라고 강조했다. 이를 위해 LG CNS는 캐나다 AI 스타트업인 코히어와 향후 협력할 계획이다. 코히어는 지난 2019년 구글 전 연구원 출신인 에이단 고메즈, 닉 프로스트와 캐나다 기업가인 이반 장이 설립한 곳으로, 오픈AI, 앤트로픽 등을 경쟁사로 두고 있다. 엔비디아를 비롯해 세일즈포스, AMD, 시스코, 일본 후지쯔 등 글로벌 기업들로부터 자금을 지원 받고 있는 상태로, 현재 조달한 자금은 총 9억7천만 달러(약 1조3천468억원)인 것으로 알려졌다. 이곳의 기업 가치는 55억 달러(약 8조원)에 이른다. 또 코히어는 기업 고객을 공략하기 위해 올해 1월 AI 워크스페이스 플랫폼 '노스'도 출시해 매출 확대를 위해서도 본격 나섰다. '노스'는 기업이 '커맨드(Command)' 모델 시리즈와 상호작용할 수 있는 챗봇 인터페이스를 제공한다. 이 도구를 통해 직원들은 수익 보고서를 분석하거나 문서를 찾는 등 비즈니스 작업을 수행할 수 있다. 특히 텍스트뿐 아니라 그래프와 같은 데이터도 출력할 수 있다는 점이 장점이다. 진 센터장은 "AI 에이전트 안에는 기업이 고려하고 갖춰야 할 요소들이 굉장히 많은 데, 코히어는 오라클, 세일즈포스 등 데이터베이스를 기반으로 한 회사들과 협업하며 AI 에이전트 시장에서 좋은 성과를 내고 있다"며 "우리도 AI 에이전트로 진화하고 있는 현 상황에서 AX 리더로서의 역할을 제대로 해 나감으로써 국익에 도움될 수 있도록 노력할 것"이라고 강조했다.

2025.03.06 13:49장유미

투비유니콘, NIPA 바우처 공급자로 선정…"원하는 기업에 AI솔루션 제공"

투비유니콘(대표 윤진욱)은 과학기술정보통신부와 정보통신산업진흥원(NIPA)이 주관하는 '2025년 AI 바우처 지원사업' 공급기업으로 선정됐다고 5일 밝혔다. 투비유니콘은 공공기관 및 산업군에 따라 수요맞춤형으로 소형언어모델(sLLM)을 구축한 후 서비스용 AI 솔루션을 공급할 계획이다. AI 바우처 지원사업은 AI 솔루션을 보유한 공급기업과 AI 도입을 원하는 중소·벤처·중견기업을 연결시켜주는 프로그램이다. 수요 기업 초기 비용 부담을 낮추고, 국내 AI 기술을 확산하자는 취지로 만들어졌다. 수요 기업에서는 최대 2억 원 상당의 바우처를 활용해 AI 솔루션 공급업체 제품이나 서비스를 도입하면 된다. 투비유니콘은 한국어를 기반으로 특정 도메인 비즈니스 응용 서비스가 가능한 파운데이션 모델(TBU-LLM)을 보유 중이다. 윤진욱 대표는 "이 모델을 위해 우리나라 중등교육과정 수준의 교과목별 다양한 지식 데이터에 문화체육관광부 국립국어원 언어정보나눔터와 위키피디아 등 7개 공개 데이터를 학습시켰다"며 "데이터 정제 및 증강과정을 거쳐 한국어에 특화된 국내 몇 안되는 원천기술"이라고 말했다. 윤 대표는 "'TBU-LLM'에 수요기관 특정 도메인 데이터와 실시간 획득 정보를 추가 학습시킨 후 사용자 프롬프트를 통해 창의적인 사고를 실현시킬 경우 분야별 전문가 수준의 답변이 가능하다"고 설명했다. 수요기관이나 기업은 'TBU-LLM'을 활용할 경우 특화된 sLLM으로 온프레미스(기업자체 데이터센터) AI를 구현할 수 있다. 또 AI 서비스형 소프트웨어(SaaS) 솔루션을 개발, 고객들에게 맞춤형 서비스도 제공할 수 있게 된다. 윤진욱 대표는 “AI 바우처 사업을 통해 보다 많은 공공기관 및 기업이 AI 기술을 도입하고, 이를 통해 업무 혁신과 디지털 전환을 가속할 수 있도록 적극 지원할 것" 이라고 말했다. 한편 AI 바우처 지원사업을 통해 자체 sLLM 구축을 희망하는 기관과 기업들은 투비유니콘의 홈페이지(www.tobeunicirn.kr)에서 상담 및 신청하면 된다.

2025.03.05 17:35박희범

가격 반등 성공한 DDR5…딥시크·HBM 등이 향후 변수

고성능 PC용 D램 가격이 지난달 반등에 성공한 것으로 집계됐다. 중국의 저비용·고효율 AI 모델인 딥시크의 등장으로 PC 수요가 덩달아 증가하면서, 이에 대응하는 메모리 판매량도 늘어난 것으로 분석된다. 지난달 28일 시장조사업체 트렌드포스에 따르면 지난달 DDR5 16Gb(기가비트) 제품의 평균 고정거래가격은 전월 대비 1% 상승한 3.80달러로 집계됐다. 올 1분기 PC용 D램의 고정거래가격은 전분기 대비 10~15% 하락할 것으로 관측된다.지난해 4분기에 이어 하락세를 이어간 것으로, 1분기 초 D램 공급업체들의 재고 수준이 상대적으로 증가한 것이 주된 영향으로 풀이된다. 다만 지난달에는 고정거래가격의 추가 하락이 나타나지 않았다. 미국의 추가 관세 정책에 따른 우려로 PC 제조사들이 D램 재고를 미리 확보한 데 따른 영향이다. 또한 삼성전자, SK하이닉스 등이 HBM(고대역폭메모리) 및 모바일 D램 양산에 집중하면서, PC D램의 공급이 일시적으로 제한되고 있다. 특히 DDR5 16Gb(기가비트)의 경우 지난달 고정거래가격이 1% 상승한 것으로 나타났다. 지난해 8월 이후 지속되던 가격 하락세가 반전으로 돌아섰다. 이전 세대인 DDR4는 가격이 변동하지 않았다. 트렌드포스는 "중국 딥시크의 영향으로 고성능 GPU가 탑재된 PC 수요가 증가하면서, 5600MT/s(초당 5600만회의 데이터 전송) 이상을 구현하는 16Gb DDR5의 수요가 늘어났다"며 "주로 SK하이닉스가 공급하는 제품이나, 현재 서버 및 모바일 D램 양산에 집중하고 있어 PC용 DDR5 D램 공급에 제한이 있다"고 설명했다. 향후에도 PC용 D램 시장은 딥시크와 같은 저비용·고효율 AI 모델, 주요 메모리 기업들의 HBM 양산 전략 등에 따라 영향을 받을 것으로 전망된다. 노트북·태블릿 등 IT기기에 AI 기능이 활성화될수록, 관련 로직 및 메모리 반도체 수요를 촉진할 수 있기 때문이다. 시장조사업체 카운터포인트리서치에 따르면, 2023~2027년 생성형 AI 노트북 출하량은 연평균 59%의 성장률을 기록할 것으로 예상된다. 전체 노트북 출하량의 연평균 성장률이 3%로 예상된다는 점을 고려하면 가파른 성장세다.

2025.03.01 08:10장경윤

"비용·업무 최적화"…IBM, 기업 전용 LLM 그래니트 신형 출시

IBM이 기업 업무환경에 최적화된 대규모언어모델(LLM) 최신 버전을 선보인다. IBM은 LLM 제품군 차세대 버전인 그래니트(Granite) 3.2를 출시했다고 27일 밝혔다. 그래니트는 작고 효율적이며 실용적인 기업용 인공지능(AI)을 제공해 실질적인 비즈니스 효과를 창출하기 위한 IBM의 지속적인 노력이 담긴 솔루션이다. 그래니트 3.2 모델은 허깅 페이스에서 허용되는 아파치 2.0 라이선스에 따라 사용할 수 있다. 일부 모델들은 IBM 왓슨x.ai, 올라마(Ollama), 리플리케이트(Replicate), LM 스튜디오에서 바로 사용가능하다. 레드햇 엔터프라이즈 리눅스(RHEL) AI 1.5에서도 제공돼 기업과 오픈 소스 커뮤니티에 새로운 기능을 제공할 예정이다. 그래니트 3.2은 문서 해석 작업을 위한 새로운 비전언어모델(VLM)이다. 엔터프라이즈 벤치마크인 DocVQA, ChartQA, AI2D 및 OCR벤치에서 기존 대형 모델인 라마 3.2 11B 및 픽스트랄 12B와 동등하거나 그 이상의 성능을 입증했다. IBM은 풍부한 학습 데이터뿐 아니라 자체 오픈 소스 도클링(Docling) 도구를 활용해 8천500만 개의 PDF를 처리하고 2천600만 개의 합성 질문-답변 조합을 생성해 복잡한 문서 중심의 업무를 처리하는 VLM의 능력을 향상시켰다. 프로그래밍 방식으로 '연쇄적 사고(Chain of thought)'기능을 활성화 또는 비활성화할 수 있는 기능을 도입했다. 이 기능을 활용해 간단한 작업은 추론 기능을 최소화해 불필요한 연산 부하를 줄일 수 있다. 이 기능을 통해 8B 모델은 안전성이나 성능 저하 없이 아레나하드및 알파카이벨과 같은 인스트럭션 추종 벤치마크에서 이전 모델보다 두 자릿수 개선된 성과를 달성했다. 그래니트 3.2 8B 모델의 경우 새로운 추론 확장(inference scaling) 방법으로 AIME2024 및 MATH500과 같은 수학 추론 벤치마크에서 클로드 3.5-소넷 또는 GPT-4o와 같은 대규모 모델의 성능에 필적하도록 보정 가능하다. IBM은 그래니트 3.2 인스트럭트, 비전 및 가드레일 모델과 함께 최대 2년 후의 미래까지 장기 예측할 수 있는 기능을 갖춘 차세대 시계열 모델인 타이니타임믹서(TTM) 모델을 출시한다. 이는 금융 및 경제 동향, 공급망 수요 예측, 유통 업계의 계절별 재고 계획 등 장기적인 트렌드 분석에 강력한 도구가 될 것이다. IBM AI 연구 담당 스리람 라가반 부사장은 "다음 AI 시대는 기업이 과도한 컴퓨팅 비용 없이도 강력한 성과를 달성할 수 있는 효율성, 통합 가능성, 실용성이 화두가 될 것"이라며 "개방형 솔루션에 중점을 둔 IBM의 최신 그래니트 모델은 오늘날 기업들의 AI 접근성, 비용 효율성, AI 자체의 가치를 높이는데 있어 도움을 줬다고 생각한다"고 말했다.

2025.02.27 10:19남혁우

통신사가 만든 AI 모델, 벤치마크로 품질 평가

세계이동통신사업자연합회(GSMA)가 MWC25 개막을 앞두고 '오픈 텔코 LLM 벤치마크'를 출범한다고 밝혔다. 통신사들이 개발하고 있는 AI 언어 모델을 자체적으로 평가할 수 있는 도구를 내놓고 AI 서비스의 고도화를 이끌겠다는 전략이다. 25일(현지시간) GSMA에 따르면 오픈 텔코 LLM 벤치마크는 오픈소스 커뮤니티 형태로 AI 모델을 평가하기 위한 통신업계 최초의 프레임워크로 고안됐다. 공식 출범은 MWC25 기간에 이뤄질 예정이다. GSMA가 주도하고 주요 산업 파트너들이 지원하는 벤치마크를 통해 AI 모델을 실제 통신 사용 사례와 비교해 평가하게 된다. 산업 전반의 협력을 촉진시키고 통신 AI 서비스의 정확성,효율성, 안전성을 높이겠다는 전략이다. 루이스 파월 GSMA AI이니셔티브 책임자는 “현재 AI 모델은 통신사별 쿼리에 어려움을 겪으며 부정확하거나 오해 소지가 있거나 비현실적인 추천을 생성하는 경우가 많다”며 “벤치마크 세트로 AI 모델 성능을 향상시키는 것을 넘어 통신사의 AI가 안전하고 신뢰할 수 있고 실제 운영 요구 사항에 부합하도록 보장할 것”이라고 말했다. 이같은 오픈소스 이니셔티브 개발에는 허깅페이스와 리눅스재단 외에 국내 통신사인 SK텔레콤과 LG유플러스가 직접 참여했다.

2025.02.26 18:05박수형

KAIST 석·박사 15명, 챗GPT와 딥시크로 수능 미적분 풀어보니…

올해 수능 수학 30번 문항을 챗GPT와 딥시크에게 물었다. 30번은 미적분 문제다. 전국 수험생들의 14%만이 맞췄다. 과연 어느 생성형 인공지능(AI)이 올바른 답을 제시했을까. KAIST 테라랩(지도교수 김정호)이 지난 주 챗GPT와 딥시크의 성능과 활용성, 경쟁력의 비밀을 공개하는 세미나를 개최했다. 이 세미나에는 테라랩 소속 석·박사과정생 15명이 참여했다. 이날 서은지 연구생(전기및전자공학과 석사과정)이 딥시크를 활용해 테스트한 결과를 공개해 눈길을 끌었다. 이 시험에서 서 연구생은 리즈닝(추론가능 LLM) 모델로 챗GPT-o1과 딥시크-R1(1.5B)을 썼다. 이 결과 GPT-o1은 7분 40초만에 정답 17을 제시했다. 반면 R1은 정답 도출에 실패했다. 서 연구생은 이외에도 수리1, 추리2, 코딩1문제를 각각 테스트한 결과도 공개했다. 이 결과에 따르면 단순 수리 문제는 양쪽 AI 모두 맞췄다. 이어 진행한 숫자 야구 게임에서는 GPT-o1의 경우 18분간 10번의 시도로 정답을 냈고, R1은 55분간 15번을 시도했으나 갈피를 잡지 못했다. 삼성이 시행하는 직무적성검사(GSAT)도 테스트했다. 3단 논법에서 전제1과 결론을 제시한 뒤 전제2를 묻는 질문이다. 이 질문에 GPT-o1은 25초만에 정답을 도출했다. 반면 R1은 1분 동안 리즈닝까지 했지만, 답을 맞히지 못했다. 그러나 코딩의 2가지 오류 탐지에서는 GPT-o1이 46초간 한 개의 오류만 해결한 반면, R1은 몇 초 동안 2가지를 모두 해결했다. 서 연구생은 "GPT-o1이 고난도 수리나 추론해결이 정확한 반면 R1은 코딩 오류 탐지가 정확했다"며 "제품 출시 2개월 된 R1이 이 같은 성능을 보인다는 측면에서 대단하다"고 평가했다. 언어와 수학에선 R1, 프로그래밍에선 오픈AI-o1이 강력 이어 김지훈 연구생(전기및전자공학과 박사과정)은 AI 벤치마크별 성능 비교 자료를 공개해 관심을 끌었다. 미국고교수학경시대회(AIME2024) 문제로는 R1이 79.8점, 오픈AI-o1은 79.2점으로 R1이 미세하게 앞섰다. MATH-500(고급수학문제)이나 소프트웨어 엔지니어링 벤치마크(SWE-벤치)에서도 0.3~0.9점 가량 R1이 좋은 점수를 받았다. 그러나 검색없이 해결하는 대학원 수준 문제(GPQA)에서는 오픈AI-o1가 75.7점으로, 71.5점을 받은 R1보다 4.2점이 높게 나왔다. 또 영어나 수학, 중국어 등의 문제에서는 R1이, 프로그래밍 최적화에서는 오픈AI-o1이 강력했다. 최성욱 연구생(전기및전자공학과 박사과정)은 딥시크의 기업 전반을 공개하며 "딥시크는 연구자와 엔지니어 150명과 데이터 자동화 연구팀 31명만으로 개발했고, 오픈AI는 1천200명의 인력이 투입됐다"고 설명했다. 최 연구생은 또 딥시크 서비스 차단 이슈를 거론하며 "우리나라를 포함해 미국, 일본, 호주, 이탈리아, 대만이 접속을 차단하거나 사용금지, 앱 다운로드 금지 등으로 규제 중"이라고 덧붙였다. LLM이 기초..."우리나라 GPU 10만장정도 보유 희망" 김근우 연구생(전기및전자공학과 박사과정)은 딥시크 R1-제로의 학습 방법론(GRPO)으로 주목 받았다. 김 연수생은 이 방법론에서 R1-제로의 특징을 가치평가 모델과 보상인공지능 모델을 사용하지 않는 경량화된 강화학습으로 분석했다. 이외에 이들은 △딥시크-V3의 기본 아키텍처 △R1-제로에서의 강화학습 △오픈소스 생태계 △기업소개 및 기술적 배경 등을 주제로 자료를 공개했다. 김정호 교수는 "딥시크 R1 등장이 경쟁 체제 문제를 넘어, 결국 전의 전쟁으로 발전하고 있다"며 "지금은 거대언어모델(LLM)에 머물지 않고 미디어 LLM, 멀티모달 에이전트, AI로봇, 피지컬 AI를 넘어 범용인공지능(AGI), 초인공지능(ASI) 시대로 가는 시작점"이라고 말했다. 김 교수는 또 "이 가운데 LLM이 기초"라며 "정부도 K-LLM 개발하겠다고 한다. 우리나라 GPU 보유숫자가 10만장까지 갔으면 좋겠다"라고 덧붙였다. 김 교수는 "딥시크가 주목받는 이유로 저비용, 자체 개발, 챗GPT 동급성능, 1년만에 개발 등을 꼽을수 있다"며 "딥시크 AI에는 학습코드와 학습 데이터가 공개되지 않는 등 비밀이 많이 숨어 있는 것 같다"고 평가했다.

2025.02.26 17:16박희범

'AI 지각생' 애플, 챗GPT 이어 제미나이도 품나…협업 통해 경쟁력 강화 '총력'

'아이폰'이 오픈AI '챗GPT'에 이어 구글 '제미나이'까지 지원될 수도 있다는 전망이 나왔다. 애플이 자사 인공지능(AI) 시스템 '애플 인텔리전스'를 통해 음성비서 '시리'와 '챗GPT'를 연동시킨 상황에서 '제미나이'까지 추가시키게 되면 AI 지각생이란 오명에서도 빠르게 벗어날 수 있을 것으로 보인다. 25일 나인투파이브맥 등 외신에 따르면 애플은 최근 공개한 iOS 18.4 개발자 베타 버전 코드에 '시리'의 타사 AI 모델 옵션으로 구글과 오픈AI을 모두 포함시킨 것으로 전해졌다. 구글 '제미나이'가 실제 언제 도입될 지는 알려지지 않았으나, iOS 18 이후 버전에서 추가될 것이란 주장이 나오고 있다. 애플은 이미 지난해 6월 '세계 개발자 회의(WWDC)'에서 구글 '제미나이'를 도입할 것이라고 예고한 바 있다. 당시 '아이폰16'과 함께 '애플 인텔리전스'를 공개하며 오픈AI와의 협업 사실도 함께 발표했다. 크레이그 페더리기 애플 소프트웨어 엔지니어링 수석부사장은 "챗GPT는 우리 옵션 중 하나"라며 "제미나이와 같은 다른 모델 접목도 기대할 수 있다"고 밝혔다. 애플은 오픈AI의 챗GPT와 구글 제미나이 외에도 AI 스타트업 앤스로픽의 AI 모델인 '클로드'를 탑재하기 위해 이들과 협력 방안을 논의해 온 것으로 알려졌다. 다만 페이스북 모회사 메타 플랫폼의 AI 모델 '라마' 탑재 가능성은 크지 않은 것으로 전해졌다. 샘모바일은 "애플이 과거 WWDC에서 구글 제미나이를 포함한 다른 AI 모델과의 통합을 제안했던 만큼, 이번 소식은 놀라운 일이 아니다"며 "최근 삼성의 AI 기능이 애플보다 우수하다고 동의한 의견이 많은 상황에서 구글 제미나이가 도입됨에 따라 애플 인텔리전스는 더욱 효과적일 수 있을 것으로 보인다"고 말했다. 이 외에도 애플은 오는 10월 새로운 '아이폰' 출시와 함께 발표될 iOS 19에 자체 개발한 대화형 시리 모델인 '시리LLM'을 추가할 예정이다. 개편된 시리는 사람처럼 상호 작용하고 챗GPT나 구글 제미나이에 더 가까운 방식으로 작업을 처리하게 될 것으로 알려졌다. 업계 관계자는 "애플이 폐쇄적 생태계를 유지해왔지만, AI 분야에선 다른 업체들과 적극적으로 협업하는 모습을 보이고 있다"며 "AI 후발 주자인 애플이 시장 주도권을 잡기 위해 다양한 시도에 나선 상황으로, 이 같은 전략이 AI 경쟁력을 회복할 묘수가 될 지 주목된다"고 말했다.

2025.02.25 15:09장유미

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

삼성전자가 돌아왔다...1년 만에 글로벌 D램 1위 탈환

"수익성은 부담, 상징성은 호감"…인천공항 면세점 입찰 딜레마

라스베이거스서 'K-뷰티테크' 알리다...에이피알 CES 전시 가보니

한국 전통 문화, '생성형 AI' 타고 세계로…K-스타트업의 도전

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.