• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
CES2026
스테이블코인
배터리
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'AI 언어모델'통합검색 결과 입니다. (8건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

퀀텀에이아이, 시리즈B 73억원 투자 유치…"2027년 IPO 목표"

퀀텀에이아이가 누적 100억원 규모 투자를 유치하며 자체 언어모델 기반 인공지능(AI) 서비스·플랫폼 고도화에 박차를 가한다. 퀀텀에이아이는 73억원 규모의 시리즈B 투자 유치에 성공했다고 6일 밝혔다. 이번 투자에는 서울경제진흥원(SBA)을 비롯한 전략적 투자자들이 신규 참여했으며 퀀텀에이아이의 자체 개발 언어모델과 AI 기술 경쟁력, 금융 데이터 시장 내 확장성을 높이 평가했다. 이번 투자를 통해 퀀텀에이아이는 ▲디지털 클레임 플랫폼 ▲AI 컨택센터(AICC) 기반의 지능형 고객경험 플랫폼 ▲바이오 AI 검색 및 이커머스 통합 플랫폼 고도화 등 AI 플랫폼 고도화와 상용화를 본격화할 계획이다. 현재 퀀텀에이아이는 금융권을 중심으로 AI 문서 처리 자동화, 지능형 음성 상담, 자체 언어모델 기반 금융 비정형 데이터 자산화 및 AI 검색 등 다양한 서비스를 제공 중이다. 이를 통해 축적된 데이터 처리 경험과 산업별 적용 사례를 기반으로 상용 서비스의 완성도를 높이고 있으며 향후 공공·의료·산업데이터 등으로 적용 범위를 확장할 방침이다. 이번 투자 유치로 퀀텀에이아이의 누적 투자금은 100억원 규모로 확대됐다. 퀀텀에이아이는 2020년 창업 후 2022년 시드 투자를 시작으로 2023년 26억원 규모의 시리즈A 등 대규모 투자를 유치한 바 있다. 퀀텀에이아이는 내년 국제회계기준(IFRS) 전환 및 하반기 예비기평 등을 통해 기업공개(IPO) 사전 준비를 병행할 예정이다. 다양한 AI 플랫폼을 기반으로 금융을 넘어 다양한 산업 영역으로 사업을 확장해 나갈 계획이다. 퀀텀에이아이 곽영훈 최고재무책임자(CFO)는 "재무 건전성과 경영 투명성에 중점을 맞춰 내년 K-IFRS 도입과 내부통제에 주력해 2027년 IPO를 목표로 증진하겠다"고 밝혔다. 2020년 설립된 퀀텀에이아이는 금융권 내 문서·음성·텍스트 등 비정형데이터를 정형화·분석해 기업이 보유한 데이터를 자산으로 전환하는 AI 기반 자연어처리(NLP) 전문기업이다. 자체 개발한 AI 인식 엔진을 활용해 금융문서, 고객 상담 이력, 시장 뉴스 등 다양한 데이터 소스를 통합 분석하며 국내 주요 시중은행과 보험사를 대상으로 한 AI 데이터 자산화 프로젝트를 다수 수행해왔다. 특히 데이터 자산화 역량을 기반으로 AI 에이전트 기반의 AI 서비스를 확대하고 있다. 최근에는 메디컬 AI 분야에도 진출하며 병의원의 의료상담을 AICC 서비스를 통해 AI 상담 에이전트로 제공하고 있다. 최성집 퀀텀에이아이 대표는 "이번 73억원 규모의 시리즈B 투자 유치는 우리의 기술력과 시장 성장성을 공식적으로 인정받은 의미 있는 성과"라며 "기존 언어모델인 트랜스포머 아키텍처의 단점을 극복한 새로운 '맘바' 아키텍처 기반 독자 AI 파운데이션 모델을 통해 금융권의 비정형 데이터를 새로운 가치자산으로 전환하고 산업 전반의 데이터 활용 혁신을 선도하겠다"고 말했다.

2025.11.06 17:09한정호

베일 벗은 카카오·오픈AI 첫 협업물…"추가 협업도 가능"

카카오가 오픈AI와의 첫 협업물로 카카오톡에 챗GPT를 탑재한 '챗GPT 포 카카오'를 출시한 가운데, 추가적인 협업 가능성을 내비쳤다. 챗GPT와 카나나의 카톡 채팅 학습 가능성에 대한 우려를 일축했을 뿐만 아니라 자사 서비스를 연동한 '카카오 툴즈'에 외부 대형 서비스 제휴 여지도 남겨뒀다. 유용하 카카오 AI에이전트플랫폼 성과리더는 28일 경기도 판교 카카오아지트에서 열린 기자간담회에서 “추후 더 추가적인 전용 API를 이용한 협업의 여지나 새로운 전용 서비스, 상품 출시도 충분히 가능할 것”이라며 “다만, 현재 서비스(챗GPT 포 카카오)가 어느 정도 안정화되고 방향성이 정해진 후 추진할 수 있을 것”이라고 이같이 말했다. 이날 카카오는 현장에서 카카오톡에 챗GPT를 적용한 '챗GPT 포 카카오'와 카톡 안 대화 맥락을 파악해 먼저 메시지를 보내주는 '카나나 인 카카오톡'을 소개했다. 챗GPT 포 카카오는 카톡 안에서 대화하면서 채팅탭 상단에 위치한 챗GPT 버튼을 클릭해 서비스를 사용할 수 있는 기능이다. 오픈AI의 최신 언어모델인 'GPT-5'를 적용해 검색, 이미지 업로드·생성과 같은 기능을 모두 제공한다. 챗GPT 포 카카오는 '카카오 툴즈'를 활용해 카카오의 다양한 서비스와 연동되는 것이 특징이다. 카카오 툴스 안에는 카카오맵, 카톡 예약하기, 카톡 선물하기, 멜론이 포함되며 이용자의 요청에 따라 해당 서비스들이 자동으로 연결되는 경험을 제공한다. 이 과정에서 발생할 수 있는 광고 상품 우선 노출 우려에 대해서는 선을 그었다. 강지훈 카카오 AI디스커버리 성과리더는 “선물하기 추천 기능은 사실 광고라고 보고 어렵고, 숨어 있는 선물을 추천하는 기능”이라며 “오히려 이용자 편의성 위주로 가게 되는 기능에 더 가깝다”고 언급했다. 카카오 내부 기능이 우선 탑재된 카카오 툴스와 외부 서비스와의 제휴 가능성도 열어뒀다. 유 성과리더는 “외부 파트너사의 경우 올해 프로젝트가 시작됐고 출시하기까지 굉장히 짧은 시간이었기 때문에 제휴까지 진행하기는 짧은 시간”이라면서도 “외부 서비스도 내년부터 순차적으로 적용할텐데 사용자들의 선택에 최대한 초점을 맞출 예정이고 새로운 패러다임으로 발전할 수 있는 대형 제휴사도 충분히 들어올 수 있을 것”이라고 답했다. 보안 관련해서 임원진들은 카톡에서 나눈 대화가 챗GPT 뿐만 아니라 자체 모델인 카나나의 학습에도 활용되지 않는다고 강조했다. 유 성과리더는 “챗GPT 포 카카오에서 사용되는 여러 내용은 자체 모델(카나나) 학습에 사용되지 않는다. 카톡에서의 대화와 챗GPT는 완전히 서비스적으로 분리돼 있기 때문에 대화가 임의로 넘어가는 경우는 절대 없다”며 걱정을 일축했다. 챗GPT 포 카카오는 이용자가 직접 대화 내용 저장 여부와 AI 학습 반영 여부를 자유롭게 선택할 수 있으며 모든 이용자 정보는 카카오와 챗GPT의 개인정보 보호 정책에 따라 보호된다는 설명이다. 챗GPT 포 카카오는 이날부터 출시되며, 현재 아이폰15 프로 이상의 모바일 기기를 지원하는 카나나 인 카카오톡은 베타테스트를 거쳐 내년 1분기 중 안드로이드로 서비스 확대 후 정식 서비스로 선보일 예정이다.

2025.10.28 16:01박서린

문서 작성부터 협력사 평가까지…엠로, AI 에이전트로 구매 업무 부담 최소화

기업의 구매 부서는 제품 생산과 운영의 기반이자 경쟁력의 핵심 축이다. 하지만 수많은 문서 작성, 데이터 검색, 협력사 관리 등 반복적이고 복잡한 업무가 이어지면서 담당자의 업무 피로도가 높고, 신규 인력이 진입하기에도 쉽지 않다. 이로 인해 많은 기업들이 인력 운용에 어려움을 겪는다. 이러한 어려움을 극복하기 위해 인공지능(AI) 에이전트가 대안으로 주목받고 있다. AI가 스스로 문제를 인식한 뒤 목표 달성을 위해 필요한 정보를 스스로 찾아내고 계획을 세우며 실행까지 수행할 수 있어 업무 부담을 최소화하고 고부가가치 분석과 전략 수립에 집중하며 생산성을 향상시킬 수 있기 때문이다. 21일 엠로는 서비스 중인 구매시스템에 대규모 언어모델(LLM)을 기반으로 한 5종의 AI 에이전트를 탑재했다고 밝혔다. 엠로의 구매시스템에 탑재된 AI 에이전트는 ▲구매 가이드 에이전트(Procurement Guide Agent), ▲DB 검색 에이전트(DB Search Agent) ▲SRM 코파일럿(SRM Copilot), ▲시장 분석 에이전트(Market Intelligence Agent) ▲문서 생성 에이전트(Automation Agent) 등이다. 이 기능들은 구매 문서 작성부터 협력사 평가, 시장 동향 분석까지 한 번의 대화로 처리할 수 있도록 지원한다. 초보자도 복잡한 구매 절차 손쉽게 엠로의 '구매 가이드 에이전트'는 이름 그대로 구매 업무 전반의 '길잡이' 역할을 한다. 신규 담당자가 복잡한 절차나 용어에 익숙하지 않더라도 챗봇에 질문만 하면 필요한 답변을 즉시 받을 수 있다. 예를 들어 '해외 협력사 등록 절차가 어떻게 되나요?' 같은 질문을 입력하면 AI가 사내 매뉴얼과 외부 문서를 동시에 검색해 단계별 절차를 안내한다. 이 에이전트는 검색증강생성(RAG) 기술을 이용해 정형 데이터뿐 아니라 PDF나 보고서 같은 비정형 데이터에서도 정보를 찾아낸다. 이를 통해 AI는 보다 구체적이고 신뢰할 수 있는 답변을 제공한다. 결과적으로 구매 가이드 에이전트는 기업 내 지식 격차를 줄이고 담당자의 역량을 균등하게 끌어올리는 역할을 한다. 이를 통해 신규 인력은 빠르게 업무를 익힐 수 있고 숙련 인력은 반복적인 질문 응답이나 문서 확인에 드는 시간을 절약해 전략적 업무에 집중할 수 있다. 필요한 정보를 자연어로, DB 검색도 한번에 DB 검색 에이전트는 구매 담당자가 시스템 속 방대한 데이터를 일일이 찾지 않아도 되도록 돕는다. 그동안 협력사 정보를 찾기 위해 여러 메뉴를 오가며 검색해야 했지만 이제는 자연어로 질문만 하면 된다. "지난해 수도권 지역 협력사 중 납기 우수 업체를 알려줘"라고 입력하면 내부 데이터베이스(DB)에 어떤 항목들이 있는지 납기율이 어떤 테이블에 저장되어 있는지를 스스로 파악한 한다. 이후 그 조건에 맞는 SQL 쿼리(SQL Query)를 자동으로 생성해 사용자에게 필요한 정보를 제공한다. 또한 AI는 단순히 데이터를 보여주는 데서 그치지 않고 필요한 경우 요약이나 분석 결과까지 함께 제시한다. "최근 6개월간 납기 지연이 늘어난 품목은?"이라고 물으면 AI는 해당 데이터를 시각화해 '어떤 품목에서 지연이 발생했고 그 원인이 무엇인지'까지 요약 보고 형식으로 알려준다. 이렇게 사용자가 복잡한 데이터를 직접 다루지 않아도 자연스러운 대화만으로 원하는 인사이트를 얻을 수 있도록 지원한다. 문서 작성도 AI가 초안부터 제안까지 구매 부서의 주요 업무 중 하나는 다양한 문서 작성이다. 입찰 공고문, 품의서, 계약서 등 문서의 형식은 정해져 있지만 매번 다른 품목과 조건을 반영해야 하기 때문에 단순 반복 업무임에도 상당한 시간이 소요된다. 한 문서를 완성하기 위해 과거 사례를 찾아보고 협력사 정보를 대조하며 예산과 납기 일정을 맞추는 과정을 거쳐야 하기 때문이다. 엠로의 '문서 생성 에이전트'는 이런 반복적인 문서 작성 부담을 줄여준다. 구매 담당자가 품목명, 예산, 일정, 자격 요건 등 기본적인 정보를 입력하면 AI가 사내 시스템에 저장된 방대한 문서 데이터를 바탕으로 유사한 사례를 찾아낸다. 이후 관련 내용을 분석해 입찰 공고문, 입찰 제안 요청서(RFx), 품의서, 계약서 등 다양한 문서의 초안을 자동으로 생성한다. 담당자가 "다음 달까지 납품 가능한 사무용 의자 입찰 공고문 초안을 만들어줘"라고 입력하면 AI는 과거 유사 품목의 입찰 데이터를 검색해 조건이 비슷한 문서를 찾아낸다. 이후 예산 규모, 납기 일정, 자격 요건 등을 자동으로 반영해 새로운 초안을 완성한다. 이후 이 초안을 바탕으로 세부 항목만 수정하면 곧바로 결재 절차를 진행할 수 있다. 과거처럼 처음부터 문서를 새로 쓰거나 비슷한 문서를 일일이 찾아 복사·편집하는 과정이 사라지는 셈이다. 또한 사람이 자주 실수하기 쉬운 오타, 금액 입력 오류, 항목 누락 같은 문제도 예방해준다. 시스템이 자동으로 항목별 데이터를 불러와 검증하기 때문에 작성 과정에서 정보가 누락되거나 중복되는 경우를 줄일 수 있다. 예를 들어 예산 금액이 내부 결재 시스템의 승인 한도와 일치하지 않거나 협력사 등록번호가 최신 정보와 다를 경우 AI가 즉시 경고 메시지를 띄운다. 결과적으로 문서 작성 시간을 단축하고 업무 품질을 높일 수 있는 환경을 조성해 구매 담당자는 전략 수립이나 공급망 리스크 관리 등 보다 중요한 업무에 집중할 수 있다. 시장 동향까지 분석해 리스크 선제 대응 구매 업무는 시장의 흐름을 읽고 가격 변동과 공급 안정성, 협력사의 재무 상태를 종합적으로 판단해야 하는 전략적 의사결정 과정이다. 특히 글로벌 공급망이 불안정하고 원자재 가격이 급변하는 시대에는 시장 상황을 빠르고 정확하게 파악하는 역량이 기업 경쟁력의 핵심이 된다. 그러나 담당자가 모든 정보를 직접 확인하기에는 한계가 있다. 매일 쏟아지는 뉴스, 공시, 환율, 거래 데이터 등 방대한 자료를 일일이 검토하기에는 시간과 인력이 턱없이 부족하기 때문이다. 시장 분석 에이전트는 실시간으로 뉴스, 공시, 주가, 재무정보 등 외부 데이터를 자동 수집하고 분석해 시장의 흐름과 주요 기업의 동향을 한눈에 보여준다. 담당자가 "리튬 가격이 최근 어떻게 변했는지 알려줘"라고 입력하면 AI는 전 세계 주요 산업 뉴스와 거래소 데이터를 통합 분석해 최근 가격 추세와 변동 원인까지 요약한다. 또한 수집한 정보를 기반으로 잠재적인 리스크를 감지하고, 향후 영향을 미칠 수 있는 요인을 예측한다. 예를 들어 특정 원자재 가격이 급등 조짐을 보이면 관련 품목의 구매 계획을 조정하도록 경고를 띄우거나 대체 공급업체를 검토할 수 있도록 제안한다. 이처럼 AI가 시장의 움직임을 사전에 포착해 알려주면 기업은 공급망 혼란이나 원가 상승 같은 위험에 훨씬 빠르게 대응할 수 있다. AI끼리 소통하는 'A2A'로 자율형 공급망 완성 목표 엠로는 이번 AI 에이전트 기능을 단순한 보조 도구가 아닌 서로 연동되는 자율형 시스템으로 발전시키고 있다. 각 에이전트가 독립적으로 작동하는 것을 넘어 서로 협업해 복잡한 문제를 해결하는 에이전트 간 협업(A2A) 구조를 구축 중이다. 시장 분석 에이전트가 특정 품목의 가격 상승을 감지하면 문서 생성 에이전트가 자동으로 관련 품목의 재입찰 공고문을 작성하고 DB 검색 에이전트가 납기 우수 협력사를 추천하는 식이다. 각 AI 에이전트가 독립된 기능을 넘어 '팀'처럼 움직이면 공급망 관리(SCM)는 완전히 새로운 단계로 진화한다. 담당자가 모든 데이터를 직접 확인하거나 문서를 작성하지 않아도 시스템이 먼저 문제를 감지하고 해결 방향을 제시한다.이를 통해 AI가 공급망 을 스스로 운영하는 자율형 시스템을 구축한다는 방안이다. 엠로는 올해 안에 이 A2A 체계의 기술적 기반을 완성할 계획이다. 이를 위해 에이전트 간 실시간 데이터 교환 프로토콜, 상황 인식 기반 의사결정 모델, AI 협업 시나리오 설계 등을 병행하고 있다. 특히 복수의 에이전트가 동시에 작동할 때 충돌이나 오류가 발생하지 않도록 우선순위 판단 알고리즘과 피드백 제어 로직을 강화하는 것이 핵심이다. 한 엠로 관계자는 "에이전틱 ai가 미래 공급망의 핵심 기술 트렌드로 자리잡으면서 이를 도입해 공급망의 운영 효율성을 높이고자 하는 기업들의 수요도 증가하고 있다"며 "이 같은 흐름과 더불어 엠로의 에이전틱 ai 솔루션에 대한 기업 고객들의 관심과 문의도 빠르게 늘어나고 있으며 엠로의 또 하나의 핵심 성장 동력이 될 것으로 기대된다"고 말했다.

2025.10.21 10:58남혁우

크래프톤-SK텔레콤, AI 언어 모델 공동 개발…오픈소스로 3종 공개

크래프톤(대표 김창한)은 SK텔레콤과 공동으로 개발한 7B(70억개 파라미터) 규모의 추론 특화 언어 모델(Language Model) 3종을 공개했다고 28일 밝혔다. 이번에 공개한 모델은 수학 문제 해결과 코드 개발에 특화된 소형 언어 모델로, 크래프톤이 독자적으로 개발한 학습 기법을 적용했다. 이 기법을 바탕으로, 해당 모델은 수학 추론 벤치마크 AIME 25에서 뚜렷한 성능 향상을 기록하며 그 효과를 입증했다. 수학은 공간지각과 논리 추론 역량이 요구되는 영역으로, 게임을 포함한 고난도 추론 분야와 기술적으로 밀접한 연관성을 갖는다. 이 같은 역량 덕분에, 크래프톤은 해당 모델을 기반으로 한 게임 중심의 AI 기술 확장 가능성도 기대하고 있다. 크래프톤과 SKT는 언어 모델을 공동 개발하며, 각각 학습 기법 개선과 인프라 구축을 통해 모델의 품질과 성능 고도화에 기여했다. 이번 협력은 도메인 특화 AI 모델 개발 역량을 입증한 사례로 평가받고 있다. 크래프톤은 기존 모델의 취약점을 분석해 이를 개선하는 오답 복기 학습 기법을 자체 개발했다. 해당 기법은 틀린 문제의 정답을 찾아 오답과 비교해 학습하며, 추론 정확도와 효율성을 동시에 확보하는 전략적 학습 방식이다. SKT는 데이터 검증과 모델 학습의 인프라 구축을 담당하여, 모델의 품질과 안정성을 확보하는 데 기여했다. 김지원 SK텔레콤 AI Model Lab장은 "양사의 기술로 고성능 언어 모델을 개발해 소버린 AI 전략 실현의 초석을 마련했다"면서 "앞으로도 긴밀한 협력을 통해 AI 기술 주권을 확보하는 데 지속적으로 기여할 것 이라고 전했다. 이강욱 크래프톤 딥러닝 본부장은 "이번 SKT와의 협업을 통해 글로벌 수준의 대형 언어 모델 개발 역량을 확인할 수 있었다"며, "크래프톤은 독자적인 AI 기술력을 바탕으로, 게임을 비롯한 다양한 산업 분야에 이를 적용해 나갈 계획"이라고 말했다. 앞으로 크래프톤은 이번 언어 모델에 적용한 학습 기법을 게임 플레이 분석, 전략 판단 등 게임 특화형 AI 응용 기술 고도화에 활용할 계획이다. 나아가 다양한 규모의 LLM을 개발해, 한국형 AI 기술 생태계의 독립성과 주도권을 확보하는 데 기여할 방침이다. 언어 모델은 글로벌 오픈소스 플랫폼인 허깅페이스를 통해 공개되어 누구나 자유롭게 활용할 수 있다.

2025.07.28 09:34정진성

카카오, 경량 멀티모달·MOE 오픈소스 공개

카카오(대표 정신아)는 국내 공개 모델 중 최고 성능의 경량 멀티모달 언어모델과 혼합 전문가(MoE) 모델을 국내 최초 오픈소스로 공개한다고 24일 밝혔다 카카오는 허깅페이스를 통해 이미지 정보 이해 및 지시 이행 능력을 갖춘 경량 멀티모달 언어모델 '카나나(Kanana)-1.5-v-3b'와 MoE 언어모델 '카나나-1.5-15.7b-a3b'를 오픈소스로 선보였다. 지난 5월 공개한 언어모델 카나나-1.5 4종에 이어 두 달 만에 추가 모델을 오픈소스로 공개한 것이다. 정부가 추진하는 '독자 인공지능(AI) 파운데이션 모델 프로젝트'에 참여한 카카오는 이러한 자체 모델 개발 역량 및 카카오톡 등의 대규모 서비스 운영 경험 등을 토대로 전 국민의 AI 접근성을 높이고 국가 AI 경쟁력을 강화하는데 기여한다는 방침이다. 이날 공개된 '카나나-1.5-v-3b'는 텍스트 뿐만 아니라 이미지 정보도 처리할 수 있는 멀티모달 언어모델로, 지난 5월 말 오픈소스로 공개한 카나나 1.5 모델을 기반으로 하고 있다. 카나나 1.5는 모델 개발의 처음부터 마지막 단계까지 카카오의 자체 기술을 바탕으로 구축하는 '프롬 스크래치' 방식으로 개발됐다. 멀티모달 언어모델인 '카나나-1.5-v-3b'는 이용자의 질문 의도를 정확히 이해하는 높은 지시 이행 성능과 뛰어난 한국어·영어 이미지 이해 능력을 보유했다고 회사 측은 설명했다. 또한, 한국어 벤치마크에서 유사 사이즈의 국내외 공개 모델과 비교한 결과 최고 점수를 기록했고 다양한 영어 벤치마크에서 해외 오픈소스 공개모델과 비교했을 때도 유사한 수준의 성능을 보인 것으로 알려졌다. 지시 이행 능력 벤치마크에서는 국내 공개된 유사한 규모의 멀티모달 언어모델 대비 128% 수준의 성능을 기록했다. 카카오는 인간 선호 반영 학습과 지식 증류를 통해 '카나나-1.5-v-3b'의 성능을 극대화했다. 지식 증류는 고성능의 대형 모델로부터 비교적 작은 모델을 학습하는 방식이다. 단순한 정답 뿐 아니라 대형 모델의 예측 확률 분포까지 학습에 반영함으로써 작은 모델이 더 정교하고 일반화된 예측 능력을 갖추도록 돕는 기술이다. 이를 통해 상대적으로 경량화된 모델 구조임에도 정확도나 언어 이해 등의 능력에서 대형 모델의 높은 성능에 근접하거나 이를 뛰어 넘을 수 있는 능력을 발휘하도록 돕는다. '카나나-1.5-v-3b'는 경량 멀티모달 언어모델의 강점을 토대로 ▲이미지 및 글자 인식 ▲동화 및 시 창작 ▲국내 문화유산 및 관광지 인식 ▲도표 이해 ▲수학 문제풀이 등 여러 분야에서 활용할 수 있다. 예를 들어, 장소 사진과 함께 이 사진이 촬영된 장소에 대해 간단히 설명해줘라고 질문하면 “이 사진은 서울 청계천을 배경으로 하고 있습니다”와 같이 국내 지역에 대한 인식력을 바탕으로 정확한 답변을 제공한다. 카카오는 모델의 성능에 집중하는 단계를 넘어 AI가 사람처럼 생각하고 행동할 수 있는 ▲멀티모달 이해 능력 ▲사용자 지시 수행 능력 ▲추론능력을 갖추도록 발전시키는 데 주력하고 있다. 하반기 중에는 에이전트형 AI 구현에 필수적인 추론 모델의 성과도 공개할 예정이다. 카카오는 일반적인 '밀집' 모델과 차별화되는 MoE 구조의 언어모델도 오픈소스로 함께 공개했다. 'MoE'는 입력 데이터 처리 시 모든 파라미터가 연산에 참여하는 기존 모델과 달리 특정 작업에 최적화된 일부 전문가 모델만 활성화되는 방식으로 효율적인 컴퓨팅 자원 활용과 비용 절감이 특징이다. MoE 아키텍처를 적용한 '카나나-1.5-15.7b-a3b'는 전체 15.7B의 파라미터 중 추론 시 약 3B 파라미터만 활성화돼 동작한다. 카카오는 모델의 학습 시간과 비용을 절약하기 위해 자사의 3B 규모의 모델 '카나나-Nano-1.5-3B'에 '업사이클링' 방식을 적용해 개발했다. 업사이클링은 기존 다층 신경망(MLP) 레이어를 복제해 여러 전문가 레이어로 변환하는 방식으로 모델을 처음부터 개발하는 방식에 비해 효율적이다. 활성화되는 파라미터가 3B에 불과하지만 성능은 '카나나-1.5-8B'와 동등하거나 상회하는 수준을 기록했다. 카카오의 MoE 모델은 고성능 AI 인프라를 저비용으로 구축하고자 하는 기업이나 연구 개발자들에게 실용적인 도움을 제공할 수 있다는 설명이다. 특히 추론 과정에서 제한된 파라미터만 사용하는 구조적 특성 덕분에 저비용, 고효율 서비스 구현에 유리하다. 카카오는 이번 경량 멀티모달 언어모델과 MoE 모델의 오픈소스 공개를 통해 AI 모델 생태계에 새로운 기준을 제시하고 더 많은 연구자와 개발자가 강력한 AI 기술을 자유롭게 활용할 수 있는 기반을 마련해 갈 계획이다. 뿐만 아니라 자체 기술 기반의 모델을 지속적으로 고도화하고 모델 스케일업을 통해 글로벌 플래그십 수준의 초거대 모델 개발에 도전함으로써 국내 AI 생태계의 자립성과 기술 경쟁력 강화에 기여할 계획이다. 김병학 카카오 카나나 성과리더는 “이번 오픈소스 공개는 비용 효율성과 성능이라는 유의미한 기술 개발의 성과를 거둔 것으로 단순한 모델 아키텍처의 진보를 넘어 서비스 적용과 기술 자립이라는 두 가지 측면의 목표에 부합하는 결과물”이라고 말했다.

2025.07.24 10:57박서린

"글로벌 수준"...카카오, 멀티모달 언어모델 'Kanana-o' 성능 공개

카카오가 새로운 인공지능 모델을 통해 기술 경쟁력 강화를 이어간다. 카카오(대표 정신아)는 공식 테크블로그를 통해 통합 멀티모달 언어모델 'Kanana-o'와 오디오 언어모델 'Kanana-a'의 성능과 개발 후기를 1일 공개했다. 통합 멀티모달 언어모델인 Kanana-o는 텍스트와 음성, 이미지까지 다양한 형태의 정보를 동시에 이해하고 처리할 수 있는 모델이다. 텍스트, 음성, 이미지 중 어떠한 조합으로 질문을 입력하더라도 처리 가능하며, 상황에 맞는 텍스트나 자연스러운 음성으로 응답 가능한 구조로 설계됐다. 카카오는 '모델 병합' 기술을 기반으로 이미지 처리에 특화된 모델 'Kanana-v'와 오디오 이해 및 생성에 특화된 'Kanana-a' 모델을 통합, 단기간 내 효율적으로 Kanana-o를 개발했다. 통합 후에는 이미지, 오디오, 텍스트 데이터를 동시에 학습하는 '병합 학습'을 통해 시각과 청각 정보를 동시에 이해하고, 텍스트와 연결 지을 수 있도록 통합 훈련을 거쳤다. 이런 과정을 통해 기존 LLM 구조에서 이미지 이해 능력과 음성 인식과 합성, 감정 이해 등 고도화된 오디오 능력을 확장시킨 통합 멀티모달 언어모델이 구현됐다. Kanana-o는 음성 감정 인식 기술을 통해 사용자의 의도를 올바르게 해석하고, 상황에 맞는 적절한 반응과 답변을 제공해준다. 억양, 말투, 목소리 떨림 등 비언어적 신호를 분석하고, 대화 맥락에 맞는 감정적이고 자연스러운 음성의 응답을 생성하는 것이 특징이다. 대규모 한국어 데이터셋을 활용해 한국어의 특수한 발화 구조, 억양, 어미 변화 등을 정밀하게 반영하기도 했다. 특히 제주도, 경상도 등 지역 방언을 인식하고 이를 표준어로 변환해 자연스러운 음성을 생성할 수 있다. 지속적인 성능의 고도화를 위해 카카오는 현재 독자적인 한국어 음성 토크나이저(오디오 신호를 일정 단위로 작게 분해하는 도구) 개발을 진행 중이다. 스트리밍 방식의 음성합성 기술을 적용해 사용자가 긴 대기 시간 없이 응답을 제공하는 강점도 보유했다. 예를 들어, 이미지와 함께 "이 그림에 어울리는 동화를 만들어 줘"라고 입력하면, Kanana-o는 해당 음성을 이해하고 사용자의 억양과 감정 등을 분석해 자연스럽고 창의적인 이야기를 실시간으로 생성해 들려준다. Kanana-o는 한국어 및 영어 벤치마크에서 글로벌 최고 모델들과 유사 수준을 기록했으며, 한국어 벤치마크에서는 높은 우위를 보였다. 특히, 감정인식 능력에서는 한국어와 영어 모두에서 큰 격차를 기록하며, 감정까지 이해하고 소통할 수 있는 AI 모델의 가능성을 입증했다. 이미지와 음성을 통합적으로 이해해야 하는 '이미지-음성 QA(질의응답)' 태스크에서도 강력한 성능을 달성하며, 통합 멀티모달 언어모델로서의 글로벌 경쟁력을 확인했다. 카카오는 향후 Kanana-o를 통해 ▲다중 턴 대화 처리 ▲양방향 데이터 동시 송수신 기술 대응 능력 강화 ▲부적절한 응답 방지를 위한 안전성 확보 등을 목표로 연구 개발을 지속해 갈 계획이다. 이를 통해 다중 음성 대화 환경에서의 사용자 경험을 혁신하고, 실제 대화에 가까운 자연스러운 상호작용을 실현해가는 것이 목표다. 카카오 김병학 카나나 성과리더는 "카나나 모델은 복합적인 형태의 정보를 통합적으로 처리함으로써 기존의 텍스트 중심 AI를 넘어 사람처럼 보고 듣고 말하며 공감하는 AI로 진화하고 있다"며 "독자적인 멀티모달 기술을 바탕으로 자사의 인공지능 기술 경쟁력을 강화하는 한편, 지속적 연구 결과 공유를 통해 국내 AI 생태계 발전에 꾸준히 기여할 계획"이라고 말했다.

2025.05.01 10:13백봉삼

타이핑 없이 느낌으로 코딩하는 시대…'바이브코딩'오나

인공지능(AI) 기술 급격한 발전으로 소프트웨어(SW) 개발 방식에 큰 변화가 있을 것이란 전망이 제기되고 있다. 특히 기존의 수작업 중심 개발 방식에 근본적인 변화를 예고하며 AI가 대신 코딩하는 형태의 개발 문화가 자리잡을 것이란 예상이다. 대표적으로 최근 전 테슬라 AI 디렉터이자 오픈AI 공동 창립자인 안드레 카파시(Andrej Karpathy)는 '바이브코딩(Vibe Coding)'이라는 개념을 SNS를 통해 제시했다. 그는 "최근 내가 '바이브 코딩이라고 부르는 새로운 종류의 코딩이 있다"며 "이 방식은 그저 바이브에 완전히 몸을 맡기고 지수적 변화를 받아들이며 코드가 존재한다는 사실조차 잊는다"고 바이브코딩을 설명했다. 이어 "이러한 개발이 가능한 이유는 LLM의 기능이 너무 좋아졌기 때문"이라고 밝혔다. 그는 실제로 코드 편집기인 커서 컴포저(Cursor Composer), LLM 소넷(Sonnet), 음성 명령 도구 슈퍼위스퍼(SuperWhisper) 등을 AI기반 도구를 활용해 키보드를 거의 사용하지 않고 프로젝트를 진행하고 있다고 밝혔다. 예를 들어 UI 스타일 변경, 버그 수정, 레이아웃 조정 등의 요청을 모두 음성이나 자연어로 입력하는 것 만으로 AI가 이를 인식하고 자동으로 작성한다. 안드레 카파시는 코드 리뷰나 디버깅도 AI에 맡기고 있다고 설명했다. 에러 메시지를 복사해 붙여넣기만 해도 대부분 문제가 해결되며, 코드 변경 내용은 별도 검토 없이 전부 수락하는 방식으로 작업한다. 그는 이러한 흐름을 '더 이상 코딩이라 부를 수 없는 새로운 제작 방식'이라고 표현했다. 안드레 카파시 외에도 실리콘밸리의 스타트업에서 상당수 AI를 활용한 개발이 가속화되고 있는 추세다. 미국 최대 스타트업 액셀러레이터인 와이컴비네이터의 개리 탄 최고경영자는 "포트폴리오 스타트업 중 25%가 전체 코드의 95%를 AI에 의존하고 있다"고 밝힌바 있다. 그는 LLM 기반 개발 도구를 활용하면 소규모 인력으로도 대규모 제품을 빠르게 출시할 수 있으며, 코드 품질 역시 일정 수준 이상을 유지할 수 있다고 설명한다. 더불어 비개발자인 실무자도 직접 앱을 개발하고 운영하는 만큼 속도가 중요한 스타트업의 경쟁력을 높일 수 있다는 것도 장점으로 꼽았다. 비개발자나 초급 개발자도 프로토타이핑 수준의 기능을 빠르게 구현할 수 있어 스타트업과 소규모 팀에 적합하다는 의견이 제시된다. 프로덕트 매니저, 디자이너 등의 직군에서도 AI 기반 개발 도구를 도입하는 사례가 늘고 있다. AI의 개입이 코드 작성 전반을 대체하면서 개발자의 역할도 재정의되고 있다. 코드를 잘 작성하는 능력은 점차 AI로 대체되고 있으며 대신 AI의 효율적 활용, 명확한 설계 지시 능력, 비즈니스 요구사항과 다양한 기술 간 조합 능력이 새로운 핵심 역량으로 부상하고 있다. 안드레 카파시의 바이브코딩에 대해선 아직 긍정과 우려가 교차한다. 생산성과 접근성을 높였다는 평가가 있는 반면, 코드 품질 저하와 기술 부채 누적에 대한 경계도 커지고 있다. 특히 AI가 생성한 코드를 사용자가 충분히 이해하지 못한 채 적용할 경우 보안 취약점이나 논리 오류가 발생할 수 있다. 복잡한 시스템에서는 장기적인 유지보수가 어려워질 수 있다는 지적도 제기된다. 안드레 카파시 역시 바이브코딩이 주말에 만들고 테스트하는 프로젝트용으로 바이브코딩이 적합하며 진짜 코딩은 아니라고 언급했다. 간단한 서비스나 데모 개발 등에는 효과적이지만 정교한 인프라나 실시간 시스템 개발에는 여전히 한계가 있다는 것이다. 더불어 그는 일부 버그의 경우 AI가 해결하지 못해 반복적인 요청이나 질문을 우회해야 했다고 밝혔다. 파이썬 웹 프레임워크 장고(Django)의 공동 창시자인 사이먼 윌리슨도 "LLM은 강력한 보조 도구이지만, 코드에 대한 이해와 검토 과정을 생략해서는 안 된다"며 과도한 AI 의존에 대해 경고했다. 이러한 우려에도 불구하고 AI를 중심에 둔 개발 방식은 빠르게 하나의 흐름으로 자리잡고 있다. 구글, 마이크로소프트, 아마존 등 주요 빅테크는 코파일럿, 제미나이 코드 어시스트, Q디벨로퍼 등 자체 개발한 LLM 기반 개발 도구를 선보이고 있다. AI 기반 개발은 아직 실험과 실전 단계의 경계에 놓여 있다. 그러나 LLM이 생성하는 코드 품질이 빠르게 개선되며 일부 분야에서는 코드를 쓰지 않고 개발이 가능할 것이란 예측이 강세를 보이고 있다. 베타랩스 데니스김 CEO는 "바이브코딩은 아직 초기 개념이지만 직관과 감성, 협업의 시대로 전환하는 디딤돌이 될 수 있다"며 "이제 우리는 AI와 코드를 함께 느끼는 시대로 향하고 있는지도 모른다"고 말했다.

2025.03.30 09:11남혁우

코난테크놀로지, 의료분야 국내 첫 LLM 기반 진료 플랫폼 개발

코난테크놀로지(대표 김영섬)가 생성형인공지능(AI) 기술을 기반으로 의료 분야에 특화된 대규모언어모델(LLM)을 선보인다. 코난테크놀로지는 한림대학교 의료원과 '생성형AI기반 입원환자 전주기 기록지 작성 및 의료원 지식상담 플랫폼 구축' 사업을 계약했다고 5일 밝혔다. 이 사업은 한림대학교의료원과 협력하여 국내 의료 분야에 특화된 생성형 AI 플랫폼을 개발하고 적용하는 것을 목표로 하며, 양 기관은 오는 7월까지 의료 AI 솔루션 공동 개발에 나서게 된다. 입원환자 전주기 의무기록은 접수부터 진료, 검사, 경과 기록, 퇴원까지 모든 과정을 아우르는 통합 기록 시스템으로, 의료 기록 전 과정에 LLM 기술을 적용하는 사례는 국내 최초다. 이에 따라 의무기록 작성에 소요되는 시간이 연간 최대 절반까지 단축될 것으로 예상되며, 실시간 데이터 분석과 함께 입력 오류도 줄어들어 의료기록의 정확성이 한층 높아질 전망이다. 생성형 AI가 의료 현장에 도입되면, 환자 관리와 케어에 더 많은 시간을 할애할 수 있는 환경이 조성되어 궁극적으로 의료 서비스의 품질 향상으로 이어질 것으로 기대된다. 양 기관은 의료 기록 시스템 외에도 검색 증강 생성(RAG) 기술을 활용한 지식 상담 플랫폼을 개발해 의료진과 교직원의 실시간 정보 검색과 상담을 지원할 계획이다. 윤리적 AI 설계와 안전 필터링으로 정보 신뢰성을 강화하며, AI 오남용 방지를 위한 대응 시스템도 구축한다. 김규훈 코난테크놀로지 사업부장은 "생성형 AI 기술을 적용해 병원 행정과 진료 과정에서 업무를 효율화하려는 시도가 늘어나는 만큼, 의무기록 작성 AI 서비스를 시작으로 의료 AI 시장의 수요에 민첩하게 대응하며 관련 모델 고도화와 제품화를 이어가겠다"고 포부를 전했다. 한림대학교의료원은 초기 개념검증(PoC) 단계부터 서비스 기획, 의료진 인터뷰, 방향성 도출까지 사업의 주요 과정을 주도적으로 이끌었다. 코난테크놀로지는 한림대학교의료원이 제공한 실무적 통찰과 피드백, 그리고 의료 AI의 특수성을 반영한 철저한 검증을 기반으로 안전하고 신뢰성 높은 의료 AI 솔루션을 고도화 해나갈 예정이다.

2025.02.05 16:46남혁우

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

애플 시리에 구글 제미나이 품는다…AI 동맹에 주가도 들썩

홈플러스는 왜 '김병주 MBK 회장 구하기' 앞장설까

[AI 리더스] 신현석 투라인클라우드 공동대표 "MSA 기술로 AI 도입·확산 조력자 될 것"

배경훈 부총리 "피지컬AI, 차세대 국가전략 핵심 축으로 명확히 설정"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.