• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'대규모'통합검색 결과 입니다. (40건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

오픈AI 中 서비스 중단…알리바바 '큐원2'가 대안될까

오픈AI가 중국 내 서비스를 전면 차단한 가운데 알리바바가 대규모 언어 모델(LLM) '큐원2-수학(Qwen2-Math)'을 출시해 관심이 쏠린다. 현존하는 LLM 중 최상위권 수학 AI로 평가돼 현지 연구자와 개발자들의 대안으로도 각광 받고 있다. 9일 미국의 기술 매체 벤처비트에 따르면 알리바바의 '큐원2-수학'은 LLM용 수학 벤치마크 '매스(MATH)' 테스트에서 84%의 정확도를 기록했다. 벤치마크 성능 1위인 오픈AI의 'GPT-4 코드 인터프리터(GPT-4 Code Interpreter)'가 기록한 87.92%에 근접한 성과로, 알리바바의 기술력을 입증했다는 평가다. '큐원2'는 초등학교 수준의 수학을 테스트하는 'GSM8K'에서 96.7%, 대학 수준의 수학 테스트에서는 47.8%의 점수를 기록하며 눈에 띄는 성과를 거뒀다. 이는 오픈AI 'GPT-4o', 앤트로픽 '클로드 3.5 소네트', 구글 '수학-제미나이 스페셜라이즈드 1.5 프로(Math-Gemini Specialized 1.5 Pro)'와 같은 주요 경쟁 모델들을 능가하는 결과다. 이번 성과는 중국 유저들에게 의미가 크다. 오픈AI의 서비스 차단으로 중국 개발업계와 학계가 '챗GPT'를 사용하지 못하고 있기 때문이다. 지금까지 중국 개발자·연구자들은 가상사설망(VPN)을 통해 제한적으로 파인튜닝, 연구 및 벤치마킹을 진행해 왔으나 이마저도 지난 7월 전면적으로 차단돼 연구에 제약을 받아 왔다. 이런 상황에서 '큐원2'는 'GPT-4 코드 인터프리터'에 거의 준하는 수학 능력을 달성해 중국 유저들의 업무를 효율적으로 지원할 것으로 예측된다. 이에 맞춰 알리바바는 해당 모델의 광범위한 활용을 위해 배포를 계획하고 있다. 특히 월간 사용자 수가 1억 명 이하인 기업들에게 오픈소스로 제공해 스타트업과 중소기업이 사실상 무료로 사용할 수 있게 할 방침이다. 벤처비트는 "LLM 모델 경쟁이 매우 빠르게 진행되면서 '큐원'이 지금까지는 경쟁자들에게 밀려났었다"며 "이번 수학 능력의 비약적인 향상은 알리바바가 다시 경쟁력을 회복하는 계기가 될 수 있을 것"이라고 분석했다.

2024.08.09 15:28조이환

마크 저커버그 "차기 LLM 라마4 기존 대비 10배 이상 투자"

메타가 차기 오픈소스 대규모 언어모델(LLM) 개발을 위해 10배 이상의 컴퓨팅 파워를 투자할 전망이다. 2일 테크크런치 등 외신에 따르면 마크 저커버그 최고경영자(CEO)는 메타의 2분기 실적발표에서 향후 AI 개발 계획을 소개했다. 그는 "향후 수 년간 필요한 컴퓨팅 클러스터와 데이터를 계획하고 있다"며 "차기 모델인 라마4(Llama 4)는 업계에서 가장 진보한 오픈 AI모델로 구축하기 위해 이전 모델보다 거의 10배에 달하는 컴퓨팅 파워가 필요할 것이라고 추정했다. 이번 실적 발표에서 수잔 리 최고재무책임자(CFO)는 메타가 올해 생성 AI에서 수익을 창출하지 못할 것임을 인정했다. 또한 다양한 데이터 센터 프로젝트와 미래 AI 모델을 훈련할 수 있는 역량 구축을 고려하고 있어 2025년까지 자본 지출이 늘어날 수 있다고 밝혔다. 이에 대해 마크 저커버그 CEO는 대규모 AI경쟁에서 뒤처지지 않기 위해 투자를 확대하는 과정이라고 밝혔다. 그는 "AI가 앞으로 어떤 추세를 보일지 예측하기 어려운 것은 사실"이라며 "하지만 투자를 멈춘 후 다시 새로운 추론 프로젝트를 시작하기엔 긴 리드타임이 필요하기 때문에 너무 늦기 전에 필요한 인프라를 미리 구축하는 위험을 감수하는 것이 낫다"고 설명했다. 또한 페이스북의 콘텐츠 순위 및 추천 도구와 인스타그램의 피드 등에 AI를 활용하고 있으며 이를 통해 성과를 개선하고 있다며 AI의 활용성을 소개했다. 마크 저커버그는 "예전에는 광고주가 특정 연령대, 지역 또는 관심사와 같이 도달하고 싶은 특정 대상 고객을 가지고 우리에게 왔다"며 "AI가 적용된 우리 광고 시스템은 이제 광고주 자신보다 누가 관심을 가질지 더 잘 예측할 수 있는 지점까지 도달했다"고 강조했다.

2024.08.02 09:58남혁우

티메프 사태 후폭풍...'로켓정산법' 재점화

티몬·위메프 정산 지연 사태가 계속되면서 플랫폼에서 긴 정산주기를 갖지 않도록 규제하는 '로켓정산법' 필요성이 커지고 있다. 이커머스 플랫폼의 정산주기에 대한 규제가 부족해 중소업체는 정상적인 납품에도 불구하고 상품대금을 제때 지급받지 못한다는 불만이 높아져서다. 티몬과 위메프의 긴 정산주기는 이번 사태 이전에도 입점 업체들에게 불리한 구조라는 지적이 있었다. 티몬은 거래가 이뤄진 달의 말일부터 40일까지, 위메프는 익익월 7일에 정산 해준다. 이커머스 플랫폼마다 정산주기 제각각…'대규모유통업법' 적용도 안 받아 플랫폼마다 정산 기한이 다른 이유는 이커머스 기업의 정산 기간에 대한 규제가 없기 때문이다. 대규모유통업법은 기업이 월 판매 마감일로부터 40일이 지나기 전까지 판매자에게 납품대금을 지금하도록 하고 있다. 다만 티몬,위메프 등 이커머스 기업엔 대규모유통업법이 적용되지 않는다. 그럼에도 불구하고 이 두 회사보다 빠르게 판매대금을 지급하고 있는 이커머스 회사들도 있다. 지마켓·옥션, 11번가, 네이버 스마트스토어와 같은 회사들은 고객 구매 확정 시 바로 다음 날 대금 전액을 지급한다. 고객이 구매 확정을 하지 않더라도 7∼8일 뒤 자동으로 구매 확정이 이뤄져 늦어도 열흘 이내에 정산이 완료되는 구조다. 때문에 정산 기한이 긴 이커머스 플랫폼에 입점한 판매자들은 상대적으로 자금유동성 문제를 겪기 쉽다. 입점업체 중에는 자금유동성 문제를 해결하기 위해 대출을 받는 기업들도 여럿이다. 지난해 10월 김종민 더불어민주당 의원이 공개한 '플랫폼 입점업체 정산대금 대출 현황'에 따르면, 7개 플랫폼 기업 입점업체가 지난 5년간 대출을 받은 총액은 1조8천억원을 웃돌았다. 당시 대출 금액 기준 1위는 쿠팡, 2위는 위메프였다. 긴 정산주기로 득을 보는 곳은 이커머스 업체들이다. 상품 판매 후 대금 정산까지 최대 약 60일간 판매대금을 융통할 시간을 얻으면서 자금유동성이 풍부해진 것이다. 이커머스 업체들이 판매대금을 이 기간 동안 어떻게 관리하는지는 알려지지 않았다. 이런 이유로 인해 이번 티메프 사태에서도 업계에서는 큐텐그룹이 티몬 위메프 판매대금을 글로벌 이커머스 플랫폼 '위시'를 인수하는 인수자금으로 썼다는 의혹이 제기됐다. 긴 정산주기동안 관리하던 판매대금을 먼저 인수자금으로 쓰고, 다른 곳에서 자금을 융통하려 했으나 계획이 어그러지면서 정산이 지연됐다는 것이다. '로켓정산법' 필요성 대두…정산주기 개선·이커머스 규제 논의 시작 이커머스 기업의 정산주기를 줄여야 한다는 의견이 늘면서 지난 국회에서 처리하지 못한 '로켓정산법'도 화두에 올랐다. 로켓정산법은 지난 2021년 21대 국회에서 한무경 전 국민의힘 의원이 유통업계의 상품 대금의 지급 기한을 앞당기며 발의한 대규모유통업법 개정안이다. 로켓정산법의 핵심 내용은 현행 40일로 규정된 유통업계의 상품 대금의 지급 기한을 '30일'로 규정한 것이다. 직매입거래 상품의 대금 지급 기한도 현행 60일에서 50일로 줄이는 내용이 담겼다. 당시 한 전 의원은 "일부 대규모유통업자가 거래규모가 작은 납품업체에 대해서는 대형 납품업체에 비해 대금 지급 기일을 길게 설정하는 등 영세 납품업체의 피해가 우려된다"며 "이를 해소함으로써 영세한 중소 납품업자의 현금흐름을 개선하려 한다"고 법안 취지를 밝혔다. 이 법안은 공정위의 동의를 얻어 정무위 소위원회에 회부됐으나 다른 법안에 밀려 추가 논의가 이뤄지지 않았다. 막대한 투자를 이어가야 하는데, 대금정산일이 앞당겨지면 현금흐름이 빡빡해질 수밖에 없다는 이커머스 업계의 우려도 있었다. 당시 정무위에서는 법안 수립에 신중하자는 입장이 나왔다. 김원보 정무위 전문위원은 법안을 검토하며 "지나치게 짧은 대금지급 기한을 두는 경우 유통업체가 입점업체에게 유리한 직매입거래를 기피하게 될 가능성이 크다"고 추측했다. 끝내 로켓정산법은 21대 국회 임기만료와 함께 폐기됐고, 현재까지 유사한 내용의 법안은 제출되지 않았다. 반면 대금 지급이 빨라진다고 입점업체에서 피해가 온다는 건 과한 우려라는 의견도 있다. 한 유통업계 관계자는 "대금을 늦게 지급하면, 그만큼 현금 흐름을 이용해 이커머스 업체가 대출 등 금융활동을 할 여지가 생긴다"며 "판매대금은 당연히 판매자에게 돌아가야 하는 금액이고, 이걸 빨리 정산한다고 해서 플랫폼에 직접적인 손해가 가진 않는다"고 말했다. 국회도 정산주기 개선 필요성에 공감을 표했다. 한동훈 국민의힘 대표는 지난 29일 국회에서 열린 최고위원회의에서 "정산 주기를 개선하는 문제와 위탁형 이커머스(전자상거래)에 있어 자금 보관 문제를 같이 검토해야 한다"고 언급했다. 티몬과 위메프 등 온라인 중개사업자에 대규모유통업법을 적용시켜야 한다는 주장도 나왔다. 진성준 더불어민주당 정책위의장은 지난 30일 기자간담회에서 "티몬이나 위메프가 전자상거래법상 규율을 받고 있지만, 대금결제기한이나 소비자에 대한 환불 책임까지도 분명히 규정돼 있진 않다"면서 "대규모유통업법도 함께 손볼 필요가 있다"고 강조했다.

2024.07.31 18:16정석규

오픈AI, 챗GPT 때문에 파산할 수도…왜?

오픈AI가 챗GPT의 유지 비용이 높아서 올해 안에 파산 위기에 처할 수 있다는 우려가 나왔다. 인공지능(AI) 기업인 오픈AI는 AI 챗봇 '챗GPT' 운영비 부담 때문에 올해 50억 달러(약 6조9천250억원) 가량 손실을 볼 가능성이 있다고 튀르키예투데이, 디인포메이션 등 외신들이 28일(현지시간) 보도했다. 보도에 따르면 챗GPT는 하드웨어를 운영 비용만 매일 70만 달러(약 9억6천950만원) 가량이 필요하다. 이 수치는 앞으로 AI 기능이 정교해지게 되면 더 늘어날 것으로 예상된다. 또 오픈AI는 올해 ▲AI 교육 부문 70억 달러(약 9조6천950억원) ▲인건비 15억 달러(약 2조775억원) 가량 필요할 전망이다. 이는 아마존의 지원을 받는 앤트로픽 등 경쟁업체의 같은 기간 지출 27억 달러(약 3조7천395억원)를 능가하는 수치다. 반면 오픈AI가 챗GPT로 벌어들이는 돈은 운영 비용을 감당하기에는 턱 없이 부족한 수준이다. 디인포메이션에 따르면 오픈AI는 챗GPT로 연간 약 20억 달러(약 2조7천700억원)를 벌어들이고 있다. 이와 별도로 대규모언어모델(LLM) 이용료로 10억 달러(약 1조3천850억원) 매출을 추가로 만들어내고 있다. 현재 오픈AI의 기업 가치는 800억 달러(약 110조8천억원)를 웃도는 수준이다. 또 생성형 AI에 대한 기업들의 관심이 높아짐에 따라 오는 2025년까지 매출이 두 배 이상 증가할 것이라는 기대도 있다. 오픈AI는 7번의 투자 라운드를 통해 110억 달러(약 15조2천416억원) 이상의 금액을 모금했으며, 마이크로소프트의 클라우드 서비스 '애저(Azure)' 할인 혜택도 누리고 있다. 그럼에도 오픈AI는 35만개의 서버 중 29만개를 챗GPT 전용으로 운영 중이다. 오픈AI는 파산을 피하기 위해 향후 12개월 이내에 추가 자본을 확보해야 한다. 이러한 리스크에도 오픈AI는 샘 알트만(Sam Altman) 대표와 함께 일반인공지능(AGI)을 발전에 집중하고 있다. 또한 AI 기반 검색 엔진인 서치(Search)GPT를 출시하며 제품과 수익원을 다각화를 모색 중이다.

2024.07.29 13:48정석규

오픈AI, 더 똑똑한 AI 모델 내놓나…비밀리에 '스트로베리' 개발

오픈AI가 인공지능(AI) 모델 추론능력 향상을 위해 비공개 연구를 진행 중인 것으로 전해졌다. 성공 시 AI는 인터넷을 자율적으로 탐색하고 작업을 순차적으로 계획·수행 할 수 있게 된다. 15일 로이터에 따르면 오픈AI는 코드명 '스트로베리(Strawberry)'라는 모델을 개발 중인 것으로 알려졌다. 이 모델의 목표는 AI가 심층연구(Deep Research)를 수행하도록 하는 것이다. 심층연구란 AI가 자율적으로 인터넷을 탐색하고 문제를 해결하며 단계에 따라 계획을 수립·실행하는 능력이다. 스트로베리는 질의에 대한 답변만 생성하는 기존 AI모델과 달리 고도의 심층연구 능력을 달성하는 것을 목표로 한다. '챗GPT' 등 생성형 AI 서비스는 이미 인간보다 빠르게 텍스트를 요약하고 산문을 작성할 수 있다. 그러나 인간이 직관적으로 이해하는 상식적 문제나 논리적 오류를 해결하지는 못한다. 대신 거짓 정보를 내뱉는 '환각(Hallucination)' 문제가 발생한다. 로이터는 스트로베리가 성공적으로 개발된다면 현재 AI가 직면한 추론 능력 문제를 해결할 수 있을 것으로 분석했다. 전문가들은 향후 AI가 애플리케이션 개발과 과학적 발견에 중요한 역할을 하게 될 것으로 기대하고 있다. 로이터 소식통은 "스트로베리 개발은 진행 중인 사안"이라며 "모델의 작동원리는 오픈AI 내부에서도 철저한 기밀"이라고 말했다. 스트로베리는 지난해 '큐스타(Q*)'로 알려져 있었다. 이 모델은 기존 AI가 해결하지 못하던 과학 및 수학 문제에 대해 답을 하는 등 발전된 추론능력을 보였다. 오픈AI 관계자는 스트로베리에 대한 직접적인 언급을 피하며 "우리는 AI 모델이 인간처럼 세상을 보고 이해하기를 바란다"며 "AI 기능에 대한 지속적인 연구는 업계에서 일반적인 관행"이라고 밝혔다.

2024.07.15 14:19조이환

"AI가 다 한다"...앤트로픽, 고품질 프롬프트 기능 추가

앤트로픽이 안전하고 전문적으로 대규모언어모델(LLM) '클로드(Claude)'를 사용할 수 있도록 고품질 프롬프트를 생성하고 검사하는 기능을 도입했다. 앤트로픽은 공식 뉴스룸을 통해 '클로드' 개발자 콘솔에 테스트케이스를 추가했다고 11일 밝혔다. 개발자 콘솔은 모델의 응답을 평가하고 개선하기 위해 사용하는 도구다. 앞서 지난 5월 앤트로픽은 콘솔에 프롬프트 생성기를 추가했다. 이 기능은 생각의 사슬(CoT) 기법 등 최신 추론 기법에 기반해 정확하고 안정적인 고품질 프롬프트를 생성한다. 새로 추가된 테스트케이스는 프롬프트 생성기 등을 통해 작성한 프롬프트가 올바르게 작동하는지를 검증한다. 마케팅용 이메일 작성, 기술 메뉴얼 작성 등 산업이나 업무의 특성에 따라 달라지는 프롬프트 요구사항을 가상환경에서 안전하고 빠르게 확인하기 위함이다. 테스트케이스는 콘솔에서 자동으로 생성하거나 수동으로 작성할 수 있으며, 다양한 종류의 테스트케이스를 하나로 통합해 테스트묶음(Test Suite)으로 운영할 수도 있다. 개발자 콘솔은 다양한 기능을 추가로 제공한다. 프롬프트 생성과 테스트케이스 묶음을 통한 검증 작업은 여러 차례 반복이 가능하며 유저는 이 결과물들을 서로 비교해 최고의 결과물을 채택할 수 있다. 또 앤트로픽은 평점을 통해 결과물 개선 작업을 지원한다. 인간 전문가가 결과의 질적 향상 여부에 대해 평가를 내리게 함으로써 모델 성능의 접근성과 속도를 향상했다. 앤트로픽은 "프롬프트 및 테스트케이스 생성·출력 기능은 모든 콘솔 사용자에게 제공된다"며 이 기능의 적극적인 사용을 독려했다.

2024.07.11 16:35조이환

中 최초 대규모 폐쇄형 '자율주행 테스트장' 가동

중국에서 자율주행 기능을 테스트할 수 있는 전용 공간이 세워졌다. 8일 중국 언론 중궈신원왕에 따르면 중국 자동차 테스트 기업 CATARC는 15억 위안(약 2천848억 원)을 투자해 건설한 중국 최초의 대형 폐쇄형 지능연결차(ICV, Intelligent Connected Vehicle)차 테스트장 '장삼각(옌청) ICV 테스트장'을 16일부터 본격 운영한다고 밝혔다. 이 테스트장은 지능형 스마트카 및 자율주행 기능 테스트를 위한 모든 조건을 갖췄다. 이 곳 폐쇄형 자동차 테스트장 내에는 세계 최초로 건설된 실제 터널이 있다. 터널 총 길이만 840m, 왕복 4차선 도로에 지하 깊이 13m로 길이 350m의 S자형 굴곡 등을 갖췄다. GPS 위치 확인 신호 없이 네트워크 신호가 차단됐을 때 차량의 감지, 연산, 의사결정 및 실행 기능을 테스트할 수 있다. 광폭의 다차선 도로도 갖췄으며, 직선 구간 길이 2천100m, 폭 24m, 최대 테스트 속도가 160km/h다. 연결된 순환도로와 합하면 10차선에 이르러, 중국뿐 아니라 세계에서 손꼽히는 수준이라고 매체는 전했다. 또 도시 현장, 농촌 현장, 날씨 시뮬레이션 등이 가능하며, 5G-A 통신 네트워크 기지국과 다수의 도로 측 감지 장치 및 엣지 컴퓨팅 기능을 갖춰 다양한 도로 조건과 속도에서의 복잡한 충돌 테스트 및 기상환경에서의 자율주행 테스트, 차량-도로 협업 기능 테스트를 지원한다. 여기에 저고도 경제를 겨냥해 항공기 테스트까지 할 수 있다.

2024.07.09 08:23유효정

美 클라우드플레어, '웹사이트 스크랩' 차단 지원

미국의 인터넷 보안 업체 클라우드플레어가 웹사이트 소유자들이 인공지능(AI) 서비스의 콘텐츠 접근을 차단하는 기능을 출시했다. 여러 AI 기업들이 타사 웹사이트를 무단으로 스크랩해 콘텐츠를 수집하자 대응 조치를 내놓은 것이다. 지난 6일 포브스 등 외신에 따르면, 클라우드플레어는 공식 블로그를 통해 클라우드플레어 고객이 자신의 웹사이트를 방문하는 AI 봇을 차단하는 기능을 출시했다고 밝혔다. 클라우드플레어 관계자는 해당 기능을 출시한 이유에 대해 "생성형 AI의 인기로 모델 학습이나 추론 실행에 사용되는 콘텐츠 수요가 급증하고 있다"며 "웹 스크래핑용 AI봇을 투명하게 운영하지 않는 일부 AI 기업이 무단으로 콘텐츠를 가져가는 사례도 발생하고 있다"고 설명했다. 해당 기능은 클릭 한 번으로 클라우드플레어 고객 누구나 활성화할 수 있으며 무료 사용자도 이용 가능하다. 해당 기능이 활성화되면 클라우드플레어 자체 기술로 봇 점수를 계산하며, AI봇을 식별하고 막는다. 클라우드플레어는 발표와 함께 자사가 수집한 'AI 스크랩퍼'들의 활동 데이터를 공유했다. AI 모델을 학습시키기 위해 대규모언어모델(LLM) 등의 콘텐츠 수요가 급증하자 여러 기업에서 타사의 홈페이지의 스크랩해 콘텐츠를 도용한 것이다. 해당 데이터에 따르면, 6월 한 달 간 클라우드플레어 사용자 중 약 39%가 AI 봇에 의해 홈페이지 스크랩을 당했다. 또한 이 중 2.98%만이 홈페이지 스크랩을 자체적으로 차단한 것으로 나타났다. 클라우드플레어 관계자는 "봇 탐지를 회피하기 위해 기존 감지 규칙을 우회해 콘텐츠에 접근하려는 AI 기업이 계속 나올 것으로 보인다"며 "클라우드플레어는 머신러닝 모델을 고도화하고 더 많은 AI봇을 차단목록에 추가해 콘텐츠 제작자가 성장할 환경을 제공할 것"이라고 말했다.

2024.07.07 14:13정석규

"AI와 인간 사이 격차 줄인다"…메타, 새로운 AI 학습방법 제시

메타가 사람의 언어를 보다 깊이 이해할 수 있는 인공지능(AI) 학습 방법을 제시했다. 5일 벤처비트 등 외신에 따르면 메타는 다중토큰예측 방식으로 사전학습한 대규모언어모델(LLM) 4종을 허깅페이스를 통해 출시했다. 다중토큰예측은 지난 4월 메타의 연구진이 발표한 논문을 통해 처음 소개된 기술이다. 순차적으로 토큰 하나씩 예측하는 기존 LLM 훈련과 달리 동시에 여러 토큰을 예측하는 방식이다. 토큰은 LLM이 인식하는 문자데이터의 기본 단위다. 이는 여러 토큰을 동시에 예측함으로써 언어 구조와 맥락에 대한 세밀한 관계를 보다 깊게 파악할 수 있어 언어에 담긴 내용을 AI가 더욱 정확하게 이해할 수 있도록 지원한다. 이를 통해 코드 생성부터 글쓰기 등 다양한 작업에서 보다 효율적이고 높은 수준의 결과물을 작성하는 것이 가능하다. 메타는 해당 방식을 통해 기존 방식보다 LLM의 성능을 향상시킬 뿐 아니라 훈련 시간과 학습에 필요한 컴퓨팅파워를 줄일 수 있다고 밝혔다. 이를 통해 AI 개발·운영 비용을 절감하고 환경에 미치는 악영향을 최소화해 지속가능한 업무환경을 구축할 수 있다고 설명했다. 허깅페이스에 공개된 4종의 LLM은 모두 70억 개의 매개변수를 기반으로 하지만 성능 비교를 위해 토큰에 차이를 뒀다. 7B_200B_1와 7B_200B_4는 2천억 개의 토큰을 활용하지만 7B_200B_1는 기존 방식으로 7B_200B_4는 다중토큰예측모델이 적용됐다. 7B_1T_1와 7B_1T_4는 토큰의 개수가 1조개로 늘어났으며 방식은 동일하다. 메타는 AI 성능 테스트인 MBPP와 휴먼에벌 벤치마크 테스트를 실시한 결과 각각 17%와 12% 더 높은 정확성을 기록했으며 생성속도는 3배 더 빨랐다고 밝혔다. 메타의 연구원들은 "우리의 접근 방식은 LLM의 속도를 향상시킬 뿐 아니라 더 나은 모델의 성능과 훈련 효율성을 제공한다"며 "새로운 학습 방법은 단순한 효율성의 확장을 넘어 언어에 대한 더욱 깊이 있는 이해를 제공해 AI와 인간 사이의 격차를 줄일 수 있는 잠재력을 가지고 있다"고 논문을 통해 강조했다.

2024.07.05 10:44남혁우

아마존, '홈페이지 무단 스크랩' 혐의로 AI 스타트업 조사

아마존이 자사 홈페이지를 무단 스크랩했다는 혐의로 인공지능 스타트업 '퍼플렉시티'를 조사 중이다. 최근 엔가젯·와이어 등 외신 보도에 따르면, 아마존 운영사 '아마존웹서비스'는 퍼플렉시티가 규정을 위반하고 있는지 확인하기 위한 조사를 시작했다. 퍼플렉시티는 AI 개발의 토대가 되는 대규모언어모델(LLM) 훈련용 콘텐츠를 수집하기 위해 아마존 홈페이지를 무단으로 스크랩했다는 의심을 받고 있다. 대부분의 프로그램 개발자는 봇이 특정 페이지에 액세스할 수 있는지에 대한 지침이 포함된 '로봇(robots.txt)'이라는 문서 파일을 도메인에 넣는다. 이는 자발적인 조치지만, 프로그램 개발자들이 90년대에 표준화한 이래로 대부분의 스크랩 프로그램은 이를 지켜왔다. 아마존웹서비스의 클라우드 사업부는 퍼플렉시티가 '로봇' 문서 지침을 무시하는 스크랩 프로그램을 사용했다는 혐의를 조사하고 있다. 와이어드 등의 외신은 아마존 웹 사이트의 '로봇' 지침을 우회하는 가상 머신을 발견했다고 보도했다. 보도에 따르면, 이 시스템은 퍼플렉시티의 IP 주소를 사용해 아마존 서버에서 웹사이트의 사용됐다. 아마존웹서비스 대변인은 관련 성명서에서 "우리 회사의 서비스 약관은 불법적인 활동을 금지하며 고객은 이러한 약관을 준수할 책임이 있다"며 "우리는 다양한 출처로부터 관련 혐의에 대한 보고를 지속적으로 받고 있다"고 밝혔다. 그는 "우리 클라우드 사업부는 퍼플렉시티의 규정 위반 가능성에 대한 모든 정보를 종합해 조사 중이다"고 덧붙였다. 사라 플랫닉 퍼플렉시티 대변인은 자사의 스크랩 프로그램이 로봇 배제 프로토콜을 우회하고 있다는 사실을 부인했다. 그는 "아마존에서 실행되는 퍼플렉시티 봇은 로봇 문서를 존중하며, 퍼플렉시티가 아마존 서비스 약관을 위반하지 않는다는 것을 확인했다"고 말했다.

2024.07.01 09:36정석규

알리바바, 자사 AI 프로그래머로 앱 개발 돕는다

알리바바 클라우드가 자체 개발한 대규모언어모델(LLM)을 기반으로 첫 '인공지능(AI) 프로그래머'를 도입했다. 23일 사우스차이나모닝포스트 보도에 따르면, 알리바바 클라우드는 AI 프로그래머가 앱 개발 시간을 분 단위까지 단축하는 것을 목표로 한다고 밝혔다. AI 프로그래머 출시는 알리바바 클라우드의 첫 AI 코딩 비서인 통이 링마(Tongyi Lingma)가 소개된 지 7개월 만이다. 알리바바 클라우드는 개인·기업 개발자 모두를 고객으로 상정했으며, 구체적인 사용료는 아직 공개되지 않았다. 알리바바에 따르면, 비서 역할을 하는 AI 프로그래머는 ▲소프트웨어 설계자 ▲개발 엔지니어 ▲테스트 엔지니어의 역할을 결합해 제품 개발을 돕는다. 알리바바 클라우드의 LLM 서비스 '통이치엔원'을 관리하는 쑤동(Xu Dong)은 지난 21일(현지시간) 상하이에서 열린 회사의 클라우드AI 행사에서 "소프트웨어 앱 개발의 패러다임이 변하고 있다"고 말했다. 그는 "미래에는 사용자가 문제를 식별하고 요구사항을 표현하기만 하면 몇 분 만에 AI가 앱 개발을 완료하는 일이 낯설지 않을 것"이라고 덧붙였다. AI 프로그래머의 출시는 통이치엔원이 지원하는 알리바바 클라우드의 첫번째 AI 코딩 도우미 '통이링마'가 도입된 지 7개월 만에 이뤄졌다. 오픈 소스 코드 교육을 받은 '통이링마'는 자연어 지침을 기반으로 ▲코드 생성 ▲단위 테스트 실행 ▲코드 디버그·최적화가 가능하다다. 롱이링마의 기본 버전은 개인 사용자에게 무료이며, 추가 관리 기능을 갖춘 기업 버전은 1인당 월 159위안(약 3만원)의 요금으로 사용할 수 있다.

2024.06.24 14:57정석규

"기업 환경에 LLM 특화"…미스트랄AI, 미세조정 SDK 공개

미스트랄AI가 대규모언어모델(LLM)의 성능을 개선하거나 기업에 특화할 수 있도록 기술 지원을 제공한다. 미스트랄은 5일(현지시간) AI모델 미세 조정을 위한 소프트웨어 개발 키트(SDK)인 미스트랄 파인튠(Mistral-Finetune)을 출시했다. 깃허브를 통해 공개된 미스트랄 파인튠는 미스트랄의 AI 모델을 워크스테이션, 서버 및 소규모 데이터 센터 노드 등 다양한 인프라에 최적화할 수 있도록 지원한다. 공개된 내용에 따르면 해당 SDK는 다중 GPU 설정에 최적화되어 있지만 미스트랄 7B와 같은 소형 모델을 미세 조정하기 위해 엔비디아 A100 또는 H100 GPU 단일 모델로 설정을 변경하는 것도 가능하다. 예를 들어 오픈AI의 챗GPT를 사용한 140만 개의 대화 모음인 울트라챗과 같은 데이터 세트를 미세 조정하는 과정은 8개의 H100 GPU를 활용해 약 30분 만에 완료할 수 있다. 보다 효율적인 AI 개발을 위해 '라 플랫폼'과 같은 유로 개발 서비스와 연계한 작업도 가능하다. 라플랫폼을 활용하면 특정 요구 사항에 맞게 모델을 정의하거나 교육하는 API를 호출해효과적으로 AI를 개발할 수 있다. 미스트랄은 몇 주에 걸쳐 미세 조정 서비스에 새로운 모델을 추가할 예정이라고 밝혔다. 이와 함께 미스트랄은 SDK를 효율적으로 활용할 수 있도록 지원하기 위한 교육 서비스를 함께 제공한다. 교육서비스에는 기업의 자체 데이터를 사용해 미스트랄 AI 모델을 미세조정하는 커리큘럼이 포함돼 보다 효율적이고 전문적으로 AI를 활용할 수 있는 방법을 제시한다. 미스트랄 AI 팀은 "우리는 개발자에게 강력한 개방형 생성 모델을 제공하고 이를 효율적으로 사용할 수 있는 방법을 제공한다"고 강조했다.

2024.06.06 15:00남혁우

GPT-3.5, 스트리트파이터3로 GPT-4 꺾었다

오픈AI의 GPT-3.5 터보가 GPT-4 등 상위 인공지능(AI) 모델을 꺾고 스트리트파이터3 챔피언에 올랐다. 14개 대규모언어모델(LLM)들이 각축을 벌인 스트리트파이터3 게임 대회에서 'GPT-3.5'가 우승을 차지했다고 PC게이머 등 외신들이 최근 보도했다. 보도에 따르면 미국 샌프란시스코에서 개최한 미스트랄 AI SF 해커톤에서 LLM간 이벤트 매치가 열렸다. 비디오게임 스트리트파이터3를 학습해 치러진 이번 대회는 LLM이 실제 업무에서 어떤 성과를 낼 수 있는지 시각적으로 확인할 수 있도록 마련됐다. 단기간에 치러진 대회인 만큼 학습시간을 줄이기 위해 캐릭터는 켄으로 제한됐다. 승부에 참여한 LLM은 화면을 인식할 수 있도록 텍스트 설명이 제공되며 캐릭터와 상대의 동작 그리고 양쪽의 체력바를 학습해 대회가 치러졌다. 오픈AI의 GPT-3.5 및 GPT-4과 다양한 버전의 미스트랄 LLM 등 총 14종의 LLM이 경합을 벌인 결과 GPT-3.5 터보버전이 최종 우승을 차지했다. 이어서 미스트랄 스몰 파이널버전이 뒤를 이었다. 기본 성능이 더 높은 GPT-4와 미스트랄 AI 상위 모델이 오히려 하위권을 기록해 눈길을 끌기도 했다. 이에 대해 미스트랄 AI의 운영진은 각 AI가 갖는 특성이 게임에 영향을 미쳤다고 설명했다. 모델의 크기가 작으면 대기 시간과 속도에 이점을 가질 수 있는 만큼 게임에서 유리해질 가능성이 크다는 설명이다.

2024.04.08 14:11남혁우

메타, '라마3' 전용 AI인프라 공개...GPU만 4만9천개

메타가 차기 대규모언어모델(LLM) '라마 3' 학습을 위한 세계 최대 규모의 컴퓨팅 인프라를 공개했다. 최근 실리콘 앵글 등 외신에 따르면 메타는 AI학습을 위한 데이터센터급의 24K GPU 클러스터 한 쌍의 세부정보를 공식 블로그를 통해 공개했다. 여러 그래픽처리장치(GPU)를 네트워크로 연결해 병렬 컴퓨팅 작업을 수행하는 시스템이다. 기계학습, 대규모 시뮬레이션 등 대규모 계산 작업을 더 빠르게 처리하기 위해 활용된다. 메타에서 공개한 24K GPU 클러스터는 2022년 선보인 리서치슈퍼클러스터(RSC)의 후속모델이다. 이름처럼 2개의 클러스터에 각 2만4천576개의 엔비디아 텐서 코어 H100(이하 H100) GPU가 적용된 것이 특징으로 총 4만9천 개 이상의 H100 CPU를 활용할 수 있다. 이번 발표는 일반인공지능(AGI) 연구를 위해 대규모 인프라 구축 계획의 일환이다. 메타는 2024년 말까지 35만 개의 H100 GPU를 포함한 AI 인프라를 확장할 계획이다. 이를 통해 기존에 확보한 인프라를 포함해 60만 개의 H100 GPU 수준의 컴퓨팅 파워를 갖추는 것을 목표로 한다. 두 클러스터는 GPU 수가 동일하며 개방형 GPU 하드웨어 플랫폼 '그랜드 티톤(Grand Teton)'을 사용해 구축됐다. 하지만 네트워크 인프라 설계에 차이가 있다. 하나는 웻지 400 및 미니팩 2 OCP 랙 스위치와 아리스타 7800를 기반으로 자체 개발한 RDMA 오버 컨버지드 이더넷(RoCE) 솔수션을 적용했다. 두 번째 클러스터는 엔비디아의 퀀텀2 인피니밴드 패브릭 솔루션이 적용됐다. 두 클러스터의 구조를 다르게 한 이유는 향후 더 크고 확장된 클러스터 구축을 목표로 하기 때문이다. 두 클러스터에서 다양한 분야의 AI를 학습하며 어떤 구조와 설계 방식이 AI에 적합한지 데이터를 확보해 이후 적용하겠다는 비전이다. 저장장치도 해머스케이프와 협력해 자체 개발했다. 생성형 AI 훈련 작업이 점점 빨라지고 규모가 커지는 것에 대비해 고성능이면서도 수만개의 GPU에서 동시 작업하는 데이터를 감당할 수 있도록 E1.S SSD를 활용했다. 이와 함께 구글은 개방형 AI 생태계 활성화를 위해 AI 소프트웨어 프레임워크인 파이토치를 지속해서 지원할 것이라고 강조했다. 케빈 리 등 구글 연구원은 “지난 2015년 빅서 플랫폼을 시작으로 GPU 하드웨어 플랫폼을 설계를 공개하고 있다”며 “우리는 이런 정보 공유가 업계의 문제 해결을 돕는데 도움이 될 것이라고 믿고 있다”고 이번 GPU 클러스터 관련 내용을 공개한 이유를 밝혔다. 이어서 “우리의 AI 노력은 개방형 과학과 교차 협력의 철학을 바탕으로 구축됐다”며 “개방형 생태계는 AI 개발에 투명성, 정밀성, 신뢰를 제공하고 안전과 책임을 최우선으로 하여 모든 사람이 혜택을 누릴 수 있는 혁신을 이끌어낼 것”이라고 강조했다.

2024.03.17 13:07남혁우

에스넷시스템, 코난테크놀로지와 자체 LLM 구축 전망

에스넷시스템(대표 유홍준, 장병강)이 협력을 통해 자체 LLM을 구축할 전망이다. 에스넷시스템은 코난테크놀로지(이하 코난)와 AI 관련 사업 협력을 위한 업무협약(MOU)을 체결했다고 15일 밝혔다. 이번 업무협약은 AI 시스템 구축 및 AI 솔루션 공동개발을 통해 상호 시너지를 창출하고 사업 성장 동력을 확보하기 위함이다. ▲AI 솔루션 상호 협력 ▲AI 인프라 부문 공급, 설치 및 기술지원 ▲AI 플랫폼, 솔루션 부문 지원을 주요 골자로 하고 있다. 에스넷시스템이 AI 인프라, GPU 클라우드 서비스 그리고 아마존웹서비스(AWS), 삼성 클라우드 플랫폼(SCP) 등 클라우드 관련 부문을 지원하고, 코난테크놀로지가 대규모 언어 모델(LLM), 생성형 AI 등의 AI 솔루션 부문을 지원한다. 에스넷시스템은 AI 에너지 최적화 솔루션과 코난LLM을 대표적으로 코난테크놀로지의 생성형 AI솔루션과 함께 협업할 예정이다. 양사의 솔루션 협업을 통해 새로운 부가가치를 만드는 솔루션을 개발하겠다는 방침이다. AI 인프라 부문 지원을 위해 GPU 서버 및 클라우드, GPU 네트워크 뿐만 아니라 테스트 및 PoC용(기술검증용) GPU 서버까지 아우르는 공급, 설치 및 기술지원을 제공할 계획이다. AI 플랫폼, 솔루션 부문도 지원한다. 구체적으로 AI 인프라 운영 관리 플랫폼과 어플리케이션 개발 플랫폼을 제공할 예정이다. 유홍준 에스넷시스템 대표는 “에스넷시스템이 AI사업을 지속 강화해 나가는 과정에서 인공지능 소프트웨어 전문기업인 코난테크놀로지와 업무 추진하게 되어 뜻깊게 생각한다”며 “이번 협약을 통해 도출된 역량을 활용하여 경쟁력 있는 AI 인프라 및 솔루션 서비스를 선도할 예정”이라고 말했다. 김영섬 코난테크놀로지 대표는 “IT산업을 선도하는 에스넷시스템과 AI 관련 사업을 함께하게 되어 기쁘다”며 “코난테크놀로지가 가지고 있는 AI 기술과 역량을 기반으로 에스넷시스템과 긴밀히 협력하여 앞으로는 AI 시장에서 유의미한 성과를 도출할 수 있도록 노력하겠다”고 밝혔다.

2024.03.15 11:22남혁우

kt클라우드, LLM으로 AI디지털교과서 맞춤형 교육 구현

kt클라우드(대표 황태현)가 AI디지털교과서에 학습분석 및 개인별 맞춤형 교육을 구현한다. kt클라우드는 스마트앤와이즈와 'AI기반 학습분석 플랫폼'을 선보인다고 8일 밝혔다. 양사는 지난 해 AI디지털교과서 사업을 위한 업무협약을 맺고, AI디지털교과서 구축에 필요한 AI학습분석 제공 플랫폼을 공동 개발했다. AI디지털교과서는 AI기반 학습 데이터를 수집∙분석하고, AI보조교사와 실시간으로 상호작용하며 학생별로 맞춤화된 교육을 제공하는 것이 핵심이다. 현재 다양한 에듀테크 기업에서 각자의 노하우를 바탕으로 학습 플랫폼을 개발하고 있지만, 대부분 AI기반이 아닌 단순 규칙에 따라 한정적으로 반응하는 룰베이스 방식을 활용하고 있다. kt클라우드는 스마트앤와이즈의 교육 전용 대규모언어모델(LLM) 및 플랫폼 개발을 위해 AI클라우드 인프라를 지원한다. kt클라우드의 AI 인프라는 LLM 학습, 개발에 있어 동적할당 기반의 이용료 과금, 대규모 클러스터링 지원 GPU 인프라를 제공한다. 향후 AI디지털교과서 사업이 확대되면서 늘어날 AI 인프라에 대비해 kt클라우드는 NPU 기반 인프라 공급도 적극 검토하고 있다. 발행사 및 에듀테크 기업은 NPU 이용으로 AI 인프라 이용 부담이 줄어들 전망이다. 스마트앤와이즈는 오랜 경험과 노하우가 축적된 교수학습플랫폼을 통해 교육 LLM을 개발했고, 이를 기반으로 학습자의 성향 및 과제 수행 정보를 분석하여 맞춤형 학습 전략을 제시하는 루츠(Roots) 플랫폼을 선보였다. 실제 교육현장 안착 및 확산을 위해 대구교육대학교와 시범 사업을 진행 중이며 연내 클라우드 보안인증(CSAP) 획득을 추진할 예정이다. 2023년 과학기술정보통신부와 한국지능정보사회진흥원이 주관한 'K-클라우드' 프로젝트에도 선정된 바 있다. 국정원은 '챗GPT 등 생성형 AI 활용 보안 가이드라인에 따라 발행사 및 에듀테크의 오픈AI 이용을 제한하고 있다. 또한 공공 교육에서는 ▲선행학습 ▲할루시네이션(허위정보) 등의 문제로, 객관적으로 검증할 수 있고 제어가능한 교육LLM의 이용이 필수적이다. 스마트앤와이즈 이민주 연구소장은 “CSAP 인증 획득을 통해 공공분야에 AI디지털교과서 제공을 위한 적격성 확보와 발행사의 콘텐츠 기반으로 특화된 교육 LLM을 구축∙제공할 수 있게 될 것”이라고 말하며 “이를 통해 공공분야 오픈 AI이용 제한과 학교 교육에서 엄격히 제한하고 있는 선행학습, 할루시네이션(허위정보) 등의 이슈를 해소할 것”이라고 강조했다. kt클라우드 남충범 본부장은 “다양한 발행사∙에듀테크에게 AI 인프라를 제공하여 사업자들의 이용 부담을 줄이고 효율적인 학습 플랫폼 개발을 적극 지원하겠다”고 말했다. 이어 “특히 AI디지털교과서 사업 및 생태계 활성화를 이끄는 선도 사업자로 앞장서겠다”며 다짐했다.

2024.03.08 10:29남혁우

샌즈랩-포티투마루-LG U+, 정보유출 위험 없는 보안LLM 구축

샌즈랩(대표 김기홍)이 정보 유출 위험이 없는 사이버 보안 분야 대규모언어모델(LLM)구축에 나선다. 샌즈랩은 포티투마루, LG유플러스와 사이버 보안 강화를 위한 대규모언어모델(이하 LLM) 기술을 공동 개발한다고 4일 밝혔다. LG유플러스 마곡 사옥에서 진행된 업무 협약식에는 LG유플러스 한영섭 AI기술담당, 포티투마루 김동환 대표, 샌즈랩 김기홍 대표 등이 참석했다. 3사는 이번 협약을 통해 사이버 보안 핵심 4대 분야인 ▲보안 관제 ▲위협 인텔리전스 ▲이상 징후 분석 ▲취약점 식별 등에 특화된 LLM을 구축하고 LLM 배포 체계를 만들기로 했다. 이 체계가 상용화되면 기업들은 LLM을 기업 내부에서 활용하며, 정보 유출 위험을 막을 수 있다. 샌즈랩은 이번협약으로 정보 유출 위험이 없는 사이버 보안 분야 LLM 상용화에 도움이 될 것으로 기대하고 있다. 사이버보안 분야 및 사이버 범죄에 대응할 인공지능(이하 AI) 기술 공동 개발을 통해 관련 사업분야에서 시너지 효과를 기대하고 있다. LG유플러스는 LLM 개발과 고객 정보 보호 안전망 구축 역할을 담당하며, 포티투마루는 사이버 보안 및 범죄 예방에 특화된 LLM 모델링 및 검색증강생성(RAG) 등의 원천 기술 개발, 샌즈랩은 기업 내부 인프라에서 운영 가능한 데이터셋 개발 역량을 제공한다. 샌즈랩은 생성형 AI 기술과 인공지능 모델 학습용 데이터셋을 자사 전반의 보안 서비스와 솔루션에 적용하고 있는 AI 보안기업이다. 전문적인 위협 인텔리전스 분야 서비스를 자연어 형태로 손쉽게 활용할 수 있도록 한 'CTX for GPT'의 GPT 스토어 출시를 비롯해 기업 내부 인프라에서 운영할 수 있는 사이버보안 전문 소형언어모델(sLLM) 'SANDY'를 개발했다. 포티투마루는 기업이 LLM을 도입 시 발생되는 환각, 보안, 비용 문제를 극복하기 위한 전문 산업 분야별 도메인 특화 언어 모델인 'LLM42'를 개발하고 있다. 딥러닝 기반 인공지능 독해 솔루션(MRC42), 검색 증강 생성 솔루션(RAG42) 등을 통해 답변의 신뢰성을 제고하고, 기업 내부 데이터나 고객 정보가 유출되지 않도록 기업용 프라이빗 모드를 지원하며, 경량화 버전의 상용 실현을 통해 초거대 AI 도입 및 운영 비용을 절감할 수 있도록 돕는다. LG유플러스는 LG AI 연구원과 협업해 대규모언어모델(LLM) '익시젠(ixi-GEN)'을 출시할 예정이다. 상반기엔 챗봇의 진화 형태인 'AI 에이전트'를 선보인다. AI 기술을 활용해 차별적 고객 가치를 제공하고 신성장 동력을 만들어 디지털 혁신(DX) 역량을 강화한다는 복안이다. 샌즈랩 김기홍 대표는 “사이버 보안과 AI 기술에 강점을 가진 분야별 전문 기업들의 융합으로 시너지 효과가 극대화될 것”이라며 “샌즈랩만의 데이터셋과 보안 기술력에 포티투마루와 LG유플러스의 고도화된 AI 기술을 결합해 혁신적인 AI 보안 환경을 조성하겠다”고 말했다. 포티투마루 김동환 대표는 “LLM 모델을 활용해 각종 사이버 범죄에 선제적으로 대응할 수 있을 것”이라며 “이번 협력을 통해 국내 보안 기술 수준을 높일 수 있을 것으로 기대한다”고 밝혔다. LG유플러스 한영섭 AI 기술담당은 “LG 유플러스는 이번 협력을 통해 샌즈랩의 보안 기술력과 포티투마루의 AI 기술을 결합하여 사이버 위협으로부터 고객들의 정보를 보호하는 안전망을 구축할 것“이라며, “특히, 고객들의 정보 보호를 최우선으로 하며 사이버 위협에 대하여 보다 안전한 디지털 환경을 조성하겠다”고 말했다.

2024.03.04 16:01남혁우

올거나이즈-마키나락스, 금융권 LLM 인프라 최적화 전략 제시

올거나이즈(대표 이창수)가 금융업 실무자들이 LLM 솔루션을 업무에 쉽고 빠르게 적용할 수 있도록 금융권 인공지능(AI) 도입 핵심 사례와 활용 노하우를 공개한다. 올거나이즈는 마키나락스와 '알짜 기업이 쓰는 진짜 AI-금융권 LLM+AI 인프라 최적화 전략'을 주제로 세미나를 개최한다고 27일 밝혔다. 지난 1월 진행된 동명 세미나의 후속으로 진행되는 이번 세미나는 금융권 기업의 AI 실제 도입 사례를 보다 풍부하게 소개할 예정이다. 다음 달 5일 오후 6시부터 9시까지 서울 역삼동에 위치한 창업지원센터인 마루180의 이벤트홀에서 진행된다. 마키나락스의 신민석 이사가 '금융기업의 AI 자원 최적화: 하이브리드 AI 플랫폼의 구축과 운영 전략'을 주제로 강연을 시작한다. 비용 효율성, 운영의 민첩성, 유연성 측면에서 하이브리드 AI 플랫폼의 구축 및 운영 전략을 살펴본다. 금융 분야에서 AI를 활용해 비즈니스 가치를 극대화하고, 규제 준수 요건을 충족하면서도 기술적 유연성을 유지하는 전략을 공유한다. 올거나이즈의 이창수 대표는 '금융권 생성형 AI 프로젝트 성공을 위한 베스트 프랙티스'를 주제로 강연을 진행한다. 금융권 고객들과 실제 협업했던 사례를 중심으로, 금융권에서 첫 번째 생성형 AI 프로젝트를 시작할 때 내부에서 어떤 데이터를 준비하고 어떻게 팀을 꾸려 대응해야 하는지, AI 내재화와 고도화를 위해 지금 바로 사용할 수 있는 생성형 AI 애플리케이션은 어떤 것들이 있는지 등을 설명한다. 패널토론 및 질의응답은 총 1시간 진행된다. 실사례 위주로 진행되는 세미나인 만큼, 강연자 외에도 실제 금융권 AI 도입 프로젝트를 이끌었던 담당자들이 패널로 참여해 실무자들의 궁금증을 해소할 예정이다. 사례의 구체적인 내용에 대한 현장 질문도 가능하다. 올거나이즈에서 실제 금융권 AI 프로젝트를 진행중인 유태하 PM과 이창수 대표가 30분간 토론 및 질의응답을 진행한다. 금융권에서 AI를 도입할 때의 주의점, AI 프로젝트를 효율적으로 운영하고 관리하며 생산성을 혁신할 수 있는 방법 등을 중점으로 이야기 나눌 예정이다. 이어 마키나락스의 신민석 이사와 허영신 CBO가 금융권의 AI 인프라 및 플랫폼 구축에 대한 실제 사례와 장기적으로 비용 및 운영 측면에서 고려해야 할 사항 등에 대해 토론한다. 올거나이즈는 4월 4일 SK텔레콤, 마이크로소프트와 함께 '금융 AI 도입의 핵심 사례'를 주제로 세미나를 개최할 예정이다. 서울 중구에 위치한 SKT 타워에서 오후 3시부터 6시까지 진행된다. 올거나이즈의 이창수 대표는 "2024년은 4대 은행그룹 회장, 은행장들이 2024년 조직 개편과 신년사를 통해 AI 활용 확대를 선언할 정도로 금융업 전반에서 생성형 AI를 적용한 서비스가 확대되는 해"라며, "양사가 금융권 고객 기업과 실제 프로젝트를 진행하며 경험한 노하우를 벤치마킹할 수 있을 것"이라고 밝혔다.

2024.02.27 08:57남혁우

미소정보기술, 비라벨링 데이터 솔루션 '데이터스캔' 출시

의료 및 산업분야에 최적화된 비(非)라벨링 데이터 표준화 솔루션이 출시했다. 미소정보기술(대표 안동욱)은 대규모언어모델(LLM) AI 구축과 소규모언어모델(sLLM) AI 구축시 양질의 빅데이터 확보를 위한 솔루션 '데이터스캔'을 선보인다고 15일 밝혔다. '데이터스캔'은 의료 및 산업분야에서 사람의 손으로 가공된 라벨링 데이터(지도학습)가 아닌 챗GPT등 초거대AI 개발에 필수인 양질의 빅데이터를 확보할 수 있는 비라벨링 데이터 표준화 솔루션이다. 초거대AI 사전학습에 필요한 빅데이터 구축을 위해 데이터 등록부터 분류체계, 단어사전 구축 통한 자연어 처리 및 분류분석, 텍스트분석, 산업별 적용 도메인에 따른 데이터 후처리 등을 실시간 분석한다. 기업·공공기관의 내부 문서 보안이 강화된 패브릭기반 멀티모달 데이터 플랫폼 '스마트빅(smart BIG)'을 통해 LLM, sLLM구축시 고도화된 언어처리 기술을 원스톱으로 제공한다. 일상생활과 직결되는 의료분야에서는 의료영상 판독을 통한 건강검진·진료 소견서 작성, 과거 진료기록 요약, 치료 방법·처방전, 개인건강관리, 반려동물 질병 상담 등 활용할 수 있다. 금융 부분은 고객상담, 금융상품 추천, 신용평가, 금융사고 감지 등 금융전반의 AI서비스에 활용하며, 법률 분야에서는 계약서, 소장, 법조문 제시, 판결문(법원)등 서류 작성 시간을 줄이고 유사 판례를 쉽게 찾아주는 서비스 등을 통해 업무 효율성과 국민 편의성까지 높아질 것으로 기대하고 있다. 현재 초거대AI에 필요한 '비라벨링 데이터'는 의료 및 산업분야에 부족한 실정이다. 단순·반복 작업 중심이었던 라벨링 데이터 중심의 AI 학습용 데이터로는 사람이 직접 라벨링 하지 않고 비지도학습 즉 모델이 스스로 예측하며 학습하는 방식의'챗GPT' 같은 초거대 AI를 지원하기 어렵다. 국가 차원의 초거대 AI 학습용 핵심 데이터 구축으로 빠르게 전환이 필요하다. 미소정보기술은 주력사업인 디지털 헬스케어사업 호조 및 대학병원 및 공공, 의료기관등 의료데이터 개방에 맞춰 임상연구분석에 최적화된 워크플로 전과정을 통합 제공하는 '서비스형 임상시험(CRaaS)' 솔루션 고도화, 정형, 비정형, 텍스트, 비디오, 오디오 등 데이터들을 통합하고 인터랙션을 제공하는 멀티모달 데이터 플랫폼(MDP) 사업에 집중하고 있다. 미소정보기술은 의료데이터에서 산업데이터까지 데이터 구분없이 분석이 가능한 전문 도메인 날리지와 패브릭기반 멀티모달 데이터 플랫폼 '스마트빅'을 통해 기업 및 공공기관에 한국형 챗GPT, LLM, Sllm등 생성형AI 서비스 품질을 높일 수 있도록 고도화에 집중 투자하고 있다. 미소정보기술 안동욱 대표이사는“생성형AI시대를 맞아 양질의 데이터는 AI경쟁력의 핵심이라며 의료, 산업 데이터분석 및 멀티모달 데이터 플랫폼으로 똘똘한 데이터를 제공해 초거대AI 기업들의 경쟁력을 지원하는 데이터 인에이블러 역할을 담당할 것”이라고 말했다.

2024.02.16 15:05남혁우

구글, 직접 학습하고 개선하는 로봇 훈련도구 공개

로봇이 주변 환경을 인식하고 스스로의 행동을 분석해 작업을 개선하는 대규모 인공지능(AI) 모델 기반 학습도구를 구글에서 공개했다. 5일 테크크런치 등 외신에 따르면 구글 딥마인드 로보틱스는 로봇 학습모델 '오토RT'와 'RT-트레젝토리' 등을 공개했다. 오토RT는 로봇에게 주어지는 다양한 환경과 목적에 따라 명령을 자연스럽게 수행할 수 있도록 개발된 기본 학습모델이다. 대규모 언어모델(LLM)과 비전 언어모델(VLM)과 로봇 제어 모델을 결합해 사전에 설정되지 않은 환경을 스스로 분석 후 주어진 목표를 적합하게 수행하기 위한 방안을 도출하고 수행한다. 예를 들어 '책상 위의 캔을 들어'라는 명령이 주어지면 언어모델이 주변 환경을 스캔한 후 모든 객체에 따른 정보를 텍스트 데이터화 한다. 이후 LLM이 책상과 캔과 관련된 데이터를 확인 후 명령을 수행하기 위한 작업 프로세스을 생성한다. 작업 프로세스는 환경을 고려해 다양하게 생성되며 부적절한 방식과 실제 업무에 필요한 작업 등을 분류하는 과정을 거친다. 실제 유효하다고 판단된 작업만이 업무 프로세스로 샘플링 된 후 로봇에 적용되어 수행된다. 또한, 수행 과정과 결과에 대한 데이터를 수집 후 분석해 이후 작업을 개선할 수 있는 기능도 갖췄다. 구글 측에 따르면 오토RT는 로봇이 얼마나 자율적으로 명령을 수행할 것인지 원하는 정도에 따라 설정할 수 있다. 또한 얼마나 안전하고, 자율적으로 업무를 수행하는지 판단하기 위해 테스트를 진행했다. 7개월에 걸쳐 한 번에 최대 20대의 로봇을 다양한 환경을 조성하며 테스트를 실시한 결과 6천650개의 고유한 언어 지침을 다루는 7만7천 개 이상의 사례를 수집할 수 있었다고 밝혔다. 구글은 로봇이 업무를 수행하는 과정에서 가장 적합한 물리적 동작을 수행하기 위한 RT-트레젝토리라는 학습모델도 도입했다. 로봇의 동작 궤도를 시각화해 반복 학습 과정에서 어떤 동작으로 업무를 수행했을 때 더 좋은 결과를 얻을 수 있는지 확인하고 개선할 수 있도록 지원한다. 훈련 데이터를 지원하지 않은 41개 작업으로 테스트한 결과 작업 성공률이 29%에서 63%로 2배 이상 향상됐다고 밝혔다. 또한 보다 안전한 로봇 활용을 위해 자체 필터링 기능 외에도 추가적인 안전조치 계층을 구성했다. 관절에 가해지는 힘이 주어진 임계값을 초과하면 자동으로 멈추도록 설정했다. 더불어 작동 중인 모든 로봇은 사람이 직접 중단한 수 있는 물리적 비활성화 스위치가 눈에 잘 띄는 곳에 위치하도록 구성할 것을 권했다. 구글 딥마인드 로보틱스 팀은 “우리는 여러 환경에서 다양한 명령을 자연스럽게 수행하기 위한 다목적 로봇개발을 목표로 하고 있다”며 “이번에 공개한 대규모 AI모델과 시스템 등을 통해 더욱 효율적인 로봇을 선보일 수 있을 것으로 기대한다”고 말했다.

2024.01.05 09:09남혁우

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

블록체인 가상자산, '입법지연·예산삭감·규제' 악순환 끊어야

[AI는 지금] 대선후보들 'AI 전쟁' 돌입…기술 주권부터 전력 인프라까지 격돌

한화 김동선 진두지휘 ‘벤슨' 뭐가 다른가…‘100% 국내산 유제품'

SKT "정보 유출 없다 '확신'...있더라도 끝까지 책임"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현