• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'언어 모델'통합검색 결과 입니다. (126건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

美 클라우드플레어, '웹사이트 스크랩' 차단 지원

미국의 인터넷 보안 업체 클라우드플레어가 웹사이트 소유자들이 인공지능(AI) 서비스의 콘텐츠 접근을 차단하는 기능을 출시했다. 여러 AI 기업들이 타사 웹사이트를 무단으로 스크랩해 콘텐츠를 수집하자 대응 조치를 내놓은 것이다. 지난 6일 포브스 등 외신에 따르면, 클라우드플레어는 공식 블로그를 통해 클라우드플레어 고객이 자신의 웹사이트를 방문하는 AI 봇을 차단하는 기능을 출시했다고 밝혔다. 클라우드플레어 관계자는 해당 기능을 출시한 이유에 대해 "생성형 AI의 인기로 모델 학습이나 추론 실행에 사용되는 콘텐츠 수요가 급증하고 있다"며 "웹 스크래핑용 AI봇을 투명하게 운영하지 않는 일부 AI 기업이 무단으로 콘텐츠를 가져가는 사례도 발생하고 있다"고 설명했다. 해당 기능은 클릭 한 번으로 클라우드플레어 고객 누구나 활성화할 수 있으며 무료 사용자도 이용 가능하다. 해당 기능이 활성화되면 클라우드플레어 자체 기술로 봇 점수를 계산하며, AI봇을 식별하고 막는다. 클라우드플레어는 발표와 함께 자사가 수집한 'AI 스크랩퍼'들의 활동 데이터를 공유했다. AI 모델을 학습시키기 위해 대규모언어모델(LLM) 등의 콘텐츠 수요가 급증하자 여러 기업에서 타사의 홈페이지의 스크랩해 콘텐츠를 도용한 것이다. 해당 데이터에 따르면, 6월 한 달 간 클라우드플레어 사용자 중 약 39%가 AI 봇에 의해 홈페이지 스크랩을 당했다. 또한 이 중 2.98%만이 홈페이지 스크랩을 자체적으로 차단한 것으로 나타났다. 클라우드플레어 관계자는 "봇 탐지를 회피하기 위해 기존 감지 규칙을 우회해 콘텐츠에 접근하려는 AI 기업이 계속 나올 것으로 보인다"며 "클라우드플레어는 머신러닝 모델을 고도화하고 더 많은 AI봇을 차단목록에 추가해 콘텐츠 제작자가 성장할 환경을 제공할 것"이라고 말했다.

2024.07.07 14:13정석규

"AI와 인간 사이 격차 줄인다"…메타, 새로운 AI 학습방법 제시

메타가 사람의 언어를 보다 깊이 이해할 수 있는 인공지능(AI) 학습 방법을 제시했다. 5일 벤처비트 등 외신에 따르면 메타는 다중토큰예측 방식으로 사전학습한 대규모언어모델(LLM) 4종을 허깅페이스를 통해 출시했다. 다중토큰예측은 지난 4월 메타의 연구진이 발표한 논문을 통해 처음 소개된 기술이다. 순차적으로 토큰 하나씩 예측하는 기존 LLM 훈련과 달리 동시에 여러 토큰을 예측하는 방식이다. 토큰은 LLM이 인식하는 문자데이터의 기본 단위다. 이는 여러 토큰을 동시에 예측함으로써 언어 구조와 맥락에 대한 세밀한 관계를 보다 깊게 파악할 수 있어 언어에 담긴 내용을 AI가 더욱 정확하게 이해할 수 있도록 지원한다. 이를 통해 코드 생성부터 글쓰기 등 다양한 작업에서 보다 효율적이고 높은 수준의 결과물을 작성하는 것이 가능하다. 메타는 해당 방식을 통해 기존 방식보다 LLM의 성능을 향상시킬 뿐 아니라 훈련 시간과 학습에 필요한 컴퓨팅파워를 줄일 수 있다고 밝혔다. 이를 통해 AI 개발·운영 비용을 절감하고 환경에 미치는 악영향을 최소화해 지속가능한 업무환경을 구축할 수 있다고 설명했다. 허깅페이스에 공개된 4종의 LLM은 모두 70억 개의 매개변수를 기반으로 하지만 성능 비교를 위해 토큰에 차이를 뒀다. 7B_200B_1와 7B_200B_4는 2천억 개의 토큰을 활용하지만 7B_200B_1는 기존 방식으로 7B_200B_4는 다중토큰예측모델이 적용됐다. 7B_1T_1와 7B_1T_4는 토큰의 개수가 1조개로 늘어났으며 방식은 동일하다. 메타는 AI 성능 테스트인 MBPP와 휴먼에벌 벤치마크 테스트를 실시한 결과 각각 17%와 12% 더 높은 정확성을 기록했으며 생성속도는 3배 더 빨랐다고 밝혔다. 메타의 연구원들은 "우리의 접근 방식은 LLM의 속도를 향상시킬 뿐 아니라 더 나은 모델의 성능과 훈련 효율성을 제공한다"며 "새로운 학습 방법은 단순한 효율성의 확장을 넘어 언어에 대한 더욱 깊이 있는 이해를 제공해 AI와 인간 사이의 격차를 줄일 수 있는 잠재력을 가지고 있다"고 논문을 통해 강조했다.

2024.07.05 10:44남혁우

아마존, '홈페이지 무단 스크랩' 혐의로 AI 스타트업 조사

아마존이 자사 홈페이지를 무단 스크랩했다는 혐의로 인공지능 스타트업 '퍼플렉시티'를 조사 중이다. 최근 엔가젯·와이어 등 외신 보도에 따르면, 아마존 운영사 '아마존웹서비스'는 퍼플렉시티가 규정을 위반하고 있는지 확인하기 위한 조사를 시작했다. 퍼플렉시티는 AI 개발의 토대가 되는 대규모언어모델(LLM) 훈련용 콘텐츠를 수집하기 위해 아마존 홈페이지를 무단으로 스크랩했다는 의심을 받고 있다. 대부분의 프로그램 개발자는 봇이 특정 페이지에 액세스할 수 있는지에 대한 지침이 포함된 '로봇(robots.txt)'이라는 문서 파일을 도메인에 넣는다. 이는 자발적인 조치지만, 프로그램 개발자들이 90년대에 표준화한 이래로 대부분의 스크랩 프로그램은 이를 지켜왔다. 아마존웹서비스의 클라우드 사업부는 퍼플렉시티가 '로봇' 문서 지침을 무시하는 스크랩 프로그램을 사용했다는 혐의를 조사하고 있다. 와이어드 등의 외신은 아마존 웹 사이트의 '로봇' 지침을 우회하는 가상 머신을 발견했다고 보도했다. 보도에 따르면, 이 시스템은 퍼플렉시티의 IP 주소를 사용해 아마존 서버에서 웹사이트의 사용됐다. 아마존웹서비스 대변인은 관련 성명서에서 "우리 회사의 서비스 약관은 불법적인 활동을 금지하며 고객은 이러한 약관을 준수할 책임이 있다"며 "우리는 다양한 출처로부터 관련 혐의에 대한 보고를 지속적으로 받고 있다"고 밝혔다. 그는 "우리 클라우드 사업부는 퍼플렉시티의 규정 위반 가능성에 대한 모든 정보를 종합해 조사 중이다"고 덧붙였다. 사라 플랫닉 퍼플렉시티 대변인은 자사의 스크랩 프로그램이 로봇 배제 프로토콜을 우회하고 있다는 사실을 부인했다. 그는 "아마존에서 실행되는 퍼플렉시티 봇은 로봇 문서를 존중하며, 퍼플렉시티가 아마존 서비스 약관을 위반하지 않는다는 것을 확인했다"고 말했다.

2024.07.01 09:36정석규

알리바바, 자사 AI 프로그래머로 앱 개발 돕는다

알리바바 클라우드가 자체 개발한 대규모언어모델(LLM)을 기반으로 첫 '인공지능(AI) 프로그래머'를 도입했다. 23일 사우스차이나모닝포스트 보도에 따르면, 알리바바 클라우드는 AI 프로그래머가 앱 개발 시간을 분 단위까지 단축하는 것을 목표로 한다고 밝혔다. AI 프로그래머 출시는 알리바바 클라우드의 첫 AI 코딩 비서인 통이 링마(Tongyi Lingma)가 소개된 지 7개월 만이다. 알리바바 클라우드는 개인·기업 개발자 모두를 고객으로 상정했으며, 구체적인 사용료는 아직 공개되지 않았다. 알리바바에 따르면, 비서 역할을 하는 AI 프로그래머는 ▲소프트웨어 설계자 ▲개발 엔지니어 ▲테스트 엔지니어의 역할을 결합해 제품 개발을 돕는다. 알리바바 클라우드의 LLM 서비스 '통이치엔원'을 관리하는 쑤동(Xu Dong)은 지난 21일(현지시간) 상하이에서 열린 회사의 클라우드AI 행사에서 "소프트웨어 앱 개발의 패러다임이 변하고 있다"고 말했다. 그는 "미래에는 사용자가 문제를 식별하고 요구사항을 표현하기만 하면 몇 분 만에 AI가 앱 개발을 완료하는 일이 낯설지 않을 것"이라고 덧붙였다. AI 프로그래머의 출시는 통이치엔원이 지원하는 알리바바 클라우드의 첫번째 AI 코딩 도우미 '통이링마'가 도입된 지 7개월 만에 이뤄졌다. 오픈 소스 코드 교육을 받은 '통이링마'는 자연어 지침을 기반으로 ▲코드 생성 ▲단위 테스트 실행 ▲코드 디버그·최적화가 가능하다다. 롱이링마의 기본 버전은 개인 사용자에게 무료이며, 추가 관리 기능을 갖춘 기업 버전은 1인당 월 159위안(약 3만원)의 요금으로 사용할 수 있다.

2024.06.24 14:57정석규

KAIST, 멀티모달 대형언어모델 '깃허브' 공개…GPT-4V 시각성능 "제꼈다"

국내 연구진이 오픈AI의 GPT-4V와 구글 제미나이-프로(Gemini-Pro)의 시각 성능을 능가하는 멀티모달 대형언어모델을 개발, 오픈소스 커뮤니티 깃허브(Github)에 공개했다. 최근 주목받는 생성형 AI 트랜드가 멀티모달화로 진화 중이어서 귀추가 주목됐다. KAIST는 전기및전자공학부 노용만 교수 연구팀이 GPT-4V 등 비공개 상업 모델의 시각 성능을 넘어서는 공개형 멀티모달 대형언어모델을 선보였다고 20일 밝혔다. 연구팀은 멀티모달 대형언어모델 시각 성능을 개선하기 위해 '콜라보(CoLLaVO)'와 '모아이(MoAI)' 2가지 기술을 자체 개발했다. 이병관 연구원(박사과정,제1저자)은 "GPT-4V나 제미나이-프로 등과 시각성능 만을 비교하면 점수나 정확도 면에서 최대 10% 더 우수하다"고 말했다. 인지추론성도 함께 따져봐야 하지만, 이는 이번 연구 주제에서 벗어나 나중에 생각할 부분이라는 것이 이 연구원 얘기다. 사실 인지추론성도 개별 검토한 결과 오픈AI나 구글 모델 대비 결코 뒤지진 않는다는 것이 이 연구원의 귀뜸이다. 연구팀은 '콜라보'를 개발하기 전 기존 공개형 멀티모달 대형언어모델 성능이 비공개형에 비해 떨어지는 이유를 1차적으로 물체 수준에 대한 이미지 이해 능력 저하에서 찾았다. 연구팀은 이를 개선하기 위해 이미지 내 정보를 배경과 물체 단위로 분할하고 각 배경 및 물체에 대한 정보를 멀티모달 대형언어모델에 직접 넣어주는 '크레용 프롬프트(Crayon Prompt)'라는 시각적 프롬프트를 새로 설계했다. 또 시각적 지시 조정 단계에서 크레용 프롬프트로 학습한 정보를 잃어버리지 않기 위해 물체 수준 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터로 학습시키는 획기적인 학습전략인 '듀얼 큐로라(Dual QLoRA)'를 제안했다. 이병관 연구원은 "이로 인해 이미지 내에서 배경 및 물체를 1차원적으로 구분하는 능력이 크게 향상됐다"고 덧붙였다. 대형언어모델인 모아이(MoAI)'도 개발했다. 인간이 사물을 판단하는 인지과학적 요소(물체 존재나 상태, 상호작용, 배경, 텍스트 등)에서 영감을 얻었다는 것이 연구팀 설명이다. 연구팀은 "기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용하기 때문에, 이미지 픽셀 수준에서의 상세하고 종합적인 실세계 장면에 대한 이해가 모자란다고 판단했다"고 말했다. 연구팀은 △전체적 분할 △한계가 없는 물체 검출기 △상황 그래프 생성 △글자 인식 등 4가지 컴퓨터 비전 모델을 언어로 변환한 뒤 멀티모달 대형언어모델에 입력했다. 이를 연구팀이 실제 검증한 결과 '콜라보'는 Math Vista(대학수준 수학 및 물리문제)나 MM-벤치(영어 객관식 문제), MMB-CN(중국어 객관식 문제), AI2D(어학문제) 등의 풀이에서 기존 모델 대비 최대 10%까지 점수와 정확도가 우수했다. 또 '모아이'는 기존 공개형 및 비공개형 LLVMs(멀티모달 대형언어)와 비교한 결과 각 질문에 따라 점수가 20포인트 이상 우수하게 답변한 경우도 나타났다. 이병관 연구원은 "3개월전 깃허브에 올려놓은 '콜라보'(https://github.com/ByungKwanLee/CoLLaVO)와 '모아이'(https://github.com/ByungKwanLee/MoAI)에 관심을 가져달라"며 "박사학위가 마무리되면 멀티모달 대형언어를 아이템으로 창업할 생각도 있다"고 말했다. 박사과정 5년차인 이 연구원은 또 "개인적으로 향후 기회가 닿는다면, 핸드폰에 들어가는 사이즈로 현재 성능을 유지하는 멀티모달 대형언어모델을 만들어 볼 것"이라고 덧붙였다. 노용만 교수는 “연구팀에서 개발한 공개형 멀티모달 대형언어모델이 허깅페이스 일간 화제의 논문(Huggingface Daily Papers)에 추천됐다"며 "SNS 등을 통해 전세계에 점차 알려지는 등 관련분야 발전에 기여할 것"으로 기대했다. 연구에는 논문 제1저자 이병관 박사과정 연구원 외에도 박범찬 석박사통합과정, 김채원 박사과정이 공동 저자로 참여했다. 연구결과는 '콜라보'의 경우 자연어 처리(NLP) 분야 국제 학회 'ACL Findings 2024'(5월16일자)에 게재됐다. '모아이(MoAI)'는 컴퓨터 비전 국제 학회인 'ECCV 2024'에 논문을 제출하고 결과를 기다리고 있다. 한편 이 연구는 KAIST 미래국방 인공지능 특화연구센터 및 전기및전자공학부 지원을 받아 수행했다.

2024.06.20 14:26박희범

"기업 환경에 LLM 특화"…미스트랄AI, 미세조정 SDK 공개

미스트랄AI가 대규모언어모델(LLM)의 성능을 개선하거나 기업에 특화할 수 있도록 기술 지원을 제공한다. 미스트랄은 5일(현지시간) AI모델 미세 조정을 위한 소프트웨어 개발 키트(SDK)인 미스트랄 파인튠(Mistral-Finetune)을 출시했다. 깃허브를 통해 공개된 미스트랄 파인튠는 미스트랄의 AI 모델을 워크스테이션, 서버 및 소규모 데이터 센터 노드 등 다양한 인프라에 최적화할 수 있도록 지원한다. 공개된 내용에 따르면 해당 SDK는 다중 GPU 설정에 최적화되어 있지만 미스트랄 7B와 같은 소형 모델을 미세 조정하기 위해 엔비디아 A100 또는 H100 GPU 단일 모델로 설정을 변경하는 것도 가능하다. 예를 들어 오픈AI의 챗GPT를 사용한 140만 개의 대화 모음인 울트라챗과 같은 데이터 세트를 미세 조정하는 과정은 8개의 H100 GPU를 활용해 약 30분 만에 완료할 수 있다. 보다 효율적인 AI 개발을 위해 '라 플랫폼'과 같은 유로 개발 서비스와 연계한 작업도 가능하다. 라플랫폼을 활용하면 특정 요구 사항에 맞게 모델을 정의하거나 교육하는 API를 호출해효과적으로 AI를 개발할 수 있다. 미스트랄은 몇 주에 걸쳐 미세 조정 서비스에 새로운 모델을 추가할 예정이라고 밝혔다. 이와 함께 미스트랄은 SDK를 효율적으로 활용할 수 있도록 지원하기 위한 교육 서비스를 함께 제공한다. 교육서비스에는 기업의 자체 데이터를 사용해 미스트랄 AI 모델을 미세조정하는 커리큘럼이 포함돼 보다 효율적이고 전문적으로 AI를 활용할 수 있는 방법을 제시한다. 미스트랄 AI 팀은 "우리는 개발자에게 강력한 개방형 생성 모델을 제공하고 이를 효율적으로 사용할 수 있는 방법을 제공한다"고 강조했다.

2024.06.06 15:00남혁우

업스테이지-플리토, 아시아 다국어 AI모델 함께 만든다

업스테이지(대표 김성훈)가 플리토와 함께 일본어, 태국어 등 데이터가 부족한 아시아 지역 대규모 언어모델을 공동 개발한다. 업스테이지는 플리토와 AI 언어 데이터 구축을 위한 업무협력 협약(MOU)를 체결했다고 9일 밝혔다. 현재 빅테크 기업이 주도하는 거대언어모델(LLM) 개발은 영어에 편중돼, 상대적으로 아시아권의 언어는 학습 데이터가 부족한 실정이다. 이에 양사는 ▲ 한국어 언어모델 평가 플랫폼 'Open-Ko LLM 리더보드' 벤치마크 데이터셋 구축 ▲ 다국어 LLM 리더보드 운영 ▲ 저자원 언어 데이터 구축 및 저자원 언어 활용 LLM 현지화 ▲ 기업용 LLM 구축에 따른 데이터 공급 파트너십 강화 등 다양한 분야에서 협력을 강화하기로 했다. 이를 통해 고품질의 저자원 언어 데이터를 확보, 사전학습 LLM 솔라의 지원 언어를 확장해 동남아시아 등 다양한 지역별 언어에 특화된 맞춤형 모델을 개발하겠다는 전략이다. 솔라는 현재 한국어, 영어를 지원하며, 연내 일본어와 태국어까지 지원 언어를 확대할 예정이다. 플리토는 이번 협약을 바탕으로 언어 데이터와 AI 기술 간의 시너지를 통해 언어 모델의 고도화에 적극적으로 기여할 예정이다. 더불어 다국어 병렬 말뭉치 구축 노하우와 저작권 이슈가 없는 텍스트·이미지·음성 데이터셋을 통해 자사 언어 수집 기술 경쟁력을 높인다는 계획이다. 김성훈 업스테이지 대표는 “언어모델로 촉발된 생성형 AI 열풍이 전 세계를 뒤흔들고 있는 상황에서 양질의 언어 데이터 확보는 필수적인 과제”라며 “업스테이지는 이번 플리토와의 협력을 통해 전 세계 더 많은 사람들이 생성형 AI 혁신을 경험할 수 있도록 데이터 고도화에 나설 것”이라고 밝혔다. 이정수 플리토 대표는 "저자원 언어 학습분야는 초거대언어모델 성능의 핵심 요소로 부상했다”며 “양사 협력을 통해 고품질 데이터와 고도화된 기술 간의 접목이 국내 생성형 AI 생태계에 얼마나 긍정적인 기여를 할 수 있는지 보이자고 한다”고 말했다.

2024.05.09 15:15남혁우

[유미's 픽] 삼성도 챗GPT로 기밀 샐까 골머리…'AI 보안' 선두 경쟁 본격화

#. 지난해 5월. 삼성전자는 회사 내부 기기에서 생성형 인공지능(AI) 사용을 금지했다. 삼성전자 반도체(DS) 부문 직원들이 같은 해 3월 소프트웨어 소스코드의 오류를 확인하고 회의 내용을 요약하는 등의 업무를 위해 챗GPT에 소스코드, 회의 내용 등을 입력했다가 문제가 발생했기 때문이다. 이에 삼성전자는 "사내 PC를 통한 생성형 AI 사용을 일시적으로 제한한다"며 "사외에서 챗GPT 등 생성형 AI를 사용하는 경우에도 회사와 관련된 정보, 본인 및 타인의 개인정보 등은 입력하지 않도록 각별히 유의해 달라"고 당부했다. 이처럼 오픈AI '챗GPT', 구글 '제미나이' 같은 생성형 AI를 통한 검색이 최근 활발히 이뤄지며 기밀 정보 유출 우려가 높아진 가운데 기업을 중심으로 '보안'의 중요성이 점차 커지고 있다. 보안이 AI 산업의 한 축이 될 것으로 전망되면서 국내외 업체들도 앞 다퉈 대응에 나선 모양새다. 7일 업계에 따르면 마이크로소프트(MS)는 지난달 1일 '코파일럿 포 시큐리티(Copilot for Security)'를 출시하며 기업 공략에 본격 나섰다. 이 서비스는 IT 및 보안 담당자를 위한 생성형 AI 보안 솔루션으로, 오픈AI GPT-4와 MS 자체 보안 특화 AI 모델을 기반으로 구동된다. MS는 지난해 3월 사이버보안 업계 첫 생성형 AI 보안 서비스라는 이름으로 이 시장에 첫 발을 내딛었다. 당시 이 서비스는 챗봇처럼 위협 요인을 알려주는 구동 방식에 그쳤다. 이번에 나온 '코파일럿 포 시큐리티'는 프롬프트 입력 시 사고 요약, 취약점 분석도 가능하다는 점에서 한 단계 더 진화됐다는 평가다. 이에 맞춰 체크포인트 소프트웨어 테크놀로지스는 보안 작업 필요 시간을 10%로 줄이는 AI 보안 솔루션 '인피니티 AI 코파일럿'을 올해 2월 선보였다. 체크포인트는 MS의 오랜 파트너인 사이버 보안 플랫폼 기업으로, 현재 프리뷰 형태로 이 서비스를 제공 중이다. 2분기에 정식 출시를 앞둔 '인피니티 AI 코파일럿'은 보안 정책을 변경하고 직원 내 담당 권한을 변경하는 작업도 가능한 것이 특징이다. 글로벌 보안 시장을 이끌고 있는 팔로알토 네트웍스는 AI 열풍 이전인 12여년 전부터 사이버 보안에 AI·머신러닝(ML)을 활용해 업계 선구자로 통한다. 최근에는 보안관제 인력난에 대한 해결책으로 '확장된 보안 인텔리전스 자동화 관리(XSIAM)'를 내세워 AI를 통한 보안운영센터(SOC)의 운영 효율을 높이기 위해 애쓰고 있다. 구글도 AI로 보안 강화에 나설 것이란 뜻을 내비쳤다. 순다르 피차이 구글 최고경영자(CEO)는 지난 2월 독일 뮌헨 안보회의에서 "사이버 해커는 시스템을 공격하기 위해 한 번만 성공하면 되지만, 방어자는 시스템을 보호하기 위해 매번 성공해야 한다는 딜레마가 있다"며 "(AI는) 이러한 딜레마를 줄여줄 것"이라고 밝혀 눈길을 끌었다. 국내 업체 역시 AI 기술을 적용해 서비스 경쟁력을 끌어 올리고 있다. 안랩은 현재 연구소 산하에 '인공지능팀'을 두고 머신러닝 기술을 통한 솔루션·서비스 탐지 기능 고도화 작업에 집중하고 있다. 또 AI를 악성코드와 피싱 이메일, 스미싱 문자 등을 탐지하는데도 활용 중이다. 여기에 생성형 AI 기술 개발을 통해 확장된 탐지 및 대응(XDR) 플랫폼 '안랩 XDR'에서 보안 담당자의 업무를 더 끌어올릴 수 있는 'AI 시큐리티 어시스턴트'도 개발 중이다. 업계 관계자는 "보안업체들은 판정형 AI업체의 서비스를 생성형 AI와 결합해 기술을 고도화 하던가, 생성형 AI가 기존에 가지고 있는 보안 문제를 최소화 하는 것에 집중하고 있다"며 "이들이 다양한 방식으로 AI 기술을 활용하는 것은 자연스러운 흐름"이라고 말했다. 일부 기업들은 AI를 활용해 보안 위협을 탐지하는 것에 그치지 않고 기업용 AI 시장에 직접 뛰어들고 있다. 내부 보안 혹은 사이버 위협·악성코드 분석 등 비정형 데이터를 포함한 데이터 분류와 필터링 기술에 강점을 갖고 있다는 점을 앞세워 보다 안전한 맞춤형 AI 서비스를 제공할 수 있다고 강조하고 나섰다. 데이터·애플리케이션 보안 사업에 집중했던 파수는 지난 3월 경량언어모델(sLLM) '엘름(ELLM)'을 출시하며 본격적으로 LLM 시장 경쟁에 나섰다. 구축형(온프레미스)으로 제공되는 엘름은 코딩, 법률, 세무, 금융 등 다양한 직군, 산업 환경에서 활용할 수 있는 것이 특징이다. 또 특정 작업이나 도메인에 맞는 작은 데이터 세트를 활용해 모델을 추가적으로 훈련시킬 수 있다. 이에 기업에선 특정 부서나 조직에서만 사용할 수도 있다. 사이버 위협 인텔리전스(CTI) 기업 S2W도 sLLM 플랫폼 'S-AIP(S2W Artificial Intelligence Platform)'를 내놨다. S-AIP는 각 기업이 가지고 있는 보안 수준에 맞춰 아키텍처를 구현하고, 데이터 보안 기술을 기반으로 기업용 프라이빗 sLLM 구축을 지원할 수 있다. 보안업계에서 떠오르고 있는 샌즈랩도 AI 기반 사이버 보안 사업 영역을 빠르게 고도화하고 있다. 이곳은 지난 2월 기업 내부 인프라에서 직접 운영, 제어가 가능한 온프레미스 sLLM '샌디(SANDY)'를 개발했다. 샌디는 기존에 사람이 직접 했던 보고서 요약·교정, 기업 내 해킹 대응 정보 검색을 대신 수행하며 최신 사이버 위협에 선제 대응할 수 있는 역량도 갖췄다. 이 외에 샌즈랩은 샌디를 기반으로 최근 포티투마루, LG유플러스와 사이버 보안을 강화할 수 있는 LLM 기술을 공동 개발키로 해 주목 받고 있다. 업계 관계자는 "국내 보안기업들이 생성형 AI 시장에 뛰어드는 이유는 데이터 보안·악성코드 분석 등의 분야에서 다년간 축적된 기술력과 노하우가 AI 데이터 학습에 유리하다는 판단 때문"이라며 "정보유출 등에 민감한 기업용 AI 분야에선 강점이 될 수 있을 것"이라고 분석했다. 이어 "보안 시장이 AI처럼 폭발적인 성장 잠재력을 갖추기 어렵다는 점에서 기존 보안 사업과 연계할 경우 AI를 새로운 성장동력으로 삼을 수 있을 것이란 점도 영향을 미친 듯 하다"며 "글로벌 단위에서 아직까지 AI 보안 시장을 이끄는 선두 업체가 마땅히 없다는 것도 매력적인 요소"라고 덧붙였다.

2024.05.07 16:19장유미

GPT-3.5, 스트리트파이터3로 GPT-4 꺾었다

오픈AI의 GPT-3.5 터보가 GPT-4 등 상위 인공지능(AI) 모델을 꺾고 스트리트파이터3 챔피언에 올랐다. 14개 대규모언어모델(LLM)들이 각축을 벌인 스트리트파이터3 게임 대회에서 'GPT-3.5'가 우승을 차지했다고 PC게이머 등 외신들이 최근 보도했다. 보도에 따르면 미국 샌프란시스코에서 개최한 미스트랄 AI SF 해커톤에서 LLM간 이벤트 매치가 열렸다. 비디오게임 스트리트파이터3를 학습해 치러진 이번 대회는 LLM이 실제 업무에서 어떤 성과를 낼 수 있는지 시각적으로 확인할 수 있도록 마련됐다. 단기간에 치러진 대회인 만큼 학습시간을 줄이기 위해 캐릭터는 켄으로 제한됐다. 승부에 참여한 LLM은 화면을 인식할 수 있도록 텍스트 설명이 제공되며 캐릭터와 상대의 동작 그리고 양쪽의 체력바를 학습해 대회가 치러졌다. 오픈AI의 GPT-3.5 및 GPT-4과 다양한 버전의 미스트랄 LLM 등 총 14종의 LLM이 경합을 벌인 결과 GPT-3.5 터보버전이 최종 우승을 차지했다. 이어서 미스트랄 스몰 파이널버전이 뒤를 이었다. 기본 성능이 더 높은 GPT-4와 미스트랄 AI 상위 모델이 오히려 하위권을 기록해 눈길을 끌기도 했다. 이에 대해 미스트랄 AI의 운영진은 각 AI가 갖는 특성이 게임에 영향을 미쳤다고 설명했다. 모델의 크기가 작으면 대기 시간과 속도에 이점을 가질 수 있는 만큼 게임에서 유리해질 가능성이 크다는 설명이다.

2024.04.08 14:11남혁우

"더 똑똑한 '시리' 만든다"…애플, 소형 언어모델 '렘' 출시

애플이 아이폰 음성모델 '시리'를 더 똑똑하게 만들기 위해 소형언어모델(SLM)을 출시했다. 시리가 사용자 요구사항과 문맥을 더 정확히 이해할 수 있도록 도울 수 있다. 2일(현지시간) 미국 지디넷 등 IT 외신은 애플이 아이폰 내 시리가 사용자 문맥을 정확히 이해하고 요구사항을 맞춤형으로 수행하는 데 활용할 SLM '렘(ReALM)'을 출시했다고 보도했다. 이 모델은 온디바이스AI에 특화된 형태다. 시리가 사용자 대화 내용을 기존보다 더 오래 기억하고, 아이폰 화면에 표시된 내용을 이해할 수 있도록 도울 수 있다. 재생 중인 음악 등까지 인식할 수 있어서 사용자 취향에 따른 답변과 검색도 향상시킬 수 있다. 해당 모델은 파라미터 규모에 따라 'ReALM-80M' 'ReALM-250M' 'ReALM-1B' 'ReALM-3B'로 총 네가지 유형으로 이뤄졌다. 애플 AI연구팀은 "해당 모델들은 기존 거대언어모델(LLM)보다 파라미터는 작지만 특정 업무 수행에선 더 높은 성능을 보인다"고 밝혔다. 연구팀은 해당 모델을 오픈AI GPT-3.5와 GPT-4와 비교하는 테스트를 진행했다. 벤치마킹 테스트 결과 특정 작업에서 자사 모델이 오픈AI의 모델 성능을 뛰어넘었다는 평가다. 연구진은 "파라미터가 가장 작은 모델은 GPT-4와 비슷한 성능을 달성했다"며 "가장 큰 모델은 GPT-4보다 특정 작업에서 더 뛰어난 성능을 보였다"고 설명했다. 또 "렘이 GPT보다 적은 수의 파라미터로 구성됐음에도 최신 LLM과 비슷한 수준의 성능을 보인 셈"이라고 덧붙였다. GPT-3.5는 1천750억 매개변수로 이뤄졌다. GPT-4는 약 1조5천억개 매개변수가 있는 것으로 알려졌다. 일각에선 이 모델이 오는 6월 열릴 애플세계개발자회의(WWDC) 2024에서 소개할 iOS18 버전에 탑재될 것으로 보고 있지만, 확실한 적용 시기는 미정이다. 애플조차 해당 모델이 최신 버전이나 기기에 탑재할 여부에 대해 밝히지 않았다. 최근 스마트폰 시장에선 생성형 AI가 핵심 기능으로 떠오르고 있는 분위기지만 애플은 아이폰에 생성형 AI 탑재 등에 대한 뚜렷한 청사진을 제시하지 않았다. 일각에선 아이폰 혁신이 사라지고 있다고 평가하기 시작했다. 이에 애플은 10년 동안 공들인 애플카 프로젝트를 중단하고 생성형 AI 기능에 주력하기로 했다. 지난달 구글, 바이두, 앤트로픽 등에 도움을 요청한 것으로 전해졌다.

2024.04.03 09:02김미정

메타, '라마3' 전용 AI인프라 공개...GPU만 4만9천개

메타가 차기 대규모언어모델(LLM) '라마 3' 학습을 위한 세계 최대 규모의 컴퓨팅 인프라를 공개했다. 최근 실리콘 앵글 등 외신에 따르면 메타는 AI학습을 위한 데이터센터급의 24K GPU 클러스터 한 쌍의 세부정보를 공식 블로그를 통해 공개했다. 여러 그래픽처리장치(GPU)를 네트워크로 연결해 병렬 컴퓨팅 작업을 수행하는 시스템이다. 기계학습, 대규모 시뮬레이션 등 대규모 계산 작업을 더 빠르게 처리하기 위해 활용된다. 메타에서 공개한 24K GPU 클러스터는 2022년 선보인 리서치슈퍼클러스터(RSC)의 후속모델이다. 이름처럼 2개의 클러스터에 각 2만4천576개의 엔비디아 텐서 코어 H100(이하 H100) GPU가 적용된 것이 특징으로 총 4만9천 개 이상의 H100 CPU를 활용할 수 있다. 이번 발표는 일반인공지능(AGI) 연구를 위해 대규모 인프라 구축 계획의 일환이다. 메타는 2024년 말까지 35만 개의 H100 GPU를 포함한 AI 인프라를 확장할 계획이다. 이를 통해 기존에 확보한 인프라를 포함해 60만 개의 H100 GPU 수준의 컴퓨팅 파워를 갖추는 것을 목표로 한다. 두 클러스터는 GPU 수가 동일하며 개방형 GPU 하드웨어 플랫폼 '그랜드 티톤(Grand Teton)'을 사용해 구축됐다. 하지만 네트워크 인프라 설계에 차이가 있다. 하나는 웻지 400 및 미니팩 2 OCP 랙 스위치와 아리스타 7800를 기반으로 자체 개발한 RDMA 오버 컨버지드 이더넷(RoCE) 솔수션을 적용했다. 두 번째 클러스터는 엔비디아의 퀀텀2 인피니밴드 패브릭 솔루션이 적용됐다. 두 클러스터의 구조를 다르게 한 이유는 향후 더 크고 확장된 클러스터 구축을 목표로 하기 때문이다. 두 클러스터에서 다양한 분야의 AI를 학습하며 어떤 구조와 설계 방식이 AI에 적합한지 데이터를 확보해 이후 적용하겠다는 비전이다. 저장장치도 해머스케이프와 협력해 자체 개발했다. 생성형 AI 훈련 작업이 점점 빨라지고 규모가 커지는 것에 대비해 고성능이면서도 수만개의 GPU에서 동시 작업하는 데이터를 감당할 수 있도록 E1.S SSD를 활용했다. 이와 함께 구글은 개방형 AI 생태계 활성화를 위해 AI 소프트웨어 프레임워크인 파이토치를 지속해서 지원할 것이라고 강조했다. 케빈 리 등 구글 연구원은 “지난 2015년 빅서 플랫폼을 시작으로 GPU 하드웨어 플랫폼을 설계를 공개하고 있다”며 “우리는 이런 정보 공유가 업계의 문제 해결을 돕는데 도움이 될 것이라고 믿고 있다”고 이번 GPU 클러스터 관련 내용을 공개한 이유를 밝혔다. 이어서 “우리의 AI 노력은 개방형 과학과 교차 협력의 철학을 바탕으로 구축됐다”며 “개방형 생태계는 AI 개발에 투명성, 정밀성, 신뢰를 제공하고 안전과 책임을 최우선으로 하여 모든 사람이 혜택을 누릴 수 있는 혁신을 이끌어낼 것”이라고 강조했다.

2024.03.17 13:07남혁우

솔트룩스 AI 루시아, 오픈 LLM 리더보드 35B 이하 모델 기준 '1위' 수성

세계 언어모델들을 평가하는 허깅페이스(Hugging Face)의 오픈 LLM 리더보드(Open LLM Leaderboard)에서 국내 스타트업이 1위를 차지하며 기술력을 입증했다. 인공지능(AI) 기업 솔트룩스는 오픈 LLM 리더보드에서 자체 개발 초거대 언어모델 루시아(LUXIA)로 전 세계 1위를 달성했다고 15일 밝혔다. 루시아의 이번 성과는 35B 이하 언어모델들 사이에서 확보한 순위다. 평균 점수는 약 77.74점이다. 전체 초거대 모델들을 기준으로도 피라미터 50B 이상의 대규모 모델들을 제치고 전 세계 4위를 달성했다. 특히 '상식능력(HellaSwag)'과 '추론능력(ARC)' 테스트 점수는 각각 91.88점, 77.47점을 최초로 받으며 기존 기록을 경신했다. 솔트룩스 관계자는 "자체 연례 행사인 올해 솔트룩스 AI 컨퍼런스에서 현재의 루시아를 압도적으로 뛰어넘는 혁신적인 LLM을 공식적으로 선보일 것"이라며 "국내 대표 인공지능 기업으로서 글로벌 AI 시장을 선점할 초격자 경쟁력을 계속해서 확보해 나가겠다"고 말했다.

2024.03.15 16:10이한얼

에스넷시스템, 코난테크놀로지와 자체 LLM 구축 전망

에스넷시스템(대표 유홍준, 장병강)이 협력을 통해 자체 LLM을 구축할 전망이다. 에스넷시스템은 코난테크놀로지(이하 코난)와 AI 관련 사업 협력을 위한 업무협약(MOU)을 체결했다고 15일 밝혔다. 이번 업무협약은 AI 시스템 구축 및 AI 솔루션 공동개발을 통해 상호 시너지를 창출하고 사업 성장 동력을 확보하기 위함이다. ▲AI 솔루션 상호 협력 ▲AI 인프라 부문 공급, 설치 및 기술지원 ▲AI 플랫폼, 솔루션 부문 지원을 주요 골자로 하고 있다. 에스넷시스템이 AI 인프라, GPU 클라우드 서비스 그리고 아마존웹서비스(AWS), 삼성 클라우드 플랫폼(SCP) 등 클라우드 관련 부문을 지원하고, 코난테크놀로지가 대규모 언어 모델(LLM), 생성형 AI 등의 AI 솔루션 부문을 지원한다. 에스넷시스템은 AI 에너지 최적화 솔루션과 코난LLM을 대표적으로 코난테크놀로지의 생성형 AI솔루션과 함께 협업할 예정이다. 양사의 솔루션 협업을 통해 새로운 부가가치를 만드는 솔루션을 개발하겠다는 방침이다. AI 인프라 부문 지원을 위해 GPU 서버 및 클라우드, GPU 네트워크 뿐만 아니라 테스트 및 PoC용(기술검증용) GPU 서버까지 아우르는 공급, 설치 및 기술지원을 제공할 계획이다. AI 플랫폼, 솔루션 부문도 지원한다. 구체적으로 AI 인프라 운영 관리 플랫폼과 어플리케이션 개발 플랫폼을 제공할 예정이다. 유홍준 에스넷시스템 대표는 “에스넷시스템이 AI사업을 지속 강화해 나가는 과정에서 인공지능 소프트웨어 전문기업인 코난테크놀로지와 업무 추진하게 되어 뜻깊게 생각한다”며 “이번 협약을 통해 도출된 역량을 활용하여 경쟁력 있는 AI 인프라 및 솔루션 서비스를 선도할 예정”이라고 말했다. 김영섬 코난테크놀로지 대표는 “IT산업을 선도하는 에스넷시스템과 AI 관련 사업을 함께하게 되어 기쁘다”며 “코난테크놀로지가 가지고 있는 AI 기술과 역량을 기반으로 에스넷시스템과 긴밀히 협력하여 앞으로는 AI 시장에서 유의미한 성과를 도출할 수 있도록 노력하겠다”고 밝혔다.

2024.03.15 11:22남혁우

스노우플레이크, 미스트랄AI와 협력…'미스트랄 라지' 모델 제공

스노우플레이크는 최근 프랑스 AI 솔루션 제공업체 미스트랄AI와 파트너십을 체결했다고 11일 일 발표했다. 이 파트너십은 스노우플레이크 산하 벤처 캐피탈인 스노우플레이크 벤처스의 미스트랄AI의 시리즈 A 투자를 포함한다. 양사의 협력으로 스노우플레이크 고객은 미스트랄AI가 가장 최근에 선보인 플래그십 대규모 언어 모델(LLM)인 '미스트랄 라지'를 스노우플레이크 데이터 클라우드 플랫폼에서 적용할 수 있다. 미스트랄AI의 기본 모델인 '미스트랄 7B'와 오픈 소스 모델 '믹스트랄8x7B'에도 액세스할 수 있다. '미스트랄 라지'는 고유한 추론 능력을 갖춘 LLM 모델로 코딩과 수학에 능숙하고 한번의 요청으로 수백 페이지에 달하는 문서를 처리할 수 있다. 프랑스어, 영어, 독일어, 스페인어, 이탈리아어, 5개 언어 처리가 가능하다. 기존 생성형 AI 모델과 '대규모 다중 작업 언어 이해 측정(MMLU)' 비교함에서 뛰어난 성능을 입증하며 챗GPT-4에 이어 API를 통해 사용 가능한 모델 중 2위를 차지하기도 했다. '미스트랄 7B'는 낮은 지연 시간과 메모리 요구사항에 비해 높은 처리량을 갖춘 것이 특징이다. '믹스트랄 8x7B'는 대부분의 성능 비교에서 챗GPT3.5보다 빠르고 품질이 우수한 것으로 나타났다. 미스트랄AI의 모델들은 '스노우플레이크 코텍스'에서 프리뷰 공개 형태로 고객에게 제공된다. 스노우플레이크 코텍스는 스노우플레이크 플랫폼에서 생성형 AI를 활용할 수 있는 완전 관리형 LLM 및 벡터 검색 서비스이다. AI/ML 기술 없이도 쉽고 강화된 보안 환경에서 생성형 AI를 활용할 수 있는 서비스로, 기업 고객은 데이터에 대한 보안, 개인 정보 보호 및 거버넌스는 유지하면서 데이터를 빠른 속도로 분석하고 AI 앱을 구축할 수 있다. 스노우플레이크 지난해 감정 분석, 번역, 요약과 같은 특수 작업을 위한 LLM을 지원하는 코텍스를 처음 공개했다. 또한, 메타 '라마2' 모델을 시작으로 검색증강생성(RAG)을 포함한 기본 LLM 지원을 늘리고 있다. 스노우플레이크는 미스트랄AI와의 파트너십을 통해 생성형 AI에 대한 투자를 이어가면서, 기본형 LLM을 스노우플레이크 코텍스에서 제공해 기업이 다방면 비즈니스에 최첨단 생성형 AI를 도입할 수 있도록 지원하고 있다. 복잡한 GPU 관리 대신 사용자의 AI 활용도를 넓히기 위해 엔비디아와 적극적으로 협력하고 있다. 스노우플레이크 코텍스는 엔비디아 트라이튼 추론 서버를 활용해 풀스택 가속 컴퓨팅 플랫폼을 제공하고 있다. 스노우플레이크 코텍스 LLM 기능이 공개 프리뷰되며 스노우플레이크 기업 고객은 기업 고유의 데이터를 바탕으로 다양하게 AI를 활용할 수 있게 됐다. SQL 기술을 갖춘 사용자라면 누구나 수 초 내에 감정 분석, 번역, 요약과 같은 특수 작업을 비용 효율적으로 진행할 수 있다. 파이썬 개발자라면 스노우플레이크 코텍스에서 제공하는 미스트랄AI의 LLM은 물론, 곧 공개될 스노우플레이크 스트림릿의 대화형 기능을 통해 수 분 내에 챗봇과 같은 풀스택 AI 앱을 개발할 수 있게 된다. 간편해진 경험과 높은 수준의 보안은 역시 곧 공개될 스노우플레이크의 통합 벡터 기능과 벡터 데이터 유형을 통해 RAG에도 동일하게 적용될 예정이다. 슈리다 라마스워미 스노우플레이크 신임 CEO는 “스노우플레이크는 미스트랄AI와의 파트너십을 통해 최정상급 성능의 LLM을 고객에게 직접 제공하고, 사용자는 간편하면서도 혁신적인 AI 앱을 구축할 수 있게 됐다”며 “스노우플레이크 코텍스를 통해 더 많은 기업이 데이터 클라우드의 보안과 개인 정보 보호는 강화하고 새롭고 경제적인 AI 사용 사례를 만들어 내기를 바란다”고 밝혔다. 아르튀르 멘슈 미스트랄AI 공동창립자 겸 CEO 는 “스노우플레이크의 보안, 개인 정보 보호 및 거버넌스에 대한 원칙은 누구나 어디에서든 혁신적인 AI를 활용할 수 있도록 하겠다는 미스트랄AI의 포부와 맞아떨어진다”며 “미스트랄AI는 전세계적으로 기업이 생성형 AI 활용에 더 가까워지도록 고성능, 고효율에 신뢰할 수 있는 AI 모델을 개발하겠다는 스노우플레이크의 목표에 공감한다”고 강조했다. 그는 “스노우플레이크 데이터 클라우드에서 미스트랄AI의 모델을 활용함으로써, 고객이 민주화된 AI를 경험하고 더 큰 가치를 창출하는 고도화된 AI 앱을 생성할 수 있기를 기대한다”고 덧붙였다. 스노우플레이크는 고객, 데이터 클라우드 생태계는 물론, 기술 커뮤니티 전체에 대한 AI 혁신을 위해 노력하고 있다. 이에 스노우플레이크는 최근 개발자, 연구원 및 조직이 개방적이고 안전하며 책임감 있는 AI를 개발하기 위한 국제 커뮤니티인 'AI 얼라이언스'에 가입했다. AI 얼라이언스를 통해 스노우플레이크는 생성형 AI가 가져올 도전과제와 기회에 대해 전방위적이고 개방적으로 대응하며 누구나 AI 기술을 활용하고 혜택을 얻을 수 있도록 지속적으로 노력할 계획이다.

2024.03.11 10:52김우용

kt클라우드, LLM으로 AI디지털교과서 맞춤형 교육 구현

kt클라우드(대표 황태현)가 AI디지털교과서에 학습분석 및 개인별 맞춤형 교육을 구현한다. kt클라우드는 스마트앤와이즈와 'AI기반 학습분석 플랫폼'을 선보인다고 8일 밝혔다. 양사는 지난 해 AI디지털교과서 사업을 위한 업무협약을 맺고, AI디지털교과서 구축에 필요한 AI학습분석 제공 플랫폼을 공동 개발했다. AI디지털교과서는 AI기반 학습 데이터를 수집∙분석하고, AI보조교사와 실시간으로 상호작용하며 학생별로 맞춤화된 교육을 제공하는 것이 핵심이다. 현재 다양한 에듀테크 기업에서 각자의 노하우를 바탕으로 학습 플랫폼을 개발하고 있지만, 대부분 AI기반이 아닌 단순 규칙에 따라 한정적으로 반응하는 룰베이스 방식을 활용하고 있다. kt클라우드는 스마트앤와이즈의 교육 전용 대규모언어모델(LLM) 및 플랫폼 개발을 위해 AI클라우드 인프라를 지원한다. kt클라우드의 AI 인프라는 LLM 학습, 개발에 있어 동적할당 기반의 이용료 과금, 대규모 클러스터링 지원 GPU 인프라를 제공한다. 향후 AI디지털교과서 사업이 확대되면서 늘어날 AI 인프라에 대비해 kt클라우드는 NPU 기반 인프라 공급도 적극 검토하고 있다. 발행사 및 에듀테크 기업은 NPU 이용으로 AI 인프라 이용 부담이 줄어들 전망이다. 스마트앤와이즈는 오랜 경험과 노하우가 축적된 교수학습플랫폼을 통해 교육 LLM을 개발했고, 이를 기반으로 학습자의 성향 및 과제 수행 정보를 분석하여 맞춤형 학습 전략을 제시하는 루츠(Roots) 플랫폼을 선보였다. 실제 교육현장 안착 및 확산을 위해 대구교육대학교와 시범 사업을 진행 중이며 연내 클라우드 보안인증(CSAP) 획득을 추진할 예정이다. 2023년 과학기술정보통신부와 한국지능정보사회진흥원이 주관한 'K-클라우드' 프로젝트에도 선정된 바 있다. 국정원은 '챗GPT 등 생성형 AI 활용 보안 가이드라인에 따라 발행사 및 에듀테크의 오픈AI 이용을 제한하고 있다. 또한 공공 교육에서는 ▲선행학습 ▲할루시네이션(허위정보) 등의 문제로, 객관적으로 검증할 수 있고 제어가능한 교육LLM의 이용이 필수적이다. 스마트앤와이즈 이민주 연구소장은 “CSAP 인증 획득을 통해 공공분야에 AI디지털교과서 제공을 위한 적격성 확보와 발행사의 콘텐츠 기반으로 특화된 교육 LLM을 구축∙제공할 수 있게 될 것”이라고 말하며 “이를 통해 공공분야 오픈 AI이용 제한과 학교 교육에서 엄격히 제한하고 있는 선행학습, 할루시네이션(허위정보) 등의 이슈를 해소할 것”이라고 강조했다. kt클라우드 남충범 본부장은 “다양한 발행사∙에듀테크에게 AI 인프라를 제공하여 사업자들의 이용 부담을 줄이고 효율적인 학습 플랫폼 개발을 적극 지원하겠다”고 말했다. 이어 “특히 AI디지털교과서 사업 및 생태계 활성화를 이끄는 선도 사업자로 앞장서겠다”며 다짐했다.

2024.03.08 10:29남혁우

ETRI, 절차 생성 AI 벤치마크 기술 첫 개발

대형언어모델(LLM)을 기반으로 만들어진 절차 성능을 자동 평가하는 기술이 세계 처음 개발했다. 한국전자통신연구원(ETRI)은 사람이 말로 작업을 명령하면 스스로 작업 절차를 이해하고 계획을 수립해 수행하는 절차 생성 인공지능(AI)의 성능을 자동 평가할 수 있는 로타벤치마크(LoTa-Bench) 기술을 개발했다고 7일 밝혔다. 기존에는 절차 이해 성능 평가를 자동으로 할 수 있는 벤치마크 기술이 없어서 사람이 직접 평가함으로써 손이 많이 갈 수밖에 없었다. 구글 세이캔(SayCan)을 비롯한 기존 연구에서는 여러 사람이 직접 작업 수행 결과를 관찰하고 성공 실패 여부를 투표하는 방법을 채택했다. 이는 성능 평가에 매우 긴 시간과 노력이 들어 번거로울 뿐 아니라 평가 결과에 주관적 판단이 개입하는 문제가 있다. 반면 ETRI가 개발한 로타벤치마크 기술은 사용자의 명령에 따라 대형언어모델이 생성한 작업 절차를 실행하고, 결과가 지시한 목표와 같은지 자동으로 비교해 성공 여부를 판단한다. 평가 시간과 비용을 최소화할 수 있고, 결과가 객관적인 이유다. 연구진은 알프레드(ALFRED) 기반 벤치마크 결과, 오픈AI(OpenAI)의 GPT-3는 21.36%, GPT-4는 40.38%, 메타(Meta)의 라마2(LLaMA 2)-70B 모델은 18.27%, 모자이크엠엘(MosaicML)의 MPT-30B 모델은 18.75% 성공률을 보였다고 밝혔다. 규모가 클수록 절차 생성 능력도 우수했다. 성공률이 20%면 100개의 절차 중 20개를 성공한 셈이다. 성능 평가는 로봇과 체화 에이전트 지능의 연구개발 목적으로 개발된 미국 알렌인공지능연구소(AI2-THOR)와 미국 MIT(버츄얼홈, VirtualHome) 가상 시뮬레이션 환경에서 이뤄졌다. “전자레인지에 차갑게 식힌 사과를 넣어라.”라는 일상적인 가사 작업 지시 명령을 내리고 각 작업 절차를 포함하는 데이터셋으로 평가했다. 또한, 연구진은 새로운 절차 생성 방법을 쉽고 빠르게 검증할 수 있는 로타벤치마크 기술의 이점을 활용해 데이터를 통한 훈련으로 절차 생성 성능을 개선할 수 있는 두 가지 전략도 발견했다. 컨텍스트 내 예제 선별법(In-Context Example Selection)과 피드백 기반 재계획(Feedback and Replanning)이다. 이와함께 파인튜닝을 통한 절차 생성 성능 개선 효과도 확인했다. 소프트웨어 오픈소스로 공개 기업·학교 활용 가능 연구진은 이 기술 개발로 대형언어모델을 이용한 로봇 작업계획 기술의 성능평가 시간과 비용을 대폭 줄일 수 있을 것으로 전망했다. 연구진은 또 관련 소프트웨어를 오픈소스로 공개했다. 기업, 학교 등에서 이 기술을 자유롭게 활용할 수 있다. 최근 대형언어모델은 언어처리, 대화, 수학 문제 풀이, 논리 증명 외에 사람 명령을 이해해 하위 작업을 스스로 선택하고 순서대로 수행해 목표를 달성하는 절차 이해 영역에서도 우수한 성능을 나타내고 있다. 이에 따라 대형언어모델을 로봇 응용과 서비스 구현에 적용하려는 시도가 폭넓게 이뤄지고 있다. 연구진은 국제 인공지능 학술대회인 표현학습국제학회(ICLR)에 논문을 발표하고, 이 기술을 이용한 대형언어모델 총 33종의 절차 생성 성능 평가 결과를 깃허브를 통해 공개했다. 장민수 소셜로보틱스연구실 책임연구원은 “로타벤치마크는 절차 생성 AI 개발의 첫걸음”이라며 “향후 불확실한 상황에서 작업 실패를 예측하거나 사람에게 질문하며 도움을 받아 작업 생성 지능을 지속 개선하는 기술을 개발할 계획”이라고 말했다. 장 책임연구원은 또 “1가구 1로봇 생활 시대의 구현을 위해서는 이 기술이 반드시 필요하다”고 덧붙였다. 김재홍 소셜로보틱스연구실장은 “ETRI는 실세계에서 각종 임무 계획을 생성하고 실행할 수 있는 로봇을 실현하기 위해 파운데이션 모델을 활용한 로봇 지능 고도화 연구개발에 매진하고 있다”고 밝혔다. 이 기술은 과학기술정보통신부와 정보통신기획평가원(IITP)의 “사람중심 인공지능 핵심원천기술 개발 사업”의 일환으로 '스스로 불확실성을 자각하며 질문하면서 성장하는 에이전트 기술 개발' 과제를 통해 수행됐다.

2024.03.07 10:55박희범

샌즈랩-포티투마루-LG U+, 정보유출 위험 없는 보안LLM 구축

샌즈랩(대표 김기홍)이 정보 유출 위험이 없는 사이버 보안 분야 대규모언어모델(LLM)구축에 나선다. 샌즈랩은 포티투마루, LG유플러스와 사이버 보안 강화를 위한 대규모언어모델(이하 LLM) 기술을 공동 개발한다고 4일 밝혔다. LG유플러스 마곡 사옥에서 진행된 업무 협약식에는 LG유플러스 한영섭 AI기술담당, 포티투마루 김동환 대표, 샌즈랩 김기홍 대표 등이 참석했다. 3사는 이번 협약을 통해 사이버 보안 핵심 4대 분야인 ▲보안 관제 ▲위협 인텔리전스 ▲이상 징후 분석 ▲취약점 식별 등에 특화된 LLM을 구축하고 LLM 배포 체계를 만들기로 했다. 이 체계가 상용화되면 기업들은 LLM을 기업 내부에서 활용하며, 정보 유출 위험을 막을 수 있다. 샌즈랩은 이번협약으로 정보 유출 위험이 없는 사이버 보안 분야 LLM 상용화에 도움이 될 것으로 기대하고 있다. 사이버보안 분야 및 사이버 범죄에 대응할 인공지능(이하 AI) 기술 공동 개발을 통해 관련 사업분야에서 시너지 효과를 기대하고 있다. LG유플러스는 LLM 개발과 고객 정보 보호 안전망 구축 역할을 담당하며, 포티투마루는 사이버 보안 및 범죄 예방에 특화된 LLM 모델링 및 검색증강생성(RAG) 등의 원천 기술 개발, 샌즈랩은 기업 내부 인프라에서 운영 가능한 데이터셋 개발 역량을 제공한다. 샌즈랩은 생성형 AI 기술과 인공지능 모델 학습용 데이터셋을 자사 전반의 보안 서비스와 솔루션에 적용하고 있는 AI 보안기업이다. 전문적인 위협 인텔리전스 분야 서비스를 자연어 형태로 손쉽게 활용할 수 있도록 한 'CTX for GPT'의 GPT 스토어 출시를 비롯해 기업 내부 인프라에서 운영할 수 있는 사이버보안 전문 소형언어모델(sLLM) 'SANDY'를 개발했다. 포티투마루는 기업이 LLM을 도입 시 발생되는 환각, 보안, 비용 문제를 극복하기 위한 전문 산업 분야별 도메인 특화 언어 모델인 'LLM42'를 개발하고 있다. 딥러닝 기반 인공지능 독해 솔루션(MRC42), 검색 증강 생성 솔루션(RAG42) 등을 통해 답변의 신뢰성을 제고하고, 기업 내부 데이터나 고객 정보가 유출되지 않도록 기업용 프라이빗 모드를 지원하며, 경량화 버전의 상용 실현을 통해 초거대 AI 도입 및 운영 비용을 절감할 수 있도록 돕는다. LG유플러스는 LG AI 연구원과 협업해 대규모언어모델(LLM) '익시젠(ixi-GEN)'을 출시할 예정이다. 상반기엔 챗봇의 진화 형태인 'AI 에이전트'를 선보인다. AI 기술을 활용해 차별적 고객 가치를 제공하고 신성장 동력을 만들어 디지털 혁신(DX) 역량을 강화한다는 복안이다. 샌즈랩 김기홍 대표는 “사이버 보안과 AI 기술에 강점을 가진 분야별 전문 기업들의 융합으로 시너지 효과가 극대화될 것”이라며 “샌즈랩만의 데이터셋과 보안 기술력에 포티투마루와 LG유플러스의 고도화된 AI 기술을 결합해 혁신적인 AI 보안 환경을 조성하겠다”고 말했다. 포티투마루 김동환 대표는 “LLM 모델을 활용해 각종 사이버 범죄에 선제적으로 대응할 수 있을 것”이라며 “이번 협력을 통해 국내 보안 기술 수준을 높일 수 있을 것으로 기대한다”고 밝혔다. LG유플러스 한영섭 AI 기술담당은 “LG 유플러스는 이번 협력을 통해 샌즈랩의 보안 기술력과 포티투마루의 AI 기술을 결합하여 사이버 위협으로부터 고객들의 정보를 보호하는 안전망을 구축할 것“이라며, “특히, 고객들의 정보 보호를 최우선으로 하며 사이버 위협에 대하여 보다 안전한 디지털 환경을 조성하겠다”고 말했다.

2024.03.04 16:01남혁우

S2W, 기업용 AI 플랫폼 'S-AIP' 소개 행사 개최

데이터 기업 S2W가 기업용 sLLM 인공지능(AI) 플랫폼 에스에이아이피(S-AIP)를 출시한다. S2W는 S-AIP를 소개하는 행사를 3월 13일 코엑스에서 개최한다고 28일 밝혔다. 이번 행사에서 S2W는 S-AIP의 차별점과 산업에서 실제 활용 사례를 제시할 예정이다. S-AIP의 강점은 제로트러스트 관점에서 설계돼 보안성이 보장되며 다년간의 빅데이터 분석을 통해 실전에서 검증된 안정성과 성능을 보여준다는 점이다. S2W는 사이버 공간의 빅데이터를 AI로 분석하는 전문 기업이다. 지난해 S2W는 한국과학기술원(KAIST)와 공동 연구를 통해 다크웹 빅데이터 분석에 인공지능을 접목한 다크웹 전용 언어모델 다크버트(DarkBERT)를 국제학술지(ACL)에 세계 최초로 공개한 바 있다.

2024.02.28 16:46이한얼

올거나이즈-마키나락스, 금융권 LLM 인프라 최적화 전략 제시

올거나이즈(대표 이창수)가 금융업 실무자들이 LLM 솔루션을 업무에 쉽고 빠르게 적용할 수 있도록 금융권 인공지능(AI) 도입 핵심 사례와 활용 노하우를 공개한다. 올거나이즈는 마키나락스와 '알짜 기업이 쓰는 진짜 AI-금융권 LLM+AI 인프라 최적화 전략'을 주제로 세미나를 개최한다고 27일 밝혔다. 지난 1월 진행된 동명 세미나의 후속으로 진행되는 이번 세미나는 금융권 기업의 AI 실제 도입 사례를 보다 풍부하게 소개할 예정이다. 다음 달 5일 오후 6시부터 9시까지 서울 역삼동에 위치한 창업지원센터인 마루180의 이벤트홀에서 진행된다. 마키나락스의 신민석 이사가 '금융기업의 AI 자원 최적화: 하이브리드 AI 플랫폼의 구축과 운영 전략'을 주제로 강연을 시작한다. 비용 효율성, 운영의 민첩성, 유연성 측면에서 하이브리드 AI 플랫폼의 구축 및 운영 전략을 살펴본다. 금융 분야에서 AI를 활용해 비즈니스 가치를 극대화하고, 규제 준수 요건을 충족하면서도 기술적 유연성을 유지하는 전략을 공유한다. 올거나이즈의 이창수 대표는 '금융권 생성형 AI 프로젝트 성공을 위한 베스트 프랙티스'를 주제로 강연을 진행한다. 금융권 고객들과 실제 협업했던 사례를 중심으로, 금융권에서 첫 번째 생성형 AI 프로젝트를 시작할 때 내부에서 어떤 데이터를 준비하고 어떻게 팀을 꾸려 대응해야 하는지, AI 내재화와 고도화를 위해 지금 바로 사용할 수 있는 생성형 AI 애플리케이션은 어떤 것들이 있는지 등을 설명한다. 패널토론 및 질의응답은 총 1시간 진행된다. 실사례 위주로 진행되는 세미나인 만큼, 강연자 외에도 실제 금융권 AI 도입 프로젝트를 이끌었던 담당자들이 패널로 참여해 실무자들의 궁금증을 해소할 예정이다. 사례의 구체적인 내용에 대한 현장 질문도 가능하다. 올거나이즈에서 실제 금융권 AI 프로젝트를 진행중인 유태하 PM과 이창수 대표가 30분간 토론 및 질의응답을 진행한다. 금융권에서 AI를 도입할 때의 주의점, AI 프로젝트를 효율적으로 운영하고 관리하며 생산성을 혁신할 수 있는 방법 등을 중점으로 이야기 나눌 예정이다. 이어 마키나락스의 신민석 이사와 허영신 CBO가 금융권의 AI 인프라 및 플랫폼 구축에 대한 실제 사례와 장기적으로 비용 및 운영 측면에서 고려해야 할 사항 등에 대해 토론한다. 올거나이즈는 4월 4일 SK텔레콤, 마이크로소프트와 함께 '금융 AI 도입의 핵심 사례'를 주제로 세미나를 개최할 예정이다. 서울 중구에 위치한 SKT 타워에서 오후 3시부터 6시까지 진행된다. 올거나이즈의 이창수 대표는 "2024년은 4대 은행그룹 회장, 은행장들이 2024년 조직 개편과 신년사를 통해 AI 활용 확대를 선언할 정도로 금융업 전반에서 생성형 AI를 적용한 서비스가 확대되는 해"라며, "양사가 금융권 고객 기업과 실제 프로젝트를 진행하며 경험한 노하우를 벤치마킹할 수 있을 것"이라고 밝혔다.

2024.02.27 08:57남혁우

[MWC]유영상 SKT "AI로 시장 판도 바꾸겠다"

“우리는 항상 글로벌에 대한 갈망과 피해의식이 있었다. 통신을 포함해 한국 서비스 기업이 글로벌 스케일을 가진 적이 많지 않다. 제조업은 글로벌 활약이 두드러지는데, 서비스는 왜 글로벌 강자가 탄생하지 못할까 자책도 해봤다.” 유영상 SK텔레콤 사장은 26일(현지시간) 스페인 바르셀로나에서 개막한 MWC24 현장에서 '글로벌 텔코 AI 얼라이언스(GTAA)'에 모인 회사들이 AI 합작법인을 추진키로 한 이유를 묻자 이같이 말했다. 기존과 같은 사업 운영으로는 ICT 시장의 주도권을 되찾기 어려웠지만, 글로벌 통신사들과 AI 협력으로 판도를 바꿀 자신감을 얻게 됐다는 것이다. 이날 SK텔레콤은 도이치텔레콤, 이앤(e&)그룹, 싱텔그룹, 소프트뱅크와 함께 AI 거대언어모델(LLM) 공동 개발과 사업 협력을 수행할 합작법인을 공동으로 설립하기로 했다. AI 언어모델 개발에 SK텔레콤과 뜻을 모은 회사들은 각각 유럽, 중동, 동남아 지역에서 통신사업을 주도하는 회사들이다. 또 소프트뱅크는 혁신 투자에 뛰어난 회사다. "AI 시대 리더십 위해 모였다" 유 사장은 여러 통신사들이 뜻을 모은 과정을 두고 “함께 하는 회사들과 비교하면 (SK텔레콤은) 가입자도 제일 적고 시총도 가장 작은 수준이다”며 “글로벌 강자가 되기 위해서는 동맹 체계를 우선 구축해야 했고, 이들을 설득하는 과정이 어려웠는데 AI(로 인한) 성장 모멘텀이 있어서 가능했다”고 회고했다. 이어, “통신 사업자들이 인터넷이나 모바일(을 통한 ICT 산업 발전) 모멘텀에 적극적으로 나서지 않고 분열됐다가 주도권을 잃게 됐는데, AI 시대에는 그렇게 하지 않았으면 좋겠다는 생각을 모은 것”이라고 설명했다. 그러면서 “챗GPT 등장 후 통신사들이 힘을 모아 제대로 AI 시대에 대응해보자고 생각했다"며 "왜 함께해야 하는지, 또 AI여야만 하는지 질문이 많았는데 (얼라이언스 구축 이후) 1년이 지났고, 이제 모든 기업이 AI를 외치고 있다”고 강조했다. 글로벌 유수의 통신사들과 뜻을 모은 것은 단순히 AI 경쟁력 확보를 넘어 글로벌 AI 강자로 나서겠다는 야심찬 포부인 셈이다. 텔코 LLM, 남들이 가질 수 없는 무기 유 사장은 SK텔레콤 대표 취임 1년이 지난 후부터 'AI 컴퍼니' 비전을 강조해왔다. 본업은 통신이지만 AI로 기존 사업과 신사업을 일구며 일하는 방식도 바꿔야 한다고 강조해왔다. 지난해 MWC에서는 AI 협력사들과 뜻을 모았는데, 지난해 하반기부터는 GTAA를 결성하면서 통신사만의 AI도 갖춰야 한다는 철학에 따라 텔코 거대언어모델(LLM) 구축의 필요성을 외쳤다. 자강과 협력을 키워드로 AI 피라미드 전략을 내세우며 AI 컴퍼니로의 전환 의지는 더욱 커졌다. 유 사장은 “1년 전 거대언어모델(LLM) 매개변수 크기를 따졌다면, 지금은 활용 방안과 어떤 비즈니스모델(BM)을 마련할지 여부에 관심이 쏠리고 있다”며 “텔코 LLM 같은 버티컬(특화형) LLM 발전이 하나의 기업을 넘어 산업 전체에 AI 전환을 불러일으키고, 수익화하는 데 중요한 축이 될 것”이라고 내다봤다. 범용 LLM이 아니라 통신에 특화된 버티컬 LLM은 꾸준한 데이터 학습과 함께, 규모의 경제를 통해 시간이 지나 큰 경쟁력을 가지며 산업 판도를 바꿀 수 있다는 자신감이다. AI 피라미드 전략 주효했다...게임체인저 도약 SK텔레콤의 AI 피라미드 전략에 따르면 데이터센터와 같은 AI 인프라를 갖추고 전 산업 영역에 걸쳐 AI 전환을 추진하며 실제 AI 서비스를 구현해야 글로벌 AI 회사로 성장하는 발판을 다질 수 있다. 구체적인 AI 서비스로 에이닷과 같은 AI 개인비서를 꼽았다. 즉, 통신사가 가장 잘할 수 있는 AI 개인비서(PAA, 퍼스널 AI 어시스턴트)로 글로벌 시장에서도 통할 수 있는 무기를 가지고 승부를 내겠다는 뜻이다. 유 사장은 “에이닷을 비롯한 PAA는 현 AI 시대 흐름과 궤를 같이하고 있다”며 “이는 빅테크의 전유물이 아니라 GTAA에서 서비스가 나올 수 있지 않을까 생각한다”고 말했다. 그는 또 “지금은 한 산업분야에 특화된 LLM이 해당분야의 변화를 이끌어가는 시대”라며, “글로벌 통신사들이 텔코 LLM 등 AI 분야 협력을 통해 시장 변화를 주도하는 게임 체인저가 되려는 것”이라고 강조했다. 그러면서 “기존 혁신에 그치지 않고 국내외 시장에서 과감한 도전을 계속할 것”이라며, “이를 통해 진정한 글로벌 AI 컴퍼니로 거듭날 것”이라고 밝혔다.

2024.02.27 08:00김성현

  Prev 1 2 3 4 5 6 7 Next  

지금 뜨는 기사

이시각 헤드라인

갤럭시 Z7 공개 '초읽기'…폴더블폰 고성능 카메라·두께 경쟁 격화

권순호 라인플러스 CTO가 밝힌 ‘라인+야후재팬’ 기술 통합 뒷이야기

입점하면 서로 이득…유통가, ‘올다무’ 유치 경쟁 치열

새정부 독자AI 구축 의지...통신사, 자체 AI 모델 공개

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.