• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'모델'통합검색 결과 입니다. (316건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

[써보고서] "정말 미쳤다"…오픈AI 新모델 'o1' 추론 능력에 '감탄'

"다른 인공지능(AI)에게 물어봐도 한 번도 맞힌 적 없는 문제들을 한글로 한 번에 해결하네. 이 모델은 정말 미쳤다." 13일 공개된 오픈AI의 인공지능(AI) 모델 'o1'에 대해 국내 관련 커뮤니티에서는 찬사가 이어졌다. 사용자들이 모델 성능을 비교하기 위해 넣었던 난해한 논리학 문제와 수학 문제들을 직접 생각하고 모두 해결했기 때문이다. 론칭 당일 새벽부터 모니터링하던 기자도 직접 다양한 테스트를 진행해 봤다. 추론과 수학 논리에 특화된 AI…뛰어난 문제 해결 능력 '눈길' 우선 간단한 실험으로 단어 내 특정 알파벳 개수를 세는 테스트를 진행했다. 기존의 거대언어모델(LLM) 대다수는 숫자 세기에 약점을 보였지만 'o1'은 'strawberry'에 포함된 'r'의 개수를 묻자 2초 만에 정확히 3개라고 대답했다. 논리학 문제에서도 뛰어난 성능을 보였다. 멘사 등에서 사용하는 '아이의 나이 맞추기' 문제를 제시하자 'o1'은 정확한 답을 도출했다. 문제는 러시아 수학자 이반과 이고르의 대화로, 아들들의 나이의 곱이 36이고 합이 오늘 날짜라는 힌트를 기반으로 아들들의 나이를 추론하는 것이었다. 기존 GPT-4 모델은 오답을 제시했지만 'o1'은 아들들의 나이가 1, 6, 6이며 오늘 날짜가 13일임을 정확히 맞혔다. 또 복잡한 추리 문제가 포함된 도난 사건에서도 'o1'은 정확한 범인을 지목했다. 여러 용의자의 진술과 거짓말이 섞인 상황에서 '찰리'와 '존무드'가 범인임을 밝혀내며 논리적 추론 능력을 입증했다. 일상에서 사용하지 않는 논리학 문제 대신 복잡한 문장의 해석 능력도 확인해 봤다. 한때 국내에서 밈이 됐던 "나 아는 사람 강다니엘 닮은 이모가 다시 보게 되는 게 다시 그때처럼 안 닮게 엄마 보면 느껴지는 걸 수도 있는 거임? 엄마도?"라는 난해한 비문을 제시하자 'o1'은 그럴듯한 해석을 내놓았다. 'o1'은 화자의 말을 "강다니엘을 닮은 이모를 다시 보았을 때 예전만큼 닮았다고 느끼지 못했다"며 "이런 느낌이 어머니를 본 후에 생긴 것일 수 있는데, 어머니도 같은 생각을 하시는지 궁금하다"는 뜻으로 해석했다. 이처럼 'o1'은 복잡한 문장의 의미를 자연스럽게 이해하고 해석하는 능력을 보여줬다. 막대한 토큰 사용 추정…응답 시간과 사용 횟수 제한은 아쉬워 일부 아쉬운 부분도 있었다. 간단한 질문에도 응답 시간이 10초 이상 소요되는 경우가 있어 실시간 활용에 제약이 있었다. 국내 커뮤니티 유저 한 유저는 '고맙다'는 답을 듣기 위해 10초가 소요됐다는 비판을 제기한 바 있다. 또 일주일에 30회로 제한된 사용 횟수는 실제 업무나 연구에 활용하기에는 부족한 면이 있었다. 실제로 기자가 15번 이상 'o1'을 사용하자마자 경고창이 떴다. "미리 보기의 응답이 15개 남았습니다. 한도에 도달하면 2024년 9월 20일로 재설정될 때까지 응답이 다른 모델로 전환됩니다." 마지막으로 일반 사용자들이 수학이나 복잡한 논리 문제를 자주 접하지 않는다는 점에서 이러한 고급 기능이 얼마나 대중적으로 활용될지는 지켜봐야 할 부분이다. 단 프로그래머나 수학 연구자 등 전문 분야에서는 큰 도움이 될 것으로 예상된다. 'o1' 출시로 AI의 추론 능력이 한 단계 도약한 것은 분명하다. 향후 응답 속도 개선과 사용 제한 완화가 이루어진다면 다양한 분야에서 혁신적인 활용이 기대된다. 특히 수학적 계산과 논리적 추론이 필요한 분야에서 큰 변화를 가져올 것으로 보인다. 샘 알트만 오픈AI 대표는 'o1'의 출시에 대해 "새로운 패러다임의 시작"이라며 "AI는 이제 다양한 목적으로 복잡한 사고를 할 수 있게 됐다"고 평가했다.

2024.09.13 11:01조이환

[기고] 기업 데이터 분석의 새로운 패러다임, 생성형 BI

그야말로 AI열풍이다. 기업에서는 업무 전반에 인공지능(AI) 특히, 대규모 언어모델(LLM)을 적용하거나 새로운 비즈니스 기회를 창출하는 시도가 활발하게 이루어지고 있다. LLM은 언어 모델이기 때문에 주로 비정형 텍스트 문서를 기반으로 AI 활용을 모색하고 있다. LLM의 단점을 보완하기 위해 검색 증강 생성(RAG) 아키텍처를 적용하는 경우도 많다. 다만, 기업의 중요한 정보는 비정형(unstructured) 문서에만 존재하는 것이 아니라, 관계형 데이터베이스(RDB) 같은 데이터 저장소에 정형(structured) 형태로도 존재한다. RDB 데이터의 LLM 적용을 위해서 RDB 데이터를 문서형태로 변환하는 것은 비효율적이다. RDB 데이터는 SQL을 통해 질의하고 결과를 얻는 것이 적절하므로, LLM이 SQL을 생성하도록 하는 것이 바람직하다. 이 과정은 자연어 기반 질의(NL2SQL) 영역에 속하며, LLM이 자연어 질의를 SQL로 변환할 수 있다. LLM은 자연어 질의에 대한 답변을 비롯해 SQL 작성에도 비교적 높은 수준의 성능을 보인다. 다만, LLM은 조직의 내부 DB 정보를 학습하지 않았으므로 RAG 방식으로 기업 내 DB 정보를 LLM 프롬프트에 질의와 함께 전달해 주면, 비교적 정확한 SQL을 생성할 수 있다. RDB에 데이터를 저장하고 분석하는 일은 전통적인 비즈니스 인텔리전스(BI) 영역에 속한다. 데이터 분석을 목적으로 한 NL2SQL은 BI 영역에 생성형AI를 적용한 것이므로 '생성형 BI'라 부를 수 있다. 글로벌 리서치 기관인 가트너에서도 생성형 BI라는 용어를 사용하기 시작했으며, 비정형 텍스트를 대상으로 생성형AI가 활발히 적용된 만큼, 정형 데이터를 대상으로 한 생성형 BI 영역도 급속도로 성장할 것으로 예상된다. 하지만 LLM이 생성하는 SQL이 항상 정확한 것은 아니다. 단순한 DB 모델에서는 LLM의 정확도가 높지만, 복잡한 DB 모델에서는 성능이 떨어질 수 있다. 정확도를 높이기 위해 DB 정보에 대한 설명을 풍부하게 만들어주면 성능이 향상될 수 있으나, 여전히 100% 만족하기는 어렵다. 그 이유는 기업의 복잡한 업무가 DB 테이블 설계에 반영되어 있을 뿐만 아니라, DB 설계자의 설계 스타일도 반영되기 때문이다. 이러한 정보를 모두 서술하기도 어렵고, LLM에 전달해도 이해하지 못해 잘못된 SQL을 생성할 가능성이 크다. 또 다른 문제점은 BI 데이터 분석이 주로 수치화된 정보를 다룬다는 점이다. 예를 들어, 판매수량, 판매금액, 생산수량, 불량수량 등을 집계하는 경우가 많은데, 잘못 생성된 SQL의 결과값이 정답 SQL의 결과값과 조금만 다르다면, 예를 들어 연간 매출액이 10조인데 9.9조나 10.1조의 결과가 나왔다면, 사용자가 이를 오답으로 인지하기 어렵다. 텍스트 문서를 기반으로 한 생성형 AI의 답변이 거짓일 경우, 예를 들어 "세종대왕이 아이패드를 던졌다"는 식의 거짓말은 문장의 특성상 사용자가 쉽게 알아차릴 수 있지만, 숫자로 된 답변은 큰 차이가 아니라면 잘못된 결과임을 인지하기 어렵다. 이러한 Gen BI의 한계를 극복하는 방법 중 하나는 온라인 분석 처리(OLAP)를 활용하는 것이다. OLAP은 SQL을 모르는 사용자도 DB 데이터를 분석할 수 있게 해주는 기술이다. 사용자가 OLAP솔루션에서 OLAP리포트를 작성하고 실행 버튼을 누르면, OLAP엔진이 SQL을 자동 생성해주고 실행 결과를 리포트에 반환해준다. 마치 엑셀의 피봇테이블 기능으로 엑셀의 데이터를 분석하는 것과 유사하다. OLAP이 쿼리 생성자로서의 역할을 수행하는 셈이다. OLAP은 수십 년에 걸쳐 상용화된 기술로, OLAP의 쿼리는 항상 안전하고 정확하다. OLAP 메타데이터를 설정할 때 비즈니스 메타데이터와 기술 메타데이터의 매핑 및 테이블 간의 조인 관계를 미리 설정하기 때문에, 설정되지 않은 조합의 SQL은 생성되지 않는다. OLAP 기반의 Gen BI에서는 LLM이 OLAP 리포트 항목을 선택할 수 있도록, RAG 방식에서 DB 정보 대신 OLAP 메타 정보를 전달하면 된다. 이후 LLM이 OLAP 리포트를 생성하면, OLAP 엔진을 통해 정확한 SQL을 생성하고 실행할 수 있다. OLAP 기반 생성형 BI의 또 다른 장점은 NL2SQL 방식의 Gen BI보다 오류 식별이 용이하다는 점이다. 질의에서 바로 SQL이 생성되는 것이 아니라, 중간 단계에서 OLAP 리포트 항목(관점, 측정값, 필터 조건 등)이 만들어지므로, 사용자가 이를 보고 LLM이 올바른 답을 도출했는지 쉽게 검증할 수 있다. 많은 OLAP 기반 BI 솔루션과 분석 솔루션들이 Gen BI 기능과 서비스를 출시하고 있다. 아직 Gen BI는 초기 단계이지만, 정확도를 높이기 위한 RAG 적용이나 외부 LLM 활용에 따른 데이터 보안 문제 등이 점차 개선될 것으로 보인다. 예를 들어 마이크로스트레티지와 같은 OLAP 기반 BI 솔루션 제공업체들은 기존 BI의 장점에 AI를 결합한 솔루션을 제공하고 있다. NL2SQL 기반의 생성형 BI도 SQL을 아는 개발자나 분석가의 생산성을 높이는 초도 Query 작성용으로 활용한다면 가치를 발휘할 것이다. 그러나 SQL을 모르는 일반 사용자에게는 OLAP 기반의 생성형 BI가 더 유리할 것이다. 언제까지? 아마도 LLM이 DB 설계자의 성향까지 극복해 정확한 NL2SQL을 생성할 때까지일 것이다. 챗GPT의 등장과 빠른 업그레이드처럼, 그 시기는 예상보다 빨리 올 수도 있다.

2024.09.13 10:29류진수

잡코리아·알바몬 광고 모델로 '변우석' 발탁

잡코리아(대표 윤현준)가 '잡코리아·알바몬 통합 브랜드 캠페인' 모델로 변우석을 발탁했다고 13일 밝혔다. 잡코리아가 통합 브랜드 캠페인에 나서는 것은 이번이 처음이다. 그간 '이직은 성장을 위한 가치 있는 일', '세상의 모든 알바를 리스펙트' 등 브랜드별로 주요 메시지를 강조하며 개별 캠페인을 펼쳐왔다. 잡코리아의 첫 통합 브랜드 캠페인 모델로는 배우 변우석이 낙점됐다. 잡코리아는 그간 변우석이 매 역할마다 최선을 다한 연기로 다양한 매력을 보여준 점과 꾸준한 활동을 통해 배우로서 큰 성장을 이뤄낸 점이 잡코리아가 추구해 온 기업 철학에 부합한다고 판단해 모델로 선정했다. 변우석은 2016년부터 다양한 작품에서 활약하며 꾸준히 필모그래피를 쌓아왔고, 최근 종영된 tvN 드라마 '선재 업고 튀어'에서는 과거와 현재의 선재 역할을 완벽히 소화하며 인상깊은 연기를 펼쳤다. 변우석은 이번 잡코리아 통합 브랜드 캠페인 광고에서 특유의 부드럽고 따뜻한 이미지와 세련되고 도시적인 모습을 동시에 선보였다. 잡코리아가 전개하는 '잡코리아·알바몬 통합 브랜드 캠페인' 신규 광고는 12일 티저 영상 공개를 시작으로 본편 시리즈가 순차적으로 온에어 될 예정이다. 주현정 잡코리아 마케팅실 실장은 "연기자로 성장하기 위해 100회 이상 오디션에 도전하고 자신의 커리어 발전을 위해 꾸준히 노력해온 배우 변우석을 통해 MZ세대의 가능성과 잠재력을 응원해 온 잡코리아의 메시지를 잘 전달할 수 있을 것으로 기대한다"면서 "앞으로 변우석과 함께 전개해 나갈 다양한 통합 브랜드 캠페인 활동에 많은 관심을 바란다"고 말했다.

2024.09.13 08:55백봉삼

업스테이지 "산업 특화 AI로 시장 공략…매출 급증했다"

"생성형 인공지능(AI)을 통해 돈 버는 기업으로 자리매김 했습니다. 올해 1분기 매출 100억원을 기록했습니다. 단순히 AI 모델 개발에만 그치지 않고 국내 금융·법률·의료·커머스 기업들에 맞춤형 거대언어모델(LLM)을 제공했기 때문입니다. 이런 사업 방향으로 국내뿐 아니라 미국 등 해외 시장에서도 본격 활약하겠습니다." 김자현 업스테이지 LLM 사업개발 리드는 최근 기자와 만나 자사 LLM '솔라'를 통한 비즈니스 성과와 향후 계획을 이같이 밝혔다. 김 리드는 업스테이지가 '솔라'를 통해 각 산업 도메인 업무에 특화된 솔루션을 제공해 왔다고 설명했다. 현재 업스테이지는 신한투자증권, 케이뱅크 등 금융회사에 파이낸스 LLM을 공급하고 있으며 법률상담 플랫폼 로톡을 운영하는 로앤컴퍼니에 법률 특화 솔루션을 제공하고 있다. 김 리드는 "고객이 요구하는 문제를 해결하기 위해 맞춤형 솔루션을 제공한 점이 주효했다"며 "이를 통해 고객사에 실질적인 가치를 제공하고 성공에 일조할 수 있었다"고 강조했다. 업스테이지는 금융과 법률뿐만 아니라 의료와 커머스 분야에서도 활약하고 있다. 의료 분야에서는 카카오 헬스케어와 손잡고 대학병원 3곳을 대상으로 AI 솔루션 제공용 메디컬 특화 모델을 제공한다. 커머스 분야에서는 커넥트웨이브와 협력해 AI 기반 맞춤형 상품 검색 및 추천 서비스를 구축했다. 현재 업스테이지는 생성형 AI 비즈니스로 올해 1분기 100억원 넘는 매출을 기록했다. 이는 지난해 회사 전체 매출보다 높은 수치다. 김 리드는 "업스테이지가 창업 원년부터 매출 창출을 목표로 사업을 진행했다"며 "최근 이례적인 성과를 얻은 셈"이라고 말했다. 이어 "생성형 AI 기업이 실제 매출을 올린 사례가 적다"며 "이런 상황에서 업스테이지 성과가 더 주목받고 있다"고 덧붙였다. 매출 성과 비결을 자체 개발한 LLM '솔라'와 파인튜닝 기술로 꼽았다. 파인튜닝은 LLM을 특정 작업이나 도메인에 맞게 학습 시키는 기술로, 업스테이지는 '솔라'를 특정 도메인에 맞게 파인튜닝해 고객사에 제공했다. 김 리드는 '솔라'가 번역·수학 풀이 등 특정 작업에서 오픈AI 'GPT-4' 같은 타사 LLM보다 뛰어난 성능을 보인다고 주장했다. 김 리드는 "파인튜닝 전문사인 프레디베이스(Predibase)와 협력해 '솔라' 성능 테스트를 500번 이상 실시했다"며 "'솔라'가 특정 도메인에선 빅테크 모델보다 우수하단 점을 정량적으로 입증했다"고 강조했다. 美·日 등 해외 진출 가속…"시장 수요에 맞는 전략 채택" 업스테이지는 글로벌 시장 진출도 빠르게 추진하고 있다. 현재 미국과 일본, 동남아시아 등 아시아태평양 지역으로 사업을 확장하며 국가 특성에 맞는 전략을 구사하고 있다. 김 리드는 "미국 시장에서는 온프레미스(On-premise) 수요를 주로 공략하고 있다"며 "생성형 AI 보안이나 비용 효율성 측면에서 온프레미스를 선호하는 기업 수요가 늘어났기 때문"이라고 밝혔다. 또 아태지역에서는 각국 언어와 도메인에 맞는 모델을 개발 중이다. 최근 '솔라' 일본어 버전을 개발 개발해 일본 시장 문을 두드리고 있다. 특히 '솔라' 일본어 버전은 니케이 아시아가 발표한 일본어 모델 벤치마크 테스트에서 상위 20위권에 포함된 것으로 알려졌다. 이중 유일한 한국산 모델이다. 김 리드는 "아태지역에서는 대규모 LLM을 자체 구축하기 어려운 경우가 많다"며 "한국서 입증된 경쟁력 있는 AI 솔루션을 통해 향후 베트남, 인도네시아, 아랍에미리트 등 다양한 국가에 언어 특화 모델을 제공할 계획"이라고 밝혔다. 김 리드는 업스테이지가 '솔라' 영어 모델을 공개해 AI 생태계 강화에 기여하고 있다는 점도 설명했다. 이를 통해 피드백과 사용 사례를 추가 확보하기 위함이다. 김 리드는 "오픈소스를 통해 개발자와 기업들이 업스테이지 모델을 활용하면 더 많은 애플리케이션과 솔루션이 나올 것"이라며 "이는 AI 공동 발전을 도모하고 AI 경쟁력을 알리는 좋은 기회"라고 강조했다. 같은 목적으로 업스테이지는 한국어 모델 성능을 평가하는 자체 리더보드를 운영 중이다. 리더보드 시즌 1에서는 LLM 기본 능력인 자연어 이해나 상식 등의 지표를 주로 사용했다. 최근에는 평가를 시즌 2로 업데이트 해 한국어 모델 성능뿐만 아니라 문화와 규범을 이해하는 능력까지 포함시켰다. 김 리드는 "평가 세트를 공개하지 않음으로써 모델들이 평가 세트를 학습하는 문제를 방지했다"며 "이로써 공정하고 정확한 성능 평가가 가능해졌다"고 밝혔다. 그러면서 "오픈소스와 리더보드 등을 통해 국내 AI 생태계가 함께 상생하고 발전하길 바란다"며 "이는 업스테이지도 한층 더 성장할 수 있는 기회일 것"이라고 강조했다.

2024.09.08 09:32조이환

유아이패스 "LLM 결합한 RPA로 쉽고 빠른 기업혁신 지원”

유아이패스가 대규모 언어모델(LLM)을 로봇프로세스자동화(RPA)에 적용해 보다 쉽고 빠르게 기업의 혁신을 돕는다. 유아이패스 세바스찬 슈뢰텔 제품 총괄 부사장 6일 서울 페이몬트 앰배서더 호텔에서 개최한 'AI 서밋 2024'에서 LLM 기반 RPA서비스를 대거 선보였다. 세바스찬 부사장은 " LLM 기반 제품군을 포함한 유아이패스의 혁신은 조직들이 AI의 잠재력을 최대한 활용할 수 있도록 설계됐다“며 ”각 분야에 맞춰 최적화된 A| 및 자동화 기능을 내장함으로써 국내 기업들이 정확성, 일관성, 예측 가능성을 높일 수 있도록 지원한다"고 설명했다. 먼저 공개한 닥패스와 컴패스는 6월 국내 서비스를 시작한 자동화 서비스로 대규모 언어모델(LLM)을 적용한 것이 특징이다. 닥패스는 세금 계산, 인보이스, 구매 주문서, 재무제표 등 다양한 유형의 문서를 처리 작업에 특화됐다. 업무 자동화 과정에서 문서 처리의 신뢰성과 속도를 향상할 수 있도록 지원한다. 컴패스는 이메일, 메시지 등 비즈니스 커뮤케이션 과정에서 정확하고 효율적인 정보 처리에 특화된 서비스다. 기업 내 다양한 커뮤니케이션 채널에서 발생하는 대량의 데이터를 분석하고, 핵심적인 내용을 도출하거나 이상을 감지해 운영 효율성을 개선하고, 기업의 의사 결정 과정을 돕는다. AI의 성능을 높이기 위한 기능도 다양하게 추가됐다. 현재 비공개 프리뷰 버전으로 제공 중인 오토파일럿 어드민은 AI 도구인 오토파일럿을 보다 효율적으로 활용하기 위한 관리 도구다. 이를 통해 사용자는 오토파일럿의 장애를 사전에 방지해 중단 없이 업무를 수행하거나 보다 업무 효율성을 높이는 것이 가능하다. 컨택스트 그라운딩은 기업 내 데이터나 내부 정책 및 절차와 같은 데이터 소스를 AI에 학습시킬 뿐 아니라 색인화하고 검색할 수 있도록 정제해 AI를 비롯해 다양한 환경에서 데이터 환경에서 활용할 수 있도록 제공한다. 또한 생성형 AI 액티비티는 유아이패스 AI 트러스트 레이어를 활용하며, 자동화 워크플로우에서 고품질의 A| 예측에 쉽게 액세스하고 이를 개발하여 활용함으로써 가치 창출 시간을 단축할 수 있다. 조의웅 유아이패스 코리아 지사장은 국내 기업들은 이제 디지털 혁신(DX)을 넘어 AI 혁신(AX)을 중요한 우선 순위로 삼고 있다"며 "유아이패스는 새로 출시된 혁신적인 기능을 포함한 강력한 자동화 도구를 제공함으로써 이러한 변화를 지원하기 위해 최선을 다하고 있다. 유아이패스의 현지화 노력은 다양한 산업 분야에서 문서 처리 정확도를 크게 개선하고 운영 효율성을 향상시킬 것이며, 앞으로도 AI를 활용해 새로운 성장 기회를 창출할 수 있도록 지원할 것"이라고 강조했다.

2024.09.06 13:07남혁우

AI '이중잣대'…비서구권·개발도상국 가짜뉴스 탐지 힘들어

인공지능(AI) 가짜 콘텐츠 탐지 툴이 비서구권 개발도상국에서는 제대로 작동하지 않아 기술 불균형 문제가 발생하고 있다. 3일 와이어드에 따르면 시장에 출시된 AI 탐지 툴 대다수가 서구권 언어와 얼굴 데이터에 편중돼 비서구권 국가에서는 정확도·탐지오류가 발생하고 있다. 실제로 AI 탐지 툴은 서구권에서 높은 신뢰도를 보이지만 비서구권에서는 미디어의 품질과 데이터 부족으로 인해 정확도가 크게 떨어진다. 이로 인해 가짜 콘텐츠를 실제 콘텐츠로 오인하거나 반대로 실제 콘텐츠를 AI 생성물로 잘못 판단하는 사례가 빈번히 발생하고 있다. 특히 비서구권 개발도상국에서는 저렴한 중국산 스마트폰으로 촬영된 저품질 사진과 비디오가 많아 AI 탐지 모델이 이를 인식하는 데 어려움을 겪고 있는 것으로 알려졌다. 이러한 품질 저하와 AI 모델의 민감성 때문에 탐지 과정에서 오류가 발생할 가능성이 높아진다. 또 AI 탐지 모델을 훈련시키기 위한 데이터와 자체가 부족해 기술적 한계가 더욱 가중되고 있다. 실제로 개발도상국 디지털 문제에 중점을 두고 활동하는 단체인 '스레츠(Thraets)'는 아프리카에서 생산되는 대부분의 정보·데이터가 인쇄물로만 발간된다고 밝혔다. 이로 인해 의심스러운 콘텐츠를 검증하는 데 오랜 시간이 걸리며 그 사이 허위 정보가 확산되고 있다. 이에 AI 탐지 기술에 지나치게 의존하기보다는 비서구권 정보 생태계 강화를 위한 지역 언론 매체 및 시민 단체 지원이 필요하다는 지적이 나온다. 이러한 접근법이 정보의 신뢰성을 높이고 허위 정보의 확산을 방지하는 데 기여할 수 있기 때문이다. 개발도상국 기술정책 발전을 연구하는 테크 글로벌 인스티튜트(Tech Global Institute)의 사바즈 라디즈 디야 연구원은 "AI 탐지 기술이 특정 지역에 치우친 탓에 비서구권에서는 그 효과가 미미하다"며 "기술적 대응뿐만 아니라 정보 생태계 자체를 강화하는 노력이 필요하다"고 강조했다.

2024.09.03 09:51조이환

美 캘리포니아 AI 안전법 'SB 1047' 통과…EU·국내 여파는?

미국 캘리포니아 주 의회가 인공지능(AI) 규제 법안 'SB 1047'을 통과시켜 주지사 승인을 기다리고 있는 가운데 유럽연합(EU)이 이를 자국 AI법 시행에 참고할 계획인 것으로 전해졌다. 국내 AI 기업들도 법안의 향방에 주목하고 있다. 30일 더 버지 등 외신에 따르면 캘리포니아 주 의회가 지난 29일 'SB 1047' 법안을 통과시켰다. 이는 다음 달 30일 개빈 뉴섬 캘리포니아 주지사가 서명하면 공식 발효된다. 해당 법안은 AI 기술의 급격한 발전에 따른 안전 문제를 해결하기 위해 마련됐다. 법안이 발효된다면 AI 개발사는 모델 훈련 과정서 발생할 수 있는 위험을 사전에 평가하고 필요 시 신속하게 모델을 중단하는 '킬 스위치' 기능을 명시해야 한다. 훈련 후 모델 변조 방지를 위해 안전 조치에 관한 조항도 법안에 포함됐다. 앞서 실리콘밸리와 정치권은 이 법안을 두고 논란을 빚었다. 테크 기업들은 과도한 규제가 기술 발전에 제약이 될 수 있다고 우려를 표명했다. 특히 오픈AI는 법안 발의자인 스콧 위너 주 상원의원에게 공개 서한을 보내 'SB 1047'이 테크 기업들의 대탈출을 불러일으킬 것이라고 경고한 바 있다. 오픈AI는 캘리포니아 사무실 확장을 유보하고 있다. 오픈소스 위주로 AI를 취급하는 스타트업 업계와 학계 역시 법안에 강력하게 반발하는 것으로 알려졌다. 법적 책임을 개발자에게 지우는 'SB 1047' 법안이 필연적으로 오픈소스의 발전을 저해할 것이라는 게 이들의 주장이었다. 페이페이 리 스탠포드 대 교수는 지난 8일 포춘지에 보낸 공개 서한을 통해 "법안은 오픈소스 AI 개발을 위축시키고 학계와 중소기업에 타격을 줄 것"이라며 "AI 개발자들에게 법적 책임을 부과한다"고 말했다. 이와 반대로 일부 테크 업계 인사들은 법안에 찬성했다. 일론 머스크 테슬라 대표는 'SB 1047'이 AI 시스템의 잠재적 해악을 방지하는데 필수적이라고 밝혔다. 또 초기에 법안에 반대했던 다리오 아모데이 앤트로픽 최고경영자(CEO)는 "정부 AI 감독 부서를 신설하거나 AI에 문제가 발생할 때 개발사를 처벌한다는 조항이 사라졌다"며 "법안의 이점이 해악보다 커졌다"고 주장했다. 정치권에서는 낸시 펠로시 등 일부 연방 의원들이 주 차원의 규제는 불필요하다고 주장했다. 이와 반대로 캘리포니아 주 의원들은 연방 정부가 AI 규제에 소극적이라는 점을 지적하며 주가 먼저 규제에 나서야 한다는 입장을 고수했다. 법안은 주 상원의 최종 승인을 받은 후 주지사에게 전달됐다. 다음달 30일까지 개빈 뉴섬 캘리포니아 주지사는 법안에 서명할지를 선택해야 한다. 'SB 1047'이 통과를 목전에 앞둔 현재 EU와 국내 AI 관계자들 역시 법안의 향후 전개에 촉각을 곤두세우고 있다. 현재 'SB 1047'에 대한 유럽연합(EU) 측의 공식적인 반응은 제한적이다. 아직 해당 법안이 주지사의 승인을 받지 않은 상태로, EU 역시 유사한 규제인 EU AI법을 시행하고 있는 단계이기 때문이다. 다만 EU 집행위원회의 AI 사무국은 캘리포니아 법안을 주의깊게 모니터링하며 EU AI법 시행과정에도 참고할 계획인 것으로 알려졌다. 전문가들은 이러한 행보가 'SB 1047'이 EU의 규제보다 더 구체적인 면이 있기 때문이라고 분석했다. 특히 딥러닝 분야의 선구자인 요슈아 벤지오 몬트리올 대학교 교수는 "EU도 이 법안에서 영감을 받아야 한다"며 "여전히 발전 중인 AI 분야에서 'SB1047'은 기업과 학계의 노력이 결실을 맺을 수 있도록 하는 유연한 규제"라고 주장했다. 국내 AI 업계에서도 'SB 1047'의 향방에 주목하고 있다. 캘리포니아 주의 AI 규제는 필연적으로 실리콘밸리에 밀집한 빅테크의 운영에도 큰 여파를 미칠 것이기 때문이다. 이에 이들과 긴밀히 교류하거나 미국 진출을 계획하는 국내 기업들도 영향을 받을 것으로 예상된다. 한 국내 테크 스타트업 관계자는 "법안의 의도에는 공감하나 책임소재와 범위가 과도하다는 점에서 미국 스타트업들과 동감한다"며 "기술을 남용한 사람의 책임을 개발자에게 지운다면 이는 개발을 저해할 것"이라고 밝혔다. 그러면서 "물론 개발자들도 지속적으로 AI 정확성과 성능 뿐만 아니라 안전성을 위해서 노력해야 한다"고 강조했다. 일부 전문가들은 'SB 1047'이 AI 규제의 선례로 남을 가능성을 지적했다. IT 기술의 본고장인 캘리포니아에서 AI 법이 조기에 제정된다면 다른 나라들도 유사한 법을 도입할 수 있다는 것이다. 한 국내 IT 기업 관계자는 "이럴 경우 스타트업들의 장점인 민첩한 기술 혁신을 막는 부작용이 생길 수 있다"며 "국내 스타트업들의 사기가 저하되고 그 여파로 창업을 안하게 되는 풍조가 이어질 수 있다"고 예측했다.

2024.08.30 17:31조이환

獨 알레프알파, 외국어·공학 전문 LLM '파리아' 출시

독일 인공지능(AI) 기업 알레프알파가 다국어와 특정 도메인에 최적화된 생성형 AI 모델을 오픈소스 형태로 공개했다. 알레프알파 거대언어모델(LLM) '파리아-1-LLM'을 출시했다고 27일 밝혔다. 매개변수 70억개로 이뤄졌다. '파리아-1-LLM'은 독일어·프랑스어·스페인어 등 다양한 언어에서 최적화된 기능을 제공하며 자동차와 공학 분야에 특화된 것으로 알려졌다. 현재 비상업적 연구 및 교육 용도로만 활용될 수 있다. 이 모델은 유럽연합(EU) 및 각 회원국의 저작권과 데이터 프라이버시 법규를 준수하며 제작 됐다. 알레프알파는 "엄선된 데이터를 사용해 모델을 훈련했다"고 설명했다. 알레프알파는 이번 모델 투명성과 안전성을 특히 신경썼다고 강조했다. 부적절한 답변을 걸러내는 데이터셋을 활용해 학습시키는 등 추가 안전장치를 도입했다. 또 답변이 지나치게 장황하거나 불필요한 정보를 포함하지 않도록 하는 기법도 적용했다. '파리아-1-LLM'은 두 가지 버전으로 제공된다. 하나는 사용자 지시에 특화된 '통제(control)' 모델이고 다른 하나는 안전성을 보다 강화한 '통제-정렬(control-aligned)' 모델이다. 독일의 머신러닝 엔지니어인 사마이 카파디아는 "'파리아'는 저작권과 개인정보 보호법 등 EU 규제를 완전히 준수해 훈련됐다"며 "이런 모델의 출시 자체만으로도 상당히 인상적인 성과"라고 평가했다.

2024.08.27 10:19조이환

앤트로픽 CEO "캘리포니아 AI 법안, 혁신 촉진할 것"

캘리포니아 주 상원 표결을 앞두고 있는 '첨단 인공지능(AI) 시스템을 위한 안전과 보안 혁신법안(S.B. 1047)'에 대해 앤트로픽 대표가 긍정적인 평가를 내렸다. 25일 유에스뉴스에 따르면 캘리포니아 AI 규제 법안인 'S.B. 1047'의 상원 표결이 지난 20일 시작됐다. 이 법안은 1억 달러 이상의 개발 비용이 들거나 일정량의 컴퓨팅 파워를 요구하는 고급 AI 모델에 대한 테스트를 의무화하는 내용을 담고 있다. 이는 AI 개발에 있어 안전성을 강화하기 위함이다. 다리오 아모데이 앤트로픽 대표는 이번 법안이 AI 개발에 긍정적인 영향을 미칠 수 있다고 평가했다. 특히 AI 기술 환경의 변화에 테크 업계가 대비하도록 지원할 수 있다고 주장했다. 법안은 AI 모델이 오작동할 경우 이를 종료할 수 있는 '킬 스위치' 설치를 의무화하고 있다. 또 사업자와 AI 개발자가 규정을 위반할 경우 캘리포니아 주 법무장관이 이에 소송을 제기할 수 있다. 이는 AI 기술의 오남용을 방지하기 위한 조치로 해석된다. 앞서 구글, 메타, 오픈AI 등 주요 테크기업들은 이 법안이 캘리포니아 주를 AI 개발에 불리한 환경으로 만들 우려가 있다고 지적했다. 특히 제이슨 권 오픈AI 최고전략임원은 지난 21일 법안을 발의한 스콧 위너 주 상원의원에게 공개서한을 보내 AI 규제는 연방 정부의 권한 아래 이뤄져야만 한다고 주장한 바 있다. 아모데이 대표는 "법안 내용이 개정됨에 따라 초기의 우려가 크게 줄어들었다"며 "이번 법안이 AI 개발 과정에서 혁신과 안전성을 모두 담보할 수 있을 것으로 기대한다"고 말했다.

2024.08.25 09:20조이환

[현장] "튼튼한 국방력은 엣지 AI서 나올 것"

최첨단 인공지능(AI) '엣지 AI'가 국방에도 필수적이라는 주장이 제기 됐다. 온디바이스·거대언어모델(LLM)은 사회에서만큼이나 군사 분야에도 유용하기 때문이다. 한국국방연구원(KIDA)과 과실연 인공지능(AI) 미래포럼은 22일 모두의연구소 강남캠퍼스에서 '제 7차 국방데이터 혁신 네트워크-토크'를 진행했다. 행사는 한국IT서비스학회, 모두의연구소, 지디넷코리아, 한국경제가 후원했다. 이 날 발제는 최첨단 AI를 칭하는 엣지 AI 주제로 진행됐다. 먼저 김홍석 리벨리온 소프트웨어 아키텍트 총괄이 '온디바이스: 꼭 가야할, 하지만 만만치 않은 여정'을 주제로 발제를 진행했다. 김 총괄은 국방 분야에서의 온디바이스 AI에 대해 강조했다. 온디바이스 AI는 전투상황에서 군인이 상황을 파악하고 대응하는데 있어 중요하다. 클라우드나 서버에 데이터를 보내서 분석할 시간이 없기 때문이다. 이에 김 총괄은 "온디바이스는 센서나 AI를 기기에 결합해 데이터를 바로 처리한다"며 "작전 성공 가능성을 높이고 군인들의 안전을 지킬 수 있는 중요한 수단"이라고 강조했다. 동시에 그는 온디바이스 기술 실현의 어려움에 대해 강조했다. 데이터센터에서 병렬컴퓨팅이 이뤄지는 클라우드 기반 AI와 달리 컴퓨터 하나를 통해 데이터를 처리하기 때문이다. 김 총괄은 "기기에 들어가는 칩이나 소프트웨어를 정밀하게 설계하고 센서를 잘 사용해야 한다"며 "전장 환경과 유사한 데이터셋을 구하기 어려운 점도 꼭 해결돼야 할 과제"라고 밝혔다. 이어 김주영 하이퍼엑셀 대표가 '국방 AI를 위한 LLM 특화 반도체 개발'을 주제로 발제했다. 그는 LLM이 국방 분야에 어떻게 접목될 수 있을지에 대한 조사 결과를 공유했다. 현재 미국 국방부는 생성형 AI 모델을 국방에 도입해 정보 수집, 전략 분석, 통신 보안에 활용하고 있다. 김 대표는 "국군도 LLM을 활용한 특화모델을 개발하고 있다"며 "공군과 육군이 특히 이러한 기술을 도입하기 위해 노력하고 있다"고 지적했다. 또 김 대표는 국방 LLM을 도입하기 위해 맞춤형 반도체가 필요하다고 설명했다. 그 이유는 LLM이 기존 딥러닝 모델에 비해 약 1천배에서 1만배 크기 때문이다. 이에 하이퍼엑셀이 현재 개발하는 언어처리장치(LPU) 칩이 기존 그래픽 인터페이스 장치(GPU)보다 효율적으로 기능할 수 있다고 소개했다. LPU는 GPU보다 90% 더 높은 메모리 대역폭을 활용할 수 있다. 김 대표는 "국방용 AI 반도체 시장이 급성장할 것"이라며 "LLM 추론에 최적화된 반도체 개발에 성공해 이 분야의 혁신을 지원하겠다"고 강조했다. 발제에 이어 '국방분야 AI 반도체, 온디바이스 AI 발전방안'을 주제로 산학연군 패널토의도 열렸다. 패널토의에는 조준현 방위사업청 전략기획담당관, 심병섭 한국항공우주산업 미래SW기술팀장, 박원근 네이버클라우드 이사, 최민석 한국전자통신연구원 박사, 김상희 국방과학연구소 박사가 참석했다.

2024.08.22 18:29조이환

테슬라, 美서 모델X 9천100대 리콜…"루프 조각 분리 위험"

테슬라가 루프 조각이 분리될 가능성이 있어 미국에서 스포츠유틸리티차량(SUV) 모델X 약 9천100대를 리콜한다고 밝혔다고 로이터 등 외신들이 21일(현지시간) 보도했다. 미국 도로교통안전국(NHTSA)은 모델X의 전면 및 중앙 루프의 장식용 트림 조각이 차량에서 분리돼 도로에서 위험을 초래하고 충돌 가능성을 높일 수 있다고 밝혔다. 해당 리콜은 2016년 모델X SUV 차량을 대상으로 한다. 테슬라는 2016년 7월 공급업체에서 후속 모델에서 문제가 발생하지 않도록 프로세스를 변경했다고 설명했다. 리콜된 차량은 무료로 루프 장식의 접착력을 테스트 후, 필요할 경우 루프 장식 조각을 다시 부착할 것이라고 회사 측은 설명했다. 또, 해당 문제에 대해 약 170건의 신고를 접수했지만 이와 관련된 충돌이나 부상은 발생하지 않은 것으로 파악했다고 덧붙였다. 해당 리콜에 대해 차량 문제가 발생하면 무선 소프트웨어 업데이트를 통해 문제를 해결해 왔던 테슬라가 실제로 차량을 리콜하는 사례는 흔치 않다고 로이터 통신은 전했다. 리콜 관리 플랫폼 개발업체 비즈카(Bizzycar) 자료에 따르면, 테슬라는 올해 상반기에만 안전 문제로 인해 260만 대에 가까운 차량을 리콜했다. 이는 같은 기간 미국에서 약 360만 대의 차량을 리콜한 포드에 이어 두 번째로 많은 수치다.

2024.08.22 13:19이정현

테슬라 모델Y 등 후드 SW 오류로 자발적 리콜

국토교통부는 테슬라코리아·기아·포드세일즈서비스코리아·지엠아시아퍼시픽지역본부에서 제작하거나 수입·판매한 7개 차종 10만3천543대에서 제작결함이 발견돼 자발적으로 시정조치(리콜)한다고 21일 밝혔다. 테슬라 모델Y 등 4개 차종 6만6천489대는 후드 소프트웨어(SW) 오류로 주행 중 운전자가 후드 열림 상태를 감지하지 못해 안전에 지장을 줄 가능성이 있어 22일부터 시정조치에 들어간다. 기아 프라이드 3만6천351대는 전자제어유압장치(HECU) 내구성 부족으로 화재 발생 가능성이 있어 19일부터 시정조치를 하고 있다. 포드 MKX 402대는 브레이크 부스터 부품 내구성이 부족해 제동거리가 길어질 가능성이 있어 22일부터 시정조치에 들어간다. 지엠아시아퍼시픽 캐딜락 리릭 301대는 전자식 브레이크 제어 장치(EBCM) SW 오류로 특정 조건에서 제동거리가 길어질 가능성이 있어 23일부터 시정조치한다. 차량 리콜 대상 여부와 구체적인 결함 사항은 자동차리콜센터에서 차량번호나 차대번호를 입력하면 확인할 수 있다.

2024.08.21 08:17주문정

뉴로클, 첫 웨비나서 딥러닝 비전검사 노하우 공유

뉴로클이 국내 기업과 연구자들에게 이미지·영상 데이터를 효과적으로 분석하는 방법을 소개한다. 뉴로클은 오는 29일 '딥러닝 비전검사의 모든 것'을 주제로 무료 웨비나를 개최한다고 20일 밝혔다. 첫 번째 세션은 '딥러닝 비전 시장의 현재와 미래'를 주제로 한다. 딥러닝 비전의 개념, 최신 트렌드, 기술 현황에 대해 논의할 예정이다. 다음 세션에서는 '딥러닝 비전검사 도입 과정에서 직면하는 어려움을 해결하는 모델들'을 발표한다. 생성적 적대 신경망(GAN), 비지도학습 아노말리(Anomaly) 등 딥러닝 모델과 그 실제 적용 사례를 소개할 예정이다. 마지막 세션은 '딥러닝 비전검사 도입 사례와 실제로 해결한 난제에 대한 심층 분석'을 다룰 예정이다. 뉴로클 기술력과 노하우를 활용해 난제를 해결한 실제 사례를 소개할 계획이다. 웨비나는 오는 25일까지 뉴로클 홈페이지에서 신청 가능하다. 딥러닝 비전검사에 관심 있는 누구나 무료로 참여할 수 있다. 이홍석 뉴로클 대표는 "이번 웨비나는 우리가 여는 최초의 웨비나"라며 "딥러닝 비전검사의 도입 사례를 통해 산업 종사자들이 유익한 인사이트를 얻을 수 있는 시간이 되길 바란다"고 강조했다.

2024.08.20 17:46조이환

팔로알토, 사이버 보안 포트폴리오 '시큐어 AI 바이 디자인' 출시

팔로알토 네트웍스가 고객사의 인공지능(AI) 업무 통합을 안전하게 지원하기 위해 사이버 보안 포트폴리오를 선보였다. 팔로알토 네트웍스는 AI 애플리케이션과 모델의 보안을 강화한 '시큐어 AI 바이 디자인'을 출시했다고 19일 밝혔다. 이 제품은 생성 AI 애플리케이션의 안전한 사용, AI 공급망 강화, 엔터프라이즈 AI 애플리케이션의 보호를 목표로 하고 있다. '시큐어 AI 바이 디자인'의 출시는 기업들이 최근 AI와 거대언어모델(LLM)을 비즈니스에 통합하는 사례가 증가함에 따른 것이다. 팔로알토 네트웍스는 앱 개발부터 배포까지 AI 보안 프레임워크의 무결성이 안전하게 유지될 수 있도록 포트폴리오를 설계했다. 이에 따라 기업들은 AI 잠재력을 극대화하면서도 보안 침해를 방지할 수 있을 것으로 전망된다. 특히 포트폴리오의 일부인 'AI 런타임 시큐리티'는 AI 애플리케이션, 모델, 데이터세트를 포함한 모든 구성 요소를 보호하고 AI 모델의 오용·공격을 방지하도록 설계됐다. 또 'AI 액세스 시큐리티'는 조직 구성원들이 생성 AI 앱을 안전하게 사용할 수 있는 환경을 제공해 데이터 유출 위험을 최소화할 것으로 기대된다. '시큐어 AI 바이 디자인'은 현재 구글 클라우드를 통해 이용 가능하며 이달 말부터는 아마존웹서비스(AWS)와 마이크로소프트 '애저'에서도 사용할 수 있게 된다. 박상규 팔로알토 네트웍스 코리아 대표는 “생성형 AI는 강력한 잠재력을 지녔지만 동시에 보안 위협을 늘렸다"며 "고객이 이러한 걱정을 덜 수 있도록 AI 보안 솔루션을 출시했다"고 강조했다.

2024.08.19 15:04조이환

스파크랩, AI 모델 제작 스튜디오 운영사 '드래프타입' 투자

액셀러레이터 스파크랩(대표 김유진)이 인공지능(AI) 기반 브랜드 커스텀 모델 제작 솔루션을 운영하는 드래프타입에 프리시리즈A 투자를 완료했다고 16일 밝혔다. 드래프타입은 AI 기술로 자체 제작한 가상 모델을 활용해 고객사들이 제품 이미지컷부터 마케팅 소재까지 기업 운영에 필요한 콘텐츠를 온라인으로 제작할 수 있는 '드래프타입 스튜디오'를 운영 중이다. 드래프타입 스튜디오는 고객사가 제품이나 브랜드를 착용한 이미지를 업로드한 후 자사의 정체성과 필요에 부합하는 AI 모델과 시선, 표정, 턱 방향 등 세부사항을 선택하면 설정값에 따라 얼굴과 구도를 자연스럽게 변경한 이미지를 생성해준다. 특히 드래프타입은 월 5만원 수준에 성별, 인종, 연령대별 적합한 AI 모델과 독점 계약 체결 권한을 제공, 이를 통해 고객사는 최대 수억 원에 달하는 브랜드 모델 계약 비용 절감은 물론 자체 보유 모델처럼 저작권 걱정없이 브랜딩과 마케팅에 활용 가능한 것이 특징이다. 드래프타입은 이번 투자를 계기로 내년까지 커스텀 모델 완전 자동화와 영상 콘텐츠 편집 및 제작 등 고도화된 기능을 선보여 신규 고객사 확보에 나설 계획이다. 현재 드래프타입은 서비스 론칭 8개월 만에 패션, 뷰티, 잡화 등 다양한 분야에서 3천500개 이상의 중소형 셀러와 대형 브랜드가 이용 중이다. 김유진 스파크랩 대표는 "'AI 기술로 기업의 브랜딩과 마케팅 프로세스를 개선한 점에서 드래프타입에 투자를 결정했다"며 "드래프타입은 자본력이 부족한 신생 기업들에게도 대형 브랜드 못지 않게 기회를 창출해주기 때문에 전체 산업 생태계의 균형있는 성장에 기여할 것"이라고 말했다. 김대희 드래프타입 대표는 "드래프타입은 단순한 비용 절감을 넘어 브랜드의 창업 및 성장 방식 자체를 혁신하고자 한다"면서 "지속적인 AI 기술 고도화로 다양한 기능을 확충해 고객사들이 일관된 브랜드 경험과 마케팅 효율성 제고를 이룰 수 있도록 돕겠다"고 밝혔다.

2024.08.16 13:13백봉삼

"AI 운영비용 최대 90% 감소"…앤트로픽, 프롬프트 캐싱 도입

앤트로픽이 생성형 인공지능(AI) 클로드의 운영비용을 최대 90% 줄이고 반응속도를 개선하는 새로운 기능을 공개했다. 16일 실리콘앵글 등 외신에 따르면 앤트로픽은 프롬프트 캐싱을 공식 홈페이지를 통해 발표했다. 이 기능은 앤트로픽의 멀티모달 대규모언어모델(LLM) 클로드3.5 소네트와 고속 AI모델인 클로드3 하이쿠에서 베타모드로 먼저 도입된다. 프롬프트 캐싱은 AI챗봇의 응답 처리 과정에서 발생하는 비용을 줄이고 반응속도를 높이기 위한 기술이다. 일반적인 AI모델은 프롬프트를 입력할 때마다 해당 데이터를 새로 입력해야 하는 만큼 많은 비용과 시간을 소모한다. 반면, 프롬프트 캐싱은 반복적으로 사용할 긴 문서나 복잡한 프롬프트를 캐시에 저장해 반복 사용하는 방식이다. 앤트로픽에 따르면 프롬프트를 캐시에 저장할 때는 백만 토큰당 3.75달러의 비용이 든다. 하지만 캐시에 저장된 데이터를 불러와 사용할 경우에는 백만 토큰당 0.3달러로 줄어든다. 이를 통해 반복적인 작업에서 기존 대비 최대 90%의 비용 감소효과를 일으킬 수 있다는 설명이다. 더불어 매번 데이터를 새로 불러올 필요가 없는 만큼 응답 시간 역시 2배 이상 높일 수 있다. 앤트로픽에 따르면 10만 토큰 규모의 특정 문서 기반 대화의 경우 캐싱 전 지연 시간은 11.5초수준이었다. 프롬프트 캐싱 적용 후 지연 시간은 2.4초로 79% 줄어드는 성과를 기록했다. 앤트로픽은 프롬프트 캐싱의 실무 사례로 노션을 소개했다. 노션은 해당 기능을 통해 AI 운영 비용을 최대 90%까지 절감했으며, 10초가 걸리던 응답 시간도 약 2.5초로 단축했다고 밝혔다. 더불어 AI응답속도가 증가하고 비용을 절감하게 되면서 더 많은 사용자에게 보다 빠른 AI서비스를 제공할 수 있어 사용자 경험 향상에 큰 영향을 미쳤다고 답했다. 노션의 공동창업자인 사이먼라스트는 "프롬프트 캐싱을 사용해 노션AI를 더 빠르고 저렴할 뿐 아니라 높은 품질을 유지할 수 있게 됐다"며 해당 서비스를 평가했다.

2024.08.16 09:52남혁우

NIA, AI모델 성능 평가 전면 재편···추론·감성 등 9개 지표 사용

한국지능정보사회진흥원(NIA, 원장)은 업스테이지(대표 김성훈, 영어명 성킴)와 공동 운영하는 'Open Ko-LLM 리더보드'가 시즌2로 전면 개편했다고 12일 밝혔다. 추론능력, 감성, 무해성, 등 9개의 새로운 지표를 적용, 성능을 측정한다. 시즌1에서는 5개 지표(4개는 허깅페이스 벤치마킹,1개는 고대 임희석 교수 마련)를 적용했다. 'Open Ko-LLM 리더보드'는 지난해 9월 민관협력을 통해 개설한 국내 최대 개방형 한국어 LLM 평가 체계다. 산·학·연 각계 분야에서 올 7월 말 기준 1700개가 넘는 LLM 모델을 제출해 평가를 받았다. 하지만 LLM 기술이 빠르게 발전함에 따라 1년 전에 만든 리더보드 벤치마크(평가지표)의 개선 필요성이 제기됐다. NIA가 벤치마킹한 글로벌 'Open LLM 리더보드'를 운영 중인 허깅페이스도 지난 6월 6개 항목의 성능 평가로 구성한 새로 개편한 리더보드 시즌2를 공개한 바 있다. 허깅페이스가 새로 마련한 6가지 성능 지표는 ▲MMLU-Pro(Massive Multitask Language Understanding-Pro version, MMLU(대규모 다중 작업 언어 이해) 데이터셋 개정판. 모델에게 10가지 선택지를 제공하고 더 많은 질문에서 추론을 요구) ▲GPQA(Google-Proof Q&A Benchmark, 대학원 수준의 구글 검증 Q&A 벤치마크. 생물학, 물리학, 화학 분야의 박사급 도메인 전문가가 만든 고난도 지식 데이터셋) ▲MUSR(Multistep Soft Reasoning, 약 1000단어 길이의 복잡한 문제들로 구성. 추론과 긴 문맥 분석 능력을 통해 해결하는 능력 평가) ▲MATH(Mathematics Aptitude Test of Heuristics, 고등학교 수준의 경쟁 문제들로 구성) ▲IFeval(Instruction Following evaluation, 주어진 지시를 얼마나 잘 이해하고 따르는지를 평가. '키워드 ★ 포함' '△형식 사용'과 같은 명시적인 지시를 따르는 모델 능력 평가) ▲BBH(Big Bench Hard, 객관적인 지표를 사용해 수학, 상식 추론 등에 대해 평가) 등이다. NIA '리더보드'에 대해 일각에서는 "자본을 투입해 일시적으로 성능을 높일 수 있다"면서 "LLM 생태계를 교란시키고 엔드 투 엔드 딜리버리 품질을 하향 평준화 시키는 이런 리더보드를 왜 운영해야 하는 지 모르겠다"는 비판적 시각도 보였다. 12일부터 시행하는 NIA의 '시즌2 리더보드'는 기존에 운영한 평가지표(벤치마크)들을 전면 폐지하고, AI 데이터 전문 기업인 '플리토'와 '셀렉트스타', 'KAIST AI대학원'이 참여해 만든 추론능력 지표, 감성 지표, 무해성 지표 등 9개의 새로운 벤치마크를 적용한다. NIA는 시즌1에 제출한 모든 모델을 포함해 향후 제출하는 모든 LLM은 신규 벤치마크를 통해 평가한다. 황종성 NIA 원장은 "리더보드는 민관 협업을 통해 한국어 LLM 생태계 조성에 크게 기여하고 있다"면서 "시즌2 개편을 통해 한국어 LLM 기술이 세계적 수준에 한발 더 올라설 수 있는 계기가 되기를 기대한다”고 밝혔다. 공동 운영기관인 업스테이지의 박찬준 리더는 “많은 전문기업과 학계 참여로 시즌2를 빠르게 준비할 수 있었으며, 시즌2에서도 지속적인 관심과 참여를 부탁한다”고 전했다. Open Ko-LLM 리더보드 시즌2는 AI허브(https://www.aihub.or.kr) 사이트의 참여하기-리더보드 메뉴에서 확인 할 수 있다.

2024.08.13 09:23방은주

[현장] 오픈AI 제이슨 권 "AI 극초기 단계…낙관론 유지해야"

"사람들이 인공지능(AI)을 '스마트하다'고 느끼기 시작했음에도 이 기술은 아직 초기 단계에 있습니다. 기술의 유용성을 극대화하기 위해서는 AI를 '과대광고'라고 생각하지 말고 합리적 낙관론을 유지해야 합니다." 제이슨 권 오픈AI 최고전략임원(CSO)은 12일 서울 페럼홀에서 열린 '서울 AI 정책 컨퍼런스(Seoul AI Policy Conference) 2024'에서 임용 서울대 교수와 대담하며 AI 기술의 현황과 잠재력에 대한 자신의 견해를 밝혔다. 권 이사는 지난 2022년 11월 '챗GPT-3.5'가 출시된 후 생성 AI에 대한 대중의 인식이 급격히 변화했다고 언급했다. 거대언어모델(LLM)을 통해 AI가 사람의 말을 이해하게 되면서 20년 전에는 상상할 수 없었던 기술들이 실현됐기 때문이다. 그는 직접 오픈AI 'GPT-4o' 최신 음성 모드를 시연하며 기술의 급격한 발전을 증명했다. 한국인 교수와의 대화를 통역해 달라는 권 이사의 영어로 된 요청에 'GPT-4o'는 그의 말을 한국어로 실시간 변환하며 성공적인 통역을 수행했다. 권 이사는 "불과 1년 반 전만 해도 텍스트를 키보드로 입력해야 했던 모델이 이제는 음성으로 실시간 통역을 제공할 수 있게 됐다"며 "기술은 매우 빠르게 발전하고 있다"고 강조했다. AI 능력의 급격한 발전에도 여전히 할루시네이션(환각)이나 음성 인식 오류와 같은 문제가 존재한다. 그럼에도 불구하고 AI는 여전히 추론 능력을 개선하고 있으며 엔지니어들은 최신 기술인 '트랜스포머' 이후의 새로운 패러다임을 모색하고 있다. 이러한 발전 과정에 대해 권 이사는 "우리는 기술을 점진적으로 발전시키고 AI가 일상 업무를 대신하도록 하는 것이 목표"라며 "단 한번의 도약이 아닌 점진적인 진화 과정을 통해 종국에는 일반인공지능(AGI)에 도달할 것이라고 믿는다"고 밝혔다. AI의 급격한 발전이 안전성 문제를 초래할 수 있지 않냐는 질문에 그는 AI 시스템 발전이 오히려 '정렬(Alignment)' 문제를 해결하는 데 도움될 수 있다는 점을 강조했다. 실제로 'GPT-2' 시절의 AI는 일반화 능력이 부족해 비윤리적인 명령을 실행했던 바 있으나 현재의 강력한 모델들은 스스로를 윤리적인 방향으로 제어할 수 있게 됐다. 또 권 이사는 AI 기업의 구조·거버넌스는 필요에 따라 변할 수 있지만 중요한 것은 조직을 운영하고 결정을 내리는 사람이라는 점을 강조했다. 오픈AI 역시 비영리로 시작했지만 컴퓨팅 자원과 투자 유치로 인해 복잡한 구조를 가지게 됐기 때문이다. 권 이사는 "AGI라는 핵심 목표를 위해 우리는 세상과 상호작용하며 유연하게 진화해 왔다"며 "이는 회사 구성원들이 원했던 목적을 이루기 위해 변화한 결과"라고 주장했다. 오픈AI의 향후 계획에 대해 권 이사는 "앞으로 사람들이 AI를 지금보다 많은 방향으로 활용하며 잠재력을 실현할 것"이라며 "AI의 추론 능력을 더욱 발전시켜 사람들의 업무에 실질적인 도움을 주고 동시에 안전성을 확보하는 것이 회사의 목표"라고 밝혔다.

2024.08.12 14:52조이환

오픈AI 中 서비스 중단…알리바바 '큐원2'가 대안될까

오픈AI가 중국 내 서비스를 전면 차단한 가운데 알리바바가 대규모 언어 모델(LLM) '큐원2-수학(Qwen2-Math)'을 출시해 관심이 쏠린다. 현존하는 LLM 중 최상위권 수학 AI로 평가돼 현지 연구자와 개발자들의 대안으로도 각광 받고 있다. 9일 미국의 기술 매체 벤처비트에 따르면 알리바바의 '큐원2-수학'은 LLM용 수학 벤치마크 '매스(MATH)' 테스트에서 84%의 정확도를 기록했다. 벤치마크 성능 1위인 오픈AI의 'GPT-4 코드 인터프리터(GPT-4 Code Interpreter)'가 기록한 87.92%에 근접한 성과로, 알리바바의 기술력을 입증했다는 평가다. '큐원2'는 초등학교 수준의 수학을 테스트하는 'GSM8K'에서 96.7%, 대학 수준의 수학 테스트에서는 47.8%의 점수를 기록하며 눈에 띄는 성과를 거뒀다. 이는 오픈AI 'GPT-4o', 앤트로픽 '클로드 3.5 소네트', 구글 '수학-제미나이 스페셜라이즈드 1.5 프로(Math-Gemini Specialized 1.5 Pro)'와 같은 주요 경쟁 모델들을 능가하는 결과다. 이번 성과는 중국 유저들에게 의미가 크다. 오픈AI의 서비스 차단으로 중국 개발업계와 학계가 '챗GPT'를 사용하지 못하고 있기 때문이다. 지금까지 중국 개발자·연구자들은 가상사설망(VPN)을 통해 제한적으로 파인튜닝, 연구 및 벤치마킹을 진행해 왔으나 이마저도 지난 7월 전면적으로 차단돼 연구에 제약을 받아 왔다. 이런 상황에서 '큐원2'는 'GPT-4 코드 인터프리터'에 거의 준하는 수학 능력을 달성해 중국 유저들의 업무를 효율적으로 지원할 것으로 예측된다. 이에 맞춰 알리바바는 해당 모델의 광범위한 활용을 위해 배포를 계획하고 있다. 특히 월간 사용자 수가 1억 명 이하인 기업들에게 오픈소스로 제공해 스타트업과 중소기업이 사실상 무료로 사용할 수 있게 할 방침이다. 벤처비트는 "LLM 모델 경쟁이 매우 빠르게 진행되면서 '큐원'이 지금까지는 경쟁자들에게 밀려났었다"며 "이번 수학 능력의 비약적인 향상은 알리바바가 다시 경쟁력을 회복하는 계기가 될 수 있을 것"이라고 분석했다.

2024.08.09 15:28조이환

식신, 아마존 서비스 활용한 AI 대시보드 구축

푸드테크 기업 식신은 아마존의 '아마존 베드록' 서비스를 활용한인공지능(AI) 대시보드 '외식메타 인덱스'를 구축했다고 8일 밝혔다. 아마존 베드록은 선도적인 AI 스타트업과 아마존의 고성능 파운데이션 모델을 활용한 생성형 AI 애플리케이션 구축을 지원하는 완전 관리형 서비스다. 외식메타 인덱스는 식신이 보유한 100만개 이상의 맛집 데이터 및 월간 350만명의 이용자 데이터를 기반으로 금융·공공·검색·SNS·방문자 정보 등 다양한 데이터를 통합·분석한다. 이를 통해 ▲지역별 인기 메뉴 ▲스토리가 있는 메뉴 트렌드 ▲상황이나 장소에 맞는 테마 데이터 ▲메뉴별 사용된 식자재 등의 데이터를 실시간으로 확인할 수 있다. 구축된 데이터는 수요처의 니즈에 따라 API, 콘텐츠형 위젯, 분석형 대시보드 등 다양한 형태로 제공한다. 식신은 아마존웹서비스(AWS)의 스타트업 고객 지원 프로그램에 선정돼 전략적 서비스 도입을 위한 리소스를 지원받았다. 이번 프로젝트는 AWS, 메가존클라우드, 스노우플레이크와의 협력을 통해 진행됐다 메가존클라우드는 AWS의 아마존 베드록과 스노우플레이크의 데이터 플랫폼 기능을 연동해 거대언어모델(LLM) 기반 마케팅 솔루션의 데이터 파이프라인을 구축했다. AWS는 아마존 베드록을 통해 LLM 서비스의 확장성을 제공함으로써 프로젝트에 필요한 AI 기능을 구현할 수 있도록 지원했으며, 스노우플레이크는 데이터 관리의 효율성을 높여 방대한 양의 데이터를 저장하고 분석할 기반을 마련했다. 식신은 이번 프로젝트 결과물을 통해 다양한 분야로 비즈니스를 확대할 계획이다. 에프엔비(F&B)와 여행관광 산업에서는 식신의 데이터를 통해 가맹점 컨설팅, 신메뉴 분석, 외식트렌드 등에 대한 인사이트를 제공할 예정이다. 사용자 재방문 및 전환 리마케팅용 콘텐츠를 필요로 하는 기업에도 자료를 유통한다. 식신 안병익 대표는 "글로벌 기업과 협력해 수십억건의 데이터를 효율적으로 분석하는 AI 프로젝트를 진행했다"며 "앞으로 LLM 기반 AI 프로젝트를 더욱 고도화할 예정"이라고 말했다.

2024.08.08 10:38정석규

  Prev 1 2 3 4 5 6 7 8 9 10 Next  

지금 뜨는 기사

이시각 헤드라인

라인야후, 'AI 기업' 전환 선언..."와우 라이프 플랫폼 되겠다"

"꼿꼿한 스타벅스가 달라졌어요"...왜 그럴까

롯데百, 영등포점 운영권 자진반납…속내는?

정은경 복지장관 후보자 "의정갈등 해결은 의료계와 신뢰 회복부터"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.