• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'텍스트'통합검색 결과 입니다. (15건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

맹성렬 괴짜 교수, "이번엔 UFO대신 이집트 신화 '저격'"

UFO(미확인물체) 작가로 널리 알려진 우석대학교 명성렬 교수가 이번에는 '고대 이집트 왕권 신화'(투나미스)를 출간해 화제다. 이 책은 고대 이집트 신화에 등장하는 '사자의 서((Book of the Dead)와 '피라미드 텍스트(Pyramid Texts)' 등의 의미를 현대적으로 재해석한 저서다. 맹성렬 교수는 "'피라미드 텍스트'는 죽은 왕의 장례 문서가 아니었다"며 "장례식은 새로 등극할 후계자 대관식과 병행해 치러졌다. 이집트 종교는 죽은 왕 장례보다 새 왕 대관식에 초점이 맞춰져 있다"는 독특한 해석을 내놨다. 고증을 통해 오시리스와 호루스 신화, 히에로스 가모스 의식, 그리고 왕권 정당화의 본질을 흥미롭게 풀어냈다. 맹 교수는 "단순한 역사적 사실의 나열이 아닌, 고대 이집트 종교의 철학적 깊이와 현대 문명에 미친 영향을 폭넓게 분석하려 했다"며 "집필과 연구에 12년을 쏟아 부었다"고 말했다. 이 책은 총 5부로 구성됐다. 고대 문헌과 벽화 분석, 오시리스 신화의 심층적 해석, 그리고 그리스와의 문화적 연결성을 찾아가려 애썼다. 특히, 오시리스와 호루스 신화를 중심으로 파라오의 권력이 신적 정당성을 얻는 과정을 통해 고대 왕권의 상징적 재현과 의식의 본질을 생생히 드러낸다. 맹 교수는 "참고 문헌만 130여 페이지에 이르는 검증된 이집트 신화 해설서"라며 "논리적으로 완결성을 갖추려 애썼다"고 덧붙였다. 저자인 맹성렬 교수는 서울대 물리학과를 졸업한 후 KAIST에서 석사학위를 취득했다. 영국 케임브리지대학에서 전기전자공학 박사 학위를 받았다. 35년간 냉인류 문명사 미스테리를 탐구해온 괴짜 과학자이다. 우석대학교에서 전기전자공학과, 전기자동차공학부, 교육 및 문화콘텐츠 개발학과, 심리운동학과에서 강의 중이다. 한국 UFO연구협회 회장을 역임하고, 현재 한국 미확인공중현상(UAP)학회장 및 한국 미스터리 협회장으로 활동 중이다. 저서로 '지적 호기심을 위한 미스터리 컬렉션', '아담의 문명을 찾아서', '과학은 없다', 'UFO 신드롬', '초 고대 문명(상·하)', '오시리스의 죽음과 부활', '피라미드 코드', 'UFO(우리가 발견한 것이 아니다. 그들이 찾아오는 것이다)' 등이 있다.

2025.01.25 20:39박희범

오픈AI, 기술 한계 직면했나…'소라' 출시 직후 연일 '먹통'

오픈AI의 야심작인 동영상 생성 인공지능(AI) 모델 '소라(Sora)'가 서비스 정식 출시와 동시에 마비됐다. 시장 내 '게임체인저'가 될 것이란 기대감과 달리 사전 대비가 소홀했다는 지적이 나오면서 AI 기술 주도권을 쥔 오픈AI가 오점을 남겼다는 평가다. 11일 업계에 따르면 오픈AI '소라'를 경험하기 위한 이용자들이 일시적으로 몰리면서 이날 오후 4시 14분(한국시간) 현재도 '소라닷컴'에 접속이 되지 않고 있다. 서비스는 이달 10일(현지 시간 9일) 오픈됐지만 트래픽이 심해 일시적으로 비활성화 조치가 내려졌다. 오픈AI '소라'가 무료가 아닌 유료 이용자들을 대상으로 서비스 된다는 점에서 이번 일은 상당한 실망감을 가져다줬다. '소라'는 현재 '챗GPT 플러스', '챗GPT 프로'에 포함돼 기존 유료 이용자들은 이 동영상 AI 모델 이용에 대한 추가 비용을 지불할 필요 없이 이용할 수 있다. 월 20달러를 지불하는 '챗GPT 플러스' 이용자들은 매월 50개(480p 또는 그 이하 해상도), 월 200달러인 '챗GPT 프로' 구독자들은 매월 500개의 영상을 생성할 수 있다. 챗GPT 팀, 엔터프라이즈, 에듀 계정에선 소라를 쓸 수 없다. 사실상 유료 서비스인 셈이다. 하지만 서비스 정식 출시 후 3일째가 된 이날도 여전히 정상화되지 않고 있다는 점에서 이용자들은 점차 불만을 터트리고 있다. '소라'를 이용하기 위해 '챗GPT 플러스'를 다시 구독하기 시작한 이용자들도 상당히 있지만, 사이트가 '먹통'이 된 탓에 많은 아쉬움을 드러내고 있다. 일각에선 국내와 달리 해외 기업의 서비스 먹통에 대한 민감도가 낮은 듯 하다고 지적했다. 앞서 카카오의 경우 지난 2022년 10월 SK C&C 데이터센터 화재로 서비스가 줄줄이 중단돼 많은 비난이 쏟아진 바 있다. 카카오는 카카오톡 등 무료 서비스에 대해서도 서비스 중단에 대한 책임을 지기 위해 보상안을 마련하며 여론을 달래기 위해 노력했다. 하지만 오픈AI는 유료 고객을 대상으로 한 서비스가 제대로 작동하고 있지 않음에도 개선책은커녕 보상안에 대해서도 제대로 내놓지 못하고 있어 눈살을 찌푸리고 있다. 오픈AI는 '소라닷컴' 알림창에 "현재 트래픽이 심해 소라 계정 생성을 일시적으로 비활성화했다"고만 공지한 상태다. 또 언제 서비스 정상화가 될 수 있냐는 질문에는 명확한 답변을 내놓지 못했다. 이에 대해 샘 올트먼 오픈AI 최고경영자(CEO)는 자신의 X(옛 트위터)에 "소라에 대한 수요를 상당히 과소 평가했다"고만 말했다. 업계 관계자는 "접속 채널에 동시 접속자가 많으면 많을수록 비용이 많이 든다"며 "그만큼 인프라를 확보해 둬야 하기 때문"이라고 설명했다. 이어 "한정된 자원과 예산으로 동시에 들어올 수 있는 인원수를 제한하려고 하다 보니 이 같은 일이 벌어진 듯 하다"며 "유료 구독자를 대상으로 하는 서비스임에도 기술적 한계와 비용 투입이 제대로 일어나지 않아 이 같은 일이 벌어진 듯 해 아쉽다"고 덧붙였다. 그러면서 "영상을 AI로 제작하는 서비스인 만큼 컴퓨팅 리소스를 엄청나게 소모할 듯 한 데 이를 오픈AI가 최적화하지 못한 측면도 있지 않을까 싶다"며 "유료 임에도 SLA(최저보장속도)을 보장해주지 않았다는 점에서 사용자들의 권리를 침해한 것으로 보여 비즈니스 모델로서도 성공적인 시작을 하진 못한 듯 하다"고 평가했다.

2024.12.11 16:19장유미

"필기체·주소 자동 보정까지"…로민, 다큐먼트 AI로 우체국 업무 혁신 '시동'

로민이 다큐먼트 AI 기술을 활용해 우체국 창구 업무 자동화를 지원한다. 로민은 우정사업본부가 자사 다큐먼트 AI 플랫폼 '텍스트스코프 스튜디오'를 활용한 업무 자동화 연구 용역 사업을 개시했다고 19일 밝혔다. 이로써 우편물과 예금 서류 등 수기로 작성된 문서를 AI 기술로 빠르게 처리할 수 있게 될 것으로 전망된다. '텍스트스코프 스튜디오'는 필기체와 인쇄체를 포함한 다양한 형태의 문서를 인식할 수 있는 우수한 솔루션으로, 특히 저화질 문서와 비정형 문서도 높은 정확도로 처리해 기존 문서인식(OCR) 기술의 한계를 극복한 것으로 알려졌다. 이번 시범사업에서는 우체국 창구에서 고객이 작성한 서류에서 주소나 개인정보를 자동 추출해 입력하는 시스템을 검증한다. 이를 통해 수작업으로 진행되던 정보 입력 과정이 대폭 간소화될 전망이다. 또 텍스트스코프 스튜디오의 후처리 기능은 입력 오류를 최소화하고 자동화된 데이터 검증과 보정을 지원한다. 반복 업무를 줄이는 데도 기여할 것으로 예상된다. 로민은 우정사업본부 외에도 국가기록원과 특허청 등 다양한 공공기관과 협력해 디지털 전환을 지원해왔다. 특히 '텍스트스코프 스튜디오'는 최근 조달청 우수제품으로 지정돼 공공시장 진출과 해외 조달시장 확대를 위한 기반을 마련하기도 했다. 강지홍 로민 대표는 "우체국의 디지털 전환에 기여하게 돼 기쁘다"며 "이번 시범사업 성공을 통해 예금과 보험 등 다른 분야로도 기술 적용을 확대할 계획"이라고 밝혔다.

2024.11.19 09:43조이환

구글, '신스ID 텍스트' 오픈소스로 공개..."AI 작성 텍스트 잡아낸다"

구글이 생성형 인공지능(AI) 모델이 작성한 텍스트 감지 및 워터마크 삽입 기술 '신스ID 텍스트'를 오픈소스로 공개했다. 이에 따라 개발자, 기업 등도 신스ID 텍스트를 사용할 수 있게 됐다. 더버지 등 외신에 따르면, 구글 딥마인드는 23일(현지시간) X 게시글을 통해 "신스ID 텍스트 워터마킹 도구를 오픈 소스로 공개한다"며 "개발자와 기업이 무료로 사용할 수 있고 AI에서 생성한 콘텐츠를 식별하는 데 도움이 될 것"이라고 밝혔다. 신스ID 텍스트는 AI 모델이 생성한 텍스트에 보이지 않는 워터마크를 삽입하는 기술이다. AI로 제작된 이미지, 영에 눈에 띄지 않는 워터마크를 삽입하는 기존 '신스 ID' 기술을 텍스트에 확대 적용한 것이다. 현재 텍스트용 신스ID는 AI 플랫폼 '허깅페이스(Hugging Face)'와 구글의 '책임감 있는 생성 AI 툴킷(Responsible Generative AI Toolkit)'에서 다운로드할 수 있다. LLM은 텍스트를 문자, 단어, 구문 등 토큰으로 분해한 다음 특정 토큰 뒤에 나올 가능성이 높은 토큰에 대해 예측한다. 각 토큰은 문장의 다음 단어로 선택될 가능성에 대한 백분율 점수를 받는다. 백분율이 높을수록 출력 텍스트에 포함될 가능성이 높다. 이때 신스ID 텍스트는 토큰 선택 점수 패턴과 조정 확률 점수를 합쳐 출력된 텍스트를 생성형 AI 모델이 작성한 것인지 구분한다. 푸쉬밋 콜리 구글 딥마인드 AI 연구 부사장은 MIT 테크놀로지 리뷰와의 인터뷰에서 신스ID 텍스트를 언급하며 "이제 AI 개발자는 이 기술을 사용해 텍스트 출력이 대규모 언어 모델에서 나왔는지 감지할 수 있다"며 "더 많은 개발자가 책임감 있게 AI를 사용하기 더 쉬워질 것"이라고 말했다.

2024.10.24 11:02조수민

텍스트넷-코오롱베니트, AI 데이터 사업 시너지 확대

텍스트넷이 코오롱베니트의 인공지능(AI) 협력체 AI얼라이언스에 동참한다. 텍스트넷은 코오롱베니트와 인공지능(AI) 사업 협력을 위한 업무협약(MOU)을 체결했다고 26일 밝혔다. 이번 협약은 텍스트넷의 고품질 AI 학습 데이터 구축 역량을 코오롱베니트의 AI 얼라이언스 회원사와 공유하며 사업 기회를 확대하기 위함이다. 코오롱베니트 AI 얼라이언스는 지난 6월 결성된 AI 전문 협력체이다. 코오롱베니트가 30년간 축적한 1천여 개의 IT 유통 파트너 네트워크와 AI 전문 기업 간의 협력을 추진하여 참여사들의 경쟁력 강화를 지원한다. 고경민 텍스트넷 대표는 “고품질 학습 데이터는 LLM의 성능과 직결되기 때문에 체계적인 설계가 동반되어야 한다”라며 “이번 협약을 계기로 AI 얼라이언스와 IT 유통 파트너사들의 디지털 전환을 적극 지원할 계획”이라고 말했다. 최상문 코오롱베니트 상무는 "AI 얼라이언스의 규모를 꾸준히 확대하고, 이를 기반으로 고객들에게 적합한 AI 솔루션을 효율적으로 제안할 수 있는 어플라이언스 패키징 구성 및 고객 리드 구체화를 통한 협력 사례 발굴에 집중하겠다"고 밝혔다.

2024.09.26 14:02남혁우

中 바이트댄스, 텍스트 기반 비디오 생성 AI 출시

틱톡을 운영하는 중국 기업 바이트댄스가 텍스트-비디오 생성 인공지능(AI) 모델 시장에 도전장을 냈다. 7일 로이터 등 외신에 따르면 바이트댄스는 텍스트 프롬프트를 기반으로 비디오를 생성하는 소프트웨어(SW) 제품군을 확대했다. 바이트댄스 소유의 파세우 테크놀로지가 개발한 지멩AI가 지난 31일 안드로이드에서 출시된 데 이어 중국 사용자를 위한 애플 앱스토어까지 출시를 마친 것이다. 다만 한국에선 아직 접근할 수 없다. 지멩AI는 구독제 시스템도 내놓았다. 월 69위안(약 1만3천원), 연간 659위안(약 12만6천원)의 구독제가 있으며 사용자는 월 약 2천 여개의 이미지 또는 168개의 AI 비디오를 만들 수 있다. 중국 내 텍스트-비디오 모델 시장은 점차 커지고 있다. 중국 최대 비디오 앱인 콰이쇼우는 지난 7월 '킬링AI' 앱을 글로벌 출시했다. 베타 버전을 중국 내부뿐 아니라 한국 포함 전 세계에서 접근할 수 있게 하며 많은 이용자 데이터를 수집하고 있다. 이 외에도 중국 AI 스타트업 지푸 AI가 지난달에 영상 생성 모델 '잉'을 출시했으며 또 다른 스타트업 셩슈도 '비두' 앱을 공식 출시했다. 반면 오픈AI가 내놓은 '소라'의 출시는 뒤처지는 모습이다. 오픈AI는 지난 2월 텍스트-비디오 모델인 소라를 공개했지만 대중 공개는 계속 미뤄지고 있다. 당시 오픈AI 측은 소라 개발 과정에서 프롬프트의 공간적 세부 사항을 혼동하고 특정 카메라 궤적을 따라가는 데 어려움을 겪고 있다고 설명했다. 오픈AI 미라 무라티 최고경영기술자(CTO)는 "소라는 올해 안에 사용자들에게 공개될 것"이라고 말했지만 별도의 정식 출시 계획은 언급하지 않았다.

2024.08.07 14:39양정민

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

링크, MTEB 텍스트 검색평가서 엔비디아·구글 제치고 1위 달성

미국 생성형 AI 전문 스타트업 링크는 거대 임베딩 모델 '링크'가 허깅페이스의 '대량 텍스트 임베딩 벤치마크 리더보드(MTEB)' 텍스트 검색 평가에서 엔비디아·세일즈포스·구글,오픈에이아이 등을 제치고 세계 1위를 차지했다고 5일 밝혔다. MIT 전기컴퓨터 공학과 박사 출신 최찬열 대표가 2022년 미국에서 설립한 이 업체는 법률, 보험, 금융, 헬스케어와 같은 전문분야에서 생성 AI 솔루션을 제공하고 있다. 허깅페이스의 대량 텍스트 임베딩 벤치마크 리더보드는 생성AI 검색 모델의 핵심인 임베딩모델의 성능을 ▲분류(Classification) ▲클러스터링(Clustering) ▲쌍분류(PairClassification) ▲재순위(Reranking) ▲검색(Retrieval) ▲텍스트 의미적 유사도(STS, Semantic Textual Similarity) ▲요약(Summarization) 등 7개 분야에 대해 평가데이터를 기반으로 순위를 정한다. 링크의 임베딩 모델은 텍스트 검색 분야에서 최초로 60점을 넘어 1위를 차지했다. 그 외의 분야에서도 우수한 성능을 확보, 종합 3위를 차지했다. 임베딩 모델은 생성 AI에서 가장 큰 문제로 대두되는 거대언어모델(LLM)의 환각 문제 (Hallucination)를 해결하는 데 결정적인 역할을 하는 검색증강생성(RAG) 기술에 쓰이는 핵심적인 모델이다. 검색증강생성은 거대언어모델에 없는 최신데이터나 외부 유출이 없어야 하는 회사 내부 문서를 가져와서 신뢰도 있는 형태로 결과물을 생성하는 기술이다. 이 프로젝트를 주도한 김준성 박사는 "우리는 사람이 라벨링한 데이터와 비슷한 품질의 데이터를 LLM 을 통해서 효율적으로 만들었고, 이를 통해 MTEB 벤치마크 데이터셋에 대해 최고의 검색 성능을 달성할 수 있었다"며 "효율적인 검색증강생성을 위한 임베딩 모델을 빠르고 비용효율적으로 만드는 방법을 고안하게 돼 기쁘다"고 말했다. 최찬열 링크 대표는 "기업이 생성 AI를 안전하게 도입하는데 있어 회사 내부 데이터 검색 정확도가 가장 중요하다. 이 검색에서 가장 핵심적인 엔진인 임베딩 모델을 성공적으로 개발하여 자랑스럽다"면서 "금융이나 법률과 같이 텍스트 검색의 정확도가 매우 중요한 분야에서 검색 정확도를 보장해주는 엔진인 임베딩 모델을 전문 분야를 중심으로 확장하고 고도화해 나갈 것"이라고 설명했다. 최 대표는 2023년이 챗GPT 의 등장으로 생성 AI 의B2C 활용사례가 많이 생겼다면, 2024년부터는 정확도와 보안기술이 개선되면서 B2C(기업간거래)가 활성화되기 시작할 것으로 내다봤다. 2022년 창업한 링크(구 위커버)는 MIT 전기컴퓨터공학과를 졸업한 최찬열 대표가 MIT 계산과학공학과 방수빈 박사 등의 인재들을 모아 창업한 회사다. 최찬열 대표는 2021년 AI 뇌모방컴퓨팅 연구결과를 기반으로 미국 내에서 포브스 30세 이하 30인 이하 과학부문에 선정됐다. 링크는 2022년 카카오벤처스·스마일게이트인베스트먼트·옐로우독 등으로부터 초기투자를 받았다.

2024.06.05 16:10백봉삼

오픈서베이, 고객 생각이나 감정까지 AI가 분석해준다

소비자 데이터 플랫폼 기업 오픈서베이(황희영 대표)가 AI 텍스트 분석 기능을 출시한다고 14일 밝혔다. 오픈서베이는 데이터 분석 기능 강화를 위해 리서치&경험관리 플랫폼 데이터스페이스에서 AI 텍스트 분석 기능을 제공한다. 이로써 기업은 VoC(Voice of Customer, 고객의 소리) 파악을 위해 수집한 설문조사 주관식 응답 데이터를 ▲비슷한 주제끼리 분류하는 주제 분석 ▲어조의 긍정·부정·중립성을 평가하는 감정 분석 등으로 실시간 분석할 수 있다. 이밖에 ▲다국어 번역 ▲유사 텍스트 언급 빈도 확인 ▲오타 자동 교정 등도 가능하다. AI 텍스트 분석 기능은 데이터 전문가의 분석 기술과 노하우를 제품에 녹여 탄생했다. 고객의 생각이나 감정을 담은 주관식 응답 데이터를 AI가 분석해 그 경향성을 빠르게 파악할 수 있게 돕는다. 또 글로벌 고객 리서치에서도 AI 기술을 활용해 단시간 내 텍스트를 번역하고 분석할 수 있다. 이번 기능은 주관식 응답 데이터 분석에 드는 시간과 비용을 대폭 절감했다는 것이 큰 특징이다. 사람이 직접 분석할 경우 데이터 1천 개 기준 코딩 및 시각화 작업에 5일가량 소요되는 데 반해, AI 텍스트 분석 기능 활용 시 수 분 내로 완료된다. 또 데이터 수집과 분석 과정에서의 휴먼 에러(Human error, 인적 오류)도 AI가 보완한다. 데이터 입력 중 발생한 오탈자를 자동으로 수정해 분석하고, 분석자 의견에 따라 데이터를 지나치게 상세하게 분류하거나 분석하는 등의 편향성도 줄일 수 있다는 강점이 있다. 황희영 오픈서베이 대표는 "주관식 응답 분석은 기업 니즈가 높은 기능으로 정식 출시 전부터 소비재, 식음료, 패션, 금융 등의 주요 기업이 사전 신청해 사용했고 VoC 청취에 큰 도움을 받고 있다는 평가가 많다"며 "추후 사진, 영상 등의 비정형 데이터 분석 기능까지 개발을 이어 나가 기업 고객의 데이터 활용을 도울 예정"이라고 밝혔다.

2024.05.14 13:35백봉삼

지코어, 엔비디아 파트너 네트워크 어워드 '산업 혁신기업 부문' 수상

퍼블릭 클라우드, 엣지 컴퓨팅 및 엣지 AI 전문기업 지코어는 '2024 EMEA(유럽·중동·아프리카) 엔비디아 파트너 네트워크 어워드'에서 엔비디아 GPU를 기반으로 한 획기적인 AI 음성-텍스트 변환 솔루션의 성공적인 출시로 '산업 혁신 부문'에서 높은 평가를 받았다고 25일 밝혔다. '엔비디아 파트너 네트워크 어워드'는 가속 컴퓨팅 및 AI 분야에서 변함없는 노력과 혁신 정신을 보여준 파트너의 탁월한 공로를 치하하기 위해 마련된 것으로, 이번에 지코어가 받은 '산업 혁신상'은 특정 산업 분야에서 혁신을 주도한 파트너에게 수여되는 상이다. 지코어는 앞서 AI를 사용해 영어 음성을 룩셈부르크어 텍스트로 변환하는 최초의 AI 음성-텍스트 번역 학습 모델을 선보였다. 이 모델을 사용하면 연극, 영화, 음악 등 다양한 매체에 녹음된 영어 음성 전체를 룩셈부르크어로된 텍스트로 즉시 번역이 가능하고, 이를 영화 자막 등에 활용할 수 있다. 지코어의 이번 음성-텍스트 변환 모델은, 2억 4천400만개의 가중치를 포함하는 오픈 소스 위스퍼(Whisper) 모델의 축소 버전인 '위스퍼스몰(Whisper Small)을 기반으로 구축됐다. 컴퓨팅 학습 리소스에 대한 엄청난 수요를 충족하기 위해 지코어는 엔비디아 A100 텐서 코어 GPU로 구동되는 하이엔드 솔루션을 사용했다. 현재 지코어는 이 솔루션이 컨퍼런스 및 행사에서 사용될 수 있도록 실시간 번역을 활성화하는 모델을 개발하고 있다. 향후에는 영어 외에 프랑스어와 독일어 등의 언어를 추가해 음성의 텍스트 변환 기능을 언어를 초월한 의사소통의 핵심 도구로 만들어 나간다는 계획이다. '음성-텍스트 변환' 모델은 지코어의 최첨단 엣지 AI 솔루션의 일부이며, 엔비디아 GPU를 기반으로 한 AI 학습용 GPU 클라우드 및 엣지에서의 AI 추론을 포함한다. 안드레 레이텐바흐 지코어 CEO는 “지코어의 AI 혁신에 대한 끊임없는 도전이 엔비디아 파트너 네트워크 어워드에서 인정 받게 되어 매우 뜻깊게 생각한다”며 “언어의 종류를 초월해 누구나 보다 원활하고 효율적으로 의사소통 할 수 있도록 지코어는 획기적인 엣지 AI 서비스를 선도하며 새로운 표준을 제시해 나갈 것”이라고 전했다. 엔비디아 EMEA 채널 디렉터인 더크 바푸스는 “AI는 여러 언어를 번역하는 능력을 통해 소통과 연결을 촉진한다”며 “지코어는 엔비디아의 GPU를 기반으로 영어 음성을 룩셈부르크어 텍스트로 번역해 낸 최초의 혁신적 성과를 높게 인정 받은 것”이라고 밝혔다.

2024.04.25 12:36김우용

"실제 체감 만족도 평가"…텍스트넷, 新서비스로 LLM 신뢰 높일까

인공지능 학습 데이터 구축 서비스 텍스트넷(TEXTNET, 법인명 스피링크)이 LLM의 신뢰를 높일 수 있는 서비스를 선보인다. 텍스트넷은 사용자 측면에서 언어모델을 평가하는 'LLM 사용성 평가 서비스'를 출시한다고 15일 밝혔다. LLM 사용성 평가는 벤치마크를 통해 측정하는 성능 평가와 달리 AI와 사용자가 나누는 대화 전반을 바탕으로 실제 사용자가 체감하는 만족도를 평가한다. 유창성, 정확성, 신뢰성 등의 지표를 바탕으로 생성형 AI 시스템의 결과물이 적절한지를 검토하는 것이 특징이다. 평가 지표는 3개의 대분류, 4개의 중분류, 12개의 소분류로 구성돼 LLM의 서비스 형태와 목적에 맞게 다양한 측면에서 평가가 가능하다. 또 LLM의 성능이나 사용자 만족도는 물론 평가 결과에 대한 면밀한 분석을 통해 당장 적용이 가능한 개선 방안부터 데이터 차원의 근본적인 개선 방안까지 제공받을 수 있다. 프로젝트 초반 서비스 형태와 목적, 주요 기능과 사용자 특성 등을 살펴 기본 평가 지표를 커스터마이징해 적용하기 때문에 높은 평가 신뢰도를 기대할 수 있다. 국내 유일 텍스트 데이터 설계 및 구축 전문 서비스인 텍스트넷은 실무 인력의 80% 이상이 언어 전문가로 구성돼 있다. 특히 AI와의 상호작용 강화를 목적으로 지속적인 R&D를 진행, 사용자가 선호하는 AI 에이전트 발화 특성을 비롯해 목적 달성을 위한 AI 대화 전략 등을 연구해 왔다. 텍스트넷은 이러한 역량을 바탕으로 지난 1월 유력 통신사와의 AI 서비스 사용성 평가 프로젝트를 성공적으로 완료한 바 있다. 이 외에도 국내 대기업 대고객 챗봇을 사용자 중심으로 개선하는 컨설팅 프로젝트를 3년 연속 수주했다. 고경민 텍스트넷 대표는 "일상 속에 AI가 자리하게 되면서 사람들은 좀 더 자연스러운, 계속 대화하고 싶은 AI를 찾게 될 것"이라며 "AI 기반 서비스를 운영하는 기업에게는 고객 커뮤니케이션과 충성도의 바로미터인 AI 사용성이 벤치마크 성능 만큼이나 중요한 지표"라고 말했다.

2024.04.15 16:14장유미

中, 생성형 AI로 애니메이션 제작…글로벌 방영

텍스트를 입력해 영상이 만들어지는 인공지능(AI) 기술을 이용한 생성형 애니메이션이 중국에서 처음으로 방영된 데 이어 세계를 향하고 있다. 11일 중국 CCTV에 따르면 CCTV가 만든 중국 첫 텍스트 투 비디오(Text to Video) 기술 생성형 인공지능 애니메이션 시리즈 '포엠스 오브 타임리스 어클레임(poems of timeless acclaim, 시대를 초월한 명시, 중국어명 千秋诗颂)' 영어 버전이 CGTN에서 정식 상영됐다. CGTN은 CCTV의 국제 방송이란 점에서 AI 기술을 이용한 콘텐츠 글로벌화를 시도하는 셈이 됐다. 이 애니메이션은 중국이 자체적으로 개발한 AIGC 기술로 제작한 첫 시리즈 애니메이션이다. CCTV 방송국의 'CCTV 청취 미디어 초거대 모델'을 기반으로 만들어졌다. 내용은 중국 교과서에 실리는 시를 AI 기술을 이용해 중국 스타일의 애니메이션으로 변환한 것이다. 텍스트로 영상을 생성했다는 점에서 오픈AI의 '소라(Sora)' 기술과 유사하다. 앞서 지난 2월 26일부터 3월 2일까지 CCTV 채널에서 애니메이션 6부작이 방송돼 시청률이 중국 전국의 애니메이션 중 1위를 차지했다. 영어 버전 역시 방송국의 최신 AI 기술을 이용해 번역 및 더빙된 것으로 알려졌다. CGTN은 AI 언어 모델을 사용해 중국어 대본을 번역 및 윤색하고 더빙 과정에서 '텍스트 투 사운드', '사운드 복제', 'AI 영상 처리' 등 기술을 이용해 중국어 더빙의 음색과 감성을 복원했다. 또한 번역 및 더빙팀은 해외 시청자들의 시청 습관을 고려해 영상에 중국의 역사적 배경을 소개하거나 인물의 주석 정보를 추가하기도 했다. CGTN에서 포엠스 오브 타임리스 어클레임은 6부를 순차적으로 방영한 이후 AI 애니메이션 시리즈 다국어 버전도 글로벌 출시할 예정이다.

2024.03.12 08:37유효정

오픈텍스트 "장애대응과 DR, OS 레벨 실시간 복제 하나로 해결"

통합 정보 관리 플랫폼 제공업체 오픈텍스트의 사이버시큐리티 부문은 28일 서울 삼성동에서 기자간담회를 개최하고 국내 파트너사인 고가용 시스템 구축 솔루션 전문기업 한국사이버테크(대표 이준녕)와 카보나이트 비즈니스 연속성(BCP) 솔루션의 트렌드 및 국내 비즈니스 전략에 대해 발표했다. 오픈텍스트는 캐나다에 본사를 둔 글로벌 소프트웨어 기업이다. 기업이 정보를 효과적으로 활용해 비즈니스 프로세스를 최적화하고 혁신을 구현할 수 있도록 지원하는 기술 중심의 솔루션을 제공하고 있다. 오픈텍스트는 엔터프라이즈 콘텐츠 관리(ECM), 비즈니스 프로세스 관리(BPM), 클라우드 서비스 및 솔루션, 팀 협업 및 플랫폼, 정보 보호 및 보안 등의 분야에서 다양한 사업을 진행하고 있다. 오픈텍스트 사이버시큐리티는 고객이 효과적으로 서비스 중단 위험을 줄이고, 데이터 신뢰성을 유지하도록 도와준다. 오픈텍스트 사이버시큐리티는 고객이 고가용 시스템, 재해복구, 백업, 보안을 탄력적으로 구축할 수 있도록 지원하는 정보보호 포트폴리오를 보유하고 있다. 대표적인 솔루션으로 카보나이트, 웹루트(Webroot) 등이 있다. 오픈텍스트 사이버시큐리티의 카보나이트 DR 솔루션은 실시간 복제를 기반으로 시스템 이중화, 다중화(HA)와 원격지 재해복구(DR) 환경을 손쉽게 구성할 수 있도록 지원한다. 이를 통해 서비스와 데이터를 안정적으로 보호할 수 있는 기능을 갖췄다. 카보나이트 솔루션은 전 세계적으로 1백5만개 이상 서버 라이선스 판매 실적을 거둔 제품이다. 국내는 1999년부터 한국사이버테크를 통해 금융, 제조, 공공, 서비스, 의료 등 다양한 분야의 2천개 이상 사이트에 구축됐다. 카보나이트 솔루션은 운영체제(OS) 레벨의 실시간 복제 방식으로 작동한다. DR 환경 구축 시 기존 운영서버를 재활용하고, 물리 및 가상 클라우드 등으로 구성된 하이브리드 전산 환경에서 동일하게 복제 및 페일오버 성능 및 기능을 제공한다. 운영서버의 데이터뿐 아니라, OS, 프로그램까지 실시간 복제해 DR 서버를 운영서버와 동기화에 필요한 시간과 비용을 대폭 감소시킬 수 있다. DR 센터를 물리 및 가상, 퍼블릭 클라우드 플랫폼까지 폭넓게 선택할 수 있도록 해 고객 예산과 환경에 맞는 DR 시스템 구성을 지원한다. 카보나이트 버츄얼 어플라이언스(VA)를 도입하면 서버리스 DR 시스템을 용이하게 구성, 관리할 수 있다. DR 시스템 구축 시 시간과 부가적인 상용 소프트웨어 비용도 줄여준다. 오픈텍스트 사이버시큐리티는 한국사이버테크와 함께 카보나이트 HA, DR 솔루션을 중심으로 높은 구축 비용으로 재해복구 시스템 도입을 망설이는 고객들에게 경제적인 구축 방안을 홍보하고, 프로모션 프로그램과 지원 체계를 강화하며, 컨소시엄을 통해 시너지를 넓힐 수 있는 파트너를 적극 활용한다는 계획이다. 오픈텍스트 사이버시큐리티의 스티브 스태브리디스 APAC 지역 부사장은 “고도화되고 있는 디지털 전환 시대에 비즈니스 연속성에 대한 요구가 빠르게 증가하고 있다”며 “가동 중단이나 다운타임 발생시 복구 가능성을 보장하는 카보나이트 솔루션은 이에 대한 경제적, 기술적 측면에서 완벽한 해법이 될 수 있을 것”이라고 설명했다. 이준녕 한국사이버테크 대표는 “한국사이버테크는 25년간 카보나이트 솔루션의 국내 총판을 맡으면서 제품 영업 및 기술지원 경험을 기반으로 고객들의 다양하고 높은 요구를 만족시켜 왔다”며 “카보나이트의 OS 레벨 실시간 복제 기술은 저렴한 예산으로 짧은 시간 내에 DR 시스템을 구축하고, BCP를 확보할 수 있도록 지원한다”고 강조했다. 한국사이버테크는 그 동안의 노하우를 바탕으로 오픈텍스트 시큐리티의 DR 솔루션이 고객의 안전한 기업 환경을 보호할 수 있도록 새로운 기술을 빠르게 공유하고, 이를 최적의 결과로 이끌어낼 수 있게 모든 역량을 집중할 것이다”라고 말했다.

2024.02.28 13:09김우용

中 바이트댄스, 10배 속도 '텍스트로 이미지 생성' AI 모델 공개

틱톡 모회사인 중국 바이트댄스가 텍스트로 이미지를 만들어내는 인공지능(AI) 모델을 공개했다. 24일 중국 언론 졔몐신원에 따르면 중국 바이트댄스는 텍스트투이미지(Text-to-Image) 오픈 모델 'SDXL-라이트닝(Lightning)'을 출시했다. 이 모델을 사용하면, 매우 짧은 시간에 고품질, 고해상도 이미지를 생성할 수 있으며 최근 가장 빠른 텍스트투이미지 모델로 꼽힌다고 소개됐다. 텍스트투이미지는 AI 기술을 이용해 텍스트를 기반으로 이미지를 생성해내는 기술이다. 매체에 따르면 바이트댄스의 SDXL-라이트닝 모델은 전례없는 생성 속도를 달성했으며, 2~4개 단계 만에 고품질의 고해상도 이미지를 생성해내면서 생성속도를 기존 대비 10배 향상시켰다. 이를 통해 1024 해상도에서 가장 빠른 텍스트투 이미지 모델이 됐으며, 컴퓨팅 원가를 10분의 1로 낮춘다. 이 기술을 개발한 바이트댄스의 지능창작팀에 따르면 이 모델은 오픈소스 텍스트투이미지 모델 SDXL의 업그레이드 버전으로서 개방형 모델 커뮤니티의 다른 툴 및 플러그인과 호환된다. 개발자, 연구원 및 창의적 임무를 맡은 이들이 사용할 수 있다. 중국 언론에 따르면 이 모델은 이미 AI 오픈소스 커뮤니티 허깅페이스에도 공개돼 인기 모델이 됐다.

2024.02.25 23:47유효정

스테이블디퓨전3 미리보기 공개

텍스트-이미지 모델 '스테이블 디퓨전'의 세번째 버전이 초기 미리보기로 공개됐다. 품질 및 철자 기능 향상, 다중 주제 프롬프트 등이 특징이다. 22일(현지시간) 스태빌리티AI는 차세대 텍스트-이미지 모델 '스테이블디퓨전 3' 초기 미리보기를 발표했다. 사용을 원하는 경우 미리보기 대기자명단에 등록해 이용할 수 있다. 접근권한을 얻게 되면 디스코드 서버 초대 메일을 받게 된다. 스테이블디퓨전은 2022년 2.0 버전 공개로 이미지 생성 AI 모델의 획기적 진보를 보여줬다. 세번째 버전은 기존 아키텍처와 달리 디퓨전 트랜스포머 아키텍처와 플로우 매칭을 결합했다. 디퓨전 트랜스포머 아키텍처는 일반적으로 사용되는 U-Net 백본을 트랜스포머로 대체해 이미지 디퓨전 모델을 훈련한다. 이 방식은 효율적으로 확장하고 더 높은 품질의 이미지를 생성할 수 있다. 플로우 매칭은 랜덤 노이즈에서 구조화된 이미지로 원환하게 전환하는 방법을 학습해 이미지를 생성하는 AI 모델을 만드는 기술이다. 스테이블디퓨전3는 이전 모델보다 더 나은 성능과 품질로 이미지를 만들어낸다. 한 프롬프트에 여러 주제를 넣을 수 있다. 철자 생성의 정확도도 더 높아졌다. 스테이블디퓨전3의 크기는 다양하다. 8억에서 80억개의 매개변수를 제공한다. 스테이블디퓨전은 기본적으로 오픈소스 라이선스를 따른다. 모델의 소스코드에 접근할 수 있고 미세조정이 가능하다. 현재 스테이블디퓨전3의 소스코드와 기술문서는 공개돼 있지 않다. 회사측은 미리보기 단계에서 성능과 안정성을 개선할 것이라고 밝혔다.

2024.02.23 10:43김우용

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

폴더블 아이폰, 펀치홀 카메라 탑재 유력

배민·요기요, 먹통 뒤 정상화..."금요일 밤 비 내린 탓"

과학자들, 납으로 금 만들었다…'연금술사의 꿈' 실현되나

SKT 유심교체 누적 193만...교체 예약 대기 686만

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현