• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
국감2025
배터리
양자컴퓨팅
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이미지 AI'통합검색 결과 입니다. (60건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

"의료 AI 개척한다"…뉴로클, 강북삼성병원과 협업

뉴로클이 디지털 병리 이미지를 활용한 인공지능(AI) 연구 혁신에 나선다. 뉴로클은 강북삼성병원과 손잡고 디지털 병리학 분야에서 AI 기반 연구를 추진한다고 16일 밝혔다. 이번 협력을 통해 의사는 코딩 지식 없이도 AI 모델을 생성·활용할 수 있다. 기존 IT 전문성 부족과 데이터 확보 어려움을 해결할 것으로 기대된다. 기존에 강북삼성병원 연구팀은 뉴로클 소프트웨어인 뉴로티(Neuro-T)로 여러 AI 모델을 제작하고 활용해왔다. 이에 뉴로클은 자사 API 라이브러리 뉴로알(Neuro-R)을 통해 디지털병리 이미지 분석 소프트웨어 큐패스(QuPath)와 뉴로티를 연결했다. 이에 따라 의사들은 큐패스로 이미지를 라벨링하고 뉴로티로 생성된 AI 모델을 적용해 병변을 자동으로 탐지·분류할 수 있게 됐다. 특히 뉴로알을 통해 AI 모델의 결과를 실시간으로 시각화·수정할 수 있어 연구 효율성과 정확도가 늘었다. 또 뉴로티는 지난 6월 4.1 버전으로 업데이트 돼 보다 원활한 딥러닝 연구를 촉진했다. 이 제품에는 새로운 기능과 모델이 추가돼 라벨링 작업에 투입되는 시간과 노력이 줄었다. 뉴로클은 "자사 소프트웨어 뉴로티와 실시간 실행 API 뉴로알이 병리학, 치의학 등 다양한 분야에서 유의미한 결과를 만들어내고 있다"며 "높은 판독 정확도를 가진 새 제품을 통해 의료 영상 이미지를 활용한 연구에 기여할 예정"이라고 밝혔다.

2024.07.16 16:13조이환

"'투닝'과 함께하면 웹툰 창작 더 잘 할 수 있어요"

꿈은 삶의 이정표이자 동력이다. 꿈은 곧 미래의 삶이다. 꿈은 그래서 소중하다. 꿈은 사람마다 다르고 다른 만큼 다채롭다. 스타트업이 꾸는 꿈도 그럴 것이다. 소중하고 다채롭다. '이균성의 스타트업 스토리'는 누군가의 꿈 이야기다. 꿈꾸는 사람이 자신의 이야기를 들려주고 다른 꿈꾸는 사람을 소개하는 릴레이 형식으로 진행된다. [편집자주] “투닝과 함께하면 웹툰 창작 더 잘 할 수 있어요” 미국 주식시장에 상장된 웹툰엔터테인먼트에서 활동하는 상위 100위 창작자의 연평균 수익은 100만 달러인 것으로 나타났다. 또 연평균 10만 달러 이상 수익을 올리는 창작자만 483명이나 되는 것으로 알려졌다. 그 숫자는 해가 갈수록 늘어나는 추세다. 웹툰 산업이 점차 확대되고 있다는 것을 의미한다. 이호영 툰스퀘어 대표는 소프트웨어와 인공지능 기술로 웹툰 생태계를 더 풍부하게 만드는 데 기여하기 위해 직접 창업했다. 툰스퀘어의 사업 방향은 그러나 웹툰엔터테인먼트 같은 거대 플랫폼과 직접 경쟁하는 방식은 아니다. 그보다 소프트웨어와 인공지능 기술로 웹툰 창작을 지원하는 쪽이라 봐야 한다. “툰스퀘어는 웹툰을 중심으로 한 콘텐츠 저작 툴인 '투닝(Tooning)' 공급을 핵심 비즈니스로 하고 있습니다. 궁극적으로 투닝 이용자를 늘리고 이들과 연대함으로써 솔루션과 IP(지적재산권) 기반 회사가 되려고 합니다.” ■생성형 AI 기반 콘텐츠 저작 툴 '투닝(Tooning)' 이 대표는 웹툰의 쓰임새가 다양하다고 생각한다. 웹툰엔터테인먼트에 연재되는 상업용 흥행 웹툰도 있지만, 학교 교육이나 기업의 마케팅 그리고 기관의 캠페인 등에서 웹툰이 효율적으로 쓰일 수 있다는 것이다. 투닝은 이 모든 것을 지원하기 위한 툴들로 구성돼 있다. “투닝은 웹툰 콘텐츠를 만들기 위한 다양한 툴들을 가리키는 툰스퀘어의 브랜드죠. 구체적으로 투닝 에디터, 투닝 보드, 투닝 GPT, 투닝 매직 등이 있어요. 스토리와 이미지를 만들고 편집하고 공유하는 툴들이죠.” 투닝 에디터는 'AI 기반 스토리텔링 제작 툴'이다. 템플릿을 통해 손쉽게 스토리를 구성하고 다양한 캐릭터를 만들어낼 수 있다. 특히 인공지능을 이용해 글로 캐릭터를 생성하거나 사진으로 캐릭터를 만들 수 있다. “투닝 에디터는 주로 교육 현장에서 많이 씁니다. 538개 학교에서 교사 1만2300명과 학생 22만 명이 활용하고 있죠. 간단한 작품을 만들거나 학습 활용에 효과가 크고 AI를 체험할 수 있다는 점에서 좋아들 하셔요.” 투닝 매직은 '생성형 AI 기반 웹툰 창작 스튜디오'다. “투닝 에디터가 어린 학생용이라면 투닝 매직은 전업 작가용 웹툰 창작 스튜디오죠. 스케치로 이미지를 생성하고, 작가의 화풍을 학습해 전용 캐릭터를 만들어주며, 어떤 각도에서든 일관성 있는 캐릭터를 생성하는 게 특징이죠. 명령어 고민 없이 버튼으로 이미지를 생성할 수 있는 기능도 탑재하고 있어요.” 투닝 GPT는 스토리를 써주는 툴이고 투닝 보드는 공유하는 툴이다. ■웹툰 작가를 꿈꾸다 웹툰 툴 회사 대표로 이 대표는 홍익대학교에서 디지털미디어디자인을 전공했다. 졸업 후에는 삼성전자에 들어가 사용자경험(UX) 디자인을 주로 했다. “회사에 다니면서도 웹툰 전업 작가가 되고 싶었어요. 처음엔 취미로 그렸죠. 그런데 웹툰 플랫폼 PD한테 연락이 왔어요. 제대로 해보자고요. 계약까지 맺었죠. 하지만 두 가지 일을 동시에 하기엔 너무 힘들었어요. 웹툰 연재를 하려면 최소 하루 8시간 주 60시간을 그려야 해요. 결국 전업 작가는 포기하고 말았어요. 삼성전자에는 C-LAB이라는 사내 벤처 프로젝트가 있어요. 웹툰에 대한 미련이 남아 이 프로젝트에 응모했죠. AI를 활용해 웹툰 제작에 도움이 되는 솔루션을 만드는 아이템을 냈어요. 직접 웹툰을 만들다보니 그 작업이 얼마나 힘든지 알게 됐고 이를 더 쉽게 해주는 솔루션이라면 승산이 있다고 생각하게 된 거죠. 그 때가 2017년이었죠. 알파고가 막 알려지던 때여서 AI에 관심이 없진 않았지만 그때만 해도 예측형 모델이 중심이어서 생성형은 크게 관심을 못 받았었죠. 하지만 생성형이 가능하다는 생각을 그때 우리는 했던 것이죠.” 2019년에 스핀오프 기업으로 선정되고 그해 11월 툰스퀘어가 설립됐다. 툰스퀘어는 오래전부터 인연을 맺고 삼성에서도 함께 근무한 3명의 동료가 공동 창업했다. ■“웹툰 작가의 새로운 생태계를 꿈꿉니다” 툰스퀘어는 웹툰의 쓰임새를 다양하게 생각하는 만큼 수익모델도 여러 가지다. 투닝이 서비스형 소프트웨어(SaaS)인 만큼 기본적으로 구독료 기반이다. 교육용 툴인 투닝 에디터의 경우 해외에서도 관심을 받기 시작했다. “AI에 대한 관심이 커지면서 투닝 에디터를 더 많이 찾고 있어요. 학습 효과도 높이고 AI도 체험할 수 있다는 인식이 확산된 듯해요. 홍콩 싱가포르 일본 등 아시아권에서 문의가 들어오고 있고 결과가 나쁘지 않을 것 같아요.” 기업 비즈니스도 활로가 될 것으로 기대한다. “기업이 웹툰을 활용할 방법은 아주 많다고 봐요. 예를 들어 스마트폰으로 소통할 때 문자를 쓰기도 하지만 이미지도 많이 이용하잖아요. 지금도 정형화된 이모티콘이 있지만, 나만의 밈을 만들 수 있다면 더 많이 활용할 수 있다고 봐요. 기업이 고객한테 그런 서비스를 제공할 수 있도록 하는 사업도 진행중이죠.” 툰스퀘어의 궁극적 지향은 자체 웹툰 생태계 확대에 있다. “어려서부터 투닝 에디터를 쓰는 학생들은 툰스퀘어와 계속해서 관계를 맺을 가능성이 높다고 봐요. 웹툰으로 학습하는 것을 더 재미있어 하기도 하지만 인공지능을 이용해 웹툰으로 무엇이든 만들다보면 창작 욕구가 생길 수 있잖아요. 투닝 에디터를 쓰는 학생 가운데 웹툰 작가가 많이 나올 수 있다는 의미지요. 전업 작가를 준비하는 사람들에게도 투닝의 여러 툴은 없어선 안 될 솔루션이 될 거고 이들과 툰스퀘어는 더 깊은 관계를 맺을 것입니다. 실제로 웹툰 관련 학과에 다니는 대학생들과 다양한 프로젝트도 진행하고 있습니다. '투닝 월드'라는 웹툰 플랫폼도 만들긴 했습니다만 당분간 이 플랫폼을 키우는 것보다는 투닝 툴 이용자 확대와 신인 작가 발굴 지원에 더 집중할 생각입니다. 신인 작가 발굴 및 지원은 IP 확대를 위한 것이죠. 현재 100여개 작품에 대한 IP를 확보하고 있는데 이를 지속적으로 확대하는 것이 중요하다고 봐요. 투닝 매직 고도화와 신인작가 발굴 지원을 위한 예산을 마련키 위해 현재 투자 유치 작업을 하고 있는데 투자자들은 우리가 확보할 IP 규모와 영향력에 관심이 큰 것 같아요. 결국은 IP가 사업의 관건이 되는 것이죠.” 덧붙이는 말씀: 이호영 툰스퀘어 대표가 다음 인터뷰 대상으로 추천한 사람은 전자문서 서비스 스타트업인 자버의 이동욱 대표입니다.

2024.07.11 14:02이균성

메타 왓츠앱, AI 통한 '이미지 편집' 도입한다

메타가 자사 메신저인 '왓츠앱'에 인공지능(AI)을 활용한 이미지 편집 기능을 적용한다. 지난 7일(현지시간) 더버지 등 외신에 따르면, 메타는 안드로이드용 왓츠앱 버전 2.24.14.20 업데이트에서 업로드된 이미지를 AI 챗봇이 분석하는 기능을 탑재할 예정이다. 해당 업데이트는 정식출시 전 베타버전이 공개된 상태다. 메타의 AI 챗봇은 사용자가 왓츠앱에 올린 이미지를 분석해 콘텐츠에 대한 정보를 제공한다. 사용자 요청대로 이미지 편집을 할 수도 있다. 이 기능이 도입되면 왓츠앱 사용자는 포토샵 등 별도 편집 툴이 없어도 메신저 앱 안에서 사진을 편집·조정할 수 있다. 더불어 사진에 나온 장소를 식별하거나 사물의 정보를 판별하는 것도 가능하다. 더불어 사용자는 언제든지 자기가 올린 이미지를 삭제할 수 있다. 메타 관계자는 "메타 AI와 상호작용을 통해 사용자가 이미지에 대한 통찰력을 빠르게 얻을 수 있을 것"이라며 "사용자는 자기 취향에 따라 이미지를 조정하고, AI를 실생활에 활용하는 경험도 쌓을 수 있다"고 말했다.

2024.07.08 09:49정석규

美 차기 대통령이 트럼프?…이미지 생성AI 오류 논란

"미국 다음 대통령은 도널드 트럼프라고?" 이미지 생성 인공지능(AI) 소프트웨어 '미드저니'(Midjourney)가 미국 다음 대통령 이미지 요청에 도널드 트럼프의 모습을 생성해 논란이 되고 있다고 IT매체 엔가젯이 1일(현지시간) 보도했다. 이는 미드저니가 미국 대통령 선거를 앞두고 AI가 유력 후보인 트럼프와 바이든의 이미지를 만드는 것을 차단하겠다고 밝힌 후 발생한 일이다. 보도에 따르면, 엔가젯은 미드저니에 “미국 대통령 이미지를 만들어 달라”고 요청하자 다양한 스타일의 도널드 트럼프 미국 전 대통령 이미지 4개를 생성했다. 이후 미드저니에 “다음 번 미국 대통령 이미지를 만들어 달라”고 하자 또 다시 트럼프 전 대통령 이미지 4개를 추가로 생성했다. “미국 현 대통령 이미지를 만들어 달라”는 요청에는 트럼프 이미지 3개와 버락 오바마 전 대통령 이미지 1개를 만들었다. 미드저니는 트럼프와 바이든 이미지를 만들어 달라는 명시적인 요청을 받았을 때만 두 사람의 이미지 생성 작업을 거부했다. 이 요청에 대해 미드저니는 "선거 기간 동안 '도널드 트럼프'와 '조 바이든'을 사용하지 않기로 투표했다"고 밝히며 이미지를 만들지 않았다. 엑스의 다른 사용자도 미드저니에서 트럼프의 이미지를 생성하도록 할 수 있었다고 밝혔다. 이번 테스트는 미국 대선을 앞두고 트럼프 전 대통령과 조 바이든 대통령의 이미지를 생성하지 못하도록 하는 미드저니의 보호장치가 충분하지 않다는 것을 보여준다고 해당 매체는 전했다. 실제로 사용자들이 이를 우회하는 방법은 매우 간단한 것으로 알려졌다. 이와 달리 오픈AI의 챗GPT, 마이크로소프트의 코파일럿, 구글의 제미나이, 메타 AI와 같은 다른 AI 챗봇들은 여러 번의 요청에도 불구하고 트럼프나 바이든의 이미지를 생성하지 않았다. 작년에 미드저니는 교황 베네딕토 16세가 푹신한 흰색 발렌시아가 재킷을 입은 가짜 이미지를 만드는데 사용된 바 있다. 또, 작년 트럼프 전 대통령이 성인영화 배우 스토미 대니얼스에게 돈을 지불한 혐의로 작년 맨해튼 형사 법원에서 기소되기 전 트럼프가 체포되는 가짜 이미지를 만드는 데에도 사용돼 논란이 됐다. 이후 이 회사는 무료 서비스 체험을 중단하고 월 최소 10달러의 이용료를 내는 방식으로 서비스를 변경했다. 올해 초, 오픈AI, 구글, 메타, 아마존, 어도비, 엑스 등을 포함한 20개 주요 테크 기업 연합은 2024년에 실시되는 전 세계 선거에서 딥페이크를 예방하기 위한 협정에 서명했다. 하지만, 미드저니는 해당 목록에 없는 상태다.

2024.07.02 14:19이정현

어도비 애크로뱃, 파이어플라이 AI 달았다

어도비는 파이어플라이 AI를 통합한 '어도비 애크로뱃'의 혁신을 19일 발표했다. 새로운 애크로뱃 기능을 통해 사용자는 생성형 AI로 기존 이미지를 손쉽게 개선하거나 새로운 이미지를 생성할 수 있다. 이 업데이트는 PDF 솔루션 최초의 인-앱(in-app) 이미지 생성 역량을 제공한다. 고객은 현재 유통되는 약 3 조 개의 PDF에서 어도비 파이어플라이로 구동되는 텍스트 프롬프트를 사용한 이미지 생성 및 편집을 할 수 있다. 어도비는 어도비 애크로뱃 리더 및 애크로뱃 워크플로우에 긴밀히 통합된 대화형 엔진인 애크로뱃 AI 어시스턴트 신규 기능을 통해 여러 PDF 그룹은 물론 마이크로소프트 워드 및 파워포인트, 텍스트 파일 등 다양한 유형의 문서에 걸친 정보를 바탕으로 사용자 질문에 답하고 인사이트를 제공하며 콘텐츠 제작을 지원하고, 한층 향상된 회의 기록 역량도 추가했다. 이미지 편집(Edit Image)은 파이어플라이 구동 생성형 채우기(Generative Fill), 배경 제거(Remove background), 지우기(Erase), 자르기(Crop) 등 용이한 툴을 통해 문서에 콘텐츠를 쉽게 추가, 제거 및 활성화할 수 있는 기능을 제공한다. 사용자는 원하지 않는 개체나 배경을 제거하고 새로운 이미지를 추가하며 PDF의 시각적 요소를 간편하게 제어할 수 있다. 어도비 파이어플라이 이미지 3 모델(로 구동되는 이미지 생성(Generate Image)은 PDF문서 내 어디든지 손쉽게 이미지를 추가할 수 있다. 사용하기 쉬운 강력한 디자인 툴을 통해 이미지로 문서에 전문적이며 창의적인 분위기를 더할 수 있다. 새로운 이미지 편집 및 이미지 생성을 통해 크리에이티브 전문성 없이도 누구나 쉽고 빠르게 애크로뱃에서 뛰어난 시각적 요소를 제작할 수 있다. 기업 영업팀의 경우, 텍스트가 많은 사업 계획서에 이미지 생성으로 이미지를 추가해 가독성과 영향력을 높일 수 있다. 이미지 생성 및 이미지 편집을 통해 기업은 투자자용 발표자료에서 기존 시각 요소를 업데이트 및 맞춤화하고, 홍보자료의 배경이 계절감과 문화적 요소를 반영하도록 쉽고 빠르게 업데이트하는 것도 가능하다. 리서치, 시험 준비, 데이터 분석, 회의록 작성 등의 작업 시 단일 문서 또는 파일 유형 내 있는 정보만 사용하는 경우는 드물다. 새로운 애크로뱃 AI 어시스턴트 기능은 누구나 쉽고 빠르게 문서 내 정보에서 인사이트를 얻고 서식을 만들며, 콘텐츠를 공유할 수 있도록 돕는다. 사용자는 간단한 답변부터 심도있는 리서치에 이르기까지, 선택한 여러 문서에서 주요 주제, 트렌드 및 관계를 파악하고 다양한 출처의 정보를 종합해 영향력 있는 콘텐츠로 만들 수 있다. 가령 Z세대 고객 접근 방법을 찾기 위해 PDF, 워드 및 파워포인트 등의 문서를 가지고 있는 마케터라면 애크로뱃 AI 어시스턴트에 해당 문서들을 드래그 앤 드롭 후 '해당 문서에 나타나는 주요 주제에 대한 개요 제공'과 같은 질문 제안을 빠르게 생성하고, 'Z세대의 소셜 미디어 습관은 무엇인가?'와 같은 질문도 할 수 있다. AI 어시스턴트는 문서 내 정보에 기반한 답변을 생성하고, 지능형 인용(Intelligent citations)을 포함해 마케터가 답변의 출처를 쉽게 확인하거나, 특정 위치로 빠르게 이동(quickly navigate)해 더 자세히 알아볼 수 있도록 돕는다. 이 밖에 '문서 내 핵심 내용을 이메일 형식으로 제작'과 같이 특정 목적에 맞게 정보를 보다 매력적인 콘텐츠(compelling content)로 만들 수 있게끔 서식화해달라는 요청도 가능하다. 새롭게 향상된 회의록 작성 역량은 주요 주제, 핵심 사항 및 실행 항목을 빠르게 이해할 수 있도록 자동으로 생성형 요약(generative summaries)을 제공해, 회의 참가자들이 최신 정보를 파악하며 팀이 일관된 방향으로 나아갈 수 있도록 지원한다. 어도비는 어도비 고객 데이터에 대해 자사의 생성형 AI 모델을 학습시키지 않는다. 파이어플라이 및 애크로뱃 AI 어시스턴트를 포함한 어도비 AI 기능은 책임, 의무 및 투명성이라는 어도비의 AI 윤리 원칙에 따라 개발됐다. 어도비 파이어플라이는 조정을 거친 어도비 스톡 콘텐츠와 저작권 만료된 퍼블릭 도메인 이미지를 포함한 라이선스 콘텐츠에 대해 학습하며 상업적으로 안전하게 사용하도록 설계된다. 어도비는 크리에이티브 과정에서 생성형 AI 사용에 대한 투명성을 제공하기 위해, 어도비 애크로뱃의 파이어플라이 구동 기능으로 제작 및 편집한 디지털 콘텐츠에 디지털 '영양 성분 표시' 역할을 하는 콘텐츠 자격증명(CC)을 자동 첨부해 사용자와 신뢰를 구축하고 있다. 어도비는 고객이 안심하고 기능을 사용할 수 있도록 학습, 테스트, AI 윤리 검토 위원회가 감독하는 검토 프로세스를 포함해 디자인에서부터 개발, 배포에 이르는 표준화된 과정을 구축했다. 애크로뱃의 새로운 이미지 편집 및 이미지 생성 기능은 초기에는 데스크톱에서 영어로 제공된다. 애크로뱃 AI 어시스턴트는 데스크톱, 웹 및 모바일에서 영어로 제공되며 이외 언어는 추후 제공될 예정이다. 아비간 모디 어도비 도큐먼트 클라우드 수석 부사장은 “어도비는 편집, 공유, 보호, 내보내기 등 PDF를 지속적으로 혁신하며 정적인 페이지에서 협업을 위한 작업 공간으로 변화시켜 왔다”며 “이제 생성형 AI를 통해 새로운 문서 유형 전반에 걸쳐 이미지 생성 및 인사이트를 제공하며 이 분야를 한 단계 더 발전시키고, 모든 사용자가 간단한 프롬프트를 사용해 쉽고 빠르게 정보를 더 잘 이해하고 정보를 매력적인 콘텐츠로 변환할 수 있도록 지원할 것”이라고 밝혔다.

2024.06.19 09:06김우용

中 콰이서우, 오픈AI '소라' 대적할 AI 영상 생성 기술 출시

중국 동영상 플랫폼 콰이서우가 미국 오픈AI의 '소라'에 대적하겠다며 초거대 인공지능(AI) 모델을 기반 이미지 생성 기술을 발표했다. 소라는 명령어를 입력하면 1분 분량의 영상을 만들어주는 AI 서비스다. 6일 중국 언론 IT즈자에 따르면 콰이서우는 '텍스트투이미지', '이미지투이미지' 기능을 제공하는 AI 초거대 모델 '칼라스(KOLORS, 중국어명 可灵)'를 발표하고 공식 홈페이지와 위챗 등을 통해 서비스한다고 밝혔다. 칼라스는 텍스트 입력을 통해 1080P의 2분 길이(30fps) 영상을 생성할 수 있으며 화면 비율을 자유롭게 조정할 수 있다. 유화, 컴퓨터그래픽, 핸드페인팅, 중국 판화, 3D 등 다양한 이미지 스타일 제작과, 8K의 고화질 이미지 생성을 지원한다는 게 콰이서우의 설명이다. 주요 기능은 '텍스트투이미지' 기능으로, 텍스트를 입력하면 다양한 스타일과 높은 화질을 갖춘 이미지를 생성한다. 입력된 테스트를 토대로 다양한 스타일의 이미지를 생성해주며 사용자가 참조 이미지를 업로드할 수도 있다. 이미지의 스타일, 테마, 세부 사항을 기반으로 새 작품을 생성한다. 'AI 이미지 커스터마이징' 기능은, 사용자가 인물 사진을 업로드하면 다양한 가상 이미지로 만들어주는 것이다. 일명 '인물 보존 기술'을 이용해 인물의 자연스러운 특성을 유지하면서 다양한 스타일의 인물 이미지를 생성해주는 것이다. 콰이서우는 "칼라스 초거대 모델은, 콰이서우의 AI팀이 자체 개발했으며, 소라와 유사한 기술 노선을 채택하면서 여러 자체 개발 기술 혁신을 결합해 소라에 맞대결 할 것"이라고 전했다. 콰이서우에 따르면, 칼라스의 초거대 모델 매개변수 규모는 10억 개 수준으로, 오픈소스 커뮤니티 소스 및 자체 AI 기술을 더했다. 텍스트투이미지 기능의 긴 텍스트와 복잡한 의미의 텍스트 입력을 위해 강화학습보상모델기술(RLHF)도 적용했다. 매체에 따르면 콰이서우는 칼라스 초거대 모델에 더 많은 기능이 구현하고, 표정과 신체 움직임이 동시에 구현되는 새로운 'AI 노래와 춤' 서비스도 출시할 예정이다. 한 장의 사진만 있으면, 노래하고 춤추는 영상을 얻을 수 있는 기능이다. 콰이서우는 지난해 연말 기준 평균 월 활성 사용자 수가 7억 명을 넘어선 중국의 주요 영상 플랫폼이다.

2024.06.07 09:08유효정

픽셀플러스, 1분기 영업익 1.8억원 '흑자전환'

픽셀플러스는 별도 재무제표 기준 2024년도 1분기 매출액은 약 141억4천만원, 영업이익은 약 1억8천만원을 기록했다고 17일 밝혔다. 전년동기 대비 매출액은 약 14% 증가했으며, 영업이익은 흑자로 전환했다. 픽셀플러스 관계자는 1분기 실적에 대해 “완성차 전장 시장 확대에 따른 매출처 다변화 및 수량의 증가로 인해 매출액이 증가했고, 이 같은 추세가 지속적으로 확대될 것으로 기대하고 있다”고 말했다. 픽셀플러스는 매출 구조를 수익성이 높은 비포 마켓 위주로 전환하기 위한 체질 개선 작업에 속도를 내고 있다. 비포 마켓용 자동차 이미지센서 수요가 높아지고 있는 만큼, 다양한 기술을 적용한 이미지센서 제품 사업화를 적극적으로 추진하고 있다. 나아가 비포 마켓의 티어1 업체를 대상으로 신제품 프로모션을 지속적으로 진행하고 있으며, 곧 가시적인 성과가 있을 것으로 회사 측은 기대하고 있다. 또한 신규로 개발한 FHD HDR 이미지센서를 AI 가전 및 IoT용 제품에 적용하는 등 차량 외 시장 확대를 위해 적극적으로 마케팅 활동을 전개하고 있다. 김도형 픽셀플러스 전략기획본부 상무는 “이번 1분기에는 원가비용 관리 및 수익성 확대에 집중함으로써 흑자 전환할 수 있었다”며 “픽셀플러스는 앞으로 비포 마켓향 공급망 확대 및 AI 가전 시장 공략을 위해 노력할 계획”이라고 말했다.

2024.05.17 08:44장경윤

레드햇, RHEL용 이미지 모드 출시

레드햇은 플랫폼을 컨테이너 이미지로 제공하는 레드햇 엔터프라이즈 리눅스(RHEL)의 새로운 배포 방식 'RHEL용 이미지 모드'를 출시한다고 10일 밝혔다. 이미지 모드는 운영체제의 구축, 배포 및 관리를 컨테이너 네이티브 방식으로 접근해 애플리케이션부터 기본 운영체제까지 전체 IT 환경을 동일한 도구와 기술로 관리할 수 있는 단일 워크플로우를 제공한다. RHEL 기반의 표준 운영 환경(SOE) 또는 '골드 이미지'는 많은 조직에서 각 기업이 보유한 기술 전략의 토대를 형성한다. 이러한 이미지는 데이터센터에서 퍼블릭 클라우드, 그리고 엣지에 이르는 하이브리드 클라우드를 지원하지만, 고유한 비즈니스와 환경에 걸맞도록 커스터마이즈 해야 하는 경우가 많다. 2027년까지 기업 워크로드의 50%가 중앙집중식 퍼블릭 클라우드의 외부에 위치할 것이라는 가트너의 전망과 같이, 하이브리드 클라우드 컴퓨팅의 까다로운 요구조건을 효과적으로 해결하는 것이 더욱 중요해지고 있다. 더 빠른 속도와 유연성이 요구되는 AI 워크로드가 증가하는 만큼 운영체제는 더 향상된 적응성, 확장 가능성, 그리고 반응성을 갖고 이에 응답해야 한다. 레드햇은 최신 애플리케이션 개발 관행과 컨테이너 지원을 운영체제의 핵심으로 가져와 이에 대응하고 있다. RHEL용 이미지 모드는 부트씨(bootc)와 같은 오픈소스 프로젝트의 성공을 기반으로 컨테이너 네이티브 워크플로우에 완벽하게 들어맞는 배포 모델을 구축한다. 이미지 모드를 사용하면 운영체제에서 컨테이너화된 애플리케이션과 동일한 도구, 기술 및 패턴을 사용할 수 있으므로 운영 및 인프라팀은 개발자와 동일한 언어로 소통할 수 있게 된다. 이미지 모드는 이미 컨테이너의 핵심 요소로 자리잡은 리눅스의 역할을 한 단계 더 발전시킨다. 이미지 모드에서는 깃옵스 및 CI/CD 같은 컨테이너 기반 도구와 개념을 통해 전체 운영체제를 관리할 수 있다. 이처럼 간소화된 접근 방식은 서로 다른 위치에 패치를 푸시하는 것이나 운영 팀과 애플리케이션 개발 주기 간의 단절 등 리눅스를 대규모로 관리할 때 발생하는 문제를 해결하는 데 도움이 된다. 모든 RHEL 사용자는 하이브리드 클라우드를 아우르는 모든 환경에서 간소화 및 휴대성 향상이라는 이점을 누릴 수 있다. 데브옵스 팀은 그들의 깃옵스 및 CI/CD 워크플로우에 레드햇 엔터프라이즈 리눅스를 더욱 쉽게 연결하여 플랫폼과 애플리케이션 사이에 존재하는 마찰을 완화할 수 있다. 보안팀은 스캔 및 유효성 검사부터 암호화 및 증명에 이르기까지 컨테이너 보안 도구를 운영체제의 기본 요소에 적용하여 업무의 복잡성을 줄일 수 있다. 솔루션 제공업체는 레드햇 엔터프라이즈 리눅스 기반 애플리케이션을 더 쉽게 구축, 테스트 및 배포할 수 있다. 대부분의 조직은 AI 워크로드, 또는 최소한 일정 수준의 AI 기능이 포함된 애플리케이션을 중심으로 구성된 미래를 계획하고 있다. 레드햇 엔터프라이즈 리눅스용 이미지 모드는 유연성 및 포드맨 AI랩과 긴밀한 통합을 통해 AI 애플리케이션 구축, 테스트 및 배포에 신속하게 대응할 수 있도록 지원한다. 개발자는 AI랩의 레시피 카탈로그와 간단한 AI 플레이그라운드 환경으로 크게 간소화된 프로세스를 통해, 노트북에서도 포드맨 AI랩을 사용해 지능형 애플리케이션을 구축할 수 있다. 다음으로 포드맨 데스크톱의 익스텐션인 부트씨(bootc)를사용해 컨테이너, 부팅 가능한 이미지, 또는 베어메탈 설치 도구로 쉽게 변환할 수 있으며, 이 모든 과정은 레드햇 엔터프라이즈 리눅스의 검증되고, 신뢰할 수 있으며, 일관된 기반 위에서 실행된다. 이에 더하여 레드햇 인사이트는 이미지 모드의 불변성을 지원하는 추가 관리 기능을 제공한다. 운영팀은 이제 인프라 전반에서 운영체제 이미지의 배포를 확인할 수 있으며, 관리자는 레드햇 인사이트에서 이미지 모드 시스템을 직접 업데이트할 수 있다. 향후에는 이미지 유지 관리자가 이미지를 더욱 강화할 수 있게 될 것이다. RHEL용 이미지 모드는 이제 레드햇 엔터프라이즈 9.4를 통해 프리뷰 버전으로 제공된다. 레드햇 고객은 고객 포털을 통해 새로운 배포 모델에 엑세스할 수 있으며, 사용자 누구나 레드햇 개발자 무료 서브스크립션을 통해 이에 엑세스할 수 있다. 군나르 헬렉슨 레드햇 엔터프라이즈 리눅스 및 레드햇 부사장은 “AI로 정의되는 조직의 시대에는 지능형 애플리케이션과 워크로드의 직접적인 영향을 받는 기술뿐 아니라 기업 전반에 걸쳐 있는 모든 기술을 재평가해야 한다”며 “레드햇은 업계 선도적인 엔터프라이즈 리눅스 플랫폼을 컨테이너 형식으로 제공함으로써, CIO들이 레드햇 엔터프라이즈 리눅스에 기대해 온 일관성과 신뢰를 바탕으로 AI 시대의 속도, 효율성 및 혁신에 부응하는 운영체제를 제공해 나갈 것”이라고 강조했다.

2024.05.10 10:35김우용

픽셀플러스, 소부장 으뜸기업 4기 선정...연구개발 역량 확대

CMOS 이미지센서 전문 팹리스 픽셀플러스(대표이사 이서규)는 산업통상자원부가 주관하는 '소부장(소재·부품·장비) 으뜸기업 4기'로 선정됐다고 9일 밝혔다. 소부장 으뜸기업은 반도체, 디스플레이, 자동차 등 총 7개 분야에서 국내 최고 역량과 미래 성장 가능성을 보유한 기업을 발굴해 글로벌 경쟁력을 갖춘 대표기업으로 육성하는 정부 지원사업이다. 이번 소부장 으뜸기업 4기에는 총 20개사가 선정됐다. 선정 기업은 향후 5년간 범정부 차원의 기술개발, 사업화, 글로벌 진출 등 전주기적 맞춤형 지원을 받을 예정이다. 특히 차세대 기술 개발을 위해 향후 5년간 최대 250억 원의 전용 연구개발, 수요기업 양산평가 우선지원, 대한무역투자진흥공사 글로벌 파트너링 사업연계 등 혜택을 받는다 픽셀플러스는 자동차 분야에서 자동차용 이미지센서와 영상신호처리 반도체의 뛰어난 기술력을 인정받아 으뜸기업으로 선정됐다. 픽셀플러스는 주력 제품인 차량용 이미지센서를 포함해 가전, 보안, 의료기기 등 다양한 분야에서도 고성능 이미지센서 경쟁력을 갖추고 있다. 이서규 픽셀플러스 대표이사는 "픽셀플러스는 이번 으뜸기업 지원사업을 기반으로 생명체의 눈과 가장 유사한 '인공지능형 이미지센서' 기반 기술을 개발할 계획”이라며 “이를 통해 '우리의 이미징 기술로 인류의 삶을 안전하게'라는 회사의 비전을 달성할 수 있도록 최선을 다하겠다"고 말했다.

2024.05.09 10:30장경윤

픽셀플러스, 온센서AI 기반 '포토닉 칩렛' 기술 개발

픽셀플러스가 온센서 AI 구현을 위한 '포토닉 칩렛' 기술을 개발하고, 이를 적용한 'PX9210K'를 출시했다고 8일 밝혔다. 픽셀플러스의 '포토닉 칩렛'은 이미지센서, 이미지를 처리하는 ISP(Image Signal Processor)와 AI칩을 수직으로 쌓아 패키징하는 신기술이다. 일반적인 멀티 칩 패키징 대비 제조 및 설계 난이도가 높은 기술로, 이미지센서와 ISP를 직접화하고 온도, 습도, 실장성 등 환경요인을 만족하는 설계가 필요하다. 픽셀플러스는 기술적 난제로 인해 상용화가 어려웠던 '포토닉 칩렛' 기술을 개발해 기존 대비 처리속도를 향상시키고, 제품의 사이즈를 줄일 수 있게 됐다. 또한 이미지센서에 AI칩을 탑재하는 '온센서 AI'를 구현해냈다. 온센서 AI는 이미지센서에서 생성되는 데이터를 실시간으로 처리해 소비전력과 실행시간을 동시에 단축할 수 있어서 스마트 가전, 스마트 자동차 등 다양한 스마트 IT 융합 플랫폼에 적용될 것으로 전망된다. 특히, 자동차 분야는 전동화 및 자율화에 따라 차량당 적게는 12개에서 많게는 20개까지 이미지센서 기반의 센서가 탑재될 것으로 예상된다. 아울러 다른 종류의 센서와의 융합(Sensor Fusion)을 통해 높은 정확도의 센싱이 가능할 것으로 보인다. 또 이번에 출시한 이미지센서 'PX9210K'는 지난 1월 출시한 AI 및 IoT 가전용 고성능 이미지센서 'PK9210K'와 ISP를 '포토닉 칩렛' 기술로 직접화한 통합 반도체다. 노이즈 감소와 자동노출보정 등 고성능 영상처리를 위해 영상신호처리 반도체 장착이 필요한 소형기기에 쉽게 장착할 수 있도록 실장성을 극대화한 것이 특징이다. 김도형 픽셀플러스 전략기획본부장은 "픽셀플러스는 다양한 분야에서 필수적인 수요가 예상되는 이미지센서 기술 고도화를 위해 연구개발에 최선을 다하고 있다"라며, "앞으로 온센서AI 구현을 위한 핵심 기술 '포토닉 칩렛'을 적용한 다양한 자동차 및 소비재용 온센서AI 라인업을 확대해 나갈 계획"이라고 말했다.

2024.05.08 08:33이나리

어도비, '파이어플라이 이미지 3 파운데이션 모델' 공개

어도비는 포토샵과 파이어플라이 웹 애플리케이션에서 사용할 수 있는 크리에이티브 생성형 AI 모델군의 후속 릴리스인 '어도비 파이어플라이 이미지 3 파운데이션 모델' 베타 버전을 24일 공개했다. 파이어플라이 이미지 3는 고품질 이미지 생성, 프롬프트 이해도 향상, 새로운 차원의 디테일 및 다양성, 빠른 아이디어 구상과 표현에서의 개선 등 결과의 품질과 다양한 표현에 있어 고도화된 역량을 제공한다. 어도비의 최신 파이어플라이 모델은 향상된 조명, 위치, 디테일, 텍스트 표시 등을 통해 이전보다 한층 더 사실적인 품질을 제공한다. 사용자는 파이어플라이 웹 앱 내 텍스트를 이미지로 모듈의 구조 참조 및 스타일 참조와 이미지의 종횡비를 확장하고 변경할 수 있는 생성형 채우기 모듈의 새로운 생성형 확장 기능에 파이어플라이 이미지 3를 활용할 수 있다. 파이어플라이는 작년 3월 첫 선을 보인 이래 전 세계적으로 70억 개 이상의 이미지를 생성하는 데 사용됐다. 포토샵, 어도비 익스프레스, 일러스트레이터, 서브스턴스 3D, 인디자인 등 워크플로우에 직접 통합할 수 있도록 구축된 파이어플라이는 불과 1년 만에 이미지 편집, 템플릿 제작, 벡터 디자인, 3D 텍스처링 및 스테이징 작업을 눈에 띄게 개선시켰다. 어도비는 새로운 파운데이션 모델을 출시할 때마다 크리에이터 커뮤니티에 베타 버전으로 기술을 공개하고 피드백을 통해 결과물을 발전시키고 있다. 파이어플라이 이미지3는 크리에이터가 비전을 보다 쉽게 실현하고 더 생산적으로 작업하며 고품질의 디테일한 이미지를 생성할 수 있도록 빠른 아이디어 구상과 실험을 위한 역량을 제공한다. 새로운 스타일 엔진으로 구동되는 파이어플라이 이미지 3의 새로운 자동 스타일화 역량은 더욱 다양한 고품질 결과물을 제공해, 사용자가 생성하는 이미지의 스타일을 더 잘 제어하고 개인화할 수 있도록 지원한다. 새로운 스타일, 색상, 배경, 피사체 포즈 등을 포함한 이미지 결과물은 사용자에게 창의적인 아이디어를 위한 다양한 옵션을 제공하고 보다 빠른 탐색을 돕는다. 파이어플라이 이미지 3로 구동되는 구조 참조 및 스타일 참조 역량은 탁월한 사용자 제어와 최첨단 시각적 품질을 제공한다. 사용자는 구조 참조를 통해 참조 이미지의 구조를 반영한 새로운 이미지를 빠르게 생성할 수 있어, 완벽한 프롬프트를 작성해야 하는 시행착오를 줄일 수 있다. 또한 고품질의 결과물을 제공하는 스타일 참조를 활용해 맞춤화된 스타일을 생성할 수 있다. 이러한 역량의 결합으로 사용자는 이미지 구조와 스타일을 모두 참조해 아이디어를 빠르게 실현할 수 있다. 파이어플라이 이미지 3는 개선된 조명 및 포지션 등을 통해 새로운 차원의 사진 품질을 제공한다. 특히 디테일한 이목구비와 다양한 분위기 및 표정을 반영한 인물 렌더링과 복잡한 구조물 및 군중을 표현하는 데 상당히 개선된 모습을 볼 수 있다. 파이어플라이 이미지 3는 텍스트 프롬프트와 장면에 대한 이해도가 향상되어, 길고 복잡한 프롬프트를 정확하게 반영하고 보다 풍부한 디테일이 담긴 이미지를 생성할 수 있다. 개선된 텍스트 렌더링으로 텍스트가 명확하게 표기된 이미지를 생성하는 것이 가능해져, 포스터와 같은 에셋에 대한 아이디어를 보다 효율적으로 구현할 수 있다. 파이어플라이 이미지 3는 아이콘, 로고, 래스터 이미지 및 라인 아트를 빠르게 만들 수 있도록 결과물의 일러스트레이션도 대폭 개선했다. 베타 버전으로 제공되는 파이어플라이 이미지 3는 어도비 애플리케이션의 파이어플라이 구동 생성 크레딧을 포함한 유료 구독 플랜 또는 무료로 파이어플라이 웹 앱에서 이용 가능하다. 어도비 파이어플라이는 어도비 스톡과 같은 라이선스 콘텐츠를 학습했으며, 저작권 및 상표, 로고와 같은 다른 지적재산(IP)을 침해하지 않는 상업적 용도의 콘텐츠를 생성하도록 설계됐다. 어도비는 다층적이며 지속적인 검토와 조정을 통해 어도비의 정책에 위배되는 콘텐츠를 차단 및 삭제하고, 파이어플라이가 생성한 콘텐츠에 대한 지적재산 면책 기회를 기업 고객에게 제공한다. 최근 어도비는 브랜드가 대규모 개인화를 위해 콘텐츠를 제작하고 생산하는 방식을 근본적으로 변화시키기 위해 어도비 파이어플라이 서비스 및 커스텀 모델을 도입했다. 콘텐츠 제작, 편집 및 조합을 위한 생성형 크리에이티브 API, 툴 및 서비스 활용을 지원하는 파이어플라이 서비스는 모든 제작 또는 워크플로우에 통합할 수 있어 기업의 대규모 콘텐츠 제작 자동화 시 품질 유지 및 제어를 돕는다. 커스텀 모델은 기업의 IP, 제품, 브랜드 스타일을 기반으로 생성형 AI 모델을 학습해, 크리에이티브 및 마케팅 팀이 일관되게 브랜딩을 유지할 수 있도록 지원한다. 일라이 그린필드 어도비 디지털 미디어 부문 최고기술책임자는 “1년여 만에 수백만 명의 크리에이터가 매일 아이디어를 구상하기 위해 사용하는 이미지 생성 툴로 자리잡은 파이어플라이는 아직 시작 단계에 불과하다”며 “어도비는 이미지 3 파운데이션 모델을 통해 계속해서 최첨단 기술을 발전시키고 있고, 크리에이티브 커뮤니티는 이번 베타 버전을 활용해 무궁무진한 가능성을 발휘할 것으로 기대된다”고 강조했다. AI 사용에 대한 투명성을 제공하기 위해 콘텐츠 자격증명은 파이어플라이에서 생성된 콘텐츠에 자동으로 첨부되고 있다. 디지털 콘텐츠의 '영양 성분 표시'와 같은 콘텐츠 자격증명은 제작 또는 편집 과정에서 AI를 사용했는지 여부 등 디지털 콘텐츠에 대한 상세 정보를 제공할 수 있는 위변조 확인이 가능한 메타데이터다. 콘텐츠 자격증명은 C2PA 개방형 표준을 기반으로 개발됐으며, 디지털 생태계에서 신뢰를 높이기 위해 2019년 어도비 주도로 출범한 콘텐츠 진위 이니셔티브(CAI)의 지원을 받는다. 기술, 정책, 미디어 기업, 크리에이티브 전문가, 연구원 등 약 2천500개 이상의 회원사가 참여하는 글로벌 연합으로 성장한 CAI는 디지털 콘텐츠의 투명성 향상을 위해 공동 노력하고 있다.

2024.04.24 14:18김우용

고정관념에 빠진 AI?…메타, 아시아인 이미지 오류 논란

메타의 인공지능(AI) 기반 이미지 생성기가 아시아인과 백인이 함께 있는 사진을 제대로 표현해내지 못했다고 미국 IT매체 더버지가 4일(현지시간) 보도했다. 이 같은 오류는 아시아인에 대한 고정 관념 때문일 가능성이 많다고 이 매체가 지적했다. 보도에 따르면 메타의 AI 이미지 생성기는 '아시아계 남성과 백인 아내', '아시아계 여성과 백인 남편'을 생성해달라는 단순한 지시도 제대로 이행하지 못했다. 프롬프트 내용을 변경해도 결과는 동일했다고 이 매체는 전했다. 이를테면 '개와 함께 웃고 있는 아시아계 남성과 백인 여성'을 요청하자 아시아인 2명의 이미지만 생성해냈다. '아시아 남성과 백인 여성의 결혼식'이라는 프롬프트에는 수트 차림의 아시아 남성과 전통 의상을 입은 아시아 여성을 생성하며 오류는 지속됐다. 더버지는 이 같은 오류에 대해 "아시아인과 백인이 함께 있는 모습을 주변에서 많이 볼 수 있는 데도 불구하고 메타의 AI 이미지 생성기는 그런 장면을 상상하지 못하는 것 같다"고 지적했다. 그러면서 "아시아인이 백인 옆에 서 있다는 것을 상상하지 못하는 문제는 심각하다"고 지적했다. 더버지는 흥미롭게도 '백인 아내를 둔 남아시아 남성'의 프롬프트를 명령하자 좀 더 정확한 이미지가 생성됐다고 설명했다. 이번 오류 배경으로 AI의 편향성이 의심된다고 지적했다. 남아시아 여성의 이미지엔 인도의 전통의상인 빈디와 사리가 추가 되기도 하는 등 고정관념에 크게 의존한 경향을 보였다. 생성형AI의 인종차별 학습 문제는 지속 불거져왔다. 영국 스태빌리티의 '스테이블디퓨전'에 최고경영자(CEO)를 그려달라는 명령을 내리자 백인 남성을 그리고 반면 범죄자는 흑인 남성으로 생성하는 등의 사례가 대표적이다. 더버지는 이같은 오류는 아시아인이 미국 내 문화에서 본질적으로 지워지고, 심지어는 주류 언론에서 과소대표 될 수 있다고 전했다. 더버지는 이같은 오류에 대해 질의 했지만 메타 측은 답변을 하지 않았다.

2024.04.05 11:14이한얼

"회의록·보고서 작성도 AI가"...행안부, AI 기반 업무지원 서비스 도입

정부가 회의록 자동 작성을 비롯해 보고서 작성 등에 활용할 수 있는 인공지능(AI) 기반 업무지원 서비스를 행정현장에 도입해 업무 효율성을 높인다. 행정안전부는 오는 22일부터 정부와 자치단체를 대상으로 이같은 기능을 갖춘 AI 기반 행정업무 효율화 서비스를 시범 운영한다고 21일 밝혔다. 우선 'AI 자동회의록' 서비스는 회의내용을 녹화·녹음한 파일로부터 문자를 자동 추출하고, 시간순으로 참석자와 회의내용을 자동 정리해 보고서(회의록) 형태로 제공해 준다. 사용자는 회의 영상·음성 파일을 업로드하는 것만으로도 회의내용을 손쉽게 확인할 수 있다. 영상회의의 경우 별도 음성 추출과정을 거칠 필요가 없는 것도 특징이다. 1시간 분량의 회의 영상 또는 음성 파일을 보고서 형태로 제공하는 데까지는 약 5분 가량이 소요된다. 스캔자료, 사진파일 등 공공부문에서 생산된 각종 이미지의 활용성을 높이기 위해 가 독성 높은 데이터 자원으로 변환하는 'AI 문서 인식' 서비스도 도입된다. 'AI 문서 인식' 서비스는 AI 딥러닝 기반의 광학문자인식(OCR, Optical Character Recognition) 기술을 활용한 것이다. 사용자가 이미지 파일을 업로드하면 이미지에 포함된 문자를 빠르게 인식해 문서 형태로 제공해 준다. PDF, JPEG 등 8종에 이르는 다양한 이미지 형태로부터 추출된 문자는 99% 이상의 높은 인식률을 보인다. 한글·영어·한자의 3종 언어와 숫자, 특수문자 등을 텍스트로 변환해 준다. A4 100장 분량의 PDF 문서를 텍스트로 변환하는 데 걸리는 시간은 약 40초 정도다. 변환된 원문을 기초로 주요 키워드 및 빈도, 키워드 연관도 등을 한눈에 파악할 수 있도록 시각화하고 이미지에 포함된 표를 인식해 엑셀파일로 변환하는 기능도 도입된다. 행안부는 행정기관을 대상으로 올 9월까지 시범 서비스 운영과정을 거쳐 사용자 의견을 충분히 수렴하고 서비스 보완 및 기능 고도화를 진행할 계획이다. 이상민 행안부 장관은 "인공지능(AI)과 데이터 분석 등을 통해 행정내부를 혁신해 단순 반복적인 업무 부담은 낮추고 생산성은 높이는 디지털플랫폼정부를 실현해 나갈 것"이라고 말했다.

2024.03.21 14:59이한얼

교황이 흑인?...메타 '이메진'도 황당 이미지 생성

구글 '제미나이'처럼 메타의 이미지 생성형 인공지능(AI) 모델 '이메진'도 편향된 이미지를 꾸준히 생성한 것으로 나타났다. 2일(현지시간) 악시오스 등 외신은 메타의 이메진이 편향되거나 역사적으로 틀린 이미지를 생성했다고 일제히 보도했다. 이메진 사용자는 생성 결과 오류 장면을 소셜네트워크서비스(SNS)를 통해 공유했다. 예를 들어, 사용자가 '교황 이미지를 그려줘'라고 이메진에 요청했을 때, 흑인 교황 이미지를 생성했다. '미국 식민지 시대에 어떤 사람이 국가에 거주하고 있었나'라고 물었을 때, 이메진은 아시아 여성 그룹을 그려서 사용자에게 보여주기도 했다. 프로 미식축구 선수라는 프롬프트에 미식축구 유니폼 입은 여성 모습을 생성하기도 했다. 이에 메타 측은 "더 많은 사람이 이메진 피드백을 공유한다면, 메타는 이메진 기능을 지속적으로 개선할 수 있을 것"이라고 벤처비트를 통해 밝혔다. 다수 외신은 메타가 이메진에 발생하는 인종, 성별, 직업 등에 대한 편향성을 없애기 위해 노력했지만, 기술적 보정이 지나치게 진행돼 문제를 낳았다고 분석했다. 이런 현상은 구글 제미나이의 이미지 생성 기능에서 발생하는 문제와 비슷하다. 제미나이는 지난달 이미지 생성 기능에 지속적 오류가 발생한 바 있다. 예를 들어, 사용자가 '1800년대 미국 상원의원을 생성해라'고 요청하면, 제미나이는 아메리카 원주민 여성을 닮은 인물을 내놨다. 실제 역사상 미국 첫 여성 상원의원은 1922년 등장했으며, 백인이었다. 제미나이가 잘못된 이미지를 생성한 셈이다. 이에 순다 피차이 구글 최고경영자(CEO)는 해당 오류를 인정하면서 제미나이의 이미지 생성 기능을 일시 중단하겠다고 발표했다. 피차이 CEO는 "구글 AI 연구팀은 기능 문제를 해결하기 위해 24시간 내내 노력하고 있다"며 "현재 다양한 프롬프트에서 상당한 개선이 이뤄지고 있다"고 설명했다. 이어 "그동안 문제를 추가로 검토함으로써 이에 맞는 기능 수정을 진행하겠다"고 덧붙였다.

2024.03.03 08:18김미정

中 바이트댄스, 10배 속도 '텍스트로 이미지 생성' AI 모델 공개

틱톡 모회사인 중국 바이트댄스가 텍스트로 이미지를 만들어내는 인공지능(AI) 모델을 공개했다. 24일 중국 언론 졔몐신원에 따르면 중국 바이트댄스는 텍스트투이미지(Text-to-Image) 오픈 모델 'SDXL-라이트닝(Lightning)'을 출시했다. 이 모델을 사용하면, 매우 짧은 시간에 고품질, 고해상도 이미지를 생성할 수 있으며 최근 가장 빠른 텍스트투이미지 모델로 꼽힌다고 소개됐다. 텍스트투이미지는 AI 기술을 이용해 텍스트를 기반으로 이미지를 생성해내는 기술이다. 매체에 따르면 바이트댄스의 SDXL-라이트닝 모델은 전례없는 생성 속도를 달성했으며, 2~4개 단계 만에 고품질의 고해상도 이미지를 생성해내면서 생성속도를 기존 대비 10배 향상시켰다. 이를 통해 1024 해상도에서 가장 빠른 텍스트투 이미지 모델이 됐으며, 컴퓨팅 원가를 10분의 1로 낮춘다. 이 기술을 개발한 바이트댄스의 지능창작팀에 따르면 이 모델은 오픈소스 텍스트투이미지 모델 SDXL의 업그레이드 버전으로서 개방형 모델 커뮤니티의 다른 툴 및 플러그인과 호환된다. 개발자, 연구원 및 창의적 임무를 맡은 이들이 사용할 수 있다. 중국 언론에 따르면 이 모델은 이미 AI 오픈소스 커뮤니티 허깅페이스에도 공개돼 인기 모델이 됐다.

2024.02.25 23:47유효정

훈민솔루션, 연마면 품질 자동 검사시스템 노르웨이에 수출

소부장 전문 벤처기업 훈민솔루션은 TIPA(중소기업기술정보진흥원) 연구개발지원으로 개발성공한 '마이크로미터(㎛) 단위 연마면 품질 자동 검사시스템(FAIS)'을 지난해 폴란드에 이어 지난달 노르웨이 FOSS사에 공급했다고 23일 밝혔다. AI 머신비전과 로봇 자동화 기술을 적용한 FAIS는 9um에서 2.5mm 정도 연마면의 품질을 um 단위로 검사해, 제품의 양/불량 여부 판단 및 검사결과를 데이터화 하는 자동 검사 솔루션 제품이다. 오석호 대표는 2020년 TIPA 연구개발지원으로 제품 개발에 성공해 일본 SEIKOH GIKEN사와 글로벌 협력계약을 체결했다. 이후 고 배율 확대 이미지 검사의 신뢰성과 안정성 향상, 액체렌즈를 적용해 검사속도 개선, MTP/MPO 커넥터 단면 검사기능 등 지속적인 성능향상과 기능개선을 진행했다. 그 결과 유럽, 미국 및 일본 시장에서 실증적 성능을 인정받았으며, 지난해 폴란드에 이어 올해 1월 노르웨이 수출∙공급하는데 성과를 거뒀다. 회사는 향후 독일, 이탈리아, 불가리아 등에 추가 수출을 진행할 예정이다. 오석호 대표는 "지속적인 연구개발로 마이크로LED, 반도체 웨이퍼 등의 품질검사 기능과 용접면 품질검사, 3D 표면 품질검사 등 다양한 산업분야에서 활용이 가능한 차세대 FAIS 제품을 출시하는 것이 목표"라고 밝혔다. 훈민솔루션은 측정기 개발을 시작으로 AI 이미지 분석 및 로봇자동화 모션컨트롤 등 다양한 기술분야로 사업영역을 확대하고 있는 소재,부품,장비 전문기업이다.

2024.02.23 15:50장경윤

스테이블디퓨전3 미리보기 공개

텍스트-이미지 모델 '스테이블 디퓨전'의 세번째 버전이 초기 미리보기로 공개됐다. 품질 및 철자 기능 향상, 다중 주제 프롬프트 등이 특징이다. 22일(현지시간) 스태빌리티AI는 차세대 텍스트-이미지 모델 '스테이블디퓨전 3' 초기 미리보기를 발표했다. 사용을 원하는 경우 미리보기 대기자명단에 등록해 이용할 수 있다. 접근권한을 얻게 되면 디스코드 서버 초대 메일을 받게 된다. 스테이블디퓨전은 2022년 2.0 버전 공개로 이미지 생성 AI 모델의 획기적 진보를 보여줬다. 세번째 버전은 기존 아키텍처와 달리 디퓨전 트랜스포머 아키텍처와 플로우 매칭을 결합했다. 디퓨전 트랜스포머 아키텍처는 일반적으로 사용되는 U-Net 백본을 트랜스포머로 대체해 이미지 디퓨전 모델을 훈련한다. 이 방식은 효율적으로 확장하고 더 높은 품질의 이미지를 생성할 수 있다. 플로우 매칭은 랜덤 노이즈에서 구조화된 이미지로 원환하게 전환하는 방법을 학습해 이미지를 생성하는 AI 모델을 만드는 기술이다. 스테이블디퓨전3는 이전 모델보다 더 나은 성능과 품질로 이미지를 만들어낸다. 한 프롬프트에 여러 주제를 넣을 수 있다. 철자 생성의 정확도도 더 높아졌다. 스테이블디퓨전3의 크기는 다양하다. 8억에서 80억개의 매개변수를 제공한다. 스테이블디퓨전은 기본적으로 오픈소스 라이선스를 따른다. 모델의 소스코드에 접근할 수 있고 미세조정이 가능하다. 현재 스테이블디퓨전3의 소스코드와 기술문서는 공개돼 있지 않다. 회사측은 미리보기 단계에서 성능과 안정성을 개선할 것이라고 밝혔다.

2024.02.23 10:43김우용

마이크로소프트, 슈퍼볼 광고 맞춰 '코파일럿' 디자인 개편

마이크로소프트가 생성형 인공지능(AI) 서비스 '코파일럿'의 디자인 업데이트를 발표했다. 7일(현지시간) 마이크로소프트는 미국 슈퍼볼 광고 출시에 맞춰 마이크로소프트 코파일럿의 업데이트를 실시한다고 밝혔다. 새로운 마이크로소프트 코파일럿의 디자인은 이미지 생성 기능에 초점을 맞췄다. 회전하는 여러 생성 이미지 예시로 시작화면을 꾸몄다. 채팅으로 이미지 생성을 요청하면 후보 이미지 여러장을 보여주는데 곧바로 이미지를 클릭해 입맛에 맞게 편집할 수 있다. 개체를 강조해 향상된 색상으로 돋보이게 만들거나, 이미지 배경을 흐리게 해 피사체를 빛나게 하거나, 픽셀 아트 같은 효과를 넣는 등의 작업이 가능하다. 코파일럿 프로 가입자의 경우 채팅 종료 없이 정사각형과 가로 모드 간 이미지 크기를 쉽게 조정할 수 있다. 마이크로소프트는 곧 코파일럿에서 아이디어를 시각화하는 몰입형 전용 캔버스 '디자이너 GPT 인사이드 코파일럿'을 출시할 예정이라고 밝혔다. 마이크로소프트 코파일럿은 기본 무료로 이용 가능하다. 엣지, 크롬, 파이어폭스, 사파리 등에서 이용할 수 있고, iOS와 안드로이드용 모바일 앱으로도 사용가능하다. 유서프 메흐디 마이크로소프트 수석부사장은 "오늘은 빙 챗 사용자에게 AI 기반 경험을 시작한지 정확히 1년되는 날"이라며 "그해 우리는 많은 것을 새로 배웠고 현재까지 50억개 넘는 채팅과 50억개 이미지를 생성해 코파일럿 경험의 사용이 폭발적으로 증가해 엣지와 빙 공유가 지속적으로 성장하는 것을 봤다"고 밝혔다. 그는 "AI 생성을 통해 더 많은 것을 얻으려는 사람을 위한 독특한 경험인 코파일럿을 통해 더 많은 이미지 생성 기능을 소개했다"고 강조했다. 한편, 마이크로소프트는 미국 미식축구리그(NFL) 제53회 슈퍼볼 경기에서 방영될 비디오 광고를 공개했다. 광고 영상은 일상에서 소프트웨어의 중요성을 상기시키고 마이크로소프트 코파일럿 앱을 사용하는 모습으로 채웠다.

2024.02.08 08:58김우용

픽셀플러스, AI·IoT 가전용 고성능 이미지센서 'PK9210K' 출시

CMOS 이미지센서 전문 팹리스 픽셀플러스는 AI 및 IoT 가전용 고성능 이미지센서 'PK9210K'를 개발 완료해 본격 출시한다고 18일 밝혔다. 픽셀플러스는 CMOS(상보형 금속 산화막 반도체) 이미지센서를 전문으로 개발하는 팹리스(반도체 설계 전문) 기업이다. 픽셀플러스는 주력 제품인 자동차용 이미지센서를 포함해 다양한 분야의 이미지센서를 연구개발하고 있다. 이번에 회사가 개발한 'PK9210K 2M HDR'는 최근 수요가 급증하고 있는 AI 및 IoT 가전에 특화된 이미지센서다. AI 가전의 경우 이미지센서를 활용한 영상인식의 중요성이 높아지고 있는데, 이때 영상 인식률 및 신뢰성 향상을 위해 HDR(높은 동적범위) 기능이 요구된다. 픽셀플러스의 'PK9210K'는 사람의 눈으로 보는 것과 유사한 수준의 120dB HDR을 지원해 영상인식 시 높은 인식 특성을 확보할 수 있다는 특징이 있다. 또한 'PK9210K'는 이미지센서 사용 환경이 열악한 백색가전의 특성을 고려해 우수한 저온 및 고온 동작 온도를 구현했다. 영하 40도에서 영상 105도까지 동작 온도를 확보하며, 냉장고와 오븐 등의 동작 온도를 극복하는 데 성공했다. 더불어 경쟁 제품 대비 우수한 SNR(신호 대 잡음비) 성능을 구현한 것이 특징이다. 픽셀플러스는 이미 국내외의 주요 가전 제품 제조사에 이미지 센서를 납품하고 있으며, 새로 개발한 'PK9210K'는 이전 제품보다 HDR, 전력소모, 노이즈 감소 등 전 부분에서 개선된 것으로 고객의 요구에 맞춰 빠른 시간 안에 시장에 공급할 예정이다. 회사는 'PK9120K' 이미지센서를 기반으로 AI 및 IoT 가전 제조 기업에 활발한 마케팅 활동을 전개하고 다양한 파생 제품으로 라인업을 확장할 계획이다. 더불어 픽셀플러스는 'PK9210K'를 이미러(E-Mirror), SVM(서라운드뷰모니터), 블랙박스 등 전장용으로 활용할 계획이다. 이서규 픽셀플러스 대표이사는 “픽셀플러스는 20여 년간 이미지센서 연구개발에만 주력해 온 이미지센서 전문기업으로서 시장을 선도할 수 있는 고부가가치 제품 개발에 집중하고 있다”며 “앞으로도 픽셀플러스가 보유한 기술력을 바탕으로 글로벌 이미지센서 시장 내 경쟁력을 강화해 나갈 것”이라고 말했다.

2024.01.18 09:44장경윤

게티-엔비디아, 저작권 걱정없는 이미지 생성 AI 공개

게티이미지와 엔비디아가 손잡고 마케팅, 소셜미디어, 온라인 광고 등에 상업적으로 안전하게 사용할 수 있는 인공지능(AI) 기반 이미지 생성기를 공개했다. 8일(현지시간) 미국 지디넷에 따르면, 게티는 엔비디아와 협력해 '아이스톡 생성형 AI(Generative AI by iStock)'를 출시한다고 발표했다. 게티 아이스톡의 생성형 AI는 오픈AI의 달리3처럼 자연어 지시로 이미지를 생성해주는 AI 모델이다. 이 모델은 저작권에 관계없이 온라인에서 사용가능한 이미지를 학습해 지적재산권 침해 없는 산출물을 만들어낸다. 최근 AI 기반 이미지 생성기는 저작권 침해로 몸살을 앓고 있다. 유명 작가의 작품을 무단으로 학습하고 거의 그대로 재현한 이미지를 마구잡이로 배포하고 있다는 이유로 소송에 직면했다. 어도비, 게티 등의 기업은 생성 AI의 이미지 산출물에 대한 저작권 문제를 해결하려 애써왔다. 정식 라이선스된 이미지를 AI 모델에 학습시켜 침해 가능성을 없애는 방식이다. 아이스톡 AI 이미지 생성 모델은 엔비디아의 피카소를 기반으로 만들어졌다. 여러 시각적 파운데이션 모델을 활용하며, 파운데이션 모델의 학습에 게티이미지 라이브러리 내 독점 데이터가 활용됐다. 아이스톡 이용자는 15달러를 지불하면 AI 이미지 생성을 100건을 제공받는다. 이미지를 생성하라는 메시지마다 한 건의 생성으로 본다. 각 명령에 따라 4장의 생성 이미지 옵션 중 하나를 선택할 수 있다. 사용자는 하나 또는 4개 모두 다운로드할 수 있다. 아이스톡의 생성 AI 모델로 만들어진 이미지는 아이스톡 크리에이티브 라이브러리에 추가되지 않고, 다른 사람에게 제공되지 않는다. 게티이미지는 사용자에게 최대 1만달러의 법적 배상을 지원한다.

2024.01.09 10:11김우용

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

美 재무장관 "한국과 무역협상 마무리 중"…현대차, 관세 손실 줄일까

마이크론은 어떻게 HBM4 속도를 빠르게 구현했을까

오픈AI는 왜 오라클과 '스타게이트' 함께 했나

[속보] 대법, 최태원·노소영 1조3800억원 재산분할 파기 환송

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.