• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
창간특집
인공지능
배터리
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'이미지 AI'통합검색 결과 입니다. (49건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

고정관념에 빠진 AI?…메타, 아시아인 이미지 오류 논란

메타의 인공지능(AI) 기반 이미지 생성기가 아시아인과 백인이 함께 있는 사진을 제대로 표현해내지 못했다고 미국 IT매체 더버지가 4일(현지시간) 보도했다. 이 같은 오류는 아시아인에 대한 고정 관념 때문일 가능성이 많다고 이 매체가 지적했다. 보도에 따르면 메타의 AI 이미지 생성기는 '아시아계 남성과 백인 아내', '아시아계 여성과 백인 남편'을 생성해달라는 단순한 지시도 제대로 이행하지 못했다. 프롬프트 내용을 변경해도 결과는 동일했다고 이 매체는 전했다. 이를테면 '개와 함께 웃고 있는 아시아계 남성과 백인 여성'을 요청하자 아시아인 2명의 이미지만 생성해냈다. '아시아 남성과 백인 여성의 결혼식'이라는 프롬프트에는 수트 차림의 아시아 남성과 전통 의상을 입은 아시아 여성을 생성하며 오류는 지속됐다. 더버지는 이 같은 오류에 대해 "아시아인과 백인이 함께 있는 모습을 주변에서 많이 볼 수 있는 데도 불구하고 메타의 AI 이미지 생성기는 그런 장면을 상상하지 못하는 것 같다"고 지적했다. 그러면서 "아시아인이 백인 옆에 서 있다는 것을 상상하지 못하는 문제는 심각하다"고 지적했다. 더버지는 흥미롭게도 '백인 아내를 둔 남아시아 남성'의 프롬프트를 명령하자 좀 더 정확한 이미지가 생성됐다고 설명했다. 이번 오류 배경으로 AI의 편향성이 의심된다고 지적했다. 남아시아 여성의 이미지엔 인도의 전통의상인 빈디와 사리가 추가 되기도 하는 등 고정관념에 크게 의존한 경향을 보였다. 생성형AI의 인종차별 학습 문제는 지속 불거져왔다. 영국 스태빌리티의 '스테이블디퓨전'에 최고경영자(CEO)를 그려달라는 명령을 내리자 백인 남성을 그리고 반면 범죄자는 흑인 남성으로 생성하는 등의 사례가 대표적이다. 더버지는 이같은 오류는 아시아인이 미국 내 문화에서 본질적으로 지워지고, 심지어는 주류 언론에서 과소대표 될 수 있다고 전했다. 더버지는 이같은 오류에 대해 질의 했지만 메타 측은 답변을 하지 않았다.

2024.04.05 11:14이한얼

"회의록·보고서 작성도 AI가"...행안부, AI 기반 업무지원 서비스 도입

정부가 회의록 자동 작성을 비롯해 보고서 작성 등에 활용할 수 있는 인공지능(AI) 기반 업무지원 서비스를 행정현장에 도입해 업무 효율성을 높인다. 행정안전부는 오는 22일부터 정부와 자치단체를 대상으로 이같은 기능을 갖춘 AI 기반 행정업무 효율화 서비스를 시범 운영한다고 21일 밝혔다. 우선 'AI 자동회의록' 서비스는 회의내용을 녹화·녹음한 파일로부터 문자를 자동 추출하고, 시간순으로 참석자와 회의내용을 자동 정리해 보고서(회의록) 형태로 제공해 준다. 사용자는 회의 영상·음성 파일을 업로드하는 것만으로도 회의내용을 손쉽게 확인할 수 있다. 영상회의의 경우 별도 음성 추출과정을 거칠 필요가 없는 것도 특징이다. 1시간 분량의 회의 영상 또는 음성 파일을 보고서 형태로 제공하는 데까지는 약 5분 가량이 소요된다. 스캔자료, 사진파일 등 공공부문에서 생산된 각종 이미지의 활용성을 높이기 위해 가 독성 높은 데이터 자원으로 변환하는 'AI 문서 인식' 서비스도 도입된다. 'AI 문서 인식' 서비스는 AI 딥러닝 기반의 광학문자인식(OCR, Optical Character Recognition) 기술을 활용한 것이다. 사용자가 이미지 파일을 업로드하면 이미지에 포함된 문자를 빠르게 인식해 문서 형태로 제공해 준다. PDF, JPEG 등 8종에 이르는 다양한 이미지 형태로부터 추출된 문자는 99% 이상의 높은 인식률을 보인다. 한글·영어·한자의 3종 언어와 숫자, 특수문자 등을 텍스트로 변환해 준다. A4 100장 분량의 PDF 문서를 텍스트로 변환하는 데 걸리는 시간은 약 40초 정도다. 변환된 원문을 기초로 주요 키워드 및 빈도, 키워드 연관도 등을 한눈에 파악할 수 있도록 시각화하고 이미지에 포함된 표를 인식해 엑셀파일로 변환하는 기능도 도입된다. 행안부는 행정기관을 대상으로 올 9월까지 시범 서비스 운영과정을 거쳐 사용자 의견을 충분히 수렴하고 서비스 보완 및 기능 고도화를 진행할 계획이다. 이상민 행안부 장관은 "인공지능(AI)과 데이터 분석 등을 통해 행정내부를 혁신해 단순 반복적인 업무 부담은 낮추고 생산성은 높이는 디지털플랫폼정부를 실현해 나갈 것"이라고 말했다.

2024.03.21 14:59이한얼

교황이 흑인?...메타 '이메진'도 황당 이미지 생성

구글 '제미나이'처럼 메타의 이미지 생성형 인공지능(AI) 모델 '이메진'도 편향된 이미지를 꾸준히 생성한 것으로 나타났다. 2일(현지시간) 악시오스 등 외신은 메타의 이메진이 편향되거나 역사적으로 틀린 이미지를 생성했다고 일제히 보도했다. 이메진 사용자는 생성 결과 오류 장면을 소셜네트워크서비스(SNS)를 통해 공유했다. 예를 들어, 사용자가 '교황 이미지를 그려줘'라고 이메진에 요청했을 때, 흑인 교황 이미지를 생성했다. '미국 식민지 시대에 어떤 사람이 국가에 거주하고 있었나'라고 물었을 때, 이메진은 아시아 여성 그룹을 그려서 사용자에게 보여주기도 했다. 프로 미식축구 선수라는 프롬프트에 미식축구 유니폼 입은 여성 모습을 생성하기도 했다. 이에 메타 측은 "더 많은 사람이 이메진 피드백을 공유한다면, 메타는 이메진 기능을 지속적으로 개선할 수 있을 것"이라고 벤처비트를 통해 밝혔다. 다수 외신은 메타가 이메진에 발생하는 인종, 성별, 직업 등에 대한 편향성을 없애기 위해 노력했지만, 기술적 보정이 지나치게 진행돼 문제를 낳았다고 분석했다. 이런 현상은 구글 제미나이의 이미지 생성 기능에서 발생하는 문제와 비슷하다. 제미나이는 지난달 이미지 생성 기능에 지속적 오류가 발생한 바 있다. 예를 들어, 사용자가 '1800년대 미국 상원의원을 생성해라'고 요청하면, 제미나이는 아메리카 원주민 여성을 닮은 인물을 내놨다. 실제 역사상 미국 첫 여성 상원의원은 1922년 등장했으며, 백인이었다. 제미나이가 잘못된 이미지를 생성한 셈이다. 이에 순다 피차이 구글 최고경영자(CEO)는 해당 오류를 인정하면서 제미나이의 이미지 생성 기능을 일시 중단하겠다고 발표했다. 피차이 CEO는 "구글 AI 연구팀은 기능 문제를 해결하기 위해 24시간 내내 노력하고 있다"며 "현재 다양한 프롬프트에서 상당한 개선이 이뤄지고 있다"고 설명했다. 이어 "그동안 문제를 추가로 검토함으로써 이에 맞는 기능 수정을 진행하겠다"고 덧붙였다.

2024.03.03 08:18김미정

中 바이트댄스, 10배 속도 '텍스트로 이미지 생성' AI 모델 공개

틱톡 모회사인 중국 바이트댄스가 텍스트로 이미지를 만들어내는 인공지능(AI) 모델을 공개했다. 24일 중국 언론 졔몐신원에 따르면 중국 바이트댄스는 텍스트투이미지(Text-to-Image) 오픈 모델 'SDXL-라이트닝(Lightning)'을 출시했다. 이 모델을 사용하면, 매우 짧은 시간에 고품질, 고해상도 이미지를 생성할 수 있으며 최근 가장 빠른 텍스트투이미지 모델로 꼽힌다고 소개됐다. 텍스트투이미지는 AI 기술을 이용해 텍스트를 기반으로 이미지를 생성해내는 기술이다. 매체에 따르면 바이트댄스의 SDXL-라이트닝 모델은 전례없는 생성 속도를 달성했으며, 2~4개 단계 만에 고품질의 고해상도 이미지를 생성해내면서 생성속도를 기존 대비 10배 향상시켰다. 이를 통해 1024 해상도에서 가장 빠른 텍스트투 이미지 모델이 됐으며, 컴퓨팅 원가를 10분의 1로 낮춘다. 이 기술을 개발한 바이트댄스의 지능창작팀에 따르면 이 모델은 오픈소스 텍스트투이미지 모델 SDXL의 업그레이드 버전으로서 개방형 모델 커뮤니티의 다른 툴 및 플러그인과 호환된다. 개발자, 연구원 및 창의적 임무를 맡은 이들이 사용할 수 있다. 중국 언론에 따르면 이 모델은 이미 AI 오픈소스 커뮤니티 허깅페이스에도 공개돼 인기 모델이 됐다.

2024.02.25 23:47유효정

훈민솔루션, 연마면 품질 자동 검사시스템 노르웨이에 수출

소부장 전문 벤처기업 훈민솔루션은 TIPA(중소기업기술정보진흥원) 연구개발지원으로 개발성공한 '마이크로미터(㎛) 단위 연마면 품질 자동 검사시스템(FAIS)'을 지난해 폴란드에 이어 지난달 노르웨이 FOSS사에 공급했다고 23일 밝혔다. AI 머신비전과 로봇 자동화 기술을 적용한 FAIS는 9um에서 2.5mm 정도 연마면의 품질을 um 단위로 검사해, 제품의 양/불량 여부 판단 및 검사결과를 데이터화 하는 자동 검사 솔루션 제품이다. 오석호 대표는 2020년 TIPA 연구개발지원으로 제품 개발에 성공해 일본 SEIKOH GIKEN사와 글로벌 협력계약을 체결했다. 이후 고 배율 확대 이미지 검사의 신뢰성과 안정성 향상, 액체렌즈를 적용해 검사속도 개선, MTP/MPO 커넥터 단면 검사기능 등 지속적인 성능향상과 기능개선을 진행했다. 그 결과 유럽, 미국 및 일본 시장에서 실증적 성능을 인정받았으며, 지난해 폴란드에 이어 올해 1월 노르웨이 수출∙공급하는데 성과를 거뒀다. 회사는 향후 독일, 이탈리아, 불가리아 등에 추가 수출을 진행할 예정이다. 오석호 대표는 "지속적인 연구개발로 마이크로LED, 반도체 웨이퍼 등의 품질검사 기능과 용접면 품질검사, 3D 표면 품질검사 등 다양한 산업분야에서 활용이 가능한 차세대 FAIS 제품을 출시하는 것이 목표"라고 밝혔다. 훈민솔루션은 측정기 개발을 시작으로 AI 이미지 분석 및 로봇자동화 모션컨트롤 등 다양한 기술분야로 사업영역을 확대하고 있는 소재,부품,장비 전문기업이다.

2024.02.23 15:50장경윤

스테이블디퓨전3 미리보기 공개

텍스트-이미지 모델 '스테이블 디퓨전'의 세번째 버전이 초기 미리보기로 공개됐다. 품질 및 철자 기능 향상, 다중 주제 프롬프트 등이 특징이다. 22일(현지시간) 스태빌리티AI는 차세대 텍스트-이미지 모델 '스테이블디퓨전 3' 초기 미리보기를 발표했다. 사용을 원하는 경우 미리보기 대기자명단에 등록해 이용할 수 있다. 접근권한을 얻게 되면 디스코드 서버 초대 메일을 받게 된다. 스테이블디퓨전은 2022년 2.0 버전 공개로 이미지 생성 AI 모델의 획기적 진보를 보여줬다. 세번째 버전은 기존 아키텍처와 달리 디퓨전 트랜스포머 아키텍처와 플로우 매칭을 결합했다. 디퓨전 트랜스포머 아키텍처는 일반적으로 사용되는 U-Net 백본을 트랜스포머로 대체해 이미지 디퓨전 모델을 훈련한다. 이 방식은 효율적으로 확장하고 더 높은 품질의 이미지를 생성할 수 있다. 플로우 매칭은 랜덤 노이즈에서 구조화된 이미지로 원환하게 전환하는 방법을 학습해 이미지를 생성하는 AI 모델을 만드는 기술이다. 스테이블디퓨전3는 이전 모델보다 더 나은 성능과 품질로 이미지를 만들어낸다. 한 프롬프트에 여러 주제를 넣을 수 있다. 철자 생성의 정확도도 더 높아졌다. 스테이블디퓨전3의 크기는 다양하다. 8억에서 80억개의 매개변수를 제공한다. 스테이블디퓨전은 기본적으로 오픈소스 라이선스를 따른다. 모델의 소스코드에 접근할 수 있고 미세조정이 가능하다. 현재 스테이블디퓨전3의 소스코드와 기술문서는 공개돼 있지 않다. 회사측은 미리보기 단계에서 성능과 안정성을 개선할 것이라고 밝혔다.

2024.02.23 10:43김우용

마이크로소프트, 슈퍼볼 광고 맞춰 '코파일럿' 디자인 개편

마이크로소프트가 생성형 인공지능(AI) 서비스 '코파일럿'의 디자인 업데이트를 발표했다. 7일(현지시간) 마이크로소프트는 미국 슈퍼볼 광고 출시에 맞춰 마이크로소프트 코파일럿의 업데이트를 실시한다고 밝혔다. 새로운 마이크로소프트 코파일럿의 디자인은 이미지 생성 기능에 초점을 맞췄다. 회전하는 여러 생성 이미지 예시로 시작화면을 꾸몄다. 채팅으로 이미지 생성을 요청하면 후보 이미지 여러장을 보여주는데 곧바로 이미지를 클릭해 입맛에 맞게 편집할 수 있다. 개체를 강조해 향상된 색상으로 돋보이게 만들거나, 이미지 배경을 흐리게 해 피사체를 빛나게 하거나, 픽셀 아트 같은 효과를 넣는 등의 작업이 가능하다. 코파일럿 프로 가입자의 경우 채팅 종료 없이 정사각형과 가로 모드 간 이미지 크기를 쉽게 조정할 수 있다. 마이크로소프트는 곧 코파일럿에서 아이디어를 시각화하는 몰입형 전용 캔버스 '디자이너 GPT 인사이드 코파일럿'을 출시할 예정이라고 밝혔다. 마이크로소프트 코파일럿은 기본 무료로 이용 가능하다. 엣지, 크롬, 파이어폭스, 사파리 등에서 이용할 수 있고, iOS와 안드로이드용 모바일 앱으로도 사용가능하다. 유서프 메흐디 마이크로소프트 수석부사장은 "오늘은 빙 챗 사용자에게 AI 기반 경험을 시작한지 정확히 1년되는 날"이라며 "그해 우리는 많은 것을 새로 배웠고 현재까지 50억개 넘는 채팅과 50억개 이미지를 생성해 코파일럿 경험의 사용이 폭발적으로 증가해 엣지와 빙 공유가 지속적으로 성장하는 것을 봤다"고 밝혔다. 그는 "AI 생성을 통해 더 많은 것을 얻으려는 사람을 위한 독특한 경험인 코파일럿을 통해 더 많은 이미지 생성 기능을 소개했다"고 강조했다. 한편, 마이크로소프트는 미국 미식축구리그(NFL) 제53회 슈퍼볼 경기에서 방영될 비디오 광고를 공개했다. 광고 영상은 일상에서 소프트웨어의 중요성을 상기시키고 마이크로소프트 코파일럿 앱을 사용하는 모습으로 채웠다.

2024.02.08 08:58김우용

픽셀플러스, AI·IoT 가전용 고성능 이미지센서 'PK9210K' 출시

CMOS 이미지센서 전문 팹리스 픽셀플러스는 AI 및 IoT 가전용 고성능 이미지센서 'PK9210K'를 개발 완료해 본격 출시한다고 18일 밝혔다. 픽셀플러스는 CMOS(상보형 금속 산화막 반도체) 이미지센서를 전문으로 개발하는 팹리스(반도체 설계 전문) 기업이다. 픽셀플러스는 주력 제품인 자동차용 이미지센서를 포함해 다양한 분야의 이미지센서를 연구개발하고 있다. 이번에 회사가 개발한 'PK9210K 2M HDR'는 최근 수요가 급증하고 있는 AI 및 IoT 가전에 특화된 이미지센서다. AI 가전의 경우 이미지센서를 활용한 영상인식의 중요성이 높아지고 있는데, 이때 영상 인식률 및 신뢰성 향상을 위해 HDR(높은 동적범위) 기능이 요구된다. 픽셀플러스의 'PK9210K'는 사람의 눈으로 보는 것과 유사한 수준의 120dB HDR을 지원해 영상인식 시 높은 인식 특성을 확보할 수 있다는 특징이 있다. 또한 'PK9210K'는 이미지센서 사용 환경이 열악한 백색가전의 특성을 고려해 우수한 저온 및 고온 동작 온도를 구현했다. 영하 40도에서 영상 105도까지 동작 온도를 확보하며, 냉장고와 오븐 등의 동작 온도를 극복하는 데 성공했다. 더불어 경쟁 제품 대비 우수한 SNR(신호 대 잡음비) 성능을 구현한 것이 특징이다. 픽셀플러스는 이미 국내외의 주요 가전 제품 제조사에 이미지 센서를 납품하고 있으며, 새로 개발한 'PK9210K'는 이전 제품보다 HDR, 전력소모, 노이즈 감소 등 전 부분에서 개선된 것으로 고객의 요구에 맞춰 빠른 시간 안에 시장에 공급할 예정이다. 회사는 'PK9120K' 이미지센서를 기반으로 AI 및 IoT 가전 제조 기업에 활발한 마케팅 활동을 전개하고 다양한 파생 제품으로 라인업을 확장할 계획이다. 더불어 픽셀플러스는 'PK9210K'를 이미러(E-Mirror), SVM(서라운드뷰모니터), 블랙박스 등 전장용으로 활용할 계획이다. 이서규 픽셀플러스 대표이사는 “픽셀플러스는 20여 년간 이미지센서 연구개발에만 주력해 온 이미지센서 전문기업으로서 시장을 선도할 수 있는 고부가가치 제품 개발에 집중하고 있다”며 “앞으로도 픽셀플러스가 보유한 기술력을 바탕으로 글로벌 이미지센서 시장 내 경쟁력을 강화해 나갈 것”이라고 말했다.

2024.01.18 09:44장경윤

게티-엔비디아, 저작권 걱정없는 이미지 생성 AI 공개

게티이미지와 엔비디아가 손잡고 마케팅, 소셜미디어, 온라인 광고 등에 상업적으로 안전하게 사용할 수 있는 인공지능(AI) 기반 이미지 생성기를 공개했다. 8일(현지시간) 미국 지디넷에 따르면, 게티는 엔비디아와 협력해 '아이스톡 생성형 AI(Generative AI by iStock)'를 출시한다고 발표했다. 게티 아이스톡의 생성형 AI는 오픈AI의 달리3처럼 자연어 지시로 이미지를 생성해주는 AI 모델이다. 이 모델은 저작권에 관계없이 온라인에서 사용가능한 이미지를 학습해 지적재산권 침해 없는 산출물을 만들어낸다. 최근 AI 기반 이미지 생성기는 저작권 침해로 몸살을 앓고 있다. 유명 작가의 작품을 무단으로 학습하고 거의 그대로 재현한 이미지를 마구잡이로 배포하고 있다는 이유로 소송에 직면했다. 어도비, 게티 등의 기업은 생성 AI의 이미지 산출물에 대한 저작권 문제를 해결하려 애써왔다. 정식 라이선스된 이미지를 AI 모델에 학습시켜 침해 가능성을 없애는 방식이다. 아이스톡 AI 이미지 생성 모델은 엔비디아의 피카소를 기반으로 만들어졌다. 여러 시각적 파운데이션 모델을 활용하며, 파운데이션 모델의 학습에 게티이미지 라이브러리 내 독점 데이터가 활용됐다. 아이스톡 이용자는 15달러를 지불하면 AI 이미지 생성을 100건을 제공받는다. 이미지를 생성하라는 메시지마다 한 건의 생성으로 본다. 각 명령에 따라 4장의 생성 이미지 옵션 중 하나를 선택할 수 있다. 사용자는 하나 또는 4개 모두 다운로드할 수 있다. 아이스톡의 생성 AI 모델로 만들어진 이미지는 아이스톡 크리에이티브 라이브러리에 추가되지 않고, 다른 사람에게 제공되지 않는다. 게티이미지는 사용자에게 최대 1만달러의 법적 배상을 지원한다.

2024.01.09 10:11김우용

  Prev 1 2 3 Next  

지금 뜨는 기사

이시각 헤드라인

블록체인 가상자산, '입법지연·예산삭감·규제' 악순환 끊어야

[AI는 지금] 대선후보들 'AI 전쟁' 돌입…기술 주권부터 전력 인프라까지 격돌

한화 김동선 진두지휘 ‘벤슨' 뭐가 다른가…‘100% 국내산 유제품'

SKT "정보 유출 없다 '확신'...있더라도 끝까지 책임"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현