• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 인터뷰
  • 인사•부음
  • 글로벌뉴스
인공지능
배터리
양자컴퓨팅
컨퍼런스
칼럼•연재
포토•영상

ZDNet 검색 페이지

'깃허브'통합검색 결과 입니다. (33건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

MS 개발자 커뮤니티 부사장 "깃허브 코파일럿이 프로그래머 생산성 혁신했다"

"인공지능(AI)은 현재 소프트웨어 개발을 혁신하고 있습니다. 마이크로소프트 '깃허브 코파일럿'과 같은 도구를 통해 개발자들은 아이디어를 코드로 구현하는 데 도움을 받게 됐습니다. 이로써 반복적인 작업을 줄이고 생산성을 높이고 있습니다." 스콧 한셀만 마이크로소프트 개발자 커뮤니티 부사장은 지난 24일부터 사흘간 진행된 '이노베이트 위드 AI: 마이크로소프트 애저 부트캠프' 웨비나에서 이같이 말하며 AI 기반 도구인 '깃허브 코파일럿(GitHub Copilot)'이 개발자들의 생산성 향상에 어떻게 기여하는지 강조했다. 한셀만 부사장은 26일 'AI 페어 프로그래머와 함께 개발자 생산성 향상' 세션에 참가해 최신 AI 기술과 비즈니스 적용 사례를 공유했다. 이 자리에는 한셀만 부사장 뿐만 아니라 스콧 덴스모어 깃허브 부사장과 케다샤 커 깃허브 개발자도 함께 참여해 AI 도구의 실제 활용 사례와 개발자 경험에 대해 논의했다. 덴스모어 깃허브 부사장은 개발자가 아이디어를 코드로 구현하는 방법을 모를 때 '깃허브 코파일럿'이 큰 도움이 된다는 점을 강조했다. 일종의 AI 동료로서, '코파일럿'은 개발자가 직면한 문제를 이해하고 적절한 솔루션을 제안할 수 있기 때문이다. 그는 "예전에는 프로그래머들이 책과 전문가에만 의존하고 생각을 구조화할 때는 인형을 가져다 설명하는 식으로 일을 구조화 했다"며 "이제는 상황에 대한 이해도가 있는 코파일럿이 말동무를 해주기 때문에 문제 해결이 쉬워졌다"고 강조했다. 이를 증명하기 위해 한셀만 부사장은 '비주얼 스튜디오 코드(VS Code)'에서 '깃허브 코파일럿'을 활용해 문제가 있는 코드를 직접 지목하고 해결하는 데모를 선보였다. '깃허브 코파일럿'을 통해 손쉽게 문제를 해결한 후 그는 "AI 페어 프로그래머가 있다면 문제 해결에 큰 도움이 된다"며 "AI 어시스턴트나 페어 프로그래머가 어떻게 작업을 효율적으로 처리할 수 있는지 보여주고 싶었다"고 말했다. 그러면서 "코파일럿은 코드의 의도를 파악하고 적절한 코드를 제안해 개발자가 창의적인 업무에 집중할 수 있게 한다"고 밝혔다. 덴스모어 부사장에 따르면 '코파일럿'의 사용은 실제 산업 현장에서도 기업의 수익률 향상에 도움이 된다. 이는 개발자의 행복도와 생산성에 직결되기 때문이다. 덴스모어 부사장은 "코파일럿을 도입하면 투자 수익률(ROI)이 높다"며 "생각하고 창의적인 문제를 해결하기 위해 일하는 개발자들이 더이상 단순히 타이핑을 할 필요가 없게 해 그들의 자기효능감을 높이기 때문"이라고 주장했다. 그러면서 "개발자들이 이 도구를 원하지만 리더십이 도입을 주저할 때에는 코파일럿의 효과를 강조해 설득할 수 있다"고 말했다. 코파일럿은 코드 내의 취약점을 감지하고 자동 수정 기능을 제공해 보안성 있는 소프트웨어 개발에도 기여한다. 이에 대해 덴스모어 부사장은 "코파일럿은 책임 있는 AI 필터를 통해 취약점을 찾아내고 개발자 워크플로우에 자연스럽게 보안 기능을 통합한다"고 설명했다. 세 명의 패널들은 세션을 마치며 '깃허브 코파일럿' 등 AI 도구가 개발자들의 생산성과 워크플로우에 혁신적인 변화를 가져오고 있음을 확인했다. 동료처럼 기능하는 AI 프로그래머가 개발자들의 병목 현상을 해결하고 더 빠르고 효율적인 개발을 가능하기 때문이다. 덴스모어 부사장은 "AI 도구는 개발자들의 행복도를 높이고 이는 곧 기업의 혁신으로 이어진다"며 "AI와 함께하는 개발의 미래는 이미 시작됐으며 이를 적극 활용하는 것이 중요하다"고 강조했다.

2024.09.26 16:39조이환

KAIST, 멀티모달 대형언어모델 '깃허브' 공개…GPT-4V 시각성능 "제꼈다"

국내 연구진이 오픈AI의 GPT-4V와 구글 제미나이-프로(Gemini-Pro)의 시각 성능을 능가하는 멀티모달 대형언어모델을 개발, 오픈소스 커뮤니티 깃허브(Github)에 공개했다. 최근 주목받는 생성형 AI 트랜드가 멀티모달화로 진화 중이어서 귀추가 주목됐다. KAIST는 전기및전자공학부 노용만 교수 연구팀이 GPT-4V 등 비공개 상업 모델의 시각 성능을 넘어서는 공개형 멀티모달 대형언어모델을 선보였다고 20일 밝혔다. 연구팀은 멀티모달 대형언어모델 시각 성능을 개선하기 위해 '콜라보(CoLLaVO)'와 '모아이(MoAI)' 2가지 기술을 자체 개발했다. 이병관 연구원(박사과정,제1저자)은 "GPT-4V나 제미나이-프로 등과 시각성능 만을 비교하면 점수나 정확도 면에서 최대 10% 더 우수하다"고 말했다. 인지추론성도 함께 따져봐야 하지만, 이는 이번 연구 주제에서 벗어나 나중에 생각할 부분이라는 것이 이 연구원 얘기다. 사실 인지추론성도 개별 검토한 결과 오픈AI나 구글 모델 대비 결코 뒤지진 않는다는 것이 이 연구원의 귀뜸이다. 연구팀은 '콜라보'를 개발하기 전 기존 공개형 멀티모달 대형언어모델 성능이 비공개형에 비해 떨어지는 이유를 1차적으로 물체 수준에 대한 이미지 이해 능력 저하에서 찾았다. 연구팀은 이를 개선하기 위해 이미지 내 정보를 배경과 물체 단위로 분할하고 각 배경 및 물체에 대한 정보를 멀티모달 대형언어모델에 직접 넣어주는 '크레용 프롬프트(Crayon Prompt)'라는 시각적 프롬프트를 새로 설계했다. 또 시각적 지시 조정 단계에서 크레용 프롬프트로 학습한 정보를 잃어버리지 않기 위해 물체 수준 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터로 학습시키는 획기적인 학습전략인 '듀얼 큐로라(Dual QLoRA)'를 제안했다. 이병관 연구원은 "이로 인해 이미지 내에서 배경 및 물체를 1차원적으로 구분하는 능력이 크게 향상됐다"고 덧붙였다. 대형언어모델인 모아이(MoAI)'도 개발했다. 인간이 사물을 판단하는 인지과학적 요소(물체 존재나 상태, 상호작용, 배경, 텍스트 등)에서 영감을 얻었다는 것이 연구팀 설명이다. 연구팀은 "기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용하기 때문에, 이미지 픽셀 수준에서의 상세하고 종합적인 실세계 장면에 대한 이해가 모자란다고 판단했다"고 말했다. 연구팀은 △전체적 분할 △한계가 없는 물체 검출기 △상황 그래프 생성 △글자 인식 등 4가지 컴퓨터 비전 모델을 언어로 변환한 뒤 멀티모달 대형언어모델에 입력했다. 이를 연구팀이 실제 검증한 결과 '콜라보'는 Math Vista(대학수준 수학 및 물리문제)나 MM-벤치(영어 객관식 문제), MMB-CN(중국어 객관식 문제), AI2D(어학문제) 등의 풀이에서 기존 모델 대비 최대 10%까지 점수와 정확도가 우수했다. 또 '모아이'는 기존 공개형 및 비공개형 LLVMs(멀티모달 대형언어)와 비교한 결과 각 질문에 따라 점수가 20포인트 이상 우수하게 답변한 경우도 나타났다. 이병관 연구원은 "3개월전 깃허브에 올려놓은 '콜라보'(https://github.com/ByungKwanLee/CoLLaVO)와 '모아이'(https://github.com/ByungKwanLee/MoAI)에 관심을 가져달라"며 "박사학위가 마무리되면 멀티모달 대형언어를 아이템으로 창업할 생각도 있다"고 말했다. 박사과정 5년차인 이 연구원은 또 "개인적으로 향후 기회가 닿는다면, 핸드폰에 들어가는 사이즈로 현재 성능을 유지하는 멀티모달 대형언어모델을 만들어 볼 것"이라고 덧붙였다. 노용만 교수는 “연구팀에서 개발한 공개형 멀티모달 대형언어모델이 허깅페이스 일간 화제의 논문(Huggingface Daily Papers)에 추천됐다"며 "SNS 등을 통해 전세계에 점차 알려지는 등 관련분야 발전에 기여할 것"으로 기대했다. 연구에는 논문 제1저자 이병관 박사과정 연구원 외에도 박범찬 석박사통합과정, 김채원 박사과정이 공동 저자로 참여했다. 연구결과는 '콜라보'의 경우 자연어 처리(NLP) 분야 국제 학회 'ACL Findings 2024'(5월16일자)에 게재됐다. '모아이(MoAI)'는 컴퓨터 비전 국제 학회인 'ECCV 2024'에 논문을 제출하고 결과를 기다리고 있다. 한편 이 연구는 KAIST 미래국방 인공지능 특화연구센터 및 전기및전자공학부 지원을 받아 수행했다.

2024.06.20 14:26박희범

"인스턴스 무단 접근" 깃허브, 최고 수준 보안 위협 발견

깃허브 엔터프라이즈 서버(GHES)에서 무단으로 다른 사용자의 인스턴스에 접근할 수 있는 최고 수준의 보안 위협이 발견됐다. 깃허브 측은 해당 취약점에 대한 문제를 해결했으며, 취약한 버전의 GHES를 사용하는 조직은 최신 버전으로 업데이트할 것을 권고했다. 21일(현지시간) 해커뉴스 등 외신에 따르면 깃허브는 미국 국립표준기술연구소(NIST)의 국가 취약점 데이터베이스를 통해 취약점에 대한 세부 정보를 공개했다. CVE-2024-4985라고 명명된 해당 취약점은 CVSS 점수 10점으로 가장 심각한 위협 수준을 기록했다. 공개된 내용에 따르면 이 취약점은 SAML 싱글사인온(SSO) 인증 과정에서 위조한 인증으로 사이트 관리자 권한을 탈취하는 방식이다. 이를 통해 추가 인증 없이 다른 사용자의 인스턴스에 무단으로 접근하는 것이 가능해진다. 깃허브 측은 해당 취약점이 지난 달 버그바운티 프로그램을 통해 보고된 것이라며 3.13.0 이전 모든 GHES 버전에 영향을 미쳤다고 밝혔다. 또한 개선 작업을 통해 지난달 25일 3.9.15, 3.10.12, 3.11.10 및 3.12.4 버전에서 해당 취약점에 대한 수정작업을 마쳤다며, 이전 버전을 사용 중인 조직은 잠재적인 보안 위협을 제거할 수 있도록 최신 버전으로 업데이트할 필요가 있다고 권고했다.

2024.05.22 09:36남혁우

마이크로소프트, '깃허브 코파일럿 익스텐션' 출시

깃허브 코파일럿이 익스텐션 기능을 달고 워크플로우 통합 범위를 확장한다. 마이크로소프트는 21일(현지시간) 미국 시애틀에서 개최한 연례 개발자 컨퍼런스 '마이크로소프트 빌드 2024'에서 '깃허브 코파일럿 익스텐션'의 제한 미리보기를 발표했다. 깃허브 코파일럿 익스텐션은 IDE나 깃허브닷컴을 벗어나지 않고 다양한 도구와 서비스를 깃허브 코파일럿에서 즉시 사용할 수 있게 해준다. 데이터스택스, 도커, 람다테스트, 런치다클리, 맥킨지&컴퍼니, 마이크로소프트 애저 및 팀즈, 몽고DB, 옥토퍼스디플로이, 판게아, 파인콘, 프로덕트사이언스, 리드미, 센트리io, 스트라이프 등의 익스텐션이 우선 공개됐다. 깃허브 마켓플레이스에서 코파일럿 익스텐션을 찾아 설치할 수 있으며, 개발자가 직접 비공개 익스텐션을 만들어 내부 API 라이브러리의 기능이나 맞춤형 모니터링 시스템에 활용할 수 있다. 깃허브 코파일럿 챗에서 다양한 도구를 바로 호출해 맥락을 파악하고, 작업을 수행하며, 파일 및 풀 요청을 생성해 전체 워크플로우를 가속할 수 있다고 회사측은 설명했다. 마이크로소프트가 직접 제공하는 익스텐션인 '애저용 깃허브 코파일럿'은 자연어를 사용해 애저 서비스 선택, 리액트 앱 실행, 애저 데이터베이스 선택 등 애저에 대한 질문과 답변을 얻을 수 있게 한다. 애저용 깃허브 코파일럿은 배포 시점에 이르러 성공적 출시를 위한 단계를 개발자에게 안내한다. 마이크로소프트는 수개월 내 비주얼스튜디오 마켓플레이스에서도 다양한 익스텐션을 이용할 수 있다고 밝혔다.

2024.05.22 00:46김우용

레이 오지의 플로피에서 발견된 MS-DOS 4.0 코드 공개

MS-DOS에서 OS/2로 넘어가는 중간단계의 멀티태스킹 DOS의 소스코드가 발견돼 일반에 공개됐다. 마이크로소프트는 지난 26일 깃허브에 'MS-DOS 4.0' 소스코드를 MIT 라이선스로 공개했다. 이 소스코드는 마이크로소프트 내부 저장소에 없던 것을 우연한 기회로 복원한 것이다. 마이크로소프트에 의하면, 마이크로소프트 아카이브에 MS-DOS 4.0의 완벽한 코드는 없었다고 한다. 영국의 코노 스타프로스트 하이드란 연구원은 DOS 4, MT-DOS와 OS/2 간의 관계를 문서화하는 작업을 진행하던 중 플로피디스크에 담긴 MS-DOS 4.0의 소스코드 일부를 발견했다. 그는 전 마이크로소프트 최고기술책임자(CTO)인 전설적인 프러그래머 레이 오지에게 서신을 보냈다. 레이 오지는 자신의 플로피디스크 중 1984년 5월 작성한 미공개 DOS 4.0 베타 바이너리를 발견했다. 하이드는 마이크로소프트의 오픈소스프로그램오피스(OSPO)에 연락했고 DOS 4의 소스를 탐색할 것을 요청했다. 이에 스콧 한셀만 마이크로소프트 개발자커뮤니티 부사장이 인쇄된 레이오지의 스캔 문서를 보고 원본 디스크 이미지를 만들었다. 이미지에 사용된 바이너리는 1984년 5월 컴파일된 것으로, 마이크로소프트의 OEM과 파트너에게 MS-DOS 4.0 베타 릴리스 버전이 전달된 건 1984년 6월5일이었다. 깃허브에 공개된 MS-DOS 4.0은 소스코드 외에도 레이오지의 DOS 문서 PDF도 포함한다. MS-DOS 4.0은 마이크로소프트와 IBM 공동으로 개발한 운영체제(OS)다. DOS는 1980년대 중반 시애틀컴퓨터프로덕트(SCP)란 회사의 개발자 팀 패터슨이 작성한 QDOS에서 시작됐으며, IBM이 1981년 마이크로소프트에 위탁개발한 후 라이선스를 구입해 인텔 프로세서의 이름에서 딴 86-DOS로 이름을 바꿨다. 이후 1981년 중반 마이크로소프트가 라이선스를 획득해 일반에 판매하며 MS-DOS로 공급된다. IBM은 자사 제품에 탑재되는 DOS를 PC-DOS라 불렀다. 팀 패터슨을 고용해 6주만에 MS-DOS 1.0을 개발완료한 마이크로소프트는 그 직후 더 온전한 OS로서 기능을 갖춘 MS-DOS 개발을 추진했다. 특히 단일작업 OS였던 MS-DOS에 두 가지 이상의 작업을 같이 수행할 수 있는 멀티태스킹 기능이 강하게 요구됐다. 멀티태스킹 DOS 개발은 1981년부터 시작됐지만, 계속 지연되다 1984년 버전명이 MS-DOS 4.0이란 이름을 받았다. MS-DOS 4.0믄 멀티태스킹 MS-DOS의 약어인 'MT-DOS'로도 불렸다. MS-DOS 4.0은 일반에 널리 판매되지 않았다. 4.0 버전은 일부 소프트웨어 개발 파트너사에게 비공개로 전달됐고, 엄격한 비밀엄수계약으로 외부 유출을 차단했다. MS-DOS 4.0은 갈수록 발전하는 개인용 컴퓨터(PC)의 사양과 수요에 맞춰 멀티태스킹과 네트워크 등을 수용하도록 개발됐다. 하지만 협력과 경쟁의 줄타기를 이어가던 IBM과 마이크로소프트의 관계가 경쟁 일변도로 치닫는 와중에 널리 보급되지 못했다. MS-DOS 4.0은 OS/2로 IBM의 전략이 넘어가면서 결국 좌초됐지만, 아이디어와 아키텍처 측면에서 IBM과 마이크로소프트의 차세대 합작품 'OS/2' 개발로 이어지는 중요한 단계에 해당한다. 1987년 발매된 OS/2는 멀티태스킹뿐 아니라 그래픽사용자인터페이스(GUI)와 당시 최강의 기능 및 성능을 갖췄었다. 하지만 마이크로소프트 윈도3.X의 대성공으로 OS/2는 상업적으로 실패했다. 공개된 MS-DOS 4.0은 IBM PC XT, 최신 펜티엄, 오픈소스 PCem 및 86box 에뮬레이터 등에서 실행가능하다. 코노 스타프로스트 하이드는 자신의 블로그에서 멀티태스킹 MS-DOS의 역사를 다룬 글을 게재했다. 2회에 걸쳐 실릴 글 중 1부가 공개돼 있다. 이번 소스코드 발견과 공개에 MS-DOS 4.0 저작자 중 일부도 참여했다고 한다. 마이크로소프트는 공개된 4.0 코드가 베타 바이너리이므로 추후 추가적인 자료를 발견하면 업데이트하겠다고 밝혔다. 마이크로소프트는 2014년 컴퓨터역사박물관에 MS-DOS 1.25와 2.0 소스코드를 기증했으며, 깃허브로도 해당 코드를 제공하고 있다.

2024.04.29 16:07김우용

"AI 모델 순위 매기는 '리더보드'는 과장됐다"

인공지능(AI) 언어모델의 성능을 측정해 순위를 매기는 리더보드 점수가 과장됐다는 지적이 이어지고 있다. 기업들이 임의로 데이터를 조정해 모델 점수를 높여 이를 홍보나 투자 유치를 위한 수단으로 활용한다는 이유에서다. 최근 기업들은 자사 거대언어모델(LLM)이나 소형언어모델(SLM) 성능이 오픈AI의GPT-4를 뛰어넘었다는 소식을 전하고 있다. 기준은 깃허브나 허깅페이스, 오픈 Ko-LLM 리더보드 순위다. 오픈 Ko-LLM 리더보드는 한국지능정보사회진흥원(NIA)과 업스테이지가 지난해 구축한 한국어 전용 리더보드다. 개발사가 리더보드에서 모델 등수를 받으려면 몇 가지 과정을 거쳐야 한다. 우선 모델은 벤치마크 테스트를 받는다. 벤치마크는 특정 작업에서 모델 성능을 비교하는 테스트다. 이를 통해 모델은 점수를 받는다. 점수에는 답변 정확성, 속도, 견고성 등으로 이뤄졌다. 모델은 이를 기반으로 리더보드에서 순위가 매겨진다. "답안지 보고 문제 푸는 셈...기업 홍보·투자 유치 수단" 국내 전문가들도 기업들이 평가 과정 틈새를 이용해 모델 벤치마킹 점수와 리더보드 순위를 조작하고 있다고 입을 모았다. 익명을 요청한 국내 AI 기업 대표는 "개발사가 모델에 학습데이터가 아니라 이미 테스트를 거친 공개 평가데이터를 입력해 점수와 등수를 올린다"고 지적했다. 그는 "마치 모델이 시험 답안지를 한번 훑고 문제를 푸는 것과 같은 것"이라며 "당연히 벤치마크 점수와 리더보드 순위가 급상승할 수밖에 없다"고 덧붙였다. 한 국내 대학 연구원은 "보통 벤치마크에서 동일한 질문을 여러 모델에 물어봐야 성능 평가가 가능하다"며 "같은 질문을 했을 때 나오는 답변 수준에 따라 리더보드 순위가 매겨지기 때문"이라고 설명했다. 연구원은 "AI 개발사들은 타사 모델이 답했던 데이터를 단순 참고용으로만 활용해야 하는데, 이를 아예 자사 모델에 집어넣는 행태를 취하고 있다"고 악용 사례를 지적했다. 그는 "현재 벤치마크 종목도 공개된 상태"라며 "개발사는 평가 데이터를 모델에 넣지 않아도, 벤치마크 종목과 유사한 데이터를 생성할 수는 있다"고 설명했다. 모델이 벤치마크 종목 데이터를 집중 학습함으로써 점수를 올릴 수 있는 셈이다. 이런 상황은 해외서도 발생했다. 앞서 마이크로소프트는 SLM '파이-1'이 리더보드에서 오픈AI의 GPT-3.5를 능가했다고 발표한 바 있다. 당시 미국 개발자들은 해당 모델을 직접 테스트한 후 점수가 과장됐다고 지적했다. 이를 증명하는 논문까지 발표된 바 있다. 개발사들이 자사 모델에 '리더보드 1위' 이름표를 붙이려는 이유는 따로 있다. 모델 홍보 효과와 투자 유치에 유용한 수단이기 때문이다. 업계 관계자는 "기업이 자사 LLM을 리더보드 상위권에 올리면 해당 기업 주가도 덩달아 오른다"며 "추후 투자자들에게도 이를 적극 어필한다"고 설명했다. 그는 "투자가 급하거나 주식 상승 효과를 보고 싶은 기업이 리더보드를 통해 자사 모델 홍보를 하는 추세"라며 "돈 있는 기업이거나 AI 전문가들은 리더보드에 관심 없다"고 했다. 업스테이지 "해당 현상 알고 있어…조치 논의 중" 지난해부터 NIA와 오픈 Ko-LLM 리더보드를 운영하는 업스테이지도 해당 현상을 인지하고 있다고 밝혔다. 업스테이지 관계자는 "벤치마크 항목은 공개 정보"라며 "개발자는 유사 데이터를 생성할 수 있어 악용 사례가 나올 수밖에 없는 구조"라고 설명했다. 기업이 모델 학습 범위를 평가데이터로만 한정해 점수만 올리려는 '오버피팅'이 가능한 셈이다. 다만 "자사 리더보드는 프라이빗 데이터셋으로 운영된다"며 "개발사가 평가 데이터를 직접 넣을 순 없다"고 덧붙였다. 관계자는 "최근 기업들이 오버피팅으로 모델 점수와 순위를 높이는 상황을 알고 있다"며 "이는 리더보드 생태계 취지와 부합하지 않는다"고 했다. 그는 "업스테이지는 내부적으로 오버피팅을 비롯한 유사 데이터 생성 방지를 막기 위해 징벌 조치를 논의하고 있다"며 "NIA와 상의를 통해 리더보드 평가 과목, 방식을 전면 교체함으로써 악용 사례를 막을 계획"이라고 말했다.

2024.03.26 14:50김미정

깃허브, 코딩에 이어 취약점 수정도 AI자동 지원

깃허브가 소스코드의 취약성을 자동으로 감지하고 수정 사항을 제안하는 기능을 공개했다. 최근 데브클래스 등 외신에 따르면 깃허브는 코드스캐닝 자동수정(code scanning autofix) 베타버전을 깃허브 어드밴스드 시큐리티 사용자 전체에게 제공한다고 블로그를 통해 밝혔다. 코드스캐닝 자동수정은 생성형AI서비스인 코파일럿과 코드 분석 엔진인 코드QL 기반으로 작성된 코드를 자동으로 분석해 보안취약점을 찾고 개선방안을 제시한다. 깃허브에서 공개한 내용에 따르면 자바, 파이썬, 자바스크립트, 타입스크립트 관련 코드의 90% 취약점에 대응할 수 있다. 또한 발견된 취약점의 3분의 2 이상에 대해 소량 또는 거의 편집하지 않고 해결할 수 있는 수준의 코드를 제공한다. 코드 검사는 정해진 일정이나 특정 이벤트에 따라 진행할 수 있으며, 오픈 소스 및 개인 도구 등 외부 서비스와 연계할 수 있다. 깃허브 측은 깃허브 코파일럿이 지루하고 반복적인 작업을 최소화한 것처럼 코드스캐닝 자동수정은 코드 검사 및 수정 작업에 소요되는 업무를 줄이고 기업 보호를 위한 전략수립에 집중할 수 있도록 지원할 것이라고 설명했다. 깃허브의 피에르 템펠 제품 매니저는 “우리는 이미 깃허브 어드밴스드 시큐리티에서 개발자 경험을 우선시하며 기존 보안 도구에 비해 7배 이상 빠르게 문제를 해결하도록 돕고 있다”며 “코드 스캐닝 자동수정은 개발자가 해결 작업에 소요되는 시간과 노력을 크게 줄이는 데 도움을 주는 다음 단계가 될 것”이라고 설명했다.

2024.03.25 11:01남혁우

기업 취약점 샌다…깃허브 저장소 데이터 유출 위험 4배 증가

소스코드 저장소 깃허브의 데이터 유출 문제가 어느때보다 심각한 것으로 나타났다. 14일(현지시간) 더레지스터 등 외신에 따르면 소스코드 보안전문 기업 깃가디언은 비밀 노출 현황 보고서 2024를 발표했다. 보고서에 따르면 깃허브에 저장된 비공개 소스코드 중 유출된 사례가 지난 4년간 4배 증가했다. 지난해의 경우 1천280만 건이 유출됐으며 이는 전년도에 비해 28% 증가한 수치다. 작성자 비율로는 약 1천497만 명의 고유 커밋 작성자 중 11.7%에 해당하는 174만 명의 데이터가 유출된 것으로 확인됐다. 깃가디언 측은 노출된 비공개 데이터의 상당수가 적절한 시간 내에 대처 이뤄지지 않았다고 지적했다. 유출된 데이터를 확인 후 담당자에게 이메일 알림을 보냈지만 90%이상이 최소 5일 동안 활성 상태가 유지된 것으로 나타났다. 깃가디언은 유출된 데이터에 기업 인증 정보, API 키, 암호화 키 등 중요한 자격 증명을 포함할 수 있어 해커가 시스템에 접근해 막대한 피해를 발생시킬 수 있다고 강조했다. 깃가디언 연구원은 이러한 보안 문제를 해결하기 위해 중요한 정보를 안전하게 저장하고 관리하기 위한 별도의 도구를 사용할 것을 권장하며 소스코드 내에선 관련 내용을 모두 없앨 것을 권했다. 또한, 소스코드의 로그를 항상 기록해 누가 접근했는지 실시간으로 파악할 수 있는 환경을 구축할 것을 제안했다. 이와 함께 이미 주요 정보가 유출됐을 경우 즉시 관련 내용을 폐기하고, 데이터 유출로 인해 어떤 악영향이 발생할 수 있을지 평가받아야 한다고 설명했다.

2024.03.15 10:52남혁우

ETRI, 절차 생성 AI 벤치마크 기술 첫 개발

대형언어모델(LLM)을 기반으로 만들어진 절차 성능을 자동 평가하는 기술이 세계 처음 개발했다. 한국전자통신연구원(ETRI)은 사람이 말로 작업을 명령하면 스스로 작업 절차를 이해하고 계획을 수립해 수행하는 절차 생성 인공지능(AI)의 성능을 자동 평가할 수 있는 로타벤치마크(LoTa-Bench) 기술을 개발했다고 7일 밝혔다. 기존에는 절차 이해 성능 평가를 자동으로 할 수 있는 벤치마크 기술이 없어서 사람이 직접 평가함으로써 손이 많이 갈 수밖에 없었다. 구글 세이캔(SayCan)을 비롯한 기존 연구에서는 여러 사람이 직접 작업 수행 결과를 관찰하고 성공 실패 여부를 투표하는 방법을 채택했다. 이는 성능 평가에 매우 긴 시간과 노력이 들어 번거로울 뿐 아니라 평가 결과에 주관적 판단이 개입하는 문제가 있다. 반면 ETRI가 개발한 로타벤치마크 기술은 사용자의 명령에 따라 대형언어모델이 생성한 작업 절차를 실행하고, 결과가 지시한 목표와 같은지 자동으로 비교해 성공 여부를 판단한다. 평가 시간과 비용을 최소화할 수 있고, 결과가 객관적인 이유다. 연구진은 알프레드(ALFRED) 기반 벤치마크 결과, 오픈AI(OpenAI)의 GPT-3는 21.36%, GPT-4는 40.38%, 메타(Meta)의 라마2(LLaMA 2)-70B 모델은 18.27%, 모자이크엠엘(MosaicML)의 MPT-30B 모델은 18.75% 성공률을 보였다고 밝혔다. 규모가 클수록 절차 생성 능력도 우수했다. 성공률이 20%면 100개의 절차 중 20개를 성공한 셈이다. 성능 평가는 로봇과 체화 에이전트 지능의 연구개발 목적으로 개발된 미국 알렌인공지능연구소(AI2-THOR)와 미국 MIT(버츄얼홈, VirtualHome) 가상 시뮬레이션 환경에서 이뤄졌다. “전자레인지에 차갑게 식힌 사과를 넣어라.”라는 일상적인 가사 작업 지시 명령을 내리고 각 작업 절차를 포함하는 데이터셋으로 평가했다. 또한, 연구진은 새로운 절차 생성 방법을 쉽고 빠르게 검증할 수 있는 로타벤치마크 기술의 이점을 활용해 데이터를 통한 훈련으로 절차 생성 성능을 개선할 수 있는 두 가지 전략도 발견했다. 컨텍스트 내 예제 선별법(In-Context Example Selection)과 피드백 기반 재계획(Feedback and Replanning)이다. 이와함께 파인튜닝을 통한 절차 생성 성능 개선 효과도 확인했다. 소프트웨어 오픈소스로 공개 기업·학교 활용 가능 연구진은 이 기술 개발로 대형언어모델을 이용한 로봇 작업계획 기술의 성능평가 시간과 비용을 대폭 줄일 수 있을 것으로 전망했다. 연구진은 또 관련 소프트웨어를 오픈소스로 공개했다. 기업, 학교 등에서 이 기술을 자유롭게 활용할 수 있다. 최근 대형언어모델은 언어처리, 대화, 수학 문제 풀이, 논리 증명 외에 사람 명령을 이해해 하위 작업을 스스로 선택하고 순서대로 수행해 목표를 달성하는 절차 이해 영역에서도 우수한 성능을 나타내고 있다. 이에 따라 대형언어모델을 로봇 응용과 서비스 구현에 적용하려는 시도가 폭넓게 이뤄지고 있다. 연구진은 국제 인공지능 학술대회인 표현학습국제학회(ICLR)에 논문을 발표하고, 이 기술을 이용한 대형언어모델 총 33종의 절차 생성 성능 평가 결과를 깃허브를 통해 공개했다. 장민수 소셜로보틱스연구실 책임연구원은 “로타벤치마크는 절차 생성 AI 개발의 첫걸음”이라며 “향후 불확실한 상황에서 작업 실패를 예측하거나 사람에게 질문하며 도움을 받아 작업 생성 지능을 지속 개선하는 기술을 개발할 계획”이라고 말했다. 장 책임연구원은 또 “1가구 1로봇 생활 시대의 구현을 위해서는 이 기술이 반드시 필요하다”고 덧붙였다. 김재홍 소셜로보틱스연구실장은 “ETRI는 실세계에서 각종 임무 계획을 생성하고 실행할 수 있는 로봇을 실현하기 위해 파운데이션 모델을 활용한 로봇 지능 고도화 연구개발에 매진하고 있다”고 밝혔다. 이 기술은 과학기술정보통신부와 정보통신기획평가원(IITP)의 “사람중심 인공지능 핵심원천기술 개발 사업”의 일환으로 '스스로 불확실성을 자각하며 질문하면서 성장하는 에이전트 기술 개발' 과제를 통해 수행됐다.

2024.03.07 10:55박희범

코파일럿에 밀린 '스택오버플로', 구글 제미나이 손 잡아

코파일럿에 밀려 인기가 하락한 개발자 지식공유 사이트 '스택오버플로'가 구글 제미나이와 손잡고 반격에 나선다. 2일(현지시간) 테크크런치 등 외신에 따르면 스택오버플로우는 구글 클라우드와 생성형AI 개발을 위한 파트너십을 체결했다. 이번 파트너십을 통해 양사는 AI의 정확성과 개발자의 생산성을 높이는 것을 목표로 한다. 스택오버플로우는 저장소에 축적된 약 5천800만 개에 달하는 개발 관련 질문과 답변을 제공한다. 구글 클라우드는 제미나이에서 전용API인 오버플로API를 통해 저장된 질문과 답변을 AI에 학습시키거나 개발 중인 코드에 적용하는 등 다양하게 활용할 수 있을 전망이다. 오버플로 API는 다음 달 개최하는 구글 클라우드 넥스트 컨퍼런스에서 공개될 후 상반기에 출시될 예정이다. 개발 중 궁금하거나 막히는 내용을 질문하고 답변할 수 있는 스택오버플로우는 수 년간 가장 인기 있는 개발자 커뮤니티였다. 하지만 챗GPT 등장이후 AI로 코드를 생성하는 방식의 등장으로 코드를 직접 검색하는 일이 줄며 사이트의 인기도 하락하기 시작했다. 특히, 챗GPT의 정확성이 떨어진다는 이유로 일시적으로 관련 콘텐츠를 사이트 내에 금지하면서 하락세는 더욱 가속화됐다. 반면, 소스코드 저장소인 깃허브는 AI를 적극 받아들여 직접 AI 개발 지원 도구 코파일럿을 개발해 제공하며 폭발적인 인기를 얻었다. 현재 모회사인 마이크로소프트는 코파일럿 개발을 넘어 모든 직군으로 확장하는 추세다. 이에 스택오버플로는 생성AI를 활용한 고급검색 기능 '오버플로AI' 등을 선보이고 있지만 아직 시장의 변화는 이끌어내지 못하고 있다. 스택오버플로의 프라샨스 찬드라세카 CEO는 "환각 현상 등이 위협으로 지목되는 AI 시대에 스택오버플로는 신뢰할 수 있고 정확한 데이터의 기반이 기술 솔루션 구축 방법의 중심이 될 것"이라며 "이번 파트너십은 두 회사의 강점을 결합해 개발자의 창의성을 발휘하고 희생 없이 생산성을 높여 다양한 산업 분야에서 혁신을 가속화할 수 있을 것"이라고 강조했다.

2024.03.03 12:00남혁우

깃허브, '코파일럿 엔터프라이즈' 정식 출시

대형기업용 생성형 인공지능(AI) 기반 개발자 보조도구 요금제 '깃허브 코파일럿 엔터프라이즈'가 정식 버전으로 출시됐다. 27일(현지시간) 깃허브는 '코파일럿 엔터프라이즈'를 정식으로 출시한다고 발표했다. 깃허브 코파일럿은 개발자의 코드 작성을 돕는 AI 도구다. 대화창에서 자연어로 작성하고 싶은 소프트웨어 개념과 요구사항을 알려주면, AI가 코드를 작성한다. 그밖에 버그나 보안취약점을 찾아내고 조치 방안을 제안하며, 주석 작성이나 디버깅 등도 수행한다. 깃허브 코파일럿 엔터프라이즈는 이같은 기본 기능 외에 사용자 조직 내부의 코드베이스와 프로세스, 지식 기반 등을 따르게 제한하는 기능을 제공한다. 저장소 기반 의미검색, 지적재산권(IP) 면책 기능도 포함한다. 일반적인 코딩 질문에 대한 채팅도 지원한다. 도입을 위해 깃허브 엔터프라이즈 클라우드가 필요하다. 코파일럿 엔터프라이즈는 개발자의 코드 탐색과 이해를 간소화해 더 빠른 기능 구현, 문제해결, 코드 현대화 등을 지원한다. 초급 개발자가 더 빠르게 조직에 기여하도록 지원하고, 수석 개발자가 실제 사건을 처리하도록 지원한다. 명확한 코드 요약, 관련 제안, 코드 동작에 대한 쿼리에 빠른 답변 제공 등으로 노후된 코드베이스 현대화에 도움을 준다. 채팅을 깃허브닷컴에 직접 통합해 개발자가 코드베이스에 자연어로 질문하고 답변을 받을 수 있으며, 관련 문서나 기존 솔루션으로 개발자를 안내한다. 조직의 특정 코드베이스와 표준에 맞는 맞춤형 지원과 제안을 제공할 수 있다. 생성된 풀 요청 요약을 통해 개발자는 초안 작성 시간을 줄이고 병합에 더 많은 시간을 할애할 수 있다고 회사측은 설명했다. 풀 요청 차이점을 분석하는 기능으로 검토자는 제안된 변경 사항을 빠르게 파악하고 변경사항 이해 시간을 단축해 피드백 제공에 더 많은 시간을 할애할 수 있다. 현재 베타로 마이크로소프트 빙과 통합됐으며, 향후 모델 미세조정도 가능해진다. 빙 검색과 통합으로 코파일럿 챗에서 CSS나 자바스크립트 프레임워크 업데이트 같은 최신 소프트웨어 관련 정보를 찾을 수 있다. 깃허브는 코파일럿의 기업 생산성 영향도를 조사한 액센추어 내부 연구 결과를 제시했다. 액센추어 연구에 의하면, 깃허브 코파일럿은 액센추어 개발자의 흐름을 유지하고 중단을 최소화하도록 지원했다. 개발자의 94%가 깃허브 코파일럿을 사용해 흐름 유지와 반복작업 감소에 도움을 받았다고 답했다. 90%는 정보 검색 소요 시간을 줄였다고 했다. 또한 개발자는 깃허브 코파일럿에서 제안한 코드의 88%를 편집기에 유지했고, 약 90%의 개발자는 코파일럿 제안을 포함한 코드를 커밋했다. 90%의 개발자는 깃허브 코파일럿을 사용해 더 나은 코드를 작성했다고 보고했다. 약 95%는 개발자가 코파일럿 제안으로 배웠다고 답했다. 토마스 돔케 깃허브 최고경영자(CEO)는 "깃허브 코파일럿 초기부터 고객은 자신의 조직의 코드와 프로세스에 맞게 사용자 정의된 코파일럿을 요청해 왔다"며 "개발자는 조직의 코드베이스에 고유한 문제, 버그 또는 취약성을 정확히 찾아내고 해결할 수 없을 때 배송보다 해독하는 데 더 많은 시간을 소비한다"고 설명했다. 그는 "게다가 개발자들은 하루에 몇 시간만 코드를 작성하고 창의적이기는커녕 하루 종일 지루한 작업에 얽매이는 경우가 많다"며 "제도적 지식에 대한 접근 불가능성은 개발자가 창의성을 충분히 발휘하고 더 많은 것을 구축하는 것을 방해하는 장애물로 작용한다"고 덧붙였다. 그는 "조직의 제도적 지식을 개발자의 손끝에 제공하는 동반자인 깃허브 코파일럿 엔터프라이즈의 정식 출시를 통해 개발자 도구의 차세대 개척지를 가져왔다"며 "이제 팀 구성원은 공개 및 비공개 코드에 대해 질문하고, 새로운 코드베이스에 빠르게 적응하고, 엔지니어링 팀 전체에 걸쳐 더 큰 일관성을 구축하고, 모든 사람이 이전에 수행했던 것과 동일한 표준 및 작업에 액세스할 수 있도록 할 수 있다"고 강조했다. 테크크런치에 따르면, 깃허브 코파일럿 엔터프라이즈의 자동 완성 기능은 현재 오픈AI의 GPT-3.5 터보를 기반모델로 활용하고 있다. 대기시간 요구사항 때문에 GPT-4로 이동하지 않았지만, 코파일럿 비즈니스 이후 모델을 6회 이상 업데이트했다고 한다. 깃허브 코파일럿 엔터프라이즈는 사용자당 월 39달러에 이용할 수 있다. 깃허브 코파이럿의 요금제는 모두 동일한 기반 모델을 사용한다. 향후에도 모델 종류에 따라 요금제를 구분하지 않을 것으로 예상된다.

2024.02.28 10:52김우용

"비개발자도 파이썬 대신 자연어로 프로그램 만드세요"

오픈AI의 거대언어모델(LLM) GPT과 상호작용하며 프로그램을 개발하는 도구가 나왔다. 전문가뿐 아니라 비개발자도 복잡한 프로그래밍 언어가 아닌 자연어를 통해서 개발을 진행할 수 있다. 25일 관련업계에 따르면 최근 깃허브에 GPT와 연동된 프로그래밍 도구 'GPT스크립트'가 오픈소스로 공개됐다. GPT스크립트는 GPT-4 터보 기반으로 이뤄졌다. 지난해 4월까지 학습한 데이터셋으로 답하는 모델이다. 지난해 11월 샘 올트먼 오픈AI 최고경영자(CEO)가 자사 개발자 컨퍼런스에서 해당 모델을 처음 소개했다. GPT스크립트에서는 사용자가 자연어 프롬프트만으로 프로그래밍할 수 있다. 간단히 작동법만 배우면 바로 사용할 수 있다. 현재 영어만 지원하며 맥OS와 리눅스, 윈도 환경에서 작동한다. GPT스크립트가 100% 자연어로만 작동하는 건 아니다. 자연어 프롬프트 대신 별도 프로그램을 호출해 활용할 수 있다. 파이썬 같은 기존 언어나 외부 HTTP 서비스 호출과도 혼합해 사용 가능하다. 이를 통해 인공지능(AI)을 비롯한 로컬 시스템, 데이터, 외부 서비스와 상호 작용하는 스크립트를 만들어낼 수 있다. 사용 방법은 간단하다. 이용자는 GPT스크립트에서 요청사항을 자연어로 스크립트를 작성한다. GPT스크립트는 지시 사항을 처리하고 GPT 모델로 이를 전송한다. GPT 모델은 명령어에 대한 답변을 생성한다. 그 후 GPT스크립트를 통해 사용자에게 답변을 전송한다. 이때 외부 HTTP 서비스와 연동해 작동할 수 있다. 업계 관계자는 "챗GPT 출시 후 GPT를 연동한 프로그래밍 개발 도구가 나오는 추세"라며 "개발자들은 완전한 자연어 기반 프로그래밍 환경을 만드는 것을 궁극적 목표로 둔 셈"이라고 강조했다.

2024.02.25 07:30김미정

깃허브 노린 사이버공격 급증, 기업 피해 주의

오픈소스 공유 플랫폼 깃허브를 이용하는 데 있어 보안 위협에 주의해야 한다는 목소리가 높아지고 있다. 다양한 소스코드를 공유한다는 플랫폼 특성을 노려 악성코드를 유포하거나 플랫폼 내 이용자들이 취약점에 노출되는 사례가 급증한다는 지적이다. 최근 해커뉴스 등 외신에 따르면 사이버 보안기업 레코디드 퓨처는 사이버 위헙 분석 보고서를 발표했다. 보고서에 따르면 사이버 범죄자들은 페이로드 배포, 코드 데드 드롭 리졸버, 명령 및 제어, 데이터 유출 등 공격의 핵심 공격 경로로 깃허브를 악용하는 것으로 나타났다. 사이버범죄자들은 깃허브의 공개저장소를 통해 노출된 클라우드 정보를 통해 자격증명을 탈취하거나 악성 코드를 소스코드 배포해 이를 사용한 개발자를 통해 기업에 침투하는 것으로 확인됐다. 깃허브는 소스코드를 공유하거나 공동 프로젝트 등을 추진하기 위해 전세계 개발자들이 적극적으로 활용하는 플랫폼이다. 특히, 챗GPT 출시 후 사용자가 더욱 증가해 지난해 3월 실제 활동하는 사용자 수가 1억 명을 넘어섰다. 레코디드 퓨처는 "기업이나 조직에서 깃허브에 의존하는 경향이 커지면서 이를 노린 사이버범죄자들의 공격시도가 급증하고 있다”며 “악용가능성이 있거나 안정성이 확인되지 않은 프로젝트는 사전에 차단하고 침투에 대비한 방안을 마련해야 한다”고 강조했다.

2024.01.17 09:41남혁우

  Prev 1 2 Next  

지금 뜨는 기사

이시각 헤드라인

라인야후, 'AI 기업' 전환 선언..."와우 라이프 플랫폼 되겠다"

[SW키트] 美·日 CISO 커뮤니티 '활발'…韓선 후순위 취급

롯데百, 영등포점 운영권 자진반납…속내는?

정은경 복지장관 후보자 "의정갈등 해결은 의료계와 신뢰 회복부터"

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.