깃허브 "생성 AI 프로젝트 폭증, 6만개 돌파"
깃허브의 연례 오픈소스 트렌드 보고서 '옥토버스 2023'이 공개됐다. 대규모언어모델(LLM)의 폭발적 성장과 함께 인공지능(AI)이 오픈소스 개발자 생태계를 뒤흔들었고, 소프트웨어 개발은 다음 단계로 진화를 앞두고 있다. 깃허브는 8일 연간 정기 간행물인 '옥토버스 2023 보고서'를 발표했다. 옥토버스 보고서는 깃허브와 오픈소스 소프트웨어 생태계의 한해 동향을 보여준다. 올해 보고서는 AI, 클라우드, 깃 등과 관련된 오픈소스 활동이 어떻게 개발자 경험을 변화시키고 개발자와 조직에게 어떤 영향력을 미치고 있는지를 담았다. 깃허브의 카일 다이글 최고운영책임자(COO)는 블로그에서 "올해 깃허브 데이터는 AI란 또 다른 기술이 어떻게 개발자 경험을 빠르게 재편하기 시작했는지 드러냈다"며 "지난해 AI 기반 애플리케이션 구축을 실험하는 동시에 AI 작업을 시작하는 개발자가 점점 더 많아졌다"고 설명했다. 올해 보고서는 세가지 트렌드를 보여준다. 생성 AI 관련 프로젝트가 급증하고, 개발자의 AI 코딩 도구 활용이 보편화됐다. 또한 개발자의 깃기반 코드형 인프라(IaC) 워크플로를 사용하는 선언적 언어가 증가하고, 클라우드 배포가 더 광범위하게 표준화됐으며, 도커파일이나 컨테이너 등의 클라우드 네이티브 기술을 활용하는 개발자의 비율이 크게 늘었다. 그리고, 상업적으로 지원되는 오픈소스 프로젝트에서 최초 기여자가 전체 기여에서 가장 큰 비중을 차지하는 것으로 나타났다. 그는 "더 많은 개발자가 오픈AI와 기타 AI 플레이어의 기초 모델을 실험하고 있으며, 오픈소스 생성 AI 프로젝트는 올해 기여자수 기준으로 가장 인기있는 오픈소스 프로젝트 상위 10위 안에 들었다"며 "거의 모든 개발자인 92%가 AI 코딩 도구를 사용중이거나 실험중이고 오픈소스 개발자는 깃허브에서 AI 혁명의 다음 파도를 이끌 것으로 예상된다"고 강조했다. 생성 AI는 작년말 오픈AI 챗GPT 등장과 함께 대중에 각인됐지만, 깃허브와 개발자 생태계 내에선 새롭지 않았다. 깃허브에서 생성 AI 프로젝트의 등장은 수년 전이었고, 여타 주요 AI 프로젝트가 다수 있었다. 다만, 올해 깃허브 데이터는 그간의 AI 프로젝트가 전문가 위주의 연구에서 일반 산업계의 주류 분야로 이동했다는 점을 보여줬다. 개발자는 사전훈련된 모델과 API를 활용해 생성형 AI 기반 애플리케이션을 더 많이 만들어내고 있다. 올해 중반에 이미 생성 AI 프로젝트 수는 작년 전체 프로젝트의 두배 이상으로 늘었다. 올해 생성 AI 프로젝트 수는 6만개를 돌파했다. 생성 AI는 전년대비 148% 성장했고, 생성 AI 프로젝트의 수는 전년대비 248% 증가했다. 미국, 인도, 일본이 생성 AI 개발자 커뮤니티에서 선두를 달렸고, 홍콩, 영국, 브라질 등이 뒤를 이었다. 깃허브 상위 20개 오픈소스 생성 AI 프로젝트 중 일부는 개인 소유였다. 텐서플로우, 파이토치 등의 머신러닝 라이브러리를 활용하는 프로젝트도 여전히 많지만, 챗GPT API 같은 LLM과 AI 모델을 실험하는 개발자가 그 수를 앞섰다. 카일 다이클은 "생성 AI를 배우는 개발자 수가 크게 증가하면 비즈니스에 영향을 미칠 것"이라며 "점점 더 많은 개발자가 생성형 AI 기반 애플리케이션 구축에 익숙해지면서 자체 AI 기반 제품과 서비스를 개발하려는 기업의 인재풀이 늘어날 것으로 기대된다"고 밝혔다. 깃허브에서 가장 인기 있는 프로그래밍 언어는 자바스크립트였다. 2위는 파이썬이다. 올해 셸(shell)과 하시코프구성언어(HCL) 등 IaC가 오픈소스 프로젝트에서 인기를 구가했다. HCL 채택이 전년대비 36% 성장했는데, 개발자가 애플리케이션에 인프라를 활용하고 있다는 것을 보여준다. 타입스크립트는 자바를 앞질러 세번째로 인기있는 언어를 차지했다. 타입스크립트는 올해 사용자 기반을 37% 증가시켰다. 타입스크립트가 자바를 앞지른 건 처음이다. 그밖에 데이터 분석과 운영에 사용되는 언어와 프레임워크가 극적으로 증가했다. T-SQL, TaX 등의 언어가 올해 성장세를 보였다. 기여자 수로 본 인기 언어 순위는 다르다. 러스트가 가장 많은 기여자 증가를 보였다. 사용률은 타 언어 대비 낮지만 매년 40%씩 성장하고 있으며, 스택오버플로우 개발자설문조사에서 올해 8년 연속 가장 존경받는 언어를 차지했다. 그와 함께 LUA, 코틀린, 고 등도 높은 성장률을 기록했다. 올해 깃허브는 활용 개발자 수 1억명을 돌파했다. 깃허브 계정 증가율은 26%였다. 깃허브 기여의 80% 이상은 프라이빗 저장소에서 이뤄지고 있다. 민간 프로젝트에 42억개 이상, 오픈소스 및 공개 프로젝트에 3억1천만개 이상의 기여가 이뤄졌다. 이는 깃 기반 협업이 오픈소스와 독점 코드를 망라해 널리 활용되고 있다는 증거다. 깃허브가 클라우드 네이티브 애플리케이션 운영에서 중요한 장소란 점도 나타났다. 올해 퍼블릭 및 프라이빗 저장소에서 430만개의 도커파일이 사용됐다. 100만개 이상의 퍼블릭 저장소에서 컨테이너 생성에 도커파일을 사용했다. 테라폼 등 클라우드 기반 기술 사용이 증가한 덕이다. 생성형 AI는 깃허브액션에 진출했다. 깃허브 마켓플레이스에서 300개 이상의 AI 깃허브 액션과 30개 이상의 GPT 기반 깃허브액션이 일어났다. 올 한해 개발자는 마스토돈(Mastodon) 같은 인기 프로젝트부터 스테이블디퓨전, 랭체인 등의 생성 AI 프로젝트 등에 이르기까지 전체 오픈소스 프로젝트에 총 3억100만건의 기여를 기록했다. 가장 인기 있는 10대 프로젝트에서 상업적 지원을 받는 프로젝트가 선두권에 있다. 마이크로소프트의 비주얼스튜디오코드(VSCode), 플러터, 베르셀/넥스트JS 등이 올해도 상위 10대 목록에 이름을 올렸다. 개발자의 AI 코딩 도구 활용은 점점 더 보편화되고 있다. 한명 이상의 스타를 보유한 오픈소스 프로젝트 중 3분의1이 깃허브코파일럿을 사용하는 관리자를 가졌다. 오픈소스 유지관리자는 깃허브코파일럿을 무료로 사용할 수 있다. 최초의 기여자가 깃허브에 많이 유입된 것으로 나타났다. 올해 오픈소스 프로젝트의 최초 기여자 수는 역대 최고를 기록했다. 최초 기여자들은 상업적으로 지원되는 프로젝트를 선호했다. 마이크로소프트, 구글, 메타 등의 지원을 받는 프로젝트가 인기였다. 브랜드 인지도가 영향을 미치기 때문으로 해석된다. 다만, 커뮤니티 중심의 오픈소스 프로젝트에서도 최초 기여자의 활동 증가가 두드러졌다. 스테이블디퓨전, 랭체인, 오토GPT 등이 인기였다. 깃허브에 의하면 전세계 개발자는 2천20만명에 달한다. 미국의 개발자 수는 전년대비 21% 성장해 여전히 세계에서 가장 큰 커뮤니티를 차지했다. 한편으로 아시아태평양, 아프리카, 남아메리카, 유럽의 개발자 커뮤니티도 성장하는 가운데, 인도, 브라질, 일본 등이 급격한 성장세를 보이고 있다. 인도는 올해 개발자 커뮤니티 규모에서 중국을 앞질러 2윌르 차지했다. 브라질은 3년째 전세계 4위 규모를 유지하고 있으며, 일본도 4년째 8위를 기록하고 있다. 깃허브는 향후 2027년이면 인도가 미국을 제치고 세계서 가장 큰 규모의 개발자 커뮤니티를 보유한 지역으로 올라설 것이라고 예측했다. 아시아태평양 지역에서 개발자 수 성장률로 보면 싱가포르가 39%로 가장 빨랐다. 싱가포르는 전체 인구 대비 개발자 비율이 가장 높은 나라다. 인도는 1천320만명의 개발자 수를 기록했다. 인도의 성장률은 전년대비 36%에 달한다. 인도네시아와 일본은 전년대비 31% 성장해 각각 290만명, 280만명에 근접했다. 한국의 개발자 수는 190만명 미만으로 전년보다 22% 성장했다. 한국은 아태지역에서 베트남, 홍콩, 싱가포르, 필리핀, 호주, 태국 등보다 많은 개발자 수를 보유한 지역이다. 아프리카 지역이 전세계 기술 회사의 유망한 허브로 떠오르고 있다. 케냐는 초등학교와 중학교에서 프로그래밍을 의무적으로 가르치는 등 아프리카 지역 국가의 개발자 규모가 급증하고 있다. 개발자 수로 나이지리아가 86만8천명 미만의 개발자를 보유했는데, 전년보다 45% 증가한 것이다. 남아프리카공화국은 전년보다 30% 성장한 53만9천명 미만 개발자를 보유했다. 모로코가 전년보다 35% 성장한 44만6천명의 개발자를 보유했고, 케냐가 전년보다 41% 증가한 29만6천명의 개발자를 가졌다. 가나, 에티오피아도 상위 5위권에 들었다. 깃허브는 나이지리아 개발자 소유 프로젝트가 최소 200개라고 밝혔다. 다이글 COO는 "깃허브는 생성 AI를 위한 개발자 플랫폼이며, 개발자는 깃허브에서 대규모로 클라우드 네이티브 애플리케이션을 운영하고 있다"며 "깃허브는 오픈소스 커뮤니티, 개발자, 회사 등이 소프트웨어를 구축하는 곳"이라고 강조했다. 깃허브 옥토버스 2023 보고서는 2022년 10월1일부터 2023년 9월30일까지 깃허브의 사용자 및 제품 데이터를 기반으로 작성됐다. 깃허브는 AI 프로젝트를 683개 저장소 주제 용어로 정의하고 있다. 오픈소스 프로젝트 평가는 '모나랭크(MonaRank)'를 측정 기준으로 한다.