버너 보겔스 "비용이란 제약 조건이 창의성 만든다"
“여러분이 구축중인 시스템에 도전과제로서 제약 조건을 만들어야 창의성을 낳을 수 있다.” 버너 보겔스 아마존 CTO 겸 아마존웹서비스(AWS) 부사장은 17일 서울 삼성동 코엑스에서 개최된 'AWS서밋서울 2024' 2일차의 화상 기조연설에서 이같이 밝혔다. 이날 기조연설은 윤석찬 AWS 수석 테크 에반젤리스트와 버너 보겔스 CTO, 맷 우드 AWS 제품 담당 부사장 등이 기조연설을 통해 클라우드 기술의 현재와 미래에서 중요한 세 가지 트렌드를 소개했다. 강연 중간 각 트렌드별 주요 국내 고객 사례로 인프랩의 이동욱 CTO, 카카오페이증권의 조지훈 플랫폼개발실장, 센드버드의 구정진 CTO가 자사의 경험을 공유했다. 첫 번째로 소개된 트렌드는 비용적으로 검소한 아키텍처, 즉 푸르걸 아키텍처(Frugal Architecture)였다. 버너 보겔스 부사장이 화상으로 푸르걸 아키텍처의 7가지 원칙을 아키텍처 설계, 지표 측정, 최적화 등의 분야로 나눠 설명했다. 버너 보겔스 CTO는 “클라우드는 하드웨어 제약을 제거하고 대규모의 안정적인 시스템을 구성할 수 있게 했고, 개발 실행과 배포의 속도에 초점을 맞추게 했다”며 “비용 인식은 잃어버린 기술이고 다시 배워야 하는 기술이며, 비용효율성과 지속가능성을 중요한 우선 순위로 두고 비용을 핵심 제약으로 생각하는 게 다시 아키텍트의 의무가 됐다”고 밝혔다. 그는 ▲비용을 비기능적 요소로 보고 아키텍처를 설계하라 ▲비즈니스에 비용을 맞춰라 ▲시스템 설계는 타협의 연속이다 ▲관찰되지 않는 시스템은 알려지지 않은 비용으로 연결된다 ▲비용 인식 아키텍처를 통해 비용 관리를 구현해야 한다 ▲비용 최적화는 점진적으로 이뤄진다 ▲도전하지 않은 성공은 가정(Assumptions)을 낳는다 등 7가지 원칙을 소개했다. 이어 윤석찬 에반젤리스트가 앞서 소개된 원칙 중 분야별로 한 가지씩 뽑아 자세히 소개했다. 윤 에반젤리스트는 먼저 아키텍처 설계 원칙 중 '비즈니스에 비용을 맞추라'는 원칙에 대해 이야기했다. 비즈니스의 진화에 따라 아키텍처 역시 변화할 수 있도록 설계해야 한다는 것이다. 그는 지속적인 아키텍처 변경을 통해 비용을 절감할 수 있으며, AWS 비용 최적화 허브를 활용하면 손쉽게 비용 최적화를 위한 권장 사항을 확인할 수 있다고 했다. 이어 지표 측정 원칙 가운데 '비용 인식 아키텍처를 통해 비용을 통제하라'는 원칙을 소개했다. 그는 아마존닷컴이 서비스의 필요성에 따라 티어가 나눠져 있어 비용을 통제할 수 있다는 점을 강조했다. 이때 서비스 티어를 도입하기 위해서는 클라우드 인프라의 리소스를 서비스 단위로 묶을 수 있어야 하는데, 윤 에반젤리스트는 아마존 클라우드워치의 애플리케이션 시그널 기능을 사용하면 AWS에서 애플리케이션 중심으로 리소스를 묶어서 모니터링할 수 있다고 말했다. 마지막으로 '성공에 안주하지 말라'는 원칙을 설명했다. 그는 현대적인 프로그래밍 언어 러스트가 지속 가능성 측면에서도 뛰어나다며, 최근 출시된 러스트용 AWS SDK를 소개했다. 비용 최적화 사례로 인프랩이 소개됐다. 이동욱 인프랩 CTO는 “작년 한 해 동안 월간 2만5천달러, 연간 30만달러의 클라우드 비용을 절감했다”며 “비용 최적화 현황표를 구축해 월별 비용을 정기적으로 검토했으며, 비효율적으로 비용이 사용되는 부분을 개선하는 데 주력했다”고 밝혔다. 이동욱 CTO는 인프랩의 비용 절감을 위한 주요 조치로 RDS 스펙 축소, ECS 파게이트에서 EC2로의 전환, AWS 그래비톤으로 인스턴스 전환, 백앤드팀과 협력을 통한 쿼리 튜닝 등을 구체적 방법으로 언급했다. 이동욱 CTO는 스타트업을 위한 비용 절감 팁으로 “CDN 트래픽 비용을 할인하는 계약인 CFRC 계약을 활용하면 트래픽 비용의 10% 이상을 절약할 수 있다”며 “인프랩은 비즈니스와 클라우드 비용을 연결하는 모니터링 환경을 구축 중에 있으며, 이를 통해 비용과 비즈니스 성과의 관계를 파악하고, 사내 블로그를 통해 공유할 계획”이라고 덧붙였다. 두 번째 트렌드는 플랫폼 엔지니어링을 꼽았다. 플랫폼 엔지니어링은 개발과 운영을 함께 하는 데브옵스와 공통 운영 조직을 만드는 신뢰성 엔지니어링에서 한 걸음 더 나아가, 공통 인프라 세팅이나 보안 규정 준수와 같은 중복되는 영역을 완전히 빼고 사내 개발자용 셀프 서비스 제품을 만들어주는 방식이다. 윤석찬 에반젤리스트는 세 가지 방법의 우열을 가릴 수는 없지만, 플랫폼 엔지니어링은 개발팀의 자유도가 조금 낮더라도 사내 규정이나 개발 가이드에 따라 빠르게 개발할 수 있다는 장점이 있다고 설명했다. 플랫폼 엔지니어링을 성공적으로 구현한 사례로 리버티 뮤추얼과 무신사를 들었다. 고객 사례로 카카오페이증권의 조지훈 플랫폼개발실장은 “데브옵스, SRE는 주로 개발과 운영의 효율성을 높이는 데 초점을 맞추는 반면, 플랫폼 엔지니어링은 사용자 중심의 문제 해결과 제품 완성도에 집중한다는 차이가 있다”며 “카카오페이증권은 쿠버네티스를 활용한 환경 구축 및 개선을 통해 사용자가 편리하게 개발할 수 있는 환경을 제공하기 위해 플랫폼 엔지니어링을 도입하게 됐다”고 강조했다. 그는 “플랫폼팀이 내부 고객인 동료들에게 제품이나 서비스에 대해 적극적으로 피드백을 받고 긴밀하게 소통하는 게 중요하다”며 “플랫폼 엔지니어링을 도입하려는 기업은 점진적이고 계획적으로 접근하고, 처음부터 전문적인 엔지니어와 조직을 만들기보다 기업 내에 생산성 병목이 있거나 개선이 필요한 영역을 찾고 자동화를 도입하고 그 결과에 따라 목표를 조정하라”고 조언했다. 가장 중요한 주제로 소개된 세번째 트렌드는 생성형 AI다. 맷 우드 AWS 제품 담당 수석 부사장은 AWS가 개발자 및 최종 사용자들에게 생성형 AI의 세 가지 계층에 대해 설명했고 각 계층에 AWS 생성형 AI 서비스 및 제품에 대해 소개했다. 개발자는 ▲파티 록(Party Rock) ▲아마존 Q 비즈니스 ▲아마존 베드록 ▲아마존 Q 디벨로퍼 등의 AWS 솔루션 중 자신의 상황 및 니즈에 맞게 선택해 파운데이션 모델을 기반한 생성형 AI 앱 개발 방식을 구현할 수 있다. 파티 록은 코딩 경험 없이도 누구나 프롬프트를 기반으로 간단한 기능을 구현하고 공유할 수 있게 해주는 '생성형 AI 놀이터'다. 예를 들어 팟캐스트를 생성하고자 할 때 특정 주제를 프롬프트로 지정하면, 이후 클릭 몇 번만으로도 제목, 예상 에피소드, 관련 이미지를 생성할 수 있다. 아마존 Q 비즈니스는 기업 내 데이터를 기반으로 생성형 AI 포털을 만들어 주는 완전 관리형 서비스다. 이를 통해 별도의 개발 절차 없이 검색 증강 기법, 즉 RAG 방식을 이용하는 챗봇 서비스를 바로 생성할 수 있다. 아마존 Q 비즈니스는 일반 사용자 모드와 관리자 모드로 나뉜다. 일반 사용자 모드는 생성형 AI와 실시간으로 상호작용해 바로 응답을 받을 수 있도록 설계됐다. 관리자 모드에서는 콘솔에서 애플리케이션을 만들고 사내 데이터를 연동할 수 있다. 여기에 S3 버킷이나 파일 업로드, 마이크로소프트 365, 구글드라이브, 세일즈포스, 슬랙 등 40여가지의 데이터 소스를 추가할 수 있다. 단순히 챗봇 기능뿐만 아니라 실제 업무 프로세스와 연동할 수 있으며, 콘솔에서 사용자 관리, 문서 인덱스 관리, 사용자 웹 환경 관리도 가능하다. 아마존 베드록은 단일 애플리케이션 프로그래밍 인터페이스(API)를 통해 AI 선도 기업의 파운데이션 모델(FM)을 사용할 수 있도록 지원하는 완전 관리형 서비스다. 폭넓은 모델 선택, 날리지베이스 에이전트, 가드레일, 모델 평가와 미세조정 등 다양한 기능을 제공한다. 이번에 베드록 스튜디오를 프리뷰 버전으로 출시하기도 했다. 베드록 스튜디오는 기술 자료, 에이전트, 가드레일 등 베드록의 주요 기능을 선별해 쉽고 신속하게 사용할 수 있도록 프로토타이핑 환경을 제공한다. 아마존 Q 디벨로퍼는 개발자들이 코드를 구현할 때, 사용할 수 있는 생성형 AI 도우미이다. AWS 콘솔 및 통합 개발 환경(IDE)에서 코딩 가이드, 코드 생성, 코드 테스트 및 레거시 코드 변환 기능 등을 제공한다. 개발자들은 아마존 베드록 및 아마존 Q를 이용해 생성형 AI 앱 기획부터, 설계, 코드 구현, 테스트, 배포, 추가 기능 개선 등 모든 소프트웨어 개발 사이클에서 맞춤화된 구현을 통해 업무 생산성을 향상시킬 수 있다. 가령 영국의 브리티시 텔레콤의 경우, 아마존 Q 디벨로퍼를 통해 사용자당 매일 15~20개의 코드 제안을 받고 있으며 도입 후 처음 4개월 동안 10만 줄 이상의 코드를 생성했고, 반복적인 작업의 12%를 자동화했다. 생성형 AI는 개발자들의 업무 생산성을 높이는 중요한 도구로서 지속적으로 기능해 나가고 있다. AI 커뮤니케이션 플랫폼 센드버드의 구정진 CTO가 이처럼 생성형 AI 기술을 활용해 더 나은 제품을 구현한 사례를 소개했다. 센드버드는 지난해 기업형 맞춤형 챗봇 '센드버드 AI 챗봇'을 출시했고 아마존 베드록 기반의 클로드3(Claude3)을 활용해 서비스의 오퍼링을 확대하며 이를 지속적으로 고도화하고 있다. 구정진 센드버드 CTO는 “센드버드는 채팅, 오디오, 비디오 콜과 같은 커뮤니케이션 API/SDK를 제공하는 회사로 최근 멀티채널과 AI 챗봇으로 서비스를 확장했다”며 “생성형 AI는 위기가 아닌 성장을 위한 기회이며, 쉽고 안정적인 API와 SDK를 활용해 고객사이 생성형 AI를 도입하는 데 가장 적절한 솔루션을 제공하려 노력하고 있다”고 밝혔다. 그는 새로 구현하게 된 노코드 기반의 AI 챗봇을 소개하며 “LLM을 실제 프로덕트에 적용할 때 응답 퀄리티 외에도 신경 써야 할 부분이 많다”며 “웹과 모바일 환경 모두에서 최적의 UI를 제공해 개발 시간을 단축할 수 있도록 지원할 계획이고 운영에 필요한 모니터링 및 다양한 워크플로와 통합 역시 제공할 계획”이라고 강조했다. 그는 “아마존 베드록을 기반으로 AI 챗봇을 구현했을 때 컴플라이언스 및 보안 문제를 해결할 수 있었다”며 '다양한 모델 선택이 가능하다는 점과 새로운 모델과의 통합이 용이한 점, 콘텐트의 안정성 관련한 가드레일의 편리함 등이 놀라웠다”고 덧붙였다. 그는 마지막으로 생성형 AI 시장의 기술 변화는 예측하기 어렵지만, LLM 모델의 비용 감소, 제너럴 모델과 검색 증강 생성(RAG)의 조합, 워크플로와의 연계가 중요한 토픽이 될 것이라고 전망했다.