애자일소다 "기업 특성에 맞는 AI 모델로 솔루션 키워야"
"챗GPT 출현 이후, 세상은 변했습니다. 전 세계 기업은 GPT를 비즈니스에 어떻게 적용할 수 있는가에 혈안입니다. 기업은 제품에 맞는 모델로 기술 수준을 올려야 합니다. GPT 모델만이 유일한 답은 아닐 수 있습니다." 최대우 애자일소다 대표는 대규모 인공지능(AI) 모델을 사업에 적절히 활용하는 것이 핵심이라고 본지 인터뷰를 통해 밝혔다. 최대우 대표는 챗GPT에 탑재된 기술 수준을 높게 평했다. 특히 언어 데이터를 대용량으로 모아 사람 의도에 맞게 답변하는 기능을 긍정적으로 내다봤다. "챗GPT는 사람 말귀를 알아듣습니다. 사람 질문 의도와 문맥을 파악하고, 가장 적합한 답을 줍니다. 대용량 데이터셋에서 사람이 가장 선호하는 답을 내놓는 것 자체가 대단한 기술입니다." 챗GPT는 '인각피드백형 강화학습(RLHF)'을 통해 해당 기능을 갖췄다. RLHF란, 사람 피드백으로 AI 알고리즘을 미세 조정해 훈련하는 학습법이다. 이를 통해 챗GPT는 제멋대로 답하지 않는다. 아직 완벽하지 않지만 문맥에 맞는 답을 낸다. 최대우 대표는 챗GPT가 '스케일링 법칙' 실현 가능성을 증명했다는 입장이다. 스케일링 법칙은 모델 크기와 데이터셋을 키우고 훈련 시간을 늘리면, 모델 성능 자체도 좋아진다는 이론이다. "지금은 너무 당연한 말이지만, 스케일링 법칙은 가설에 불과했습니다. 당시 GPT나 구글 버트처럼 대용량 데이터셋을 직접 실험하지 않아서죠. 여력이 없었습니다. 오픈AI가 GPT-2를 공개했을 때 아무도 GPT-3까지 갈 수 있을 거라고 확신하지 못했어요. 챗GPT로 인해 실현가능한 이론이 된 셈입니다." 그는 앞으로 AI 분야에 적극 투자해야 성능 좋은 모델을 내놓을 수 있다고 주장했다. 예를 들어 지난해 1천억원 투자하고, 올해 2천억 투자하면 모델 성능도 2배 오를 수 있다는 말이다. 그는 "오픈AI가 막대한 투자와 노력으로 GPT-4를 만들었다"며 "결과적으로 크기뿐 아니라 성능도 GPT-3보다 좋아진 건 당연하다"고 말했다. "GPT만 해답 아냐...기업 데이터X경량화 모델도 효과적" 최대우 대표는 전 세계 기업이 GPT 모델을 자사 솔루션에 접목하는 것에 대해서도 언급했다. 최 대표는 기업 제품 용도나 업무에 적합한 AI 모델을 활용해야 한다는 입장이다. 기업이 무조건 GPT 모델만 쫓을 필요는 없다는 의미다. 제품에 맞는 모델을 적절히 찾아 사용하는 것이 우선인 셈이다. 그는 GPT가 기업용 업무에 아직 완벽지 않다는 점을 이유로 들었다. 기업용 업무에 맞게 사용하려면 매개변수 약 2천억개를 하나씩 미세조정 해야 해서다. 비용도 천문학적으로 든다. 대신 기업용 제품에 적합한 모델을 접목해 솔루션 능력을 올리는 것이 더 효율적이라는 설명이다. "기업 서비스는 틀에 정해져 있습니다. AI 챗봇부터 추천 서비스까지 다양합니다. 파라미터가 GPT보다 가벼운 구글 모델 버트로도 효율적인 서비스를 제공할 수 있다는 의미입니다. 기업이 가진 데이터와 버트를 결합해도 솔루션 역량을 끌어올릴 수 있습니다." 구글 언어 모델 버트는 파라미터가 약 1억개다. 애자일소다는 구글 버트를 활용해 AI 자연어처리 플랫폼 '트윈독'을 개발해 운영 중이다. 버트 기반으로 AI가 문맥을 이해하고 감정과 의미를 반영한 분석 도구다. 트윈독은 화자 의도나 감성 포착도 가능하다. 주로 상담 내용, 후기, 게시판 내용 등 보이지 않는 고객 의중을 찾아낸다. 애자일소다 측에 따르면 금융 분야를 비롯한 보험, 식품 관련 쇼핑몰 분석 프로젝트에서 고객 의도 파악에 뛰어난 성능을 보인다. GPT보다 파라미터 적은 버트로도 효과적인 기업용 도구를 만들 수 있는 사례기도 하다. "멀티모달, AI로보틱스·반도체 설계에 스며들 것" 최대우 대표는 향후 AI 언어모델과 멀티모달로 인한 미래 산업을 내다봤다. 최 대표가 주의 깊게 본 분야는 AI 로보틱스와 반도체 설계다. 그는 멀티모달 기술을 로봇에 탑재하면 AI 로보틱스를 실현할 수 있을 것으로 봤다. 최 대표 설명에 따르면 현재 AI 로봇은 완벽하지 않다. 제한적인 환경에서만 작동하는 '세팅형 로봇'이다. 최 대표가 그리는 AI 로보틱스는 로봇을 멀티모달로 훈련하는 방식이다. 해당 로봇은 스스로 환경을 보고 인식할 수 있다. 또 어떻게 움직여야 할지 스스로 사고할 수도 있다. "AI 로보틱스는 지금처럼 미세한 조정을 하지 않아도 스스로 상황을 인지해 움직일 수 있을 겁니다. 멀티모달 기술을 접목하면 실현 가능하다고 봅니다." 반도체 설계도 마찬가지다. 반도체 설계에 강화학습을 활용하는 식이다. 최대우 대표는 "현재 반도체 설계에 대한 기술을 상용화 수준으로 끌어올렸다"며 "완전한 상용화를 위해 노력하겠다"고 강조했다.