뤼이드의 생성 AI 도전…"교육기술기업의 LLM 활용법"
머신러닝(ML)의 등장 후 인공지능(AI) 기술이 다양한 산업군에서 시도됐고, 그중 교육 분야는 가장 활발한 도전 분야 중 하나였다. 생성형 AI란 새로운 흐름 속에서 에듀테크를 혁신해온 AI 교육 기업은 생성 AI에 어떤 고민을 하고 있을까? 이에 대한 다양한 고민과 성찰을 들을 수 있는 기회가 최근 마련됐다. 뤼이드는 지난 26일 한국마이크로소프트에서 개최한 '마이크로소프트 스타트업 서밋-젠AI 로드쇼'에 참가해 '교육 기술회사는 생성형 AI를 어떻게 사용하고 있나'를 주제로 발표했다. 뤼이드의 한성민 ML옵스 리드가 세션 발표를 진행하고, 김민삼 프로덕트 VP가 패널토크에서 다양한 의견을 내놨다. 토익 테스트 학습에 AI를 접목한 '산타토익'으로 유명해진 뤼이드는 2014년 이래 꾸준히 AI 기술기반의 교육 서비스 개발에 투자해왔다. 뤼이드는 생성 AI에서도 매우 적극적인 행보를 이어가고 있다. 동영상 학습 콘텐츠에서 중요한 정보를 식별하고, 사용자에게 이해도를 체크할 수 있는 문제를 자동생성하는 '퀴지움'을 최근 선보이기도 했다. 한성민 리드는 “뤼이드는 작년부터 LLM 준비를 하고 있었고, 미국과 인도 시장을 목표로 한 서비스 퀴지움을 개발중이었다”며 “LLM 생태계가 만들어지고 효과적이고 빠른 기술이 등장하던 중 챗GPT의 등장 후 올해 들어 언어모델이 좋은 품질로 교육 문제를 만들 수 있다는 가능성을 보고 있다”고 말했다. 퀴지움은 문제 지문과 보기의 생성 품질을 매우 높은 수준으로 제공한다. 교육 전문가가 생성한 수준의 고품질 문제를 뽑아낸다. 동영상 교육자료 원문을 학습자에게 맞게 보정하고, 학습자의 지식 기반에 맞도록 뤼이드 고유의 지식 추적 기술을 바탕으로 생성형 모델 기술을 연결해 학습자에게 최적화된 문제를 제공한다. 퀴지움은 현재 브라질에서 시연됐고, 브라질 공교육 시장에서 강사를 돕는 솔루션으로 검토되고 있다. 한성민 리드는 퀴지움 외에 파워포인트나 워드 파일 속 콘텐츠에서 교육 문제를 만들어주는 '타이달', 학습자와 대화하며 공부를 도와주는 대화형 AI 'R에디(R.{eddy})', 토익 학습을 도와주는 '산타 챗' 등 현재 개발중인 LLM 관련 제품을 대거 선보였다. 타이달은 교육자를 위한 제품이다. LLM으로 문서 내 콘텐츠를 분석하고, 키포인트를 추출하며, 학습 목표에 따라 부족한 콘텐츠를 분석해 보정하며, 커리큘럼을 바탕으로 내용을 조정한다. R에디는 학습자와 소통하는 양방향 교육 서비스다. 과외선생님처럼 학습자 곁에서 공부를 도와준다. 학습 교재를 읽고 있을 때나, 특정 교재 부분에 도달했을 때 새로운 공부를 할 수 있게 한다. 학습자는 R에디에게 모르는 부분을 질문하기도 하고 토론도 하면서 성취도를 높여갈 수 있다. R에디는 학습자의 집중을 유지할 수 있는 다양한 활동도 한다. 영어 작문을 할 때 교정을 해주기도 한다. 산타챗은 토익 공부 중 모르는 부분을 물어봐 답을 제공 받고, 중요한 내용을 알려주는 제품이다. 말하기 시험을 준비할 때 발화의 문법을 평가하고 교정, 첨삭하는 기능도 개발되고 있다. 한 리드는 “LLM은 교육 분야에 임팩트 강한 변화였다”며 “LLM을 사용해 뤼이드의 제품과 교육자를 돕는 방식을 정말 많이 고민하게 됐고, 다수의 제품팀이 하나하나 기술을 도입해 출시하고 있다”고 밝혔다. 그는 “뤼이드란 교육 패키지 안에서 이런 기능들을 하나의 교육기술로 응축시켜 뤼이드 AGI 테크를 만드는 걸 최종목표로 한다”고 덧붙였다. LLM의 교육 분야 접목은 학습자의 성취도 향상이란 근본적 목표에서 새로운 가능성을 연 것으로 판단됐다고 한다. 김민삼 VP는 “점수예측, 콘텐츠 큐레이션 측면만 보면 우리가 몇가지 숫자를 보여준다고 학생이 문제 풀어야겠다는 동기부여를 느끼기 쉽지 않다”며 “그 콘텐츠를 왜 풀어야 하고, 어떤 효과를 얻을 수 있는지 인간 선생님이 학생에 이유를 설명해주듯 LLM은 학생의 학습의지를 높일 수 있다고 본다”고 말했다. 그는 “정오답 예측, 점수 예측, 문제 추천, 이미지 생성, 텍스트 생성 등의 AI는 무엇을, 어떻게, 왜를 담은 멀티모달 콘텐츠를 생성하는 것”이라며 “어떤 교재로 가르쳐야 가장 재밌고 오랫동안 효율적으로 학습할까 탐구하고, 어떤 콘텐츠를 줄 때 왜 배워야하는지 동기부여를 하며, 기존의 추천 시스템이 진단 목적이나 교수 효과 목적에서 점점 더 좋아지려면 어떻게 해야 하는지 등 새 기술을 기존 시스템에 융합할 지 연구한다”고 덧붙였다. 뤼이드는 대표 상품인 산타토익에도 생성 AI 기술을 일찌감치 접목하려 했다. 김 VP는 “처음 챗GPT를 보고 우리만의 것을 가져야 할지, 오픈AI의 인터페이스보다 더 좋은 것을 만들 수 있을지 검토했다”며 “효과를 정량적으로 확인하고 싶어서 오픈AI와 다른 오픈소스 모델, 자체 모델 등이 언어 학습자의 질문에 정확하고 연관성 높은 답변을 내놓을 수 있는지 내부 전문가들과 블랙박스 테스트를 했다”고 말했다. 그는 “뤼이드 자체 AI의 답변과 오픈소스 모델의 답변을 비교할 때 오픈소스는 훨씬 떨어지는 성능을 보였다”고 밝혔다. 그는 “여러 언어학습의 형태 중 표준화된 영어 숙련도를 판단하는 시험에서 사용자의 요구는 점수를 빠르게 올리는 것이지 오랜시간 그 언어에 노출돼 회화를 늘리는 게 아니다”라며 “빠른 시간 내 영어 실력 높이는 코칭, 교수를 원하는데, 시중의 LLM은 외국인이 가르치는 식이고, 한국인의 영어학습 문법체계도 다르기에 답변의 역량이 현저히 떨어졌다”고 설명했다. 그는 “RAG(Retrieval Augmented Generation) 기술이 보조적으로 들어가는데 아마도 뤼이드가 가장 선제적으로 고급 프롬프트 엔지니어링 기술과 시스템 연동 기술을 연구했다고 생각한다”며 “시중의 모델은 모델의 퀄리티 체크 프로세스도 별도의 AI 모델을 활용하기에 성능이 떨어지지 않았나 여기고 있다”고 밝혔다. 그는 “현 수준에서 오픈소스 모델의 답변은 내부 수치 기준으로 100점 만점에 38점이고, 뤼이드 내재 모델은 93점을 받고 있다”며 “확실히 재미를 넘어서 더 유용한 가치를 제공할 수 있는 기술적 해자를 확보했다고 본다”고 덧붙였다. 뤼이드의 생성형 AI 제품은 크게 세 갈래로 나뉜다. ▲LLM 날리지 트레이싱, LLM 점수 예측(KTSP), LLM FastCAT, LLM 튜터 등 GPT 같은 자연어 모델에 기반한 KT/SP와 문제 생성 ▲이미지 생성 등 생성 기반 모델 ▲스피킹 스코어링, 에세이 스코어링 및 리라이팅 등 이미지 및 텍스트를 복합적으로 사용하는 평가 모델 등이 있다. 뤼이드는 마이크로소프트 애저 오픈AI 서비스를 이용해 생성 AI를 개발하고 운영중이다. 오픈AI의 모델을 활용할 수 있고, 인프라의 안정성과 기술지원 때문이란 설명이다. 한성민 리드는 “오픈 AI 모델을 택한 건 그 자체 임팩트가 크고, 생성 결과물의 품질을 확인하는 문제도 있다”며 “애저 오픈AI를 쓰는 건 기업에서 고민하는 콘텐츠 필터링에서 도움을 받을 수 있고, 명확한 인프라 제공으로 서비스 장애를 미연에 방지할 수 있다는 점에서 사용하고 있다”고 말했다. 그는 “마이크로소프트의 애저 전문가와 논의하면서 생성 AI의 교육 AI 임팩트를 함께 고민하고 나아갈 수 있다는 이점도 있었다”고 밝혔다. 김민삼 VP는 “개발자와 연구원 입장에서 볼 때 오픈AI가 여러 모델을 선도하고, 마이크로소프트와 긴밀한 관계를 맺어서 거기서 발생하는 주요 업데이트와 업그레이드를 가장 빠르게 도입할 수 있는 부분이 크게 작용했다”고 덧붙였다. 오픈AI 서비스 외에도 애저 코그니티브 서비스 등 다양한 클라우드 기반 AI 제품을 활용중이다. 한 리드는 “생성 AI 말고도 스피치 인식도 애저를 검토하고 있고, 뤼이드의 비즈니스 문제를 애저의 기술로 해결하는 것을 마이크로소프트에서 로드맵과 아키텍처 베스트 프랙티스를 제공한다”며 “애저의 쿠버네티스 서비스 위에 하나씩 오픈해서 좀 더 고가용성 기준으로 전체적 인프라를 검토해야 하고, 애저가 그런 부분에서 단단히 잡혀 있어 도움을 받고 있다”고 말했다. 또 “한가지 더 GPU 증설 고민이 큰데 하이엔드인 엔비디아 H100과 A100 확보에도 도움을 받을수 있고, 여러 서버를 하나의 연구 태스크로 빠르게 학습할 수 있는 구성도 애저 전문가와 깊이있게 논의하고 있다”고 덧붙였다. 김 VP는 “제품 관점에서 아직 가장 많은 트래픽이 산타 서비스인데 이른 시점부터 산타에 생성 AI 기술을 도입했을 때 DAU가 3~5%였다”며 “그러다 기능 개선과 넛지 툴을 테스트하면서 40~50%로 확 뛰었던 사례가 있었는데, 트래픽 스파이크가 왔을 때 그것을 감당할 수 있다는 게 애저의 돋보이는 점이라고 본다”고 말했다. 뤼이드는 현재 자체 LLM을 구축할 인프라를 준비하고 있다. 지금은 엔비디아 A100 GPU 8개를 장착한 서버를 두자릿수로 운영중이고, 추가 증설할 계획이다. 데디케이티드 환경과 퍼블릭 클라우드 환경을 활용하고 있는데, 향후 마이크로소프트 애저의 DGX H100 GPU 서버를 추가 증설할 예정으로 논의중이다. 사실 생성 AI의 각 산업별 접목의 성패, 비즈니스 이점은 아무도 확신하지 못하는 상황이다. 뤼이드도 확실한 이점을 파악한 건 아니다. 다만 기술적 제한점과 미래 가치에서 명확한 인식을 갖고 있다. 김 VP는 “현재까지 뾰족한 해답은 아직 없는데, 확실히 확인한 것은 비용과 딜레이 등의 기술적 제한점이 분명하다는 점”이라며 “기술적 문제는 단기적으로 해결될 것으로 보고 있고, 제품팀 입장에선 경험적 타협을 해야 한다고 생각한다”고 말했다. 그는 “특정 한 사용자를 위해 감당할 비용을 시뮬레이션하고 예측해야 하는데, 투명하게 사용자와 공유할 방법을 고민하고 있다”며 “디테일한 고민으로 실제 비용을 줄이면서 UX를 해치지 않는 타협안이 나와야 한다”고 덧붙였다. 잘 할 수 있는 것으로 집중해 해자를 파야 한다는 점에 대해서도 언급했다. 김 VP는 “장기적으로 뤼이드가 조금 손해를 보더라도 채팅, 생성 인터랙션으로부터 볼 수 있는 미래가 있을 것이라 생각한다”며 “그건 콘텐츠 해자와 기술적 해자일텐데, 캐릭터닷Airk 오픈AI 트래픽 상당부분을 차지하듯 사용자가 생성한 채팅 기록이나 프롬프트가 콘텐츠화돼 해자로 작용하고, 오픈AI에서 하지 못하는 니치한 작업에서 분명한 엣지를 보여준다면 단기적 비용 우려보다 장기적 비전과 전략에서 큰 기여를 할 것”이라고 강조했다. 한성민 리드는 “ML옵스로서 계속 예측해야 하는 미션이 있고, 올해 AI 격동기여서 예측이 매우 힘들었다”며 “생성 AI의 컴퓨팅은 효율화되지만, AI에서 요구하는 연산 비용은 늘어나고 있어서, 앞으로 가야할 우리의 AI가 어느정도 비용을 요구하고 어느정도로 줄어들 수 있는지 같이 예측하면서 연구개발하는 게 중요하다”고 말했다. 두 사람은 생성 AI로 교육 시장에 새로운 변화가 또 찾아올 것이라고 예상했다. 인간의 AI로 대체를 보진 않았다. 학생의 성취도를 높이면서 교육자의 교수 역량 강화에 집중할 수 있게 하는 AI에 방점을 찍었다. 김 VP는 “교육이란 분야는 선생님, 부모, 친구, 학습자 등 다양한 플레이어가 있다”며 “AI가 할 수 있는 것과, 해도 되는 것, 했을 때 무조건 더 사람보다 잘 할 것, 평생해도 사람보다 못할 것 등을 보고 교육 생태계에서 각 관계자에게 자신의 가치에 더 집중할 수 있는 보조적 도구를 만드는데 심혈을 기울이고 있다”고 밝혔다.