"KoBERT부터 A.X 4.0"...SKT, 국산 LLM 기술력 7년 축적
SK텔레콤은 과학기술정보통신부가 추진한 '독자 AI 파운데이션 모델' 프로젝트에 참여하며, 지난 2018년부터 지속해온 한국어 특화 AI 자립 노력이 본격화될 것이라고 24일 밝혔다. SK텔레콤은 그간 한국어에 최적화된 초거대 언어모델(LLM)을 독자 기술로 개발하며, 국내 AI 생태계의 기술 자립과 실용화를 위한 기반을 꾸준히 다져왔다. 2018년부터 자연어 이해 및 생성 기술을 연구하며, 주요 모델을 오픈소스로 공개해 생태계와의 상생도 추구해왔다. 현재 AI 기술은 감성 대화, 통화 요약, 지식 응답 등 고객 접점에서 실제 서비스로 이어지고 있다. 한국어 특화 LLM의 진화, KoBERT에서 A.X 4.0까지 SK텔레콤은 2019년 한국어 딥러닝 모델 'KoBERT'를 자체 개발·공개하고, 고객센터 챗봇에 적용했다. 이 모델은 조사·어순·띄어쓰기 등 한국어 구조를 반영해 문맥 이해에 강점을 보였다. 2020년에는 한국어 GPT-2 모델 'KoGPT2'와 뉴스·문서 요약 특화 모델 'KoBART'를 공개하며 자연어 처리 기술을 확대했다. 주요 모델들은 오픈소스로 공개됐으며, 이는 한국어 기반 생성형 AI 기술의 초석이 됐다. 2022년에는 자체 GPT-3 기반 한국어 특화 모델을 '에이닷'에 적용해 일상 대화와 작업 수행이 가능한 AI 서비스를 구현했다. 이어 감성 대화형 'A.X 1' 모델을 추가 적용하며, 정서적 교감 기능을 강화하기도 했다. 2023년에는 복잡한 문맥 이해와 지식 기반 응답이 가능한 'A.X 2'를 차례로 선보였다. 2024년에는 추론 성능을 높인 'A.X 3.0'을 출시했다. 각각 340억(34B, 표준형), 70억(7B, 경량형) 파마미터 모델로 구성되며, 통화 요약과 AI 에이전트 기능에 실제 적용됐다. 모든 모델은 구조 설계부터 데이터 수집과 학습까지 SK텔레콤이 자체 개발한 '프롬 스크래치' 방식이다. 성능과 효율 모두 잡는 '투 트랙 전략' 가동 2025년 7월에는 외부 지식 기반 추론 성능을 높인 'A.X 4.0'을 공개했다. 대규모 학습(CPT) 방식으로 학습돼 보안성과 로컬 운영, 한국어 처리 효율에 강점을 지닌다. 이 모델은 현재 에이닷 통화 요약 등 실서비스에 적용되고 있다. 이어 SK텔레콤은 70억(7B) 및 340억(34B) 파라미터 규모의 'A.X 3.1' 모델도 공개했다. 이 모델들은 추론모델 확장을 고려해 코드와 수학 성능을 강화했다. SK텔레콤은 '프롬 스크래치' 기반 A.X 3 계열 모델과 CPT 기반 A.X 4 계열의 대규모 모델을 병행 개발하는 '투 트랙 전략'을 통해 다양한 환경에 최적화된 AI 모델 포트폴리오를 확장하고 있다. SK텔레콤은 앞으로도 한국어에 특화된 LLM 기술 고도화를 이어가며, 초거대 AI의 산업화와 일상화를 이끌고, 기술 공유와 협력을 통해 국내 AI 생태계 활성화에 기여할 계획이다.