이경전 교수 "AI역사는 챗GPT 이전과 이후로"···경영정보학회 줌 세미나 성황
한국경영정보학회(회장 김종원 동의대 교수)가 '챗GPT 인공지능(AI) 혁명과 경영정보학의 미래'를 주제로 개최한 온라인 줌 세미나가 30일 열렸다. 세미나 시작하자 마자 최대 참석 인원인 100명이 입장하는 등 성황을 이뤘다. 이날 이경전 경희대 교수는 "AI역사는 챗GPT 이전과 이후로 나뉜다"면서 사용자 입장에서 챗GPT 등장은 2016년 3월의 '알파고'보다 충격이 더 크다고 진단했다. 챗GPT는 2015년 설립된 미국 오픈AI사가 작년 11월 선보인 초거대 언어AI다. 이 교수는 '알파고'는 대중이 사용해 볼 수 없었지만 챗GPT는 누구사 써 볼 수 있다면서 사용자 관점에서 인터넷의 역사가 넷스케이프 이전과 이후로 나뉘는 것과 같다고 해석했다. 이어 1990년대 등장한 웹브라우저와 웹사이트가 미국 아메리카온라인(AOL)과 한국 하이텔 같은 PC통신서비스를 사라지게 한 것 처럼 챗GPT 등장은 빅테크와 글로벌 기업의 판도에 큰 변화를 가져올 것으로 예상했다. 그는 챗GPT가 대화 능력 등 세 가지 관점에서 '혁명적'이라고 짚으며 "인간 역사상 문맥을 이해해 대화를 형성한 첫 기계"라며 챗GPT를 강조했다. 하지만 챗GPT가 한계도 있다고 지적했다. 첫째, 데이터가 충분히 많아야 하며 훈련 시간이 오래걸리며 둘째, N개의 단어 배열이 주어지면 N+1번 째가 나올 가장 그럴듯한 단어를 출력하는 확률 시스템이며 셋째, N+1번 째의 단어가 나오면 다시 그 N+1개의 단어 배열을 입력해 N+2번 째의 단어를 출력하는 방법을 반복, 대답과 문장을 만드는 단순한 구조 넷째, 언어로 표현되지 않는 암묵적 지식은 학습이 안될 뿐 아니라 역사적 사실과 현재 상황, 허구적 문장 등을 구분하지 못하며 다섯째, 많은 비용(파라미터 숫자에서 0을 빼면 컴퓨터 비용이 됨) 여섯째, 학습 비용이 얼추 무어의 법칙에 의해 줄어드는 것 등을 꼽았다. 반면 장점은 첫째, 레이블링이 필요없고 둘째, 단순 구조로 모든 자연어 생성 행위를 해결하겠다는 근본적 방법 셋째, 범용 기술을 계속 발전시켜 문답 처리, 문법 체크 등 여러 업무에 사용 넷째, 각 문제 영역에서 기존 시스템보다 낫거나 필적한 성과 등을 들었다. 챗GPT는 이전 GPT3가 가진 많은 문제를 1년여만에 해결했는데 이 교수는 "머리만 쓴게 아니라 노동력도 사용했기 때문"이라고 들려줬다. 챗GPT는 GPT3와 달리 사람의 피드백을 받아 기능을 고도화시켰다. 특히 이 교수는 네이버가 2021년 6월 내놓은 초거대 언어AI '하이퍼클로바'를 거론하며 "추격 그 이상의 전략이 필요하다"고 제안하면서 "싸이월드 같은 전철을 밟으면 안된다"고 강조했다. '하이퍼클로바'는 5600억개 토큰 데이터셋과 2040억개 파라미터를 갖고 있다. 한국어 비중이 97% 이상인 한국어 데이터로 구성됐다. 본인이 대학생이라면 AI대화 분야에서 창업을 했을 거라면서 "(새로운 AI 등장으로) 앞으로 아마존 같은 새로운 회사가 나오지 않을까 한다"고 예상했다. 이경전 교수에 이어 '챗GPT를 활용한 대학 교육과 연구'를 주제로 발표한 안현철 국민대 교수(비즈니스IT전문대학원)는 챗GPT의 기술 특성에 대해 "챗을 할 수 있게 이전 대화 내용을 기억하도록 설계됐다"면서 "토큰 단위로 텍스트를 처리하기 때문에 한글보다 영어로 대화를 진행하는 것이 더 유리하다"고 분석했다. 또 챗GPT는 기술적으로 RLHF(Reinforce Learning from Human Feedback)를 들며 1단계로 베이스 모델을 먼저 학습했고 2단계로 인간의 피드백 데이터를 사용해 보상 모델(Reward Model)을 학습했고 3단계로 2단계에서 구축한 모델을 활용해 강화학습 알고리즘으로 1단계 모델을 파인 튜닝(Fine Tuning) 했다는 것이다. 이에 "역설적이게도 거대 언어 모델 성능의 핵심적 영향 요인은 사람"이라고 진단한 안 교수는 "이는 IBM 왓슨에서도 이미 경험한 것으로 앞으로 챗GPT가 어디까지 발전할 수 있을 지에 있어 LLM(대규모 언어모델) 규모 외에 이 부분도 중요하다"고 밝혔다. 또 챗GPT 기술 특성으로 기존 데이터와 유사한 새로운 데이터를 생성하는 '생성 모델'이며 앞에 단어가 주어지면 시퀀스에서 다음 단어를 예측하는 '확률적 모델'이라면서 "챗GPT의 학습데이터 중 영어 데이터는 92%인 반면 한국어 데이터는 0.19%밖에 안되는 것으로 추정된다"고 말했다. 알아두면 좋은 챗GPT 관련 확장 앱과 웹을 소개한 안 교수는 국민대 신문 사설에 나온 내용이라면서 "인공지능과 구별되는 인간 고유의 힘, 즉 창의적 질문 능력과 비판적 상상력, 타자를 향한 공감 능력이 우리에게 필요하다"고 강조했다. 안 교수에 이어 '지능형 디지털 금융과 신뢰가능한 인공지능'을 주제로 강연한 홍태호 부산대 경영학과 교수는 인공지능의 정의에 대해 사람처럼 행동하는 기계로 서비스를 제공하는 대상이 사람인지 기계인지 구분할 수 없다면서 "오래전 내가 몇년 걸려 한 일을 지금 GPT는 수초만에 해결한다"고 들려줬다. 대화형 인공지능이 완성된다면, 즉, 사람 명령을 100% 이해하는 AI가 나온다면 할 일이 많다면서 "현재의 간편결제도 의미가 없어진다"고 예상했다. AI가 알아서 다 쇼핑을 해주니 사람이 간편이든 그렇지 않든 고민할 필요가 없어진다는 거다. 금융권의 AI 적용 분야로 고객경험, 마케팅 및 영업, 리스크 관리, 후선업무 지원 등을 들며 "하지만 GPT같은 AI를 어디까지 신뢰할 수 있는가의 문제가 남아 있다"고 말했다. 텍스트 마이닝의 역사는 2017년 셀프 어텐션이 나오면서 전환점이 됐는데 4.5년전부터 가짜 뉴스를 연구하고 있다는 그는 챗GPT가 그럴듯한 가짜 리뷰를 10만건이든 100만건이든 만들어 낼 수 있다면서 "가짜 리뷰를 과연 탐지할 수 있을까?"라는 근본적인 질문을 제기하기도 했다. AI가 다크 사이드에 사용되면 구분하기 굉장히 어렵다고 진단한 홍 교수는 신뢰가능한 AI의 조건으로 딜로이트가 제시한 공평성과 프라이버시, 안정성과 보안, 투명성, 책임성 등 6가지를 들려줬다. 이어 홍 교수는 초거대 AI GPT가 가야할 길로 ▲독립적인 초거대 AI가 복수로 필요 ▲AI를 본격적으로 사용하기 위한 기반 조성 ▲GPT 기반 응용 활동 억누르면 안됨 ▲학습 방법이 투명해야 함 ▲AI도 필수 윤리가 필요 등의 5가지를 제안했다.