[방은주의 AI세상] 클로바X에 쏠린 시선···해외진출 등 아쉬움
네이버가 24일 자체 개발한 생성형 인공지능(AI) '하이퍼클로바X'를 공개했습니다. 미국 오픈AI의 '챗GPT'와 구글 '팜2' 등 해외 빅테크가 주도하는 생성 AI 시장에 도전장을 던진 겁니다. 네이버와 함께 국내 거대AI시장을 선도하는 LG AI연구원도 지난 7월 마곡 LG사이언스파크에서 'LG AI 토크 콘서트 2023'을 열고 초거대 AI '엑사원 2.0'을 공개한 바 있습니다. 네이버는 이날 행사를 '팀 네이버 콘퍼런스 단 23'이라고 붙였습니다. 단(壇)은 플랫폼의 한국어인데요, 여러 의미를 가진 다의어입니다. 특히 네이버는 '팀(Team)'을 강조하며 행사장 곳곳에 '팀 네이버'를 강조했는데요, 계열사가 51개나 돼서 그런다고 합니다. 행사장(서울 삼성역 인근 그랜드 인터컨티넨탈 파르나스 5층)에는 사람들이 넘쳤습니다. 행사를 시작한 오전 10시전부터 인파가 몰렸는데, 온오프라인으로 진행했는데 현장에 약 2천여명이 왔다고 합니다. 행사가 행사인 만큼 네이버에서도 주요 경영진과 임직원들이 꽤 많이 왔습니다. 네이버는 이날 ▲대화형 AI 서비스 '클로바X(CLOVA X)' ▲기업생산성 향상을 위한 AI 플랫폼 '커넥트X(CONNECT X)' ▲비즈니스에 최적화한 AI개발 도구 '클로바 스튜디오(CLOVA Studio)' 등 세 종류 서비스를 선보였습니다. 이들을 설명한 총 12개 세션 발표가 이뤄졌는데 역시 하이라이트는 최수연 대표의 오프닝 키노트였습니다. 20분 정도 발표를 한 최 대표는 "네이버는 기술로 세상을 변화시키는 꿈을 꾸고 있다"면서 "생성형 AI20분라는 새로운 변화를 맞이할 준비를 마쳤다"며 말을 마쳤습니다. 최 대표는 '80년대생 CEO'로 2021년 CEO 선임때부터 화제를 모았죠. 1981년 전라도 광주 출신으로 서울대에서 지구환경시스템공학과 언론정보학을 복수전공했습니다. 2005년 네이버 전신인 NHN에 공채로 입사해 네이버와 인연을 맺었습니다. 2009년 연세대학교 법학전문대학원 1기로 진학해 2012년 변호사 자격증을 취득하고 법무법인 율촌에서 M&A 업무를 담당하다 2019년 다시 네이버로 합류했습니다. 작년 3월 주총에서 대표이사로 정식 선임됐으니 CEO가 된지 1년 5개월이 조금 넘었네요. 워킹 맘이기도 합니다. 오늘 '방은주의 AI이야기'는 세션 발표보다 최 대표 등 네이버 주요 발표자들이 발표 후 현장에서 50여명의 기자들과 나눈 질의응답(Q&A)을 중심으로 써볼까 합니다. 구글, MS 등 글로벌 빅테트에 대항하는 네이버의 경쟁력과 AI와 저작권 문제, 해외 진출 계획 같은 주요 경영 전략들이 공개됐기 때문입니다. 기자간담회에는 최 대표 외에 네이버 초거대AI를 진두지휘하고 있는 성낙호 네이버클라우드 하이퍼스케일AI기술 총괄과 김용범 네이버 서치(Search) US AI기술 총괄, 최재호 네이버 AiRSearch 책임 리더 등 4명이 참석했습니다. 주로 최 대표와 성 총괄이 답변을 했습니다. 이번 기자간담회에서는 네이버의 AI 학습 데이터에 대해 그동안 대중에 잘 못 알려진 사실도 처음으로 수정, 공개됐습니다. 즉, 그동안 네이버 거대AI가 학습한 뉴스 분량이 50년치라고 알려졌었는데 이날 최수연 대표는 "사실이 아니다"면서 "학습 데이터 규모를 알기 쉽게 전달하는 과정에서 생긴 것으로, 뉴스 50년치가 아니고 (뉴스 전체 분량이) 1년에 검색 되는 뉴스 분량의 50배"라고 밝혔습니다. 아쉬운 부분도 있었습니다. 가장 관심을 모은 하이퍼클로바X의 파라미터와 데이터 학습량을 공개하지 않았습니다. "구글 같은 글로벌 기업도 그렇게 한다"면서 기업비밀이라고 설명했습니다. 해외 진출 부분도 아쉬웠습니다. '내수용'이라는 지적이 억울하다면서도 구체적인 해외 진출 전략과 계획은 설명하지 않았습니다. 단지 "이야기 중이며 적극 나서겠다" 정도만 표명했습니다. 성낙호 총괄은 "원하는 시장에서 원하는 인공지능을 빠르게 공급하는게 우리 전략"이라면서 심지어 "한국에 더 배팅했다"는 말도 했습니다. 우리가 네이버에 기대하는 건(물론 당사자들은 그 기대가 버겹겠지만) '골목대장'이 아니라 '글로벌 플레이어'인데 말입니다. 아래는 기자들과의 Q&A 내용입니다. Q: 구글과 비교했을때 네이버만의 장점은? 초거대AI는 운영비가 많이 들어가는데... ▲최수연 대표: 자연스러운 한국어 표현을 포함해 한국사회의 맥락이라든지, 제도와 법, 이런 부분을 모두 이해하고 있는 생성형 AI라는 점이다. 이 점이 가장 큰 차별점이다. 우리나라 창작자분들이나 소상공인들이 결국 한국 시장을 타깃으로 하고 있다는 점에서 국내 파트너들에게 가장 최적화한 생성형AI라고 생각한다. 글로벌 얘기도 많이 해주시는데, 굉장히 커스터마이징한 서비스를 제공할 수 있다는 것이 우리 특장점이다. 데이터를 이야기 했지만, 이용자들이 인터넷에서 하는 모든 행위가 일어나는 게 플랫폼이고 그게 네이버고, 네이버는 이런 데이터들을 다 학습했고 또 매일매일 갱신하는 최신 데이터를 학습한 대규모 언어모델이라는 점이 우리 특장점이다. 비용 이슈는, 생성AI가 우리의 대규모 B2C 서비스를 붙이기에는 여러 비용 이슈가 있는게 맞다. 그래서 B2B 모델부터 수익화를 하면서 클로바서비스에 대한 검증을 계속해 나갈 예정이다. 우리 전제는, 기존까지 우리 모든 기술이 그런 전환기를 거쳤을때, 비용이 올라가는 이슈들이 항상 있었지만, 결과적으로는 그게 서비스 경쟁력과 차별점으로 연결되고 이게 우리 수익으로 이어지는, 이런 효과를 이미 경험했기 때문에, 우선은 한정된 사용자들을 대상으로 베타 테스트를 진행하면서 검증을 계속해 나갈 예정이다. ▲성낙호 총괄: (비용부담을 줄이기 위해) 경량화라든지, 우리만의 반도체 설계라든지 이런 기술적인 연구 투자를 계속해 나갈 계획이다. 유니버셜한 데이터를 학습하면 그만큼 돈이 더 많이 들어간다. 그래서 우리는 로컬라이즈 전략을 취했다. 세계를 타깃으로 하는 글로벌기업은 반대로 국가별의 로컬라이즈 경쟁력은 약화될 수 밖에 없다. 우리는 한국에 배팅한거다. 한국에 특화한 모델을 만들고 경량화를 진행하고 있다. -해외 플랫폼이 강세다. 업그레이드한 클로바X는 얼마나 성능이 좋아졌나? 수치로 말해달라 ▲최수연: 검색시장이나 점유율, 그리고 앱 사용시간, 체류율 등에 대해 여러 매체들이 점유율이나 순위를 발표하고 있다. 이에 따라 네이버 점유율이나 경쟁력이 약화하고 있는 것 아니냐는 우려 목소리가 있는 것 알고 있다. 사실은 일관된 기준을 갖고 집계하는 매체가 있는게 아니라, 내부적으로 우리 경쟁력을 판단하는 여러 지표들을 갖고 있다. 매출을 비롯해 검색 등은 견고하게 유지되고 있는 편이라고 말씀 드릴 수 있을 것 같다. 네이버는 이용자들의 니즈를 어떻게 만족시킬 수 있을 지에 더 집중을 해서 전략을 짜고 있다. 우리가 계속해 기술을 뾰족하게 해 우리 경쟁력을 유지해 나가다면, 사실 이용자들이 우리한테 바라는 건 검색이고, 이에 대한 점유율이나 경쟁력을 유지해 나갈 뿐 아니라 오히려 더 강화할 수 있을 것이라고 자신한다. ▲성낙호: 경쟁사 대비 수치로 비교해달라고 했는데, 초대규모언어 모델이 특별히 어떤 목적을 갖고 만들어진 게 아니라 하나의 수치로 비교하는 건 적당하지 않은 건 같다. 하나의 벤치마크로 이야기 하는 건 어렵다. 내부적으로 시물레이션해본 결과 GPT3.5(오픈AI가 2022년 11월 출시)의 75% 승률을 갖고 있다. GPT4처럼 모든 영역에서 많은 양의 데이터를 들이 부어 그 정도의 AI를 만들어 유지하는 건 쉽지 않다. 클로바X에서 원하는 건, 사용자가 어떤 요청을 하고 어떤 것은 실망을 하는지를 빠르게 파악을 해 그 부분에 대해 데이터를 집중적으로 투자를 하는, 원하는 시장에서 원하는 인공지능을 빠르게 공급하는게 우리 전략이다." -이전 버전을 내놓았을때는 파라미터 수를 공개했는데, 이번에는 공개 하지 않은 이유는? 또 국내 스타트업들이 오픈AI와 MS보다 네이버 AI를 써야 하는 이유는? ▲최수연: 하이퍼클로바는, 연구개발 목적이 더 컸기 때문에 파라미터 수 등 여러 부분을 공유하고 공개했다. 하지만 하이퍼클로바X는 파라미터라든지 학습 데이터셋 규모를 공개하지 않은 것으로 정했다. 우리 언어모델의 핵심이고, 오픈AI나 구글도 마찬가지 입장인 것을 감안했다. 챗GPT4도 추측만 있을 뿐 공개(파라미터 수)하지 않은 걸로 알고 있다. 이번에 새로운 생성AI를 공개한 건 우리 내부 서비스도 있지만, 이를 활용하는 기업들의 생태계를 어떻게 만들고 우리가 어떤 기여를 할 것인지가 중요한 전략이라 생각한다. 우리 초거대AI가 왜 좋냐면, 네이버에서 활동하시는 이용자들의 데이터들, 그리고 거기서 생상돼 축적한 데이터들을 네이버가 어덯게 이해하고 있는지를 가장 궁금해 한다. 우리 하이퍼클로바X는 이것을 학습한 거고, 이것을 이용할 수 있는 걸 우리가 기술적으로 열어준거라서 이 부분에 차별점이 있다. 내부 문서와 리서치 자료 등 기업 내부 정보들을 외국 클라우드에 올린다는 건 기업 입장에서 보안 이슈가 있다. 우리는 '뉴로 클라우드'라고 해서 기업 정보가 외부로 나가지 않게 하는 서비스를 제공한다. 즉, 기업의 내부망을 나가지 않고도 하이퍼클로바를 이용할 수 있는 상품을 준비했다. 이런 로컬라이즈와 보안의 강력성, 그리고 커스터마이징까지 이런 부분이 우리의 큰 강점이다." ▲성낙호: 국내 스타트업들이 오픈AI 대신 우리와 하면 좋은 점은 한국 위주로 데이터를 학습했기 때문이다. 우리가 전략적으로 한국에 포커스를 뒀기 때문에 한국 시장을 타깃으로 하는 B2B와 B2C 기업들은 당연히 우리를 선택할 수 밖에 없다고 생각한다. 나아가 기술 지원도 우리가 더 잘해준다. 우리는 특이하게 연구개발도 하고 제품도 만들고 사업도 한다. 이렇게 풀 버티컬로 하는 AI기업은 전세계에 없다. 우리 밖에 없다. 오픈AI도 아니고 MS도 아니고 구글도 이렇게 안한다. 대부분 연구는 연구를 하고 개발은 개발을 하는데 우리는 연구와 개발을 동시에 하는 유일한 기업이다." -11월부터 통합검색을 한다고 했는데, 네이버 검색이 전면적으로 바뀌는 건가 ▲김용범: 네이버 검색이 전면적으로 큐:(CUE:)로 배치되는 건 아니다. 기존 검색이 수행하지 못한 기능을 추가했다. 큐도 계속해 학습하며 더 똑똑해진다. 일단 9월에 스탠드얼론형으로, 11월에 통합 적용하며 새로운 생성AI 기술을 적용해 기존의 검색 경험을 확장한다." -하이퍼클로바X 학습소스가 구체적으로 무엇인지 아직 불명확한 것 같다. 이에 대한 대가를 어떻게 지불할 지 말해달라. ▲최수연: 이 부분은 여러 논의가 계속 되고 있고, 규제 동향이라든가 논의가 어떻게 흘러가는지 굉장히 관심있게 보는 부분이다. 지금까지 우리가 학습한 데이터들은 기존의 규제라든지 우리 약관에 근거를 두고 학습한 거라 별도 사용료를 논의하고 있는 단계는 아니다. 한가지, 50년치 뉴스를 학습했다는 부분은 죄송스럽게도 사실이 아니다. 예전에 하이퍼 클로바를 출시했을때 그 학습한 데이터의 규모를 알기쉽게 전달해드리는 과정에서 생긴 오해다. 뉴스 검색이, 1년에 검색되는 뉴스 분량의 50배라는게 50년치로 잘 못 알려졌다. 블로그도 마찬가지다." -하이퍼클로바 해외 진출은? 또 삼성전자와 AI반도체 협력은 어떻게 돼가고 있나? ▲최수연: 지금 긴밀히 협력을 논의하고 있는 글로벌 파트너들이 있는데 지금 이 단계에서 공개하기는 일러서 말하기 어렵다. 아까 말한 것 처럼 글로벌 모델에 비해 우리 강점은 그 나라에 특화한 데이터를 집중적으로 학습하면 그 나라에 더 강점이 있는 모델을 만들 수 있지 않을까 한다. 이런 기술력이 우리가 있다고 생각한다. 삼성전자와 AI반도체 협력은, 우리가 만든 경량화 알고리즘 같은 게 성공적을 작동하는지, 이런 부분에서 테스트를 하고 있다. 좋은 결과가 있는 것으로 알고 있다. 아직 사업화나 상용화를 논의하기는 두 회사 모두 이르다. 하지만 이게 당면 과제라 연구개발을 계속할 계획이다." -클로바 X기반 목표나 성과 수치가 있나? ▲최수연: B2B는 유료화 계획은 있지만 매출 계획까지는 안 잡았다. 내부 목표 숫자는 있다. 투자 할때 이걸 고려한다. B2B를 구매하려면 B2C에서 가능성을 봐야 하니, 올해부터 의미있는 사업 성과가 있으리라 기대하고 있다. -제휴 언론사와 이용료 등은 어떻게? ▲최수연: 글로벌기업보다 먼저 콘텐츠 수익 돌려주는 거 고민해왔다. 데이터 학습은 우리 약관에 근거한 거다. 창구들이 이미 많이 열렸는데 동의 받을 건 받고, 안되는 건 활용하지 않는 걸로 방향 을 잡을 거다. 기술회사나 콘텐츠 회사가 윈윈하는 방향으로 논의가 자리잡으면 좋겠다." -내수형이라는 비판은 어떻게 생각하나. 플랫폼 규제는 어떤 입장? ▲최수연: 한국에 있는 많은 스타트업의 타깃 시장은 한국시장이기 때문에 그분들 니즈를 맞추는 차원에서 한국을 많이 말한 거다. 글로벌 니즈에 대한 것도 충분히 대응하기 위한 하겠다. 우리와 경쟁하는 곳은 글로벌 회사이니 사전 규제보다는 자율규제로 틀을 잡아줬으면 좋겠다. 자사 우대와 끼워팔기는 누구보다 엄격히 하겠다. ▲성낙호: AI는 전기랑은 다르다. 데이터가 들어간 만큼 나오기 때문이다. 세계에서 경제 등 우리나라 규모가 작다. 사명감을 갖고 처음부터 공개한 거다. '스튜디오'도 이미 발표가 된 거다. 내수용 비판보다는 다른 시각으로 봐달라. -글로벌에서 봤을때 네이버 기술 수준은 어느정도라고 보나? ▲김용범: 검색 입장에서는 충분히 경쟁력이 있다. 검색도 있고 우리 에코시스템에 다양한 서비스들이 존재한다. 이들이 생성AI기술을 서비스하는데 가장 큰 재료라고 생각한다. 할루네이션을 해결 하는 한 방법도 검색이다. 우리는 검색이 있고, 다양한 서비스가 있어 이를 해결할 수 있다. 서비스 완성도 측면에서는 내가 기존에 다녔던 아마존이나 MS와 충분히 경쟁력이 있다고 본다. 특히 검색에 특화한 생성형AI 기술, 생성을 잘하기 위해서는 가장 중요한 건 이해인데, 이해를 하지 못한 건 생성할 수 없다. 우리는 이해를 잘 할 수 있게 많은 자료를 20년간 축적했고, 그 이해를 바탕으로 독자적인 리즈닝(이해) 기술을 확보했다. 이런 면에서 충분히 경쟁력이 있다. ▲최수현: 검색 기술과 검색광고 상거래와 관련된 여러 기술과 추천기술들을 모두 내재화했는데, 이런 건 세계에서 손꼽는다. (글로벌 기업과 경쟁하기에) 두려운 마음도 있다. 포시마크 등 인수한 외국 기업도 기대만큼 잘하고 있다. -비용과 관련이 있는 반도체 경량화는 어떻게 되가고 있나? ▲최수현:경량화 연구팀을 만들어 계속 보고 있다. 반도체는 학습영역보다 추론 영역에서. 어떤 식으로 개발했을때 성공적으로 압축할 수 있을 지를 보고 있다. 언제 출시해 언제 비용을 단축해줄지는 아직 판단 하긴 이르다." 성낙호: 비용이 문제이기 때문에 경량화 기술을 빠르게 적용해야 한다. 언어 모델을 탄탄히 하는 등 풀 버티컬 차원에서 비용 절감 계획을 갖고 있다. 추론 과정에서 놓치고 있던 것들을 계속 발라내고 있고, 방만하게 학습돼 있던 초거대모델을 탄탄히 하고 있다. 파라미터 크기가 동일하더라도 더 놓은 성능을 낼 수 있게 이것들의 효율성을 높이고 있다. -최 대표가 마무리 발언 해달라 ▲최수현: 오늘 질문들을 보니 정말 그동안 많이 기대해주셨다는 느낌이 든다. 감사하다. 앞으로 갈 길이 더 많다고 생각한다. 많은 부분 더 발전시키겠다. 우리가 어떻게 잘 해결해 나갈 지 관심 많이 가져주고 의견 달라. 오늘 와주셔셔 감사하다.