국내서 개발한 다크웹 전용 AI 언어모델 해외 주목
S2W(에스투더블유, 대표 서상덕)는 한국과학기술원(카이스트, KAIST) 연구진과 공동 개발한 다크웹 전용 인공지능(AI) 언어모델 '다크버트'(DarkBERT)가 해외에서 주목받고 있다고 12일 밝혔다. 다크버트는 논문 발표 및 채택 이후, 트위터에서 180만건 이상 조회되고 유투브에서 소개 콘텐츠가 100건 이상 만들어졌다. 다크버트는 다크웹 상의 데이터로 학습한 다크웹 전용 AI 언어모델이다. 마약, 정보 유출, 랜섬웨어, 해킹 등 범죄 온상이 된 익명 기반 네트워크로 각종 불법 거래와 유해 콘텐츠가 유통되지만, 정보의 휘발성과 탈중앙화, 익명화 기술로 보호돼 범죄자 추적이나 출처 파악, 데이터 확보 등이 어렵다. 다크버트를 활용하면 범죄와 관련된 다크웹 콘텐츠를 요약하거나 다크웹 내 공격자들이 자주 사용하는 신종 툴을 빠르고 정확하게 확인할 수 있다. S2W는 지난 6월 글로벌 자연어처리(NLP) 학술대회 전산언어학회(ACL)에서 '다크버트: 인터넷의 어두운 단면을 위한 언어 모델(DarkBERT: A Language Model for the Dark Side of the Internet)'이라는 주제로 논문을 발표했다. 논문 발표 이후 미국에서는 주요 테크미디어와 사이버 보안 매체에서 다크버트를 다뤘다. 또한, AI 권위자 랜스 엘리엇 박사, 구글 클라우드 필 베네이블스 CISO 등이 언급하며 다크버트에 대한 관심이 커졌다. 현재 다크버트에 대한 트위터 누적 조회수는 180만 건이 넘었으며, S2W 홈페이지를 통해서는 30개 국에서 50건 이상 다크버트 데모 요청과 문의가 쇄도했다. 현재 다크버트는 일반 대중에게 공개되지는 않고 연구 및 개발 목적으로 사용을 요청하는 곳에 한해 선별해서 접근할 수 있도록 허용하고 있다. S2W는 2018년에 한국 카이스트 네트워크 보안 전문 연구진이 주축으로 설립된 다크웹, 암호화폐 자체 분석 기술을 보유한 데이터 인텔리젼스 기업이다. 인터폴(INTERPOL)의 공식 파트너사호 사이버 위협 인텔리젼스(CTI) 분야에서는 다크웹 위협 탐지, 랜섬웨어 및 APT 공격 그룹 방어, 피싱/스미싱 등 외부 위협에 선제적으로 대응하는 보안 솔루션을 제공한다. S2W의 기술 관련 논문은 글로벌 자연어처리 학술대회에서 2년 연속 논문이 채택되었으며 작년 북미전산언어학회(NAACL)에 이어 올해 5월 ACL에서 다시 한번 S2W의 기술력을 인정 받은 바 있다.