D램 메모리 안에서 연산까지...KAIST, '메모리+AI반도체' 개발
연산과 저장 기능이 분리되지 않은 뇌처럼 D램 메모리 안에 연산 기능을 함께 구현한 PIM 반도체가 개발됐다. 챗GPT와 같은 거대 인공지능 모델을 낮은 전력으로 가동할 수 있다. 과학기술정보통신부는 KAIST 전기및전자공학부 유회준 교수 연구팀이 D램 메모리 셀 내부에 직접 연산기를 집적해 인공지능(AI) 연산을 수행하는 PIM 반도체 '다이나플라지아'를 개발했다고 14일 밝혔다. PIM(Processor In Memory)은 칩 안에 메모리와 프로세서 연산기를 한데 모은 차세대 반도체다. 현재 쓰이는 폰노이만 컴퓨팅 구조는 메모리와 연산기(CPU)를 분리해 두고 명령어와 데이터를 필요에 따라 주고받는 방식이라 처리 용량이 커질수록 데이터 병목과 전력 소모 문제가 커진다. PIM은 메모리와 연산 장치가 함께 있어 이같은 문제를 해결할 수 있다. 기존 PIM은 연산기가 메모리 셀 어레이 안이 아니라 외부에 가까이 있는 형태다. 거리가 가까워져 데이터 병목과 전력 손실을 상대적으로 줄일 수 있지만, 완전히 메모리 안에 포함된 것은 아니다. 또는 셀 하나에 트랜지스터가 8개 이상 필요한 S램 PIM 방식이라 집적도를 높이기 어렵다. 이번에 개발한 다이나플라지아는 3개의 트랜지스터만으로 셀을 구성했다. 셀 내부에 연산기를 집적하고, 에너지 효율이 높은 아날로 연산 방식을 이용해 집적도와 연산 기능을 모두 높였다. 전류 누설을 막아 모든 메모리 셀들이 병렬로 동작할 수 있게 함으로써 데이터 처리량을 기존 PIM에 비해 15배 향상시켰다. 또 이 PIM 반도체는 하나의 셀이 메모리와 연산기, 아놀로그-디지털 데이터 변환기의 기능을 모두 지원하는 '트리플-모드 셀'을 구현했다. 실제 AI 연산 상황에 맞춰 메모리가 많이 필요하면 메모리로 동작하는 셀의 비중을 높이고, 연산 능력이 많이 필요하면 연산기로 동작하는 셀의 비중을 높이는 식이다. 메모리와 연산기, 변환기의 하드웨어 구조가 고정되어 있어 상황에 맞춰 대응하지 못 하고 자원 낭비가 발생하는 기존 PIM 반도체의 문제를 해결했다. 이같은 동적 코어 형성 아키텍처로 기존 아날로그형 PIM 반도체보다 효율이 2.5배 올렸다. 이번 연구는 과기정통부 'PIM인공지능반도체핵심기술개발(설계)' 사업을 통해 설립된 'PIM반도체 설계연구센터(PIM-HUB)'에서 진행됐다. 지난달 미국 샌프란시스코에서 열린 국제고체회로설계학회(ISSCC)에서 발표됐다. 유회준 교수는 “이번 연구는 기존 인공지능 반도체의 메모리 병목현상을 해소할 뿐만 아니라, 높은 처리량과 가변성을 갖는 고메모리 용량의 D램 PIM을 개발했다는 점에서 의미가 크다"며 "본격적인 상용화에 성공할 경우, 최근 더욱 거대해지고 다양해지는 인공지능 모델에서도 높은 성능을 보일 수 있을 것"이라고 말했다. 과기정통부 전영수 정보통신산업정책관은 "PIM 반도체 기술은 메모리 반도체 기술에 강점을 보유한 우리나라가 앞서나갈 수 있는 잠재력이 높은 분야"라면서 "글로벌 최고 수준의 초고속·저전력 인공지능 반도체를 개발할 수 있도록 하드웨어 뿐 아니라 국산 인공지능 반도체를 데이터센터에 적용하기 위해 필요한 소프트웨어 및 클라우드 관련 기술 개발까지 지원을 아끼지 않겠다"고 밝혔다.