[기고] 제조 역량 강화에 AI 기반 딥러닝·통합 데이터는 필수
한국 산업통상자원부에 따르면 올해 10대 제조업이 계획 중인 주요 설비 투자 금액은 110조원에 달한다. 특히 국내 자동차 업계는 전기차 전용 공장 증설에 17조원을 투자할 계획인 것으로 나타났다. 이를 위해 현대자동차그룹은 국내 전기차 전용 공장 건설에 2030년까지 24조원을 투자하겠다고 발표했다. 전기차 생산을 지원하기 위한 새로운 시설과 기존 현장의 현대화는 효율성, 품질 및 노동력을 극대화하기 위한 툴링(tooling)과 프로세스를 재고할 수 있는 좋은 기회다. 최근 전기차 제조업체는 배터리 제조 공정에서 100개 이상의 단계, 차제 공장에서 52개의 장비, 주력 차량 설계에서 500개 이상의 부품을 제거했다는 보도가 있었다. 프로세스를 재고한 결과 승합차의 자재 비용을 35% 절감하고, 다른 차량에서도 비슷한 규모의 비용을 절감이 이뤄졌다. 공장을 개발하고 솔루션을 조달할 때 현장과 기업 차원에서 자원의 투입과 이에 대한 승인이 공유되는 현장 중심적인 방식이 있다. 그러나 유사한 워크플로에 대해 현장마다 서로 다른 솔루션을 사용할 가능성이 항상 존재한다. 데이터 품질이 필수적인 새로운 인공지능(AI) 기반 솔루션을 사용하는 경우를 포함해 전문 지식과 데이터가 현장 간에 공유되지 않을 위험도 있다. 이는 품질과 규정 준수를 위해 머신 비전 시스템을 사용하는 시각 검사 팀에게도 해당될 수 있다. 자동차 산업의 AI 머신 비전에 대한 지브라의 보고서에 따르면 독일과 영국의 머신 비전 리더 중 약 20%가 자사의 AI 머신 비전이 더 잘 작동하거나 많은 일을 할 수 있다고 응답했다. 이처럼 딥러닝 머신 비전과 같은 기술을 더 잘 배포하고 사용할 수 있는 방법이 있을까. 클라우드 보안·거버넌스에 대한 논의와 딥러닝 머신 비전을 통한 테스트, 품질 관리, 엔지니어와 데이터 과학자를 위한 새로운 컴퓨팅·협업 자원 등 고부가가치 워크플로우에 활용할 수 있는 기회의 균형을 맞출 수 있는 방법은 무엇인가. AI, 특히 딥러닝은 데이터에 기반을 둔다. 양질의 데이터의 양, 다양성과 속도는 딥러닝 모델 학습과 테스트의 핵심이다. 이를 통해 실제 배포 시 기대하는 결과를 얻을 수 있다. 보통 팀과 현장마다 경험과 가용할 수 있는 작업 시간이 다르다. 이로 인해 사일로(silo) 현상이 생겨 올바른 데이터 품질을 달성하기 더 어려워질 수 있다. 데이터는 저장·주석이 필요하며 모델 테스트에 필요한 다른 데이터셋과 사용돼야 한다. 이런 맥락에서 기업이 데이터 사일로 현상을 겪을 경우 개선된 머신 비전 모델 학습도 저해될 수 있다. 딥러닝 신경망은 다양한 시간대와 요일을 포함해 가능한 많은 변화에 노출돼야 한다. 데이터셋에 임의의 날짜를 혼합해야 하는데, 이는 훈련 데이터 시뮬레이션용 플랫폼을 사용하지 않는 한 일정 기간 동안 데이터를 캡처해야 하기 때문에 불편할 수 있다. 그럼에도 강력한 모델을 훈련하는 데 필수적이다. 또 산업 공정은 주변 조명의 변화, 미세한 변화가 있는 재료, 진동, 소음, 온도, 생산 조건의 변화 등 다양한 환경적 영향을 받는다. 학습 데이터에서 이런 변화를 고려하지 않는다면 모델 정확도가 떨어질 수 있다. 각 현장마다 선명도, 작업 거리, 주변 조명·모델이 처리하는 방법을 학습해야 하는 기타 요소에 차이가 있을 수 있으므로 학습 데이터셋은 실제 시나리오에서 모델이 직면할 수 있는 모든 변수를 반영해야 한다. 산업 공정이 여러 생산 현장을 포함하는 경우 그 중 한 곳에서만 데이터를 수집하거나 모든 데이터를 사일로화해 보관하는 것은 바람직하지 않다. 이를 해결하기 위해서는 다양한 환경 조건과 생산 현장에서 데이터를 수집하고 공유해야 한다. 사일로화 된 현장 접근 방식의 또 다른 문제는 딥러닝 모델에 대한 학습 데이터의 주석과 관련 있다. 부정확하고 불명확하며 일관성 없는 주석은 필연적으로 모델 성능 저하로 이어진다. 동일한 품목을 만드는 여러 생산 현장을 포함해 주석이 정확하고 모호하지 않도록 하는 것이 중요하다. 이를 위해서 팀이 주석 프로젝트에서 협업할 수 있어야 한다. 각 이미지마다 다른 결함 유형을 표시하면서 일부 결함은 전혀 표시하지 않는 것은 실제 프로젝트에서 흔히 발생하는 실수다. 또 무엇이 결함으로 간주되는지도 주관적일 수 있으므로 교차 검증이 필요하다. 모든 결함은 유형에 관계없이 모든 관련 이미지에 명확하게 표시돼야 한다. 통합된 접근 방식을 취하지 않고 클라우드를 활용하지 않는다면 현장과 국가 간에 데이터 주석을 추가하는 문제는 해결할 수 없다는 것이다. 제조 업계의 머신 비전 팀은 딥러닝 머신 비전을 활용할 수 있는 새로운 방법이 필요하며 클라우드 활용이 포함돼야 한다. 클라우드 기반 머신 비전 플랫폼을 사용한다면 팀은 여러 현장, 국가, 지역 등 다양한 제조 위치에서 데이터를 안전하게 업로드하고 라벨을 지정하고 주석을 달 수 있다. 여러 현장과 환경의 클라우드 기반 플랫폼에 더 크고 다양한 범위의 풀링된 데이터는 딥러닝 학습에 더 효과적이다. 이런 플랫폼에서는 지정된 사용자가 실시간으로 함께 작업하고 주석, 학습 및 테스트 프로젝트에서 협업하며 각자 전문 지식을 공유할 수 있다. 클라우드 기반 플랫폼을 사용하면 지정된 역할과 권한, 책임 있는 사용자가 클라우드에서 딥러닝 모델을 학습하고 테스트할 수 있다. 훨씬 더 나은 학습·테스트 데이터 기반으로 특정 사용 사례에 대해 기존 규칙 기반 머신 비전보다 훨씬 더 높은 수준의 시각적 검사 분석과 정확도를 제공할 수 있다. 특히 자동차, 전기 배터리, 반도체, 전자, 패키징 산업을 비롯한 여러 제조업체에서 이런 결과를 달성하는 것을 목표로 한다. 클라우드 기반 솔루션은 컴퓨팅 성능의 확장성과 접근성을 제공한다. 기존 시스템에서는 일부 지정된 직원들만 컴퓨터에 강력한 그래픽처리장치(GPU)를 장착해 대규모 교육을 수행했다. 그러나 클라우드를 사용하면 모든 사용자가 자신의 노트북에서 동일한 고성능 컴퓨팅을 사용할 수 있다. 약간의 비용이 발생하지만 종량제(pay-as-you-go) 구독 모델을 사용하면 회사 자체 서버와 구하기 어려운 추가 IT 인력에 비용을 투자하는 것보다 더 유리할 수 있다. 머신 비전 팀은 서비스형 소프트웨어(SaaS) 모델 구독을 통해 클라우드 기반 플랫폼에 유연하고 쉽게 투자할 수 있는 동시에 기술 파트너는 새로운 기능, 모델, 업데이트를 원활하게 추가할 수 있다. 딥러닝 클라우드 기반 플랫폼은 PC와 디바이스에 모델 엣지를 배포함으로써 생산 라인, 사용자, 팀 위치와 관계없이 유연한 디지털 워크플로우를 지원한다. 한국을 포함한 아태지역 제조업 리더들은 AI가 성장을 주도할 것으로 기대하고 있다. 이러한 AI 도입의 급증은 디지털 혁신을 우선시하는 리더들과 데이터 관리를 개선하고 제조 프로세스 전반의 가시성과 품질을 향상시키는 새로운 기술을 활용하려는 제조업체의 의도를 잘 보여준다. 오늘날 가장 중요한 품질 관리 이슈 중 하나는 데이터 통합이다. AI·데이터 목표와 새로운 자동차 공장을 계획하고 있는 지금이야말로 데이터를 활용하고 딥러닝 머신 비전의 이점을 확장하는 클라우드의 잠재력을 살펴볼 적기다.