• ZDNet USA
  • ZDNet China
  • ZDNet Japan
  • English
  • 지디넷 웨비나
뉴스
  • 최신뉴스
  • 방송/통신
  • 컴퓨팅
  • 홈&모바일
  • 인터넷
  • 반도체/디스플레이
  • 카테크
  • 헬스케어
  • 게임
  • 중기&스타트업
  • 유통
  • 금융
  • 과학
  • 디지털경제
  • 취업/HR/교육
  • 생활/문화
  • 인사•부음
  • 글로벌뉴스
스테이블코인
배터리
AI의 눈
IT'sight
칼럼•연재
포토•영상

ZDNet 검색 페이지

'시스템 장애'통합검색 결과 입니다. (7건)

  • 태그
    • 제목
    • 제목 + 내용
    • 작성자
    • 태그
  • 기간
    • 3개월
    • 1년
    • 1년 이전

국정자원 복구는 두 달, 민간은 몇 시간…왜 차이 날까

지난 9월 26일 발생한 국가정보자원관리원(국정자원) 대전센터 화재는 단순한 사고를 넘어 정부 디지털 인프라의 구조적 취약성을 드러낸 사건으로 평가된다. 주요 핵심 서비스가 멈춰 서면서 행정 전반이 장기간 혼란에 빠졌고 화재 발생 두 달이 돼가는 현재까지 최종 복구 작업이 이어지고 있다. 업계에서는 이번 사태를 계기로 공공 정보시스템의 복원력 강화와 재난 대응 체계 전면 재설계가 필요하다는 지적이 커지고 있다. 22일 행정안전부에 따르면 국정자원 대전센터 정보시스템 709개 중 697개 시스템이 복구돼 총복구율은 98.3%로 나타났다. 정부는 대구센터 민관협력형 클라우드(PPP) 이전 대상 시스템 복구에 박차를 가하고 있다. 이번 사태가 던진 질문은 "왜 정부 디지털서비스는 멈추면 다시 돌아오는 데 몇 주·몇 달이 걸리는가"라는 점이다. 같은 기간 글로벌 클라우드 사업자 아마존웹서비스(AWS), 마이크로소프트(MS), 클라우드플레어 등도 잇따라 장애를 겪었지만 대부분 수 시간 내 복구를 완료했다. AWS 미국 동부 리전에서 발생한 도메인 시스템 장애는 약 15시간 만에 정상화됐고 MS 애저 클라우드의 전역 네트워크 장애 역시 수 시간 내 복구됐다. 클라우드플레어는 내부 데이터베이스(DB) 권한 변경 과정에서 발생한 오류로 전 세계 네트워크 서비스가 피해를 입었지만 약 3시간 만에 문제를 해결했다. 글로벌 사업자들 역시 장애 자체는 피하지 못했지만 복구 속도는 국정자원과 비교하기 어려울 만큼 빨랐다. 속도 차이는 기술 인프라와 운영 체계의 구조적 차이에서 비롯된다. 민간 클라우드 기업들은 장애 발생 즉시 자동화된 재해복구(DR) 체계가 작동하도록 설계돼 있고 리전·가용영역(AZ)을 다중화해 단일 장애 지점(SPOF)을 최소화했다. 반면 국정자원은 물리적으로 세 곳의 센터를 운영해 왔지만, 전력·네트워크·장비 구성 요소가 한 센터 내부에 집중돼 있어 대전센터 화재처럼 물리적 재난이 발생했을 때 대체 시스템으로의 전환이 원활히 작동하지 않았다. 운영 구조도 여전히 전통적 방식에 머물러 있다. 서버·스토리지·네트워크 등 장비 제조사 다양화를 위한 정책은 운영 복잡성을 높였고 구성의 표준화가 부족해 신속한 대응이 어려운 환경이다. 특히 각 부처의 정책·사업·보안 규정이 분절돼 있어 새로운 기술을 도입하고 운영 방식을 개선하는 데도 한계가 있다. 전문가들은 정부 디지털 인프라가 '중앙집중형=안전'이라는 오래된 인식에서 벗어나야 한다고 지적한다. 민간 클라우드는 지리적으로 분산된 여러 리전 기반 위에서 운영되기 때문에 특정 데이터센터에서 문제가 발생해도 서비스 전체가 중단되지 않는 구조를 갖췄다. 국정자원은 특정 센터에 문제가 생기면 주요 행정서비스가 한꺼번에 멈추는 위험을 드러냈다. 정부는 센터 간 이중화 시범 사업을 신속히 완료하고 DR 전용 공주 백업센터를 운영한다는 방침이다. 미국은 이미 민간 클라우드 기반의 공공 전용 존을 확대하며 멀티클라우드 전략을 기반으로 공공 인프라를 운영 중이다. 연방조달청(GSA)이 AWS·구글·MS·오라클 등과 대규모 계약을 체결해 클라우드 자원을 정책적으로 통합 조달하고 페드램프 인증으로 보안 기준을 표준화한 것이 대표적 사례다. 한국 공공 클라우드 환경과의 구조적 차이가 나타나는 지점이다. 국내에서도 민간 클라우드 활용 확대 움직임은 이미 시작됐다. 국정자원 대구센터에 PPP 모델이 구축되며 삼성SDS·KT클라우드·NHN클라우드 등 민간 클라우드 서비스 기업(CSP)들이 국가 중요 시스템 대상 서비스를 개시한 상태다. 하지만 실제 공공 전반을 놓고 보면 클라우드 전환 속도는 여전히 더딘 수준이다. 예산·보안 규제·조달 절차 등 제도적 장벽 역시 장애 요인으로 지적되고 있다. 이번 사태 이후 업계에서는 국정자원을 민간 클라우드 수준의 가용성과 복원력을 갖춘 '정부형 CSP'로 전환해야 한다는 목소리가 커지고 있다. 다중 리전 기반 멀티클라우드 전략을 도입해 단일 장애 지점을 제거하고 자동화 기반 DR 시스템을 갖춘 구조로 재편해야 한다는 데 의견이 모아진다. 장애는 어떤 인프라에서도 발생할 수 있다. 문제는 복구 속도와 그 과정에서 국가 기능이 어디까지 유지될 수 있는가다. 공공의 디지털 복원력을 민간 수준으로 끌어올리지 못한다면 정부 디지털서비스는 앞으로도 위기 때마다 장기간 멈춰 설 수밖에 없다는 경고가 나온다. 클라우드 업계 관계자는 "전 세계 어디에서도 장애는 피할 수 없지만 복구를 몇 시간 내 끝낼 수 있는 구조를 갖추는 것이 공공의 필수 과제"라며 "국정자원도 단일 센터 중심 구조에서 벗어나 멀티클라우드 기반 복원력 체계로 전환해야 한다"고 강조했다.

2025.11.22 10:33한정호 기자

MS 애저 클라우드·365 서비스 전 세계 장애…현재 복구 중

마이크로소프트(MS)의 클라우드 플랫폼 '애저'와 사무용 서비스 'MS 365'에서 전 세계적으로 장애가 발생해 이용자들이 큰 불편을 겪었다. 일부 항공사와 통신사, 주요 기업 웹사이트까지 영향을 받으며 지난 아마존웹서비스(AWS) 클라우드 장애에 이어 글로벌 디지털 인프라의 취약성이 다시 한 번 드러났다는 평가다. 미국 온라인서비스 추적사이트 다운디텍터에 따르면 29일 오후 1시 36분(미국 동부시간, 한국시간 30일 오전 2시 36분) 기준 애저 서비스 장애는 3천96건, 365 서비스 장애는 3천448건으로 집계됐다. 서비스 장애는 이날 오전 11시부터 두드러지기 시작해 정오를 정점으로 점차 완화됐다. 이번 장애로 애저 클라우드를 이용하는 알래스카항공과 하와이안항공은 웹사이트 및 온라인 체크인 시스템이 중단됐다. 영국 히스로 공항과 보다폰도 주요 시스템에 접근 문제가 발생했다. 스타벅스·코스트코·크로거 등 다수의 글로벌 기업 웹사이트와 애플리케이션, 엑스박스와 마인크래프트 등 MS의 자사 서비스도 일시적으로 접속 불가 상태를 겪었다. 특히 일부 산업에서는 항공 예약과 통신, 결제 시스템까지 영향을 받아 전 세계적으로 혼란이 이어졌다. MS는 자사 상태 페이지를 통해 "의도치 않은 구성 변경이 문제의 원인으로 의심된다"며 "애저 프론트 도어(AFD) 서비스의 모든 변경을 차단하고 마지막으로 정상 작동했던 상태로 복구 중"이라고 설명했다. 애저 프론트 도어는 클라우드 트래픽을 관리하는 글로벌 콘텐츠·애플리케이션 전달망(CDN)으로, 이번 장애는 해당 시스템의 설정 변경에서 비롯된 것으로 추정된다. 이번 사태는 불과 일주일 전 AWS에서 대규모 접속 장애가 발생한 데 이어 벌어진 것으로, 글로벌 IT 인프라의 안정성에 대한 우려가 다시 제기되고 있다. 업계와 주요 외신에서는 인공지능(AI)과 클라우드 시대일수록 단일 사업자 장애가 산업 전반으로 확산되는 도미노 리스크가 커지고 있다고 지적했다. MS는 "애저는 장애 영향을 받은 지역 전반에서 서비스가 회복되고 있다"며 "완전한 복구 절차를 진행 중"이라고 밝혔다.

2025.10.30 09:38한정호 기자

공공데이터포털 서비스 재개…정부 정보시스템 64.3% 복구

공공데이터포털 등 정부 정보시스템이 속속 복구되며 국가정보자원관리원(국정자원) 대전본원 화재 피해를 입은 전산망이 조금씩 정상화되고 있다. 행정안전부는 23일 오전 10시부터 그간 중단됐던 공공데이터포털 서비스를 재개했다. 공공데이터포털은 공공기관이 보유·관리하는 공공데이터를 국민이 무료로 이용할 수 있는 1등급 핵심 시스템이다. 현재 API 서비스, 파일 다운로드, 데이터 제공 신청, 분쟁조정 신청, 기업 공공데이터 문제해결 신청 등 주요 기능이 정상화됐다. 다만 일부 파일데이터는 추가 복구 중이며 공공기관의 데이터 신규 등록 등 관리자 기능은 이달 말까지 복구될 예정이다. 행안부에 따르면 이날 오후 1시 기준 전체 709개 장애 시스템 중 456개 시스템이 복구돼 전체 복구율은 64.3%로 집계됐다. 등급별로는 ▲1등급 40개 중 33개(82.5%) ▲2등급 68개 중 49개(72.1%) ▲3등급은 261개 중 178개(68.2%) ▲4등급 340개 중 196개(57.6%)로 나타났다. 복구된 주요 시스템에는 정부24·모바일 신분증·주민등록시스템·나라장터·우체국금융 등 국민 생활과 직결된 서비스가 포함됐다. 행안부는 안정성 검증을 병행한 단계적 복구를 진행한다는 방침이다. 복구 완료 시스템은 즉시 모니터링 체계에 편입돼 장애 재발 방지 및 데이터 손상 여부가 점검된다. 행안부는 "콜센터를 통한 불편 신고·처리와 지속적인 모니터링을 통해 일부 불편 사항을 최소화할 계획"이라고 밝혔다.

2025.10.23 15:01한정호 기자

정부, 전산센터 화재 피해 복구 속도…시스템 36.7% 정상화

정부가 국가정보자원관리원(국정자원) 대전본원 화재로 중단된 주요 정보시스템을 복구하며 중요 서비스 조기 정상화에 박차를 가한다. 행정안전부는 13일 윤호중 장관 주재로 중앙재난안전대책본부(중대본) 제11차 회의를 개최해 시스템 장애 복구 현황·방안과 정보시스템 장애 관련 민원 처리 실태를 점검했다. 중대본은 대국민 주요 서비스, 업무 등급 등 우선순위에 따라 서비스를 최단기간에 재개할 수 있는 복구 방식을 마련해 추진 중이다. 우선 화재와 분진 피해가 심각한 7-1 전산실 등의 시스템은 데이터 복구 후 대전센터 또는 대구센터에 신규 장비를 도입해 복구할 예정이다. 화재·분진 영향이 적은 전산실은 중요도에 따라 신속히 시스템을 복구하되, 7-1 전산실 등과 관련된 시스템은 백업 또는 구 시스템을 활용하는 등 시스템별 여건에 맞는 조속한 복구 방안을 수립·추진할 계획이다. 이와 관련해 국정자원에서는 기존 700여 명의 복구 인력에 더해 제조사 복구 인원도 추가로 투입하는 중이다. 이를 통해 이날 6시 기준 1등급 30개 시스템(75%), 2등급 35개 시스템(51.5%) 등 총 260개 시스템(36.7%)이 복구됐다. 현재 1등급 시스템인 우편정보 ePOST 쇼핑, 차세대종합쇼핑몰을 복구함에 따라 국민과 공공기관이 온라인으로 편리하게 소상공인·중소기업 물품을 검색·구매할 수 있게 됐다. 아울러 사회서비스 전자바우처 시스템 복구로 전자바우처 결제, 지방자치단체의 예탁금 납부, 이용자의 본인부담금 납부 등의 서비스도 재개됐다. 중대본은 정보시스템 장애로 인한 불편 민원의 처리 상황도 점검했다. 장애 관련 콜센터 상담 건수는 화재 다음날인 지난달 30일에는 2천700여 건이 접수됐으나, 지속적으로 감소해 현재 일일 300건 내외가 접수되고 있다. 주요 상담 내용은 시스템 장애로 인한 생활 불편, 대체 시스템 등 민원 신청 방법, 기한 연장 등이다. 각 기관은 대체 시스템과 서비스를 마련해 국민과 현장 애로사항 해소에 나서고 있다. 윤호중 행안부 장관은 "정부는 시스템별 상황에 맞는 세부 복구 방안을 수립·추진해 중요 서비스부터 신속히 정상화하는 데 집중하고 있다"며 "연일 밤낮으로 복구에 매달리고 있는 정부·공공기관과 민간업체 직원들이 신체적·정신적 위험에 노출되지 않도록 세심하게 근무 환경을 챙기겠다"고 밝혔다.

2025.10.13 10:22한정호 기자

행안부 "국정자원 화재 원인 감식 필요…복구는 안전 점검 뒤 단계적 착수"

정부 주요 시스템을 담은 대전 국가정보자원관리원 전산실에서 화재가 발생해 전산망 일부가 중단됐다. 국민 다수가 이용하는 온라인 행정 서비스와 금융 업무에 차질이 우려되자 행정안전부는 중앙재난안전대책본부를 꾸리고 긴급 대응에 나섰다. 행정안전부는 27일 정부서울청사에서 긴급 브리핑을 열고 화재 경위와 복구 계획을 설명했다. 이 자리에는 이재용 국가정보자원관리원장과 행안부 김민재 차관, 이용석 디지털정부혁신실장, 소방청 관계자가 참석했다. 행안부에 따르면 이번 화재는 전산실 전력 공급 장치인 무정전전원장치(UPS) 배터리에서 발생한 것으로 추정된다. 화재는 진압됐지만 내부 열기가 빠지지 않아 복구 작업에는 착수하지 못했다. 이를 두고 정부가 강조해 온 3시간 이내 시스템 복구를 수행하지 못했다는 비판이 나온다. 이재용 국가정보자원관리원장은 "3시간 이내 복구는 일반 장애 시 목표 수준"이라며 "이번처럼 화재가 원인일 경우 열기 제거와 소방 안전 점검 뒤 서버 상태를 확인해야 복구 가능 여부를 알 수 있다"고 설명했다. 이번 화재로 직접 피해를 입은 시스템은 약 70개지만 항온항습 장치가 작동하지 않아 과열이 우려되면서 대전 본원 전체 647개 시스템의 전원이 차단됐다. 행안부 김민재 차관은 "연기와 열기가 빠지고 항온항습 장치가 정상 가동되면 장애 시스템 수는 크게 줄어들 것"이라고 밝혔다. 국가정보자원관리원은 현재 대전·광주·대구 3개 센터에서 약 1천600개 정부 시스템을 운영하고 있다. 행안부는 이번 사고로 정보시스템 장애가 사회재난에 포함된 이후 처음으로 중앙재난안전대책본부를 가동했다. 지난해 11월 대규모 전산망 장애를 계기로 관련 규정이 마련된 바 있다. 한편 행안부는 2023년 전산망 장애 이후 재해복구 체계를 '액티브-스탠바이'에서 '액티브-액티브(실시간)' 방식으로 고도화하는 방안을 추진해왔으며 올해 시범사업을 진행 중이다. 그러나 일부 시스템은 여전히 스토리지 백업 등 제한적 이중화에 머물러 있어 이번 화재에서도 복구 한계가 드러났다는 지적이 나온다. 행안부는 국민 불편 최소화를 위해 우체국 금융과 우편, 정부24 등 핵심 서비스부터 단계적으로 복구할 방침이다. 이용석 디지털정부혁신실장은 "국민이 많이 이용하는 주요 서비스가 우선 복구 대상"이라며 "네이버 협력 대체 사이트 등으로도 일부 서비스가 안내되고 있다"고 설명했다.

2025.09.27 13:32한정호 기자

과기정통부, 국정자원 화재에 위기경보 '경계' 발령…24시간 비상 대응

국가정보자원관리원 대전 본원에서 발생한 화재 여파로 정부 행정시스템 운영에 차질이 빚어지자 과학기술정보통신부가 위기경보를 '경계' 단계로 격상하고 비상 대응에 나섰다. 과학기술정보통신부는 주요 소관 행정시스템 장애에 신속히 대응하기 위해 긴급 상황판단회의를 개최하고 '위기상황대응본부'를 즉시 소집해 24시간 비상근무체제에 돌입했다고 27일 밝혔다. 현재 과기정통부와 소속기관 홈페이지, 내부 행정시스템, 인터넷 우체국 등 다수 시스템에 장애가 발생한 상태다. 앞서 지난 26일 오후 국가정보자원관리원에서 무정전전원장치(UPS) 배터리 화재가 발생하면서 관리원 대전 본원에서 운영 중이던 647개 행정업무시스템이 가동을 멈췄다. 정부는 항온항습기 복구를 우선 진행한 뒤 서버 재가동을 통한 복구 절차에 착수할 계획이다. 특히 국민 생활과 직결되는 우체국 금융·우편 서비스 등 핵심 서비스부터 신속히 정상화한다는 방침이다. 과기정통부는 "행정안전부와 협의해 국민 피해가 없도록 만전을 기하고 있다"고 밝혔다.

2025.09.27 11:44한정호 기자

"정부 서비스 국민 불편 최소화"…과기정통부, 행정정보시스템 재난 대응 체계 마련

과학기술정보통신부가 디지털 정부 서비스의 국민 불편을 최소화하기 위해 행정정보시스템 재난 대응 체계를 구축한다. 과기정통부는 행정정보시스템 재난 시 신속하고 체계적으로 대응할 수 있는 위기관리 체계와 각 부서의 역할을 규정한 '행정정보시스템 재난 위기 대응 실무매뉴얼'을 마련했다고 21일 밝혔다. 이번 매뉴얼은 지난 2023년 11월에 발생한 행정전산망 장애를 계기로 1등급 정보시스템 장애를 사회재난으로 포함하는 재난안전법 시행령 개정안이 지난해 7월 17일부터 시행됨에 따라 재난 법령에 따른 제도적 대응체계 수립의 필요성에 따라 마련됐다. 과기정통부는 행정안전부가 수립한 '행정정보시스템 위기관리 표준매뉴얼'을 바탕으로 1등급 정보시스템 장애 발생 시 신속한 복구와 피해 최소화를 목표로 하는 실무매뉴얼을 구성했다. 해당 매뉴얼을 통해 관계기관 간의 협력 체계를 강화하고 재난 대응의 효율성을 높여나갈 계획이다. 과기정통부는 재난방송 온라인시스템·우체국 차세대 종합 금융시스템 등 총 6개의 1등급 정보시스템을 관리하고 있다. 그동안 각 시스템의 운영 부서·기관이 개별적으로 장애에 대응했으나 앞으로는 과기정통부가 총괄해 대응할 예정이다. 관련 기관 간 유기적인 정보 공유와 협력으로 위기관리 체계를 일원화해 보다 체계적으로 대응한다는 목적이다. 특히 정보시스템의 위기 징후가 감지되거나 위기 상황 변화에 따라 위기 경보수준 변경이 필요한 경우에 자체적으로 상황판단 회의를 개최해 위기 수준에 따라 위기관리 기구를 구성해 운영할 계획이다. 또 올 하반기 중 위기 단계별 시나리오에 따라 모의훈련을 실시해 사전에 장애 발생 대응 능력을 축적할 예정이다. 과기정통부 구혁채 기획조정실장은 "이번 재난 대응 매뉴얼은 디지털 정부 서비스의 안정적 제공과 국민 불편을 최소화하는 중요한 안전장치"라며 "행정정보시스템의 중요성이 더욱 커지고 있는 만큼 위기 대응 역량을 강화하고 관계기관 간 협력을 통해 어떤 상황에서도 신속하게 대응할 수 있는 시스템을 지속적으로 발전시켜 나가겠다"고 밝혔다.

2025.04.21 16:16한정호 기자

  Prev 1 Next  

지금 뜨는 기사

이시각 헤드라인

中, 엔비디아 H200 수입 준비…자국 AI칩 동시 활용

괴테는 모든 것을 말하진 않았다, 그리고 '업계 전문가'도

게임시장 소비자 직접 판매 'D2C 시대' 온다

'서학개미' 확대에 원·달러 일평균 807억 달러 움직였다

ZDNet Power Center

Connect with us

ZDNET Korea is operated by Money Today Group under license from Ziff Davis. Global family site >>    CNET.com | ZDNet.com
  • 회사소개
  • 광고문의
  • DB마케팅문의
  • 제휴문의
  • 개인정보취급방침
  • 이용약관
  • 청소년 보호정책
  • 회사명 : (주)메가뉴스
  • 제호 : 지디넷코리아
  • 등록번호 : 서울아00665
  • 등록연월일 : 2008년 9월 23일
  • 사업자 등록번호 : 220-8-44355
  • 주호 : 서울시 마포구 양화로111 지은빌딩 3층
  • 대표전화 : (02)330-0100
  • 발행인 : 김경묵
  • 편집인 : 김태진
  • 개인정보관리 책임자·청소년보호책입자 : 김익현
  • COPYRIGHT © ZDNETKOREA ALL RIGHTS RESERVED.