검색 - IT세상을 바꾸는 힘 지디넷코리아

ZDNet 검색 페이지

'클라우드 장애'통합검색 결과 입니다. (11건)

태그
기간
- 3개월
- 1년
- 1년 이전

재검색

네이버클라우드플랫폼 일부 장애…복구 진행 중

네이버클라우드가 운용하는 서비스 '네이버클라우드플랫폼'에서 일부 장애가 발생했다. 네이버클라우드플랫폼은 20일 오후 3시 26분경부터 일부 블록 스토리지 장비에서 문제가 감지돼 원인 파악 및 복구 작업을 진행 중이라고 공지했다. 블록 스토리지는 클라우드 내 가상 서버에 데이터를 저장하는 장치다. 이번 장비 이상으로 일부 가상머신(VM) 서비스의 안정성이 저하된 것으로 알려졌다. 네이버클라우드 측은 "서비스가 정상화되는대로 안내할 것"이라고 밝혔다.

2026.02.20 20:03한정호 기자

국정자원 복구는 두 달, 민간은 몇 시간…왜 차이 날까

지난 9월 26일 발생한 국가정보자원관리원(국정자원) 대전센터 화재는 단순한 사고를 넘어 정부 디지털 인프라의 구조적 취약성을 드러낸 사건으로 평가된다. 주요 핵심 서비스가 멈춰 서면서 행정 전반이 장기간 혼란에 빠졌고 화재 발생 두 달이 돼가는 현재까지 최종 복구 작업이 이어지고 있다. 업계에서는 이번 사태를 계기로 공공 정보시스템의 복원력 강화와 재난 대응 체계 전면 재설계가 필요하다는 지적이 커지고 있다. 22일 행정안전부에 따르면 국정자원 대전센터 정보시스템 709개 중 697개 시스템이 복구돼 총복구율은 98.3%로 나타났다. 정부는 대구센터 민관협력형 클라우드(PPP) 이전 대상 시스템 복구에 박차를 가하고 있다. 이번 사태가 던진 질문은 "왜 정부 디지털서비스는 멈추면 다시 돌아오는 데 몇 주·몇 달이 걸리는가"라는 점이다. 같은 기간 글로벌 클라우드 사업자 아마존웹서비스(AWS), 마이크로소프트(MS), 클라우드플레어 등도 잇따라 장애를 겪었지만 대부분 수 시간 내 복구를 완료했다. AWS 미국 동부 리전에서 발생한 도메인 시스템 장애는 약 15시간 만에 정상화됐고 MS 애저 클라우드의 전역 네트워크 장애 역시 수 시간 내 복구됐다. 클라우드플레어는 내부 데이터베이스(DB) 권한 변경 과정에서 발생한 오류로 전 세계 네트워크 서비스가 피해를 입었지만 약 3시간 만에 문제를 해결했다. 글로벌 사업자들 역시 장애 자체는 피하지 못했지만 복구 속도는 국정자원과 비교하기 어려울 만큼 빨랐다. 속도 차이는 기술 인프라와 운영 체계의 구조적 차이에서 비롯된다. 민간 클라우드 기업들은 장애 발생 즉시 자동화된 재해복구(DR) 체계가 작동하도록 설계돼 있고 리전·가용영역(AZ)을 다중화해 단일 장애 지점(SPOF)을 최소화했다. 반면 국정자원은 물리적으로 세 곳의 센터를 운영해 왔지만, 전력·네트워크·장비 구성 요소가 한 센터 내부에 집중돼 있어 대전센터 화재처럼 물리적 재난이 발생했을 때 대체 시스템으로의 전환이 원활히 작동하지 않았다. 운영 구조도 여전히 전통적 방식에 머물러 있다. 서버·스토리지·네트워크 등 장비 제조사 다양화를 위한 정책은 운영 복잡성을 높였고 구성의 표준화가 부족해 신속한 대응이 어려운 환경이다. 특히 각 부처의 정책·사업·보안 규정이 분절돼 있어 새로운 기술을 도입하고 운영 방식을 개선하는 데도 한계가 있다. 전문가들은 정부 디지털 인프라가 '중앙집중형=안전'이라는 오래된 인식에서 벗어나야 한다고 지적한다. 민간 클라우드는 지리적으로 분산된 여러 리전 기반 위에서 운영되기 때문에 특정 데이터센터에서 문제가 발생해도 서비스 전체가 중단되지 않는 구조를 갖췄다. 국정자원은 특정 센터에 문제가 생기면 주요 행정서비스가 한꺼번에 멈추는 위험을 드러냈다. 정부는 센터 간 이중화 시범 사업을 신속히 완료하고 DR 전용 공주 백업센터를 운영한다는 방침이다. 미국은 이미 민간 클라우드 기반의 공공 전용 존을 확대하며 멀티클라우드 전략을 기반으로 공공 인프라를 운영 중이다. 연방조달청(GSA)이 AWS·구글·MS·오라클 등과 대규모 계약을 체결해 클라우드 자원을 정책적으로 통합 조달하고 페드램프 인증으로 보안 기준을 표준화한 것이 대표적 사례다. 한국 공공 클라우드 환경과의 구조적 차이가 나타나는 지점이다. 국내에서도 민간 클라우드 활용 확대 움직임은 이미 시작됐다. 국정자원 대구센터에 PPP 모델이 구축되며 삼성SDS·KT클라우드·NHN클라우드 등 민간 클라우드 서비스 기업(CSP)들이 국가 중요 시스템 대상 서비스를 개시한 상태다. 하지만 실제 공공 전반을 놓고 보면 클라우드 전환 속도는 여전히 더딘 수준이다. 예산·보안 규제·조달 절차 등 제도적 장벽 역시 장애 요인으로 지적되고 있다. 이번 사태 이후 업계에서는 국정자원을 민간 클라우드 수준의 가용성과 복원력을 갖춘 '정부형 CSP'로 전환해야 한다는 목소리가 커지고 있다. 다중 리전 기반 멀티클라우드 전략을 도입해 단일 장애 지점을 제거하고 자동화 기반 DR 시스템을 갖춘 구조로 재편해야 한다는 데 의견이 모아진다. 장애는 어떤 인프라에서도 발생할 수 있다. 문제는 복구 속도와 그 과정에서 국가 기능이 어디까지 유지될 수 있는가다. 공공의 디지털 복원력을 민간 수준으로 끌어올리지 못한다면 정부 디지털서비스는 앞으로도 위기 때마다 장기간 멈춰 설 수밖에 없다는 경고가 나온다. 클라우드 업계 관계자는 "전 세계 어디에서도 장애는 피할 수 없지만 복구를 몇 시간 내 끝낼 수 있는 구조를 갖추는 것이 공공의 필수 과제"라며 "국정자원도 단일 센터 중심 구조에서 벗어나 멀티클라우드 기반 복원력 체계로 전환해야 한다"고 강조했다.

2025.11.22 10:33한정호 기자

챗GPT·X·스포티파이 등 글로벌 다운…원인은 'AI'

챗GPT와 X, 리그오브레전드 등 전세계 주요 인터넷 서비스가 수시간 동안 대규모 접속 장애를 겪었다. 원인은 네트워크 인프라를 제공하는 클라우드플레어에서 사용 중이던 인공지능(AI) 봇의 설정 오류로 나타났다. 매튜 프린스 클라우드플레어 최고경영자(CEO)는 19일 클라우드플레어에서 발생한 장애의 구체적인 원인을 밝혔다. 클라우드플레어는 전세계에 분산된 데이터센터를 운영하면서 수많은 웹사이트와 앱의 트래픽을 대신 받아 처리하는 기업이다. 전세계 웹사이트 가운데 약 20%가 클라우드플레어의 보안·네트워크 서비스를 사용하는 것으로 알려졌다. 매튜 프린스 CEO는 이번 장애의 직접 원인으로 봇 관리 기능이 사용하는 '피처(feature) 설정 파일'에서 발생한 오류를 지목했다. 클라우드플레어는 기계학습(ML) 기반 봇 탐지를 위해 각 요청에 대해 수십 개의 특징값을 계산해 점수를 매긴다. 이 과정에서 어떤 피처를 어떻게 사용할지 정의한 설정 파일을 몇 분 간격으로 전세계 서버에 배포한다. 18일 내부 데이터베이스 권한 변경 과정에서 발생한 오류로 이 파일에 중복 항목이 대량으로 포함됐다. 그 결과 파일 크기가 기존의 약 두 배로 불어났고 해당 파일을 읽어들이던 코어 프록시 소프트웨어가 설계된 한계를 넘기면서 비정상 종료됐다는 설명이다. 이로 인해 국내시간 기준 18일 오후 9시 30분경 전세계 네트워크에서 핵심 트래픽 전달이 제대로 이뤄지지 않는 장애가 발생했다. 약 4시간 동안 챗GPT, 스포티파이, 리그오브레전드, X 등 클라우드플레어를 사용하는 수많은 웹사이트와 서비스 접속 시 오류가 발생했다. 장애를 확인한 클라우드플레어는 잘못된 피처 파일 생성과 전파를 중단하고 정상 동작하던 기존 파일을 수동으로 배포하며 문제 해결에 나섰다. 회사 측은 이번 사고를 2019년 이후 최악의 장애라고 평가했다. 그동안에는 대시보드나 일부 신기능이 일시적으로 중단된 사례는 있었지만 네트워크 전체의 코어 트래픽이 이 정도 규모로 멈춘 적은 없었다는 설명이다. 클라우드플레어는 재발 방지 대책도 제시했다. 자체 생성 구성 파일도 엄격하게 검증하고 문제가 생긴 기능을 전세계적으로 즉시 끌 수 있는 '킬 스위치'를 확대하겠다고 밝혔다. 또한 코어 덤프나 에러 리포트가 시스템 자원을 잠식하지 못하도록 설계를 바꾸고 프록시 모듈 전반의 실패 모드를 재검토해 단일 설정 오류가 인터넷 전반 장애로 이어지지 않도록 구조를 손질하겠다고 덧붙였다. 매튜 프린스 CEO는 "현재 이런 장애가 다시 발생할 경우를 방지하기 위해 시스템을 어떻게 강화할 것인지에 대한 작업이 진행 중"이라며 "클라우드플레어 전체 팀을 대표해 오늘 인터넷에 끼친 피해에 대해 진심으로 사과드린다"고 말했다.

2025.11.19 10:03남혁우 기자

클라우드플레어 장애로 챗GPT·X 등 먹통

웹 인프라 기업 클라우드플레어 서버에 장애가 발생해 전세계 주요 플랫폼 서비스 운영이 중단됐다. 18일 더버지 등 외신은 클라우드플레어 서버 장애로 챗GPT나 X와 같은 플랫폼 서비스들이 마비됐다고 보도했다. 챗GPT 사이트에 접속시 '계속하려면 challenges.cloudflare.com 차단을 해제하세요' 라는 메시지가 뜬다. 외신에 따르면 이날 리그오브레전드, 우버, 캔바, 스포티파이 등 다른 온라인 서비스도 먹통이 됐다. 회사 측은 "비정상적인 트래픽이 급증해 오류가 발생했다"며 "서비스 중단을 해결하기 위해 노력하고 있다"고 밝혔다.

2025.11.18 23:28안희정 기자

MS 애저 클라우드·365 서비스 전 세계 장애…현재 복구 중

마이크로소프트(MS)의 클라우드 플랫폼 '애저'와 사무용 서비스 'MS 365'에서 전 세계적으로 장애가 발생해 이용자들이 큰 불편을 겪었다. 일부 항공사와 통신사, 주요 기업 웹사이트까지 영향을 받으며 지난 아마존웹서비스(AWS) 클라우드 장애에 이어 글로벌 디지털 인프라의 취약성이 다시 한 번 드러났다는 평가다. 미국 온라인서비스 추적사이트 다운디텍터에 따르면 29일 오후 1시 36분(미국 동부시간, 한국시간 30일 오전 2시 36분) 기준 애저 서비스 장애는 3천96건, 365 서비스 장애는 3천448건으로 집계됐다. 서비스 장애는 이날 오전 11시부터 두드러지기 시작해 정오를 정점으로 점차 완화됐다. 이번 장애로 애저 클라우드를 이용하는 알래스카항공과 하와이안항공은 웹사이트 및 온라인 체크인 시스템이 중단됐다. 영국 히스로 공항과 보다폰도 주요 시스템에 접근 문제가 발생했다. 스타벅스·코스트코·크로거 등 다수의 글로벌 기업 웹사이트와 애플리케이션, 엑스박스와 마인크래프트 등 MS의 자사 서비스도 일시적으로 접속 불가 상태를 겪었다. 특히 일부 산업에서는 항공 예약과 통신, 결제 시스템까지 영향을 받아 전 세계적으로 혼란이 이어졌다. MS는 자사 상태 페이지를 통해 "의도치 않은 구성 변경이 문제의 원인으로 의심된다"며 "애저 프론트 도어(AFD) 서비스의 모든 변경을 차단하고 마지막으로 정상 작동했던 상태로 복구 중"이라고 설명했다. 애저 프론트 도어는 클라우드 트래픽을 관리하는 글로벌 콘텐츠·애플리케이션 전달망(CDN)으로, 이번 장애는 해당 시스템의 설정 변경에서 비롯된 것으로 추정된다. 이번 사태는 불과 일주일 전 AWS에서 대규모 접속 장애가 발생한 데 이어 벌어진 것으로, 글로벌 IT 인프라의 안정성에 대한 우려가 다시 제기되고 있다. 업계와 주요 외신에서는 인공지능(AI)과 클라우드 시대일수록 단일 사업자 장애가 산업 전반으로 확산되는 도미노 리스크가 커지고 있다고 지적했다. MS는 "애저는 장애 영향을 받은 지역 전반에서 서비스가 회복되고 있다"며 "완전한 복구 절차를 진행 중"이라고 밝혔다.

2025.10.30 09:38한정호 기자

AWS 15시간 먹통 후 복구…업계 "소수 클라우드 집중 구조 한계"

세계 최대 클라우드 서비스인 아마존웹서비스(AWS)에 대규모 장애가 발생해 전 세계 주요 인터넷 서비스가 마비됐다. 현재 대부분 복구가 완료됐지만 일부 서비스는 여전히 불안정한 상태로, 인터넷 인프라 집중화의 구조적 취약성이 다시 드러났다는 평가가 나온다. 21일 업계와 주요 외신에 따르면 이번 장애는 지난 20일 미국 버지니아 북부 리전(US-EAST-1)에서 발생했다. AWS의 핵심 데이터베이스(DB) 서비스 '다이나모DB'의 도메인 네임 시스템(DNS) 오류가 근본 원인으로 지목됐다. DNS는 인터넷의 전화번호부 역할을 하는 핵심 인프라로, 주소(URL)를 실제 서버의 IP로 연결해주는 기능을 한다. 이 시스템이 멈추자 수많은 앱과 웹사이트가 데이터 접근을 잃고 동작을 멈췄다. AWS 측은 "아마존 EC2 서버 내부 네트워크의 트래픽 분산 모니터링 서브시스템 문제로 인해 네트워크 부하가 급증했다"며 "DNS 오류와 맞물리면서 연쇄 장애가 확산됐다"고 설명했다. AWS는 15시간가량 이어진 복구 작업 끝에 대부분의 서비스를 정상화했다. 회사는 "현재 모든 AWS 서비스에서 복구가 진행 중이며 일부 백로그 메시지는 몇 시간 내 처리될 예정"이라고 밝혔다. 다만 일부 지역에서는 여전히 접속 오류가 간헐적으로 발생 중이며 AWS의 서버 임대 서비스 '람다'와 일부 데이터 분석 서비스는 복구가 지연되고 있는 것으로 알려졌다. 이번 장애로 슬랙·퍼플렉시티·스냅챗·포트나이트·로블록스·챗GPT·스타벅스·디즈니플러스·페이팔·코인베이스·유나이티드항공 등 수천 개의 글로벌 서비스가 일시적으로 중단됐다. 국내에서도 삼성월렛·배틀그라운드·네이버웹툰·배달의민족 등 다수 기업 서비스가 멈춰 업무와 이용에 불편이 발생했다. 현재는 대부분 서비스가 정상화됐지만 일부 기업은 캐시 데이터 손상과 API 지연으로 복구 점검을 이어가고 있는 것으로 전해졌다. 장애가 발생한 US-EAST-1은 AWS에서 가장 오래되고 많은 서비스가 연결된 리전으로, 일종의 허브 역할을 한다. DNS 오류로 다이너모DB 접근이 막히자 리전 간 장애 복구 시스템도 제대로 작동하지 못했다. 트래픽을 다른 리전으로 우회하려던 복구 시도마저 DNS가 마비되며 실패했고 복구에 최대 15시간이 소요됐다. 메흐디 다우디 캐치포인트 최고경영자(CEO)는 "이번 사태로 인한 생산성 손실과 사업 중단 등을 고려할 때 경제적 피해는 수천억 달러 규모에 이를 수 있다"고 전망했다. 이는 지난해 크라우드스트라이크 장애 이후 최대 규모의 IT 대란으로 평가된다. 업계는 이번 사건을 계기로 멀티 클라우드 전략과 독립적 DNS·네트워크 복원 구조의 중요성을 재조명하고 있다. 특히 정부·공공기관도 긴급 복구 체계와 데이터 이중화, 리전 분산 아키텍처를 도입해야 한다는 목소리가 커지고 있다. AWS뿐 아니라 구글 클라우드, 마이크로소프트 애저 등 다른 사업자들도 최근 유사한 장애를 겪으면서 집중형 인프라의 한계가 업계 전반의 공통된 고민으로 떠올랐다. 업계 관계자는 "세계 인터넷 서비스 대부분이 3~4개의 클라우드 기업에 의해 운영된다"며 "하나의 사업자가 멈추면 전 세계가 영향을 받는 구조 자체가 문제"라고 지적했다. 이어 "대형 사업자 중심의 클라우드 의존을 낮추고 서비스 복원력과 다중 리전 분산 전략을 강화하는 것이 앞으로의 핵심 과제"라고 덧붙였다.

2025.10.21 11:02한정호 기자

AWS 서버 장애로 글로벌 서비스 '마비'…국내 기업도 여파 우려

글로벌 1위 클라우드 사업자 아마존웹서비스(AWS) 인프라에서 대규모 서버 오류가 발생하면서 전 세계 주요 인터넷 서비스들이 일시적으로 마비됐다. 이번 장애로 인공지능(AI) 검색 서비스 퍼플렉시티를 비롯해 코인베이스·포트나이트·알렉사·스냅챗 등 글로벌 플랫폼이 일시 중단됐으며, 국내에서도 삼성닷컴과 크래프톤의 배틀그라운드 등 일부 서비스가 영향을 받은 것으로 나타났다. 20일 업계에 따르면 이날 한국시각 오후 4시께 AWS 미국 동부 리전에서 오류율과 지연시간이 급격히 증가하면서 관련 서비스들이 대거 마비된 것으로 알려졌다. IT 장애 모니터링 사이트 다운디텍터에는 수천 건의 오류 신고가 접수됐고 AWS는 원인을 조사해 복구 작업을 진행 중인 것으로 전해졌다. 이 피해로 퍼플렉시티는 이날 오후 4시 이후 홈페이지에서 '죄송합니다. 문제가 발생했습니다' 또는 'Internal Error Return Home' 문구가 표시되며 검색과 연구 기능이 중단됐다. 아라빈드 스리니바스 퍼플렉시티 최고경영자(CEO)는 이날 X를 통해 "퍼플렉시티 서비스가 현재 접속되지 않고 있다"며 "근본 원인은 AWS 문제이며 복구를 위해 최선을 다하고 있다"고 밝혔다. 이번 AWS 장애는 퍼플렉시티뿐 아니라 디즈니플러스·캔바·코인베이스·맥도날드·레딧 등 다수의 글로벌 서비스에 영향을 미쳤다. 특히 국내에서도 AWS 클라우드를 사용하는 기업이 많아 추가적인 피해 가능성이 제기된다. 실제 삼성닷컴에서 일부 접속 문제가 발생했고 크래프톤의 대표 게임 배틀그라운드에서도 서버 접속 장애가 이어진 것으로 알려졌다. 현재 국내 주요 대기업인 삼성전자·현대자동차·넥슨 등도 AWS 인프라를 활용하고 있어 장애가 확산될 경우 더 큰 여파가 우려된다. 업계 관계자는 "국내 주요 서비스들도 AWS 클라우드에 기반을 두고 있어 미국 동부 리전에서 발생한 장애라 하더라도 일정 부분 영향을 받았을 가능성이 높다"고 말했다.

2025.10.20 18:39한정호 기자

구글클라우드, 서비스 장애 6시간만 복구…장애 원인은 '침묵'

구글클라우드가 전 세계에 발생한 클라우드 서비스 장애 복구를 완료했다. 다만 이번 오류 원인에 대한 구체적인 설명은 나오지 않았다. 13일 토마스 쿠리안 구글클라우드 최고경영자(CEO)는 토마스 쿠리안 구글클라우드 최고경영자(CEO)는 "최근 발생한 장애 복구를 위해 최선을 다해 노력해왔다"며 "현재 모든 지역과 제품에서 정상적인 서비스가 완전히 복구됐다"고 소셜미디어 계정을 통해 밝혔다. 구글클라우드는 이번 장애 발생부터 현재 상황까지 한 눈에 볼 수 있는 대시보드를 공개했다. 대시보드는 한국을 포함한 주요 리전에서 12일 오전 10시 51분(태평양시각 기준)부터 API 요청 실패와 5xx 오류가 동시다발적으로 발생했다고 알렸다. 이 장애는 전 세계 다수 서비스와 리전에 영향을 미쳤으며 같은 날 오후 6시 18분에 완전 복구됐다. 가장 큰 영향을 받은 서비스는 버텍스 AI 온라인 예측 기능인 것으로 나타났다. 이 기능은 장애 기간 동안 가장 높은 오류율을 보였으며 복구가 가장 늦게 이뤄졌다는 분석 결과도 나왔다. 구글클라우드는 이날 오후 1시 일부 완화 조치를 취한 것으로 확인됐다. 이후 리전별 복구 작업을 단계적으로 진행했다. 오후 2시부터는 다수 리전 기능이 회복됐고 순차적으로 정상화됐다. 미국 중부 리전(us-central1) 복구가 상대적으로 지연됐다는 수치도 기록됐다. 이에 구글클라우드는 문제가 발생한 시스템 경로를 파악한 뒤 점진적으로 대응했다고 밝혔다. 현재 구글클라우드는 전체 서비스가 복구됐다고 공지했으며 클러스터 단위로 시스템 안정화를 모니터링하고 있다. 다만 장애 원인에 대해서는 아직 공식적인 기술 분석 보고서가 나오지 않았다. 일각에선 엔터프라이즈 고객 대상 AI 기능 장애는 향후 서비스 수준 계약 설명(SLA) 보상 이슈와 직결될 가능성이 있다고 평가했다. 구글클라우드코리아 관계자는 "현재까지 직접적인 국내 피해 사례는 나오지 않았다"고 밝혔다.

2025.06.13 15:26김미정 기자

구글클라우드 장애로 앱 '중단'…韓 "피해 여부 확인 중"

스포티파이 등 구글클라우드 인프라를 활용하는 서비스가 접속 중단 사태를 일으킨 가운데 한국은 피해 정황을 파악 중인 것으로 확인됐다. 13일 구글클라우드코리아 관계자는 "한국 고객사 서비스 장애 피해 확인을 위해 본사 답변을 대기 중"이라며 "현재까지 직접적인 피해 사례는 나오지 않았다"고 밝혔다. 앞서 테크크런치 등 외신은 12일 오전 11시(태평양 표준시 기준, 한국시간 13일 오전 4시)부터 스포티파이와 디스코드, 스냅챗 등 주요 앱과 클라우드플레어 일부 서비스에서 오류가 발생했다고 보도했다. 구글클라우드는 해당 문제를 인지하고 조사에 착수했으며 복구 조치를 진행 중이라고 밝혔다. 이번 장애는 구글클라우드 인프라를 사용하는 서비스에서 동시다발적으로 나타난 것으로 전해졌다. 일부 인공지능(AI) 코딩 앱과 커뮤니케이션 서비스도 영향 받아 사용자 불편이 이어졌다. 클라우드플레어는 일부 서비스만 구글클라우드를 이용하고 있어 영향이 제한적이었다고 밝혔다. 스포티파이는 구글클라우드 상태를 실시간으로 확인하고 있으며 아마존웹서비스(AWS)는 이번 사태에 영향이 없다고 선을 그었다. 구글클라우드코리아 관계자는 "현재 접속 중단 사태를 면밀히 주시하고 있다"며 "아시아·태평양 지사 측 답변을 기다리고 있다"고 말했다.

2025.06.13 11:12김미정 기자

[유미's 픽] 광주·경남 지자체 홈피 '먹통' 일으킨 NHN클라우드, 보상은 어떻게?

NHN 자회사 NHN클라우드가 운영하는 클라우드 서비스에서 장애가 발생한 가운데 향후 보상안을 어떻게 제시할 지 관심이 쏠린다. 이곳의 서비스를 이용한 곳이 공공기관뿐 아니라 민간 기업도 일부 포함된 것으로 알려져 피해는 알려진 것보다 더 클 것으로 예상된다. 26일 업계에 따르면 NHN클라우드 서비스를 이용하는 일부 지자체와 산하기관 홈페이지가 이날 오전 7시 56분부터 9시 55분까지 약 2시간가량 접속되지 않았다. 해당 지자체는 광주광역시, 경상남도청을 비롯해 전남·경남 지역에 있는 곳들이다. 광주에선 광주시청, 광주 동구·북구청, 광주문화관광포털 등 19개 홈페이지가 영향을 받았다. 경남도에선 도청 및 도지사 홈페이지, 산하 지자체, 도립미술관 등 50여 개 홈페이지가 영향을 받은 것으로 알려졌다. 이는 NHN클라우드의 판교 리전(서버 위치)에서 장애가 발생했기 때문이다. 이곳의 공조 설비 이상으로 서버룸 내 온도가 올라가면서 일부 서버 스토리지가 다운된 것으로 파악됐다. 구체적인 원인은 추가 조사를 진행해 파악할 예정으로, 이번 장애로 인한 데이터 손실 여부는 아직 확인되지 않은 상황이다. 일각에선 공조 설비 문제로 인해 장애가 재발될 가능성이 있다는 점에서 서비스 이용에 대한 불안감을 드러냈다. NHN클라우드는 유사한 문제가 발생하지 않도록 대응책을 마련하겠다는 방침이지만, 향후 재발 방지 대책에 대해 구체적으로 내놓지는 못했다. NHN클라우드가 이번 일에 대해 어떤 보상안을 내놓을 지도 관심사다. 앞서 NHN클라우드는 지난 2023년 2월에도 3시간 14분간 도메인 이름 시스템(DNS) 장애가 발생해 곤욕을 치른 바 있다. 당시 NHN클라우드 서비스를 이용한 고객사들은 콘솔·API 이용 불가, 도메인 접속 불가 등의 피해를 입은 바 있다. 당시 보상은 서비스 수준 약정(SLA)에 따라 이뤄졌다. 손해 배상은 월 가용성 구간에 따라 결정됐는데 월 가용성이 95% 미만인 경우 3개월 평균 사용 금액의 50%, 95~99%일 때는 25%에 해당하는 금액을 배상했다. 또 99% 이상 99.9% 미만일 때는 10%에 해당하는 금액을 돌려줬다. NHN클라우드 관계자는 "모든 서비스는 현재 정상 복구됐다"며 "보상안에 대해선 아직까지 논의된 것이 없다"고 말했다. 다른 기업들도 SLA을 기준으로 보상안을 제시하고 있다. 아마존웹서비스 코리아의 경우 지난 2018년 11월 22일 서울 리전의 일부 DNS 서버 설정이 잘못돼 84분 동안 장애가 발생하자, 피해 기업들에게 그 해 11월 청구 비용의 10%를 환불해준다는 대책을 내놓은 바 있다. 2022년 10월 발생한 '카카오 먹통 사태'에선 카카오가 자사 서비스로 영업하는 소상공인들에게 3만~5만원 상당의 보상액을 제시한 바 있다. 카카오모빌리티의 경우 서비스 장애 시간만큼의 수수료를 면제해줬다. 일각에선 클라우드 서비스를 이용하는 곳들이 점차 늘어나고 있는 만큼 장애 발생 시 적절한 보상을 제시할 수 있도록 기준을 마련할 필요가 있다는 지적도 나오고 있다. 현재는 데이터 유실, 접속 지연 같은 실질 피해를 입었어도 서비스를 제공하는 기업에서 자체적으로 마련한 기준에 따라 보상을 받을 수밖에 없어 불만을 키우고 있다. 업계 관계자는 "IT 서비스가 장애를 일으켰을 때 피해 보상의 범위는 대부분 기업에서 자체적으로 마련한 SLA에 따른다"며 "서비스 제공 수준이 기준에 미달하면 요금 중 일부를 배상하는 식"이라고 설명했다. 그러면서 "클라우드 환경으로 전환하는 시기인 만큼 서비스 장애에 따른 피해 유형이 갈수록 늘어갈 것으로 보인다"며 "SLA를 일괄 적용하기보다 사례별 보상안을 기업 자율규제 방식으로 마련해 서비스 신뢰도를 높일 필요가 있다"고 덧붙였다.

2025.02.26 15:42장유미 기자

NHN클라우드, 장애로 공공기관 서버 2시간 마비…"공조 설비 문제 확인 중"

NHN클라우드가 운영하는 클라우드 서비스에서 장애가 발생해 일부 지방자치단체 홈페이지가 약 2시간 동안 마비됐다. 이번 장애는 공조 설비 문제로 인해 발생한 것으로 밝혀진 상황으로, 세부 원인은 조사 중이다. 26일 업계에 따르면 이날 오전 7시 56분부터 9시 55분까지 NHN클라우드 판교 리전에서 공공기관용 클라우드 서비스 장애가 발생했다. 이로 인해 광주광역시와 경상남도청을 비롯한 다수의 공공기관 홈페이지가 접속 불가 상태에 놓였다. 광주에서는 동구·북구청, 시청, 문화관광포털 등 19개 웹사이트가 영향을 받았다. 경남에서는 도청 및 도지사 홈페이지를 포함해 산하 지자체와 도립미술관 등 50여 개 웹사이트가 장애를 겪었다. NHN클라우드는 문제가 발생한 서버 저장장치(스토리지)를 복구한 뒤 정상화 작업을 진행했다. NHN클라우드 관계자는 "현재까지 파악된 바로는 공조 설비 이상으로 인해 서버룸 내 온도가 올라갔고 이로 인해 일부 서버 스토리지가 다운됐다"며 "구체적인 원인은 추가 조사가 필요하다"고 설명했다. 이번 장애로 인한 데이터 손실 여부는 아직 확인되지 않았다. NHN클라우드 측은 "현재까지 파악된 문제는 홈페이지 접속 장애이며 내부 행정망에 추가적인 영향이 있었는지는 조사 중"이라고 밝혔다. 공조 설비 문제로 인한 장애가 재발할 가능성에 대해서도 우려가 제기된다. 회사는 현재 판교 리전의 설비 점검을 진행 중이며 유사한 문제가 발생하지 않도록 대응책을 마련하겠다는 방침이다. 다만 향후 구체적인 재발 방지 대책에 대한 구체적인 계획은 확인되지 않았다. NHN클라우드 관계자는 "향후 유사한 사태를 방지하고 원활한 서비스 제공을 위해 최선을 다하겠다"며 "장애 원인과 피해 규모가 파악되는 대로 추가적인 조치를 검토할 예정"이라고 말했다.

2025.02.26 13:28조이환 기자

Prev 1 Next

ZDNet 검색 페이지

'클라우드 장애'통합검색 결과 입니다. (11건)

네이버클라우드플랫폼 일부 장애…복구 진행 중

국정자원 복구는 두 달, 민간은 몇 시간…왜 차이 날까

챗GPT·X·스포티파이 등 글로벌 다운…원인은 'AI'

클라우드플레어 장애로 챗GPT·X 등 먹통

MS 애저 클라우드·365 서비스 전 세계 장애…현재 복구 중

AWS 15시간 먹통 후 복구…업계 "소수 클라우드 집중 구조 한계"

AWS 서버 장애로 글로벌 서비스 '마비'…국내 기업도 여파 우려

구글클라우드, 서비스 장애 6시간만 복구…장애 원인은 '침묵'

구글클라우드 장애로 앱 '중단'…韓 "피해 여부 확인 중"

[유미's 픽] 광주·경남 지자체 홈피 '먹통' 일으킨 NHN클라우드, 보상은 어떻게?

NHN클라우드, 장애로 공공기관 서버 2시간 마비…"공조 설비 문제 확인 중"

지금 뜨는 기사

이시각 헤드라인

전남광주 반도체 新공장 투자, 업계는 당혹스럽다

삼성전자 "3년 안에 AI 모듈러 홈 1만채 판매 목표"

AI 민원부터 AI 순찰차·재해복구까지…미래 행정기술 총출동

김용범 정책실장 "호남·충청 반도체 클러스터 조만간 발표...용인 이전 아냐"

ZDNet Power Center