입력
수정
잇단 SaaS 기업 서비스 중단 사태 지난 7월 MS 클라우드 마비 대란 세일즈포스도 DB 연결 오류로 먹통
고객관계관리(CRM) 소프트웨어 글로벌 1위 기업인 세일즈포스의 시스템이 장애로 중단됐다. 세일즈포스의 업무 도구를 활용하고 있는 기업의 세일즈, 서비스 플랫폼 등이 일제히 먹통이 되면서 세일즈포스의 업무 도구를 활용하고 있는 정부와 기업의 세일즈, 서비스 플랫폼 등은 막대한 피해가 불가피해졌다.
세일즈포스 장애 발생
16일 업계에 따르면 전날 오후 3시께부터 서비스가 중단됐다. 이용자는 서비스에 로그인할 수 없다는 메시지를 받았다. 이 같은 현상은 한국은 물론 일본, 호주 등 아시아·태평양 지역에서 광범위하게 발생한 것으로 나타났다. 세일즈포스는 공지를 통해 ‘세일즈포스 서비스가 중단된다’며 ‘최종 사용자가 서비스에 액세스할 수 없다’고 알렸다. 장애가 생긴 서버(인스턴스)는 아시아·태평양 지역에 걸쳐 100곳 이상인 것으로 나타났다. 기술팀은 서버에 영향을 미치는 서비스 중단을 인지하고 과도한 트래픽, 네트워크 사용률, 데이터베이스(DB) 안정성을 제어하기 위한 조처를 하기 시작했다.
장애의 원인은 정확하게 파악하지 못했다. 세일즈포스는 “영향을 받은 DB를 분석해 몇 가지 불일치를 확인했다”며 “추가 조사를 통해 최근의 변경 사항이 잠재적 트리거로 밝혀져 변경 사항에 대해 롤백(이전 상태로 되돌림) 작업을 수행했다”고 덧붙였다. 이어 15일 오후 10시30분께 "롤백을 통해 문제가 성공적으로 해결된 것을 확인했다"며 "나머지 인스턴스에도 롤백을 진행할 것"이라고 공지했다.
세일즈포스 서비스가 멈추면서 해당 서비스를 사용하는 수많은 회사가 불편을 겪었다. 세일즈포스는 세계에서 가장 큰 CRM 솔루션 기업이다. 한국에선 LG전자, 카카오엔터프라이즈, 현대모비스, 한화호텔앤리조트 등 대기업부터 중소기업까지 다양한 기업이 세일즈포스를 활용 중이다. 국내 기업 간 거래(B2B) 대형 기업 관계자는 “영업 담당 부서에서 시스템에 접속하지 못해 혼란이 있었다”고 말했다. 다른 업체는 “모바일 앱 서비스에 회원들이 로그인할 수 없는 사태가 일어났다”며 “피해 규모를 산정하고 있다”고 설명했다.
MS 클라우드 먹통 대란
업계에서는 업무 효율성 향상을 위해 SaaS를 잇따라 도입하고 있지만 관련 기업들의 잇따른 서비스 장애로 시장이 움츠러들까 염려하고 있다. 무엇보다 외부 공격이 아닌 내부 시스템 변경만으로도 서비스가 마비됐다는 점에서 SaaS에 대한 불안정성 문제가 부각되는 분위기다.
특히 지난 7월 발생한 글로벌 사이버보안 기업 크라우드스트라이크(Crowdstrike)의 대규모 서비스 장애 문제가 경각심을 키웠다. 당시 마이크로소프트(MS) 윈도 운영체제(OS)와 크라우드스트라이크의 시스템이 충돌해 이를 사용하는 기기 850만 대가 영향을 받아 세계 곳곳의 공항과 병원, 기업, 기관 내 업무용 PC 상당수가 마비됐다. 해당 사고의 원인 역시 보안 사고나 사이버 공격이 아닌 업데이트 시 발생한 단순 결함인 것으로 밝혀졌다.
서비스 먹통으로 인한 피해는 막대했다. 국내 항공사와 게임사 시스템을 멈추게 했고 미국, 유럽 등의 방송·금융·응급 서비스에까지 혼란을 일으켰다. 이에 델타항공은 큰 손해를 봤다는 이유로 지난달 조지아주 법원에 크라우드스트라이크를 상대로 소송을 제기하기도 했다. 델타항공에 따르면 해당 장애로 인해 매출이 3억8,000만 달러(약 5,300억원) 감소하고, 비용이 1억7,000만 달러(약 2,370억원)가량 발생한 것으로 알려졌다.
AWS 먹통에 美 동부 ‘대혼란’ 발생도
미국 최대의 클라우드 서비스 제공업체 아마존 웹서비스(AWS)도 접속 장애로 곤혹을 치른 바 있다. 2021년 12월 8일 10시 45분께 AWS 접속 문제에 대한 신고가 접수되기 시작했고, 30분 후에는 아마존 관련 신고 건수가 1만1,300건으로 치솟았다. 이로 인해 아마존이 운영하는 음악 스트리밍 서비스 ‘프라임뮤직’을 시작으로, 화상회의 프로그램인 ‘차임’과 가정 보안 시스템 ‘링’ 등 아마존의 서비스 대다수가 중단됐다. 물류 배송에도 차질이 생겼다.
아마존 외에 AWS를 이용하는 다른 기업들도 피해를 입었다. 디즈니의 스트리밍 구독 서비스인 디즈니+와 넷플릭스의 접속 장애를 겪었고, 주식 거래 앱인 로빈후드와 미국 최대 암호 화폐 거래소인 코인베이스 또한 접속에 어려움을 겪었다. 아마존 측은 특정 API(컴퓨터 운영 언어)와 AWS 관리 콘솔에서 문제가 발생했다고 밝혔다.
이 같은 사태는 빅테크 기업이 우리 일상에 얼마나 큰 영향을 미치는지 단적으로 보여주는 사례다. 리서치 회사 가트너의 시드 내그 부사장은 “미국 클라우드 서비스 시장은 “일부 대기업은 클라우드 서비스를 여러 곳으로 분산해 위험을 줄이고 있지만, 클라우드 업체 수가 제한적인 것을 감안할 때 이런 접속 장애가 재발하는 것을 막기는 어렵다”고 말했다.
일각에선 이 같은 문제를 방지하기 위해 SaaS 기업들이 내부 시스템 변경 시 관리 프로세스를 더욱 강화해야 한다는 지적도 나온다. 한 클라우드 업계 관계자는 "안정적인 SaaS 운영을 위해 클라우드 시스템의 이중화와 삼중화를 구현하고 장애 발생 시 신속하게 대응할 수 있는 환경이 조성돼야 한다"며 "예상치 못한 장애 상황에서도 시스템 중단 시간을 최소화하기 위한 구조적 설계도 강화해야 할 것"이라고 말했다. 이어 "앞으로 자동 업데이트를 맹목적으로 신뢰하면 안 된다는 것을 기업들도 인지하게 됐을 것"이라며 "대규모 장애를 막기 위해선 선제적으로 시스템 변경 전 통제된 조건에서 예비 배포를 진행해 볼 필요가 있다"고 덧붙였다.
마이클 호크 가트너 수석 애널리스트도 "SaaS 기술에 대한 기업의 의존도가 높아짐에 따라 SaaS 데이터를 보호하고 복구할 수 있도록 하는 것이 중요해졌다"며 "오류, 사이버 공격, 공급업체 사고에 대한 SaaS 데이터의 취약성을 고려할 때 강력한 백업 솔루션도 필수"라고 역설했다.