IOT기술로 전산실환경을 감시하는 장비들.사진=여정현 필자 제공.
IOT기술로 전산실환경을 감시하는 장비들.사진=여정현 필자 제공.

 

[이코리아] 지난 11월 17일 공무원 전용 행정전산망인 ‘새올행정시스템'과 온라인 민원 서비스인 ‘정부24'가 모두 마비되면서 사상 초유의 민원서비스 마비 사태가 벌어졌다. 정부는 2일이나 지난 19일에야 장애를 해소했고 시스템들은 정상화되었다. 

그런데, 전산장애 5후인 22일 주민등록시스템이 장애를 일으켰고, 다음날에는 23일 조달청 국가조달시스템인 나라장터가 불통되었다. 24일에는 정부의 전자증명서 발급이 중단되고 모바일 신분증 서비스가 다시 마비되었다. 

지난 3월 법원전산망 마비, 6월 교육부 교육행정정보시스템 '나이스(NEIS)' 오작동 등이 부각되면서 UN이 2022년 발표한 전자정부발전지수 종합3위가 무색해졌다는 주장도 나오고 있다.

국가의 중요정보를 관리하는 국가정보자원관리원의 2024년 잠정 예산은 약5,433억원에 달하나 관리원은 다양한 장애발생으로 여론의 뭇매를 맞고 있다. 정부는 조선시대 4대 사고를 참고하여 대구센터, 광주센터 등의 분원을 두고 공주센터를 추진하고 있는데, 대구나 광주의 유지보수 예산도 년간 200억원을 넘고 있다.

1주일새 4번이나 먹통이 된 전산시스템 마비는 여러 명에게 재산적인 손해를 가져올 수도 있는 국가적 재난상태라고 할 수 있다. 이글에서는 지속되는 장애의 다양한 원인과 효율적인 대응방안에 대하여 간략히 살펴본다.

네트웍에 결합된 다양한 스토리지.출처=픽사베이.
네트웍에 결합된 다양한 스토리지.출처=픽사베이.

 

지금부터 10년 전인 2013년 3월 20일 국가 기간방송망인 KBS와 농협의 전산망이 마비되면서 ‘3.20.전산대란’이 발생했다. 대란의 원인은 업데이트 서버의 취약성을 공격한 북한의 소행으로 추정되고 있다. KBS가 마비되면서 복구를 담당하는 직원들은 KBS에 상주해야 했고, 전국의 하나로마트와 목우촌 직원들은 망가진 컴퓨터를 정상화하기 위하여 복구업체 앞에서 긴 줄을 섰다. 일시적으로 쌀과 고기의 공급이 부분적이나마 중단되었다.

그러나, 이번 전산대란은 상황이 조금 다른 것이었다. 북한의 소행에 관한 명백한 증거는 발견되지 않았다. GPKI인증은 가능했으나 느려진 네트웍 속도로 작업을 정상적으로 할 수 없었던 것으로 추정된다. 필자도 서버를 20개 정도 운영하지만 네트웍 속도가 비정상적으로 느려지면 서버에 문제가 없어도 아무런 작업을 할 수 없다. 

그래서, 다수의 전문가들은 곧바로 로드밸런싱에 문제가 있었을 것이란 추측을 내어놓았다. 정부는 1주일이 지난 25일경에야 문제의 원인은 광주센터로 연결되는 라우터의 물리적 장해라고 원인을 진단했다.

과도한 사용자가 몰리는 시스템에는 일반적인 네트웍 로드밸런싱이 사용된다. 관련 장비들은 사용자인 클라이언트의 엄청난 요청을 적절히 배분하는 역할을 수행한다. 로드밸런싱 기능은 정해준 순서대로 과업을 한가한 서버에 배정하거나 연결시간이 짧은 서버에 우선 배정하는 등의 다양한 방법을 사용한다.

원인이 정확하게 밝혀지기 전에는 대전 본원의 L4 스위치가 문제의 원인으로 지적되기도 했고, GPKI인증 시스템의 부적절한 업그레이드, 웹서버 인증서의 만료, 웹방화벽 인증서의 만료 등도 장애의 원인으로 추정되었다.

현재의 재난복구는 시스템 복구보다는 비지니스 복구에 촛점을 맞추고 진행된다. 전통적인 의미의 백업은 파일의 이동에 하루 이상이 걸리므로 적절한 재난 대응이 아니다. 효과적인 미러링은 전산장애의 유효한 대응으로 적극 추천되고 있다. 전산담당자는 데이터처리에 전문성을 가질 뿐만 아니라 네트웍의 효율적인 분배에도 충분한 식견을 가져야 한다.

다양한 정부와 기업들이 보통 2개의 데이터센터에서 미러링을 수행하지만 때로는 3대로 미러링을 하는 것이 효과적일 수 있다. 이번 전산장애에도 예비 서버를 두고 장비를 2중화 하였으나, 예비 서버마저 정상적으로 작동하지 않았다. 3중으로 시스템을 구성하는 것이 때로는 과도한 자원낭비가 된다는 지적도 제기되므로, 3대 모두를 활성상태로 두고 데이터가 실시간으로 오가도록 제어하는 것도 가능하다.

다만 위 경우에도 유지보수는 필요하므로 트래픽의 양을 0%에서 100%까지 자유롭게 제어하는 것이 필요하다. DB를 변경하는 등으로 매우 짧은 시간 동안은 한 서버가 마스터가 되고 다른 서버들이 슬레이브로 설정될 수도 있는데 훈련을 통하여 관련 시간은 줄일 수 있다.

지진피해를 줄여주는 전산랙 모형. 사진=여정현 필자 제공.
지진피해를 줄여주는 전산랙 모형. 사진=여정현 필자 제공.

 

임진왜란 당시 전투 경로에 있었던 사고들은 소실되었으나 다행히 전주사고의 일부 서적이 보존되었다. 과거에는 소실된 데이터를 손으로 옮겨서 재구성했으나, 현시점에서 방대한 데이터를 미러링할 경우에는 초당 ms이하의 짧은 응답속도가 바람직하다.

그러므로, 적어도 20km 정도의 인접지역에 2대의 데이터센터를 확보하는 것이 바람직하다. 관리원이 대전과 인접한 공주에 분원을 건립한다고 하니 전산센터간 거리로 인한 지연은 어느 정도 해소될 것으로 보인다.

정부는 향후 유사한 사고재발을 막기 위해 장비점검을 강화하겠다고 밝혔다. 다양한 국가기관들이 매년 사이버침해 대응모의훈련을 실시하고 있는데, 다양한 장애원인에 대한 효과적인 훈련이 필요하다.

한편 대법원은 그동안 서버 과부하를 방지하기 위하여 전자소송시스템에서 제출할 파일용량을 10M바이트로 제한하여 일부 국민의 불편을 초래했다. 법원은 국민편의를 위하여 차세대전자소송시스템에서는 클라우드 기반 인프라를 도입하고 인공지능 기능을 강화하고 있다. 

행정부에서도 클라우드 도입을 늘리기 위하여 ‘클라우드보안인증제도’를 준비하고 있다. 적절한 클라우드의 도입은 전산망의 과부하를 막고 예산을 효율적으로 집행하는 대안이 될 수도 있다.

대구지방법원 포항지원은 지난 11월 16일 “지진을 한 차례 겪은 경우 200만원, 두 차례 모두 겪은 경우 300만원의 위자료를 지급하라”는 판결을 내어놓았다. 이로 인하여  하루에 시민들 500명 이상이 경주의 주민센터에서 줄을 서서 등본을 발급받는 진풍경이 펼쳐지고 있다. 

한국도 지진으로부터 완전히 자유로울 수 없는 만큼 이에 대비하여 설비를 안전하게 지킬 방법도 검토해야 한다. 최근 출시된 전산랙들은 지진이 발생할 경우 좌우로 이동하면서 피해를 감소시키도록 설계되기도 한다.

작년 10월 15일 카카오전산센터에서는 UPS누전으로 화재가 발생하여 소방차 46대 소방관 114명이 출동하였고, 화재 후 5일이 지난 10월 20일에야 모든 서비스를 완전히 복구할 수 있었다. 

소화가스 배관이 내장된 ESS.사진=여정현 필자 제공.
소화가스 배관이 내장된 ESS.사진=여정현 필자 제공.

 

최근에 나온 UPS나 ESS는 화재를 예방하기 위하여 바나듐이나 나트륨 전지를 사용하는 경우도 있고, 전고체전지를 채택하기도 한다. 배터리의 팩에 미세한 가스배관을 내장시켜 화재발생시 자동으로 환풍기가 작동하고 내장된 배관에 소화용가스가 분출되면서 추가적인 피해를 막도록 설계되기도 한다.

최근에 개발된 IOT기술은 전력의 공급불안정이나 과열 등의 장애를 실시간으로 파악하면서 혹시라도 발생할지 모르는 재난상태에 선제적으로 대응하도록 돕는다. 여러 IOT센서들은 다양한 예비 보전기능을 비약적으로 발전시키고 있다.

1866년 병인양요때 비교적 안전한다고 여겨졌던 강화도의 사고는 결국 불탔고, 의궤 297권 등 소중한 문화재들은 약탈당했다. 약탈 문화재 중 일부만 127년이 지난 1993년, 프랑스와의 5년마다 대여 형식으로 한국으로 돌아오게 되었다. 

정부와 공공기관, 주요 기업들은 임진왜란이나 병인양요와 같은 재난사태가 언제든지 발생할 수 있음을 염두에 두고 중요한 데이터는 충분히 4대의 사본을 만들어, 3종의 다양한 미디어에 저장하고, 2개 이상의 원격지에 보관하며, 네트웍은 효율적으로 분산시키면서 불시의 재난에 슬기롭게 대응하는 지혜가 필요하다.

[필자 소개] 여정현

서울대학교 법과대학을 졸업하고 대우그룹 회장비서실, 안양대 평생교육원 강사, 국회사무처 비서관 등을 지냈다.

저작권자 © 이코리아 무단전재 및 재배포 금지