01 · 제가 하는 일
실제 업무
- VM, 파일 공유, 데이터베이스, 물리 호스트를 위한 Rubrik 백업 아키텍처를 설계·배포하고, 각 워크로드가 실제로 얼마나 중요한지에 맞춰 정책을 구성합니다.
- 시스템별로 RTO와 RPO 목표를 설정한 뒤, 추측이 아니라 그 목표를 충족하도록 보호 스케줄을 구성합니다.
- 형식적인 점검이 아닌 실제 복원 훈련을 진행합니다. 전체 VM 복구, 파일 단위 복원, 그리고 직접 지켜볼 수 있는 페일오버 시연까지 포함합니다.
- 재해 복구 계획을 명확한 담당자, 순서, 의존 관계를 갖춘 문서화된 절차로 작성합니다.
- 합의한 기준에 맞춰 복구 시간을 검증하고, 수치가 안정적으로 충족될 때까지 백업 작업 시간, 복제, 보관 주기를 조정합니다.
- 불변성과 랜섬웨어 복구를 테스트해, 나쁜 하루가 전면적인 손실로 번지지 않도록 합니다.
- 제가 전화를 받지 않아도 팀이 직접 복구할 수 있도록 환경을 문서화합니다.
02 · 얻으시는 것
최종적으로 남는 결과물
- 복원이 실제로 검증된 백업 구성과, 경영진이나 감사 담당자에게 제시할 수 있는 문서화된 복구 시간.
- 사전에 합의하고 테스트에서 충족한, 시스템별 명확한 RTO와 RPO 수치.
- 제게 연락하지 않아도 팀이 그대로 따라 할 수 있는 문서화된 재해 복구 계획.
- 랜섬웨어나 하드웨어 장애가 닥쳐도 처음부터 다시 구축하는 것이 아니라 복구로 끝난다는 확신.
03 · 도구와 지식
이 분야에서 다루는 것들
04 · 제 접근 방식
계획하고, 범위를 정하고, 끝까지 책임집니다
먼저 30분 범위 산정 통화로 시작하고, 같은 날 서면 적합성 평가를 보내드립니다. 그래야 어디까지가 작업 범위이고 무엇이 좋은 결과인지 서로 분명히 알 수 있습니다. 운영 환경에 손대기 전에는 보호 스케줄, 보관 주기, 복제가 어떻게 바뀌는지 명시한 문서화된 변경 계획과 롤백을 작성합니다. 그런 다음 정해진 작업 시간 안에서 변경을 적용하고, 실제 복원 훈련으로 합의한 기준에 맞춰 복구를 검증하며, 기준을 통과하지 못하면 롤백을 제가 책임지고 수행합니다. 막연한 기대가 아니라 검증된 결과를 받으시게 됩니다.
05 · 질문
좋은 질문에 대한 솔직한 답변
Rubrik만 다루시나요?
Rubrik이 제가 가장 깊이 아는 도구라 그만큼 가장 큰 가치를 더할 수 있는 영역입니다. 다만 실질적인 RTO와 RPO 목표를 정하고 복원 훈련으로 입증하는 방법론은 어떤 플랫폼에도 적용되며, 다른 도구가 귀사 환경에 더 잘 맞는다면 솔직하게 말씀드리겠습니다.
복원 훈련이란 무엇이고, 왜 중요한가요?
실제 복구를 해 보는 것입니다. 백업 작업이 성공했다고 보고된 것을 그대로 믿는 대신, 백업에서 시스템을 실제로 되살리고 그 시간을 측정합니다. 한 번도 복원해 본 적 없는 백업은 추측일 뿐입니다. 복원 훈련은 그것을 확인된 복구 시간으로 바꿔 줍니다.
운영 환경에 지장을 주지 않고 구축할 수 있나요?
네. 백업과 DR 변경은 롤백을 갖춘 문서화된 변경 계획에 따라 정해진 작업 시간 안에서 적용합니다. 복원 훈련은 운영 중인 시스템이 아니라 복구된 사본을 대상으로 진행하므로, 복구를 테스트한다고 해서 운영 환경이 위험에 노출되지 않습니다.
06 · 관련 경험