linux-sre-handbook
11-故障排查方法论
本节导航
01-排查思路框架.md
02-常见故障模式.md
03-应急响应SOP.md
04-事后复盘模板.md
05-经典案例库.md
学习目标
建立系统化的故障排查思维框架,掌握应急响应全流程(检测 → 响应 → 恢复 → 复盘),从实际案例中积累经验。
核心理念
“在 SRE 的世界里,故障不是意外,是系统行为的一部分。”
相关板块
../04-系统性能/README.md
— 性能问题排查
../05-可观测性/README.md
— 故障发现和数据源
../12-高可用与容灾/README.md
— 预防故障