高阶01:EAP三档容灾架构(冷备/温备/热备)选型与落地配置

高阶01:EAP三档容灾架构(冷备/温备/热备)选型与落地配置 高阶01EAP三档容灾架构冷备/温备/热备选型与落地配置一、本课学习目标1、彻底掌握Fab生产系统冷备、温备、热备三档容灾底层差异、适用场景、成本与风险取舍。2、读懂EAP集群容灾架构设计逻辑理解单点故障、集群故障、机房级故障防护机制。3、掌握三档容灾完整落地配置、切换流程、巡检标准、故障演练SOP。4、能够根据产线产能、等级、预算自主选型容灾方案规避容灾不足或过度建设。5、解决量产核心痛点主服务宕机无人接管、切换丢数据、备机不同步、灾备失效。二、EAP容灾核心价值Fab量产红线EAP是全厂设备自动化唯一中枢无容灾单点崩溃全厂停线。容灾的核心目标RTO恢复时间最小、RPO数据丢失量趋近于0。三、三档容灾架构原理量产选型对比1、冷备Cold Backup架构逻辑备用服务器长期关机/待机定时同步备份数据平时不运行服务。优点成本极低、无资源占用、零冲突风险。缺点恢复慢、数据滞后、无法应对突发宕机。适用场景辅助设备EAP、低产能、老旧产线、预算受限站点。2、温备Warm Backup架构逻辑备机服务常驻运行定时同步业务数据不承载生产流量。优点切换速度快、数据延迟低、稳定性高。缺点需要常驻资源、有一定运维成本。适用场景主力工艺设备、中高产能产线、主流Fab标准配置。3、热备Hot Backup / 双活架构逻辑主备双机同时实时读写、毫秒级数据同步、双活负载。优点故障无感切换、数据零丢失、7*24高可用。缺点架构复杂、成本高、运维难度大、存在双写冲突风险。适用场景12寸高产能Fab、核心工艺集群、全厂核心EAP中枢。四、三档容灾落地配置标准可直接量产套用1、冷备落地规范1、每日凌晨全量备份、每2小时增量备份2、故障后人工启动服务、导入备份数据3、RTO≥30分钟RPO≤2小时2、温备落地规范1、主备服务双常驻数据库定时同步日志回放2、故障自动探测、手动/半自动切换3、RTO≤5分钟RPO≤1分钟3、热备双活落地规范1、主备毫秒级binlog同步、服务心跳互检2、故障秒级自动切换、业务无感3、RTO≈0RPO0五、容灾切换标准化SOP1、故障判定主服务失联/数据库异常/业务写入失败2、确认现场风险、禁止双主同时运行3、切断主机流量、激活备机接管4、校验批次、状态、Trace数据完整性5、主机恢复后切回、同步差值数据六、本课核心总结1、冷备省钱、温备通用、热备最高可用量产按产线等级选型。2、绝大多数Fab量产最优解核心温备关键集群热备辅助冷备混合架构。3、容灾不是有备份就够必须常态化演练、校验同步有效性。七、课后作业1、简述冷/温/热备三者RTO、RPO核心区别2、为什么主流Fab主力EAP不使用冷备架构3、双活热备最大风险点是什么如何规避