Synology High Availability (SHA):零宕机双机热备
如果你的业务一分钟都不能停(如公司文件服务器、监控中心),那么 Snapshot Replication 的分钟级恢复可能还不够。你需要 SHA (Synology High Availability)。 它将两台 NAS 绑定为一个高可用集群 (Cluster),对外提供唯一的虚拟 IP。当主服务器故障时,副服务器在 秒级 内自动接管,用户几乎无感知。
1. 硬件要求 (严格)
SHA 对硬件要求非常苛刻,必须满足: 1. 型号相同:两台 NAS 必须是完全相同的型号(如两台 DS920+)。 2. 硬盘相同:硬盘数量、容量、位置必须完全一致。 3. DSM 版本相同。 4. 心跳线 (Heartbeat):两台 NAS 之间必须用一根网线直连(推荐万兆直连),用于同步内存数据和磁盘写操作。
2. 部署步骤
- 物理连接:
- LAN 1: 连接交换机(对外业务)。
- LAN 2: 两台 NAS 直连(心跳线)。
- 初始化:
- 配置好主 NAS (Active)。
- 副 NAS (Passive) 保持出厂状态(未初始化)。
- 创建集群:
- 在主 NAS 上打开 Synology High Availability 套件。
- 点击 创建高可用集群。
- 输入副 NAS 的 IP 和管理员密码。
- 系统会自动检测网络配置。
- 设置 集群虚拟 IP:这是用户以后访问的唯一 IP。
- 数据同步:
- 系统会格式化副 NAS,并开始从主 NAS 全量同步数据。这可能需要几小时到几天。
3. 工作原理
- Active-Passive 模式:
- 平时只有主 NAS 在工作,处理所有请求。
- 副 NAS 处于“影子”状态,实时接收主 NAS 的所有磁盘写入和内存状态。
- 自动故障转移:
- 当主 NAS 断电、断网、或关键服务崩溃时,SHA 机制会立即将副 NAS 提升为主 NAS。
- 虚拟 IP 自动漂移到副 NAS。
- 切换时间:通常在 10-60 秒内。SMB 连接可能会断开一下然后重连,Web 服务只需刷新页面。
4. 脑裂 (Split-brain) 预防
脑裂是 HA 集群最怕的情况:心跳线断了,两台 NAS 都以为对方挂了,都试图抢占主服务器地位,导致数据冲突。 * Quorum Server (仲裁服务器): * 在 SHA 设置中,配置一台第三方的服务器(如路由器或另一台小 NAS)作为仲裁者。 * 当心跳断开时,谁能 ping 通仲裁服务器,谁就是老大。
5. 维护与升级
- DSM 升级:SHA 会自动协调。先升级副 NAS,重启,切换主副,再升级原来的主 NAS。全程业务不断。
- 硬盘更换:支持热插拔。拔掉坏盘,换新盘,点击“修复”,数据自动同步。
6. SHA vs Snapshot Replication 对比
| 特性 | SHA (高可用) | Snapshot Replication (快照复制) |
|---|---|---|
| RPO (数据丢失) | 0 (实时同步) | > 5分钟 (取决于快照频率) |
| RTO (恢复时间) | < 1分钟 (自动) | > 5分钟 (需人工介入切换) |
| 距离限制 | 必须近距离直连 (同机房) | 可跨越全球 (异地容灾) |
| 硬件要求 | 必须相同型号 | 任意型号 |
| 防病毒 | 弱 (病毒会实时同步) | 强 (快照只读,可回滚) |
| 定位 | 业务连续性 (Business Continuity) | 灾难恢复 (Disaster Recovery) |
最佳实践:真正的企业级方案是 SHA + Snapshot Replication。本地用 SHA 保证零宕机,同时把快照复制到异地 NAS 防止火灾和病毒。