跳转至

Synology High Availability (SHA):零宕机双机热备

如果你的业务一分钟都不能停(如公司文件服务器、监控中心),那么 Snapshot Replication 的分钟级恢复可能还不够。你需要 SHA (Synology High Availability)。 它将两台 NAS 绑定为一个高可用集群 (Cluster),对外提供唯一的虚拟 IP。当主服务器故障时,副服务器在 秒级 内自动接管,用户几乎无感知。

1. 硬件要求 (严格)

SHA 对硬件要求非常苛刻,必须满足: 1. 型号相同:两台 NAS 必须是完全相同的型号(如两台 DS920+)。 2. 硬盘相同:硬盘数量、容量、位置必须完全一致。 3. DSM 版本相同。 4. 心跳线 (Heartbeat):两台 NAS 之间必须用一根网线直连(推荐万兆直连),用于同步内存数据和磁盘写操作。

2. 部署步骤

  1. 物理连接
    • LAN 1: 连接交换机(对外业务)。
    • LAN 2: 两台 NAS 直连(心跳线)。
  2. 初始化
    • 配置好主 NAS (Active)。
    • 副 NAS (Passive) 保持出厂状态(未初始化)。
  3. 创建集群
    • 在主 NAS 上打开 Synology High Availability 套件。
    • 点击 创建高可用集群
    • 输入副 NAS 的 IP 和管理员密码。
    • 系统会自动检测网络配置。
    • 设置 集群虚拟 IP:这是用户以后访问的唯一 IP。
  4. 数据同步
    • 系统会格式化副 NAS,并开始从主 NAS 全量同步数据。这可能需要几小时到几天。

3. 工作原理

  • Active-Passive 模式
    • 平时只有主 NAS 在工作,处理所有请求。
    • 副 NAS 处于“影子”状态,实时接收主 NAS 的所有磁盘写入和内存状态。
  • 自动故障转移
    • 当主 NAS 断电、断网、或关键服务崩溃时,SHA 机制会立即将副 NAS 提升为主 NAS。
    • 虚拟 IP 自动漂移到副 NAS。
    • 切换时间:通常在 10-60 秒内。SMB 连接可能会断开一下然后重连,Web 服务只需刷新页面。

4. 脑裂 (Split-brain) 预防

脑裂是 HA 集群最怕的情况:心跳线断了,两台 NAS 都以为对方挂了,都试图抢占主服务器地位,导致数据冲突。 * Quorum Server (仲裁服务器): * 在 SHA 设置中,配置一台第三方的服务器(如路由器或另一台小 NAS)作为仲裁者。 * 当心跳断开时,谁能 ping 通仲裁服务器,谁就是老大。

5. 维护与升级

  • DSM 升级:SHA 会自动协调。先升级副 NAS,重启,切换主副,再升级原来的主 NAS。全程业务不断。
  • 硬盘更换:支持热插拔。拔掉坏盘,换新盘,点击“修复”,数据自动同步。

6. SHA vs Snapshot Replication 对比

特性 SHA (高可用) Snapshot Replication (快照复制)
RPO (数据丢失) 0 (实时同步) > 5分钟 (取决于快照频率)
RTO (恢复时间) < 1分钟 (自动) > 5分钟 (需人工介入切换)
距离限制 必须近距离直连 (同机房) 可跨越全球 (异地容灾)
硬件要求 必须相同型号 任意型号
防病毒 弱 (病毒会实时同步) 强 (快照只读,可回滚)
定位 业务连续性 (Business Continuity) 灾难恢复 (Disaster Recovery)

最佳实践:真正的企业级方案是 SHA + Snapshot Replication。本地用 SHA 保证零宕机,同时把快照复制到异地 NAS 防止火灾和病毒。