常见故障排查案例集 (Advanced Troubleshooting)
这里收集了 DSM 运维过程中最惊心动魄的几个场景。当你的 NAS 亮起红灯报警时,请冷静参考本指南。
案例 1:存储池降级 (RAID Degraded)
现象:NAS 发出滴滴滴的报警声,存储管理器显示“存储池已降级”,某块硬盘状态为“已损毁”或“未初始化”。
原因:硬盘物理故障、SATA 接口松动、或者硬盘被误拔出。
修复步骤: 1. 静音:先在 控制面板 > 硬件和电源 > 常规 中点击“停止哔声”,让自己冷静下来。 2. 确认故障盘:在 存储管理器 > HDD/SSD 中找到状态异常的硬盘。记录其序列号和位置(Drive 1, Drive 2...)。 3. 数据备份:虽然 RAID 1/5/6 允许坏盘,但此时是单点故障状态,强烈建议先将核心数据备份到外接硬盘或云端,以防重建过程中第二块盘挂掉(RAID 5 噩梦)。 4. 更换硬盘: * 热插拔:如果你的机型支持热插拔(Plus/XS 系列通常支持),直接拔出坏盘,插入新盘(容量必须 >= 旧盘)。 * 非热插拔:关机,更换,开机。 5. 修复存储池: * 进入 存储管理器 > 存储池。 * 点击右上角 ... > 修复。 * 选择新插入的硬盘,确数据会被擦除。 * 系统开始“重组 (Resyncing)”。这个过程可能持续数小时到数天,期间 NAS 性能会下降,但可以使用。
案例 2:系统分区爆满 (System Partition Full)
现象:无法登录 DSM 界面,或者提示“系统空间不足,无法更新”,甚至 Docker 容器全部无法启动。
原因:DSM 的系统分区(通常是 /dev/md0,挂载在 /)只有 2.3GB 左右。如果某个 Docker 容器配置错误,把日志狂写到系统盘,或者某个脚本产生了大量临时文件,就会把系统盘塞满。
排查与清理: 1. SSH 登录:必须通过 SSH 终端操作。 2. 查找大文件:
3. 常见嫌疑人: */var/log:系统日志。 * /usr/syno/synoman:Web 界面相关。 * /root:Root 用户的家目录(新手最爱往这下东西)。 * Docker 覆盖层:如果你在 Docker 映射路径时填错了(没填 /volume1/... 而是填了 /data),数据就会写到系统盘。 4. 清理: * 删除无关文件:rm -rf /root/big_file.zip * 清理 Docker 日志:truncate -s 0 /var/lib/docker/containers/*/*-json.log (需重启 Docker)。 案例 3:Docker 容器无法删除/僵尸容器
现象:在 Container Manager 中删除容器卡住,或者提示“系统繁忙”。SSH 命令 docker rm -f 也删不掉,提示 device or resource busy。
原因:容器的文件系统被某个进程锁死,或者挂载点未释放。
解决方案: 1. 查找挂载点:
2. 手动卸载: 找到对应的挂载路径(通常有一串长 ID),执行: 3. 再次删除: 4. 终极大法:重启 Docker 服务(会中断所有容器):案例 4:循环登录 (Login Loop) 或 2FA 丢失
现象:输入密码后,转圈圈,然后又回到登录界面;或者手机丢了,无法通过两步验证。
原因: * 循环登录:通常是 /tmp 满了,或者 /var/lib/synology 权限错误。 * 2FA 丢失:无法获取验证码。
解决方案: 1. SSH 救急(针对循环登录): * 清理 /tmp:rm -rf /tmp/* * 检查磁盘空间(参考案例 2)。 2. 物理重置 (Mode 1 Reset): * 这是官方留的后门,不会删除数据。 * 找到 NAS 背后的 RESET 小孔。 * 用回形针顶住,直到听到“滴”的一声(约 4 秒),立即松手。 * 效果: * admin 账号密码重置为空。 * admin 账号被启用。 * IP 地址恢复为 DHCP。 * UI 管理端口恢复为 5000/5001。 * 2FA 被禁用。 * 使用 admin (空密码) 登录,重置密码,修改回原来的设置。
案例 5:Btrfs 存储空间“幽灵”占用
现象:删除了几百 GB 文件,但存储空间并没有释放,可用空间依然很少。
原因: * 快照 (Snapshot):你开启了快照功能,删除的文件被快照锁定了。 * 回收站:文件只是进了 #recycle 文件夹。 * 空间回收滞后:Btrfs 需要时间进行元数据清理。
解决方案: 1. 清空回收站:控制面板 > 共享文件夹 > 操作 > 清空所有回收站。 2. 检查快照: * 打开 Snapshot Replication。 * 查看各文件夹的快照列表,删除过期的旧快照。 * 技巧:在“快照”菜单中,点击“计算大小”,可以看到每个快照实际占用了多少空间。 3. 运行空间回收: * 存储管理器 > 存储池 > 全局设置 > 空间回收计划。 * 手动运行一次。