群晖 NAS 故障排除记录
上上周办公室一天内连续意外断电三次,之后 NAS 访问就不太正常,无法搜索文件了。
登录到管理后台看了眼,发现提醒索引文件损坏,需要重建。
在这之后开启了将近两周的 NAS 修复的路程,遇到了不少问题,在技术客服的帮助下,现在总算是恢复正常了,记录一下,希望能帮到有相同问题的人。
索引损坏
重新创建索引:
控制面板 - 应用程序 - 索引服务 - 媒体索引 - 重建索引
重建之前还升级了下系统和套件,结果发现升级特别慢。
CPU 占用显示 99%
一开始以为是因为重建索引比较消耗资源,百度了下大家也都这么说,如果复制图片进入要生成缩略图也会出现这个现象。
但是等了几天发现索引建得很慢,CPU 一直居高不下,连升级套件都变得特别卡。
技术同事看了下系统进程,发现有个进程一直不停的重启,把这个进程改名之后 CPU 占用就恢复正常了,但是其他人会无法访问 NAS。
于是我们抱着试试看的态度联系了下 NAS 客服,提交了工单。
操作:
更新了套件
升级到了最新系统
安装了几个用于照片和视频的套件
重启 NAS
现象:
CPU 显示占用 99%
访问 Drive 在线文档特别卡
尝试解决:
查看后台进程,看到 index.cgi 一直在重启
把 index.cgi 改名 sudo mv index.cgi index.cgi.bak
之后 这个就不能被频繁调用,cpu 占用率就降下来了
但是所有账号都无法再访问了
没想到回复的还挺快的。
亲爱的用户 您好,
感谢您的来信。
根据您目前提供的信息我们暂时无法判断准确的原因
1、请问您所说的所有账号都无法再访问,指的是什么?是无法访问DSM吗?
2、请问目前使用synology assistant搜索NAS的状态是什么?正常状态是“已就绪”。
Synology Assistant 下载地址:
Windows:
https://cndl.synology.cn/download/Tools/Assistant/6.2-23733/Windows/synology-assistant-6.2-23733.exe
Mac:
https://cndl.synology.cn/download/Tools/Assistant/6.2-23733/Mac/synology-assistant-6.2-23733.dmg
3、请问您目前使用ssh是否还能登陆NAS?如果可以登陆,请您将系统进行名称还原默认。
4、如果可以进入到系统,请您将目前cpu占用99%时的系统日志提供给我们。
请您依照以下步骤提供系统的日志文件:
[如何提供系统日志]
1.以 admin 帐号登入 DSM。
2.请到「 DSM 主菜单>技术支持中心>技术支持服务」>选择“系统”。
3.然后拉到页面最下方,点击“生成日志”,系统会产生日志文件(debug.dat),下载完成后请附件回复给我们。
4.如果您的日志文件过大无法上传,请将您的日志存放在我们的ftp服务器之中,链接如下,上传时请将您的单号输入您的名字栏中,上传后请通知我们。
https://supfiles.synology.com/sharing/MFRCkkReD
烦请您在上传完成之后告知我们
希望以上信息对您有所帮助,谢谢。
条例很清晰,我还转发给部门同事看了,说可以学习下人家这个回复,因为毕竟我们也是做技术工具开发的嘛~
于是我按照步骤生成了日志发了过去,很快就又收到了回复,我大概摸到了一个规律,就是如果早晨十点之前提工单,当天就能收到回复;如果下午提,可能就要第二天了。
内存条不是原装的
看了日志,NAS 技术工程师发现我们公司的这个设备,内存条和他们提供的默认的不一致,不是原装的,于是建议我们做内存测试。
请使用Synology Assistant来扫描內存,请根据以下步骤来做内存测试的准备。
- 在PC上安装Synology Assistant,您可以在以下链接中下载对应您NAS的Synology Assistant。https://cndl.synology.cn/download/Tools/Assistant/6.2-23733/Windows/synology-assistant-6.2-23733.exe
- 打开Synology Assistant,打开设置,勾选内存测试。
- 右键点击需要测试的设备,选择内存测试。
- 根据提示内容一步步进行,等待提示完成。请至少执行內存检测三次,扫描期间您的DiskStation将会重启。如果内存测试不通过,那么说明是NAS的内存出现了问题,还请您联系经销商进行返修的操作。
Synology Assistant 下载地址:
Windows:
https://cndl.synology.cn/download/Tools/Assistant/6.2-23733/Windows/synology-assistant-6.2-23733.exe
Mac:
https://cndl.synology.cn/download/Tools/Assistant/6.2-23733/Mac/synology-assistant-6.2-23733.dmg
提示:内存检测完成后,请您回复此工单告知我们,同时提供您最新的系统日志,谢谢您的配合。
当初公司的 NAS 是从淘宝店买的,来的时候就不是原装内存,我们也没原装内存可以换的,就那么直接测试的。
而且内存测试特别耗时,差不多要五六个小时才能完成,白天同事们工作又需要用到 NAS,只能下班之后折腾。于是花了好几天才做了两次测试,本来应该做三次,但是后来遇到周末我就没做了。
抱着试试看的态度就把日志又发过去了。
文件系统错误
leaf bad key order 错误,当时我就觉得,终于找到问题了,可以修复了吧!
需要提供非 admin 的管理账号,于是我去后台看了看,设置了一个。
控制面板-用户账号-新增-右键编辑-用户群组-勾选 admin 群组-保存
接着吭哧吭哧的把重要文件备份了一遍,用了好几年,公司的图片、产品原型、软件安装包备份、团建照片,加起来有 1T 多。
大概用了一天半,中间 NAS 不断发出哔声警报,提醒磁盘损毁,要不是看到系统日志知道是技术远程连线在修复,真的以为要坏掉了。
修复后重新设置
亲爱的用户 您好,
感谢您的来信。
文件系统问题我们已经为您修复了,目前文件系统检查已经没有问题,请您后续使用中注意观察,如果有任何问题,请您随时联系我们。
另外,虽然您的内存测试显示通过,但是我们强烈建议您换掉第三方内存,使用NAS原装内存,以避免后续使用再次出现问题,谢谢。
希望以上信息对您有所帮助,谢谢。
终于!但是登录管理后台一看,套件全部停用了,要挨个开启一遍。
而且这些套件还这个依赖那个,跟三角恋似的,一开始启动都很顺利,到了 Synology 应用程序服务的时候,报错了。
您好,感谢。目前查看 CPU 占用已正常。我在尝试启动 Synology 应用程序服务套件的过程中遇到报错提示:启动失败。PostgresSQL is not running
请问如何处理呢?
百度了下看到了类似的问题说是要 SSH 进去启动进程,但是我不会呀!
只好又给技术支持留言说明了下,并且询问如果要买原装内存到底买哪个,官网上的实在太多了。
到了今天早晨,还没等到回复,我就想着是不是可以重启下解决,毕竟电脑进程启动失败都是重启解决的!
于是我就重启了,果然好了!
用户主目录目前已被禁用
打开 Synology Drive 的在线文档,发现我的在线文档都没有显示,Synology Drive Client 提示“用户主目录目前已被禁用”。
百度了下,发现了这个帖子:http://www.ai0916.net/forum.php?mod=viewthread&tid=202683&extra=page%3D1&page=1
按照说明进行操作:控制面板-用户账号-高级设置-下拉到底部 - 勾选“启用家目录服务”
对应的就是 homes 文件夹,终于恢复正常了,撒花~