服务器频繁宕机怎么排查？新手也能看懂的六步自救指南

知识分享

2026-06-15 03:40

10 阅读

当你发现网站动不动就打不开、远程连不上服务器，多半是服务器频繁宕机造成的。
别慌，这篇文章会带你用最简单的方法，一步步找出问题所在。
整个过程不需要你懂编程，只要跟着命令和后台操作走就行。

第一步：确认宕机现象并收集基本信息

先确认“服务器频繁宕机”不是网络问题。
试着用电脑或手机 ping 服务器公网 IP：

ping 你的服务器IP -t   # Windows 按 Ctrl+C 停止

如果超时或丢包严重，说明服务器确实挂了。
同时记下宕机的时间点，方便后续对比日志。
如果你用的是宝塔面板，登录面板首页就能看到服务器运行时长，重启后时长会重置。

系统日志会记录宕机前后的异常信息。
登录服务器（或者通过面板的“文件”功能）执行以下命令：

# 查看最近 100 条系统日志（CentOS/Ubuntu 通用）
sudo journalctl -xe -n 100

如果提示 journalctl 不存在，试试：

sudo cat /var/log/messages | tail -100

重点看有没有 Out of memory、oom-killer、Kernel panic、Hardware error 等字样。
比如出现 oom-killer 说明内存耗尽；
出现 Kernel panic 往往是驱动或内核问题。

服务器频繁宕机最常见的原因是资源耗尽。
用命令看看实时负载：

# 查看 CPU 和内存占用（按 q 退出）
top

或者用更友好的 htop（需先安装）查看哪个进程在吃资源。
如果发现 PHP-FPM、MySQL 或某个进程长期占用 100% CPU，立即停掉它，再分析是不是配置不当或被攻击了。

内存告警的判断方法：

free -h

如果 available 内存不足 100MB，并且 swap 使用率很高，说明内存不足。
建议升级配置或优化程序。

磁盘写满同样会导致服务停止。
执行：

df -h

如果 / 根分区使用率超过 90%，立刻清理日志、临时文件或扩容。
另外还要看 inode 是否用完：

df -i

如果 IUsed% 达到 100%，说明小文件太多，即使磁盘没满也写不进去了。
常见原因微信聊天记录、缓存目录、Session 文件残留。

如果你是物理服务器，宕机还可能是硬件故障。
重点检查：

如果你用的是云服务器，跳过这一步，直接提交工单给云厂商。

Q：服务器频繁宕机，但日志里什么都没记录，怎么回事？
A：可能是硬件断电、电源故障或手动重启。检查 /var/log/messages 中重启前后的记录，或者查看 BMC（带外管理）日志。

Q：按照步骤查了一圈，没发现明显异常怎么办？
A：考虑安装监控工具（如 Netdata、Prometheus），记录宕机前的资源曲线。另外检查 crontab 里是否有定时任务在整点或半夜触发大量计算。

避坑提醒：

处理服务器频繁宕机，核心逻辑就是“先看日志，再看资源，后看硬件”。
把上面六步走一遍，80% 的故障都能定位。
如果问题依旧，不要硬扛，该换配置就换配置，该找云厂商就找云厂商。
记住，文档和监控才是长期解决问题的根本。