零基础也能上手的服务器监控工具推荐与配置教程
前置准备
开始前,请确认你已经有以下条件:
- 一台运行 Linux 的服务器(以 CentOS 7 或 Ubuntu 20.04 为例)
- SSH 连接工具(如 PuTTY、Termius 或系统自带终端)
- 服务器 root 或 sudo 权限(安装软件时需要)
- 安全组/防火墙已放行对应端口(如 Netdata 默认端口 19999)
如果你是纯新手,建议先使用宝塔面板自带监控,或者选择安装最简单的 Netdata。
下面我会把两种方法都写清楚。
分步操作
方法一:使用宝塔面板内置监控(推荐新手)
如果你已经安装了宝塔面板(官网 bt.cn),监控功能是内置的,无需额外安装。
- 登录宝塔面板后台(IP:8888)
- 左侧菜单点击「监控」
- 在监控页面你可以看到 CPU、内存、磁盘、网络、进程的实时图表
- 点击右上角「设置」可调整数据保存时长(默认7天)
- 建议开启“自动刷新”,页面顶部勾选即可
💡 宝塔监控无需配置,开箱即用。但数据颗粒度较粗,适合入门。
方法二:安装开源监控神器 Netdata(数据更详细)
Netdata 可以在几秒内安装完成,展示所有服务指标的实时仪表盘。
# 使用官方一键安装脚本(适用 CentOS / Ubuntu)
bash <(curl -Ss https://my-netdata.io/kickstart.sh)安装完成后,Netdata 会自动启动并开机自启。
访问:
http://你的服务器IP:19999如果无法访问,检查防火墙是否放行了 19999 端口。
以 CentOS 7 为例:
# 开放端口
firewall-cmd --zone=public --add-port=19999/tcp --permanent
重新加载防火墙
firewall-cmd --reload
现在你应该能看到一个漂亮的实时看板,包含 CPU、内存、磁盘 IO、网络、进程等几十种图表。
方法三:Prometheus + Grafana(进阶但更强大)
如果你后续想搭建更专业的可视化监控,可以组合 Prometheus(采集)+ Grafana(展示)。
这里只给新手一个快速预览:
- 下载 prometheus.yml,配置要监控的目标
- 运行 Prometheus 进程
- 安装 Grafana,添加数据源为 Prometheus
- 导入官方仪表盘模板(如 Node Exporter Full)
新手第一次建议先用 Netdata,熟悉后再尝试这套组合。
避坑指南
1. 端口被占用或防火墙未放行
- Netdata 默认端口 19999,如果被占用,启动时会报错。可以用
systemctl status netdata查看日志,或者修改/etc/netdata/netdata.conf中的端口。 - 云服务器安全组一定要添加对应端口的入站规则,否则外网无法访问。
2. 内存占用过高
- Netdata 默认会采集很多指标,内存占用大约 100MB 左右。低配服务器(1核1G)也可以跑,但如果机器内存紧张,可以关闭部分采集器:
# 编辑 /etc/netdata/netdata.conf
[plugin:apps]
enabled = no
[plugin:cgroups]
enabled = no
- 宝塔面板监控占用较小,但数据保存太多会占用磁盘。建议保留7天即可。
3. 安装失败时
- 如果执行 Netdata 一键安装脚本后报错,可能是网络问题或缺少依赖。可以尝试先安装依赖:
# Ubuntu/Debian
apt update && apt install -y curl
CentOS
yum install -y curl
- 再重新运行安装脚本。如果依然报错,请检查是否启用了 SELinux(可能需要临时关闭
setenforce 0)。
高频问题解答
Q1:Netdata 安全吗?会不会被黑客利用?
Netdata 默认监听所有 IP,但没有密码保护。生产环境一定要加防火墙或使用 Nginx 反向代理加上 HTTP 认证。
最简单的方法是仅在局域网使用,或通过 SSH 隧道访问。
Q2:宝塔面板监控数据不准怎么办?
宝塔监控工具基于 serverStatus 修改,部分指标(如网络流量)与系统命令统计有差异。建议以 htop 或 netstat 命令为准,宝塔监控只作为参考。
Q3:有没有其他免费监控工具?
- Uptime Kuma:专为网站可用性监控设计,界面清爽,配合 Webhook 告警。
- Zabbix:老牌企业级监控,但配置复杂,新手不推荐。
- Prometheus + Grafana 组合:适合有一定基础的用户,灵活度最高。
效果验证
完成安装后,请通过以下方式确认监控工具正常工作:
- 宝塔面板:打开监控页面,查看是否有实时曲线在更新。点击“进程”标签,能看到当前占用 CPU 最高的进程。
- Netdata:浏览器访问
http://你的服务器IP:19999,看到彩色图表且数字不停刷新,说明采集成功。 - 查看服务状态:
systemctl status netdata
如果显示 active (running) 则正常
如果你正在处理服务器监控工具推荐的选型与配置,建议先从宝塔面板或 Netdata 开始,十分钟就能看到效果;
熟悉之后再尝试更复杂的组合。
遇到异常时优先检查防火墙和端口放行,这是新手最容易忽略的地方。