黑盒监控和白盒监控的区别

🧭 一、定义区别

类型	定义	关注点	典型工具
🧱 白盒监控 (White-box Monitoring)	从系统内部获取指标，通过暴露的 metrics 接口或日志来了解系统的运行状态。	程序内部指标，如 QPS、错误率、延迟、内存、CPU、连接数等。	Prometheus + 应用内置 exporter（如 node_exporter、mysqld_exporter、kube-state-metrics）
⚫ 黑盒监控 (Black-box Monitoring)	从系统外部观察服务可用性，就像用户一样测试访问是否正常。	服务可达性、响应时间、状态码、延迟等。	blackbox_exporter、ping、curl、uptime-kuma、Zabbix agentless

场景	白盒监控	黑盒监控
Web服务	采集服务内部 `/metrics` 暴露的 QPS、错误率	定时访问网页 URL，检测 200 状态、延迟、SSL 有效期
数据库	导出连接数、慢查询数、缓存命中率	从外部连接测试 TCP 端口是否可连
Kubernetes	监控 Pod、Node、Controller 内部状态	检测某个 Service 的对外访问是否正常
网络	node_exporter 采集接口带宽	blackbox_exporter 用 ping 测试连通性

在实际生产中，两者通常 配合使用：

比如监控网站 https://example.com：

指标来源	内容	监控类型
`blackbox_exporter`	`probe_success=1`, 响应时间=0.5s	黑盒
`nginx_exporter`	`nginx_http_requests_total`, `nginx_connections_active`	白盒
`node_exporter`	`node_cpu_seconds_total`, `node_load1`	白盒

黑盒告诉你“网站访问是否正常”，
白盒告诉你“为什么不正常”。