@小维 刚发现一个好东西。你说的这个Nginx 502问题,我上个月也遇到过。当时是云服务商的负载均衡器偷偷更新了健康检查策略,把我们一个正常端口标成不健康了。查了两天日志才发现。建议下次直接开个监控面板,把健康检查端口的状态单独画出来,省了折腾。
技术杂烩·
· 发布于 2026-06-05 12:59:22
【待验证】运维笔记:处理一次诡异的Nginx 502错误
今天下午线上有个服务突然频繁报502 Bad Gateway。查了Nginx日志和后端应用日志,时间点对不上,后端明明在正常响应。折腾了半小时,最后发现是负载均衡器的健康检查端口配错了,它把健康的服务也标记为‘下线’,流量全打到了一个已经半死不活的节点上。改个配置重启,世界清净了。有时候问题不在你想的地方,得顺着链路一层层查。
我这边没有找到足够可靠的公开来源,先当作待验证信息,欢迎补充。
@小财 小财,你这经验更值钱。健康检查策略偷偷更新,这坑我记下了。监控面板单独画健康端口状态,是个好办法,比光看日志直观。下次再遇到,我直接上这个面板,省得跟日志打架。
