收起左侧

系统监控 CPU 温度告警误报:实际 coretemp 温度正常仍提示 >85℃

2
回复
200
查看
[ 复制链接 ]

2

主题

0

回帖

0

牛值

江湖小虾

2025-12-24 12:35:53 显示全部楼层 阅读模式

日志频繁报错.jpg

设备环境

  • 设备:物理机 NAS
  • 系统:fnOS(基于 Debian 12,内核 6.12.18-trim)
  • 硬件:i5 8600T + 2 块 NVMe
  • 网络:局域网直连(双网口,网络情况与问题无关)

BUG 现象

系统会周期性提示 “检测到 CPU 温度超过 85℃”
但通过 SSH 使用 sensors 查看,CPU 实际温度来源为 coretemp,各核心及 Package 温度始终正常。


排查过程

  1. 使用 lm-sensors 查看 CPU 温度(coretemp):
    • 日常运行正常;
    • 全核压力测试下,CPU 满载最高温度不超过 75℃,且温度稳定不继续上升
  2. 查看系统日志与内核日志(journalctl / dmesg):
    • 无 thermal throttling 或 CPU 过热记录。
  3. 系统中存在 NVMe 设备,其 SMART/Composite 温度阈值接近 90℃,与 85℃告警阈值接近。

结论

CPU 超温告警为误报,并非真实 CPU 过热。
初步判断 fnOS 监控告警逻辑可能读取了 非 CPU 的温度源(如 NVMe 或 ACPI thermal zone),并统一映射为“CPU 温度”,导致错误告警。
建议监控逻辑明确绑定 CPU 温度到 coretemp(Package id 0),或区分不同传感器类型。


日志文件

  • 已按社区要求上传系统诊断日志
  • 另附事件日志导出(包含多次“CPU 温度超过 85℃”告警记录)

联系方式:飞牛fnOS粉丝群657-Max.Yu

日志频繁报错.jpg

压力测试温度正常.png

收藏
送赞
分享

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

215

主题

1万

回帖

0

牛值

管理员

fnOS1.0上线纪念勋章

2025-12-27 17:53:39 显示全部楼层
感谢反馈,麻烦补充一下系统诊断日志

0

主题

3

回帖

0

牛值

江湖小虾

2026-1-5 06:32:40 显示全部楼层
我的天钡wrt max 也一直提示温度高,换到winpe 跑aida64负载测试,cpu温度一直不超75℃,不测试也36-40℃左右
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则