Linux内核线程死锁或死循环之后如何让系统宕机重启求解答

 我来答

1个回答

#热议# 空调使用不当可能引发哪些疾病？

无法使用QT78
推荐于2017-11-26 · TA获得超过133个赞

知道答主

回答量：143

采纳率：0%

帮助的人：197万

我也去答题访问个人页

关注

展开全部

榛蚯保绻硎螅贾履诤讼叱讨谐鱿炙浪蛘咚姥罚慊岱⑾郑酥仄糁猓忝挥腥魏慰梢宰龅摹Ｕ馐蹦愕氖淙氩黄鹑魏巫饔茫斩耍ú皇侵冈冻痰膕sh工具）只会在那重复的输出类似“BUG: soft lockup - CPU#0 stuck for 67s! [fclustertool:2043]”，更无奈的是你重启之后导致系统挂起的堆栈信息也看不到，你所能做的就是一遍遍的加调试信息，一遍遍的重启机器（这是我的经历，现在想想很傻）。 这种情况你肯定不是第一个遇到的，所以内核肯定会提供处理这种情况的一些机制。但是如何来找到这些机制在哪个地方，或者说根据什么信息去google呢？最有用的就是这句话“BUG: soft lockup - CPU#0 stuck for 67s! [fclustertool:2043]”，因为这句话提供你的信息量很大。首先，这条信息可以输出，说明即使发生死锁或者死循环，还是有代码可以执行。第二，可以通过这个日志信息，找到对应的处理函数，这个函数所在的模块就是用来处理CPU被过度使用时用到的。所以通过这个事情，可以看到内核打印出的只言片语都有可能成为你解决问题的关键，一定要从重视这些信息，从中找出有用的东西。 我经常看的内核版本是官方的2.6.32内核，这个版本中我找到的函数是softlockup_tick()，这个函数在时钟中断的处理函数run_local_timers()中调用。这个函数会首先检查watchdog线程是否被挂起，如果不是watchdog线程，会检查当前占有CPU的线程占有的时间是否超过系统配置的阈值，即softlockup_thresh。如果当前占有CPU的时间过长，则会在系统日志中输出我们上面看到的那条日志。接下来才是最关键的，就是输出模块信息、寄存器信息和堆栈信息，检查softlockup_panic的值是否为1。如果softlockup_panic为1，则调用panic()让内核挂起，输出OOPS信息。代码如下所示： /*

本回答被提问者采纳

已赞过已踩过<

你对这个回答的评价是？
评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

您可能关注的内容

运维要高效，便捷远程linux!

远程linux减少运维人力物力成本，让运维变简单;一键配置LAMP/LNMP，SSL，WEB，FTP.轻松搞定远程linux;

www.bt.cn广告

linux界面-专业开发团队-支持服务器安全检测

宝塔面板支持linux界面保障服务器安全问题，支持服务器安全检测;linux界面提升服务器管理效率，保障服务器安全运行。

www.bt.cn广告

一款颜值和功能都很打的SSH工具

AI解答，让你的疑问得到即时解答AI智能提示，让每一个命令都无需猜测完全自定义布局，满足个性化需求图表化实时监控，清晰掌握系统状态

www.terminal.icu广告

Linux内核线程死锁或死循环之后如何让系统宕机重启求解答

您可能关注的内容

其他类似问题

为你推荐：