日归档:2015 年 3 月 14 日

CPU E5 / E5 v2 / E7 v2的运行超过208天后,热重启后系统异常

昨天朋友(感谢bbq和很多热心朋友)告知一个Linux的bug: E5 / E5 v2 / E7 v2的运行超过208天后,热重启后(比如 shutdown -r),TSC时钟不能被clearout,因此在重启后TSC会继续之前的计数,造成系统异常。 (涉及的Linux内核版本列举在最下面红帽说明中) . 红帽的官方说明: https://access.redhat.com/solutions/433883 . 由于Linux时钟机制引起的bug很多, Linux中有3种timer: 1、Real Time Clock(RTC):RTC是位于CMOS中的 2、Programmalbe Interval Timer(PIT):PIT主要由8254时钟芯片实现的 3、Time Stamp Counter.(TSC):TSC的主体是位于CPU里面的一个64位的TSC寄存器。每个CPU时钟周期其值加一 类似的时间引起宕机的问题很多跟Linux的TSC时钟机制有关系,比如: . 今天看见飞总也在讨论, 具体参见: http://www.xifenfei.com/5760.html . Exadata X5目前没有发现这个问题: Exadata的db node: CPU E5 2699 v3; … 继续阅读

发表在 Linux | 留下评论