CPU真的会老化?具体表现是什么?
展开全文
超详细的学开车步骤一般来说IC老化是四种现象之一:NBTI (negative-bias temperature instability), HCI (hot carrier injection), EM (electron migration) 和TDDB (time-dependent dielectric breakdown)。其中NBTI和HCI主要导致速度的缓慢降低,EM和TDDB主要导致随机的崩溃性失效。
其中EM很好解释,金属导线中的原子被电流带着不知跑到什么地方去。这个效应一会导致导线在缺损处逐渐变细最终断裂,二会导致跑掉的原子在别处堆积生成dendrite,然后dentrite长着长着就长到别的导线上面去了,结果就是线间短路。可以看出两个效应基本一发生就没得挽救了,要对付EM主要靠预防,比如说想法不要造出缺陷来,做线的时候宽一点。但是在设计条件下,正常设计数十亿门,导线如恒河沙数,要保证这个人力有时不及。其它三个效应都是跟MOSFET原理有关。贴个我以前做的报告图示意一下:
本科学过电子学的可以知道,MOSFET原理是一个门极靠静电势控制底下的导电沟道深度,电势高形成深沟道电流就大,电势低沟道消失就不导电了。稍微想深一层就知道这个门极导电底下的沟道也导电,那就必须中间有个绝缘介质把他们分开,否则就变成联通线不是晶体管了。再想深一层就知道这个绝缘介质最简单的做法是把硅氧化做二氧化硅。而行外人一般想不到的是光二氧化硅还不够,工程上二氧化硅和基板硅之间附着很差,必须加入Si-H键把二氧化硅层拴住。所以实际上介质层和硅之间有一层不是纯SiO2是SiOH。问
题由此产生。VLSI等级的微观尺度使得量子效应不能忽略。沟道中流动的电子会因为量子能量涨落随机得到临时能量变成热电子然后跳到不知什么地方去,这叫隧穿效应。随手搜到一个详细解释(隧穿电流_百度百科),对物理学感兴趣的同学可以看看。不感兴趣的同学,想想MOSFET关断状态的漏电流哪来的,为啥是个幂指数函数就知道了。这事没完。前面提到有Si-H键。这个键的特点是容易破,也容易重新恢复。电子一隧穿,有几率把这个键打断,这时候就产生断键和游离氢原子。断键会使得threshold voltage提高,就是说原先0.3V就打开的门,现在需要0.35V才能打开了。这意思是说,同样加1伏电压,原先导通电流相当于0.7V时的情形,现在相当于0.65V时的情形。这就是为什么断键会使芯片变慢,因为导通电流低了,升压就慢。升压一慢,门开关就慢了,最后你的逻辑就慢了。为什么会随时间变慢呢?因为断键是随机发生,需要时间积累。另外,记住我们前面提到Si-H键可以恢复,所以基于断键的老化效应都有恢复模式。对于NBTI来说,你给他加反向电压就会进恢复模式;对于HCI来说,你不要动他就进入恢复模式。但是这两者都不可能长时间发生,所以总的来说,芯片是会逐渐老化的。为什么温度有影响呢?温度表示宏观物体微观粒子平均动能。热了,热电子就多,断键机会就大。一般民用电子产品用上十来年问题不大。汽车电子芯片,十年就差不多了。哪位有朋友开美国车的,可以观察一下。新车一
般很潮,上十年以后基本上就像圣诞树一样了,一开车到处都亮。为什么加压有影响呢?同样的晶体管,供电电压越高偏移电压越高,偏移电压越高氢原子游离越快,等于压制了自发的恢复效应,自然老化就快了。为什么超频有影响呢?因为超频本质上是利用芯片厂商对这个过程无法充分把握而预留的裕量。芯片制造出来会有一个速度测试,然后芯片厂商考虑到典型使用情况,预留一个裕量,话不说太满,免得老化以后芯片达不到。打个比方,300ps芯片标3GHz,即便老化10%也还能达到;但是如果你改时钟当3.3GHz用,那稍微老化一点就达不到了。从用户的角度来看,就是亮不起来。这是为啥会老化。最后再说一下前面提到的TDDB。上文只说Si-H键会断,但是Si-O键其实也会断的,断了以后会形成一个可导电的点。随着使用随机断裂,到一定时间以后断了的Si-O键会形成一个从沟道联通门极的导电旁路,管子就击穿了。这就是TDDB。过去为了速度二氧化硅层越削越薄,这个问题很突出。但是有了High-金属门(HKMG)技术以后可以不再削薄电介质层,这个问题可能就不如想象的那么严重了。延伸阅读:Negative-bias temperature instabilityHot-carrier injection普度大学M. Alam教授的网上课件EE695A: Reliability Physics of Nanoelectronic Transistors。 特别推荐这个,Alam教授不辞劳苦不怕被盗把幻灯片都放上来了还带配音,尤其难得的是把NBTI研究历史都带入教学里面了很有故事感,数理背景hold得住的不妨看一看。