作者:Rick Nelson, Test & Measurement World主编

游戏玩家可以尽情倘佯于NVIDIA公司的虚拟世界中。但是对于IC失效,却没有任何的虚拟,他们是失效分析小组必须面临的真实情况。
NVIDIA公司的芯片不仅在炫目的PC游戏——如Doom的背后提供图形支持,而且还帮助NASA(美国国家航空和宇宙航行局)的科学家利用从勇气号和机遇号漫游者发回的数据来重构火星表面的真实三维景象。 NVIDIA公司的1400人中多数人沉浸在虚拟世界中,有点类似于游戏玩家和重构火星表面真实图景的科学家。NVIDIA是一家无半导体生产线的设计公司,有相当多的员工从事软件开发或EDA(电子设计自动化)环境的开发。
然而有一个例外,那就是,公司不得不面对一个真实的世界——失效分析实验室,有一个7人小组致力于从上亿的晶体管中筛选出一个失效晶体管的工作——那个引起单个芯片失效的东西。
Howard Marks利用EmiScope系统从数百万的晶体管器件中寻找失效,他和他的小组可以监测到信号沿内部轨道的传播——甚至可以监测到NVIDIA的最新芯片中2.4GHz的信号穿过PCI快速通道。
NVIDIA公司半导体失效分析实验室的经理Howard Marks说道:“我们是一家无芯片生产线的设计公司,我们致力于研究芯片的工作原理,这些芯片由其它公司制造的,比如TSMC,IBM,UMC,或者是将来我们可能会雇用的其它公司如Chartered和SMIC。” 为此,Marks建立了一个世界级的失效分析实验室,它囊括了半导体行业能用到的全部化学的和电子的设备。他聘用了三位电子工程师,让他们利用自动测试和检测设备来分析失效器件,还聘用了三位反向工程专家,让他们解剖包封的芯片,以便观测详细的内部结构。
的的确确,半导体制造商利用各种技术来构造芯片,而Marks和他的小组采用同样的基本技术——剖封、研磨、等离子刻蚀、剖层和搭接等来分离芯片。进行微细观察时,他们使用JEOL扫描电镜(SEM),它有30万倍的放大倍数,提供能量散射的X射线,它能分辨出是什么元素,从而帮助识别杂质。Marks说:“借助于SEM,我们能精确聚焦于失效点上,观察它为什么发生,然后将此信息反馈到芯片生产线。”
知道要观察哪里 尽管Marks的实验室整齐地排列着了令人震撼的特制用来寻找问题的设备,但是由于单个芯片就有2亿个晶体管,要从中找出特定目标,即使有世界级的手段也需要了解一些线索才能知晓从何处着手。单单使用反向工程技术和一台SEM就试图从一百万(或更多)的晶体管中找出失效的那一个是不太现实的。需要更多的方法才能弄清楚究竟要调查哪一个半导体层,要将SEM聚焦于哪一点,为此,往往需要求助于原始芯片设计师.
Marks说:“实验室对于芯片设计师来说仍然有些神秘(更不用说编写驱动程序和测试程序的员工了)。设计师首次接触实验室都会大吃一惊。当器件有问题时,我们会邀请他们加入进来,他们的第一反映往往是“呵,硅原来是这样啊!”他们整年都在设计这个东西,却对物理执行到底是什么样儿毫无概念。”
设计师对硅的接触,往往发生在从芯片加工厂回来的工程样片不能正常工作的时候。但是,也有另一种情况。由于失效芯片可能是数年前设计的,或者是从应用现场返回的,这时,Marks必须追溯到原始设计者。“通常,他们已经升到管理或行政的职位,他们的反映是‘是我设计的?’,但是一旦我们会唤起他们的记忆,他们就会来协助我们。”
设计者会基于观测结果提出器件失效机理的一些见解。据Marks介绍说,象Synopsys这样的EDA公司,在帮助设计师做反向工程时,自己也会变得越来越好——这种反向工程是从测试向量对自动生成的测试图形的响应中提取失效信息。反向工程能够从特殊的内部扫描链中分离出失效,用物理配置工具得出的相关性能够指示DUT(被测器件)中有关器件的正确位置。
用物理方法在集成电路上找出这样的器件从来就是困难的。Marks报告说,对于2层器件,他可以使用激光打开一条通向顶部金属层的通道,然后插入一根与示波器或其它测量仪器相连的探针来进行电子测量。 然而对于多层情形,这种方法却不再有效。Marks解释说,激光会蒸发掉目标金属。因此他转而以聚焦离子束(FIB)的方式来淀积探针,虽然使用FIB,必须置于真空中的DUT(被测器件)仍然要继续保持与电子激励源的连接——这种激励可能是ATE(自动测试设备),或者是在线测试、一种PC母板或图形卡。
但是,随着芯片复杂程度的增加,他和他的小组需要绕行顶层信号来打通里层。此外,淀积过的探针针尖会增大轨迹电容,从而影响被测信号。Marks和他的小组作了进一步改进,比如,采用有源探测器来改善电容的影响。
不过,更大的复杂度导致小组花费大量时间使用FIB,而且检查大量的器件用于定位和分析失效。为了缩减劳动量,他们求助于光子发射技术,利用科利登(Credence)公司的Optonics EmiScope来监测晶体管开关时发出的光子。
借助于EmiScope,Marks的小组可以监测到信号沿内部轨道的传播-甚至可以监测到NVIDIA的最新芯片中2.4GHz的信号穿过PCI快速通道。如果在信号序列中某一点发现意外的错误的晶体管输出,他们就明白他们已经找到了失效,并且知道将SEM聚焦于何处进而找出原因。
Marks和他的小组将该项技术应用于委托TSMC加工的首批0.13微米芯片,分析漏电的晶体管栅极,以抑制适当的栓锁。Marks介绍说,NVIDIA公司和TSMC公司对直接送往分析实验室现场的后续器件的相同问题进行了分析。
Marks还说到,基于光子发射的失效分析,确实也有某些缺陷。例如,如果将电子探针连接到示波器上,就能观测到象信号上升时间这样的参数。上升时间太长的话,就无法显示诸如阻抗介质的失效。而光子发射系统不允许直接观察上升时间——目标晶体管开关时仅仅能看到发射的光子。另外,光子发射系统也不能探测电压水平。
Marks说,通过测量沿信号序列传输的信号的时序,他能精确推断出上升时间在何处出现问题,然后求助于其它方法。“最终,人们总是要借助于示波器才能了解发生了什么。”一般而言,他对光子发射技术比较满意,甚至使用它对打线过的芯片进行前期分析。
ATE考虑 电子和光子发射失效分析技术需要对DUT(被测器件)实施电气激励。Marks解释说,许多缺陷仅仅出现在现实应用中,因此,必须对连接于母板的DUT或轮流连接到母板的图形卡进行分析(图1)。 作为另一选择,他使用ATE(自动测试设备)系统作为激励源,这样有助于使用引起失效的矢量序列来重复测试DUT(被测器件)。为完成基于ATE的失效分析任务,他寻求NVIDIA的17位测试工程师的帮助。他们在实验室进进出出,需要的时候,我们就逮住他们进行失效分析。
目前,Marks使用安捷伦的Agilent 93000,一个原因是,93000测试仪是最新的测试系统,能紧跟NVIDIA的器件,另一个原因是“安捷伦给了我们一台免费的测试仪” 。他们希望NVIDIA能够吸引芯片厂商来大批订购,因为NVIDIA已经利用免费平台开发了测试程序。“我们每周要推出4百万或5百万个新器件。所有这些都会带来大量的测试需求。” 当被问到他是否希望能永远对NVIDIA的合约制造商指定测试平台时,他回答说:“不,我们与供应商和销售商是工作关系。他们不指挥我们,我们也不指挥他们。”实际上,现在正在努力将某些成熟产品转移到便宜一些的测试平台上。
他还说道:“传统上,新的器件速度越来越快,测试仪也变得越来越快。目前,我们正在关注DFT测试,因为我们正在进行各种内部测试时它突然减慢了测试仪速度。这帮助了我们的供应商,但是却增加了我们的工作量,因为我们必须开发DFT的功能。但是我们也会从中受益,因为我们能进行更深刻的测试,得到更广的测试覆盖。” 因此,可以在他和供应商之间“存在大量的平等交换”。
当被问及他是否担心Credence公司对EmiScope设置陷阱来限制测试选项,而本来Credence测试仪会工作更加高效时,他回答说:“他们知道,没有必要那么做,也知道他们必须与其它测试仪合作。”他列举STIL和OpenStar作为实例,证明测试仪制造商越来越明白他们必须标准化和协同化。最终,他是基于性价比来选择测试仪的,而不在于他是否拥有会编程的工程师。
当被问到他是否希望供应商承担更多的失效分析任务时,他说:“不!因为由于我们的器件内部有各种不同的功能块,没有一个人能懂得它的全部,甚至于一个小组也不能。在台湾的某个人不可能知道检查从何处开始。” 但是,他最终还是找到了一种适当的方法,那就是利用因特网来遥控设备,就象EmiScope那样,因为就算把设备安置在海外也还是可以对它控制。在NVIDIA工作的这段时间里,他有过亲身体验,设计师能够用他本地电脑来操作美国加州失效分析实验室的EmiScope。
从事失效分析的开端 Marks于1988年就职于NVIDIA,他说,“从那时起,一切从零开始,我设计了这个实验室,采购了每一台设备,并且招募了员工。” 来NVIDIA公司之前,他在Cirrus Logic工作,主持失效分析实验室。而在那之前,他工作于Amdahl公司,包括将主机计算机推向市场的各种失效分析处理事项,“马达、框架、半导体、电路板、等等”。在Amdahl之前,他在美国国家半导体(National Semiconductor)从事工艺和产品技术工作。
“当我还是工程学校的学员时,我使用称为IC的小黑箱来从事设计。我想了解它们到底是什么。我们搞到了Intel 打算扔掉的3英寸的扩散炉,把它安装在学校的实验室里。我们开始生产自己的器件。在Amdahl,我对器件内部有了近距离的观察,当时我们在使用Mostek 公司的DRAM,我试作解剖了一个。去掉顶层,去掉两层,去掉三层等,透过显微镜观察并绘出该器件的电路。我做了时序分析,发现了一些时序上错误。我们将DRAM寄回Mostek公司,他们修改了芯片。这就是我的失效分析的开端。”
那次经历从此奠定了他的失效分析的原则,“当你发现了失效器件,不要简单地说‘这是不良品’,就把它扔掉。当你的封装工厂出了错,不要说‘你不行’,就将它从认证供应商清单中删掉,要将这些信息反馈给你的供应商们,让他们改正错误。如果这样,你的努力就会使下一代器件有更好的可靠性,整个行业也会因为你的努力而更加美好。”