作为最早在网上连载《光刻机之战》系列和翻译出版ASML传记《光刻巨人》的始作俑者,我近两年一直躲开这个话题。一方面因为深入技术讨论的门槛越来越高,另外一方面实在也怕沸腾派以理服人。
昨天ASML宣布联席总裁温宁克和范登布林克明年4月份退休,让我突然想给过去的一点历史做个小注脚。
看过《光刻巨人》的朋友一定对范登布林克(Martin van den Blink)记忆犹新,他也正是三十年来ASML的技术领路人。
去年范登布林克在接受采访时,曾暗示目前即将出货的High-NA EUV光刻机(NA=0.55)可能是ASML最后一代产品。虽然业界已经开始在讨论Hyper-NA(超NA,即NA>0.7),但老范认为它的成本会恐怖到不可能,大概原因是他能看到这一代产品已经把合作伙伴们逼到极限(注:NA简单地说,是来描述系统可以收集和聚焦多少的光)。
用比EUV更短波长的光(射线)呢?也被否决了。因为波长再降低,反射角调整会导致光损失到难以承受,光路上反射镜如果增大很多倍会导致光刻机变成个难以生产和运输的大怪物。
接下来,我们回顾一下,ASML光刻机是怎样一步步走上“绝路”的。
一
光刻这个词,全名叫Photolithography,简称Lithography或者Litho。Litho原义是一种印刷方法,利用油和水不相容的原理,把文字和空白分开。现代的胶板印刷,也是一模一样的原理:印版搞到滚筒上,滚筒上无图文部分亲水而有图文部分亲油(油墨)。彩色印刷呢,CMYK四种颜色的油墨依次上筒,但显然要保证每次套印一定要对齐。
请记住套印这个词(overlay),也是把光刻机一步一步逼疯的关键之一。光刻里面的overlay,一般也是指不同层的图案对准的精度。印刷机的套印精度大概是0.05mm,据说这样就够骗过人眼了,而最先进的光刻机overlay精度是<1nm,两者差了5万倍。
早期光刻机的原理和印刷确实也是一毛一样的,有图案和没图案的地方通过光敏胶曝光再刻蚀分开,多次曝光要对齐,所以叫对齐机(Aligner),台湾地区干脆叫它曝光机。
但你要真以为印刷就这么简单,那就天真了。印刷机的设计不仅要精细计算印版的吸附表面能,也要考虑水和油墨的表面张力和流变特性,而且印刷速度越快温度越来越高,它们的粘度和厚度又会怎样变化?怎样保证不同颜色不会互相污染?不同纸张对不同油墨的渗透是不是不一样?
我们要解释光刻机的难度,同样需要理解它怎样处理各种印刷的精度和材料及温度特性等问题。
二
光刻机从Aligner到Stepper(步进光刻机),是一次微机电的升级,从一次曝光一整片晶圆到光头在晶圆上一步一步(Step and repeat)移动曝光一个小方块,那时还用的是简单的汞灯。
Stepper升级到Scanner(扫描光刻机),因为激光光源越来越珍贵,光头从方块光场变成一条线扫描(和复印机那一条光原理横扫一样)。Scanner的机械实现技术难度成指数级数的上升,因为这条光需要同步扫描光罩和晶圆。光罩(Reticle)也叫掩模(Mask),似乎光罩更能清晰表示它和晶圆不是贴在一起的。
众所周知,日本由于出色的精密机械和加工能力,在80、90年代各种极其精巧的家电中独占鳌头,比如录音机、摄录像机、Walkman和Diskman等,后来乔布斯为了给第一代iPod装上硬币大小的微硬盘,也得去找东芝。
因此,在Stepper和Scanner的时代,日本尼康和佳能背靠着日本优势的精密仪器产业,加上两家本身在光学上就是世界一流,迅速打垮了美系那些傻大黑粗。
但随着摩尔定律的进展,芯片尺寸越来越小曝光多达几十层,对齐套刻(overlay)的挑战越来越高。日系的精密加工也是有极限的,如同日系消费电子产业从模拟转换到数字后遭受惨败,软件控制是对机械控制的降维打击。现代光刻是Stepper+Scanner+高精测量+计算光刻等一堆的集成,所以叫Lithography System(这大概是现在光刻机最正式的英文)。
我们在之前的文章里反复提到,日系产品的软件设计不可思议地奇怪,比如多年后索尼夏普的彩电遥控器上还是密密麻麻的小按钮。不知道是不是日本文化更重视看得见摸得着的硬件,反正日系的软件基因一直发育不良。
三
网上大家都传,认为浸入式光刻是尼康败于ASML的关键一战,我倒不这么认为。浸入式本身也可算是机械实现,难度不算高,而且尼康也确实很快做出来了。
导致尼康溃败的,应该是ASML的双工台TwinScan。TwinScan的光刻机有超过十亿行代码,有无数的高精传感器和控制器来配合软件做到纳米级的测量和定位。日系一直拿不出可以提前精测的双工台,这导致其机器的生产效率明显不如ASML,而且自然差错率也会更高。
另外一个需要强依赖软件的地方是所谓“计算光刻”。举例来说,由于光刻胶本身物理和化学特性加上光本身的折射衍射,真正胶体的变性图案和模版并不能完全一致,软件建模和校正则成为杀手锏。工业软件的关键就是建模,比如提前算好什么牌子的胶和什么角度的光配合出的线条粗糙度如何,反过来再去重新设计光罩,但显然这需要大量的历史数据和算法库。激光本身也会带来镜片或液体温度的变化,软件计算后可以通过微机械联动进行动态补偿。
四
由于Mate 60系列的原因,最近大家一直在讨论DUV生产7nm芯片,这玩意比现阶段使用EUV其实更复杂:通过增加CVD层spacer实现自对准,四次曝光叠加才能完成第一层,这个overlay的精度需要1nm左右。多重曝光大幅度提高了光刻在总成本中的占比:昂贵的四个光罩加上四次浸没光刻时间成本,而同理瑕疵也会倍增导致良率下降。
记得梁先生在2020年辞职信里提到,3年多完成从28nm到7nm研发的神奇三级跳。这种跳跃并没有设备上的不同,而是来自海峡对岸的工程师们在晶圆厂的know-how上面,做出了奇迹般的传递。
到现在,我们还没开始讨论EUV。
现在大家都已经知道,EUV是一个横跨超过二十年的工程奇幻。那么,ASML究竟做对了什么,可以达成这样一个不可能的任务呢?
这个话题值得写一本书。不过,我们想象一下,如果你是公司的老板,你会怎么做。你会去全世界找各个领域最顶尖的制造商,帮你按你的高标准研发零部件,对吧?
但是,一个机型一年卖几十台,十万个零件,核心部件全是非标定制,每个零件的订货数量少得可怜,供应商愿意么?
所以,不光得讲情怀,你要给足够的钱、足够的研发时间、足够的测试、足够的迭代改进时间…
这大概就是尼康碰到的问题。日系的供应商大多也是日系,如果裙带企业不愿意做,尼康只能降低spec要求。另外不像ASML没有退路背水一战,尼康本身还有相机、医疗仪器等大量其它产品,内部拖沓扯皮也会更容易发生。
其实日本研发人员在1980年代就开始研究EUV,同步加速器产生光源(清华方案的老祖宗)和实验室曝光纳米级线条30多年前就成功了。
五
氙气是后来大家一致认可的产生EUV光的方案,因为相对简单。在2000年前后有大量相关论文,包括英特尔在2004年安装的EUV实验装置也是用氙,尼康也押宝在氙,但最终还是无法解决转换效能低和污染问题。
ASML倒是老早就押宝在锡身上。锡并不是个很好的EUV方案,开始用激光击打固体锡总是产生大量碎片,而且锡片本身会阻挡掉大半宝贵的等离子体。ASML大概做了10年锡EUV,在2010年第一代EUV NXE3100上,可用功率也只有10W。这是什么意思呢?大概一小时只能生产几片晶圆,这种效率不会有人买单的。
同样,光讲情怀搞不定卡脖子的供应商。ASML在2012年走上绝路的标志,就是它把当年早些英特尔、台积电和三星购买其23%股份时承诺的研发投入17亿美元,自己再加了9亿一股脑全用在高溢价收购激光光源供应商Cymer身上了。
工程师们用激光轰击液体锡滴,但锡滴是球型的,激光接触面自然是很小的。为了尽可能达到尽可能高的转换效率,锡滴越小越好,而且最好激光击打到一个凹进去的形状里。这种想法提给工程师以后,很难想象得给他们喝多少鸡血才行。
反正最后的方案是这样的,锡滴一小滴一小滴滴下来,先用低能量激光把锡滴打变形出来凹饼状,再用高能量激光打在凹坑里产生宝贵的EUV。听起来是不是也不算难?问题是,液滴只有30微米大,每秒5万滴以时速近300迈喷出来,然后两枪激光必须每一次都要准确地第一枪打凹,第二枪打在凹坑里:每秒10万枪。这样的高效率,终于使得EUV光刻机的可用功率达到200多W,达到量产上百片晶圆目标。
在2004年ASML、尼康和佳能联合制定的EUV光源目标中,功率只有110W,可见当时大家期望都不高。但今天,ASML已经把目标定在450W了。
六
“我听说ASML对晶圆台启动移动的瞬间光子的浪费都感到可惜,因为EUV射线太宝贵了。为了保证产能,他们必须和时间赛跑,尽可能提高晶圆的移动速度,但台面飞快地加速和减速时,还不能产生一丝震动。”
——《和时间旅行者讨论半导体》
为了尽可能提高曝光效率,晶圆台的移动要越快越好,那么要多快呢?5个g的加速度,同时量测速度是一秒钟2万次,保证晶圆台飞一般地移动到正确的位置。那么问题来了,得配备什么样的传感器才能精准到这种程度呢?
ASML官方说,这些传感器的精度是60皮米,也就是0.06纳米。即使这样,ASML觉得还没做够,他们实现了7个g的晶圆台加速度,这样可以达到15秒处理一片晶圆,而在这15秒内要扫描曝光约100个地方。要知道晶圆台是托着12寸晶圆的大玩意,这么快的移动速度,怎么能不产生振动和热量呢?
ASML之前的TwinScan台是空气悬浮的,这样摩擦阻力可以很小。但随着芯片做到7nm以下,问题又来了,气悬的空气会随着晶圆台高速移动产生扰流,扰流会影响量测干涉仪的精度,这样就难以达到纳米级对准了。
怎么办呢?ASML咬牙把气悬浮改成了磁悬浮,这不就没空气了么,也避免了空气被加热的问题。但说起来容易,磁浮会带来超强磁场,副作用肯定也得解决。
那么,这样就可以了吗?
七
悲催的是,我们还没讨论最重要的光路设计呢。我想大家都看过EUV示意图。
有小伙伴问,既然EUV光线这么宝贵,为什么要反射这么多次?每次要损失近一半的光子呢,按一次50%损失反射6次就只剩2%不到了。
对,即使蔡司制作的这些反射镜是地球上最平整的平面(每个镜子有四五十层硅和钼交替的涂层,还得确保每层的厚度是EUV波长的一半),仍然让EUV光损失惨重。
这里有好多讲究,一个是光不能随意拐弯,为了机器不是巨大塞不进飞机,光路设计要考虑空间。不考虑空间的体育记者手里的大炮相机和考虑空间的手机相机,差别是很大的。较大的入射角也是不行的,会导致更多的相差和损失。
EUV光子需要汇聚成线后先扫过光罩(也是镜子),反射光需要缩小到1/4再扫过晶圆上橡皮大的曝光区(Field),这个缩小过程更需要严格的对焦和光路设计,所以这些镜子并不是平面镜,而是带焦点的缩小镜。
只要是光学器件就会有缺陷,光路设计好则有可能补偿掉其中大部分。
听朋友传谣说,蔡司一开始是不想玩这个游戏的,一年生产几十套这个镜子,能赚几个钱?而且为了生产它们,需要几层楼高的超级真空腔和巨型机械手。更悲催的是做出来稍微有点瑕疵,ASML还不要。
这个谣言也许是真的,因为大约到了2015年ASML启动High-NA EUV项目时(当时Low-NA EUV还远未通过客户验证),蔡司真的准备撂挑子了。当时还不富裕的ASML咬牙花10亿欧元买下蔡司半导体部1/4的股份,再加上承诺未来6年给半导体部拨款7.6亿欧元。
八
High-NA EUV系统已经是ASML能看到的一条绝路了。问题是,周围小伙伴们却认为那也许是一条死路。台积电和英特尔都对手里的ASML股票做了清仓式减持(《台积电等三巨头投资ASML的真相》)。
历史是必须要回看的,身在其中必然无法体会期间的奥秘。
第一台EUV跳票10年,确实是碰到的问题太多了。我们举个小例子:
现在的EUV是一台1.5兆瓦的功率巨兽,激光就像带着火把在森林里放火,每到一处产生的温度变化都不可避免导致器件变形变异,而在高端芯片上是错开1.5nm上下层就对不上了。
我们说过带有芯片图案的母版光罩也是镜子,这玩意大概30万美元一个,高能激光会导致光罩是有寿命的。别的镜子上有点瑕疵还好,大不了丢几个光子,而光罩上的瑕疵则直接导致芯片失效。还有一个问题是,小的杂质颗粒会掉到上面。
原来设计师的思路是,EUV光路是全真空的,根本不用考虑杂质的事。可现实情况是,鬼知道哪里来的肉眼根本看不到的小东西。晶圆厂通常只能在发现缺陷后,停机把光罩摘下来干洗或湿洗,反正是损失巨大。
有人说,不如给光罩贴个膜,发现问题撕了再贴一张不就好了。
这个思路倒是一点都不蠢,居然和工程师想的一样。但什么样的膜才能让宝贵的EUV光线进去再反射回来还没损失呢?要知道EUV打在上面可以升温超过600度呢。要知道玻璃都能吸收EUV我们才改用镜子的,这个膜得足够薄还要有足够的强度来保证平整。
没有光线损失是不可能的,很多厂家参与了挑战但大多最终放弃了。ASML自己做了无数试验最终选了一款50nm厚的多晶硅膜,大概是女士面膜1/50000那么厚,大概可以实现只损失10%的EUV。ASML为了吸引客户,把这个膜做成自动的,自动量测膜上的杂质,再用机械手自动把它遮挡到光罩上。
虽然已经精益求精了,但这10%的光线损失也让晶圆厂肝疼,因为它很可能导致产能降低。而且这膜寿命也就扛一两天而已,所以晶圆厂对于小尺寸光罩有时就不用了。
这件事从一个侧面显示了现在光刻机的悲催之处,就是每一处微小的改进都需要花巨大的代价,这个代价和收益经常是不能匹配的。
九
不知道英特尔当年的CEO和CTO是怎么判断局势的,在10nm百般不顺延误了至少3年的情况下仍不相信EUV是能用的,手握巨额现金却错过了一举扳平台积电7nm的机会。
显然,英特尔的聪明人不会两次在同一个地方绊倒,他们决定比台积电更早使用High-NA EUV光刻机,在1.8nm级别(18A)时反超台积电。
不巧的是,ASML的High-NA跳票了。
虽然多少nm的芯片现在已经完全是营销术语,但晶体管密度的提升并不能作假。英特尔低调地不再宣传18A是用High-NA制造,只能默默用良率不好控制的Low-NA多重曝光来实现。
High-NA理论上并不是像EUV刚上马那时那么困难,所有事情都需要颠覆重做,那它难在哪里呢?
十
为了收集更多的宝贵EUV,对ASML最理想的情况是光罩的面积从6英寸大幅度增大到12英寸(光罩也是个反射镜),这样产能(吞吐量)也会更大。
但晶圆厂、光罩厂、检测设备厂齐齐投了反对票,甚至增大到7英寸都不同意,毕竟他们要为光罩这么个消耗品买单。
但High-NA就意味着更大的反射镜,压力全留给了ASML,然后转嫁给蔡司。据说最后光路中的反射镜有1米多宽,比普通EUV长了一倍。更悲催的是,这样的镜子从普通EUV的40公斤一片陡增到360公斤一片。
如此重而且大的镜子,用怎样的夹具才能保持世界上最平整的表面没有变形呢?
具体我也不知道。但看宣传稿,蔡司是用在巨大的真空室里用巨大的机器人抓着它的。
我们回到光罩这个最复杂的镜子上来,由于面积不许增大,图案分辨率要求入射角也不能增大,就只能采用x和y轴不同缩小倍数的反射镜了(也就是一个轴是哈哈镜),最终到达晶圆的扫描光场是普通EUV的一半大小,这算是达到0.55NA的折中方案。
听起来还好,但这个高精度哈哈镜和做平面镜的难度显然不是一个量级了。更复杂的是扫描光场小了一倍,两个光场怎么才能纳米级拼接呢?辅助的量测系统又要大改。
还有一个大麻烦的是,NA增大后最终光线聚焦的焦深变浅了。光刻胶是一层三维立体的东西,足够的焦深才能使足够厚度的光刻胶吸收光能后变性。光刻胶得重新研发,另外晶圆的平整度要求比以前更高了(否则浅焦深覆盖不了硅片表面起伏),这又涉及到产业链一系列变化。
高NA还要求被挤爆牙膏的激光功率再一次提升,而且打击锡滴的激光从每秒5万滴再增加20%以上。但是,这种超级功率巨兽散发出的各种能量,又是引起整台机器内部温度变形的各种要解决的麻烦。
总之,High-NA EUV并不是普通EUV的简单升级,这玩意儿几乎是照着极限新设计一台,所以一个“升级”又花了十年。悲催的是,Hyper-NA EUV将是同样地每个极限再突破全重来一遍,这就是范登布林克“绝望”的地方。
十一
ASML在过去三十年大概出了五六千台光刻机。令人无比惊讶的是,其中95%的机器仍然在晶圆厂正常工作,其中包括了1800台《光刻巨人》里的传奇老机器PAS5500。在中国也有无数海外流入的二手机器在跑,ASML每年也在翻新和维护大量老机器。
这样的商业模式听起来很奇怪吧?老的不淘汰,新的卖给谁啊?
这就是信息时代的力量。人类信息技术和存储对芯片需求爆炸性的增长,给了光刻机不断成长和发展的空间。
这么看来,ASML显然是时代发展的宠儿。
那么,它的光刻机走上“绝路”,是好事还是坏事呢?