利用人工智能与智能数据提高半导体可靠性

目前芯片行业正在积极地利用人工智能(AI)和数据分析来降低设计和制造复杂设备的难度和总体成本,并提高产量和运营效率。事实上,国际半导体行业协会(SEMI)也预计,其成员可以通过智能数据使用和AI获得超过600亿美元的收入。

然而,实现这一目标需要克服一些长期存在的障碍。智能数据利用目前还处于起步阶段,这主要是由于确保数据安全的挑战、数据处理和分析方面的大量前期投资以及许多其他问题。尽管半导体行业正在采取积极主动的措施,例如相互协作来实施AI / ML(机器学习)和数据分析解决方案,但这些都没有像支持者希望的那样快。

半导体设备厂商Teradyne(泰瑞达)智能制造产品经理、SEMI AI工业咨询委员会成员Eli Roth表示:“这一领域的一个挑战是,数据正在被重视和大量收集。” “人们担心,如果他们提供数据,其他人会将其货币化。第二个挑战是,这些数据模型肯定会弯曲成本曲线,因此它们的开发被视为竞争优势。”

最终目标是实现更智能、成本更低的产量管理、计量和检查方法、测试插入以及对使用中的半导体的长期生命周期监控。但芯片制造商对彻底的数据/IP盗窃、数据泄露以及他们用来获得竞争优势的ML/AI模型的披露表示严重担忧。

Roth说:“他们要求我们对测试人员的数据进行加密。” “但从更大的意义上讲,数据分析试图将前端蚀刻步骤的结果与对已知良好模具的影响联系起来。因此,今天我们专注于测试生产力,比如从预测性维护转向预防性维护,降低耗材成本和能源使用。未来我们将关注信息流、反馈和前馈,以提供设备见解。”

总的来说,该行业正在从强烈依赖模块(例如光刻/蚀刻)优化和基于规则的算法向依赖基于机器学习的算法过渡,以预测整个半导体生态系统中的工艺和产量。

Synopsys高级产品经理Vivek Jain解释道:“过去,你会在晶圆厂内校准设备,确保它在规格范围内运行,通过大量的试错和遗留知识,你会达到产量目标并不断改进。” “但凭借一流的建模能力和晶圆厂工具的数字孪生,我们正在努力有效地改变模式,以更快的工艺过渡到高产量的大批量制造。”

Jain说,实现这一目标的一个关键是同时对缺陷检测数据、设备数据和计量数据进行建模,而不是单独优化单元操作。“如果发生缺陷偏移,您可以自动深入了解并确定导致产量损失的过程根本原因。”

在过去的几年里,ATE制造商在实时计算密集型处理方面投入了大量资金,可以根据需要快速部署后续测试,并通过异常值检测、自适应测试、预测建模和大规模计算能力降低测试成本(见图1)。Advantest(爱德万测试) Cloud Solutions(ACS)副总裁兼总经理Michael Chang表示:“我们正在使用可以比作数字超级高速公路的实时数据基础设施,在此基础上我们建立了分析。”“但因为这是一个开放的体系结构,客户也可以加入第三方分析。这种方法将位于测试平台上的服务器与内置的数据安全和应用程序部署统一起来。”

Fig. 1: Advantest Control Solutions use cases enable quality and yield improvement, preventing field failures, and reducing the cost of test (COT). Source: Advantest

图1:Advantest控制解决方案用例能够提高质量和产量,防止现场故障,并降低测试成本(COT)。来源:Advantest

缩小设计和工艺成本对半导体行业来说并不是什么新鲜事。产量管理系统随着数据分析和学习模型的进步而不断发展,能够更有效地表征缺陷,更好地将工艺工具传感器数据与先进的工艺控制相关联,并将片上监视器和测试仪分析相结合。各方之间的数据共享发生了根本性转变,这推动了对数据安全和加密的需求,以及产量管理、ATE、EDA和芯片制造商之间的分析方法之间的冗余能力。

YMS与计量学

晶圆厂产量管理系统(YMS)的关键功能之一是检测参数或工艺漂移的警告信号,并发送需要采取纠正措施的警报。

DR Yield首席执行官Dieter Rathei表示:“我们可以在系统中摄入的数据越多,即计量数据、工具FDC数据、PCM测试数据、缺陷数据等,就越好。” “我经常被问到,‘我们如何选择应该监控的参数类型?’我们总是建议使用暴力攻击。监控所有参数。比如说,你可能有100个想要监控的关键参数。你正在密切监控这些参数,并有反馈环,但因为它们受到了严格的控制,通常不会发生任何事情,f参数变成了关键参数,因为现在这些都是不受控制的参数。摆脱这种难题的唯一方法是监控一切,”Dieter Rathei说道。

在关联数据源时,工程师们经常提到拥有数字线程的优势。Rathei说:“强大的产量管理算法的可用性意味着YMS可以准确跟踪特定算法筛选出的设备故障数量。”。“这提供了一种跟踪每种算法丢失的设备数量的方法,以及与不同筛选机制相关的产量损失。这一点正受到密切关注,因为质量和成本效率之间总是存在权衡。”

芯片制造商正在采用强大的算法和数据库方法来缩短设计调试过程,目前一个新的过程节点需要12到18个月的时间。在某些情况下,高达50%的失败产品无法追溯到制造业的根本原因,这导致了硬件和软件方面的行业合作伙伴关系,以提高效率。

proteanTecs产品副总裁Tami Shlasky Nachalon表示:“我们发现,提供晶圆平均值或芯片平均视图的传统测试指标对产品来说是不够的,因为它们使调试既低效又昂贵。”。“测试数据需要与片上数据集成,以隔离可靠性和性能问题。我们公司与几家ATE和EDA公司建立了合作伙伴关系,以探索片上性能监视器在与设计、产量和测试系统集成时的好处。

例如,proteanTecs和PDF Solutions合作,通过将模具上的数据源和分析建模与PDF的Exensio分析平台战略性地结合起来,帮助客户揭示设计边缘性或设计过程敏感性,以提高产量、质量、可靠性和上市时间。

Nachalon说:“关键是能够深入到模内功能块。”。“这些是互补的解决方案。我们谈论的是来自具有不同测试数据格式(包括结构化和非结构化数据集)的测试人员的实时数据,这些数据通过分析引擎丰富数据、验证数据并在数据上运行各种算法。除此之外,我们还有可视化功能,用户可以在其中分析产量、仓分布和其他参数统计信息。”

该方法识别推断工艺参数(IPP),其本质上是对揭示设计或工艺裕度的参数的模具级评分。Nachalon解释道:“当模具级IPP分数超过控制极限时,它会提示工艺工程师以某种方式深入研究,以揭示产量损失的原因。”。

潜在缺陷、FA、RMA

随着3D设备结构的不断扩展和引入,该行业的潜在缺陷问题日益严重。这些缺陷包括在晶片探针上不会失败的缺陷,以及封装器件测试或系统级测试。但它们作为现场故障(RMA)而沉淀,这反过来又推动了替代计量和测试方法。

需要更多的数据和正确的数据来表征潜在缺陷的真实来源。Onto Innovation软件产品管理总监Mike McIntyre表示:“我们构建的计量工具依赖于TEMS和SEM的物理标准,在分析和寻找根本原因时,我们缺乏数据。”。

麦金太尔描述了超薄金属互连的情况,这种情况会引起电迁移,并由于工艺边缘性而导致最终的器件故障。“关键是能够连接正确的数据来得出结论,”他说。尽管如此,当涉及到系统性缺陷时,这尤其具有挑战性,因为系统性缺陷需要从零件的故障分析中获得广泛的反馈。

同时,生命周期管理方法寻求连接以前完全不同的数据源。Synopsys的Jain表示:“通过Fab.da,我们正在创建一个端到端的数据连续体,从口罩设计到现场设备性能的制造和监控。”。

其基本思想是减少采样需求和控制成本。这对于任务和安全关键型设计来说尤其成问题,因为对可靠性的需求需要更高的计量采样率和更多的测试插入。

“你需要更高的采样率,尤其是当你正朝着更高的质量要求前进时,例如,在汽车应用中,你需要达到十亿分之一的零件水平,”布鲁克应用和产品管理总监Frank Chen说。“实现这一点的关键方法之一是经常采样,并在过程中更早地采样。建模表明,在某些应用中,使用100%的检测是有意义的,而在其他应用中,即使是30%的采样率也会带来大部分收益。因此,也有权衡。X射线计量可以在连接模具后立即插入,以捕捉模具上发生的与粘合质量有关的情况。“

陈指出,仅通过随机采样,例如晶片凸点,通常不会捕捉到感兴趣的特征,例如局部翘曲。

理想的产量管理策略

那么,理想的收益管理策略到底是什么样子的呢?

Rathei说:“如今,一种理想的产量管理策略被集成到一个完全自动化的工厂中,该工厂从所有工具、所有测试数据、工具历史记录中获取所有数据,将所有数据组合在一个结构化的数据仓库中,并在数据上运行我们所有的异常检测算法,让人们观察软件检测到的发展并采取行动。”。

然而,由于需要热批、分割批、批量监控晶圆和其他物流,半导体制造商可能会低估自己数据的复杂性,并低估在工作晶圆厂和OSAT运营中实施YMS所需的工作量。“我们拥有所有必要的组件,如自动配方上传、批量自动调度、自动数据收集等。但必须注意细节。例如,如果你查看晶片坐标系,分析必须在仓图上捕捉缺陷的确切位置,这与缺陷检查坐标图的位置相关,因为即使有几微米的偏移,缺陷也可能与错误的芯片相关,从而导致错误的致命缺陷标记,因此,在验证这些覆盖层方面需要做大量工作,”Rathei补充道。

然而,经济学始终是个问题。Nordson Test?&inspection的产品线总监Brad Perkins表示:“在许多半成品区,你看不到100%检查的原因是所有权成本没有达到,工具不够快,占地面积太贵。”。“真的,你想知道每个零件的数据,因为这样你就可以更快地捕捉过程漂移。你可以把你的规格限制更严格。你越接近你的控制限制,你的产品就越好,你在现场的长期故障也就越少,因为电参数将更接近理想值。”

例如,考虑一个已经封装和填充不足的电源设备。Perkins说:“故障通常与应力集中器引起的空隙有关,这些空隙将导致热故障或机械故障,这在可靠性测试中表现出来。”。超声波声学成像非常适合在固化前或固化后检测底部填充物中的空隙,因为像焊料这样的高密度材料在成像时会投射出阴影,而气穴或孔隙在成像时则会投射出浅色阴影

这些数据与其他数据相结合,可以帮助及早发现制造厂和包装厂的问题。帕金斯指出:“它已经从偶尔收集数据转变为查看收集的数据,并表示一切都在控制之中。”。“这几乎是在自食其力,提高工艺产量。这就是为什么我们看到采样率和检测要求全面提高的原因。你检测得越多,得到的数据就越多,但需要注意的是,我们今天得到的数据必须得到利用。这不是为了数据而数据,几十年前我们可能就是这样收集的,但她没有时间分析,或者关系太复杂,无法将机器A、材料B、机器C、材料D以及工艺参数和湿度联系在一起。现在,我们能够识别在几件设备上运行标准DoE时从未发现的交互。”

结论

该行业越来越多地寻求ML数据分析,以解决不断缩小的设计和工艺利润率、潜在缺陷,并更快地提高新工艺节点的产量。目前,当EDA、产量管理、计量、检验和测试的数据连接在一起,并将巨大的计算能力用于晶圆厂运营时,合作开始显示出什么是可能的。

随着半导体需求的持续增长,芯片行业有望在未来几年达到1万亿美元。但是永远不会有足够的工程师和技术人员。需要某种形式的人工智能来填补空白,使工程师在提高产品可靠性的同时提高生产力。

Synopsys的Jain表示:“缺乏主题专家,因此数字孪生以及AI和ML的力量肯定会提高工程师更快地获得授权的能力,并实现准确的根本原因分析。”

编辑:芯智讯-林子  来源:semiengineering

0

付费内容

查看我的付费内容