当前位置：首页 > 物理技术 > 摄像光波> 用于基于过程参数标记衬底的方法独创技术84103字

用于基于过程参数标记衬底的方法

2021-02-02 00:17:43

用于基于过程参数标记衬底的方法

　　相关申请的交叉引用

　　本申请要求于2018年4月27日提交的美国申请62/663,866和于2018年7月10日提交的EP申请18182594.4的优先权，其全部内容通过引用合并于此。

　　技术领域

　　本公开涉及用于例如半导体器件的生产的衬底的处理。

　　背景技术

　　光刻装置是一种被构造为将期望图案应用到衬底上的机器。光刻装置可以用于例如集成电路(IC)的制造中。光刻装置可以例如将图案形成装置(例如，掩模)的图案(通常也称为“设计布局”或“设计”)投影到设置在衬底(例如，晶片)上的辐射敏感材料(抗蚀剂)层上。

　　为了将图案投影到衬底上，光刻装置可以使用辐射。该辐射的波长决定了可以在衬底上形成的特征的最小尺寸。当前使用的典型波长是大约365nm(i线)、大约248nm、大约193nm和大约13nm。与使用例如波长约为193nm的辐射的光刻装置相比，使用波长在4-20nm(例如，6.7nm或13.5nm)范围内的极紫外(EUV)辐射的光刻装置可以用于在衬底上形成更小的特征。

　　低k1光刻术可以用于处理尺寸小于光刻装置的经典分辨率极限的特征。在这样的过程中，分辨率公式可以表示为CD＝k1×λ/NA，其中λ是所采用的辐射的波长，NA是光刻装置中的投影光学器件的数值孔径，CD是“临界尺寸”(通常是所打印的最小特征尺寸，但在这种情况下为半间距)，k1是经验分辨率因数。通常，k1越小，就越难以在衬底上再现与电路设计者计划的形状和尺寸类似的图案以实现特定电气功能和性能。为了克服这些困难，可以将复杂的微调步骤应用于光刻投影设备和/或设计布局。这些包括例如但不限于数值孔径(NA)的优化、定制的照射方案、一个或多个相移图案形成装置的使用、诸如设计布局中的光学邻近校正(OPC)等设计布局的优化、或通常定义为分辨率增强技术(RET)的其他方法。另外地或替代地，可以使用用于控制光刻装置的稳定性的一个或多个紧密控制环来改善在低k1下的图案的再现。

　　发明内容

　　光刻装置的控制的有效性可以取决于个体衬底的特性。例如，与在通过光刻装置进行处理之前由第二处理工具处理的第二衬底不同，在通过光刻装置进行处理(或制造过程的任何其他过程步骤，在本文中统称为制造过程步骤)之前由第一处理工具处理的第一衬底可以受益于(略)不同的控制参数。

　　典型地，对于衬底，预处理数据是可用的(与在某个关注的制造过程步骤之前执行的制造过程步骤相关联的数据)和后处理数据(与在已经经历关注的制造过程步骤之后在衬底上执行的测量相关联的数据)。期望例如基于预处理数据的知识来控制关注的制造过程，因为这允许控制回路预见预期的后处理结果。但是，该控制通常涉及对预处理信息与后处理信息之间的关系以及关注的过程的控制参数如何影响后处理数据的知识。可能并不总是知道关注的过程的控制设置如何影响后处理数据。例如，在光刻过程中应用的剂量设置可能对与在执行光刻过程之后获取的特征相关联的某个临界尺寸具有可预测的影响，或者可能没有。基于(通常是非常大量的)预处理数据来预测后处理数据的方法的性能较差的问题更大。通常，预处理数据包括太多参数，以至于无法构建将预处理数据链接到后处理数据的可靠模型。

　　机器学习技术可以用于识别对要经历某个过程的衬底的一个或多个特性(例如，重叠、CD、边缘放置误差(EPE)等)处理上下文观察到的影响之间的因果关系模式。然后，这些模式可以用于预测和校正处理后续衬底时的错误。这种系统的一些示例在PCT专利申请公开号WO 2017/060080中有描述。在某些情况下，预处理数据具有有限的关联参数集。例如，当仅将蚀刻室的标识(ID)用作与待处理衬底相关联的预处理数据时，可以很容易地在特定后处理数据簇与预处理数据中包括的参数的值之间建立关系。然而，在更一般的情况下，可以为很多处理工具注册很多预处理参数和与这些参数相关联的潜在值，并且有可能将其用于基于上下文的控制目的。尚不清楚如何对后处理数据进行聚类并且然后将这些簇分配给预处理(例如，上下文)数据中包括的某个参数(值)子空间。将预处理数据分割为较小集合(子集)的可能配置数量实在太大了。

　　提出了通过分析与上下文数据相关联的对象数据来创建一种可靠的方法来对上下文数据进行分割。基于上下文数据中包括的参数(值)的通用性对对象数据进行分组。每个组地处理对象数据以获取代表性对象数据集的一个集，每个集与上下文数据中包括的参数的公共值相关联。该处理可以是例如得出平均对象数据指纹(每个上下文参数)的一个集的求平均操作。可以例如在与经处理的对象数据的多个集相关联的邻接矩阵的频谱域中，进一步分析经处理的对象数据集，以传达与上下文数据相关联的结构。然后，可以使用该结构将上下文数据划分为组(例如，分割上下文数据、标记上下文数据、向上下文数据提供代码等等)。

　　在一个方面，提供了一种分割数据的方法，所述数据与经历制造工艺过程的过程步骤的衬底相关联，该方法包括：在衬底进行过程步骤之前，获取与衬底相关联的第一数据；在衬底进行过程步骤之后，获取与衬底相关联的第二数据的多个集，第二数据的每个集与第一数据的特性的不同值相关联；确定描述第二数据的多个集之间的距离的度量的距离度量；以及基于距离度量的性质对第二数据进行分组。

　　在一个实施例中，公开了一种对数据进行分组的方法，该方法包括：获取与制造过程相关联的上下文数据；获取与上下文数据相关联的对象数据；以及利用频谱聚类方法基于对象数据和上下文数据将上下文数据分组为簇。

　　在本发明的另一方面，提供了一种包括程序指令的计算机程序，该计算机程序当在合适的装置上运行时可操作以执行第一方面的方法。

　　附图说明

　　现在将仅通过示例的方式参考所附的示意图来描述本发明的实施例，在附图中：

　　图1描绘了光刻装置的示意性概图；

　　图2描绘了光刻单元的示意性概图；

　　图3示意性地示出了图1和2的光刻装置和光刻单元与形成例如半导体器件的制造设施的一个或多个其他装置的使用，该设施包括实现制造优化技术的控制装置；

　　图4描绘了根据本发明的实施例的决策树；

　　图5示意性地示出了在图3的制造设施中应用图4所示的决策树的原理的反馈控制器和训练方法；

　　图6描绘了可以用于在图5的方法中定义指纹和校正的场间和场内分量；

　　图7示意性地示出了基于决策树的候选预测模型的交叉验证(CV)；

　　图8示出了如何将交叉验证的结果用于自动或在人工指导下选择要应用于决策树学习的约束条件；

　　图9是根据本发明的实施例的方法的流程图；以及

　　图10是示出图9的方法的最后步骤的光谱图和相关的数据。

　　具体实施方式

　　图1示意性地描绘了光刻装置LA。光刻装置LA包括：照射系统(也称为照射器)IL，其被配置为调节辐射束B(例如，UV辐射、DUV辐射或EUV辐射)；支撑件(例如，掩模台)T，其被构造为支撑图案形成装置(例如，掩模)MA并且连接到第一定位器PM，该第一定位器PM被配置为根据某些参数精确地定位图案形成装置MA；一个或多个衬底支撑件(例如，晶片台)WTa和WTb，其被构造为保持衬底(例如，涂覆有抗蚀剂的晶片)W并且连接到第二定位器PW，该第二定位器PW被配置为根据某些参数来精确地定位衬底支撑件；以及投影系统(例如，折射投影透镜系统)PS，其被配置为将由图案形成装置MA赋予辐射束B的图案投影到衬底W的目标部分C(例如，包括一个或多个管芯)上。

　　在操作中，照射系统IL接收来自辐射源SO的辐射束，例如经由光束传输系统BD。照射系统IL可以包括用于引导、整形和/或控制辐射的各种类型的光学部件，诸如折射、反射、磁性、电磁、静电和/或其他类型的光学部件、或其任何组合。照射器IL可以用于调节辐射束B以使其在图案形成装置MA的平面处在其横截面中具有期望的空间和角度强度分布。

　　本文中使用的术语“投影系统”PS应当广义地解释为涵盖各种类型的投影系统，包括折射、反射、折反射、变形、磁性、电磁和/或静电光学系统、或其任何组合，具体取决于所使用的曝光辐射和/或其他因素，诸如浸没液体的使用或真空的使用。本文中对术语“投影透镜”的任何使用可以被认为与更通用的术语“投影系统”PS同义。

　　光刻装置LA可以是如下类型：其中衬底的至少一部分可以被具有相对较高折射率的液体(例如，水)重叠，以填充投影系统PS与衬底W之间的空间，也称为浸没式光刻。关于浸没技术的更多信息在美国专利号6,952,253中给出，该专利通过引用并入本文。

　　在该示例中的光刻装置LA是所谓的双台型，其具有两个衬底台WTa和WTb以及两个站：曝光站和测量站，衬底台可以在这两个站之间移动。当一个衬底台上的一个衬底在曝光站EXP处曝光时，另一衬底可以在例如测量站MEA或另一位置(未示出)处被装载到另一衬底台上，或者可以在测量站MEA处被处理。具有衬底的衬底台可以位于测量站MEA处，使得可以执行各种准备步骤。准备步骤可以包括使用水平传感器LS来绘制衬底的表面高度的图和/或使用对准传感器AS来测量衬底上的对准标记的位置。对准标记通常以规则的网格图案布置。然而，由于形成标记过程中的不精确性以及由于衬底在其整个处理过程中发生的变形，标记可能偏离理想网格。因此，如果装置LA要在正确的位置高精度地印刷产品特征，则除了测量衬底的位置和取向，对准传感器实际上还可以详细地测量整个衬底区域上的很多标记的位置。对准标记的测量因此可能是耗时的，并且提供两个衬底台实现了装置的生产率的实质性提高。如果位置传感器IF在测量站和曝光站时都不能测量衬底台的位置，则可以提供第二位置传感器，以使得能够在两个站跟踪衬底台的位置。本发明的实施例可以应用于仅具有一个衬底台或具有两个以上衬底台的装置中。

　　除了具有一个或多个衬底支撑件，光刻装置LA可以包括测量平台(未示出)。测量平台被布置为保持传感器和/或清洁装置。传感器可以被布置为测量投影系统PS的性质或辐射束B的性质。测量平台可以容纳多个传感器。清洁装置可以被布置为清洁光刻装置的一部分，例如，投影系统PS的一部分或提供浸没液体的系统的一部分。当衬底支撑件WT远离投影系统PS时，测量平台可以在投影系统PS下方移动。

　　辐射束B入射在被保持在支撑结构(例如，掩模台)MT上的图案形成装置(例如，掩模)MA上，并且由图案形成装置图案化。在穿过图案形成装置MA之后，辐射束B穿过投影系统PS，该投影系统PS将光束聚焦到衬底W的目标部分C上。借助于第二定位器PW和位置传感器IF(例如，干涉仪、线性编码器或电容传感器)，可以准确地移动衬底台WTa/WTb，例如，以便在辐射束B的路径中定位不同的目标部分C。类似地，第一定位器PM和另一位置传感器(其未在图1中明确示出)可以用于相对于辐射束B的路径准确地定位图案形成装置MA，例如在从掩模库中进行机械检索之后或者在扫描期间。通常，支撑结构MT的移动可以借助于形成第一定位器PM的一部分的长行程模块(粗略定位)和短行程模块(精细定位)来实现。类似地，衬底台WTa/WTb的移动可以使用形成第二定位器PW的一部分的长行程模块和短行程模块来实现。在步进器的情况下(与扫描仪相反)，支撑结构MT可以仅连接到短行程致动器，或者可以是固定的。可以使用图案形成装置对准标记M1、M2和衬底对准标记P1、P2来对准图案形成装置MA和衬底W。尽管所示出的衬底对准标记占据专用的目标部分，但是它们可以位于目标部分之间的空间中(这些被称为划道对准标记)。类似地，在图案形成装置MA上提供有一个以上的管芯的情况下，图案形成装置对准标记可以位于管芯之间。

　　该装置还包括光刻装置控制单元LACU，LACU控制光刻装置(诸如所描述的那些)的各种致动器和传感器的所有运动和测量。控制单元LACU还包括信号处理和数据处理能力，以实现与装置的操作有关的所需计算。在实践中，控制单元LACU将被实现为由很多子单元的系统，每个子单元处理该装置中的子系统或部件的实时数据采集、处理和控制。例如，一个处理子系统可以专用于衬底定位器PW的伺服控制。分开的单元甚至可以处理粗致动器和精致动器或不同的轴线。另一单元可能专用于读取位置传感器IF。装置的总体控制可以由中央处理单元控制，该中央处理单元与这些子系统处理单元、操作者以及光刻制造过程中所涉及的其他装置通信。

　　如图2所示，光刻装置LA可以形成光刻单元LC的一部分，该光刻单元LC有时也称为光刻单元或(光刻)簇，其通常还包括用于在衬底W上执行曝光前和曝光后过程的装置。通常，这些装置包括用于沉积抗蚀剂层的一个或多个旋涂机SC、用于使曝光的抗蚀剂显影的一个或多个显影剂DE、一个或多个冷却板CH、和一个或多个烘烤板BK，烘烤板BK例如用于调节衬底W的温度例如以用于调节抗蚀剂层中的溶剂。衬底处理机或机械手RO从输入/输出端口I/O1、I/O2拾取衬底W，在不同的处理装置之间移动衬底W，并且将衬底W输送到光刻装置LA的装载台LB。光刻单元中的器件(通常也统称为轨道)通常受轨道控制单元TCU的控制，轨道控制单元TCU本身可以由监督控制系统SCS控制，SCS也可以控制光刻装置LA，例如经由光刻控制单元LACU。

　　为了使光刻装置LA曝光的衬底W正确且一致地曝光，期望检查衬底以测量图案化结构的性质，诸如后续层之间的重叠误差、线宽、临界尺寸(CD)等。为此，可以在光刻单元LC中包括一个或多个检查工具(未示出)。如果检测到错误，则例如可以对随后的衬底的曝光或要在衬底W上执行的其他过程步骤进行调节，尤其是在检查要在仍要曝光或处理同一批次或同一批的其他衬底W之前进行的情况下。

　　检查装置MET(其也可以被称为量测装置或量测工具)用于确定衬底W的一个或多个性质，尤其是确定不同衬底W的一个或多个性质如何变化或与同一衬底W的不同层相关联的一个或多个性质如何随层变化。检查装置可以被构造为识别衬底W上的缺陷，并且可以例如是光刻单元LC的一部分，或者可以被集成到光刻装置LA中，或者甚至可以是独立装置。检查装置可以在潜像(在曝光之后抗蚀剂层中的图像)上，或在半潜像(在曝光后烘烤步骤之后抗蚀剂层中的图像)上，或在已显影的抗蚀剂图像上(其中已经除去抗蚀剂的曝光或未曝光部分)，或甚至在蚀刻图像上(在诸如蚀刻等图案转移步骤之后)，测量一个或多个性质。

　　图3示出了在用于例如半导体产品的工业制造设施的上下文中的光刻装置LA和光刻单元LC。在光刻装置(或简称为“光刻工具”200)内，测量站MEA在202处示出，曝光站EXP在204处示出。控制单元LACU在206处示出。如上所述，光刻工具200形成“光刻单元”或“光刻簇”的一部分，“光刻单元”或“光刻簇”还包括涂覆装置SC 208，涂覆装置SC 208用于将光致抗蚀剂和/或一种或多种其他涂层施加到衬底W上以通过装置200进行图案化。在装置200的输出侧设置有烘烤装置BK 210和显影装置DE 212，以将曝光的图案显影为物理抗蚀剂图案。为了清楚起见，省略了图3所示的其他部件。

　　一旦图案已经被应用并且显影，就将图案化的衬底220转移到诸如222、224、226所示的其他处理装置。在典型的制造设施中，各种过程步骤由各种装置实现。出于示例的原因，该实施例中的装置222是蚀刻站，并且装置224执行蚀刻后退火步骤。其他物理和/或化学过程步骤在另外的装置226等中应用。制作真实器件可能需要进行多种类型的操作，诸如材料沉积、表面材料特性改性(氧化、掺杂、离子注入等)、化学机械抛光(CMP)等。实际上，装置226可以表示在一个或多个装置中执行的一系列不同的过程步骤。

　　所描述的包括一系列图案化过程步骤的半导体制造过程仅是可以在其中应用本文中公开的技术的工业过程的一个示例。半导体制造过程包括一系列图案化步骤。每个图案化过程步骤包括图案化操作(例如，光刻图案化操作)、以及很多其他化学和/或物理操作。

　　半导体器件的制造涉及这种处理的很多重复，以在衬底上逐层建立具有适当材料和图案的器件结构。例如，现代器件制造过程可以包括40或50个单个的图案化步骤。因此，到达光刻簇的衬底230可以是新制备的衬底，或者它们可以是先前已经在该簇232或在另一装置中整个被处理过的衬底。类似地，取决于所需要的处理，离开装置226上的衬底可以被返回以在同一光刻簇(诸如衬底232)中进行后续图案化操作，它们可以被指定用于在另一簇中进行图案化操作(诸如衬底234)，或者它们可以是待切割和包装的成品(诸如衬底234)。

　　产品结构的每一层通常涉及一组不同的过程步骤，并且在每一层处使用的装置的类型可以完全不同。此外，即使在装置要应用的过程步骤名义上相同的情况下，在大型设施中，可能会有数个假定相同的机器并行工作以在不同衬底上执行处理。这些机器之间的设置或故障方面的细微差异可能表示它们以不同的方式影响不同的衬底。甚至对于每个层来说相对通用的步骤(诸如蚀刻(装置222))也可以由名义上相同但并行工作以最大化产量的几个蚀刻装置来实现。并行处理也可以在较大装置内的不同腔室中执行。此外，实际上，根据要蚀刻的材料的细节以及诸如例如各向异性蚀刻等特殊要求，不同层通常涉及例如化学蚀刻、等离子蚀刻等不同蚀刻过程。

　　如前所述，在前和/或后续过程可以在其他光刻装置中执行，并且甚至可以在不同类型的光刻装置中执行。例如，在装置制造过程中在例如分辨率和/或重叠方面非常苛刻的一个或多个层与较不那么苛刻的一个或多个其他层相比可以在更先进的光刻工具中执行。因此，一个或多个层可以在浸没式光刻工具中曝光，而一个或多个其他层可以在“干”工具中曝光。一个或多个层可以在工作于DUV波长的工具中曝光，而一个或多个其他层可以使用EUV波长辐射进行曝光。

　　在图3中还示出了量测装置(MET)240，MET 240被提供用于在制造过程中的期望阶段进行产品参数的测量。现代光刻制造设施中的量测站的常见示例是散射仪，例如角度分辨散射仪或光谱散射仪，并且可以将其用于在装置220中的蚀刻之前在220处测量已显影衬底的一个或多个性质。例如，使用量测装置240，可以确定诸如重叠或临界尺寸(CD)等性能参数不满足已显影抗蚀剂中的指定精度要求。在蚀刻步骤之前，有机会剥离已显影抗蚀剂并且通过光刻簇对一个或多个衬底220进行重新处理。此外，通过随时间进行细微调节，可以将来自装置240的量测结果用于维持光刻簇中的图案化操作的准确性能，从而降低或最小化产品不合格和要求重做的风险。当然，量测装置240和/或一个或多个其他量测装置(未示出)可以应用于测量已处理的衬底232、234和/或进入的衬底230的一个或多个性质。

　　通常，光刻装置LA中的图案化过程是涉及在衬底W上进行结构的尺寸标注和布置的高精度的处理中最重要的步骤之一。为了帮助确保这种高精度，可以在图3中示意性地示出的控制环境中将三个系统组合在一起。这些系统之一是光刻工具200，该光刻工具200(虚拟地)连接到量测装置240(第二系统)和计算机系统CL 250(第三系统)。这种环境的期望是优化或改善这三个系统之间的协作，以增强总体上所谓的“过程窗口”并且提供一个或多个紧密控制环，以帮助确保由光刻装置LA执行的图案保持在过程窗口内。过程窗口定义了多个过程参数(例如，从剂量、聚焦、重叠等中选择的两个或更多个)的值范围，在该范围内，特定制造过程会产生定义的结果(例如，功能半导体器件)，通常是允许在光刻过程或图案化过程中改变过程参数的值，同时产生适当结构(例如，在可接受的CD范围(诸如标称CD的±10％)方面指定的)的范围。

　　计算机系统CL可以使用要图案化的设计布局(的一部分)来预测要使用的一种或多种分辨率增强技术，并且执行计算光刻模拟和计算以确定哪些图案形成装置布局和光刻装置设置可以实现图案化过程的最大总体过程窗口(在图3中由第一刻度盘SC1中的双箭头表示)。通常，分辨率增强技术被布置为匹配光刻装置LA的图案化可能性。计算机系统CL还可以用于检测光刻装置LA当前正在过程窗口内的哪个位置(例如，使用来自量测工具MET的输入)操作，以预测是否由于例如次最佳处理而可能存在缺陷(在图3中由第二刻度盘SC2中指向“0”的箭头表示)。

　　量测工具MET可以向计算机系统CL提供输入以实现精确的仿真和预测，并且可以向光刻装置LA提供反馈以识别可能的漂移，例如，光刻装置LA的校准状态的漂移(在图3中由第三刻度盘SC3中的多个箭头表示)。

　　计算机系统250基于以下两者的组合来实现一种反馈控制形式：(i)在衬底给定处理步骤(例如，光刻步骤)中被处理之前的与衬底相关联的第一数据或“预处理数据”，以及ii)在衬底已经被处理之后与衬底相关联的第二数据或“后处理数据”。作为预处理数据的示例，计算机系统250可以访问上下文数据CDAT。该上下文数据可以是并非从产品本身获取的数据，而是表示多个个体产品单元(晶片或其他衬底)或成批产品单元的全部或部分加工历史的数据。作为预处理数据的示例，历史性能数据PDAT在图3中示出，历史性能数据PDAT可以包括例如由量测装置240进行的重叠和/或CD测量、以及与个体衬底相关联的上下文数据CDAT。因此，计算机系统250可以访问历史性能数据PDAT，并且该历史数据存储在存储器252中。整个图中的箭头254示出了上下文数据如何来自任何装置。上下文数据也可以随新衬底230一起到达。例如，上下文数据可以记录已经应用了哪些类型的过程步骤、在执行这些步骤时使用了哪些个体装置、以及这些装置应用了哪些参数(例如，在蚀刻装置222中的温度或压力的设置、或者在光刻工具200中的诸如照射模式、对准配方等参数)。上下文数据存储在存储装置256中以供计算机系统250使用。

　　性能数据PDAT可以被视为在本文中公开的技术的一些实施例中使用的对象数据的示例。预处理数据的其他示例可以包括对象数据ODAT，该对象数据ODAT是在处理执行之前或执行过程中(直接或间接)从在产品单元上进行的测量得出的。图3示出了可选地收集并且存储在数据库260中的该对象数据。这种对象数据可以是在产品单元本身上测量的数据，或者是在工业过程中涉及的其他部件上测量的数据。作为一个示例，存储在数据库260中的对象数据可以包括由光刻装置200使用测量站202中的对准传感器AS异常规方式获取的对准数据。由于表示衬底的XY平面中的标记的位置的详细测量的这个数据是作为正常图案化操作的一部分而固有地获取的，所以通过指示控制单元LACU 206将数据存储在对象数据存储装置260中几乎没有或没有损失。替代或除了对准数据，对象数据可以包括使用水平传感器LS获取的高度数据、和/或来自对准传感器AS等的“晶片质量”信号。在其他实施例中，对象数据可以包括在系统中的其他地方而不是在产品单元本身上测量的数据。这样的对象数据的示例可以是使用图1的光刻装置的一个或多个衬底支撑件中的图案形成装置对准标记M1、M2和/或一个或多个传感器而获取的图案形成装置(掩模或掩模版)对准数据。

　　如在本说明书中使用的术语“对象数据”可以包括用于历史产品单元或要处理的新产品单元的可以在制造设施中收集的各种数据。如本文中使用的“对象数据”可以包括性能数据PDAT(在处理之后从已处理的产品单元测量并且存储在存储装置252中)和其他类型的对象数据ODAT(在处理之前和/或期间从产品单元或其他系统测量的并且存储在存储装置260中)。根据上下文，该对象数据可以是“预处理数据”或“后处理数据”。在特定处理步骤之前收集的对象数据(包括例如对准数据或紧接在衬底曝光之前测量的高度数据)可以被视为本文所述形式的预处理数据。相对于先前的处理步骤，相同的对象数据可以被认为是性能数据，即后处理数据。例如，对准标记可以包含先前的蚀刻或抛光步骤的指纹。因此，在一些实施例中，一条对象数据可以在一个处理步骤的控制循环中用作后处理数据(历史性能数据)，并且可以在后续过程步骤的控制循环中用作预处理数据(类似于上下文数据)。

　　尽管图3示出了用于每个上下文数据、性能数据和其他对象数据的单独的存储装置252、256、260，但是应当理解，这些不同类型的数据可以存储在一个公共存储单元中，或者可以分布在大量存储单元上，在需要时可以从这些存储单元中检索特定数据项。此外，尽管上下文数据254被示出为源自个体装置222、224等，但是该数据可以通过中央控制系统来收集，该中央控制系统整体上控制光刻单元和/或制造工厂的操作。

　　对象数据、上下文数据和性能数据存储装置中的每个记录都用唯一的标识符标记。注意，个体衬底可能在制造过程中反复通过相同的光刻工具，或者可能通过均测量相同标记的不同工具，因此可以在制造的不同阶段收集同一产品单元的数据。这些测量实例中的每个都可以在分析中被视为独立的产品单元。但是，如果在复杂的制造过程中在不同阶段测量同一衬底的多个实例，则对象数据将包括标识符，该标识符不仅唯一地标识个体衬底，而且还唯一地识别已经测量该衬底的处理阶段。通常，在光刻过程中，同一衬底的不同实例将与图案化器件结构的连续层相关联。

　　相对较新的技术领域是机器学习领域。如今，与该技术有关的方法用于基于对所获取数据(测量和上下文数据)中存在的模式的识别来改进过程参数的预测。另外，机器学习技术可以有助于指导用户选择对过程控制最有用的数据。

　　由于(半导体)制造过程涉及多个处理装置(光刻装置、一个或多个蚀刻站等)，因此整体上优化该过程可能是有益的，例如，考虑与个体处理装置相关联的特定校正能力。这导致如下观点：第一处理装置的控制可以(部分地)基于第二处理装置的一个或多个已知的控制性质。这种策略通常称为协同优化。这种策略的示例是光刻装置和图案形成装置和/或光刻装置和蚀刻站的密度分布的联合优化。有关协同优化的更多信息可以在PCT专利申请公开号WO 2017/067748和WO 2017/144343中找到，其通过引用整体并入本文。

　　在某些过程控制情况下，控制目标可以是例如“规格管芯数”—通常是由产量驱动的过程控制参数，以获取每批次已处理衬底的最大数量的功能产品(通常，产品与衬底上的管芯相关联，因此，通常将基于产量的过程控制称为基于“规格管芯”标准)。为了获取良好的基于产量的过程控制，用于量测测量的采样方案可以受益于在被期望是对产量最关键的位置处或位置上或位置附近执行的测量，和/或可以在统计上最相关的以确定产量是否受到影响。除了测量产品特征的一个或多个性质，还可以测量缺陷的发生，以为了最佳产量进一步帮助优化过程(参考缺陷检查)。有关基于产量的控制的更多信息可以在欧洲专利申请号EP16195819.4中找到，其通过引用整体并入本文。

　　如所讨论的，上下文数据可以用于过程控制的目的。可以利用机器学习技术来识别上下文数据中的图案，并且随后将它们与对要进行处理的衬底的一个或多个特性(例如，重叠、CD、边缘放置误差(EPE)等)的预期影响相关联。已知方法取决于诸如重叠数据、CD数据或成品率数据等历史后处理数据的可用性，这些数据是在一大堆已处理衬底上测得的，这些已处理衬底的预处理(上下文)数据(在经历特定关注的过程之前与衬底相关联的数据)也可用。为了关联这两类数据，通常基于众所周知的方法(诸如k均值和/或PCA分析)对后处理数据进行聚类。随后，建立后处理数据簇和预处理数据之间的关系以便制定一模型，该模型能够纯粹基于其相关联的预处理数据，将待处理衬底分配给后处理数据的某些预期特性。这种系统的示例在PCT专利申请公开号WO 2017/060080中有描述，其通过引用整体并入本文。

　　在一些情况下，预处理数据具有有限的关联参数集。例如，当仅记录蚀刻室的ID以表征与待处理衬底相关联的预处理数据时。在这种情况下，通常很容易在与后处理数据的某个簇有关的衬底簇与预处理数据内包括的参数的值之间建立关系。在一个示例中，可以将与某种类型的重叠数据(指纹)相关联的特定衬底簇分配给蚀刻室ID的值，例如，可以将与通过腔室2进行的在先处理相关联的衬底例如链接到径向重叠指纹。而将与通过腔室5进行的在先处理相关联的衬底可以例如链接到鞍形重叠指纹。因此，当已知待处理衬底已经通过蚀刻室5时，可以通过对该过程(例如，对光过程)进行适当的重叠校正来调节过程(控制)以补偿鞍形重叠指纹。

　　然而，通常，预处理数据通常包括很多参数。在现代的半导体制造设施中(通常简称为“fab”或“晶片fab”)，很多参数和与这些参数相关联的潜在值可以被注册以用于很多处理工具，并且可以潜在地用于基于上下文的控制目的。在这种情况下，如何采用前述方法对后处理数据进行聚类并且随后将这些簇分配给预处理(例如，上下文)数据中包括的某个参数(值)子空间不太明显了。将预处理数据分割为较小集合(子集)的可能配置的数目实在太大了。

　　本公开提出了对包括大量相关参数的预处理数据的很多集采用不同的方法。具有与衬底的集相关联的预处理数据和后处理数据，部署决策树算法，例如递归决策树算法。有效地，通过应用多个分割规则以分割由预处理数据的参数定义的参数空间，递归决策树算法搜索将衬底分割为子集的很多配置。分割规则基本上是将数据集分割为子集的方法。例如，分割规则可以是用于将预处理数据集化分为两个子集的决策；一个子集的参数“蚀刻室”等于“A”，另一子集的蚀刻室不同于“A”(不是A)。当然，可以定义更复杂的分割规则，其中涉及多个参数、数学运算和/或参数检查。参数可以包括“分类”参数(例如，是否抛光；是否腔室A)或连续可变参数。在后一种情况下，可以根据参数是否具有在来自一组非重叠数值间隔的数值间隔内的值来对数据集进行分割。在利用递归决策树算法的情况下，在一系列决策步骤或节点处的分割规则定义了决策。

　　递归决策树算法的目标是，最终获取的决策树的每个步骤(分支点)将预处理数据参数空间划分为两个子空间，并且从而将其关联的衬底集合划分为两个或更多个子集(组)，其特征在于，至少衬底的集从其相关的后处理数据来看展示一定的(通常是期望的)特性。以这种方式，预处理数据空间的子集链接到后处理数据的某个特性。然后，有效地，一下子解决了找到衬底的最佳分组(聚类)并且预测后处理数据的哪些特征组与每个衬底组相关联(纯粹基于预处理数据)的问题。然后，与期望的预处理数据分割相关联的分割规则用作用于对衬底进行分组并且向每组衬底分配其后处理数据的相关特性的手段。

　　图4描绘了该原理的实施例。在该简化示例中，可以从与一个或多个待处理衬底的预处理历史相关联的上下文数据中确定重叠系数。应当理解，重叠仅仅是光刻制造过程的性能参数的一个示例，并且类似的方法可以应用于处理其他性能参数，例如CD。在402处示意性地表示了衬底的集。预处理数据404包括上下文数据，例如与在什么工具中、在工具的什么腔室中(如果该工具具有多个腔室，例如蚀刻机)和/或在工具的哪个槽中处理哪个衬底(晶片)有关的信息。决策树算法(在所示示例中为决策列表)包括决策步骤410、412、414，其形成决策树的节点。每个决策步骤基于预处理数据402中参数的值来应用节点分割规则。决策列表是递归决策树的示例，这表示，可以在多于一个的决策步骤中检查相同的参数。通过基于预处理数据运行递归二元决策树算法，将由预处理数据定义的参数空间划分为四个子空间。借助于训练(下面进一步描述)，这些子空间中的每个与后处理数据的某种特性(在这种情况下为衬底上的重叠数据)相关联。对于具有预处理数据404的衬底的集402，参数空间的分割具有定义任何给定的衬底的集的子集的效果。因此，衬底的集402被划分为在图4中标记为G1至G4的子集，每个子集与具有符合所应用的分割规则的相关预处理数据的衬底有关。注意，每个节点可以具有分割规则，并且结果树也可以称为定义分割规则，这是节点分割规则的综合效果。如本文中提及的，“分割规则的选择”是指决策树的选择，其可以是单节点分割规则，但是更可能是形成更大的决策树的一系列节点。

　　在步骤420中，使用决策树将每个衬底分配给特定子集或“容器”G1至G4。由此，在步骤422中，使用在衬底的训练组的相应子集中观察到的后处理数据的特征来定义指纹，该指纹被输出作为对过程步骤的校正。这个校正对每个子集G1-G4是特定的，子集G1-G4如图4所示，并且标记为COR1至COR4。因此，在处理该衬底的集时，光刻工具LA可以由计算机系统CL控制以应用这些校正，并且相对于训练组改善制造过程的重叠性能。

　　对于基于预处理数据的决策树，其参数表示蚀刻室等中的步骤，将期望场间指纹和校正，并且这在图4中示意性地示出。在其他实施例中，一些或全部节点分割规则可以与跟场内指纹相关联的参数有关，并且可以生成场内校正。

　　图5是基于图4所示的原理的由计算机系统CL实现的方法的流程图，该方法用于基于衬底的训练集502训练决策树并且然后应用该训练以在后续衬底的处理中应用校正。图3的制造设施中在该方法中起作用的元件的相应地标记。

　　在图5的底部示出了反馈控制器500，该反馈控制器500在计算机系统CL内和/或在光刻装置控制单元LACU(图1-3)内实施。衬底的集402将通过光刻工具200进行处理。反馈控制器500存储定义用于处理预处理数据CTX的参数的参数空间的决策树的分割规则506，并且存储由决策树定义的参数空间的不同子空间的过程校正508。在通过光刻工具LA处理每个衬底之前，控制器500使用与当前衬底相关联的预处理数据为当前衬底选择适当的过程校正PC。在控制系统允许的情况下，可以选择过程校正，并在整个衬底基础上应用过程校正，如果需要，可以按批次应用过程校正。

　　现在参考图5的上部，在训练阶段，递归二叉树决策树算法基于衬底502的训练集的预处理数据256和后处理数据252搜索由预处理数据定义的参数空间。更具体地，机器学习方法可以用于迭代搜索在预处理数据的参数空间内操作的适当决策树，从而可用于将衬底分割为子集，每个子集希望具有例如预期的后处理特性(诸如重叠、CD、焦点、EPE等)的最小变化。根据上下文数据的格式，可以使用机器学习算法(诸如ID3、C4.5、CART、C5.0、CHAID、QUEST、CURISE等)找到用于分割未来的衬底的适当的(或理想地：最佳)决策树。

　　图5在步骤510到516中示意性地示出了该训练过程。应当理解，这些步骤可以根据所选择的算法和所选择的实施方式以不同的方式执行。如循环路径518所示，可以部分地并且迭代地执行这些步骤。概念上，在步骤510中，生成多个候选决策树512，以便以不同方式分割参数空间。对于每个候选决策树，可以计算对应的指纹集合514，并且基于这些指纹或等效数据，可以在不同模型之间判断性能预测的质量。然后选择分割规则的“最佳”集并且将其作为分割规则506存储在反馈控制器500中。将校正COR1-CORn的对应的集作为校正508存储在反馈控制器500中。

　　参考图6，应当理解，可以以任何合适的形式来表示指纹，这既是为了找到最佳决策树，也是为了表示得到的校正。图6示出了可以以加权方式组合以定义各种场间和/或场内指纹的指纹分量的集。然后可以将每个指纹或校正COR1-CORn表示为用于对这些分量指纹进行加权的一组系数。对于场间变化，可以例如通过泽尔尼克多项式来定义分量602。对于场内变化，示出了九个不同的分量，如标记为604的分量。这些场内分量仅在图6的比例上示意性地表示，并且图6展示了低采样分辨率的伪像。本领的读者将理解这一点，并且还将能够设想用于对指纹建模的其他示例方案。

　　一旦建立了决策树，就可以将其用于分割新的衬底402的集，如所描述的。通常，该新的衬底的集不是用于使用递归决策树算法确定决策树的衬底的集502的一部分。然而，如断开的数据路径520和522所示，可以将来自新处理的衬底的预处理数据和/或后处理数据添加到数据库252、256、260，然后重复步骤510至518以在连续、规则或不规则的基础上更新决策树。

　　为了判断分割规则的“最佳”集(步骤516)，可以考虑各种性能指标(关键性能指标或KPI)。作为一个示例，可以采用预测残差减少(PRR)。为了说明这一点，可以将重叠误差的测量视为衬底的集上的性能特性。在所有衬底上的所有测量位置，测量的统计分布将显示出某个平均值m和某个标准偏差。(通常在X和Y方向上分别测量重叠，并且每个方向的统计分布都不同。)性能指标“m3s”可以定义为平均误差加上三倍的标准偏差。应当理解，在一种情况下，重叠误差可能相对较大(平均值较大，标准偏差较低)，而在另一种情况下，平均误差可能为零，但是样本可能变化很大(平均值为零，标准偏差较大)。性能指标m3s将这些情况组合为一个相当的值。应当理解，在第二种情况下，要应用的校正将不是很清楚的。但是，通过应用决策树分析来区分不同的会在特定样品(特定衬底和/或衬底上的特定位置和/或每个曝光场内的特定位置)引起偏差的上下文参数，从而针对衬底的不同子集订制的校正可以有希望能改善性能。

　　然后，在应用决策树和校正之前，考虑值m3s0，该值m3s0是#w个衬底的样本集的平均m3s：

　　m3s0＝mean({m3s(wi)}，i＝1，...#w)

　　其中wi表示跨过单个衬底测量的重叠值的集，#w是样本集中的衬底数。

　　任何候选决策树512及其相关联的校正集514构成重叠性能的预测模型M。在应用该预测模型M之后，可以将衬底的剩余平均值m3s称为m3sM：

　　m3sM＝mean({m3s(wi-wiM)}，i＝1，...#w)

　　其中wiM是根据该特定预测模型M应用于每个个体衬底的校正。该剩余平均值m3s是应当被最小化以实现最佳校正的模型性能的度量。

　　还可以例如通过以下公式为模型M定义正规化的“预测残差减少”(PRR)度量：

　　PRR(M)＝(m3s0-m3sM)/(m3s0)

　　PRR测量相对于原始衬底上的误差，重叠误差的多少部分或百分比通过预测模型M校正。由于度量PRR随着m3sM的减小而增加，因此PRR是应当最大化以实现最佳校正的度量。因此，提供了用于预测性模型的合适的KPI或性能指标，其可以用于在不同的候选决策树之间进行选择。

　　虽然在步骤510-518中示意性定义的训练过程可以完全自动化并且以“蛮力”执行，但是可以在自动化和/或人工专家步骤中应用各种改进和约束，以提高期望应用中的整体性能。

　　作为一种改进，可以对预处理数据执行一个或多个准备步骤510a。一个准备步骤可以是过滤步骤，过滤步骤用于去除冗余并且减少要在其中搜索决策树的参数空间的维数。过滤步骤可以是自动和/或手动引导的。例如，当在收集了所有训练集502的上下文数据之后，某些数据域在整个训练集上可能是不完整的，并且可以被自动排除。某些数据域将具有对每个衬底是独特的值，并且可以被排除。某些数据域具有在所有衬底上是恒定的值，并且可以被排除。某些数据域将与其他参数(诸如批号)100％相关。

　　另一选择是通过人和/或自动识别后处理数据中的变化的某些模式来过滤预处理数据。基于过程知识，变化或指纹的某些模式可以指向其根本原因。然后，可以使用该知识对预处理数据进行预过滤，以向与该根本原因相关并且更可能相关的预处理数据子集赋予额外权重。可以在自动化机器专家中对过程知识进行编码，或者通过人工干预和机器辅助的组合来应用过程知识。

　　预处理数据的某些变换也可以作为准备步骤510a执行。不必在与原始预处理数据中包括的个体参数相对应的参数空间内定义预处理数据。例如，参数的线性或非线性组合可以用于更有效地表示预处理数据(例如，在减少问题维数的方法中使用)。

　　可以对后处理数据(性能数据)执行准备步骤510b。本领域的读者将能够设想各种有用的准备步骤，包括例如离群值过滤和/或将相关的变换和/或投影应用于不同的参数空间。这样的变换和投影可以增强分割，并且纯粹作为示例，可以包括使用参数化模型进行建模、一键编码和/或主成分分析(PCA)。例如，来自PCT专利申请出版物号WO 2017/060080的技术可以适于该目的。

　　可以使用K折交叉验证方法来完成学习算法的进一步优化。这些方法可以用于优化学习算法的超参数，诸如终端节点数、树深度等。下面将参考图7说明其原理。

　　如果需要，可以在定义决策树之后合并子空间(衬底的子集)，以减轻由于学习算法中的递归二进制拆分策略而导致的过于细粒度的拆分为子集。这个合并可以通过机器编程(群集)和/或通过人工干预来执行。

　　此外，可以由专家操纵经学习的决策树，以对在学习阶段使用的预处理(上下文)数据中未包括的后处理变化源作出解释。可以使用“保留”数据集来验证改变的效果。保留数据可以是训练和交叉验证中未使用的任何数据。

　　还要注意，所提出的分割有效地提供了在上下文数据域中分组(分类)。上下文数据可以是在执行与过程或控制策略相关联的动作之前可用的任何数据。决策树随后用于在执行动作之前导出衬底特定的控制动作。因此，为此目的的上下文数据甚至可以包括从个体衬底测量的对象数据，甚至在该对象数据已经加载到光刻工具LA中之后。当然，该数据可以被参数化，而不是以原始形式使用。

　　如上所述，现在回顾一下在新的(待处理)衬底上的操作，首先基于与新衬底相关联的可用的预处理数据进行分割。对于每个分割(也可以称为新衬底的总集合内的子集/箱/组/簇)，可以确定后处理数据的某些特性，并且可以得出适当的过程校正。这样的后处理指纹的示例是：重叠指纹、CD指纹、屈服指纹、聚焦指纹和/或EPE指纹。

　　基于将预处理数据与后处理数据(并且因此与过程校正性质)相关联的决策树的可用性，可以采用各种控制策略。

　　首先，可以实施衬底水平控制类型(WLC)，其中对每个个体衬底应用过程校正(衬底水平控制原理)。由于在过程开始之前预处理数据是可用的，因此可以确定过程校正并且即时对每个衬底应用过程校正。

　　第二种控制策略被称为“批次”控制。在这种情况下，在执行过程步骤之后，对处理后的衬底的测量和/或过程数据分析被执行，并且被用于优化后续处理后的衬底的处理。在这种情况下，由决策树建立的衬底分组可以用于在批次控制中选择适当的校正。通过在已更新的预处理数据集上使用递归决策树算法，可以将新批次的预处理和后处理数据用于进一步提高决策树的质量。但是，在使用数据时应该注意不要使用相同的数据作为决策树算法和批次校正的输入而进行双重校正。

　　图7示意性地示出了候选模型的交叉验证(CV)，以确定PRR性能指标的鲁棒性如何，换言之，对于与用于训练的样本集不同的样本集，PRR性能指标的效果如何。图8示出了如何使用交叉验证的结果自动或在人工指导下选择最佳约束以应用于决策树学习。

　　在图7中，与图5中相同，在502处表示训练样本(衬底)全部的集。可以通过将预处理和后处理(训练)数据分割成子集并且至少在未用于建立模型的一个集上验证模型来验证决策树的质量。例如，将训练集划分为10个子集，使用其中9个子集作为训练数据702进行决策树学习，然后评估其预测和校正第十子集704中的错误的能力。将其重复10次，为相同的决策树算法提供10个不同的性能指标PRR1至PRR 10。然后可以将这些组合起来，例如通过简单的平均值进行组合，从而为作为整体的决策树算法提供交叉验证的性能指标PRR(CV)。应当理解，完全在与衬底的训练集相关联的预处理数据和后处理数据的域中执行划分为子集。交叉验证过程不需要物理处理衬底。交叉验证可以用作评估不同决策树算法以及评估候选决策树的技术，候选决策树作为决策树算法内步骤516的部分(例如，作为步骤516a)。

　　现在参考图8，对不同的决策树算法使用交叉验证的性能指标可以调节算法本身的区域参数和约束。这些可以被称为例如“超参数”。作为决策树算法的超参数的特定示例，参数#min定义应当保留在决策树的“叶节点”处的最小衬底数。也就是说，如果决策导致包含少于#min个衬底的分支，则该决策将不被包括在决策树中，并且决策树将终止于叶节点。

　　图8中的图示出了针对#min的多个不同值的交叉验证的性能指标PRR(CV)，其在特定的衬底的集上运行图7的交叉验证方法。衬底数可以是数百甚至数千。#min的值范围从图形左侧的5个到右侧的30多个。在所使用的特定度量中，PRR值的增加表明模型更好。而且，不仅绘制了性能指标的平均值，而且绘制了不同训练和验证子集702/704之间的性能指标的偏差范围。在图8的图示中，性能指标在值PRR1-PRR10上的偏差范围由“误差线”806表示。可以看出，如果#min设置太高，例如，高于25，则决策树算法无法产生最高性能。另一方面，将最小叶节点大小减小到20以下只会在性能方面有所较小改善(如果有改善)。在图8的比例尺上太小而看不到，在该示例数据集中，#min等于13(虚线箭头802)时实现绝对最佳性能。

　　另一方面，随着叶节点的大小变得小于最优值，候选模型之间的变化范围可以增加。在图8的比例尺上太小看不到，实际上在该示例的数据集中#min等于20(实线箭头804)时实现所有测试的选项中最窄变化范围。该最小变化指示特定算法从训练样本一般化到生产环境的良好能力。因此，在一种实施例中，对于步骤510-518，将参数#min设置为20。在其他实施例中，可以将这些超参数的设置调节为迭代过程的一部分，并且不时进行修改以保持最佳性能。

　　在所提供的很多示例中，预处理数据包括分类数据，诸如上下文数据，即，工具A是否用于处理衬底。已知，当使用决策树算法或类似技术对分类数据进行分割时，每个节点处的可能分割数为2(M-1)-1，其中M为类别或组的数目。因此，将认识到，对于大量类别，每个节点处的可能分割数变得过大。这使得难以确定最佳分割结构(例如，使用直接搜索方法)。这潜在地对上述方法对于大批量制造应用中的适用性施加了苛刻的限制。

　　在上面的描述中，描述了用于对后处理数据(性能数据)执行的可选准备步骤510b。一键编码和/或主成分分析(PCA)是为这样的准备步骤510b提供的示例。在多输出决策树算法中，可以使用一键编码将分类上下文变量转换为二进制指示符。然而，在大量上下文变量的情况下，这样的算法可能遭受大量可能的决策节点配置的困扰。另外，分割可能不是最佳的，因为当将上下文变量转换为二进制决策时，所有可能的决策节点中只有一个子集是可实现的。在目标变量是标量值或二进制类别的情形中，还可以基于对应目标变量的平均值确定顺序。然而，在目标值是矢量值的情况下，例如在当目标值被重叠时的情况下，以这种方式确定顺序是重要的。

　　为了解决这个问题，提出了上述分割方法的替代分割方法和/或准备步骤510b。这样的步骤可以包括用于确定一个或多个初始分割规则的特征编码步骤；例如，对预处理数据施加一定程度的序数(ordinality)。编码步骤的结果可以是频谱编码的预处理(分类上下文)数据，然后可以基于频谱码对数据进行分割。特别地，频谱码可以用于确定一个或多个初始分割规则(决策)。

　　所提出的方法使用频谱图分析来确定每个分类上下文变量的目标值(例如矢量目标值，诸如重叠)的低维表示(例如，低维接近图)。然后可以使用来自较低维表示的坐标(例如，作为实矢量值)来对分类值进行编码。频谱图分析是研究图的和与图相关联的矩阵(诸如其邻接矩阵或拉普拉斯矩阵)的特征多项式、特征值和特征矢量的相关的性质。

　　图9是描述所提出的方法的流程图。在步骤910，获取第一数据或预处理数据以及相关联的第二数据或后处理数据。后处理数据可以是已经提供的任何示例(例如，重叠数据、对准数据、CD数据、EPE数据、调平数据、和/或衬底高度图数据中的一个或多个)。在一个实施例中，后处理数据可以包括矢量值数据，例如重叠数据。如已经描述的，后处理数据与预处理数据相关；例如：上下文数据(例如，蚀刻装置的腔室ID)。

　　在步骤920，针对每个上下文数据特性确定代表性后处理数据度量。通过特定示例，重叠数据图或指纹对每个分类值(例如，蚀刻室ID)被分类(例如，求平均)，以获取每个分类值的聚合或平均重叠指纹。但是，求平均只是处理后处理数据以确定代表性后处理数据度量的一个示例。其他方法包括以下中的一项或多项：对后处理数据求平均、求和、相减、相乘、过滤或任何聚合。该步骤的输出是多组后处理数据，每组具有对应的代表性后处理数据度量。

　　在步骤930，确定距离度量，距离度量根据其对应代表性后处理数据度量来描述多个组中包括的每对组之间的距离。在一个实施例中，距离度量可以包括成对的距离矩阵D，其中行和列由每个分类值定义，并且每个条目描述针对该对分类值的对应的代表性后处理数据度量之间的距离。例如，距离度量可以基于欧几里德或余弦。

　　在步骤940，基于组的对之间的距离或邻接程度并且因此基于距离矩阵或其变换来确定完全连接图。在一个实施例中，可以首先将距离度量转换为邻接度量，邻接度量描述多个组中包括的每对组之间的邻接度量。邻接度量可以包括软邻接矩阵，其中元件的值在0到1之间，该值表示两个节点相邻的程度。这样，该变换将距离([0∞)中的正值表示节点之间的不相似性)转换到区间(0，1)，其中1表示完全相同，值随着不相似性的增加而减小。在特定示例中，邻接矩阵可以根据以下公式计算：

　　其中ai，j是邻接矩阵A的个体元素，di，j是距离矩阵D的对应个体元素，λ是常数。

　　在步骤950，基于完全连接图来确定频谱码，从而为每个分类变量(并因此，后处理数据组)被分配(被编码有)频谱码值。该步骤的目的是为了以稀疏方式对距离(邻接)矩阵表示进行编码。如本领域技术人员将很清楚的，这可以通过多种方式来实现。此处描述的方法经由特征矢量的子集来实现这一点。

　　这样，所描述的方法可以包括从邻接矩阵A计算拉普拉斯算子，并且从拉普拉斯算子计算特征矢量V0、V1、V2等。前几个非恒定特征矢量(V1、V2、……、Vn；n<k，其中k是类别/组的数目)用作由每个图节点表示的对应的分类变量的频谱码。在一个实施例中，确定拉普拉斯矩阵的特征矢量并且对其进行排名，并且基于其特征值选择排名后的特征矢量的子集，并且然后将其用于上下文数据的分组。图的拉普拉斯算子的非恒定特征矢量揭示了谱域中的信息；例如，表示图的不变量，这些不变量指示后处理数据(例如，重叠)对类别值的变化的响应的平滑度。

　　在步骤960，基于其在频谱码空间中的相对接近度(例如，根据与每个组相对应的频谱码值的接近度，指示更高接近度)，对上下文数据(以及因此，对应的后处理数据)进行分组。至少根据初始决策或分割规则，可以将彼此接近的组分配给例如同一组上下文数据。这是基于与上下文数据相关联的后处理数据的特性以分割上下文数据为目标的实施例的示例。例如，可以使用聚类算法来执行该分组步骤。

　　图10示出了步骤960的示例。它示出了六个组，每个组由代表性后处理数据度量或平均重叠指纹1010a-1010f表示，并且每个组具有在频谱码空间的曲线中由点1020a-1020f表示的相应频谱码。频谱码可以用于根据频谱码上的频谱聚类进行分组。在此处的特定示例中，可以确定决策边界1030的第一侧的点1020b和1020d被分组在第一频谱编码组1040a中，并且决策边界1030的第二侧的点1020a、1020c、1020e和1020f被分组在第二频谱编码组1040b中。然后，例如，该方法然后可以被用来在执行前述数据分割方法(例如，作为准备步骤510b的一部分)之前对上下文数据进行预分组。为了使用特定说明性示例，其中每个平均重叠指纹1010a-1010f和对应点1020a-1020f与特定蚀刻室A至F有关(其中指纹1010a对应于室A等)，则决策树的第一判定可以被确定为：“是否使用了蚀刻室B或D之一？—是/否”。

　　所公开的用于对上下文数据进行分组的方法可以使用图9和所附描述中描述的方法基于上下文数据的频谱编码。另外，可以基于频谱聚类方法对上下文数据进行分组。频谱聚类方法基于后处理数据及其关联的上下文数据。

　　在一个实施例中，公开了一种对数据进行分组的方法，该方法包括：获取与制造过程相关联的上下文数据；获取与上下文数据相关联的后处理数据；以及利用频谱聚类方法基于后处理数据和上下文数据将上下文数据分组为簇。

　　在一个实施例中，执行使用应用于分组上下文数据的决策树算法执行对经分组的上下文数据进行分割的后续步骤。

　　在下面的编号实施例的列表中公开了与分割规则(例如，决策树)的确定有关的其他实施例：

　　1.一种用于分割数据的方法，所述数据与经历制造过程的过程步骤的衬底相关联，所述方法包括：

　　在衬底经历所述过程步骤之前，获取与衬底相关联的第一数据；

　　在衬底经历所述过程步骤之后，获取与衬底相关联的第二数据；

　　将多个分割规则应用于所述第一数据以获取所述第一数据的子集的多个配置；以及

　　基于与通过将分割规则应用于所述第一数据而获取的所述第一数据的所述子集相关联的所述第二数据的子集的特性，选择所述分割规则。

　　2.根据实施例1所述的方法，其中决策树训练算法被用来执行应用所述多个分割规则以及选择所述分割规则的步骤。

　　3.根据实施例2所述的方法，其中所述训练算法是用于执行应用所述多个分割规则以及选择所述分割规则的步骤的递归二进制决策树算法。

　　4.根据实施例3所述的方法，其中使用诸如ID3、C4.5、CART、C5.0、CHAID、QUEST和/或CRUISE的一种或多种决策树训练算法训练所述决策树算法。

　　5.根据实施例2至4中任一项所述的方法，还包括使用交叉验证来评估所述训练算法，和根据所述评估来选择所述训练算法的参数，例如在二元决策树算法的情况下，选择诸如终端节点数和/或树深度等参数。

　　6.根据前述实施例中任一项所述的方法，还包括由专家操作员操纵所述第一和/或第二数据以说明所述第一数据中未包括的变化源。

　　7.根据前述实施例中任一项所述的方法，还包括在应用所述分割规则之前，对所述第一数据进行预处理以应用变换或投影。

　　8.根据前述实施例中任一项所述的方法，还包括合并所述第一数据的两个或更多个子集。

　　9.一种在衬底经历过程步骤之前基于与所述衬底相关联的数据对所述衬底进行分割的方法，所述方法包括：

　　-使用通过根据前述实施例中任一项所述的方法而选择的分割规则对数据进行分割；以及

　　-将所述衬底分割为子集，其中每个子集与通过所述分割而获取的所述数据的子集相关联。

　　10.根据实施例9所述的方法，还包括确定与所述衬底的子集相关联的过程控制特性。

　　11.根据实施例10所述的方法，还包括基于为所述衬底所属的子集确定的所述过程控制特性，在每个衬底上执行所述过程步骤。

　　12.根据前述实施例中任一项所述的方法，其中所述第一数据包括参数和与所述参数相关联的值，涉及选自以下中的一个或多个：

　　-对准标记的性质；

　　-衬底的高度图；

　　-衬底的表面的性质；

　　-在所述过程步骤之前用于处理衬底的工具的设置；

　　-识别在所述过程步骤之前用于处理衬底的工具；和/或

　　-在所述过程步骤之前用于处理衬底的工具的特性。

　　13.根据前述实施例中任一项所述的方法，其中所述第二数据包括参数和与所述参数相关联的值，涉及选自以下中的一个或多个：

　　-对准标记的性质；

　　-衬底的高度图；

　　-衬底的表面的性质；

　　-与提供给衬底的特征相关联的性能数据，所述性能数据涉及选自以下中的一个或多个：层之间的重叠、通过单层中的多个图案化步骤施加的图案之间的重叠、聚焦质量、特征的CD、所述特征的边缘放置误差、所述特征的电特性、和/或与包括所述特征的功能器件的相对数量有关的衬底的产量。

　　14.根据实施例12或实施例13所述的方法，其中所述分割规则包括被配置为基于所述第一数据中包括的参数的值来分割所述第一数据的至少一个决策操作。

　　15.根据实施例11至13中任一项所述的方法，其中所述分割规则定义包括一系列决策步骤的决策树。

　　结论

　　总之，本公开提出了一种基于与衬底相关联的第二数据的多个集(上下文数据)之间的邻接或距离来对与经历制造过程的过程步骤的衬底相关联的数据进行分组的方法，每组第二数据与第一数据的特性的不同值相关联。

　　当用作决策树算法中的处理步骤的一部分时，由于分组在决策树中是隐含的，使得例如组内变化被最小化，所以不需要建立指纹簇的明确概念。与后处理参数(“指纹空间”的维数)和上下文空间的维数(预处理数据参数)的变化数相比，这使得该方法可以以相对较少的产品单元数应用。

　　执行交叉验证和为每个上下文变量分割参数空间的能力在实践中促进了该方法的良好概括。与已知方法相比，该方法还可以更大规模地扩展到大批量生产。可以包括类别值和连续值上下文变量的混合。

　　组数不随各个上下文变量的维数成指数增长。这与先前的方法相反，在先前的方法中，例如，可以为每个上下文值(诸如蚀刻室ID)建立单独的反馈回路(“控制线程”)。决策树分类器只会选择导致显著指纹变化的腔室和工具的那些组合。不相关的上下文将自动被忽略。

　　代替二进制决策树算法，也可以使用其他方法。此处的重要意义在于，该算法会生成多个分割规则，每个分割规则都基于其预处理数据而定义不同的衬底分割。多个分割规则可以例如随机地生成。(适当的或甚至最佳的)分割规则的选择基于评估与预处理数据的子集相关联的后处理数据的特性，所述预处理数据的子集通过应用关注的分割规则而获取。例如，大量分割规则可以基于改变用于将衬底划分为子集的参数，而将衬底划分为子集基于预处理数据。例如，第一分割规则可以基于所利用的蚀刻室来划分衬底，并且第二分割规则可以基于与所执行的沉积过程相关联的温度。在这种情况下，第二分割规则可以基于预处理数据中包括的参数的值，例如，第一分割规则选择与第一温度范围相关联的预处理数据，第二分割规则选择与第二温度范围相关联的预处理数据。

　　在基于预处理数据定义衬底的子集之后，确定与衬底的至少一个子集相关联的后处理数据的特性。例如，将与已经通过某个蚀刻室并且已经在某个温度范围内进行沉积过程的衬底相关联的重叠数据与整组后处理数据(在这种情况下为重叠)隔离。确定与该特定集合相关联的重叠数据的特性。这样的特性可以与特定集合上的后处理数据的可变性的度量有关，诸如(重叠的)方差。可以考虑一个或多个其他特性：将后处理数据映射到标量的预测产量或任何其他成本函数代表特定衬底组的期望特性。在特征是重叠数据的变化的情况下，可以基于观察到的变化性特征的最小值来选择分割规则，这表示与由分割规则划出的预处理数据的子集相关联的衬底全部共享类似的重叠特性。

　　预处理数据可以包括参数和与与涉及选自以下中的一个或多个有关的参数相关联的值：一个或多个对准标记的一个或多个性质；一个或多个衬底的一个或多个高度图；一个或多个衬底的表面的一个或多个性质；在过程步骤之前用于处理衬底的一个或多个工具的一个或多个设置；识别在过程步骤之前用于处理衬底的一个或多个工具；和/或在过程步骤之前用于处理衬底的一个或多个工具的一个或多个特性。通常，在执行关注的过程步骤之前，与先前的层和先前的过程步骤相关联的数据是已知的(至少在监测该数据的处理到位时)。在光刻过程的情况下，与预曝光量测步骤(例如，衬底的对准和水平)相关的数据可能是可用的并且因此被包括在预处理数据中。

　　在PCT专利申请公开号WO 2017/060080的术语中，基于实际衬底的测量的预处理数据可以被称为“对象数据”。在这种情况下，在曝光之前可用的“对象数据”可以以与其他类型的预处理数据相同的方式来考虑，称为“上下文数据”。后处理数据对应于PCT专利申请公开号WO 2017/060080中的“性能数据”，因为其涉及在每个衬底的情况下通过光刻过程步骤实际实现的结果。

　　后处理数据可以包括参数和与涉及选自以下中的一个或多个有关的参数相关联的值：一个或多个对准标记的一个或多个性质；一个或多个衬底的一个或多个高度图；一个或多个衬底的表面的一个或多个性质；和/或与在过程步骤期间和/或在过程步骤之后提供给衬底的一个或多个特征相关联的性能数据。这样的性能数据例如可以涉及选自以下中的一个或多个：层间重叠、在单层中由多个图案化步骤施加的图案之间的重叠、聚焦质量、一个或多个特征的CD、一个或多个特征的边缘位置误差、一个或多个特征的一个或多个电特性、和/或与包括一个或多个特征的功能器件的相对数量有关的衬底的产量。

　　尽管在本文中可以具体参考光刻装置在IC的制造中的使用，但是应当理解，本文所述的光刻装置可以具有其他应用。其他可能的应用包括制造集成光学系统、用于磁畴存储器、平板显示器、液晶显示器(LCD)、薄膜磁头等的引导和检测图案。在这方面，经过处理的“衬底”根据要制造的产品类型，可以是半导体晶片，也可以是其他衬底。

　　尽管在本文中可以在光刻装置的上下文中具体参考本发明的实施例，但是本发明的实施例可以在其他设备中使用。本发明的实施例可以形成图案形成装置检查装置、量测装置、或测量或处理诸如晶片(或其他衬底)或掩模(或其他图案形成设备)等物体的任何装置的一部分。这些装置通常可以称为光刻工具。这种光刻工具可以使用真空条件或环境(非真空)条件。

　　在本文件中，术语“辐射”和“光束”用于涵盖所有类型的辐射，包括紫外线辐射(例如，波长为365、248、193、157或126nm)和EUV(极端)紫外辐射(例如，波长在约5-100nm范围内)。

　　本文中使用的术语“标线片”、“掩模”或“图案形成装置”可以广义地解释为是指可以用来向入射辐射束赋予与将在衬底的目标部分中创建的图案相对应的图案化横截面的通用图案形成装置。在此上下文中也可以使用术语“光阀”。除了经典的掩模(透射或反射、二进制、相移、混合等)，其他这样的图案形成装置的示例还包括可编程反射镜阵列和可编程LCD阵列。

　　尽管上面可能已经在光学光刻的上下文中具体参考了本发明的实施例的使用，但是应当理解，在上下文允许的情况下，本发明不限于光学光刻，并且可以在其他应用中使用，例如压印光刻。

　　如本文中使用的，术语“优化”和“优化过程”是指或表示调节装置(例如，光刻装置)、过程等，使得结果和/或过程具有更期望的特性，诸如设计图案在衬底上的更高投影精度、更大的过程窗口等。因此，本文中使用的术语“优化”和“优化过程”是指或表示识别一个或多个参数的过程，该一个或多个参数用于提供改进，例如与用于一个或多个参数的一个或多个值的初始集合相比，在至少一个相关度量中的局部最优。“最佳”和其他相关术语应当据此解释。在一个实施例中，可以迭代地应用优化步骤以提供一个或多个度量的进一步改进。

　　本发明的方面可以以任何方便的形式来实现。例如，一个实施例可以由一个或多个适当的计算机程序实现，该程序可以在适当的载体介质上承载，该适当的载体介质可以是有形的载体介质(例如，磁盘)或无形的载体介质(例如，通信信号)。本发明的实施例可以使用合适的装置来实现，该装置可以特别地采取运行计算机程序的可编程计算机的形式，该计算机程序被布置为实现本文所述的方法。

　　在框图中，图示的部件被描绘为离散的功能块，但是实施例不限于其中本文中描述的功能如图所示被组织的系统。由每个部件提供的功能可以由与当前描绘的不同地组织的软件或硬件模块来提供，例如，这样的软件或硬件可以被混合、结合、复制、分解、分布(例如，在数据中心内或在地理上)，或者被不同地组织。本文中描述的功能可以由一个或多个计算机的一个或多个处理器执行存储在有形的非暂态的机器可读介质上的代码来提供。在某些情况下，第三方内容传送网络可以托管通过网络传输的部分或全部信息，在这种情况下，在信息(例如，内容)被称为被供应或以其他方式提供的程度上，该信息可以通过发送用于从内容传送网络检索该信息的指令来提供。

　　除非另有明确说明，否则从讨论中可以明显看出，应当理解，在整个说明书中，利用诸如“处理”、“计算”、“运算”、“确定”等术语的讨论是指诸如专用计算机或类似的专用电子处理/计算设备等特定装置的动作或过程。

　　读者应当理解，本申请描述了若干发明。不是将这些发明分成多个独立的专利申请，而是将这些发明归为一个文档，因为它们的相关主题可以使申请过程更加经济。但是，这样的发明的独特的优点和方面不应当混为一谈。在一些情况下，实施例解决了本文中指出的所有缺陷，但是应当理解，本发明是独立有用的，并且一些实施例仅解决了这样的问题的子集或者提供其他未提及的益处，这些益处对于审查本公开的本领域技术人员而言是很清楚的。由于成本限制，本文中公开的一些发明目前可能没有要求保护，而是可能在诸如连续申请等以后的申请中要求保护，或者通过修改本权利要求书来要求保护。同样，由于篇幅限制，“摘要”和“发明内容”部分均不应当被视为包含所有这样的发明或这样的发明的所有方面的全面列表。

　　应当理解，说明书和附图并非旨在将本公开限制为所公开的特定形式，相反，其意图是涵盖落入由所附权利要求书限定的本发明的精神和范围内的所有修改、等同形式和替代形式。

　　鉴于本说明书，本发明的各个方面的修改和替代实施例对于本领域技术人员将是很清楚的。因此，本说明书和附图仅应当被解释为是说明性的，并且目的是向本领域技术人员教导用于实施本发明的一般方式。应当理解，本文中示出和描述的本发明的形式将被视为实施例的示例。可以对本文中示出和描述的元件和材料进行代替，可以对各部分和过程进行颠倒或省略，可以独立地利用某些特征，并且可以组合实施例或实施例的特征，所有这些对于受益于本说明书的本领域技术人员而言是很清楚的。在不脱离如所附权利要求书中描述的本发明的精神和范围的情况下，可以对本文中描述的元件进行改变。本文中使用的标题仅用于组织目的，而并不意在用来限制本说明书的范围。

　　如在本申请中通篇使用的，词语“可以”以允许的意义(即，表示有可能)而不是强制性的意义(即，必须)来使用。词语“包括(include)”、“包括(including)”和“包括(includes)”等表示包括但不限于。如在本申请中通篇使用的，除非内容另外明确指出，否则单数形式的“一个(a)”、“一个(an)”和“该(the)”包括复数指示物。因此，例如，对“一个(an)”元件或“一个(a)”元件的引用包括两个或更多个元件的组合，尽管对于一个或多个元件使用其他术语和短语，诸如“一个或多个”。除非另有说明，否则术语“或”是非排他性的，即，包括“和”和“或”。描述条件关系的术语(例如，“响应于X、Y”、“在X、Y时”、“如果X、Y”、“当X、Y时”等)包含因果关系，其中先决条件是必要的因果条件，先决条件是充分的因果条件，或者先决条件是结果的附带的因果条件，例如，“状态X在获取条件Y时发生”是“X仅在Y时发生”和“X在Y和Z时发生”的通称。这样的条件关系不限于在获取先决条件之后立即发生的后果，因为某些后果可能会延迟，并且在条件陈述中，先决条件与它们的后果相关，例如，先决条件与发生后果的可能性有关。除非另有说明，否则其中多个性质或功能被映射到多个对象(例如，一个或多个处理器执行步骤A、B、C和D)的陈述既包含所有这样的性质或功能被映射到所有这样的对象，又包含性质或功能的子集被映射到性质或功能的子集(例如，既包含所有处理器均执行步骤AD，又包含如下情况：处理器1执行步骤A，处理器2执行步骤B、和步骤C的一部分，并且处理器3执行步骤C的一部分和步骤D)。此外，除非另有说明，否则一个值或动作“基于”另一条件或值的陈述既包含条件或值是唯一因素的情况，又包含条件或值是多个因素中的一个因素的情况。除非另有说明，否则某个集合的“每个”实例具有某个性质的陈述不应当理解为排除较大集合的某些以其他方式相同或相似的成员不具有该性质的情况，即，每个不一定表示每一个。对从某个范围中进行选择的引用包括该范围的端点。

　　在以上描述中，流程图中的任何过程、描述或框应当理解为代表代码的模块、段或部分，其包括用于实现过程中的特定逻辑功能或步骤的一个或多个可执行指令，并且替代实现是包括在本发明的示例性实施例的范围内，其中可以根据所涉及的功能与所示出或所讨论的相比不按顺序地执行功能，包括基本上同时或以相反的顺序执行，如本领域技术人员将理解的。

　　在以下编号实施例的列表中公开了本发明的其他实施例：

　　1.一种用于分割数据的方法，所述数据与经历制造过程的过程步骤的衬底相关联，所述方法包括：

　　在衬底经历所述过程步骤之前，获取与衬底相关联的第一数据；

　　在衬底经历所述过程步骤之后，获取与衬底相关联的第二数据的多个集，第二数据的每个集与所述第一数据的特性的不同值相关联；

　　确定描述所述第二数据的多个集之间的距离的度量的距离度量；以及

　　基于所述距离度量的性质对所述第二数据进行分组。

　　2.根据实施例1所述的方法，包括：为每组第二数据确定代表性后处理数据度量；以及确定用于描述所述代表性后处理数据度量之间的距离的度量的所述距离度量。

　　3.根据实施例2所述的方法，其中所述代表性后处理数据度量包括每组第二数据中的所述第二数据的值的聚合。

　　4.根据实施例3所述的方法，其中所述距离度量是描述各对所述代表性后处理数据度量之间的距离的度量的距离矩阵。

　　5.根据实施例4所述的方法，其中在所述分组步骤之前，所述距离矩阵被变换成描述所述代表性后处理数据度量的相应的对的之间的邻接的度量的邻接矩阵。

　　6.根据实施例前述中任一项所述的方法，还包括从所述距离度量确定完全连接图。

　　7.根据实施例6所述的方法，包括：基于所述完全连接图为每组第二数据确定相应频谱码；以及基于所述频谱码对所述第二数据进行分组。