用于控制空调系统的运行的系统及方法
技术领域
本发明总体上涉及一种空调系统,并且更具体地,涉及控制空调系统的运行。
背景技术
诸如供暖、通风和空气调节(HVAC)系统之类的空调系统已经广泛用于工业和住宅应用。例如,空调系统可以包括变速压缩机、可变位置阀和变速风扇中的一个或组合以用于传递特定热量的蒸汽压缩循环。到传递特定热量的蒸汽压缩系统的命令输入通常不是唯一的,并且组件的各种组合消耗不同量的能量。因此,期望使用使能量最小化并由此使效率最大化的输入的组合来操作蒸汽压缩系统。
常规上,使能量效率最大化的方法依赖于空调系统的物理过程的数学模型的使用。这些基于模型的方法试图描述蒸汽压缩系统的组件的命令输入对系统的热力学行为和所消耗能量的影响。在这些方法中,使用模型来预测满足热负荷要求并最小化能量的输入组合。
HVAC系统的操作改变在调节环境中的定义了空气从调节环境的一个区域向另一区域移动的气流。但是,气流的物理模型具有无限的维度,并且过于复杂而无法在实时控制应用中使用。另外,在空调系统的运行期间,气流的模型也能够改变,参见例如美国专利申请公开US2016/0258644。
为此,需要一种用于使用在系统运行期间产生的气流的实时知识来控制空调系统的系统和方法。
发明内容
一些实施方式的目的是提供一种用于控制空调系统的运行的系统和方法,从而满足该运行的热负荷要求并改善系统的性能。一个实施方式的另一目的是提供这样一种在控制空调系统中使用气流模型的系统和方法。另一实施方式的另一目的是提供这样一种在空调系统的运行期间随着时间改善空调系统的性能的系统和方法。
一些实施方式基于以下知识:空调系统随时间而变化。在一个时间点准确描述蒸汽压缩系统的运行的模型随着系统的改变(例如,由于制冷剂缓慢泄漏或热交换器上的腐蚀积聚而导致)而在以后的时间可能并不准确。另外,空调系统的模型通常忽略了诸如房间尺寸之类的特定于安装的特征,导致空调系统的模型偏离系统的运行。
一些实施方式基于以下认识:在空调系统运行期间产生的气流的知识能够用于优化系统的运行。但是,在空调系统运行期间,气流的模型也能够变化。因此,需要一种用于使用在系统运行期间产生的气流的实时知识来控制空调系统的系统和方法。
一些实施方式解决了确定和更新气流动力学模型的问题,使得该模型准确地表示气流的动力学并且能够适应调节环境中的变化。不幸地是,气流的物理模型,即捕获气流动力学的物理特征的模型,是无限维的并且过于复杂而无法在实时控制应用中使用。因此,一些实施方式使用适于实时更新和控制的低维模型。例如,在一些实施方式中,模型包括降阶模型,该降阶模型的参数数量少于根据Boussinesq(布西内斯克)方程式的气流的物理模型的参数数量,其中Boussinesq方程是偏微分方程式(PDE),并且其中降阶模型是常微分方程式(ODE)。
为此,一些实施方式解决了旨在将复杂(例如,无限维的)物理模型简化为更少维(例如,有限维的)的更简单模型的模型简化问题。在这种的背景下,模型简化问题意味着确定更简单模型的所有参数或系数,使得在根据复杂模型的系统与根据更简单模型的系统的性能测量结果之间的误差最小化。例如,在气流建模估计和控制应用中,需要用具有更少维度和更低复杂度的ODE模型变换表示气流的PDE模型。这种减少能够允许对诸如空调系统之类的气流系统进行实时控制。
一些实施方式基于以下认识:PDE模型具有两种类型的参数,即,内部参数和外部参数。内部参数是指在模型的外部没有任何意义的模型的内部增益。外部参数是影响气流的世界的物理参数,并且独立于气流动力学模型而存在。这种物理参数的示例包括调节环境中的空气粘度、调节环境的几何形状、调节环境中的物体的数量和类型(例如,诸如人的热源)中的一种或组合。
一些实施方式基于以下认识:模型复杂度的降低(例如,将PDE模型变换为ODE模型)应将PDE模型的物理参数保留在降低了复杂度的模型中。以这种方式,降低了复杂度的模型能够更准确地表示PDE模型。但是,PDE模型的物理参数通常是有歧义的,即包括不确定性。例如,在不同的时间在调节环境中,空气粘度能够变化和/或能够存在不同数量的人。一些实施方式基于以下认识:物理参数的值是不确定的且具有有界不确定性,本文称为有界不确定性范围。但是,在有界不确定性范围内,物理参数的值是未知的并且能够变化。
一些实施方式基于以下认识:能够通过强迫在调节环境中的观测误差的能量函数以减小物理参数在有界不确定性范围内的任何值来补偿缺乏关于气流动力学模型的物理参数的知识。为此,一些实施方式使用Lyapunov(李雅普诺夫)方法来分析能量函数及其相对于时间的导数。一些实施方式基于以下认识:这种方法允许吸收物理参数的不确定性对气流状态的估计的影响。
在分析Lyapunov函数的导数期间,一些实施方式发现了使Lyapunov函数的导数始终为负而与不确定性的实际值无关的项。该项包括有界不确定性范围和负增益的乘积,使得Lyapunov函数的导数与不确定性的实际值无关地始终为负,这进而使得能量函数与不确定性的值无关地随时间迭代而减小,并且因此,对于物理参数在有界不确定性范围内的任何值,观测误差随着时间迭代而减小至零。
一些实施方式使用将物理参数的有界不确定性范围与能量函数的导数相关联的项,以辅助气流状态从先前状态到其当前状态的转换的收敛来修正气流动态模型。为此,在一些实施方式中,气流动力学模型包括将先前的气流状态转换为当前的气流状态的第一项和辅助该转换的第二项。具体地,第一项包括气流的物理模型在有限维空间上的投影-气流的物理模型包括调节环境的物理参数,并且投影在第一项中保留调节环境的物理参数。第二项包括有界不确定性范围、负增益和观测误差的函数,观测误差是在一组点处气流的测量结果与根据气流的模型在该一组点处气流的估计结果之间的观测误差。
以这种方式,气流动力学模型中的第一项和第二项的组合允许在保持模型准确性的同时降低模型的复杂性。在各个实施方式中,迭代地确定气流状态。因为第二项被设计为强迫观测误差的能量函数的导数为负定的,所以气流状态的迭代更新强迫在多个控制步骤上减小了观测误差。
定义
在描述实施方式时,在全文(包括以上)应用了以下定义。
“控制系统”或“控制器”是指用于管理、命令、指导或调整其它装置或系统的行为的装置或装置的集合。控制系统能够由软件或硬件来实现,并且能够包括一个或几个模块。能够使用微处理器来实现包括反馈环路的控制系统。控制系统能够是嵌入式系统。
“空调系统”或供暖、通风和空调(HVAC)系统是指基于热力学、流体力学和/或热交换,使用蒸汽压缩循环使制冷剂流经系统各组件的系统。空调系统涵盖了非常广泛的系统的集合,从仅向建筑物居住者提供室外空气的系统到仅控制建筑物温度的系统,再到控制温度和湿度的系统。
“空调系统的组件”是指系统中具有由控制系统可控制的操作的任何组件。组件包括但不限于具有用于压缩和泵送通过系统的制冷剂的可变速度的压缩机、用于在系统的高压和低压部分之间提供可调的压降的膨胀阀、各自合并有用于调节通过热交换器的空气流速的变速风扇的蒸发式热交换器和冷凝式热交换器。
“蒸发器”是指蒸汽压缩系统中的通过热交换器的制冷剂在热交换器的整个长度上蒸发的热交换器,因此制冷剂在热交换器出口处的比焓高于制冷剂在热交换器入口处的比焓,并且制冷剂通常从液体变为气体。在空调系统中可以有一个或更多个蒸发器。
“冷凝器”是指蒸汽压缩系统中的通过热交换器的制冷剂在热交换器的整个长度上冷凝,使得制冷剂在热交换器出口处的比焓低于制冷剂在热交换器入口处的比焓的热交换器,并且制冷剂通常从气体变为液体。在空调系统中可以有一个或更多个冷凝器。
“一组控制信号”或“控制输入”是指用于控制蒸汽压缩系统的组件的操作的输入的特定值。一组控制信号包括但不限于压缩机的速度值、膨胀阀的位置值、蒸发器中的风扇速度值以及冷凝器中风扇速度值。
“设置点”是指系统(诸如空调系统)由于运行而要达到并保持的目标值。术语设置点被应用于一组特定的控制信号以及热力学和环境参数的任何特定值。
“中央处理单元(CPU)”或“处理器”是指读取或执行软件指令的计算机或计算机的组件。
“模块”或“单元”是指计算机中执行任务或一部分任务的基本组件。它能够由软件或硬件来实现。
附图说明
[图1A]
图1A示出了根据一个实施方式的用于控制在调节环境中产生气流的空调系统100的运行的系统99的框图。
[图1B]
图1B示出了根据一些实施方式对要调节的房间160进行空气调节的示例的示意图。
[图1C]
图1C示出了根据一些实施方式的控制系统99的框图。
[图2A]
图2A示出了根据一些实施方式的气流动力学110的模型的示意图。
[图2B]
图2B示出了根据一些实施方式的将气流动力学的物理模型投影在有限维空间上的示意图。
[图3]
图3示出了根据一些实施方式的PDE模型375和ODE模型337之间的关系的示意图。
[图4]
图4示出了根据一些实施方式的选择用于将无限维模型375投影到简化的有限维模型337的投影算子387的示意图。
[图5]
图5示出了一些实施方式补偿气流动力学模型的物理参数的不确定性所使用的基于能量的方法的框图。
[图6]
图6示出了根据一个实施方式的用于控制空调系统的迭代方法600的框图。
[图7]
图7示出了根据一些实施方式的用于自动调谐气流动力学模型的至少一个增益的方法的框图。
具体实施方式
图1A示出了根据一个实施方式的用于控制在调节环境中产生气流的空调系统100的运行的系统99的框图。空调系统100能够包括诸如蒸发器风扇114、冷凝器风扇113、膨胀阀111和压缩机112之类的组件中的一个或组合。系统99使用控制器120来控制空调系统100,该控制器120负责接收例如来自恒温器的设置点115和传感器130的读数,并输出用于控制组件的操作的一组控制信号。控制器120可操作地连接到用于将一组控制信号转换成对相应组件的一组特定控制输入的一组控制装置。例如,控制器连接到压缩机控制装置122、膨胀阀控制装置121、蒸发器风扇控制装置124和冷凝器风扇控制装置123。
控制器可操作地连接到估计器140,该估计器140被配置为估计当前的气流状态150。在各种实施方式中,控制器120使用当前的气流状态150控制空调系统100。气流状态的示例包括在空调系统运行期间进行空气调节的房间的流量值和温度值之一或组合。以这种方式,控制器控制空调系统的运行,使得针对给定的热负荷来实现设置值。例如,监视控制器确定和/或更新对空调系统的至少一个组件的至少一个控制输入,以使用气流状态150来优化性能确定指标。
为了确定当前的气流状态150,估计器140使用气流动力学的模型110。模型110允许估计器140通过根据气流动力学模型在时间上向前转换先前的气流状态,以减少当前的气流状态中的观测误差来确定气流状态150。在各种实施方式中,观测误差是在一组点处气流的测量结果与根据气流模型在这一组点处气流的相应估计结果之间的误差。以这种方式,观测误差是局部观测误差,其允许减少在调节环境中测量气流状态的传感器的数量。
图1B示出了根据一些实施方式对要调节的房间160进行空气调节的示例的示意图。在该示例中,房间160具有门161和至少一个窗户165。房间的温度和气流由空调系统(诸如,系统100)通过通风单元101控制。在房间中布置了一组传感器130,诸如用于测量在房间中给定点的气流的速度的至少一个气流传感器131以及用于测量房间温度的至少一个温度传感器135。能够考虑其它类型的设置,例如具有多个HVAC单元的房间或具有多个房间的房屋。
控制器120能够以硬件实现或实现为在处理器(例如,微处理器)中执行的软件程序,该处理器以固定或可变的控制周期采样间隔接收来自传感器130的测量结果、期望的设置点115、气流状态150,并使用此信息确定用于操作空调系统100的输入,例如,控制信号。
估计器140能够以硬件实现,或者实现为在处理器中执行的软件,该处理器是与控制器120相同或不同的处理器,其以固定或可变的控制周期采样间隔接收来自传感器130的测量结果,并使用新的测量结果和先前的测量结果以及先前的气流状态来确定当前的气流状态150。
图1C示出了根据一些实施方式的控制系统99的框图。系统99包括例如以连接到用于存储气流动力学的模型110的存储器195的单个中央处理单元(CPU)或多个CPU处理器190的形式的计算机。控制系统99使用来自空调系统100的运行的反馈信号103。在一些实现中,反馈信号由传感器130的测量结果表示。控制系统99确定用于操作空调系统100的控制信号104。
一些实施方式基于以下认识:气流的物理模型(即,捕获气流动力学的物理特性的模型)具有无限维并且过于复杂而无法用于实时控制应用中。因此,一些实施方式使用适合于实时更新和控制的低(即,有限)维模型110。例如,在一些实施方式中,模型包括降阶模型,该降阶模型的参数数量小于根据Boussinesq(布西内斯克)方程式的气流的物理模型的参数数量,其中Boussinesq方程式是偏微分方程式(PDE),并且其中,降阶模型是常微分方程式(ODE)。
为此,一些实施方式解决了旨在将复杂(例如,无限维的)物理模型简化为更低维(例如有限维)的更简单模型的模型简化问题。在这样的背景下,模型简化问题意味着确定更简单模型的所有参数或系数,使得根据复杂模型的系统和根据更简单模型的系统的性能测量结果之间的误差最小化。例如,在气流建模估计和控制应用中,需要用具有更少维度和更低复杂度的ODE模型来变换代表气流的PDE模型。这种减少能够允许诸如空调系统之类的气流系统的实时控制。
图2A示出了根据一些实施方式的气流动力学的模型110的示意图。在这些实施方式中,模型110包括将先前的气流状态转换为当前的气流状态的第一项210和辅助转换的第二项220的组合。在一些实施方式中,第一项包括气流动力学的物理模型在有限维空间上的投影。因为气流动力学的物理模型将先前的气流状态在时间上向前转换为当前的气流状态,所以第一项210也有助于这种转换。另外,由于气流的物理模型包括调节环境的物理参数,因此在各个实施方式中,投影在第一项中保留了调节环境的物理参数。
图2B示出了根据一些实施方式的将气流动力学的物理模型投影在有限维空间上的示意图。一些实施方式基于以下认识:气流动力学的物理模型230具有两种类型的参数,即,内部参数233和外部参数235。内部参数233是指在模型之外没有意义的模型的内部增益。外部参数235是影响气流的世界的物理参数,并且独立于气流动力学的模型而存在。此类物理参数的示例包括调节环境中的空气粘度、调节环境的几何形状、调节环境中物体的数量和类型(例如,诸如人的热源)中的一种或组合。
一些实施方式基于以下认识:降低模型复杂度(例如,将物理模型230投影237在有限空间中从而产生气流动力学240的降阶模型)应保留外部参数235,同时内部参数243能够不同于内部参数233。以这种方式,降低了复杂度的模型240能够更准确地表示物理模型230。
然而,物理模型的物理参数通常是有歧义的,即,包括不确定性。例如,在不同的时间在调节环境中,空气的粘度能够变化和/或能够存在不同数量的人。一些实施方式基于以下认识:物理参数的值是不确定的且具有有界不确定性,本文称为有界不确定性范围。但是,在有界不确定性范围内,物理参数的值是未知的并且能够变化。
为此,气流动力学的模型110的第一项210包括降阶模型240,该降阶模型240具有至少一个物理参数235的值,该至少一个物理参数235是不确定的且具有定义了有界不确定性范围的有界不确定性。例如,在一些实现中,物理参数235是调节环境中的空气粘度。对调节环境或类似环境中的空气粘度进行统计分析能够提供具有所需统计置信度的有限不确定性范围。但是,粘度值能够在该范围内变化。
一些实施方式基于以下认识:能够通过强迫在调节环境中的观测误差的能量函数以减小物理参数在有界不确定性范围内的任何值来补偿缺乏关于气流动力学的模型的物理参数的知识。为此,一些实施方式使用基于Lyapunov(李雅普诺夫)方法来分析能量函数及其相对于时间的导数。一些实施方式基于以下认识:这种方法允许吸收物理参数的不确定性对气流状态的估计的影响。
在分析Lyapunov函数的导数期间,一些实施方式发现了使Lyapunov函数的导数始终为负而与不确定性的实际值无关的项。该项包括有界不确定性范围、负增益以及在一组点处气流的测量结果与根据气流模型在这一组点处气流的估计结果之间的观测误差的乘积,以使得Lyapunov函数的导数始终为负而与不确定性的实际值无关,这进而使得能量函数与不确定性的值无关地随时间的迭代而减小,并且因此,对于物理参数在有界不确定性范围内的任何值,观测误差随着时间的迭代而减小至零。
为此,模型110的第二项220包括有界不确定性范围、负增益以及在一组点处气流的测量结果与根据气流模型在这一组点处气流的估计结果之间的观测误差的函数。以这种方式,气流动力学模型中的第一项和第二项的组合允许在保持模型准确性的同时降低模型的复杂性。
在各个实施方式中,迭代地确定气流状态。因为第二项被设计为强迫观测误差的能量函数的导数为负定的,所以气流状态的迭代更新强迫在多个控制步骤上降低观测误差。
在一些实施方式中,气流动力学的物理模型230可以由偏微分方程式(PDE)来描述,该偏微分方程式(PDE)使气流状态在时间上向前转换。相比之下,气流动力学的降阶模型240,特别是其第一项210,是在时间上向前转换气流状态的常微分方程式(ODE)。
图3示出了根据一些实施方式的PDE模型375和ODE模型337之间的关系的示意图。在一些实施方式中,PDE模型375是无限维的,而ODE模型337是有限维的。一些实施方式使用投影算子337将PDE模型投影到低(即,有限)维空间上,以到达ODE模型337。以这种方式,气流动力学的ODE模型允许将气流动力学用于空调系统的实时控制。
在一些实现中,PDE模型375由Boussinesq方程式定义。Boussinesq方程式由下式给出:
在该方程式中,T是温度标量变量,并且
Boussinesq方程式描述了房间中气流和温度之间的结合,但是具有无限维。另外,Boussinesq方程式具有其中PDE的边界条件随时间变化的不确定的条件,或者PDE涉及的系数之一正在变化的情况。这些数学变化反映了房间中的一些实际变化。例如,房间中窗户或门的打开和关闭会改变Boussinesq PDE的边界条件。类似地,天气变化(诸如每日和季节性变化)影响房间内温度和房间外温度之间的差,进而影响PDE系数中的一些,例如能够受影响Reynold’s number(雷诺数)。
图4示出了根据一些实施方式的选择用于将无限维模型375投影到简化的有限维模型337的投影算子387的示意图。在各种实施方式中,投影算子需要保留PDE模型的物理参数。为此,一些实施方式选择基于投影算子387的基函数460以用于有限维模型,有时称为降阶模型(ROM)337。从由广泛数值解(称为直接数值模拟(DNS))获得的PDE的精确解的快照中获得基函数。
不同的实施方式使用不同类型的基函数460来确定投影算子387。例如,一个实施方式使用本征正交分解(POD)基函数440。另一实施方式使用动态模式分解(DMD)基函数450。以下提供了投影算子的数学公式的示例。
在确定投影算子387之后,一些实施方式使用算子387将无限维的PDE模型375转换为有限维的ODE模型337,同时保留PDE模型的物理参数。
图5示出了一些实施方式补偿气流动力学模型的物理参数的不确定性所使用的基于能量的方法的框图。例如,一个实施方式使用Lyapunov函数540来评估520由投影387确定的ODE模型337的给定能量值。评估520用于推导出校正项510,该校正项510与模型337一起得到校正模型530,校正模型530对物理参数的不确定性具有弹性。
例如,一些实施方式分析能量函数及其相对于时间的导数。例如,实施方式设计了强迫能量函数的导数为负定的校正项。一些实施方式基于以下认识:这种方法允许吸收物理参数的不确定性对气流状态的估计结果的影响。
在一些实现中,能量函数是观测误差的平方的积分的Lyapunov函数。以这种方式,对Lyapunov函数的导数的分析表明,校正项510能够使Lyapunov函数的导数始终为负而与不确定性的实际值无关。
为此,在各种实施方式中,该校正项包括有界不确定性范围、负增益以及在一组点处气流的测量结果与根据气流模型在这一组点处气流的估计结果之间的观测误差的乘积。在一个实施方式中,针对多个控制步骤在调节环境中迭代地更新气流状态,并且迭代地减小观测误差。
图6示出了根据一个实施方式的用于控制空调系统的迭代方法600的框图。该实施方式在时间上向前运行校正的ODE模型530,以估计在调节环境中的一组点/一组位置中的气流状态。这一组点对应于传感器130对气流状态的测量结果637,并且测量结果637与估计结果675之间的差在本文中被称为观测误差610。
具体地,因为方法600是迭代地执行的,所以该方法通过根据气流动力学模型530在时间上向前转变先前的气流状态,即,针对先前的控制步骤而确定的状态675,来确定在调节环境中的当前的气流状态675。先前的状态被转换,以减小当前的气流状态中的观测误差610。
一个实施方式针对整个调节环境(即,房间685的所有位置)估计当前的气流状态675,同时仅针对与测量结果637相对应的一组点使观测误差最小化。一种实现使用数据拟合技术来简化计算。附加地或另选地,一个实施方式使用逆投影算子595来估计在房间585的所有位置中的气流的全部值。最初用于将PDE解投影到更低维空间的投影现在逆转,以从低维空间中恢复覆盖整个房间的PDE解,即,高维空间中的气流。
在确定了整个调节环境685的气流状态之后,使用气流状态来控制690空调系统的运行,以在调节环境中实现一些期望的温度和舒适度。例如,气流状态能够与针对期望舒适度设置而获得的气流状态的期望设置点进行比较,然后能够将期望气流设置点与气流状态之间的误差发送给空调单元,以调整房间的温度或通风。
一些实施方式基于以下认识:也能够更新气流的校正模型的一些增益以提高状态估计的准确性。例如,由于校正项510,气流动力学的ODE模型530能够具有负增益以补偿物理参数的不确定性。但是,在离线时可能难以明确地确定负增益的最优值。
例如,一些实施方式被配置为迭代地更新气流动力学模型的至少一个增益以减小观测误差。实施方式能够使用数据驱动的优化来确定增益。数据驱动的优化的示例包括极值搜索优化、Gaussian(高斯)过程上置信界优化和模拟退火优化中的一种或组合。
图7示出了根据一些实施方式的用于自动调谐气流动力学模型的增益的方法的框图。图7的方法使用由ODE模型530估计的气流值,然后将估计结果与气流的测量结果737进行比较。然后,将使用这些值之间的观测误差760来评估性能成本函数710。在优化720中使用成本函数610,该优化搜索校正项510的增益的最佳可能值,同时满足稳定性约束725。然后使用增益的更新值730来更新ODE模型530。
优化720能够是任何数据驱动的优化744。例如,一个实施方式使用极值搜索优化741。另一实施方式使用Gaussian过程上置信界(GP-UCB)优化742。
气流模型的第一项的示例
一些实施方式考虑以下形式的非线性PDE 373系统的状态估计问题
(I)
其中,
函数h:D(A)×Rm→[D(A)]'满足h(0,0)=0并且局部Lipschitz(利普希茨)假设:对于每对(z,u),存在正常数εz、εu、Lz和Lu,使得
对于所有
对于低维子空间
同时
设T:
当
因此,TPOD的特定选择是自然的一个440,但是其它基函数460能够用于设计投影。例如,可以使用DMD基函数450。
不同的实现在估计器(2)中选择Bc和G的不同值。为了保证收敛,一个实施方式对于
Bc=TB (4)
以及
气流模型的第二项的示例
为了推导第二项237,一些实施方式使用控制理论,以通过向ODE模型337添加校正项220,来对在上一节中设计的名义估计器进行鲁棒化。
设PDE系统(1)375承认关于h的不确定性如下:
z(0)=z0,
y(t)=Cz(t), (6)
约束于Δh:H→H,满足以下假设。
而不确定性满足:
Δh:H→H约束于
根据估计器(2)的动力学,估计器的收敛依赖于矢量场G的设计。为了使上面提到的名义设计鲁棒化,一些实施方式使用Lyapunov重新设计方法,并且向ΔG220添加额外项以补偿不确定项Δh。
稳健的ODE估计器530写为
其中ΔG:
在这种情况下,相关的误差动态写为
其中,对于k<0,ΔG 220由下式给出:
并且任何
气流模型的基于学习的调谐的示例
上面提出的被动鲁棒化220保证了渐近性能。然而,一些实施方式对于改善估计器的瞬态性能也感兴趣。由于这个原因,一些实施方式通过用关于图7所示的学习内部参数(例如,估计器反馈增益k 730)的主动学习,来补充先前的被动鲁棒估计器来改进先前的被动鲁棒估计器。
为此,一些实施方式将主动学习与被动鲁棒ODE模型530合并在一起,以提高模型530的性能。实际上,能够从在线调谐中受益的一个参数是鲁棒Ode模型增益k730。
为了找到鲁棒ode模型增益730的最优值,一些实施方式使用数据驱动的优化720,以在鲁棒ode模型正在估计系统状态的同时在线地自动地调谐增益。反馈增益为
k=knominal+δk,knominal<0, (11)
其中,knominal代表估计器增益的标称值,并且δk是对增益的必要调整以改善估计器的瞬态性能。
学习成本函数710为
其中T>0,
一个实施方式使用以下基于时变振幅的极值搜索算法741来调谐δk
δk(t)=xk(t)+aksin(ωkt),
其中δk>0,ωk>0,εk>0是调谐增益。
另一实施方式使用Gaussian(高斯)过程上置信界算法742来优化鲁棒ode模型增益730。又一些实施方式使用其它数据驱动的优化算法744,例如,强化学习算法、神经网络、深度神经网络等。
能够以多种方式中的任何方法来实现本发明的上述实施方式。例如,可以使用硬件、软件或其组合来实现实施方式。当以软件实现时,软件代码能够在任何合适的处理器或处理器集上执行,无论其是设置在单台计算机中还是分布在多台计算机当中。这种处理器可以实现为集成电路,在集成电路组件中具有一个或更多个处理器。但是,可以使用任何适当格式的电路来实现处理器。
另外,本发明的实施方式可以体现为方法,已经提供了该方法的示例。作为该方法的一部分而执行的动作可以以任何合适的方式排序。因此,可以构造这样的实施方式,其中以与所示出的次序不同的次序执行动作,其包括同时执行一些动作,即使这些动作在示例性实施方式中被示为顺序动作。
在权利要求中使用诸如“第一”、“第二”之类的序数术语来修饰权利要求要素,本身并不意味着一个权利要求要素相对于另一权利要求要素的优先权、优先级或次序,或者执行方法动作的时间次序,而仅用作标签以将具有一定名称的一个权利要求要素与具有相同名称(除了使用序数词之外)的另一元素区分开,以区分权利要求要素。