【专利技术】一种基于数据驱动方式的运行优化控制方法

发布时间:2017-6-23 17:56:29

  申请日 2016.12.28

  公开(公告)日 2017.06.13

  IPC分类号 G05B19/418

  摘要

  一种基于数据驱动方式的运行优化控制方法,涉及一种工业运行控制方法,本发明涉及流程工业过程控制技术优化设计方案,包括以下步骤:多目标多约束最优运行控制问题的阐述;ADP的近似最优设定值设计;面向复杂工业过程控制系统的仿真与实验验证。针对现有复杂工业生产过程中常见的一些问题,如多时间尺度、运行指标生成轨迹、被控过程不能被精确建模和有界未知干扰等,在ADP框架下,有机融合DP、RL和H∞控制等方法,建立一套系统的、实用的数据驱动运行优化控制方法,并探索该方法在浮选过程和磨矿过程等流程工业过程中的具体应用,提炼经验和成果,使成果能为更多的复杂工业生产过程提供支持和保障。

  权利要求书

  1.一种基于数据驱动方式的运行优化控制方法,其特征在于,所述方法包括有双层多率运行控制;多目标多约束最优化运行控制;数据驱动的近似最优设定值设计;算法的收敛性和系统稳定性分析;多目标多约束最优运行控制包括:快时间尺度过程控制系统跟踪控制;用于解决最小化实际运行指标与理想运行指标偏差的慢时间尺度最优运行控制;控制输入、控制输出和运行指标约束;基于ADP的近似最优设定值设计包括两个阶段:将上层运行指标转化为H∞控制问题的具有有界干扰项的慢时间尺度离散系统H∞控制;以及有机融合DP、RL和H∞控制等方法,用于得到近似最优设定值而提出的一种不依赖模型参数的RL算法;面向复杂工业过程控制系统的仿真与实验验证的具体步骤为:采用仿真软件、半实物仿真平台和物理实验平台,联合验证理论方法和结果的有效性,并根据仿真和物理实验结果,对理论方法和控制技术做出相应的调整。

  2.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述快时间尺度过程控制系统跟踪控制中①考虑被控过程为非线性系统,运行指标生成轨迹为呈现非线性动态;②考虑上层运行过程和底层过程控制时间尺度不同;ƒ考虑控制输入受限、控制输出和运行指标受限。

  3.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述采用泰勒公式展开方法将非线性被控过程和运行指标生成轨迹在稳态附近线性化,冗余误差作为有界干扰。

  4.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述设定障碍函数,引入衰减因子,给出L2增益性能指标,将多目标多约束优化问题转化为H∞控制。

  5.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述方法将H∞控制问题转化为具有折扣因子的线性二次跟踪问题,折扣因子适用于理想运行指标非零情况下的最优跟踪问题;利用DP方法,并采用同构映射,给出新的Bellman方程;采用值函数近似,执行性能评估,实现目标最优性的必要条件,得到设定值更新策略,利用策略迭代得到学习最优设定值的RL算法。

  6.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述方法采用off-policy策略,在学习最优设定值过程中,采用任意允许控制作用系统生成数据,更新的设定值不作用于运行控制过程,避免不适当的设定值直接作用系统,影响或破坏系统正常运行。

  7.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述方法底层控制过程跟踪控制器设计采用传统的PI控制器,实现控制输出跟踪设定值。

  8.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述方法采用李雅普诺夫(Lyapuov)稳定性理论,最优控制理论,分析算法的收敛性及运行指标生成轨迹稳定性的条件。

  9.根据权利要求4所述的数据驱动的运行优化控制方案,其特征在于,为保证RL算法的收敛性,对设定值加入探针噪声,丰富数据,保证参数估计准确,确保RL算法的收敛性。

  10.根据权利要求1所述的一种基于数据驱动方式的运行优化控制方法,其特征在于,所述方法仿真和物理实验验证的具体步骤为:①采用Java、Matlab相关软件,编写程序,仿真验证运行优化控制算法;②采用磨矿过程半实物仿真平台,执行近似最优设定值设计算法和底层控制环近似最优控制器设计算法,验证磨矿粒度是否控制在理想范围内;③采用污水处理物理实验平台,执行近似最优设定值设计算法和底层控制环近似最优控制器设计算法,验证出水水质和能量使用是否控制在理想范围内。

  说明书

  一种基于数据驱动方式的运行优化控制方法

  技术领域

  本发明涉及一种工业运行控制方法,特别是涉及一种基于数据驱动方式的运行优化控制方法。

  背景技术

  工业过程控制中,设计的控制器不仅要镇定被控过程,使被控变量很好地跟踪参考输入,还要优化运行指标,即表征产品在加工中的质量指标、效率指标、能耗与物耗等相关的指标,这就需要研究运行优化控制。如果设定值(Setpoints)选取不适当,即使被控变量跟踪设定值,也不可能优化运行指标。因此,设定值设计是实现运行优化的一个关键问题。

  现代工业规模庞大、生产加工工序复杂,例如:我国的流程工业原料变化频繁,工况波动剧烈,并且生产过程涉及物理化学反应,机理复杂,上述特征突出表现为生产过程建模困难。运行指标不仅与工业过程有关,而且受运行条件、原材料价格和产品价格等多种因素影响,因而,其生成轨迹呈现非线性、多变量耦合和时变特征,很难构建精确的数学模型。这给传统的基于模型的运行优化控制方法带来严峻挑战。现有基于模型的运行优化控制方法即使已经在实际的工业运行优化与控制中应用,但是要求过程控制系统模型和运行指标生成轨迹精确已知,优化控制往往涉及参数校正,使得在现代大规模复杂工业生产应用中有很大的局限性,例如:计算量过大、设定值选取不优、运行指标不能保证等。

  近年来,得益于数字传感技术的发展和应用延伸,系统信息数据很容易抽取并且费用较低,数据驱动的控制方法得到了极大的关注和发展。

  数据驱动的优化控制方法对于复杂工业过程运行优化控制是一种非常有潜质的研究方向。

  面向复杂工业过程的数据驱动运行优化控制存在很多挑战性理论问题有待解决,包括:

  A. 不依赖运行指标生成轨迹和被控过程动态:以往的运行优化控制往往采用基于模型的实时优化(Real Time Optimization, RTO)控制、模型预测控制(ModelPredictiveControl, MPC)、非线性模型预测控制(Nonlinear Model Predictive Control,NMPC)等方法。鉴于复杂工业过程很难精确构建运行指标生成轨迹和被控过程动态的数学模型,如何设计不依赖运行指标生成轨迹和被控过程动态的算法,仅利用收集到的数据(包括控制输入、被控过程输出和实际运行指标值)估计最优设定值,并且保证算法的收敛性和目标优化的可实现性,是一亟待解决的问题;

  B. 多时间尺度采样和外界干扰:多时间尺度是复杂工业过程的一个比较常见现象,这种情况一般是由于物理化学现象中的强关联造成的。例如:磨矿过程中,矿石给料速度一般比产生规定的磨矿粒度快几百个数量级。并且,复杂工业过程中被控过程和运行指标受运行条件、外界环境干扰。多时间尺度和外界干扰使多目标多约束(优化多个运行指标,被控变量、控制输入和运行指标受限)运行优化控制问题变得更加复杂。

  发明内容

  本发明的目的在于提供一种基于数据驱动方式的运行优化控制方法,本发明采用将采用近似动态规划方法,以复杂工业应用为背景,采用双层层级架构,驱动最优运行控制。

  本发明的目的是通过以下技术方案实现的:

  一种基于数据驱动方式的运行优化控制方法,所述方法包括有双层多率运行控制;多目标多约束最优化运行控制;数据驱动的近似最优设定值设计;算法的收敛性和系统稳定性分析;多目标多约束最优运行控制包括:快时间尺度过程控制系统跟踪控制;用于解决最小化实际运行指标与理想运行指标偏差的慢时间尺度最优运行控制;控制输入、控制输出和运行指标约束;基于ADP的近似最优设定值设计包括两个阶段:将上层运行指标转化为H∞控制问题的具有有界干扰项的慢时间尺度离散系统H∞控制;以及有机融合DP、RL和H∞控制等方法,用于得到近似最优设定值而提出的一种不依赖模型参数的RL算法;面向复杂工业过程控制系统的仿真与实验验证的具体步骤为:采用仿真软件、半实物仿真平台和物理实验平台,联合验证理论方法和结果的有效性,并根据仿真和物理实验结果,对理论方法和控制技术做出相应的调整。

  所述的一种基于数据驱动方式的运行优化控制方法,所述快时间尺度过程控制系统跟踪控制中①考虑被控过程为非线性系统,运行指标生成轨迹为呈现非线性动态;②考虑上层运行过程和底层过程控制时间尺度不同;ƒ考虑控制输入受限、控制输出和运行指标受限。

  所述的一种基于数据驱动方式的运行优化控制方法,所述采用泰勒公式展开方法将非线性被控过程和运行指标生成轨迹在稳态附近线性化,冗余误差作为有界干扰。

  所述的一种基于数据驱动方式的运行优化控制方法,所述设定障碍函数,引入衰减因子,给出L2增益性能指标,将多目标多约束优化问题转化为H∞控制。

  所述的一种基于数据驱动方式的运行优化控制方法,所述方法将H∞控制问题转化为具有折扣因子的线性二次跟踪问题,折扣因子适用于理想运行指标非零情况下的最优跟踪问题;利用DP方法,并采用同构映射,给出新的Bellman方程;采用值函数近似,执行性能评估,实现目标最优性的必要条件,得到设定值更新策略,利用策略迭代得到学习最优设定值的RL算法。

  所述的一种基于数据驱动方式的运行优化控制方法,所述方法采用off-policy策略,在学习最优设定值过程中,采用任意允许控制作用系统生成数据,更新的设定值不作用于运行控制过程,避免不适当的设定值直接作用系统,影响或破坏系统正常运行。

  所述的一种基于数据驱动方式的运行优化控制方法,所述方法底层控制过程跟踪控制器设计采用传统的PI控制器,实现控制输出跟踪设定值。

  所述的一种基于数据驱动方式的运行优化控制方法,所述方法采用李雅普诺夫(Lyapuov)稳定性理论,最优控制理论,分析算法的收敛性及运行指标生成轨迹稳定性的条件。

  所述的数据驱动的运行优化控制方案,其为保证RL算法的收敛性,对设定值加入探针噪声,丰富数据,保证参数估计准确,确保RL算法的收敛性。

  所述的一种基于数据驱动方式的运行优化控制方法,所述方法仿真和物理实验验证的具体步骤为:①采用Java、Matlab相关软件,编写程序,仿真验证运行优化控制算法;②采用磨矿过程半实物仿真平台,执行近似最优设定值设计算法和底层控制环近似最优控制器设计算法,验证磨矿粒度是否控制在理想范围内;③采用污水处理物理实验平台,执行近似最优设定值设计算法和底层控制环近似最优控制器设计算法,验证出水水质和能量使用是否控制在理想范围内。

相关推荐