集成神经网络污水处理软测量方法

发布时间:2018-8-3 17:15:42

  申请日2012.08.30

  公开(公告)日2013.01.02

  IPC分类号G06N3/02; G01N33/18

  摘要

  一种基于集成神经网络的污水处理软测量方法属于污水处理领域。污水处理过程是一个高度非线性、时变性及复杂性的过程,关键水质指标的测量对控制水污染有着至关重要的作用,本发明针对污水处理软测量过程中多个关键水质参数同时软测量精度的问题,提出了一种集成神经网络模型对出水COD、出水BOD、出水TN进行测量,模型中充分利用三个出水关键水质参数之间的耦合关系,建立了包含三个子前馈神经网络的集成神经网络模型,同时运用粒子群算法对各个子神经网络进行训练,得到各个子神经网络的最佳结构。最后用已训练好的神经网络对出水COD、出水BOD、出水TN进行预测,预测结果精确。

  权利要求书

  1.一种基于集成神经网络的污水处理软测量方法,其特征在于包 括以下步骤:

  (1).输入输出变量的选择;

  在污水处理过程中,流量Q、进水浊度、进水固体悬浮物浓度 SS、曝气池溶解氧DO、水温T、污水酸碱度pH、氧化还原电位ORP、 混合液悬浮固体浓度MLSS以及出水固体悬浮物浓度SS对关键水质 参数出水COD、出水BOD影响较大;流量Q、进水浊度、进水SS及 NH4+-N、曝气池溶解氧DO、T、pH、ORP、MLSS、NO3-以及出水SS、 NH4+-N对出水TN影响较大;将以上的参量精简输入变量与输出变 量,具体的步骤包括变量数据的归一化处理、变量的主元分析,具体 如下:

  ①.变量数据的归一化处理:在对数据进行主元分析之前,首先 要对样本数据进行归一化处理,归一化的公式如下:

   D ij * = D ij - D j σ j - - - ( 1 )

  其中表示归一化后的样本数据,其中i为样本数,j为样本分量,Dij表示第i个样本的第j个分量,为第j个样本分量的均值,σj为变 量Dj的标准差,其中表示为:

   D j = 1 m Σ i = 1 m D ij - - - ( 2 )

  式中m表示第j个样本分量的样本数,σj表示第j个样本分量的偏差, 表示为:

   σ j = 1 m - 1 Σ i = 1 m ( D ij - D j ) 2 - - - ( 3 )

  通过以上的归一化处理,样本数据被归一化到[-1,+1]之间;

  ②.变量的主元分析:下面对经过归一化后的样本数据进行主元分 析,通过主元分析法,将子神经网络的输入样本个数减少,得到的最 终输入变量的结果是:测量出水COD的输入辅助变量是进水流量Q、 进水SS、曝气池DO、MLSS;测量出水BOD的输入辅助变量是进 水流量Q、曝气池DO、MLSS、pH;测量出水TN的输入辅助变量 是进水流量DO、NH4-N、NO3-、进水浊度;

  (2).建立各个子神经网络模型;

  此集成神经网络包含三个子神经网络,每个子神经网络为一个三 层的前馈神经网络,三个子神经网络的输出分别为出水COD、出水 BOD、出水TN;

  建立三个三层前馈神经网络模型,三个子神经网络的结构为l-k-1 结构,根据实际情况,三个子神经网络中l,k取不同的值;

  首先要对网络进行初始化,若网络选择l-k-1结构,则表示网络 输入层有l个神经元,隐含层有k个神经元,输出层有1个神经元, x1,x2,...,xl表示网络的输入,则对于输入层第p个神经元而言,其输出 为:

   Y p I = X p I - - - ( 5 )

  其中,表示网络输入层的输入,表示网络输入层的输出;

  隐含层共有k个神经元,隐含层第q个神经元的输入为:

   X q H = Σ q = 1 w pq Y p I - - - ( 6 )

  其中,表示网络隐含层的输入,wpq表示输入层与隐含层之间的连 接权值;

  隐含层第q个神经元的输出为:

   Y q H = f q H ( X q H ) - - - ( 7 )

  其中,表示隐含层的输出,表示隐含层神经元的转换函数, 在此选为sigmoid函数,其形式为:

   f q H ( X q H ) = 1 1 + e - X q H - - - ( 8 )

  输出层神经元的净输入为:

   X O = Σ q = 1 w q Y q H - - - ( 9 )

  其中,XO表示输出层的输入,wq为第q个神经元与输出层神经元之 间的连接权值;

  输出层神经元的输出,即网络的实际输出为:

  yO=fO(XO) (10)

  其中,yO表示网络输出层的输出,fO(XO)为输出层神经元的线性作 用函数,在此yO表示为:

   y O = Σ q = 1 w q Y q H - - - ( 11 )

  定义误差函数为:

   E = 1 M Σ t = 1 M ( y O ( t ) - y ( t ) ) T ( y O ( t ) - y ( t ) ) - - - ( 12 )

  其中,式中yO(t)表示第t个样本的实际输出,y(t)为第t个样本的期 望输出,M表示神经网络的样本数,T表示转置,训练神经网络的目 的是使得式(12)定义的误差函数达到最小;

  (3).子神经网络结构的确定及子网络的集成;

  ①.出水COD子神经网络软测量模型;

  在集成神经网络中,对于出水COD的软测量采用一个三层的前 馈神经网络,网络的输入辅助变量为进水流量Q、进水SS、曝气池 DO、MLSS,网络的隐含层神经元个数选为10,输出神经元个数为1, 输出为出水COD;

  ②.出水BOD子神经网络的软测量模型;

  在污水处理过程中,出水BOD与出水COD之间存在着大的耦 合关系,在多输入多输出神经网络对出水BOD的软测量中,充分利 用这一耦合关系,即在测量出水BOD时其输入辅助变量在原先的输 入变量基础上加入出水COD,这样测量的出水BOD比输入变量中单 纯的只有流量Q、曝气池DO、MLSS、pH更加精确,同时隐含层神 经元个数取12,输出层神经元个数为1,输出为出水BOD;

  ③.出水TN子神经网络的软测量模型;

  在污水处理过程中,污水中含氮量与出水BOD之间的密切关系, 因此为了更加准确的测量出水TN,在神经网络输入辅助变量中加入 出水BOD,即输入变量变为DO、NH4-N、NO3-、进水浊度、出水 BOD,同时网络的隐含层神经元个数为13,输出层神经元个数为1, 输出为出水TN;

  ④.子神经网络的集成;

  确定各个网络的输入变量,输出变量,网络层数,网络隐含层个 数后,即得到三个子神经网络,通过三个输出变量之间的关系进行集 成,得到集成神经网络;

  (4).对集成神经网络进行训练;

  本集成神经网络是由三个子神经网络组成,每一个子网络单独训 练,神经网络用粒子群算法进行训练,找到集成神经网络中各个子神 经网络的权值,从而得到集成神经网络的模型;

  (5).用训练好的神经网络模型对预测样本进行预测,将预测样本 数据作为网络的输入,出水COD、出水BOD、出水TN作为网络的 输出,得到预测结果。

  说明书

  一种基于集成神经网络的污水处理软测量方法

  技术领域

  软测量是检测技术及仪表研究的主要发展趋势之一,是先进制造技术领域的重要分支,本发明涉及污水处理过程中出水水质指标的软测量方法,属于污水处理领域。

  背景技术

  随着我国国民经济的迅猛发展,城市规模不断扩大,人口数目增长迅速,随之而来的是城市污水的水量不断加大,水质也越来越复杂,并且有继续恶化的趋势。我国大部分城市95%的污水未经处理排放入水体,仅仅依靠稀释及水体自净作用已经无法使污水满足达标排放的要求,并且会对下游水体产生较大的污染和影响。在这种情况下,就不得不采取措施加大对城市污水的处理力度,以改善不断恶化的水环境污染趋势。污水处理过程中关键水质参数的及时准确测量反应了污水处理效果,因此,本发明的研究成果具有广阔的应用前景。

  污水排放标准中,衡量污水是否达标的参数指标有:出水化学需氧量COD、出水生化需氧量BOD、悬浮物、氨氮、磷等。其中出水COD、出水BOD、出水TN的准确测量对控制水体污染具有重要的意义。

  由于软测量的方法仅需检测一些易测变量,其它工作则只要通过软件即可实现,无需多少投资和时间,并且,软测量的方法具有响应迅速,易于保养和维护等优点,所以采用软测量方法对污水处理关键水质参数进行测量是当今污水处理领域应用最广的一种方法。

  软测量技术的核心就是建立数学模型。由于污水处理过程是一个强耦合的多输入、多输出的动态系统,具有时变、高度非线性、不确定性、滞后等特点。传统的数学建模的方法受到了挑战。智能建模是当前工业领域中倍受关注的研究热点,它可根据对象的输入输出数据直接进行建模。智能建模中,基于人工神经网络的软测量建模方法是近年来研究较多、发展很快和应用范围广泛的一种软测量建模方法。 通过神经网络的学习来解决不可测变量的软测量问题,使得模型的在线校正能力强,并能应用于高度非线性和严重不确定性系统。

  近年来,多种神经网络模型应用于污水处理软测量中,就神经网络的输出个数而言,可分为多输入单输出的神经网络,多输入多输出的神经网络,由于污水处理过程需要测量多个关键水质参数,多输入多输出神经网络是目前的研究趋势,但是此种网络也存在很大的问题,比如神经网络学习算法选择的问题,输出精度的问题等等,针对这些问题,本发明提出了一种基于集成神经网络的污水处理关键水质参数的软测量方法,是一种精度更高的多输入多输出神经网络模型。

  发明内容

  本发明获得了一种基于集成神经网络的污水处理关键水质参数的软测量方法。该方法通过分析出水COD、出水BOD、出水TN之间的耦合关系,建立一种包含三个子前馈神经网络的集成神经网络模型,同时运用粒子群算法对各个子神经网络进行训练,继而完成了三个关键出水水质参数的软测量。

  本发明采用了如下的技术方案及实现步骤:

  一种基于集成神经网络的污水处理软测量方法,其特征在于能够利用各个子网络之间的耦合关系建立集成神经网络,使测量结果更加精确,包括以下步骤:

  (1).输入输出变量的选择;

  本发明的目的是预测出水COD、出水BOD、出水TN,所以集成神经网络的输出为出水COD、出水BOD、出水TN。在污水处理过程中,流量Q、进水浊度、进水固体悬浮物浓度SS、曝气池溶解氧DO、水温T、污水酸碱度PH、氧化还原电位ORP、混合液悬浮固体浓度MLSS以及出水固体悬浮物浓度SS等参数对关键水质参数出水COD、出水BOD影响较大。流量Q、进水浊度、进水SS及NH4+-N、曝气池溶解氧DO、T、PH、ORP、MLSS、NO3-以及出水SS、NH4+-N对出水TN影响较大。由于以上的参量过多,若都作为神经网络的输入辅助变量,会造成神经网络结构过于复杂,为了使网络结 构简单精确化,需要精简输入变量与输出变量,具体的步骤包括变量数据的归一化处理、对变量异常数据的剔除、变量的主元分析,具体如下:

  ①.变量数据的归一化处理:在对数据进行主元分析之前,首先要对样本数据进行归一化处理,归一化的公式如下:

   D ij * = D ij - D j σ j - - - ( 1 )

  其中 表示归一化后的样本数据,其中i为样本数,j为样本分量,Dij表示第i个样本的第j个分量, 为第j个样本分量的均值,σj为变量Dj的标准差,其中 可表示为:

   D j = 1 m Σ i = 1 m D ij - - - ( 2 )

  式中m表示第j个样本分量的样本数,式中σj表示第j个样本分量的偏差,表示为:

   σ j = 1 m - 1 Σ i = 1 m ( D ij - D j ) 2 - - - ( 3 )

  通过以上的归一化处理,样本数据被归一化到[-1,+1]之间;

  ②.变量的主元分析:下面对经过归一化后的样本数据进行主元分析,即利用变量数据之间的线性相关关系对多维信息进行统计压缩,用少部分互不相关的主元变量描述多维空间绝大部分的动态信息;

  归一化后的变量A=[A1,A2,...,Am],其中A表示经过归一化后的变量,A的协方差矩阵为s,矩阵s的特征根依次排列为,其中λ1,λ2Iλ-m表示矩阵s的特征根,与其对应的单位正交特征向量组成的矩阵即负荷矩阵为L=[L1,L2,...,Lm],若a为能分得的最小主元个数,将矩阵A分解成主成分得分矩阵K与负荷矩阵L的外积加上残差项E,即

   A = KL T + E = K 1 L 1 T + K 2 L 2 T + · · · K q L a T + E - - - ( 4 )

  计算累计方差贡献率 时所需的最小主元个数 a的值,并在A中选出相应的a个主元;

  通过以上的主元分析法,将子神经网络的输入样本个数减少,得到的最终输入变量的结果是:测量出水COD的输入辅助变量是进水流量Q、进水SS、曝气池DO、MLSS;测量出水BOD的输入辅助变量是进水流量Q、曝气池DO、MLSS、PH;测量出水TN的输入辅助变量是进水流量DO、NH4-N、NO3-、进水浊度;

  (2).建立各个子神经网络模型;

  此集成神经网络包含三个子神经网络,每个子神经网络为一个三层的前馈神经网络,三个子神经网络的输出分别为出水COD、出水BOD、出水TN;

  建立三个三层前馈神经网络模型,三个子神经网络的结构为l-k-1结构,根据实际情况,三个子神经网络中l,k取不同的值;

  首先要对网络进行初始化,若网络选择l-k-1结构,则表示网络输入层有l个神经元,隐含层有k个神经元,输出层有1个神经元,x1,x2,...,xl表示网络的输入,则对于输入层第p个神经元而言,其输出为:

   Y p I = X p I - - - ( 5 )

  其中, 表示网络输入层的输入, 表示网络输入层的输出;

  隐含层共有k个神经元,隐含层第q个神经元的输入为:

   X q H = Σ q = 1 w pq Y p I - - - ( 6 )

  其中, 表示网络隐含层的输入,wpq表示输入层与隐含层之间的连接权值;

  隐含层第q个神经元的输出为:

   Y q H = f q H ( X q H ) - - - ( 7 )

  其中, 表示隐含层的输出, 表示隐含层神经元的转换函数,在此选为sigmoid函数,其形式为:

   f q H ( X q H ) = 1 1 + e - X q H - - - ( 8 )

  输出层神经元的净输入为:

   X O = Σ q = 1 w q Y q H - - - ( 9 )

  其中,XO表示输出层的输入,wq为第q个神经元与输出层神经元之间的连接权值;

  输出层神经元的输出,即网络的实际输出为:

  yO=fO(XO) (10)

  其中,yO表示网络输出层的输出,fO(XO)为输出层神经元的线性作用函数,在此yO表示为:

   y O = Σ q = 1 w q Y q H - - - ( 11 )

  定义误差函数为:

   E = 1 M Σ t = 1 M ( y O ( t ) - y ( t ) ) T ( y O ( t ) - y ( t ) ) - - - ( 12 )

  其中,式中yO(t)表示第t个样本的实际输出,y(t)为第t个样本的期望输出,M表示神经网络的样本数,T表示转置,训练神经网络的目的是使得式(12)定义的误差函数达到最小;

  (3).子神经网络结构的确定及子网络的集成;

  ①.出水COD子神经网络软测量模型;

  在集成神经网络中,对于出水COD的软测量采用一个三层的前馈神经网络,网络的输入辅助变量为进水流量Q、进水SS、曝气池DO、MLSS。

  ②.出水BOD子神经网络的软测量模型;

  在污水处理过程中,对于一般的有机物,生物氧化时用于呼吸产生能量的约占1/3,合成细胞物质的约占2/3,内源呼吸全部完成时,残留物约为细胞物质的20%,因此得到如下式子:

  BODu≈1/3COD+(2/3)×0.8COD=0.87COD

  BOD5≈2/3BODu (13)

  BOD5≈(2/3)×0.87COD ≈0.58COD

  其中,BODu为总的生化需氧量,BOD5为五日生化需氧量,从公式(14)可以得出出水BOD与出水COD之间存在很大的耦合关系,多输 入多输出神经网络对出水BOD的软测量中,可以充分利用这一耦合关系,所以在测量出水BOD时其输入辅助变量在原先的输入变量基础上加入出水COD,这样测量的出水BOD比输入变量中单纯的只有流量Q、曝气池DO、MLSS、PH更加精确。

  ③.出水TN子神经网络的软测量模型;

  在污水处理过程中,生物除氮量N生物可表示为:

  N生物=0.125XB,H+0.08XP (14)

  式中Xp表示微生物进入内源呼吸状态后产生的内源衰减残留物量,XB,H表示活性生物固体产量,XB,H可按下式计算:

  XBH=BOD5YH(1+θcbH) (15)

  式中YH表示产率系数,θc表示泥龄,bH表示异养菌微生物内源衰减系数。从公式(15)和公式(16)可以得到如下的式子:

  从公式(16)可以看出污水中含氮量与出水BOD之间的密切关系,因此为了更加准确的测量出水TN,在神经网络输入辅助变量中加入出水BOD,即输入变量变为DO、NH4-N、NO3-、进水浊度、出水BOD。

  ④.子神经网络的集成;

  确定各个网络的输入变量,输出变量,网络层数,网络隐含层个数后,即得到三个子神经网络,可以通过三个输出变量之间的关系进行集成,得到如图1所示的集成神经网络。

  (4).对神经网络进行训练;

  本集成神经网络是由三个子神经网络组成,每一个子网络单独训练,在本方案中,神经网络用粒子群(PSO)算法进行训练,PSO算法中假设在d维搜索空间中第i个粒子的位置和速度分别为:

   X r = ( x r , 1 , x r , 2 , · · · , x r , d ) , 1 r N , 1 d D - - - ( 17 )

   V r = ( v r , 1 , v r , 2 , · · · , v r , d ) , 1 r N , 1 d D

  其中,N表示粒子的总个数,D表示搜索空间的最大维数,xi,d表示第r个粒子在d维空间上的位置,vr,d表示第r个粒子在d维空间上的速度,粒子通过跟踪两个最优解来更新自己,一个是粒子本身找到的最优解,即个体极值(pbest),第r个粒子找到的最优值可表示为 其中pr,d表示第r个粒子在d维空间上找到的最优值,另一个就是到目前为止整个群体中找到的最优解,即全局最优解(gbest),全局最优解可表示为 其中pg,d表示所有粒子在d维空间上找到的最优值,而函数值F(gbest)记录当前的最优目标函数值。在迭代过程中gbest在寻优过程随着个体极值的更新而不断进行更新。粒子根据如下的公式来更新的速度和新的位置:

  vr,d(t+1)=vr,d(t)+c1r1[pr,d-xr,d(t)]+c2r2[pg,d-xr,d(t)]

  xr,d(t+1)=xr,d(t)+vr,d(t+1) (18)

  1≤r≤N,1≤d≤D

  其中,c1,c2表示正的学习因子,r1,r2表示0,1之间均匀分布的随机数;

  PSO算法的基本流程如下:

  ①.PSO算法参数初始化,选定c1,c2的值,选定粒子数N,维数D和最大迭代次数,在本集成神经网络中,分别单独训练三个子神经网络;

  ②.评价每个粒子的适应度,在本发明中根据公式(12)所示的误差函数计算各个粒子的适应度值,将当前各微粒的位置和适应值最优值存储在各微粒的个体最优值pbest中,将所有粒子的个体最优值pbest中适应值最优个体即误差最小个体的位置和适应值存储于全局最优值gbest中;

  ③.用式(18)更新粒子的速度和位移;

  ④.根据目标函数计算更新以后的新粒子的适应度值,将其适应值与与其经历过的最好位置作比较,如果较好,则将其作为当前的最好位置,将当前各微粒的位置和适应值最优值存储在各微粒的个体最优值pbest中;

  ⑤.比较当前的所有pbest和gbest的值,更新gbest;

  ⑥.若满足停止条件(达到集成神经网络要求的精度0.001),搜索停止,输出结果,否则返回③继续搜索;

  (5).按照(4)方法分别单独训练三个子神经网络直到满足规定的均方误差为止;

  (6).用训练好的神经网络对预测样本进行预测,将预测样本数据作为网络的输入,出水COD、出水BOD、出水TN作为网络的输出。

  本发明的创造性主要体现在:

  (1).本发明针对在污水处理过程中多个关键水质参数难于同时测量的问题,提出了一种集成神经网络模型,此模型是一种多输入多输出的神经网络模型,在结构上充分利用了出水COD、出水BOD、出水TN之间的耦合关系,预测结果更加准确。

  (2).本发明采用粒子群算法训练每个子神经网络,与以往文章中在多输入多输出神经网络中用传统的学习算法训练神经网络相比较更加迅速,更加准确。

相关推荐