申请日2019.07.16
公开(公告)日2019.09.17
IPC分类号G06Q10/06; G06Q50/26; G06K9/62
摘要
本发明涉及机器学习领域,特别涉及一种基于机器学习的污水处理的水质预测方法及系统,所述方法包括确定污水的测量参数和污水处理的行业标准,并初始化污水的测量参数,并将测量参数的特征权重向量初始化为1;获取污水测量参数的适应度,将适应度最大的个体作为最优的个体;将最优的个体复制n‑1个,并在每个复制的个体上的特征权重上加一个随机值;获取当前个体的适应度,选择适应度最大的个体作为最优的个体;若达到最大迭代次数,则输出最优的特征权重向量;将得到最优特征向量输入线性支持向量机;将实时污水测量参数输入完成训练的线性支持向量机即可得到预测结果;本发明可以有效地对污水质量进行预测,为实际的污水处理提供辅助。
权利要求书
1.一种基于机器学习的污水处理的水质预测方法,其特征在于,具体包括以下步骤:
S1、确定污水的测量参数和污水处理的行业标准,并初始化污水的测量参数,并将测量参数的特征权重向量初始化为1,表示为为v0(i)=1;所述污水的测量参数至少包括CODcr出水、PH值、溶解氧DO、氨氮NH3-N;
S2、通过线性支持向量机获取污水测量参数的适应度,将适应度最大的个体作为最优的个体,令i=1;
S3、在第i次迭代中,将最优的个体复制n-1个,并在每个复制的个体上的特征权重上随机加上一个区间[0,max_variation]内的值;
S4、通过线性支持向量机获取当前个体的适应度,选择适应度最大的个体作为最优的个体;
S5、判断是否达到最大迭代次数,若没达到则令i=i+1,返回步骤S3;否则输出最优的特征权重向量;
S6、将得到最优特征向量输入线性支持向量机进行训练,训练完成后将实时污水测量参数输入线性支持向量机中,即可得到预测结果;
其中,n为预定的种群数量;max_variation为预设的单代最大变异度;vj(i)为第j个污水的测量参数的特征向量,1≤i≤m,m为该测量参数的特征向量的维数。
2.根据权利要求1所述的一种基于机器学习的污水处理的水质预测方法,其特征在于,所述适应度为个体的F1分数,F1分数为支持向量机在验证集上的性能参数。
3.一种基于机器学习的污水处理的水质预测系统,其特征在于,包括数据输入模块、基于线性支持向量机的预测模块和水务平台污水检测子系统;所述数据输入模块包括历史数据存储器、实时数据缓存器以及期望数据存储器;其中:
历史数据存储器用于存储污水处理厂最近几天实时检测到的水务数据;
期望数据存储器用于存储污水处理的行业标准的数据;
实时数据缓存器用于缓存实时监测到的水务数据;
基于线性支持向量机的预测模块用于根据历史数据存储器和期望数据存储器的数据对实时数据缓存器中的数据进行预测;
水务平台污水检测子系统用于获取水务信息。
4.根据权利要求1所述的一种基于机器学习的污水处理的水质预测系统,其特征在于,所述水务平台污水监测子系统包括数据采集单元和数据存储打印单元,所述数据采集单元包括CODcr出水检测装置、PH值检测装置、溶解氧DO检测装置、氨氮NH3-N检测装置;数据采集单元将各个检测装置检测的污水的测量参数通过数据存储打印单元存储打印。
5.根据权利要求4所述的一种基于机器学习的污水处理的水质预测系统,其特征在于,污水处理厂的每种污水处理设备的出水口至少设置有一个数据采集单元。
6.根据权利要求1所述的一种基于机器学习的污水处理的水质预测系统,其特征在于,基于线性支持向量机的预测模块包括线性支持向量机,将历史数据存储器中的数据和期望数据存储器的数据输入线性支持向量机进行训练获得特征权值,线性支持向量机训练获得最优特征权值的过程中,调用线性支持向量机在验证集上的性能F1分数作为筛选特征权值的指标;将实时数据缓存器中的数据作为线性支持向量机的输入,线性支持向量机输出对污水处理的预测结果。
说明书
一种基于机器学习的污水处理的水质预测方法及系统
技术领域
本发明涉及机器学习领域,特别涉及一种基于机器学习的污水处理的水质预测方法及系统。
背景技术
水环境治理一直是民生关心的一大问题,其中污水处理更是第一要务。现阶段,随着我国社会水平逐步提高、工业化发展程度的加深,社会用水需求量大,工业污水排放量增加,使我国水资源环境遭到一定程度的破坏,水资源短缺、水生态损害、水环境污染等问题越来越突出,水安全保障面临严峻的挑战。在政府水务治理规划中,黑臭水体整治更是目前城镇水务工作的重中之重。因此,为了促进我国生态文明的建设,减少水资源浪费,需要做好污水处理工作,加强水资源的循环应用,达到我国可持续发展的规划。
近年来,随着水务治理工作的推进,污水处理的情况得到较大改善。但污水处理过程是一个变量繁多、具有时滞特点的动态非线性反应过程。如果我们能从以往的污水水质数检测标准数据预测出以后实时阶段的水质数据,对即将突发的水质问题进行预警、及时处理。对于水务工厂的长期安稳运行具有重要的意义
在现有的污水处理领域中,针对于污水厂水质预测现阶段大部分是人工的方式去设计或提取水质数据的特征来实现数据的处理,这种方法的缺点在于需要耗费大量的劳动力且得出的特征往往局限于特定的任务,并且最主要的问题在于由于污水水质是实时变化的当污水水质出现问题后不能保证实时的解决。因此现有技术往往直接采用传统的信息检索中的一些方法来提取水质数据中的特征而这些传统方法并不能很好捕捉到我们所需要的信息,并且不能及时的对出现的问题进行补救。
发明内容
为了更加有效地对污水处理进行预测,本发明提出一种基于机器学习的污水处理的水质预测方法及系统,所述方法具体包括以下步骤:
S1、确定污水的测量参数和污水处理的行业标准,并初始化污水的测量参数,并将测量参数的特征权重向量初始化为1为v0(i)=1;
S2、通过线性支持向量机获取污水测量参数的适应度,将适应度最大的个体作为最优的个体,令i=1;
S3、在第i次迭代中,将最优的个体复制n-1个,并在每个复制的个体上的特征权重上随机加上一个[0,max_variation]的值;
S4、通过线性支持向量机获取当前个体的适应度,选择适应度最大的个体作为最优的个体;
S5、判断是否达到最大迭代次数,若没达到则令i=i+1,返回步骤S3;否则输出最优的特征权重向量;
S6、将得到最优特征向量输入线性支持向量机,完成训练;将实时污水测量参数输入完成训练的线性支持向量机即可得到预测结果;
其中,n为预定的种群数量;max_variation为预设的单代最大变异度;vj(i)为第j个污水的测量参数的特征向量,1≤i≤m,m为该测量参数的特征向量的维数。
进一步的,所述适应度为个体的F1分数,F1分数为支持向量机在验证集上的性能参数。
所述污水的测量参数至少包括CODcr出水、PH值、溶解氧DO、氨氮NH3-N。
本发明还提出一种基于机器学习的污水处理的水质预测系统,包括数据输入模块、基于线性支持向量机的预测模块和水务平台污水检测子系统;所述数据输入模块包括历史数据存储器、实时数据缓存器以及期望数据存储器;其中:
历史数据存储器用于存储污水处理厂最近几天实时检测到的水务数据;
期望数据存储器用于存储污水处理的行业标准的数据;
实时数据缓存器用于缓存实时监测到的水务数据;
基于线性支持向量机的预测模块用于根据历史数据存储器和期望数据存储器的数据对实时数据缓存器中的数据进行预测;
水务平台污水检测子系统用于获取水务信息。
进一步的,所述水务平台污水监测子系统包括数据采集单元和数据存储打印单元,所述数据采集单元包括CODcr出水检测装置、PH值检测装置、溶解氧DO检测装置、氨氮NH3-N检测装置;数据采集单元将各个检测装置检测的污水的测量参数通过数据存储打印单元存储打印。
进一步的,污水处理厂的每种污水处理设备的出水口至少设置有一个数据采集单元。
进一步的,基于线性支持向量机的预测模块包括线性支持向量机,将历史数据存储器中的数据和期望数据存储器的数据输入线性支持向量机进行训练获得特征权值,线性支持向量机训练获得最优特征权值的过程中,调用线性支持向量机在验证集上的性能F1分数作为筛选特征权值的指标;将实时数据缓存器中的数据作为线性支持向量机的输入,线性支持向量机输出对污水处理的预测结果。
本发明提出的一种基于机器学习的污水处理水质预测方法是基于遗传算法与支持向量机的水质做出预测模型对于整个原始数据进行初始化,利用遗传算法筛选出最佳特征权重来对原始数据进行加权放缩,训练模型对污水处理水质完成预测;对于整个原始数据(原始数据参数)进行初始化,并将其权重都设置相同进行标准化;其次利用遗传算法筛选出最佳特征权重vk来对原始数据进行加权放缩;最后利用加权后的数据对支持向量机模型进行训练得到最终的污水水质预测模型,达到实时预测污水质量,人为进行辅助调控的目的。(发明人马创;袁野;尤海生)