欧彦
污水处理过程出水水质稀疏鲁棒建模
2022-5-24 16:57
阅读:2094

引用本文

闻超垚, 周平. 污水处理过程出水水质稀疏鲁棒建模. 自动化学报, 2022, 48(6): 1469−1481 doi: 10.16383/j.aas.c200707

Wen Chao-Yao, Zhou Ping. Sparse robust modeling of effluent quality indices in wastewater treatment process. Acta Automatica Sinica, 2022, 48(6): 1469−1481 doi: 10.16383/j.aas.c200707

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200707?viewType=HTML


文章简介


关键词


RVFLNs, 稀疏鲁棒建模, 稀疏偏最小二乘, 广义M估计, 污水处理, 水质指标


摘   要


污水处理过程中, 出水水质参数是衡量污水处理性能的最重要指标, 需要进行严格监测, 但现有传感技术难以对其进行实时准确地在线测量. 因此, 提出一种新型的基于随机权神经网络(Random vector functional-link networks, RVFLNs)与Schweppe型广义M估计(Generalized M-estimation, GM-estimation)的稀疏鲁棒建模方法, 用于水质指标的在线鲁棒预测. 首先, 针对常规RVFLNs隐含层矩阵存在多重共线性而导致最小二乘估计失效的问题, 利用稀疏偏最小二乘(Sparse partial least squares, SPLS)代替RVFLNs输出权值求解的最小二乘估计, 从而提出SPLS-RVFLNs. 该算法不仅可有效解决传统RVFLNs的多重共线性问题, 还可以进行建模变量选择, 提高模型的可解释性和最终的预测精度. 同时, 考虑到SPLS-RVFLNs在求解输出权值时会同时受到隐含层矩阵和输出层矩阵两个方向离群点的影响, 进一步采用Schweppe型广义M估计对SPLS-RVFLNs进行鲁棒改进, 从而提出GM-SPLS-RVFLNs, 可显著提高模型的稀疏鲁棒性能. 最后, 将提出的GM-SPLS-RVFLNs用于污水处理过程出水水质指标预测建模, 数据实验结果表明所提方法不仅解决了常规RVFLNs多重共线性和鲁棒性差的问题, 而且具有很好的预测精度和泛化性能.


引   言


随着工业化的发展和生态污染的加剧, 我国水资源短缺问题日益严重, 已经成为制约经济社会发展的瓶颈问题. 污水处理可有效缓解水资源匮乏问题并且减少环境污染. 活性污泥法是目前最为常用的污水处理方法, 其利用微生物菌群的生物特性, 通过硝化、反硝化等生物化学反应, 对污水中的可溶性有机物进行分解和氧化, 从而使得污水得到净化, 达到排放标准. 活性污泥法污水处理过程工艺示意图如图1所示, 污水首先经过格栅间去除较大体积的固体污染物, 然后通过进水泵的作用进入初沉池, 去除大部分固体悬浮物. 经过初沉池的出水进入生化反应池, 生化反应池是活性污泥法的核心环节, 分为厌氧区和好氧区两个部分. 在厌氧区, 利用厌氧菌的无氧呼吸完成反硝化反应, 可以将污水中的硝态氮还原成氮气释放出来; 在好氧区, 通过硝化反应将氨氮转化成硝酸盐, 回流到厌氧区进行反硝化反应使有机物被降解. 最后, 经过生化池处理的出水流入二沉池进行固液分离, 上层清水从出水口排出进行消毒处理, 以使水质达到排放标准. 而下层沉淀后的污泥一部分继续回流到生化池中, 另一部分污泥与初沉池的污泥混合经过浓缩、消化、脱水等处理后回收利用.


10.16383-j.aas.c200707-Figure1.jpg

图 1  污水处理过程工艺流程图


污水处理是一个具有复杂生化反应的非线性、大滞后、强耦合典型流程工业系统, 包含诸多重要的生产数据, 现场操作人员会利用工业数据对某些特别关注的关键指标进行监测, 从而调控整个生产过程, 最终实现稳定生产的目标. 目前, 在污水处理过程中被广泛关注的指标为出水的水质指标, 主要包括生化需氧量(Biochemical oxygen demand, BOD)、化学需氧量(Chemistry oxygen demand, COD)和总悬浮物(Total suspended solid, TSS). 污水水质指标不仅是用来衡量污水处理过程正常与否的重要标志, 还可以反映过程内部的具体状态变化. 因此, 对水质指标进行实时准确地测量可以为污水处理厂的工作人员提供操作参考. 然而, 污水处理过程受进水流量、微生物种群、溶解氧浓度、PH值等的影响, 使得整体过程反应机理极其复杂, 内部环境恶劣, 难以进行水质指标的实时在线直接检测, 通常需要进行离线检验. 然而离线检验的时滞会严重影响污水处理操作的实效, 并且容易造成二次污染. 所以建立准确的水质指标估计模型来反映当前水质情况和预期的水质指标变化, 进而为污水处理过程的操作与优化提供重要指导.


目前常见的水质指标建模方法包括机理建模和数据驱动建模两种. 机理建模需要对整体工艺机理有着深入了解, 并在满足一定假设条件的基础上, 依据大量的专家知识才能够建立. 正是因为这些假设条件和人为经验的限制, 使得机理模型的实际应用精度极低, 实用性差. 与机理建模方法不同, 数据驱动建模不需要先验知识和各种假设条件, 只需借助于机器学习、统计学习等智能算法主动学习输入输出样本数据之间的映射关系, 就能够获得比较好的建模精度. 随着工业过程各种数据可用性的提高以及数据处理能力的增强, 数据驱动水质指标智能建模方法越来越受到研究者的重视, 相关文献先后提出了偏最小二乘(Partial least squares, PLS)建模方法、支持向量机回归(Support vector regression, SVR)建模方法和人工神经网络(Artificial neural networks, ANNs)等水质指标建模方法. 尤其以ANNs为代表的数据驱动建模技术已经成为了水质建模的主要方法. 文献[2]使用前馈神经网络建立出水氨氮和总氮浓度的预测模型, 实验表明该方法具有较好的模型精度. 文献[6]提出了一种基于类脑模块化神经网络的关键出水参数软测量方法, 通过模拟大脑皮层模块化分区结构, 构建软测量子模型对各水质指标进行同步测量. 虽然利用ANNs建立水质指标模型取得了很大的进展, 但是常规ANNs建模算法普遍存在过拟合、易陷入局部极小的问题, 并且基于批学习的网络权值和偏差迭代算法容易造成模型训练时间长、收敛速度慢的系列问题.


近十年来, 随机权神经网络 (Random vector functional-link networks, RVFLNs)利用简单易实现的网络结构, 改善了现有ANNs建模普遍存在的收敛速度慢、泛化能力不强、实用性差的问题, 大大提高了模型的计算精度和计算效率. RVFLNs的建模原理是在给定训练范围内随机选取输入权值和隐含层偏置, 通过最小二乘(Least squares, LS)估计求得隐含层和输出层之间的权值. 与传统ANNs相比, RVFLNs可以获得更快的训练速度和可接受的精度. 此外, RVFLNs的万能逼近能力在理论上也得到了证明. 因此, 基于RVFLNs的数据驱动质量建模已经被广泛应用到污水处理过程中. 文献[19]采用基于智能算法优化网络参数的RVFLNs实现了BOD的在线软测量. 文献[20]提出了一种选择性集成RVFLNs水质指标建模方法, 并应用到某工业污水处理厂的水质测量, 有效解决了传统ANNs水质模型测量精度低、性能不稳定的问题. 但是, 实际污水处理过程中, 受检测仪表等装置的故障等不可避免的影响, 测量数据中经常存在各种各样的离群点, 即由于人为或设备故障而产生的远离其他大部分样本的极大值或极小值. 同时, RVFLNs在实际应用中, 隐含层矩阵会因为隐含层参数的选取不当造成多重共线性问题, 即隐含层矩阵的列向量之间存在相关关系, 使得LS估计失效. 为此, 有学者提出用PLS代替LS估计求解输出权值, 并将这种网络结构称为偏最小二乘随机权神经网络(PLS-RVFLNs). 虽然PLS-RVFLNs可以不受多重共线性的影响, 但是PLS在计算时用到了隐含层矩阵的所有列, 并且没有考虑离群点的影响, 导致利用PLS-RVFLNs进行建模的水质模型精度不高且计算效率较低. 综上, 由于实际污水处理过程的复杂动态特性和RVFLNs的结构特点, 多重共线性和离群点问题必然存在, 基本的RVFLNs和PLS-RVFLNs模型不能为现场操作人员提供准确可靠的指导.


针对上述问题, 本文提出一种基于稀疏偏最小二乘(Sparse partial least squares, SPLS)和Schweppe型广义M估计(Generalized M-estimation, GM-estimation)的RVFLNs稀疏鲁棒建模方法(GM-SPLS-RVFLNs), 并用于污水处理过程的出水水质指标的在线鲁棒估计. 与现有鲁棒估计方法相比, 本文方法具有良好的稀疏性, 可以自主地选择与输出变量相关的隐含层变量, 有效地提高模型的计算效率. 同时, 所提模型不仅考虑输入输出样本均含有离群点的情况, 而且还考虑了输入输出样本离群点之间的相互影响, 可以增强模型在遇到离群数据时的泛化能力. 最后, 进行建模仿真实验, 并和其他几种建模算法进行对比. 结果表明, 当输入输出数据均含有离群点时, 本文方法不仅具有更高的模型精度, 而且可以解决常规RVFLNs水质指标模型存在的多重共线性问题.


10.16383-j.aas.c200707-Figure10.jpg

图 10  输入输出样本均含25%离群点时, 不同方法水质指标估计误差PDF曲线


文章简介


闻超垚

东北大学硕士研究生. 于2018年获得武汉理工大学学士学位. 主要研究方向为数据驱动建模与优化.

E-mail: mr_qilintong@163.com


周   平

东北大学教授. 分别于2003年, 2006年, 2013年获得东北大学学士学位、硕士学位和博士学位. 主要研究方向为工业过程运行反馈控制, 数据驱动建模与控制等. 本文通信作者.

E-mail: zhouping@mail.neu.edu.cn


相关文章


[1]   韩红桂, 秦晨辉, 孙浩源, 乔俊飞. 城市污水处理过程自适应滑模控制. 自动化学报. doi: 10.16383/j.aas.c210798

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210798?viewType=HTML


[2]   韩红桂, 张璐, 卢薇, 乔俊飞. 城市污水处理过程动态多目标智能优化控制研究. 自动化学报, 2021, 47(3): 620-629. doi: 10.16383/j.aas.c190154

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190154?viewType=HTML


[3]   韩红桂, 张琳琳, 伍小龙, 乔俊飞. 数据和知识驱动的城市污水处理过程多目标优化控制. 自动化学报, 2021, 47(11): 2538-2546. doi: 10.16383/j.aas.c210098

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210098?viewType=HTML


[4]   周平, 赵向志. 面向建模误差PDF形状与趋势拟合优度的动态过程优化建模. 自动化学报, 2021, 47(10): 2402-2411. doi: 10.16383/j.aas.c200001

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200001?viewType=HTML


[5]   杨翠丽, 武战红, 韩红桂, 乔俊飞. 城市污水处理过程优化设定方法研究进展. 自动化学报, 2020, 46(10): 2092-2108. doi: 10.16383/j.aas.c200294

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200294?viewType=HTML


[6]   乔俊飞, 丁海旭, 李文静. 基于WTFMC算法的递归模糊神经网络结构设计. 自动化学报, 2020, 46(11): 2367-2378. doi: 10.16383/j.aas.c180847

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180847?viewType=HTML


[7]   李温鹏, 周平. 高炉铁水质量鲁棒正则化随机权神经网络建模. 自动化学报, 2020, 46(4): 721-733. doi: 10.16383/j.aas.2018.c170670

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c170670?viewType=HTML


[8]   张瑞垚, 周平. 基于鲁棒加权模糊聚类的污水处理过程监测方法. 自动化学报. doi: 10.16383/j.aas.c200392

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200392?viewType=HTML


[9]   蒙西, 乔俊飞, 韩红桂. 基于类脑模块化神经网络的污水处理过程关键出水参数软测量. 自动化学报, 2019, 45(5): 906-919. doi: 10.16383/j.aas.2018.c170497

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c170497?viewType=HTML


[10]   韩红桂, 伍小龙, 张璐, 乔俊飞. 城市污水处理过程异常工况识别和抑制研究. 自动化学报, 2018, 44(11): 1971-1984. doi: 10.16383/j.aas.2018.c180439

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c180439?viewType=HTML


[11]   周平, 张丽, 李温鹏, 戴鹏, 柴天佑. 集成自编码与PCA的高炉多元铁水质量随机权神经网络建模. 自动化学报, 2018, 44(10): 1799-1811. doi: 10.16383/j.aas.2018.c170299

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c170299?viewType=HTML


[12]   栗三一, 乔俊飞, 李文静, 顾锞. 污水处理决策优化控制. 自动化学报, 2018, 44(12): 2198-2209. doi: 10.16383/j.aas.2018.c170257

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c170257?viewType=HTML


[13]   马跃峰, 梁循, 周小平. 一种基于全局代表点的快速最小二乘支持向量机稀疏化算法. 自动化学报, 2017, 43(1): 132-141. doi: 10.16383/j.aas.2017.c150720

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c150720?viewType=HTML


[14]   乔俊飞, 薄迎春, 韩广. 基于ESN的多指标DHP控制策略在污水处理过程中的应用. 自动化学报, 2013, 39(7): 1146-1151. doi: 10.3724/SP.J.1004.2013.01146

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.01146?viewType=HTML


[15]   辛斌, 白永强, 陈杰. 基于偏差消除最小二乘估计和Durbin方法的两阶段ARMAX参数辨识. 自动化学报, 2012, 38(3): 491-496. doi: 10.3724/SP.J.1004.2012.00491

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2012.00491?viewType=HTML


[16]   颜学峰. 基于径基函数-加权偏最小二乘回归的干点软测量. 自动化学报, 2007, 33(2): 193-196. doi: 10.1360/aas-007-0193

http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-0193?viewType=HTML


[17]   李丽娟, 苏宏业, 褚健. 基于在线最小二乘支持向量机的广义预测控制. 自动化学报, 2007, 33(11): 1182-1188. doi: 10.1360/aas-007-1182

http://www.aas.net.cn/cn/article/doi/10.1360/aas-007-1182?viewType=HTML


[18]   赵龙, 陈哲. 新型联邦最小二乘滤波算法及应用. 自动化学报, 2004, 30(6): 897-904.

http://www.aas.net.cn/cn/article/id/16261?viewType=HTML


[19]   李松涛, 张长水, 荣钢, 边肇祺, Dongming Zhao. 一种基于最小二乘估计的深度图像曲面拟合方法. 自动化学报, 2002, 28(2): 310-313.

http://www.aas.net.cn/cn/article/id/15521?viewType=HTML


[20]   孟晓风, 王行仁, 黄俊钦. 最小二乘估计的HOUSEHOLDER变换快速递推算法. 自动化学报, 1994, 20(1): 20-28.

http://www.aas.net.cn/cn/article/id/14159?viewType=HTML


转载本文请联系原作者获取授权,同时请注明本文来自欧彦科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3291369-1340032.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?