申请日2017.11.01
公开(公告)日2018.03.06
IPC分类号C02F7/00; G06N3/04
摘要
本发明公开了一种实时污水曝气情况监测方法,从各个污水池所配备的摄像设备采集原始图像数据;对原始的图像数据进行预处理,构建训练集和验证集;构建分类模型,根据数据集进行训练和调参;部署分类模型,对污水池进行实时监测;根据模型实际效果,针对性的采样新数据用以提升模型效果。本发明方法方便了污水曝气情况的实时监测,并具有较强泛用性。
摘要附图

权利要求书
1.一种实时污水曝气情况监测方法,其特征在于,包括以下步骤:
(1)从各个污水池所配备的摄像设备采集原始图像数据;
(2)对采集到的原始图像数据进行预处理,构建训练集和验证集,具体包括以下子步骤:
(2.1)对采集到的原始图像数据打标签,标记是否处于爆沸状态,标定爆沸状态起始时间和结束时间,再根据数据的时间戳进行状态的标注;
(2.2)将原始图像数据格式化为分类模型可接受的数据格式:读取原始图像数据,按照文件对应的编码格式,将单条数据转化为包含RGB三个通道的单精度三维数组,并重新对数据的长、宽、通道维度的顺序进行排列;
(2.3)将原始图像数据进行随机排序;
(2.4)随机抽取5%或10%的数据作为验证集,剩余数据作为训练集;
(3)构建分类模型,根据数据集进行训练和调参,具体包括以下子步骤:
(3.1)选择合适的参数,构建卷积神经网络模型,其中网络层数和卷积核及神经元个数,根据计算机内存限制、输入数据、模型效果进行调整,卷积核大小根据输入图片大小进行调整;并对网络各层参数进行初始化;
(3.2)若数据采集不够充分,则在输入数据之前对数据进行数据增强,对输入数据在语义不变的情况下进行翻转、拉伸、锐化、调节饱和度等操作,增加数据数量,以提高模型的健壮性;
(3.3)用交叉熵作为评估模型损失的指标,计算当前模型在训练数据上的交叉熵,再根据随机梯度下降算法和反向传播算法计算出交叉熵在各层参数方向上的偏导数,最后根据偏导数更新各层参数值;
(3.4)当模型在验证集上的准确率达到0.97-0.99区间内时停止训练;若模型出现过拟合的情况,则采用早停技术,即当验证集上的准确率开始下降时立刻停止训练过程;
(3.5)封装模型,供实时监测调用;
(4)部署分类模型,对污水池进行实时监测。
2.根据权利要求1所述的一种实时污水曝气情况监测方法,其特征在于,所述步骤(2.2)中,还包括:原始图像数据采集自不同设备,污水池所在位置、比例和视角也各不相同,在必要的情况下需要对图像数据作裁剪,以保证图像数据的主体为污水池。
3.根据权利要求1所述的一种实时污水曝气情况监测方法,其特征在于,所述步骤(2.2)中,还包括:原始图像数据采集自不同设备,图像长宽和像素分辨率不尽相同,需要将各条数据调整为固定的长宽和分辨率。
4.根据权利要求1所述的一种实时污水曝气情况监测方法,其特征在于,所述步骤(2)的预处理过程还包括:若不同标签的数据比例相差过大,则对数据进行二次加权采样,以保证不同状态的数据数目大致相当,防止某一类别数据过多对结果造成影响。
5.根据权利要求1所述的一种实时污水曝气情况监测方法,其特征在于,所述步骤(2.4)中,可以向验证集中补充加入特殊情况的采用数据,包括污水池中的倒影中出现云、水体表面覆盖有浮萍以及各种极端天气下的采样数据。
说明书
一种实时污水曝气情况监测方法
技术领域
本发明属于水处理领域,尤其涉及一种实时污水曝气情况监测方法。
背景技术
随着中国城市化、工业化的加速发展,工业污水和城市生活用水的排放量也在日益增加,远远超过了环境的自净能力。2017年6月27日,十二届全国人大常委会第二十八次会议以全票表决通过关于修改水污染防治法的决定。新版水污染防治法增加了关于实行河长制的规定,进一步完善水环境监测制度,强化中国各省、市、县、乡负责人对水污染防治、水环境治理的责任。强调排污单位必须持证排污,同时,持证单位要自行监测,重点排污单位还要安装污染物排放自动监测设备,与环保部门监控的平台联网,这些信息要实时向社会公开,对污水排放单位和相关监管部门提出了新的要求。
曝气氧化法是污水处理的主要方法之一,其中的一个重要指标就是曝气时间,污水处理厂曝气时间不足会导致缺氧,生物菌无法正常生存,出水水质发生变化;生物菌发生变化污泥膨胀,曝气池有泡沫产生;污泥颜色发生变化,有黄褐色变成暗色甚至发黑;曝气池气味由泥土清香味,变得略带臭味等不良影响。因此,对污水曝气情况(曝气设备是否开启、曝气时间)的实时监测对污水处理效果及污水监管都有着至关重要的作用。
发明内容
本发明的目的在于针对现有技术的不足,提供一种实时污水曝气情况监测方法。
本发明的目的是通过以下技术方案来实现的:一种实时污水曝气情况监测方法,包括以下步骤:
(1)从各个污水池所配备的摄像设备采集原始图像数据;
(2)对采集到的原始图像数据进行预处理,构建训练集和验证集,具体包括以下子步骤:
(2.1)对采集到的原始图像数据打标签,标记是否处于爆沸状态,标定爆沸状态起始时间和结束时间,再根据数据的时间戳进行状态的标注;
(2.2)将原始图像数据格式化为分类模型可接受的数据格式:读取原始图像数据,按照文件对应的编码格式,将单条数据转化为包含RGB三个通道的单精度三维数组,并重新对数据的长、宽、通道维度的顺序进行排列;
(2.3)将原始图像数据进行随机排序;
(2.4)随机抽取5%或10%的数据作为验证集,剩余数据作为训练集;
(3)构建分类模型,根据数据集进行训练和调参,具体包括以下子步骤:
(3.1)选择合适的参数,构建卷积神经网络模型,其中网络层数和卷积核及神经元个数,根据计算机内存限制、输入数据、模型效果进行调整,卷积核大小根据输入图片大小进行调整;并对网络各层参数进行初始化;
(3.2)若数据采集不够充分,则在输入数据之前对数据进行数据增强,对输入数据在语义不变的情况下进行翻转、拉伸、锐化、调节饱和度等操作,增加数据数量,以提高模型的健壮性;
(3.3)用交叉熵作为评估模型损失的指标,计算当前模型在训练数据上的交叉熵,再根据随机梯度下降算法和反向传播算法计算出交叉熵在各层参数方向上的偏导数,最后根据偏导数更新各层参数值;
(3.4)当模型在验证集上的准确率达到0.97-0.99区间内时停止训练;若模型出现过拟合的情况,则采用早停技术,即当验证集上的准确率开始下降时立刻停止训练过程;
(3.5)封装模型,供实时监测调用;
(4)部署分类模型,对污水池进行实时监测。
进一步地,所述步骤(2.2)中,还包括:原始图像数据采集自不同设备,污水池所在位置、比例和视角也各不相同,在必要的情况下需要对图像数据作裁剪,以保证图像数据的主体为污水池。
进一步地,所述步骤(2.2)中,还包括:原始图像数据采集自不同设备,图像长宽和像素分辨率不尽相同,需要将各条数据调整为固定的长宽和分辨率。
进一步地,所述步骤(2)的预处理过程还包括:若不同标签的数据比例相差过大,则对数据进行二次加权采样,以保证不同状态的数据数目大致相当,防止某一类别数据过多对结果造成影响。
进一步地,所述步骤(2.4)中,可以向验证集中补充加入特殊情况的采用数据,包括污水池中的倒影中出现云、水体表面覆盖有浮萍以及各种极端天气下的采样数据。
本发明的有益效果是:本发明将神经网络模型应用到曝气监测上。把爆气检测作为一个二分类问题,以摄像头拍摄到的图像作为输入,输入到卷积神经网络分类器。由于摄像头的位置不固定导致画面中会出现杂物,白天或夜晚的不同亮度会导致画面差异较大,均对曝气监测有很大影响。而使用神经网络则可以不用考虑时间和地点的因素,用同一个模型对多个污水池进行监测,有较强的鲁棒性、泛用性。