谈起污水处理的大数据和人工智能,大家想到的大多是曝气自动化、投药自动化。但你有没有听过,图像识别的AI技术如今在污水处理厂也得到应用的呢?它的前景已经受到多家水务工程公司的青睐,其中包括了丹麦的Ramboll公司,2021年,该公司发布了一款名为Opseyes的人工智能系统,声称仅凭显微镜拍摄的图片,就能对污水厂生化池的污泥进行快速分析。
小编在本期水星漫谈里和大家看看他们是怎么做到的。
来自医学界的灵感
这个名叫Opseyes的系统的创始人叫Bryan Arndt,他是Ramboll公司的管理顾问,有着丰富的污水厂运行管理经验。Bryan有个亲生兄弟,是个放射科的医生。
早在几年前,Bryan和他的兄弟聊起了深度学习(Deep Learning),他的兄弟说图像识别技术已经实实在在地帮助放射科医生们分析人体图像。这也让Bryan意识到,这技术是不是能用到污水处理上呢?
污水厂哪里有图像识别的需求呢?
答案在实验室的显微镜里。
缩短分析时间
如果你工作的污水厂的实验室配有显微镜,那么你可以借助它观察微生物的组成,统计污水样品中的原生动物的组成情况,来判断污泥泥龄及其沉降性能。
有些国外学者还将他们这些镜检经验整理成类似下图的对应关系图,帮助运行人员了解污水厂的污泥处于什么状态。如果你刚好是从事污水厂的微生物镜检工作的专家,对此图应该不会陌生。
在美国,虽然不少污水处理厂的实验室有显微镜,但真能识别出不同微生物的专家并不多,因此,当污水处理厂若想要得到较为专业的微生物镜检报告,需要将污水样品寄到相应的第三方机构进行分析。显然这种做法相当耗时,而且得五天以上 (因为通常还会分析其他指标,包括BOD5)。对于追求实时性的污水运行人员来说,这时间是耗不起的。
在他兄弟的启发下,Bryan Arndt心想:能不能像其他行业那样,运用深度学习来训练 AI ,让AI识别出污水各种微生物的照片,并根据这些照片即时生成废水分析的结果?
污水的大数据
Bryan Arndt的想法得到了公司的支持,并开始组建小团队。同时联系美国各地污水厂的同行,邀请他们给他寄些污水厂的样品。
基于这些样品,他和他的团队在随后的几个月里,积累了6000多张图片。在外行人看来,这些图片绝对不是什么美图,甚至有点恶心,但在小编看来,Bryan Arndt和他的团队做的是开荒牛的好事。他们把收集的图片打包发给了位于德国的同事 Robin Schlenga。德国的团队用卷积神经网络(Convolutional Neural Network, CNN)来处理这些图像文件。
这里又要说个题外话,这次图像分析用到了英伟达公司的独立显卡。小编猜测也许是英伟达公司的品牌管理团队觉得污水处理和人工智能的跨界十分新奇,因此在2021年的2月和6月相继在其官网博客报道了这个项目,甚至制作了音频播客,这才让小编了解到这则新闻,也才有了搬砖的素材。而小编也是因此才知道,显卡的钱省不了,因为好的显卡确实能大大缩短数据分析时间的(应该会比让码农闲着白等划算)。
没那么简单
美国人Bryan Arndt刚联系德国同事Robin Schlenga的时候,觉得这项目挺简单的——不就是给AI一些图片,AI就能把图片的细菌一一认出来了吗?Robin说远没有这么简单,花了好些时间给Bryan解释,才让后者明白为何如果镜检专家不能为数据团队提供足够的标签信息,数据团队是没法开展工作。
Robin在采访中解释了这背后的两个原因:第一是定性的难度,因为显微镜的图片里往往有许多种细菌,而不是大家熟悉的简单的一图一物的识别任务;第二是定量的难度,这个系统能认出有什么细菌还不够,必须需要根据图片,判断各种细菌的数量,分出个名次。
由于第一批图片的质量不能满足数据分析团队的要求,所以Robin硬着头皮要求Bryan重新采样拍照。而这其实也让Bryan很为难,因为他也要向镜检专家们解释一番,这些镜检专家虽然不懂AI,但长年累月看过成千上万张微生物照片,已能轻松对每张图片出现的微生物进行描述,而Robin训练的AI最初只能认出2-3种细菌,这难免会让非AI专业的专家质疑码农们的水平。幸好Bryan最终还是能做好两边的沟通工作,确保项目得以延续。
经过超过一年半时间的开发,Opseyes总算达到了他们内部满意的版本——2020年9月,他们正式发布的1.0版。在此版本里,用户将智能手机通过一个固定架绑在显微镜上,并对观察到的样本进行拍照,照片经上传后,系统会在几分钟内返回分析结果。
而早在2020年8月,一个叫Bruce The Water Guy的Up主分享了一个视频——他收到了Opseyes的 内测安装包,邀请他进行评测。下图就是他在实验室拍的视频截图。可惜他在视频里并没有分享分析报告的内容,而且表示他能收到的只是一份报告的初稿,还不算正式的报告。而除了这个视频,小编也没有再找到其他相关第三方评测结果的消息,因此无法评价这个软件目前的实际分析水平。
未来的潜能
读到这里,你是否会问:那么这套机器学习系统除了识别污泥状态,还有什么其他用途呢?
Bryan Arndt在采访中也被问到此问题,他表示:他的团队正在考察能这套系统拓展到藻华爆发预警的可行性。
在小编看来,这套机器学习系统的当务之急还是要积累更多令人信服的实测数据,过早的收费不利于自身系统的完善。尽管如此,它的面世还是带来很多积极意义的,它不仅帮助运行人员了解污水处理系统的运行状况,更重要的是让污水处理行业进一步认识到专业知识和人工智能之间的边际要消融。换句话说,以后会有越来越多既懂污水处理又懂计算机的人才需求。
Robin在采访中也说到:“其实此前很多所谓的机器学习大多集中在互联网和金融领域,工程领域是在最近才开始对机器学习有更深入的探索和研究。” 他也表示非常欢迎更多的IT人才加入这些工程领域中来。
领取专属 10元无门槛券
私享最新 技术干货