首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

面向建筑运维领域数据挑战的机器学习新范式:进展与展望 | NSO综述

近期,《国家科学进展》(NationalScience Open, NSO)在线发表了深圳大学范成副教授等的综述文章《面向建筑运维领域数据挑战的机器学习新范式综述:研究进展与展望》(Novel Machine Learning Paradigms-Enabled Methods for Smart BuildingOperations in Data-Challenging Contexts: Progress and Perspectives)。该综述归纳了建筑运维领域面临的常见数据挑战,讨论了多范式机器学习(如迁移学习和半监督学习等)在负荷预测、故障诊断和优化控制等运维任务中的研究进展和发展前景。文章将收录于NSO“低碳建筑能源系统”专题(Special Topic: Energy Systems ofLow Carbon Buildings)

建筑运行阶段消耗大量能源,约占我国社会能耗总量21%。通过信息化技术实时管控建筑运行状态,提高其能效水平是实现节能降排的重要途径。公共建筑普遍配有数据采集系统,能够通过数字载体描述不同系统和设备的动态运行状态,这也为构建精细化、自动化的运维技术提供了有利基础。然而,实践中获取的运行数据通常存在多种质量问题,严重影响数据驱动技术的可靠性,很大程度上限制了建筑运维技术的数智化升级。

举例来说,对于运行时间较短的建筑来说,采集的运行数据量较少,只能描述部分工况下的运行规律(如图1a中的工况1),由此建立的数据模型很难应用于其他未见工况(如图1a中的工况2),即模型外延性差。再如图1b所示,很多建筑虽然采集了大量运行数据,但是只有极少部分会经过人工辨识转换为有标签数据(labeled data),剩余大部分仍为无标签数据,这会导致数据模型出现拟合问题且数据浪费严重。另外,如图1c所示,建筑运行存在明显的天、周、季度周期规律,这也导致了运行数据存在内生不均衡问题(如工作日数据多、休息日数据少),容易使数据模型出现决策偏差和精度下降现象。

图1 建筑运维领域面临的典型数据问题示例:(a)数据代表性有限导致模型外延性差;(b)标签数据不足导致模型精度受限;(c)建筑运行周期特点引发的数据不均衡问题示意图

融合多范式机器学习的建筑运行数据分析方法

近年来,国内外诸多学者探索了多范式机器学习驱动的解决方案,通过革新分析范式解决建筑运维领域面临的数据质量问题,并在建筑负荷预测、设备故障诊断、控制策略优化等方面取得成功应用。举例而言,迁移学习旨在利用源域(source domain)积累的丰富数据提高目标域(target domain)的数据建模效率。在建筑运维领域,这类分析范式可以将相似建筑中学到的运行规律迁移应用到数据量较少的目标建筑中,进而提高目标建筑的数据模型质量,解决目标建筑可能面临的数据代表性有限问题。再比如,半监督学习能够通过模型自训练、图卷积运算等方式实现有标签和无标签数据间的信息互通,进而提高数据模型质量,缓解传统监督学习方法对标签信息的过度依赖。此外,如图2所示,生成式学习可以通过生成虚拟数据模拟未知运行工况,丰富数据资源,进而提高数据模型鲁棒性、降低数据不均衡度等。

图2 建筑运维领域生成式学习应用示例:(a)生成虚拟能耗数据,拓展样本代表性;(b)生成虚拟故障数据,缓解类别不均衡性;(c)生成虚拟工况数据,测试优化控制策略通用性

未来研究展望

为进一步推动“数智融合”的建筑运维技术发展,该文提出了三类研究展望:

(1)制定易实施、易推广的建筑运行数据分析指南,特别就分析流程、模型训练及优化等技术细节制定标准化指引,降低人工智能技术在建筑运维领域的实践门槛;

(2)加强探索无标签数据的分析方法,在较低人工成本的前提下提高海量监测数据的利用效率,如利用主动学习自动筛选出有价值的待标记样本等;

(3)除传统结构化数据外,研发融合多模态信息(如室内摄像头视频、维修文本、人体惯性传感数据等)的数据分析体系,拓展数据驱动技术在建筑运维领域的适用范围。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O73DB6FA8sSBi3uHK_xe0zGA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券