自人工智能诞生以来,机器学习作为实现人工智能的途径,其主要宗旨是:通过研究使用计算机模拟或实现人类学习活动。
经过几十年的创新发展,机器学习不仅在基于知识的系统中得到应用,而且在自然语言理解、非单调推理、机器视觉、模式识别等许多领域也得到了广泛应用,越来越受到产业界的高度重视。
随着大数据智能时代到来,2017年印发的《新一代人工智能发展规划》中,明确将机器学习研究布局作为新一代人工智能前沿基础理论研究主题之一,新一轮智能产业变革的核心驱动力,重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新技术。
在这一背景下,如何探索大数据机器学习理论,突破多模态庞大异构数据深度理解瓶颈,更高效地从杂乱无章数据中自动生成高价值知识,成为当前机器学习领域研究的前沿主题。
为解决这一问题,中国科学院自动化研究所王军平研究员经过长期研究,基于系统运筹优化、物理启发式计算和超图理论,提出了大数据机器自动学习理论与方法。其本质是从海量多模态高速数据流中,自动构建特征工程、自动选择模型函数、超参数自优化、模型进化结构搜索和自评估等机器自动学习方法体系,成功弥补现有大数据平台“有海量数据,无行业知识,无决策模型”的局面。
他完美刻画了多模态海量数据中蕴含的复杂系统运行演化规律,构建了系统动力学模型,如非线性、涌现、自发秩序、适应性以及反馈回路等。他还利用已知运行规律模型以更加简洁、富有洞察力的方式自动涌现出新数据蕴藏知识,开辟了数据驱动复杂系统脑网络认知学习新思路。通过多年对该领域的不懈探索,将已取得的研究成果广泛应用于石油化工生产指挥、汽车传动系统管控、水电开发电站调度等复杂系统描述、综合诊断、科学决策过程中。
在科学研究中,王军平始终坚持将自己的科学研究成果扎根于社会所需、人民所需,服务于国家前沿战略技术落地。
王军平
兴趣启蒙,
展开颠覆性的理论探索
1980年,在美国的卡内基梅隆大学(CMU)召开的第一届机器学习国际研讨会上,西蒙(Simon)等20多位人工智能专家创办了国际性杂志《机器学习》(Machine Learning),标志着机器学习研究已在全世界兴起。
王军平在美国斯坦福大学留学期间,有幸加入了克里斯托弗·曼宁(Christopher Manning)研究团队,参与了多语种自然语言处理项目开发和理论研究,从此与机器学习结下了不解之缘。
他意识到计算机的优势就在于通过数学来描绘美好世界,机器学习是打开人类与机器交互的一把金钥匙。在他看来,当全球已开启人工智能2.0时代,机器学习特别是大数据机器学习作为人工智能领域重要基石,已成为智能产业蓬勃发展的新引擎。
2010年,王军平通过系统科学论证,认为将图模型知识表示优势和强化学习类人决策优势相结合,特别适合大数据环境中各类复杂任务感知与理解,形成了事理演化图表示、多主体元级协同管控方法、博弈推断分析等大数据机器学习理论体系,并广泛应用于复杂网络空间描述、建模和预测分析,如拓扑结构表征学习、多粒度关联超参数优化、小世界网络演变模型构造、网络非线性动力学扩张等。
2012年,王军平作为课题负责人,参与了科技部“863计划”项目“复杂网络群体交互自动建模关键技术研究”,将分布式强化表示学习新理论创新应用到数亿级网络用户动态交互庞大复杂系统自动建模、预测模型自动选择、群体交互结构自动搜索和参数自动优化、高维刻画应用当中,精确标注电话通信网络交互拓扑结构,用户分布、交互频率等主题。随着我国电信网络诈骗事件愈演愈烈,其与高利贷、网络传销和非法集资等恶性犯罪事件交织在一起,严重危害公共安全体系。
王军平将自己的研究成果率先应用到国家有关部门网络电话反诈骗系统,主动预测准确率92%左右,并在2017年“砥砺奋进的五年”大型成就展展出。2018年,王军平提出了“面向电信用户群体交互大数据的事件线索在线涌现与预判研究”理论方法,获得了国家自然基金委面上项目资助,逐步形成了大数据事理演化自动表示、线索结构自动搜索和风险主动预判模型为核心的大数据机器自动学习方法体系。
步履不停,
助力中国制造产业智能化发展
科研人一直在探索的道路上,永不止息。在王军平看来,科学研究从不受时间、环境以及地域的限制,而发自心底的热爱,就是支撑他在科学研究领域笃行无悔的初心和动力。
2014年2月,王军平来到了中国科学院自动化研究所这一平台从事科研工作。在“人工智能与实体经济深度融合”的背景下,他受邀请参与到国家工业智能战略技术研究组,探索现有智能制造模式,人工智能如何解决当前制造产业升级转型过程提质增效、降本等问题。
为响应“广大科技工作者要把论文写在祖国的大地上,把科技成果应用在实现现代化的伟大事业中”号召,王军平系统调研了中石油、中海油、一汽大众、北汽福田等知名制造企业,认为智能制造是由若干人-机器-企业之间相互关联和相互作用而形成的具有特定功能的巨系统。如何将人-机器-企业在有规则或不确定动态环境中相互作用产生的大数据高效自动转化成科学决策知识,即全生命周期知识自动化、系统决策优化,已成为制造行业智能化发展的最大技术瓶颈。
以深度学习为代表的机器学习的发展方兴未艾,尤其是在图像分类、语音识别等特定领域研究,取得了很大的突破,被广泛应用到产品缺陷检测、工业视觉检测等环节。但现有的深度神经网络技术仅是对生物神经系统的初级模拟,功能大多局限于感知与理解层面,难以在复杂时变、不确定动态大数据环境中高效地获取知识。
大数据机器自动学习,被王军平研究团队认为是可以实现数据驱动制造全过程自动化颠覆式变革发展的方法理论。
在他们看来,未来制造企业的重要任务不仅要在物理世界、人类社会空间中完成,更重要的工作都是在虚拟信息空间中完成。不容忽略,构建基于大数据机器自动学习的三元空间“感知-决策-执行”闭环管控大脑成为未来奋斗方向。
结合之前的研究经验,2019年,王军平团队先后跟中海油服务股份有限公司、龙蟒佰利联集团股份有限公司等单位联合承担了“工业互联网网络化能耗管理平台”“面向海上油气勘探生产的工业互联网网络化应用创新平台建设”,全力推进大数据机器自动学习技术赋能制造企业的工艺数字化、预测性制造、节能减排和精益管理等方法体系智能化升级转型,打造三元空间“感知-决策-执行”闭环管控工业大脑系统。
如今,国家的制造产业仍然有成本高、利润低、生产效率周期长导致交付无保障、决策没依据的困境。王军平还将与团队成员们全力推进相关标准的制定,帮助制造企业的软件开发商来突破现有的技术瓶颈,以提升企业产品的经济及社会效益。
科研之路漫漫。在王军平看来,未来的人工智能领域还有一个需要攀越的点,那就是——知识自动化表示。而目前的知识图谱表示大多都是静态的,需要依赖专家经验指导,然而复杂系统观测数据是由不确定环境动态演化的,由于不确定性,复杂动态系统中一般含有各种反馈回路,其观测数据的性质往往是由复杂非线性动力学方程所决定的,因此它们远不满足独立性与平稳性等经典统计假设。
“在大数据机器自动学习研究中,我们无法回避基于这类复杂数据的算法分析和反馈利用。”王军平说。
前路任重而道远。王军平表示,未来他和研究团队还将时刻保持着对科研方向的初心,在这一领域中继续奋斗。哪怕当前自己所处的研究领域是个“冷灶”,也要用自己的专注和热情将其烧成“热灶”。
为国为社会而研,王军平仍将在科研道路上不遗余力。
领取专属 10元无门槛券
私享最新 技术干货