首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

听铁郭侠论工业大数据应用实践与认识

由腾讯、同济大学、中国产业互联网发展联盟(IDAC) 及深圳市工业互联网行业协会联合举办的公益联播旨在邀请来自全国的相关领域专家为工业企业带来智能制造的实践经验,助力数字化转型。

昨天(3月13日)优也首席科学家郭朝晖博士发表了题为《工业大数据应用的实践与认识》的主题演讲。从应用者的视角,围绕典型的分析与建模技术问题,为直面价值的战略与管理提出了建议。现实中工业大数据,与学术界宣传的做法往往是不一样的。过度强调所谓先进算法,成功将会是小概率事件。现实成功的关键,是将数据化思维与人的领域知识和经验相结合、与具体的业务需求相结合。在技术上要发挥人的长处、针对人的盲点、弥补人的不足。

回放链接:

https://cloud.tencent.com/edu/learning/live-2085?ADTAG=mar

大数据时代,其实是给一些以前难以处理的问题提供了机会,所谓的“条件改变了”。例如一些感性认知的准确辨别,相关知识的判定。充分利用这个机会,解决一些之前没有条件解决的工业问题。在商业互联网领域,大数据关注于相关性,而不关注因果性,但是在工业互联网领域,不能只止步于相关性,但不纠结于(从数据中获得)因果关系,即从数据中去发现相关性,但是基于人的认知去理解、保证因果关系。要将人的知识跟数字化的方法相结合,不断创新,寻求工业问题的解决思路。

在工业场景不要迷信高级算法的价值,利用数据创造价值才是问题的关键。业务人员根据对场景和问题的理解,提出需求,经过中间转化环节,变成可以用计算机来解决的科学问题。先提出正确的问题,再正确地解决问题。

进行工业大数据分析,应该遵循“跨行业数据挖掘标准流程(CRISP_DM)”来执行,充分理解业务和数据,要将问题分解定义正确,避免在“验证与评估”环节发现根本性错误,返回到“业务理解”环节,造成大量的无效工作。

工业大数据分析/建模难度大,主要原因是目标高(超越人的认知),条件差(影响因素多,数据条件差),一定要发挥人类和计算机各自的长处,取长补短。而在建模过程中,选取模型,需要根据场景需求,平衡精度、范围和可靠性要求。

数据量可以不大,但要全,模型学习到所有的情况,能够给出比较好的结果。即不纠结于因果,跟着学就是了。这是一种聚类思想。

在现实工作过程中,有些工作难做或做不到,很可能是条件还不满足,可以采取“退而求其次”的办法,做到目前能做到的水平,待条件满足之后再进一步优化。

管理定义了技术的边界,智能化技术重新定义人机关系。智能化技术重新定义管理和控制的关系。在工业企业,管理漏洞经常占到成本的20%~30%。作为管理者,需要找到管理上的问题,而这些碎片化的管理问题需要找到有效的工具来管理和解决。

分析与应用成败决定于数据质量,数据条件不好,怎么都做不成。但是,我们也需要知道,数据条件不理想是一种常态,分析水平就体现在数据不理想时怎么做,要善于利用间接数据、人类知识和非数字化信息。

关于数据,最后强调了四点:1)数据对应要准确,不要张三的参数对李四;2)对应精度要准确,秒级问题不要分级取样;3)时钟要统一。要知道先后;4)判断数据失效的依据和标准要清楚。

精彩推荐

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200314A0K5KV00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券