00:03
呃,各位同事,那个各位同事下午好,那非常荣幸来给大家做这一次腾讯AI助力数字政府的分享,那我是腾讯这边高级产品经理赵。然后今天的分享内容呢,主要会分为三部。第一部分是腾讯云这边AI这边的基础能力,第二部分是腾讯云AI解决方案的一个介绍,第三部分呢,是整个案例的分享,然后提前跟大家说一下,如果在过程中呢,有任何问题,那欢迎大家也在留言区进行呃留言,然后在最后呢,会对大家的问题做一个整体的解答。呃,然后呃,第一部分我们来介绍腾讯云AI的基础能力。嗯,首先我们看一下整个腾讯AI这边的解决方案架构啊呃,整个的解决方案呢,一共分为从最下面的硬件到能力,到AI平台,到应用,到方案,到行业这样几个层面,那在最下面的硬件层呢,会包含像是AI摄像机,门禁机,AI一体机等基础的通用的硬件,在能力层呢,会包含像是基础的视频能力。然后。
01:05
呃,基础视频能力,以及像o crts语音,包括LP的基础能力,那在这个上层呢,我们会有呃应用的服务平台,机器学习的平台,还有标注的平台,呃,以及一系列加速的平台,包括推理的小应小的组件,那在上层呢,通过这些平台加能力的组合,会形成各种各样的应应用,比如说像是城市治理相关的应用,我们在社区理相关的应用,然后包括像是文旅,然后呃零售相关的这些应用平台,然后把应用平台跟能力三方结合起来呢,我们就会在形成很多的行业的解决方案,比如说像是城市运行的解决方案,那是中AI中台的解决方案,这个两个方案也是会是今天主要分享的内容。那其实还会有像社区工业啊等等一系列解决方案,最终是支持到像政府里面各行和各种业务,比如说像是城管,然后政书局,住建,民政,那针对这些行业提出来用,呃,给出来各种各样的解决方案,那首先呢,我们去看一下整个腾讯云AI的基础的能力。
02:07
技术能力,我们这里面一共是分为四块啊,第一块是OCR的技术能力,第二块是实名实人认证,第三块呢是语音,第四块的是NRP。那首先我们来看OCR技术能力,那OCR其实就是,呃,叫光学字符识别啊,它技术能力就是包含文字检测和文字识别两大关键的技术啊,呃,或者通俗来讲就是我们会识别一张图片中它的文字,呃,究竟是哪些文字,然后转变成对应的这个。我们可以编辑的电子信息,那整个的技术挑战呢,会会是多方面的,包括文字倾斜,还可能出现模糊畸变,光照不均匀,多种语言混合等不同的情况,那针对这些情况呢,是腾讯云传播针对这些特殊的场景做了专门的优化,那我们整个OCR的呃产品呢,包含了像是通用卡证,然后票单,票据单据,然后汽车相关行业文档等五大类,还有数十项的这个文字信息的结构化需求。
03:06
是覆盖了不同行业场景,还有不断的在开发新的功能,那下面简单举了一些例子,比如像是通用文字识别,比如说是通用的印刷体,然后还有这种英文识别,快速文本的一个检测,那像卡证的,比如说身份证、营业执照、银行卡,像票据的,会有我们自己的增值税发票,那定额发票,还有这样像火车发票,还有出租车的发票,以及一系列这样的文档,都可以通过视觉这样的解析来把它变成电子的信息。那整个的产品呢,也是呃。参与了向工信牵头,工信部就做OCR国家标那个评测的一个标准,并且参与了工信部AI标准化的一个白皮书的制定,还有AIA这样的一个中国智能人工智能那个产业发展联盟的一个立项,也通过了新标委。嗯,还有央行这边的一个相关技术标准的那个编写。呃,能力呢呃,能力方面整个甲是非常全面的,就是我们支持了像基本能呃,市面上常见的这样通用的文字卡证票据,还有汽车类相关的识别啊,并且准确率是非常高的,印刷体整体识别率可以达到95%以上,那首页体识别率达到90%以上,那各类OCR呢,是准确明显领先于精品的呃。
04:18
然后整个的鲁棒性也是非常强,刚才讲到其实针对一些呃,比较小众的场景,在一些场景下,比如说模糊,可容忍透视畸变,包括是光照不均匀,复杂场景下,我们能去自动的实现裁边并且修正。然后落地案例呢,也是非常丰富的,就是60加项能力基本是在业内第一的,然后垂直行业的应用啊,一些特殊领域的版式制定呢,我们还会提供这种OCR的定制服务,那同时整个odr对外还会提供包括公有云,私有云,包括移动端SDK等多种服务方式来方便啊我们接入这些应用去支持数字政府的各种场景。那这个下面就是举了一个例子,比如说在政务类应用的场景中,那大家现在其实经常会有,呃,各个政府类的。
05:03
啊,办事的,呃,或者叫比如说我们在上海,它可能叫这个随身办,然后这个呃在广东可能叫绘制管,那这样的场景下,我们都会用到这个OCR能力,主要是用在一些办事场景下,比如说要去做这个呃,办个人的户口,线上办理个人的户口,线上更新自己的驾照,那都会需要使用这样的像OCR识别,那行驶证驾照的识别,还有银行卡识别,以及营业执照识别。呃,就是通过OCR这样的一个能力,实际上是把后续还会讲到它其实是跟以往政府中往通办相关的场景中,那都能支持到他帮助用户实现一个更便捷的一个场景。那第二个大的应用场景呢,是叫实名实人的一个认证啊,其实就是在线上去核验真实的身份了。那呃,它是一组呢,对这里有个具体解释,就是对用户身份包含真实信息进行验证审核的服务套件,那包含了像OCR,包括我们的身份检测,还有身份检测其实就是我们的人脸,人脸识别,然后包括刷脸一比一等能力,那整个的流程呢,其实我们在呃,特别是疫情期间做线上的核酸检测就经常会用到,比如说要去首先要认证,要去上传自己的身份证,然后跟随屏幕去做一个简单录制,呃,录制完了之后呢,就能测试线下这个人,呃。
06:20
办业务的人,你的实际的身份是否与身份证上的身份相吻合?那整个实名实名认证它主要的目标呢,其实是帮助呃,我们来去确认真实的办理某项业务的人员,他就是本人在办,而不是呃,谨防一些线下诈骗之类的行为出现,那整个实名实名认证的这个功能介绍就是直约的准确率可以达到99.8%,那检测通过率是达到9.9%,那包含了三项啊,就是包含这个OCR身份检测,包括刷脸,1:1比对三项基础的一个功能。那。同时在这个增强版实名认证,还有这个基础版的实名认证中提供了不同的服务,那增强版呢,可以更适合在一些金融保险、电商直播的场景下,那基础版呢,可能还用在一些这个呃,金融运营商、共享出行等行业的这个刷脸通用的场景下,那增强版针对于活眼活起这个反欺诈是做了更强级别的这个加密的。
07:19
那整个产品的优势呢,也是第一个会提供这样微信原生的一个服务体验,就是我们在微信小程序上啊,那是提供微信原生的,就是可以直接接入这样一个人脸合成的组件,那像技同时呢,技术也是非常先进,在像这种软件测试报告啊,然后由多个团队经过海量数据训练成,在公安部包括工信部的权威都是得到了认证的。然后第三个就是部署灵活,那支持公有云混合式的部署,而且支持这种数字动作,静默活体这种多种的检测要求,然后很多呃,非常多的场景下都能都能去做记入,就支持你继续做一组动作来去做活力检测,也支持你通过啊屏幕光线这样去做一个活体检测啊,最后呢是呃,我们整个的核心产品呢,还会通过隐形层,数据层,人工审核这样多重的方式来去做一个帮助客户去做一个风控。
08:11
对呃,这里面再写一个产品优势是我们支持上那个公众号的H5 AP的SDKPC端的H5,包括微信小程序的H5,独立H5多种方式来去做用。那这里面举了一个具体场景,就是在政务场景下,嗯,要去,呃,比如说任何,比如说像是这样一个深圳公安的登记,或者是任何你在线上,比如说在那个要去做身份核验,呃,展示自甚至展示自己的绿码的时候,都要去做一个人脸的核验,那在这样的场景下,其实就可以通用这个个人实名这样的一个认证功能,而且我们个人认证的功能呢,呃,与公安部的人口比对是这个。是做过验证的,然后通过后就可以直接在网上办理事项,就是我们会把实那个活体的核验与他身份的核验放在同样的一个服务内。那呃,第三块呢是基础能力,是语音相关的这样一个能力,那语音能力主要分为两块啊,第一块是这个语音识别相关的能力,然后第二块呢,是语音合成相关的能力。
09:12
呃语音识别呢,呃就是英文缩写是AR,其实就是把整个的音频转化成文字的服务,那腾讯基础的呃音频能力呢,覆盖了像是中英、越川,上海话,韩日泰,呃南昌南京这些基本的一些语种,然后陆续后面陆续呢还会支持更多的方言以及语种,实际上也是帮助我们在呃数字化的场景下,去覆盖更多的这样一个垂类的场景,那整个的行业呢,也是包含像这种音视频,金融、法庭、医疗,还有政务通用的一些场景,然后接入的方式呢,有APISDK,还有小程序的插件,那整个的子服务呢。其实也是覆盖了非常多的类型啊,就包括实时语音的一个识别,就是边说话,然后会对这样一个实时,实时的那个音频流呢,呃队形进行一个输出,另外就是呃一句话识别,就是60秒,60秒之内的一个录音文字,输入了之后,然后半实时的返回文字。第三个就是录音文字的识别,对于较大类别这样的一个录音文件进行识别,就是异步来返回文字。
10:12
那同时呢,呃,我们还会提供针对于整个这样一个呃,语音识别的场景下,会有效果调优这样一个场景啊,这是一个什么意思呢?就大概是嗯。这样一个场景息,就是我们通常针对一些垂类场景,比如说政务场景息,有一些专门办事的类型啊,如果在这个场景息发现某些你针对识别的啊这些热词,然后识别率不是很高,那可以通过我们后台这样一个热词自学习的模型,把这热词添加,那比如说呃,像是这种呃,身份核验证,比如说你提到了身份证,或者是提到了这些,呃。户口相关的这些名词,如果现在的模型识别不好,可以通过添加热词的方式来把准确率提升到一个可使用,可快速提升到一个可使用的程度。那第二个呃,语音相关的大类呢,是我们的,呃,GPS就那个就是语音识别的,呃语音识别准确率就是第一个,它会在那个16K非电话场下,跟8K的这样一个电话场景下,整体的识别率呢,其实都会是在业界保持一个非常领先的水平,那下面是我们去做的一个跟以上相比的一个评测,那第二个呢,是。
11:21
呃,整个呃,语音延时的一个实验,就是我们实时实时去做翻译的这样一个准确性啊,也是在业内非常领先的。对,然后第二大类呢,我们会去讲到语音,语音这个合成相关的产品功能,语音合成呢,其实就会把文字转化成语音,语音的服务啊,就大家经常在听到一些像是呃。比如说我们听到一种智能客服,就可能有人在给你打,呃,现在比较多的场景下,可能是在金融服务场景下,那可能在政务某些场景下,也会听到有机器人客服会给你打的,打过来电话来询问你,比如说核酸检测的情况,那询问你是否是这个从外地归来,特别是在疫情期间,那这个里面都会用到这种语音合成的功能啊,那这里面主要的一个判断标准呢,实际上是你听到这个语音的发声,它是否足够的逼真,就像真人说话一样,那整个腾讯语音技术能力呢?
12:13
就呃是覆盖的语种呢,从中文英文到中英文混读跟粤语那都是覆盖的,并且并且声音的类型呢,目前已经上线了30家,那从比较呃这个适合小孩的声音,到这个老人声音,到比较适合阅读的声音,那整个的类别都是全覆盖的。然后语速音量,包括那个采样率这些参数都是可以配置,并且整个的基础语音合成跟流失语音合成的啊,我们也是分专门专项去做了优化,技术方式呢,也是支持像NPISDK这样的方式,呃,然后整个的合成的优势呢,是包含这三方面,第一方面就是高拟真度,就是用这样一个TTS来针对于政务场景下,特别是像智能客服,然后去给我们的居民去拨打这样一个电话,他会有非常高的拟真度,就大家听到之后会觉得这就是一个真人在给你打电话。第二呢就是灵活配置。
13:02
那它就是我们腾讯云的语音呢,实际上是支持像中文英文中英文混读的,呃,就是可能针对一些外国的居民呢,也能够有一个比较好的交互,然后第三个就是声音多样,会支持多种的男生女生这样的一个选择,那音色其实能覆盖多样化的一个应用场景。呃,最后一个是我们,嗯,是腾讯云NLP相关的一个基础能力,LLP就是自然语义理解,那它里面会涉及到像是呃,文本纠错,文本分类,然后情感分析,知识图谱,还有智能问答相关的一些能力,那在这里呢?呃,这是我们基础能力的相关的一个介绍,这里面大的类型呢,从这种啊,词法分析到句法分析,到篇章分析到向量的一个技术,那NRP主要用在场景下会是什么呢?在政务场景下,其实最常用的场景就是我们在线上会用到这种智能对话的机器人,它最底层其实就要去用到像这种智能的分词,词性的标注,包括是呃,对于某些词,它命名实体的一个识别,呃。
14:03
那大的大类的还会去做这种像篇章类的分析,比如说情感分析,文本分类,然后可能针对于一些文章呢,要实现自动摘要,后面会举一个具体例子,然后在NP场景下呢,其实最大的优势是整个的智能分词的准确率都是在业内保持非常高的领先度的,并且是通用15类新闻场景下,285类这样的一个类别,覆盖率90%以上都是覆盖的。呃,然后这样整个的呃,通用场景,比如说会遇到的NP的场景,比如说中文的这个处理都要预先分词,然后用户评论的一个态度分析,还有这种各种文档的这个信息化处理,特别是在政务中啊,比如说通过OCR解读了某一篇的这样一个我们呃去上报的一个呃政务中的文档,那需要把这个文档给电子化之后做格式化的处理,那这里面就会需要用到我们NLP的相关的能力。然后再下面就是OCR那个转完之后的文本校对,呃,主要是用在一个文本纠错上下,因为OCR识别它好像也会有一个,呃识别错误的一个概率,包括AR这样的一个文本交流,也会需要用到基础的RP的能力。
15:13
那这里面举了一个例子啊,就是政府场景下,比如说像是我们针对一些非结构化的文本,比如说这样一个人民,呃,人民法院的一个判决书啊,然后它可能整个判决书的本身的一个呃结构呢,是一个非结构,非结构化的,那之后在整个文档的整理,包括存档中都会存在一定的困难,那通过LP这样的一个能力呢,实际上能够快速的把它变成这样一个结构化的信息。就比如说按照案件的基本信息,案件依据的法律,案件裁判的结果来去做一个快速的分类。来帮助去整理这样一个法律文书的结构化。对,然后呃,在我们基础能力的基础上呢,实际上就结合我们自己的这样一些,呃,政务上基本的应用,我们形成了下面的一些方案,嗯,这里也是给大家介绍一下相关的经验,那第一块呢,是城市运行治理。
16:03
嗯,这里面大的背景先介绍一下,就是我们在看到上海,包括天津,包括在武汉,还有在重庆,其实从二零年开始呢,那。各个地方在政府报告或者是自己的三年规划中呢,都把这个,呃,以往统管相关的规划都写进去了,呃,因为政府觉得可能以往统管这样的一个治理的模式呢,是未来的一个大的趋势,然后各个城市呢,都相关的去建立了自己的城市运行管理中心。那呃。那我们就在这个过程中呢,其实发现是呃。在区还有街镇这个管理的层面呢,呃,会有这样的一个问题,比如说一个事件,城管发现了之后,如果同时需要派出所来去,呃,或者是公安这一条线来去跟他做治理,它需要上上事件上升到区,流转到分局,公安局再去息到派出所,这样的一个流转流程呢,实际上是非常长的,那所以我们就发总结了当时的一个四个四个挑战,第一个就是信息化基础很薄弱,因为在很多的区域跟准层面都没有去建立这样一个管理的信息化系统,那是缺乏一个管理基础,那第二个呢,就是说事件管理的径是冗杂的,然后服务水平还有居民的需求是不匹配的。第三个就是说。
17:15
呃,事件发现还有处置智能化不足,就是效率比较低下,低下的呃,低下的原因是呃,就是我们。呃,地下的原因是这个我们很多智能化的手段,包括AI的能力呢,是没有利用在其中的啊,第四个呢,就是说信息化建设各自为战,是我们。像是城管,包括派出所啊,大家都会去建自己的这样一个信息系统,事件这样的一个流转,实际上是没有连在一起,然后数据壁垒呢,也是限制了业务,业务这样一个效率的提升,呃,这里面呢,呃,所以我们就提出了街区,包括街镇这样一个城市运行管理的核心就是高效处置监事,那这里面主要通过四方面来去做一个。呃,解答就是第一个是那个中心下移,资源下沉,来从街镇还有区的层面呃,来帮助他们去建立这样一个呃城市运行管理的组织,那第二个呢,就是说帮助他们去建立这样一个管事件管理的信息化系统,然后使事件的流转可量化,可评估,然后从而有的放矢来去提升处理这个效率。第三个呢,就是我们会呃把这样一个街镇层面积累的数据呢,啊,双向赋农,包括区,包括市里面提供基础数据,让我们自己的区,包括镇里面这样的领导可以这个一品统关。第四个方面呢,就是说利用智能化的手段,其实就是我们AI基础巡检这样一个能力来代替人力巡检,减少基层这样一个压力,来优化事件处置的发现处置,包括评估的一个流程。
18:41
那整个呃解决方案的架构呢,是包含六个大的模块,那最底层是我们基础的一些感知的硬件,那上面一层会有一个视频业务平台,还有一个物联网关平台来接入我们相关的呃视频的呃数据,以及我们物联网关的数据,那上一层呢,会有一个数据平台来针对于我们所有的这些视频,呃视频包括物联网关,包括我们第三方接入的数据来做一个统一的加工清洗,还有数据的检索。那在呃这视频智能分析平台呢,其实就是利用AI能力,在视频中能发现我们管或者是城市运行治理中日常发现的一些需要处置的事件,那最上层呢,会有基础的应用,包含这个城市综合应行管理基础的应用,以及专项应用管理啊,基础应用就包含,但是日常管理,应急的管理,还有专项的管理,主要是来去做街镇,街镇或者区里面它的一个可视化网国,以及事件的指挥,还有事件的流转,那最上层呢,会针对一些专项来去做项群租,那住宅消防安全,垃圾分类这样的一些专项应用的管理。
19:42
那这是整个呃,综合应用管理平台的一个界面啊,那个它包含一些基统包,像是日常的管理,就是值班信息,一键轮询,就是所有接诊里面这些视频啊,能够轮巡的家去查看街镇体征呢,是有事件街镇,包括这个区里面发现的体征的一个统计,可视化的网格,就是所有的事件,包括我们管理资源都会在网格上统一做一个呃来指挥,然后智能发现呢,其实就会通过我们AI的能力来去在视频中发现像是占道堆物,占道经营这样的事件,然后这些事件呢,通过管理闭环的模块来去做一个统一的流转处理。
20:18
那是这个是视频智能分析平台的一个界面,那整个会覆盖13大的场景,60家的这个违违规发现的一个算法,适用于像是城市管理,社区安全,然后综合治理,包括交通管理等多个领域。那后面是具体算法,我们打开来去看,像是这种路面堆物啊,然后跨门经营啊,然后实际上是会把整个城市中立的这些摄像头呢,统一去做一个。呃,智能的一个分析啊。然后一共是60家类的算法,那覆盖了像是环卫,市容界面,秩序,社会社区治理,包括安全生产,包括交通管理,还有设施管理这样全面的方面,然后呃,这里面呃给大家举一个例子,比如说中部这某一个城市,我们上线了450度,那九种算法,实际上是线上运行的准确率呢,95%以上,事件处理效率从之前的24天也下降到了小师级别,下面是一个具体的用的界面。
21:12
然后呃整个呃,最后呢,是给大家讲一个我们在腾讯云AI政务的一个叫中I中台的解决方案。那这里面的一个背景呢,是我们其实在之前很多城市中,整个政务的建设中呢,是会发现我们AI都是这样一个离散化的建设,就是每个委办,然后包括是呃建设的系统,其实都是各自建设自己的AI,这样会导致一个问题,就是说A委办去建设AI的能力,我们在B委办是没法去复用的,所以就会有这样一个政务中台的一个产品解决方案,来帮助我们去集约化的实现AI的能力,那这下面是整个AI中台的产品架构,那整个架构呢,是分为呃下面蓝色部分的三大块。是包括我们的AI支撑平台,AI的工具箱以及AI中台门户这样三个大的模块,那然后上层支撑的是整个政务AI相关的应用,那AI支撑平台呢,包括我们的推理及服务子平台,还有我们训练的子平台,那训练子平台是用来帮助整个AI输入之后训练出来AI相关应用的一个,呃,训练专用的平台,比如说训练出各种视频解析的算法,然后包括是各种预测相关的算法,那在推理以及服务子平台上呢,是对这些训练出来的算法进行呃,部署一个推理的服务,来进行具体的应用法的对接,那在AI工具箱中呢,是沉淀了相关我们已经训练好的现有的这样一个。
22:37
嗯,AI相关的能力,那比如说像是知识图谱相关的能力,智能对话相关能力,视频分析相关的,以及流程自动化这样一个相关的能力,那在AI中台的门户上呢,是针对于呃工,包括AI工具箱,包括我们下面推理及服务平台中所有的这些呃能力做一个统一的管理,那包含是像是下面的资源超市,像是工作的一个专区,能去做资源的管理申请,各个委办可以在工作专区中去申请相关的AI能力,以及在个人中心中去查看自己AI状态,AI能力的一个状况,那在最上层呢,通过这些AI能力的赋能,可以针对于各种各样AI应用来去做一个。
23:16
呃,应用快速的搭建,那这方面我们不会把应用主要分为两方面,第一方面就是一网通办相关的应用,第二方面就是一网通管相关的应用啊然后这里面我展开再去讲一下,就是呃,这样一个整个AI中台中国中台大的方案呢,它有这样几个特性,第一个是它是基于整个AI加行业,并且支持这个全复环,全全环节的一个覆盖,然后全所有的模块都是解耦的,一个设计理念就是我们可以快速的去把模块做拆解,然后根据。呃,客户一测现在已经建设的情况,来去解耦的,呃,进行进行的一个组合,那第二块呢,其实是基于腾讯全行业的一个项目的沉淀,然后包括我们自己沉淀出大量的算法,还有设备接入与组与组合应用的一个经验。
24:04
那第三块儿呢是嗯,本身整个中国AI中台,它其实是一个高可用那个,高可用那个,并且一开放的一个AI pass的平台,这是我们会兼容合作伙伴,然后包括整个可能政务里面本地生态的各种合作伙伴,来把他们的能力快速接入,以及在这些AI能力上搭建应用啊,然后并且我们在上层应用啊,还有我们自己的AI能力上,都会协同自己强大的这个生态的能力来快速打造,帮助客户快速打造各个行业,行业相关的应用。嗯,这个是我们这里面讲到的,就是呃,一些我们在AI能力上相关的优势项,第一个就是会有非常,就是非常多的AI原子能力,150加的原子能力,然后包括我们自己的算法能力,第二块呢,就是多场景应用模板,就是在我们的整个AI平台上还会有像这种20家的应用模板,包括复含那个复杂的模板。
25:01
然后第三块儿呢,是跟这个机器学习还有深度学习平台相关的,我们其实会提供这种呃。这个100家的数据处理工具,包括十家的这种内置算法,然后在知识图谱工具箱中呢,还能够提供各种知识抽取的平台,以及知识图谱构建的工具集。那首先我们去讲三大能力平台啊,就是最底层的三个专门去提供这个AI技术支持的平台,第一个是数据标注平台,那第二个呢,是我们自己的叫机器学习的平台,第三个是我们AI应用服务的TM,就是专门做数据就是呃AI推理的三个平台,那首先数据平台中呢,呃,它是包含了数据中心,然后数据集这样一个整体的管理,数据源的管理,还有个人标注,团队标注两种模式,那通过这样的一个数据标注平台呢,我们可以把已标注的数据推送到我们机器学习管理平台上,那在机器学习平台中呢,去做一个基础模型的这样一个训练,最终呢,通过模型管理模块把模型发布在我们推理的平台上,并通过呃,像是。
26:02
应用编排,把整个的模型呢,通过我们的编排,编排为工作流方,然后推送到应用中心中啊形成通过应用中心中,然后形成各种各样的应用,那外部的AI应用呢,就可以通过数据订阅或者是API网关调用的一个方式来把所有的应用呢,啊去做一个集成,这是这是我们整个三个平台的一个定位,就是基本覆盖了AI从这个数据,然后到训练到这个推理应用的全流程。呃,然后整个AI中台呢,也是也是在它的工具箱中呢,是覆盖了我们七大类这个算法技术能力,可以看到是包含了我们之前讲过的腾讯AI的基础能力,从OCR到语音到NLP,另外呢,还包含了我们事件,呃,特别是视频类检测相关的算法,从刷脸到人体到车辆,到那个事件,以及物体相关的一个检测。那下面是一个整体总量表,像事件还有物体类检测算法中,我们能看到有像人体类事件的检测,那车辆类相关事件检测,以及物体检测,还有物体的检测与识别,特别是在各个场景下,比如说在承运社区中会用到这样的火焰检测,烟雾检测,然后施工,呃,施工废料这样一个乱堆放在水雾中呢,会用到河道漂浮物,河道垃圾食品,然后河道去违见食品,那在后面的一些场景中呢,我们我会也会聊到,就是说在一些应用场景下,如何去集这样的一些算法的能力。
27:29
呃,这里面就提到在我们这样一个政务AI中台的场景下,如何去集成各种应用,那这里面应用主要分为两部分啊,第一部分是用网通办相关的应用,第二第二是一网通管相关的应用。那首先我们看一下通办相关的应用,呃。这里面简单讲一下,就之前通办中可能会是基遇到的一些建设情况,还有基本问题,那之前是像这种整个通办中其实基本框架都已占用完毕,针对于线上办理的政务服务呢,呃,应用。
28:03
要去做一个深那个进行深化的一个建设,那这里面呃举的一些例子,比如说像电子证照,数据共享,电子表单这些基础数据其实都已经建好,然后在上层呢,会有各种各样的一件事,比如说我们去在线上办理,呃办理护照,在线上办理身份证,然后呃在不同的层面呢,也可能会出现一些具体的问题,然后比如说像上层的这个基础建设情况不统一,业务联动性比较差,像在下一层,比如说呃,业务服务这样的一个构建速度慢,体验不佳等等这样的一个问题,其实都可以通过。我们的AI来去做具体的一个优化,然后比如说一网通办,他的目标用户呢,其实就像这种群众,还有企业,然后政府的办事人员,各地市的这个业务接入部门,还有我们政府自己的一些管理部门,那这里面我来举一些具体的一网通办的场景,第一个就是这样一个刷脸核验,那证照的识别,比如说通过我们呃线上一网通办这样的一个系统,在利用刷脸识别来去办线上比如说营业执照的办理,包括营业执照办理过程中需要持他的身份证做一个核验,那这些都是可以用到基础,我们OCR的一个相关能力,以及这个呃,人脸成核验这样一个基础能力,那第二块呢,像是智能填报,那这里面举一个具体例子,就比如说。
29:18
要去做这种呃,线上身份证跟营业执照这样一个核验的核验的一个过程,那他就需要跟传统的这样电子证照库,还有我们这样一个纸质资料,资料补充的一个扫描库去做,首先利用莫CR识别完了我们的电子证照,包括这个身份证还有营业执照两方面来去跟这个电子执照做一个基础的比对,那第二方面呢,呃,电子填智能填表这样的一个能力,会把我们在呃整个电子电子证照库中相关的相关的基础信息补充上去,那最终会形成一张统一的提交申请表来去做一个自动受理,那最后可以通过我们的一个IP机rpa的机器人来针对于这些提交的资料做一个自动的审批,那最终实现的是就是整个政务服务申请的秒批就减缓了,减少了中间我们所有跟人力相关的一个审批流程,也是缩短了整个审批的流程提升就是我们市民来去做以往就是线上事件办理的一个体验。
30:17
那这里面提到就是像这样一个智能受理,然后我们可能用到的一个呃,技术能力,就包括我们的刷脸识别,然后可能跟RPA相关的一个条件核验,然后可能跟我们OCR识别相关的一个文字识别,然后再后面是呃,这个后台还可能去做这样一个数据共享,然后包括这个审批,那个初步的一个审批,都可以通过我们自己的这样一个AI的能力来去解决。啊,然后这样,呃,在下面是讲一个跟智能审批相关,就是我们会有一个智能审批的机器人,那比如说刚才讲到的这样一个审批的过程,其实它会在前面的流程中呢,主要是用到我们的OCR跟人脸核身的能力,那在后台的审批过程中呢,其实就会跟我们的rpa相关,呃,Rpa机器人这样的一个能力是,呃,就是我们通过线上这样一个各种技术组件的一个编排来去实现所有的这些流程就无人化,通过机器人来自动的审核,因为之前可能各个信息的核验,比如说你的姓名是否正确啊,然后你的这个办事的地址是否正确,然后你的文字是否正确,那这些信息呢,可能是通过人工来核验那。
31:24
呃,在我们政务中台中台的能力中呢,就可以通过rpa机器人来帮助他自动去审核所有的这些文字,然后包括整个流程是否是正确的,然后通过机器人代替来节省整个的人力。好,这里面是另外一个。另外一个这个审批辅助的一个机器人,就是针对于这些特别那个复杂复杂事项,呃,针对于特别复杂的事项,比如说针要依据一些法律法规或者政策文件,历史办事信息,呃来去做一个审批,呃这里面举了一个具体例子啊,比如说我们在深圳市这然后这样要去做一个各类设施行政审批的一个许可证,这里面会牵扯到四个核验点,第一个核验点是这个工商系统查验有效,那第二个核验点是税务系统查验合规,第三个核验点是未列入这个经营异常名录,第四个核心点就是未列入这个严重违法失信名单,那之前的工作流程中呢,其实都需要业务人员啊,把这样四个点在可能三到四个系统中反复的来去,呃,查阅完之后人工的去做一个核验,那其实通过IP机器人呢,就能自动在多个系统中拉取信息,做一样做一个比对,从而提升这样一个辅助审批的效率。
32:40
嗯,在接下来是讲一下跟在中外仲裁上一网统管相关能力的一个,呃,相关这样一个应用的一些场景。那第一个场景呢,比如说像是在智慧整区中啊,其实呃景区的管理呢,本身就景区的管理呢,本身就会遇到很多的呃痛点,就比如说像是游客拥堵啊,超负荷这样的一些安全隐患,实际上在之前的场景下,我们是没法去做一个有效的管理的,那针对于这些呃风险事件呢,其实是要及时预警出来,然后给到景区中我们相管的安保安保人员,那这里面能用到下面我们AI能力呢,包含这样几个场景,比如比如说线上预约,线下直接刷脸入园,那比如说我们在呃整个景区中遇到这些违规不文明的场景进行一个预警,比如说像是入侵检测河边的入侵,然后人员摔倒,那下面会看一些具体的场景,比如说我们能去针对景区做人群密度的分析,人流数的一个统计,然后包括像景区中针对一些危险场景要去做入侵的一个检测。
33:40
然后一些特殊事件检测,比如说徘徊、越界、摔倒,然后异常的检测,这些都可以通过AI针对于视频的分析,来把事件的结果及时推给相相关的安保人员,来保证景区的这样一个安全。那接下来是像民厨造这样一个场景啊,其实是针对于后厨人员的一个监控啊,然后主要利用到了像AI能力,是针对于人体的结构化来检测它是否着装合格,那下面是具体的一个场景的描述,比如说在后厨中是否有打电话,是否有玩手机,是否有这样一个抽烟工,然后有没有戴工作帽,它的这个口罩佩戴是否正确,然后包括夜间老鼠的这样一个呃检测,还有这个短袖短裤的检测,工作服的一个检测。
34:27
那在后面是包括像是这个水务场景下啊,针对于智慧水务一些一那个比如说河道治理相关的难题,还有这个污染追溯相关一些难题,那其实也可以通过这样视频解析的能力,针对于水域上的这些污染物来去做预警识别,那下面列了一些具体场景,比如说河道上的一些漂浮物,船舶闯入物的这些一个识别,河道垃圾的识别,然后像是这个水文标识的一个识别,来识别水位,然后包括人员越界,还有钓鱼这样河边钓鱼这样一些违法场景的识别,可以及时的预警给水务相关的单位来帮助他。
35:02
更好的做这种城市运行相关的一个管理。那最后呢,我们是来讲一下,就是我们这个落地的一些。这个具体的案例啊,第一个案例是这个,比如说某高院这样数字法官的一个辅助决策,那首先是这个案件数据,呃,通过我们自己这样一个,呃,Rpa这样一个机器人,那直接输入某某某某人可以把它的按键自动的去做一个建档,然后第二方面呢,是像这种办案的文书也是可以通过RPG来自动生成的,那它。这样一个过程呢,大概会是这样,第一个就是办案人员他输入这个机器人的地址,在浏览器上进行身份的认证,那身份认证完之后,进入用户的一个界面流程,机器人呢,就可以把这个司法数据,通过这样数据读取,OCR识别,包括语义分析,还有语音识别这样相关的能力,把整个信息提取出来,然后再提取,提取完了之后呢,就会把文文书生成这样一个数据来做一个整体的回填,那呃。
36:00
还会通过像这个司法机关统一的这个业务应用来去做统一的业务认证,就整个的这样一个,呃,司法数据的处理,包括数据回填的过程,通过机器人来去做,那其实会把整个的效率大概能提升30~40倍,那第二个呢,就比如说在整个那个。中AI中台场景下,我们可以去借整个城市的这个大视频的这那个大规模数据分析的一个中枢,这样呃,数据中枢针对于整个城市中的视频呢,做各种各样的分析,那视频类分析的结果呢,其实可以应用于像是城管,那水务,然后包括是这个。我们住建可能各个委办在他们自己的应用场景下来去实现整个一网统管相关的场景,那呃,第三块呢,这样一个落地场景,比如说我们像是某城市这里面做的,呃,超级城市大脑这样一个视频分析的应用场景,这里面举一个例子,像是这样,呃,红色的部分呢,是我们帮他建的政AI中台的部分,那会有政务AI资产的一个仓库,呃,除了纳管,腾讯这边AI的模型也会去能有能力纳管第三方这样的一个。
37:07
呃,主流主流厂家的一个模型,比如说像第三方的数据检测,包括人体分析相关的能力那。然后在上面通过人工智能AI中心的门户来去支持各个委办相关的业务,那覆盖了从城管、水务、园林到环保相关的呃,所有的部门,那整个AI能力呢,在这些部门下实际上是复用的,也就是说同样的一套AI系统,那大家不用再去分散建立,实际上是节省了大量的就是政务建设的资金,那然后统同样我们还有整个那个AI支撑的平台来统一接入,呃,他们官网内所有的这些视频系统,那这里面提了两个点,第一个点就是嗯,整个的平台呢,是纳管了多家的厂家的能力了,然后同时呃。对所有历史上已经建立的AI中台,包括AI的能力都去做了一个复用,那第二个点呢,就是说同样的一套系统,它的AI能力是来支撑多个委办,然后实现了一个集约式的建设。
38:02
然后呃,整个的分享呢,就到此结束,然后看一看大家有没有什么,呃问题是需要的解答的。哎,好的,我在这里面是看到了一些那个,嗯,有一些问题啊,第一个问题是那个会议录音转文字这种功能下。呃,会议录音转文字这种功能,然后像是AI公文写作,公文排版,电子档案等等疫情之间很有用,那这个其实我们在第一块AI基础能力介绍的时候就讲到了,就是我们会议录音呢啊,那通常它会是这种,可能会有小级别的,也可能会有这种,呃,就是如果需要实时实时录音转写,那其实我们都会有对应的,包括流式转写,包括我们录音文件转写两种基础能力来去做一个提供,那呃,这个这个问题也提的很好,其实在疫情场景下,很多电线上办办办这个办公的场景下,针对电子文档的实时转写,那就可以用到这些基础的能力。
39:01
嗯。第二块呢,有没有微信可用的表单识别,那这里面其实像我OCR的基础能力呢,在微信这条链路上也会有基础能力,基础能力组件的接入,那这个问题是有的。然后第三个问题是数字乡村,呃,有应用案例吗?啊,数字乡村我们也是有相关应用案例的,那在数字乡村中最多的应用案例其实主要还是跟我们,呃,第一个第一块是跟视频技术能力相关,因为像跟乡村治理相关的,比如说乡村中。如果有河道,然后或者河道上漂浮物的识别,或者污染物的识别,然后跟我们自己麦田相关的也是另类的,就比如说有没有秸秆焚烧,或者是呃,垃圾堆放这样的一些行为,那第二块呢,跟数字乡村最相关的,实际上也是办事的场景,因为乡村场景下其实也会出出现在相相居这样一个场景下去做线上办事,那也会继续用到我们在线上类似于人脸合身,包括OCR识别这样一个线上办事的场景。然后。
40:03
嗯,这个因为这次解决方案没有没有专题去讲,然后呃,我简单讲一下就是可能的应用场景,然后之后在之后的分享中呢,也可以补充上来。嗯,然后第五块是AI中台已经化了嘛,客户只需要购买云服务就可以调用了,第五块是这样,就我们整个AI中台呢。呃。目前因为是在政务场景用的比较多的,那通常政务的客户呢,都会对我们的部署有一个要求是要在政务的内网中,那呃,就是我们是能够去做这个云化部署的,但更多的实际部署场景下,其实还是在客户政务外网这样一个私有化部署,然后呃,客户需要买我们私有化部署的,呃。私有化部署的云服务,包括我们私有化部署的这样一个推理的平台,嗯,当然如果说有一些我们政府,政府的客户,他能够接受这样公网部署的情况下,我们能够提供相应相应的服务来去支持。
41:02
好,那暂时应该没问题了,然后可能我这个分享就先到这里结束。
我来说两句