随着互联网信息大爆炸式的发展,一些虚假信息、虚假广告充斥其中,垃圾信息漫天飞一直是互联网快速发展留下来的顽疾。在今年315上,互联网安全话题的讨论再次成为焦点。在互联网垃圾信息打假层面,作为全球最大的中文搜索引擎百度颇具心得,其利用多种AI技术建造严格风控体系,通过拦截、拒绝等方式在去年处置垃圾信息条数超千亿。
全年清理互联网有害信息数千亿条
随着互联网用户的不断突破性增加,促使一些网络黑产、虚假广告、赌博、色情等信息传播者更加猖狂。在互联网圈,百度无疑是国内最大的流量入口之一,其中文搜索引擎业务全球第一。正是因为如此,每天数亿量级的信息流通,百度更应成为打击虚假广告,阻击网络黑产的担当者。根据百度发布的《2017年度信息安全综合治理报告》,得知2017全年百度安全共拦截恶意网页202.9亿个,处置有害信息451.2亿条。
具体来看,去年一整年,百度打击不良信息中,淫秽色情清理占比67.36%,制假贩假类、赌博类也分别占9%与7%左右的比例。在不良广告问题方面,全年拒绝不良广告数21.3亿条,累计审核广告主资质次数150万次,其中驳回或下线处理账户数66万个,超过半数。同时,百度2017全年关键词屏蔽总量46万个,其中医疗违规黑名单词库近23万个,占比一半,并处理医疗虚假推广信息约6000万条。
依托AI技术打造内容风控一体化解决方能
规模如此庞大的信息打假工作,除了表明百度与不良信息的斗争到底的决心之外,也表明了百度在信息风控层面强大的处理能力。众所周知,百度在AI深度学习、图像语言识别能力、大数据处理等方面拥有行业前排的技术,正是基于此,百度搭建了内容风控一体化服务解决方案。形成了“技术+人工”的审核模式,大大降低了违法违规息的风险威胁。
据了解,百度每天的推广内容审核数量高达4.7亿,利用机器实现的就占比95%以上。不仅如此,百度还成立了超过千人的审查团队,其分工明确,可以实现全网覆盖,除人工智能排查之外,人工把关也在其中,专人专项已经形成了“技术+人工”的审核模式。为此,百度设置了“三大屏障”:主动巡查、自主清理、第三方反馈,力求全方位,多层次的严格把控内容,让不良信息无处遁行。
正式因为百度占据庞大流量,具有重要的导向性,所以更应担负起肩上的重担,严格把控信息流入,以避免给用户错误导向性,以实现互联网的安全保障。在把控层面,百度结合自己在技术层面的优势,打造AI+广告筛查模式,最大限度的拒绝虚假广告及不良信息。
文|唠氪【微信公众号:laoke_2017】欢迎添加关注!
领取专属 10元无门槛券
私享最新 技术干货