还有不到俩月,2018年的春节就要到了。对很多在外地打工的人来说,回家过年的票,很不好抢。
就在打工族摩拳擦掌准备抢票的时候,网上一则消息让抢票一族心里拔凉拔凉的。消息称,航空公司放出的低价机票,80%以上被票务公司的“爬虫”抢走,普通用户很少能买到。
作为一种网页信息采集的关键技术,“爬虫”就是一段用来批量、自动化采集网站数据的程序,几乎不需要人工干预。
当前,“爬虫”已被广泛用于电子商务、互联网金融等诸多领域。比如,“爬虫”可以抓取航空公司官网的机票价格,发现低价或紧俏机票后,“爬虫”可以利用虚假客源的真实身份信息实现抢先预订。
那么,是谁在利用“爬虫”技术抢票呢?有业内人士介绍,主要是机票代理公司利用“爬虫”技术,不断抓取航空公司售票官网网页信息,如果发现该航空公司有低价票放出,“爬虫”即刻利用虚假客源身份进行批量预定但不实际支付,以达到抢占低价票源的目的。由于“爬虫”的效率远远超过正常的手动操作,导致通过正常操作几乎无法抢到票。
这些“爬虫”流量消耗了大量的机器资源,却不产生任何消费,这是每个公司最痛恨的东西,但因为怕误伤真实用户,各家公司的“反爬虫”策略做得非常谨慎。
当今世界,云计算、大数据等为代表的新一代信息技术处在高速发展阶段。这种新的技术,却是一把双刃剑。如果被非法或者不当应用,则会产生严重的危害。正因如此,互联网空间安全需要建立健全完善的保护体系,绝不能“裸奔”。
对于这种高科技“黄牛”倒票行为,目前尚未有明确规定,这使得恶意爬取信息并不当获利行为处在法律法规监管的“灰色地带”。
从国际社会的操作来看,针对“爬虫”的应用,专门制订了“爬虫”协议、网络机器人协议等。网站可通过该协议告知“爬虫”可以爬取哪些页面及其信息,不能爬取哪些页面及其信息。这一协议的好处是,可以作为网站和“爬虫”的一种沟通方式,用来规范“爬虫”行为,限制不正当竞争。
不过,也业内人士表示,“反爬虫”不仅要依靠技术防范,还应该通过完善管理和法律法规手段来约束这种行为,尤其是法律手段才能彰显惩治力和震慑力。正因如此,航空公司也要完善账期管理,不给“爬虫”抢票提供机会。
领取专属 10元无门槛券
私享最新 技术干货