最近一个玩彩票的朋友找我爬一个彩票网站数据,采用服务端+客户端的模式,服务端采用PHP来写的,客户端用的是易语言。服务端主要用来爬数据,对数据进行简单的处理。客户端就展现服务端的数据。
代码就简简单单几十行,如果只是爬数据,可能就更短。
爬虫其实写起来很简单,主要就是找到特征相同的代码,然后将代码以某一特征分割成数组,例如我这里先通过file_get_content()访问指定URL,获取网页返回的HTML代码,然后再取出包含数据的一段代码。取出包含数据的tbody后,再以每期为基础单元,对没一期数据进行分割。
奖号处理当时准备放在客户端来做,但是易语言没系统学习过,不是很了解,就放在服务端来做了。
回复PHP爬虫获取代码。
领取专属 10元无门槛券
私享最新 技术干货