我想检查多个网站的HTML更改使用PHP与某种数据库存储。除了使用MD5 sum检查更改之外,我还想知道另一种方法。
另外,有没有办法在检测到更改时,我也可以找出更改的确切内容?
所以提前谢谢了!
发布于 2012-12-03 04:33:39
您可以在第一次爬网时存储该页面的“上次修改时间”标题。下次爬行时,只需再次检查Last-Modified标头即可。
如果网站不支持此标题,您可以使用MD5。
可以使用任何diff包来检测更改。例如,http://www.raymondhill.net/finediff/viewdiff-ex.php
https://stackoverflow.com/questions/13673489
复制相似问题