最美好的生活方式,不是躺在床上睡到自然醒,也不是坐在家里的无所事事。而是和一群志同道合充满正能量的人,一起奔跑在理想的路上,回头有一路的故事,低头有坚定的脚步,抬头有清晰的远方。
我们是不是遇到过这样的问题,发现百度快照的内容不完整?使用抓取诊断时,被抓取的内容也不完整?出现该问题后,会不会对网站流量有影响?该如何解决这种问题呢?
对于这个问题,我们可以先拆分出几个小问题,来进行解说,也许你这样会更容易理解,后面我在说下我的解决办法,亲测,绝对可行。
百度对网页内容的大小是否真的有限制?
对内容文字的多少是没有限制的,但是对页面的源代码大小是有一定限制,如果源码过长的话,百度会截取前面一部分,所以,源码要越简洁越好。
如果百度快照不完整,那么是不是代表百度蜘蛛没有抓取收录完整的页面内容呢?
不是,百度快照的生成,也不是那么简单,也涉及到很多环节,导致不显示完整的页面内容,也是有很多因素,所以不能简单的认为百度蜘蛛没有收录完整的页面。
如果百度站长工具后台,使用“抓取诊断”工具进行抓取测试,如果也没显示完整的内容,是不是百度蜘蛛也会收录不完整的页面?
不是,抓取诊断工具,只是显示页面前200KB的内容,我们一般一个页面的内容大小都在100KB以内的。
百度是否要求页面不能出现特殊字符呢?
没有这样的要求,但是,为了能够方便百度蜘蛛抓取和识别页面内容主体意思,尽量少用特殊字符。
通过上面的问题,我相信大家也有一定的了解,虽然百度没有明确说百度快照不完整还是抓取诊断内容不完整,是不能代表百度没有收录完整的页面,因为这里面的因素太复杂,下面我直接来说说,我以前遇到这种问题是怎么解决的。
解决办法很简单,只要做以下几点工作就可以了:
1、页面长度大小控制在128K以内;
2、合并JS、CSS;
3、禁止直接将图片二进制内容放到了html中;
4、与页面无关的元素,最好都用JS封装,不用直接显示在页面html中;
5、万一,这些都没解决,那一定要把页面主体内容放在最前面。