时光太瘦,指缝太宽。不经意间的一瞥,已隔经年。如果你不努力,一年后的你仍然是现在的你。要知道,你不是别人羡慕的“富二代”。你想要是生活,别人无法给你,只有靠自己拼搏,靠自己努力,靠自己奋斗,汗水永远比泪水更能打动成功,汗水的浇灌注定绽会放出绚丽的花朵!
今天给大家讲解下有关页面URL的问题,URL在SEO中,可以说是比标题还要重要,可以说是禁忌中的禁忌,各位同学一定要多加留意。现在我给各位同学讲解下,在日常中我们都会遇到哪些URL问题。
1
URL上使用#号好不好?
URL当中的#号是一个锚点的标志位,这样的url打开之后会将访问者的视线定位在指定位置上,令访问者直接看到网页中间的一段内容。
很多站长直接在#号后面加参数且参数是有效的,即#号去掉与不去掉,打开的网页完全不同。
目前百度对带#号URL的收录策略是:去掉#号后面的内容,仅对#号前面的url进行建库。这样就导致一些站长认为有意义有价值的页面,百度却无法收录,继而影响新链接的抓取和整体SEO效果。
所以,站长在建站的时候对#号的使用一定要慎谨,百度站长平台不建议在有独特内容价值的url上使用#号,对于独特的内容,应该新开页面,用独立的URL页面来承载该内容,让百度更容易抓取与识别。
2
URL参数该如何使用呢?
也叫URL query,是一个最复杂,最容易被忽视,这个问题多数出现在数据统计部门,如果去掉的话,该部门或其他部门就无法工作。
例如:为了统计一个页面,该用户是从哪个地方访问进来的,往往会在URL中添加“?”问号,后面紧跟相关参数(时间参数、关键词参数、文章ID参数等等)
这样做的弊端,也是显而易见的:
1、浪费搜索引擎对你网站的各项配额,从而影响其他正常的页面。
2、丢失很多本应拿到的链接加分,站外渠道的链接往往是最优质的。同一个URL的分值可能分散成几十份。
3、SEO的流量被统计到别的渠道(因为tracking字段写的是别的渠道,而且被收录被点击)
4、往往形成一种局面,产品用一套URL,SEO用另一套URL, 甚至不同渠道用不同的URL,后期开发和维护的成本极高。
遇到这种问题,也许大家都首先想到的是用canonical标签来解决,但在实际测试当中,百度对canonical标签的支持力度还是比较低的,所以,有好多人使用了该标签,但一直效果不佳的原因。那么大家可以尝试以下解决办法:
1、建立好网站的思维导图和元信息。
2、所有和SEO元信息相关的参数都放到路径中去
3、所有和SEO元信息不相干的参数都放到#后边,因为#后边不影响web服务器返回的内容。简单的说就是用"#"替代"?"。
4、每个页面中都利用js获取#后边的参数对,通过二次请求发回给统计服务器
5、如果#后边的参数影响页面内容,比如酒店的入住日期。那么这部分内容用ajax加载就行,他是不稳定的,不属于页面内容的一部分。
6、原始的#锚点定义肯定会冲突,定义一个#后边的变量,并用js控制屏幕滚动,来保证原始锚点的作用。
3
URL中出现非必要元素?
出现这种情况,往往是产品或是初学SEOer,想让URL与页面相关性更强,才会使用。例如:
该页面讲的是上海某某酒店,那在URL中,直接使用中文、中文全拼、英文等等。
如:/Shanghai_moumou_Hotel-12345678/
1.中文 (非必要元素)
2.由中文翻译的英文 (非必要元素)
3.id (必要元素)
其实,跟“相关性”比,URL的唯一性与稳定性更为重要,那么这个URL最佳的情况是:/hotel/shanghai/12345678/
4
URL中出现大写字母合适吗?
对于这个问题,我只想说,大写字母统统换成小写字母。如果已经有大写字母的URL了,那么做301跳转到小写字母上面,但一定要注意不要陷入301死循环中了。
5
URL目录规范需要注意哪些?
把没有反斜杠的URL做301跳转到带反斜杠的URL上面。这句话,我相信做SEO的人都知道,但往往在现实中,还是有很多网站,同时存在这两种URL,虽然,把网站的收录无形的扩大了1倍,但危害远远要大于这个。对这个不多解释,有疑问可以给我留言,我一对一的帮你解决。
6
URL避免出现太多无效目录,目录不宜过深
对于这个问题,就目前来说还是比较普遍存在的一个问题。这句话是什么意思了?直接看看下面举例,就知道了:
过多无效目录:/home/2017/08/07/2345.html
/home/a/1235.html
目录层次过深,简单理解就是你URL中的反斜杠太多了;
无效目录,简单的理解就是你直接访问这个目录,该目录的页面是404,如
我直接访问:/home/2017/08/ 该页面是404;
我直接访问:/home/ 该页面是404。
尤其,是这种无效的目录,很多网站都存在,如发现有,请尽快进行解决。
7
对URL中存在的数字没有进行判断
这个问题,对我来说,其实就是技术的逻辑不严谨导致的,试想一下,如果没有对URL中的数字进行判断,那么URL中的数字,我可以修改成任意数字,修改完后,访问该页面依旧返回200状态码。对于这个问题,就很严重了,如果被对手发现,会变成什么样?
出现该问题的页面类型,一般有:
1、筛选页面;
2、列表页面;
3、翻页;
4、ID为主的详情页;
5、ID为主的聚合页;
如果,发现自己网站存在这个问题的话,赶快让技术进行处理吧!
(直接把自己网站上面URL中的数字改成任意数字,看看该页面能否访问)
8
不同的URL都指向同一个页面
通过这个标题,我相信大家都应该知道是什么意思了。以前,最常见的就是动态URL与静态URL,都是可以访问到同一个页面,也都会想到使用canonical标签来解决。
其实,在我们实际中,还会遇到这种情况,就是一篇文章分了好多页面,还有一个把所有分页整合在一起的总页面,
例如:1111-p1.html、1111-p2.html、1111-all.html
对于这种页面,我们也要进行处理不然的话,对搜索引擎来说,也是重复页面。
9
PC端与移动端URL不对应
这种问题主要指两者URL结构完全不同,但页面内容是相同。
例如:
PC端URL:/new/a/123.html
移动端URL:/new/b/456.html
这种页面进行移动适配,虽然,理论上是没什么问题,但对于搜索引擎来说,还是不太方便,我们应该尽量做到PC与移动只有主域名不同,其他部分都相同,这样搜索引擎识别起来很方便,写适配正则也很方便。所以,应当尽量避免该问题的出现。
总结:
1、所有部门统一使用SEO定义的URL,屏蔽非SEO URL的入口。
2、用"#"替代"?"
3、统一使用小写
4、保证目录的规范
5、把不规范的URL跳转到规范的URL
6、在搭建网站结构、制作URL时,尽量避开非主流设计,追求简单美即可, 越简单越平常,越好
7、不建议URL中含有中文字符,中文字符容易出现识别问题
8、URL长度要求从www开始到结束,总长度不超过1024个字节
9、避免无效参数,如ll(竖线)等
10、谨慎使用#参数,有可能会被爬虫截断,导致井号后面的url字符不生效,最终效果是网页抓取失败
11、避免出现太多无效目录,目录不宜过深,否则会影响链接层级计算,也不利于抓取。