刚入门SEO都需要了解哪些SEO基础知识呢?今天,在这里给各位同学讲解下SEO基础入门专业词汇都有哪些,从新思考它们在我们实际操作中都有哪些用途及意义。
白帽SEO(White hat SEO)
1
白帽SEO是通过正规优化手法,来对网站进行优化,是符合搜索引擎优化的规则。它与黑帽SEO是相反,它是业界主流的优化手法,避免了一切风险进行操作的优化手法。虽然白帽SEO见效时间周期要长,但往往成功后,就可以稳定的带来流量,它也是SEO从业者最高道德标准。
黑帽SEO(Black hat SEO)
2
对于黑帽SEO来说,笼统的可以把任何作弊,投机取巧的优化手法成为黑帽SEO,例如:隐藏锚文本,堆砌关键词,桥页面,购买链接等等。
黑帽SEO来说,风险过大,一般也就只有一些暴利产品会使用,一般被发现就会面临整站被K的风险。新手SEOer们可要千万留意了
中文分词
3
对于中文分词,有些人也许很少听说,这个一般是由技术进行操作,我们只需要懂得有这么个说法即可。
中文分词,在搜索引擎抓取判断页面内容过程中,会将中间没有空格的、连续的中文字符序列,分隔成一个一个单独的、有意义的单词的过程。那么搜索引擎在获取页面、用户输入的关键词文章内容时都会优先进行分词。
分词技术运用的地方很多,只要是涉及到搜索的过程,都会运用到,例如:站内搜索,每个网站都会有搜索,只是分词及排序的机制逻辑不一样,本质是一样;在网站中还有一个地方也会用到分词搜索,那就是每个页面的“相关推荐”,好的相关推荐,不仅仅是根据用户习惯进行推荐,还有根据页面主体内容,进行推荐。在技术层面都是进行搜索推荐。
网络爬虫
4
网络爬虫,在SEO中又可以叫搜索引擎蜘蛛、网络机器人等。本质上是一种按照一定规则,来爬取互联网信息的脚本与程序。搜索引擎蜘蛛抓取内容机制后期,在详细讲解。
排名
5
有很多朋友都不怎么清楚SEO是干什么的,听起来挺高大上的,其实,也只有真的入了这行才知道。
排名,对于SEO来说,可以说是一个直接目标,不断优化关键词页面在搜索结果页面的排名,来获取更多的流量。
搜索结果页面
6
搜索结果页面,就是指当用户输入关键词,点击搜索后,出来的结果页面。SEO所做的一切就是让自己网站的页面尽可能的排在搜索结果页面前面,让更多的用户看到,并点击进来。
索引
7
索引,是搜索引擎蜘蛛在存储互联网每个词及页面位置的过程,搜索索引库是搜索引擎的数据库,任何一个搜索引擎都有自己独特设计的数据库,我们优化的每个页面都需要先被搜索引擎索引并存储在索引库中,才能展现给用户,所以,这也是关键的一步。
索引库
8
在上面已经说到过索引库,他的重要性,相信大家也有了新的认识,虽然平时接触的不多,但也是不可忽视的存在。
索引库,搜索引擎的数据库,在库中每个关键词都会有很多对应的页面,当获取用户搜索词时,会对搜索词进行分词,在到索引库中进行匹配,最后,按照一定规则把匹配到的内容展示给用户。
蜘蛛程序
9
蜘蛛程序,也称为机器人,指搜索引擎运行的程序,沿着发现的链接/域名/ip等进行发现和爬取更多的页面,抓取收集相关页面的内容,并把这些内容收录到索引库中。
人工智能,大家都不陌生的词,相信将来的一天会运用到搜索引擎中,那时,不知道我们SEOer该何去何从。
蜘蛛程序通道
10
蜘蛛程序通道,这个通道也就是URL,蜘蛛程序是顺着URL来发现新页面的,所以,我们为了让蜘蛛能够发现我们网站更多页面,一般我们会做网站地图(html、xml、txt等格式)、网站外链(友情链接也包含),百度URL自动推送程序等等,这些都是建立一个让搜索引擎蜘蛛程序通道,让它尽可能快的发现网站的页面。
蜘蛛陷阱
11
蜘蛛陷阱,指由于网站结构或程序逻辑技术等特征,使蜘蛛陷入无限循环无法停止抓取,并返回。以前最典型的就是万年历,让蜘蛛无限制的抓取下去,但并不能把抓取的内容返回到搜索数据库中。
robots协议
12
Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。
文件写法
User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符
Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录
Disallow: /ask/ 这里定义是禁止爬寻ask目录下面的目录
Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录
Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。
Disallow: /*?* 禁止访问网站中所有包含问号 (?) 的网址
Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片
Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。
Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录
Allow: /tmp 这里定义是允许爬寻tmp的整个目录
Allow: .htm$ 仅允许访问以".htm"为后缀的URL。
Allow: .gif$ 允许抓取网页和gif格式图片
Sitemap: 网站地图 告诉爬虫这个页面是网站地图
沙盒效应
13
沙盒效应,这主要是搜索引擎对于新站处理观察的方法,往往新站流量过于快速增长,就会触发沙盒效应。
目前百度站长工具中,只要是认证的新站,都有一个新站保护功能,这个功能可以包含新站的页面快速被收录,但是页面排名还需观察,可以说百度现在功能越来越完善化了,以前往往为新站收录而发愁,还没有试的同学可以去试试。
Cloaking-障眼法
14
隐藏页(Cloaking)、伪装、障眼法,这是一个典型的作弊手法,在SEO中指做两套页面,一个只给搜索引擎抓取,另一个给用户查看,典型的欺骗用户和搜索引擎,目前搜索引擎对此类手法已经有很高的识别度,所以,同学千万别以身试法哦。
隐藏文本
15
一种作弊手法,通过技术让网站页面上的内容不被用户看到,例如:相关文字可以把字号变的极小,文字颜色与背景颜色一致,或是用某个页面元素覆盖在上面等手法,达到欺骗用户,提高页面关键词密度,提升页面排名。
此方法,百度已经能够准确的识别出来,所以,此方法不能使用哦。
页面劫持
16
页面劫持也是一种作弊手法,通常为用户本应该访问A页面,但访问进去后却跳转到其他页面,302跳转或是js跳转等通常是用来实现页面劫持的手法。
现在页面劫持,新生出来的名词有:域名劫持、快照劫持、权重劫持、浏览器劫持、宽带劫持等。
隐藏的链接
17
隐藏链接,跟隐藏文本差不多,也是作弊的手法之一,现在黑链一直都存在,利用黑帽SEO手段,在其他高权重网站隐藏自己网站的链接,到达权重传递,引蜘蛛抓取。
所以,网站安全、服务器安全一定要注意,定期查看网站友情链接,及百度快照,发现异常时,及时处理。
整合搜索
18
整合搜索即内容搜索、图片、视屏搜索等搜索结果整理在一起,在搜索引擎的显示区块内显示出来。
对于整合搜索,我在这可以强调下,并不仅仅应用到搜索引擎,我们自己站内的搜索,也是可以这样操作,这种页面往往要比其他页面更有价值,但前提要有技术支持,要不然出来的页面很可能是低级垃圾页面。
链接
19
对于这个大家应该都好理解。链接也称超级链接,是指从一个网页指向一个目标的连接关系,所指向的目标可以是另一个网页,也可以是相同网页上的不同位置,还可以是图片、电子邮件地址、文件、甚至是应用程序。
链接分析
20
对于链接分析,我只想说,当蜘蛛发现一个链接时,都会该链接指向页面进行综合分析,这种分析不仅仅依靠该链接锚文本、还有该页面TDK、页面内容,其他指向该页面的链接及页面综合分析(也许还有其他判断逻辑)
链接农场
21
在SEO中,链接农场是很早的一种作弊手法,就是在一个页面中存在大量的链接,很早处于googleSEO中,让谷歌认为被链接的页面很有价值,从而提升排名,现在也多用于引导蜘蛛抓取被链接的页面,从而提高页面被收录的几率。
目前百度也对链接农场有很强的识别能力,所以,别以身犯险,也要注意,一个页面的导出链接数量,要控制在一定数量内哦。
双向链接
22
双向链接,也可以称为相互链接,是指一个页面不仅仅链接了另一个页面,另一个页面也同样链接该页面。最典型的就是友情链接。
反向链接
23
反向链接,是指一个页面B链接到页面A,那么A的反向链接就是B页面。在SEO实际应用中,也是很有价值的存在,通过页面B的锚文本及页面内容的描述,可以让搜索引擎快速知道页面A主要讲的是什么内容,由于这个因素的存在,我们在做外链时,就应该时刻注意锚文本及该页面内容或是该网站主要是什么类型/意思。
单向链接
24
单向链接,指一个页面上的链接指向另一个页面,但另一个页面并没有回源链接。
在早期时,单向链接是很受欢迎的一种外链形式。因为链接是可以传递权重,参与权重投票,这也是我们原来外链为皇的时代,大量发布外链的因素之一。(平时做的外链也是单向链接)
付费链接
25
付费连接,是指用金钱去购买链接。现在多数是指购买友情链接,虽然百度严厉打击买卖友情链接,但现在还是有很多网站在购买链接,这种购买的链接都是单向链接。
竞价排名
26
竞价排名,是用户向搜索引擎付一定费用后,保证付费结果在搜索结果页面有一定的排名展示。就是我们常说的SEM竞价推广,该排名由于是付费,所以展现出来的位置,形式,都有别于自然排名(SEO排名)。
竞价排名,速度快,流量大,效果立竿见影。所以,现在一般企业都会做竞价推广。
自然排名
27
自然排名,与付费排名及广告无关,是依靠页面自身相关性,权重,重要性展现在搜索结果页面。
自然排名与付费排名,在搜索结果页面上有一个很大的区别就是:付费排名网站有“广告”两个字,而自然排名没有。
站点地图(site map)
28
站点地图,一般有三种形式:Html、TXT和XML形式。
HTML格式,一般都是直接展示在网站中,该页面聚合整站所有重要频道、目录、分类等内容的页面,也可以称为导航页面。
TXT与XML格式,一般是通过技术手段,把整站的所有链接,存放在一个或多个TXT/XML格式的文件中,在有我们通过站长平台向搜索引擎提交该文件,再由搜索引擎派蜘蛛通过文件中的链接对页面进行爬取。
网站日志(web log)
29
网站日志,是记录服务器接收处理请求及运行状态等各种原始信息的以log结尾的文件,准确的来说也是服务器日志。
网站日志对于做SEO来说,可以清楚的看到用户和蜘蛛的访问情况,浏览了哪些页面、及哪些页面有问题,是否是404、是否是500、301等,当网站出现严重问题时,就可以查看网站日志,进行分析。
当然了,平时也可以通过分析网站日志得出蜘蛛抓取每个频道页面的次数,抓取数量占比,抓取状态如何等等,为后期做优化调整提供有利的数据支撑。
着陆页
30
着陆页,一般是指潜在用户点击广告或者利用搜索引擎搜索后显示给用户的网页。一般这个页面会显示和所点击广告或搜索结果链接相关的扩展内容,而且这个页面应该是针对某个关键字(或短语)做过搜索引擎优化的页面。
网页快照(Cache)
31
搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。
网页快照,对于SEO优化者来说是一个重要的参考因素,所以,有些网站屏蔽搜索引擎建立网页快照的方法是不可取的。通过网页快照,我们可以知道搜索引擎抓取页面时,该页面的情况,也可以通过网页快照来分析网站索引下降、被K等问题。
内部优化
32
内部优化,一般是指针对网站页面进行SEO优化的行为,例如:优化页面TDK、页面布局、版块逻辑及用户体验等。
网站标签(TAG)
33
网站标题(Tag)是互联网组织内容的一种方式,通过相关性很强的关键词聚合网站所有相关的内容形成的TAG页面,便于用户阅读和分享。
网站标签页面,也是SEO优化中一个非常重要的手段之一,也称为聚合页面,通过很多关键词,利用技术,把整站相关的内容都聚合到一起,展示给用户。由于网站标签页面相关性很强,往往在搜索引擎排名中占据靠前的位置。
标题、关键词及描述
34
学SEO时,首先接触到的就是这个页面标题、关键词和描述的优化。在这里我主要说以下几点,需要大家平时要多注意:
1、标题,一定要跟页面内容主体相符合,百度对标题作弊查的很严,大家可以参考我最近写的【思考】百度新推出“网页标题作弊详解”文章,也许会给你带来想不到的灵感。
2、关键词,一定要围绕标题来进行选择,且不宜过多,并选择的关键词之间要有所关联(除非你是大型网站的首页,例如:腾讯首页,关键词之间没有什么关联)
3、描述,一定是围绕关键词来进行描述的一段话,这里不要堆砌关键词,语句要通顺。
4、针对有些页面,不知道怎么写关键词和描述,那么这两个地方可以为空,例如:分页、翻页的关键词及描述。
关键词密度
35
关键词密度(Keyword Density)与关键词频率(Keyword Frequency)所阐述的实质上是同一个概念,用来量度关键词在网页上出现的总次数与其他文字的比例,一般用百分比表示。相对于页面总字数而言,关键词出现的频率越高,关键词密度也就越大。
在刚开始兴起SEO优化时,堆砌关键词,提高页面关键词密度,是提高页面排名有效的方法之一。不断目前随着搜索引擎技术的提高,此方法已经渐渐失效,甚至会起到反效果。
因此,同学们就不用在打关键词密度的主意了,做到页面关键词出现自然,而不是刻意出现。
锚文本
36
锚文本,在刚学SEO时,就会重点提到的一个词汇。锚文本又称锚文本链接,是链接的一种形式。和超链接类似,超链接的代码是锚文本,把关键词做一个链接,指向别的网页,这种形式的链接就叫作锚文本。
锚文本其实是在告诉搜索引擎和用户,该链接页面主要讲的是什么内容,也是搜索引擎判断链接页面内容重要参考因素之一,因此,要好好利用,但不能作弊哦。
关键词堆积
37
关键词堆积,是在一个页面中多次无意义的出现同一个词,来提高关键词密度,从而让搜索引擎误认为该页面主要内容与关键词相关性很高,来提高搜索排名。
目前,搜索引擎对关键词堆积识别能力有所提升,所以,同学可别犯这种低级的错误了。
META标签
38
通常所说的META标签,是在HTML网页源代码中一个重要的html标签。META标签用来描述一个HTML网页文档的属性,例如作者、日期和时间、网页描述、关键词、页面刷新等。
META都是在页面Html的HEAD中,以“<meta”为开头,以“>”为结尾,中间放相关属性。
Meta标签,在SEO实际优化中,也占据很重要的位置,例如防止页面被转码,告诉搜索引擎该页面是移动/PC页面等,都需要添加相对应的Mtea标签。
301永久重定向
39
页面永久性移走(301重定向)是一种非常重要的“自动转向”技术。网址重定向最为可行的一种办法。当用户或搜索引擎向网站服务器发出浏览请求时,服务器返回的HTTP数据流中头信息(header)中的状态码的一种,表示本网页永久性转移到另一个地址。
在SEO优化实际应用中,301重定向,是一个很重要的功能。例如:URL变化、域名改变等,只要涉及到URL变动时,都需要做301重定向,指向新的URL。
往往技术修改URL后,就会忘记做该操作,或是用302,而不是用301重定向进行页面跳转。
302临时重定向
40
302重定向又称之为302代表暂时性转移,也被认为是暂时重定向,一条对网站浏览器的指令来显示浏览器被要求显示的不同的URL,当一个网页经历过短期的URL的变化时使用。一个暂时重定向是一种服务器端的重定向,能够被搜索引擎蜘蛛正确地处理。
302一般应用到页面临时需要跳转到某个页面时,才会使用。当搜索引擎识别是302时,搜索引擎会过段时间再来识别,如果是301,则搜索引擎会把新的URL在它自己的数据库中替换掉旧的URL。
域名解析
41
域名解析是把域名指向网站空间IP,让人们通过注册的域名可以方便地访问到网站的一种服务。IP地址是网络上标识站点的数字地址,为了方便记忆,采用域名来代替IP地址标识站点地址。域名解析就是域名到IP地址的转换过程。域名的解析工作由DNS服务器完成。
域名解析也叫域名指向、服务器设置、域名配置以及反向IP登记等等。说得简单点就是将好记的域名解析成IP,服务由DNS服务器完成,是把域名解析到一个IP地址,然后在此IP地址的主机上将一个子目录与域名绑定。
域名解析一般做SEO的应该都会遇到,因为想做SEO,一定会有自己的网站,那时候就会遇到域名解析操作,网上有很多教程,在这就不多说了。
死链接
42
死链接是网站建设中的专业术语,也就是无效链接,就是那些不可达到的链接。通常访问该页面时,会返回一个404页面。
对于死链接,在SEO实际操作中,要注意,当你访问死链接时,网站一定要返回一个404页面,并且要查询该死链接的HTTP状态码是否为404。如果不是,则需要技术尽快修改。
网站优化过程中,会经过多次改版优化,就很容易出现原有的页面404,但该页面还在其他页面存在入口,那么这时,一定要让技术,把该入口给删除,避免搜索引擎进行抓取。
网站镜像
43
网站镜像,通过技术手段复制整个网站或部分网页内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引的行为,这既是为什么有的网站注明禁止未授权不得做网站镜像的原因了,两个网站的内容完全一样,相似度过高必然会导致自己的网站受到影响。
网站降权
44
是指搜索引擎对网站评定的级别下降,是搜索引擎对网站进行的一种处罚方式。通常多为网站自身作弊导致的,改正错误一段时间后会自行恢复。
网站降权,通常表现为,关键词排名大幅度下降,流量急剧下降,但搜索页面还是存在,这说明指是轻度惩罚,如果更严重的则是网站被K,则在搜索该网站时,是看不到该网站(也就是该网站的页面内容,已经在搜索引擎数据库中除名)
404页面
45
404页面是客户端在浏览网页时,服务器无法正常提供信息,相关信息已经不存在,而返回的页面。
404页面的优化,有利于减少网站用户的流失,引导用户访问其他页面。
XML
46
可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。
对于SEO来说,该文件一般都是应用在网站地图上,需要技术进行编写,我们只需要把该文件的URL,提交给百度,让百度去抓取该文件里面的URL即可。
Cookie
47
Cookie(通常叫浏览器缓存),有时也用其复数形式 Cookies,指某些网站为了辨别用户身份、进行 session 跟踪而储存在用户本地终端上的数据(通常经过加密)。
对应SEOer只需要知道即可,方便我们在与技术进行沟通,多掌握些技术术语也是非常有必要的。
Css、Js
48
CSS,层叠样式表是一种用来表现HTML(标准通用标记语言的一个应用)或XML(标准通用标记语言的一个子集)等文件样式的计算机语言。CSS不仅可以静态地修饰网页,还可以配合各种脚本语言动态地对网页各元素进行格式化。
JS,JavaScript一种直译式脚本语言,是一种动态类型、弱类型、基于原型的语言,内置支持类型。它的解释器被称为JavaScript引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在HTML(标准通用标记语言下的一个应用)网页上使用,用来给HTML网页增加动态功能。
HTTP状态码
49
HTTP状态码(HTTP Status Code)是用以表示网页服务器HTTP响应状态的3位数字代码。
最常见的都有:200、301、302、404、500,这几种。在SEO实际应用中,分析网站日志,查看代码时都要注意该状态码。
用户体验度优化(UEO)
50
用户体验优化就是把你的网站针对于用户的体验来进行优化,面对用户层面的网站内容性优化,本着为访客服务的原则,改善网站功能、操作、视觉等网站要素,从而获得访客的青睐,通过优化来提高流量转换率。
用户体验优化,在SEO实际应用中,尤其要重点关注,在SEO优化中已经逐渐占据主导地位。