首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    百度变脸:为了框计算和智能搜索

    百度首页变了,频道文字链被移到顶部,核心位置只剩独立搜索框,用户可以在顶部选择频道、登录账户、添加应用。百度极简首页这一影响数亿用户搜索习惯的改版在年初便有消息流出,经过近半年内测后百度终于将其正式推出。这看上去是一个小改动,但影响的人群规模,对用户习惯带来的改变却不容小觑,背后的考究更是值得思索。 极简首页更接近框计算的实质 从视觉风格即UI上看新首页更加简单,体现乔布斯崇尚的少即是多,大道至简的设计理念,在信息过载、审美疲劳的今天,简单清新的页面确实是用户所亲睐的。百度从第一天开始便崇尚简单可依赖,亲

    04

    如何判断一个网页是不是一个Blog的首页?

    最近碰到一个问题,如何从一组链接中,判断链接是不是Blog的首页链接?     先从 Blog 存放的地点说起: 1、由BSP托管的Blog,一般采用开源或者BSP独立开发的Blog系统; 2、由个人空间存放的Blog,一般采用开源的Blog系统。而个人空间存放的Blog大都是 比较职业的 价值比较高的Blogger。     对于第一类,BSP的Blog链接地址都是固定的,加上成规模的BSP数量较少,其Blog的首页链接可以列举出来。     对于第二类,问题要复杂些,     有的 www 首页就是 blog 的主页,     有的是采用子域名的方式,     有的采用目录的方式; 但无论哪种链接方式,Blog 首页都有以下属性: 1、blog首页链接的长度短;可以在这个链接下面发现更多以此链接为开头层级更深的链接; 2、连接中一般包含blog字样; 3、blog的作者为方便他人订阅其Blog,都有类似:bloglines , rss feed 的链接。 不知道各位有没有更好的判断方法。 我现在正在以donews的 10 大金刚为起点,抓取其blogroll,收集blogge地址呢。  * 博客:飞雪残剑无间道http://www.donews.net/tycoo  *  * 博客:互联生活每一天http://www.donews.net/liuren  *  * 博客:对牛乱弹琴http://www.donews.net/keso  *  * 博客:胡一郎是谁http://blog.donews.com/fanggang/  *  * 博客:Xin观点http://blog.donews.com/panxin/  *  * 博客:温柔的人生http://www.donews.net/chinabright  *  * 博客:求缺草堂 伟大是熬出来的!http://blog.donews.com/zhongzhan/  *  * 博客:快马黑蹄SP踏乱,乐庭羌鼓IT迷离http://blog.donews.com/banly/  *  * 博客:努力谁不是历史怀胎的时代人物http://www.donews.net/chennian  *  * 博客:努力做一个最懂法律的IT人/最懂IT的律师http://blog.donews.com/yuguofu/ 最终的目的是,学习page rank算法,根据blogroll的链接做一个blog rank 的donews数据库。 希望这个可以作为keso的brand rank 的一个补充。 keso 现在的blog的回复量是:22063 ,可谓惊人。 keso的blog( include yesterday news )数量是:1986 , 平均每个blog  11个回复。

    02

    [SEO知识讲解] 什么样的网站设计对搜索引擎友好?

    | 如果我们从搜索引擎蜘蛛的角度去看待一个网站,在抓取、索引和排名时会遇到问题呢?解决了这些问题的网站设计就是搜索引擎友好(search engine friendly)的。那么,什么样的网站设计对搜索引擎友好?一起来看看吧。       1.搜索引擎蜘蛛能不能找到网页。       要让搜索引擎发现网站首页,就必须要有外部链接连到首页,找到首页后,蜘蛛沿着内部链接找到更深的内容页,所以要求网站要有良好的结构,符合逻辑,并且所有页面可以通过可爬行的普通HNL链接达到、JaVsCnp链接、Flash中的链接等搜索引擎蜘蛛般不能跟踪爬行,就会造成收录问题。       网站所有页面离首页点击距离不能太远,最好在四五次点击之内。要被搜索引擎收录,页面需要有最基本的权重,良好的网站链接结构可以适当传递权重,使尽量多的页面达到收录门槛。       2.找到网页后能不能抓取页面内容。       被发现的URL必须是可以被抓取的。数据库动态生成、带有过多参数的URL、Session ID、整个页面是Flash、框架结构(frame)、可疑的转向、大量复制内容等都可能使搜索引擎敬而远之。 某些文件站长可能不希望被收录,除了不链接到这些文件,更保险的方法是使用robots文件或者meta robot标签禁止收录。       3.抓取页面后怎样提炼有用信息。       关键词在页面重要位置的合理分布、重要标签的撰写、HTML代码精简、起码的兼容性等可以帮助搜索引擎理解页面内容,提取有用信息。       只有搜索引擎能顺利找到所有页面,抓取这些页面并提取出其中真正有相关性的内容,网站才可以被视为是搜索引擎友好的。 |

    01
    领券