无限空间及解决办法

浏览 发布时间 2011/02/10

如果你是一位关注搜索引擎蜘蛛爬行朋友,那么你就要注意一个网站结构优化上的短板,应避免搜索引擎蜘蛛陷入无限空间,那么什么是无限空间呢?又该以怎样方式去避免蜘蛛陷入无限空间呢?下面请看正文。

什么是无限空间?

搜索引擎往往处于对新内容渴望,会不断抓取大量陌生页面(既从未抓过的URL),但是如果你的网站因为设计不合理,导致相同内容页面产生大量不同URL,这样会让搜索引擎蜘蛛陷入无限空间的抓取中,消耗大量的宽带。

网站发生“无限空间”现象后,将会占用搜索引擎大量抓取资源,导致网站有价值的内容不被收录,而且随着时间推移,搜索引擎会因为得不到有价值内容而放弃这个网站。

因此合理、科学解决无限空间现象,是网站优化重要课题。

那么无限空间现象,常见发生在什么情况下:

1、日历表

日历表上面的链接,指向无数个过去和将来的日期,既你的链接参数数字可以无限加大,但是仍然会返回正常200代码,这也是日历表产生无限空间重要原因。

2、电子商务网站的列表

在电子商务网站的列表页面,常常会提供一些产品刷选功能,这样虽然有很好用户体验效果,但是却容易让搜索引擎陷入无限空间当中,这是因为程序会因所选的品牌、价格、型号、人气、上线时间、好评等等因素的不同,而产生大量不同的URL,这样无限制的组合就构成了大量重复页面的产生。

在上面介绍了什么是无限空间,以及无限空间的常见情况之后,下面将和大家分享有关无限空间的解决办法:

1、利用谷歌网站管理员工具中的“参数处理工具”来截取一些不必要的链接参数。

截取网址参数办法:

  • 在网站站长工具信息中心内,点击所需的网站。
  • 在网站配置下,点击设置。
  • 点击参数处理标签。
  • 根据需要选择每个参数的选项。(如果未列出参数,则说明Google 在抓取您网站的内容时未找到任何参数。您仍可自行添加参数。)

2、使用link rel="canonical"属性规范网页的标准URL链接地址。

3、从技术角度,避免在URL中使用session ID,减少无限空间的发生概率。

4、给可能发生无限空间的链接加上nofollow属性,禁止抓取。

5、使用robots.txt文件来阻止蜘蛛程序访问。

本文主要是阐述了什么是无限空间,以及发生无限空间的原因和常见情况,并给出了五条解决无限空间的办法,在撰写本文是参考了以下资料:

http://www.scseoer.com/nlimited-url.html

http://www.semyj.com/archives/1136

http://www.google.com.hk/ggblog/googlewebmaster-cn/2009/08/blog-post.html

这里也对以上朋友分享,表示感谢。

文章作者:北京网站优化@红光(QQ:86541358)
文章地址:http://www.010wangzhanyouhua.com/infinite-space/
尊重别人的劳动成果,你的劳动成果也一定会被尊重。
文章来源:除注明来自转载,其余全部为原创文章。
旨在和大家分享网站优化经验、普及网站优化知识。
如果你喜欢本站的文章,转载时请保留文章出处,谢谢。 var _bdhmProtocol = (("https:" == document.location.protocol) ? " https://" : " http://"); document.write(unescape("%3Cscript src='" + _bdhmProtocol + "hm.baidu.com/h.js%3F228e1f36afdcb394a9b26b873488ff28' type='text/javascript'%3E%3C/script%3E"));