网址规范化(URL canonicalization)是SEO工作中经常遇到,因而必须了解的一个重要步骤。就我检查过的网站来看,99%的网站有各种各样、程度不同的URL规范化问题。
什么是网址规范化?
网址规范化问题指的是网站上由于种种原因,同一个页面出现多个网址,搜索引擎挑选显示的URL有可能不是最恰当的、站长想要的那个URL网址。网址规范化就是通过一些SEO技术手段,帮助搜索引擎判断出真正的、站长想要的那个所谓规范化的网址。
举例来说,下面这几个URL一般来说指的是同一个文件或网页:
http://www.domainname.com
http://domainname.com
http://www.domainname.com/index.html
http://domainname.com/index.html
https://www.domainname.com
从技术上来讲,这几个网址都是不同的网址,是可以显示不同内容的。虽然在绝大部分情况下,这些网址所返回的都是相同的文件,也就是网站的主页。但是从技术上来说,主机完全可以对这几个网址返回不同的内容。
既然实质上是同一个页面,搜索引擎需要从这些选择当中挑一个最合适的代表,也就是规范化网址。但由于各种原因,搜索引擎不一定能判断正确。
比如,一般来说,网站首页是固定的,只有一个URL。但是有的时候,在很多网站上站长在链接回首页时,所使用的URL并不是唯一的。很可能在网站上,一会链接到 http://www.domainname.com,一会儿链接到 http://www.domainname.com/index.html 。这在没考虑网址规范化的CMS中是很常见的。外部链接也可能链接向不同版本的非规范化网址,而且别人链接到哪里还不能控制。
虽然这些情况不会给访客造成什么麻烦,因为这些网址都是同一个文件,但是对搜索引擎来说却是造成了困惑,哪一个网址是真正的首页呢?
上面举的首页例子只是造成网址规范化问题的一种原因,还有很多其它原因会造成网址规范化问题,会出现网址规范化问题的也不仅仅是首页。比如,电商网站经常会出现的产品列表不同排版、排序、显示产品个数等URL,页面内容是一样的,也会造成网址规范化问题。
再比如以目录为网址形式时尾端有没有斜线,URL中是否有字母大小写混用,用户访问时生成会话ID(session ID)等等,这些都有可能造成网址规范化问题。
为什么要避免网址规范化问题?
出现网址规范化问题,可能会给网站带来很多方面的负面影响。
比如,网站上不同版本的网址大量出现,那么多个URL可能都会被搜索引擎收录进数据库,这时就会造成复制内容网页。
所谓复制内容网页,指的是两个或多个网页的内容是相同或大部分相似的。很多时候,复制网页有可能是作弊手段。就算不是作弊手段的时候,搜索引擎通常也只会挑出其中一个返回搜索结果,而把其他的复制网页都排在最后面,以至于根本找不到。
如果复制内容只出现在同一个网站上,搜索引擎通常不会因此惩罚网站。但获得排名的可能不是站长希望的那个,对转化可能就有影响。如果复制内容出现在不同网站上,搜索引擎判断错误,可能就意味着原创版本没有得到排名。
即使不考虑复制内容,多个版本的不规范化网址也可能造成权重分散,因为网站上的内部链接和外部链接都很可能指向各种不同版本,使得本该获得所有链接的规范化网址没有得到该有的权重,影响关键词排名。
再进一步,即使搜索引擎从多个版本中正确判断出规范化网址,将权重合并到规范化URL上,网站上出现多个URL版本,也会造成抓取份额的浪费,因为搜索引擎需要抓取每一个版本URL,对大型网站来说,很可能会挤占了抓取其它更有用页面的份额。
怎样避免或解决网址规范化问题?
能避免出现网址规范化问题当然是最好,从建站时就要高度注意。如果已经出现网址规范化问题,就要从几个方面尽量解决。
1)谨慎选择CMS系统,看一下其它使用了这个CMS的网站生成的URL都是什么样的。有的CMS是比较SEO友好的,如 WordPress,但即使WordPress也没能完全避免网站规范化问题,可能还需要做特定设置,安装些插件,或者修改模板,修改特定功能等。以后有机会详细写一下WordPress的优化。
2)选择一个规范化网址版本后,全站严格贯彻使用。网站内部在链接到其他内页时,只使用规范化URL。不管是包含www或不包含www,不管URL结尾有没有斜杠,选定一个,就由始至终只使用这一个版本。这样搜索引擎也就明白哪一个是规范化的网址。
3)但是你没办法控制别的网站用哪一个网址连向你的页面。所以应该在你的主机服务器上,把所有非规范化网址,做301重定向到你所选择的规范化版本。这样各版本权重将被集中到规范化版本URL。具体参考301转向贴子。
4)在所有页面上用canonical标签指定规范化网址版本。canonical标签可以理解为和301转向的功能几乎相同,但用户是停留在原URL的。
5)在提交给搜索引擎的Sitemap.xml文件中,只提交规范化网址。
zac,下一篇blog可以把国外的最新的301定向方面的信息发布一下.
这只是建议.
顶!!!网站优化真的好难,所以偶每天来这学习受用,感谢版主罗。。。。
google在中国经常会出现打不开的情况(至少现在这个问题一起没解决),所以我们习惯了用百度,有时间可以讨论下baidu的优化更实际些^_^
robinliu: 这一两天会写篇301定向方面更详细的文章。多谢建议。
Mike:欢迎来我的博客,也谢谢建议。我最近才开始研究中文搜索引擎,过些天会讨论百度排名等的心得。
不过,所有的搜索引擎优化原则都是相同的。我的经验是,能在google排名好,其他搜索引擎也不会差。
搜索引擎的排名原理大同小异的,只要我们真正的用心做好自己站点的优化,投入会有回报的.
静态页面怎么做301转向呢?还有在我的网页链到首面是用/index.htm和www.mysite.com 链到同一网页,最近我的收录一直在下降 这算不算规范问题。
你网站的资料比较新,我大都是读英文的,不过有困难,还是这里好。
石头王:如果www.mysite.com/index.htm和www.mysite.com都在Google结果中,可能就会有URL规范问题。
可以参考这篇301转向文章:
http://www.chinamyhosting.com/seoblog/2006/04/12/301-redirect/
seo:谢谢。我会尽量讨论最新技术。我也是每天都读一大堆英文论坛和博客。
http://www.chinamyhosting.com/seoblog/2006/04/12/301-redirect/ 我看过,我是想问,在htm里怎么写html代码让它301转向,因为服务器不在我那,无法修改apache
据我所知,HTML无法做301转向。在HTML里只能做JS或META REFRESH,但不是301转向。HTML一被读取,就已经返回200 OK状态码了。
如果你的页面是ASP或PHP还可以做301转向:
ASP:
<%@ Language=VBScript %>
<% Response.Status="301 Moved Permanently" Response.AddHeader "Location", " http://www.domain.com" >
PHP:
Header( “HTTP/1.1 301 Moved Permanently” );
Header( “Location: http://www.domain.com” );
?>
另外,DOThtaccess文件只是一个普通文字文件,你用Notepad建这个文件,放上指令,存在你帐号的根目录下就行了。不需要修改Apache。
谢谢你的提醒。
谢谢,你能够给予回答:DOThtaccess文件是怎么命名的,后缀名是什么,就新建一个什么名:DOThtaccess或是htaccess.dot 还是.Thtaccess因为.Thtaccess在window下不能建
文件名就是DOThtaccess(把DOT换成点“.”),没有后缀。在Windows下可以建。
支持,学到一些知识.
你好,我看了你写的 301 重定向后才知道如何规范自己的网址。我用 site:laomiao.org 和 site:www.laomiao.org 在 google 和百度里搜,基本上只有前者,所以我把 http://www.laomiao.org 全部重定向到 laomiao.org 了。
但我看了 google.com yahoo.com 这样的网站,都是重定向到 http://www.google.com 和 http://www.yahoo.com 的,是不是这样会更好一些?
还有一个问题,一般网站默认将网站转换成链接时,都只会认带 www 的,比如 http://www.laomiao.org 可以自动链接,而 laomiao.org 就不行。
关于301跳转问题的请教:
我的网站是由几个大模块组成,为了实现每个大模块由一个二级域名来访问,我把几个二级域名都指向了主站www.chinamtcm.com的主页,然后在主页中用程序来实现跳转,但是我发现这样是违反了301跳转的规范,同时也是影响我们网站排名的,像我这种问题该怎么调整和修改才能实现到301的做法,并能满足我的二级域名访问我模块页面的需求?
怎怎么做域名的重定向啊,要在我的主页上写代码么?还是直接在index.asp上面设置,重定向!我的是iis主机
学习…老大你太有才了
这样指定跳转到新哉名的文章ID行吗?
URL网址规范化问题,值得重视,细节决定成败!
一 问题描述:
由于业务需要,我需要将来源网站的别名信息
作为用户信息的一部分,于是我把外链接设置成了:
http://www.我的域名.com/index.asp?s=来源网站的拼音简写
二 样例:
比如这个用户是从百度过来的那么链接URL就是
http://www.我的域名.com/index.asp?s=baidu
或者
http://www.我的域名.com/index.asp?s=baidu_关键词
三 所以请问:
1:这样会引起URL网址规范问题吗?
2:会影响排名吗?。
3:如果会如何补救?
四 注:我的域名是www.xian-yuan.com
学到了,原先我还以为首页有二种方式对网站来说是好事,所以我在做网站内链时,有时是http://www.gzlicai.net.cn/ , 有时是 http://gzlicai.net.cn/ ,看来以后要统一规范了,谢谢管理员!
请问一下,网上购买的普通的win iis 支持 asp,net,php的这种空间怎么设置301呢?谢谢了。
老师:我的网站www.ywzz.com被百度屏蔽了,但是ywzz.com却能搜索的到,这段时间我吧ywzz.com转发到 http://www.ywzz.com这里。奇怪的是搜索到的还是ywzz.com. 请问我该怎么处理比较好,希望能回答,谢谢
这篇文章的操作性很强,尤其是后面的评论 收藏了
怎怎么做域名的重定向啊,要在我的主页上写代码么?还是直接在index.asp上面设置,重定向!我的是iis主机
我的网站是由几个大模块组成,为了实现每个大模块由一个二级域名来访问,我把几个二级域名都指向了主站www.chinamtcm.com的主页,然后在主页中用程序来实现跳转,但是我发现这样是违反了301跳转的规范,同时也是影响我们网站排名的,像我这种问题该怎么调整和修改才能实现到301的做法,并能满足我的二级域名访问我模块页面的需求?
楼上的这两个问题也是我想问的,请教!
你好.我今天才看到了你的文章,文章非常实用,但我是刚学做网站的,对301重定向没有一点基础,我做的网站是www.dg-linhai.com,我只是做了静态网站,没有后台的。只是用Dreamweaver cs3做好网页就用FTP直接上传的。我这样的请问我怎样才能做301重定向。我打电话问空间商他说他也不懂。如果我懂叫我教他操作。直可笑!。能祥细一点给我回复吗,我无限感激!谢谢了。
我新做了网站替换了原来的网站并用了新IP,百度上显示了新的网站,但快照显示的是新FLS旧网页,快照时间未变。其他新子页面,也在同天抓拍到,但只一天就全没有了。参看百度 唐山创想广告www.tscxgg.cn 敬请您百忙中及时指教
我的是智能型建站系统,没有FTP功能,请问我该怎样做301重定向?http://www.mwdss.com 魅网时尚
请问我这个网站该怎么做301重定向?
现在是SEO的基本要求
刚写seo,还有很多不懂的,先记下来,慢慢体会吧!
这个非常值的读
感觉,如果做百度排名,www的地址是首选
每天来都没有更新~
新手上路,刚开始接触SEO,基本什么都还不懂,前来学习,吸取精华
ZAC老师 301 只做首页 吗 ?我的意思是 301 只规范 首页就行了是 吗 ?
我的网站,正遇到这种问题!给客户做的网站。很麻烦。
301确实很重要 …
301确实很重要 …
我现在以现URL网址规范化对新站来说可以减少搜索引擎判断网站的绝对地址做好URL规范化可以更快的收录时间。原来这是SEO的基础,学习了。
我的网站也遇到这样的问题, 现在百度收录了www.diyifangshui.com 和www.diyifangshui.com/indexhtml这两个页面,头疼!
关于网址唯一性,百度“太仓人才网”,第一个阳光版的就是我们的网站,问题是在这个百度结果页面的第二页,收录了很多个title为“太仓找工作-太仓人才网”的地址,仔细一看,是因为这是一个使用get方式的搜索职位的页面。
所以百度收录了很多,可能分别是(下面的中文是为了说明清楚,实际上已经url编码)
http://www.tcrcsc.com/page_zwss.php?zwmc=工程师&submit_search_x=1
http://www.tcrcsc.com/page_zwss.php?zwmc=程序员&submit_search_x=1
http://www.tcrcsc.com/page_zwss.php?zwmc=文员&submit_search_x=1
比如这样3个地址,百度就收录了3条,title都是“太仓找工作-太仓人才网”,如果我想要合并权重,如何实现呢?
看了你的实战密码,一直追寻到这里,还是不懂怎么做301转向, 好难
你好,我现有的网站怎么判断哪个网址是规范化网址呢
请教博主我这个站的301做的正常吗?http://www.gdbyxy.com 是否符合你说的那个规范》?
google welcome to china .
讲的很好,很受用,很多新站长,会有个误区,就是不会考虑页面的内容差不多。就是希望页面越多越好,。
Hello zac,
可以问个问题吗? 就是为什么网址中间的斜划线多加几个, 还是同样能打开这个网页呢,比如说http://www.5kplayer.com/video-music-player/media-player-update-for-windows-10.htm 我这样写http://www.5kplayer.com///video-music-player/media-player-update-for-windows-10.htm 或者这样写http://www.5kplayer.com/video-music-player////media-player-update-for-windows-10.htm 都完全可以打开, 为什么呢, 这样是不规范的吧。
多谢。
Daisy
请教我这个站的301做的正常吗?https://www.jx020.com 是否符合你说的URL规范?
请教我这个站的301做的正常吗?http://www.guolinholdings.com/ 是否符合你说的URL规范?