博客被惩罚讨论小结一

非常感谢那么多朋友对我的博客被百度惩罚或封杀提的建议和观察,连平常一般都在潜水的几个我很关注的blogger,这次都出现了,非常感谢大家。

下面就朋友们所说到的一些可能的问题谈一些想法。

1)highDiy注意到我的博客上有404坏链接,我第一次查还没看到,经highDiy指出具体网页后才找到。我用Xenu查了一遍整个网站的所有链接,发现有三处这样的错误网址,已经改正。

这些不是301转向带来的问题,纯粹是写帖子的时候copy URL copy错了。这三个404错误所占的比例应该很小,不知道是否足以影响网站收录?如果是这个问题,最好。

2)黑色梦中,石头,网络之心,SeoVista等不少人注意到,在百度目前还收录的几个URL的共同特征,我也注意到这个问题,不过还没找到原因。这几个URL实际上都是博客首页,不同之处是接在后面有一些参数。

黑色梦中觉得可能是投票功能带来的这些URL,我仔细看了一下投票插件,似乎不太可能产生这种URL,也不知道百度是从哪里抓取的。

就我所知,正确的URL后面加上?XXXX和原来那个正确的URL是同一个网页,大家可以去yahoo.com/?123456看一下,得到的就是雅虎原来的首页,不会产生错误,服务器返回的是200。

这种手法实际上以前常用来跟踪链接用,搜索引擎算法应该了解这种URL和原来正确的URL是一回事,而且有可能其他网站用这类URL连向目标网站。如果搜索引擎算法不能正确判断,那么很多网站都会出问题的。

题外话。还一个特点是这几个URL收录的都是不同日期的首页,说明百度和Google一样,在数据库中都收有多个版本的同一个URL。这些URL因为是不同日期的,所以收录的内容并不一样,应该不会被当做是复制内容

但是有没有可能被当做是隐藏网页呢?

3)枫林,Robin,David等都感觉301转向可能是个问题,我的博客里面还有很多链接是指向域名首页的,但是域名首页做了301转向到博客首页。按说这不应该是问题,但是也许百度被搞糊涂了,觉得这是作弊。

我会等一个月时间去掉301转向,看情况怎么样。

4)SeoVista注意到我做301转向之前,域名首页曾经有虚拟主机服务的内容,不过只是一个大概的页面设计,正文是空白的。也许百度认为这说明这个网站带有商业性,只有那么一个空白页就判断是商业性的网站,而且进行惩罚,是不是有点未卜先知了。

也许百度认为我在用301转向试图隐藏什么?

困了,明天继续。

------首次发布日期: 2006年10月29日

作者: Zac
版权属于: SEO每天一贴
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。



17 条评论 “博客被惩罚讨论小结一

  1. 是不是因为你的blog在业界比较有名气,百度想给众多的seo及爱好者来个下马威?

    呵呵,开个玩笑。

  2. [quote]
    枫林,Robin,David等都感觉301转向可能是个问题
    [/quote]
    我的小站进行了包括域名和网址参数变更后的整体301重定向后,几天之中百度就收录了新的域名和新域名下的绝大多数网址(也许是直接从原网址更改域名而来,具体不清楚)。倒是在google中的收录情况叵测。如果不出意外的话,这个事实应该否定有的朋友说的“百度一跳就死”的说法。
    我把整个301重定向的过程记成了日记。感兴趣的朋友可以看看,上面我也提出了一些自己的疑问,如果有哪位朋友能在我的日记中指点一二,本人感激不尽。
    我的这篇日记是:百度和google对本站301重定向的反应 网址: http://java.learndiary.com/disDiaryContentAction.do?goalID=2630

  3. 对了,我最近有个发现,好像org域名很容易逃出google沙盒,前一阵才注册的domovie.org,现在已经能用google搜索出来。但是同时绑的com域名就搜不出来。

  4. 这个现象很正常的,301转向,把就是不再存在的网页转向新的地址,如果你把整站做了301转向,那么就等于告诉搜索引擎我这个网站所有的网页已经不存在了,我要转向新的站点,(请记住301不会把内容转过去的,)这样导致搜索引擎先把你网站的内容全部删掉,然后再收录新的网站内容,根据我以往的经历应该在1周–6周之间可以全部重新收录,当然这个看你站点的受欢迎程度.请不要对301转向产生误解,这件事也说明了百度更新比较快

  5. Zac,我的意思不是针对单纯的那么三个链接,而是,既然将域名首页做了301转向到博客首页,为什么不把如“http://www.chinamyhosting.com/2006/……”格式的链接都301至“http://www.chinamyhosting.com/seoblog/2006/……”呢?毕竟这样,1、没有风险,而且类似这样格式的链接都属于博客内容;2、必须考虑某些搜索引擎在算法上的弱智以及在某些细节上图省事带来的问题,比如说该SE将之前索引时将“http://www.chinamyhosting.com”作为根,在如今必须以“http://www.chinamyhosting.com/seoblog”为根时未必能及时地过度过来,这样,在该SE中也许你的内容页面便会成为404

    至于“?image=1151725862”,个人怀疑是不是类似于某种性质的网页快照,当然,这也是SE本身的问题。

  6. qingdong: google related command is not based on topic, it’s based on link relationship. for example, site A links to your site B and some other’s site C, then B and C are related, although B and C are not connected in any direct way, you may not even heard of site C.

  7. qingdong: google related command is not based on topic, it’s based on link relationship. for example, site A links to your site B and some other’s site C, then B and C are related, although B and C are not connected in any direct way, you may not even heard of site C.

留个言呗:

您的邮箱不会被显示在页面上。标有*的是必填项。