被Google收录的网页数急剧下降及其他

Google的大爸爸数据中心已经全面使用3个月了,最近有一些明显的现象,最引人注目的是很多网站被Google所收录的网页数急剧下降。

这里说的下降不是从90%降到80%之类的,而是几万页几十万页降到几百页。上个月Matt Cutts在他的博客里面曾经谈到这个问题,原因主要是链接质量问题,比如大量交换链接,买卖链接,指向垃圾网站的链接,无关链接等等。

但是从受影响的网站之多和网页收录数目下降之多看,似乎不是链接质量所能解释的。Matt Cutts最近在休假,没有任何来自Google的消息对这个现象做出解释。

有的人发现网页收录数下降和网站PR值有关,PR值决定Google收录多深的网页。比如说如果你的网站主页是PR5,那么你的网页最多可以被收录到离主页2次点击远的网页,超过3次点击以上才能达到的网页就不会被收录了。

有的人还做了一个很大的网站地图(sitemap),把上千个连向深层网页的链接放在离主页只有一次点击的网站地图上,结果这些网页竟然被重新收录了。

不过这种观察到底是个案还是普通规律,除了Google谁也不能判断。而且这种方式对大型网站来说基本上是不实用的,如果你有几万几十万页,不可能把这些网页都做到离主页只有两次点击的距离。技术上可以,但那样做显然违反了Google经常教育大家的原则:从客户出发,不要为搜索引擎着想。

还有的人猜测是因为Google网站地图出了技术问题,因为经常是递交了网站地图后网页收录数目有下降。这也无法证实。

我自己也有网站收录数从一万多骤降到700多,然后过一两天又回到了一万多。

前两天有读者在评论中有提到,他的网站网页收录数目骤降,不知道是什么原因,我想都和Google现在的这个问题有关。如果你也有网站被收录的网页数在Google里大量降低,应该不用太担心,估计是Google自身的问题。

另外前两天还注意到,Google搜索结果中的网页标题偶尔会使用开放目录所收录的网站标题,而不是网页真正的标题,应该是试验性质的,因为时有时无。

还有不少人发现Google搜索结果中的标题出现错误,不仅把标题标签中的文字放进标题,还把网页正文中的部分文字放了进去。有人猜测Google是在做试验,试图动态生成网页标题。

就目前所看,Google在爬行索引上比较混乱,排名影响不是很大,但是如果索引的变化如此巨大,从几万几十万降到几百,恐怕早晚会对排名造成影响。

------首次发布日期: 2006年06月28日

作者: Zac
版权属于: SEO每天一贴
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。



113 条评论 “被Google收录的网页数急剧下降及其他

  1. 网页最多可以被收录到离主页2次点击远的网页,超过3次点击以上才能达到的网页就不会被收录了…

    感觉不是那样…我唯一碰到的一个案例是个类似于阿里巴巴的网站,我第一感觉就是太多无用的供求信息,国内企业很有意思,大家把供求信息抄来抄去,到最后,那些网站里面全部都是复制网页。可笑又可悲!

  2. PR值决定Google收录多深的网页。比如说如果你的网站主页是PR5,那么你的网页最多可以被收录到离主页2次点击远的网页,超过3次点击以上才能达到的网页就不会被收录了……
    这个,我觉得不会,我有一个网站,以前被google关了几个月,这次数据更新之后,就又开始重新收录了~,并且每天开始有很大的收录量,但是pr值现在为0.

    经常是递交了网站地图后网页收录数目有下降。这也无法证实
    ….
    有另一个网站,就是这样…,地图提交之后,就开始变少~~,从十几万到几万~,我现在确得有可能是我即用了二级域名又用了非二级域名的原因~,导致网页重复。这个可能性很大.

  3. 能讨论一下powered by对网站PR值的影响吗?这个东西现在用得很多,但其作用似乎远不及友情链接来得明显。

  4. 我觉得Google是在尝试清除复制网页,他们认为质量低的网页等等。但怎样判断质量低显然出了问题,Google还在调整。

    另外我感觉这个行动和前不久Google的CEO说Google有机器/硬件危机也许有点关系。虽然Matt Cutts很快否认他们缺机器,可还有什么比硬件危机更能令Google决定限制数据库膨胀呢。

  5. flyman:如果你指的是一些免费模板,软件等要求链接到作者网站,就我看对PR很管用啊。但toolbar PR几个月才更新一次,不一定立即看到效果。

  6. 从cctv和soso得到链接当然会很有帮助。还有什么网站比cctv与中文视频更相关?我猜想也没有几个中文网站比cctv更有信任度。

    另外有两个建议。1)在链接里放上你最重要的关键词,2)网站首页内容也需要简单介绍你公司的核心业务,文字中自然包含关键词。

  7. 你好,偶然看到您的博客,知道您对seo很有研究,有个比较奇怪的问题咨询。
    我的一个站点pr4了,但是一直没有被google收录,请问什么原因?

    先表示感谢。。

  8. 如果你指的是签名里的站点,有可能因为前段时间主机返回500错误码有关。另外,那么多sub domain有点怪。

  9. 请教大家:由a到b两个域名做了310重定向(指向同一个服务器(ip)上),逻辑上数据会逐渐专到新域名下,旧的逐渐减少。但现在的状况是,新的到了几万的时候就不再增加了,旧的也不再减少,两边的数据都处在一个静止的状态,这是什么原因呢?是google糊涂了吗,分不清新旧了吗?

  10. Yahooo!一般比较稳定,但对spam的判断比较严,建议先检查网站有什么可能被认为是spam的地方。

  11. 网站的首页被收录,但相关网页没被收录,会是哪些那些问题造成的啊? 十分感谢!我是初次接触网络,所以有点晕。

  12. 我的网站以前在Google有3万多页,有一次我提交网站地图之后,收录页突然掉到几百,一直都上不去,已经有一两个月了!我看了一下Google提供的网站地图里面的抓取记录,发现很多404错误!我把地图删了之后,重新做了一个提交,之后发现还是一样的问题!
    是不是第一次提交的地图还在大爸爸的缓存里?现在我已经把地图删掉了!

    我的网址是:www.manager365.com

  13. 我们网站港开始的时候google收录了好几万页,最多的时候到达8万页。为什么一段时间以后我们就下降了还多。现在就到1万多页了呢?

  14. 你好,请问下怎样可以去找到一些高质量的连接呢?
    PR高的网站都已经有太多的连接了.
    不好去找啊,通过link exchange的会不会有垃圾网站,影响到自己啊.
    怎样的连接才算是高质量的连接,如何去和这种高质量的网站做连接啊.

  15. 回上楼的,一开始先做好网站的内容,先做几个必要的外部链接,让搜索引擎收录你.
    高质量的链接,首页链接,文本链接,对方网站的内容和你的网站相近,对方链出的链接少.做好内容自然会有人与你链的

  16. 很感谢Zac,以后会来多请教。

    只是想问一下,为什么我的网站http;//www.com51.com gg收录的会那么少?在百度有26万多。

    还有最近有很多用户注册时都可以跳过“选择省份”这一项注册成功,而且都是用户名带4位数字的。比如
    148 kexaw0398 CN– 2006-12-24 13:58:55 首页 欧洲[]
    149 reipai7959 CN– 2006-12-24 14:00:13 首页 山东省潍坊市[(诸城)网通]
    150 bubeh0642 CN– 2006-12-24 14:00:17 首页 江苏省[]

    这些带4位数的用户的ip都是显示 CN–,这个Zac或其他朋友知道是什么原因吗?

    先谢谢朋友们了!

  17. 请教一下:

    刚刚从事这种工作,新接一个企业网站,发现最近被google收录的页面都不见了,是怎么回事呢,是不是有人为因素,还是网站质量下降了?

  18. 我的其中一个新站,签名那个。在没有收录之前就已经被百度k了,难道百度跟我有仇吗,
    我查了蜘蛛和访问记录,发现百度曾经收录过几十页但维持不到一小时,就k了。。。
    换了域名再收录几十页又再k,
    我发现,可能根我服务器有关,服务器在美国,内容有点音乐,可能跟版权问题?

  19. 我的网站,四季风批发网http://www.yaoq.com
    PR是3,百度google收录都没多少页,一直就没高过,不知道网站有什么天生的缺陷

  20. 我的网站也是收录的页面越来越少,前几天site:了一下 已经找不到了 一个页面都没有了 是否被google封了 如果是封了 要怎样才能重新让google收录呢

  21. 我的站做了四五个月了,百度,GOOGLE收录都在一百五十多页,PR值连一都没有,看其它人的网站才几十页PR值却很高..不知道要怎么做才会有PR值呢?

  22. 最近我的网站收录也变少了几千页,我觉得有可能是我在gg的等级吧,,
    个人感觉,google是靠对一个网站的三项指数来评论收录数的,pr指,引擎访问pv数,少而精的反链http://www.yundong98.com

  23. 近日的确是变化多!
    比如我的站点www.52shops.cn一天都变化好几次!
    早上的site和中午site,晚上的site竟然都相差好几百页,
    太奇怪了!

  24. 我的网站www.comeinplz.com也是,百度收录正常,可是google收录量一下子少了一半!但是关键词的排名还没有降!

  25. 个人认为,还是google自身的问题。google的反复无常不正是证明google的技术缺陷吗,google告诉我们要以客户为中心规划网站,可是,单篇文章是原创的,为什么收录之后还要K调,或者说,暂时被K调,google能给一个解释吗?百度则不同,百度收录了原创文章,一般很强调唯一性,对于复制的其他的文章一般都不收录了。我们总是为google收录多少而烦恼,正是我们自己做垃圾站产生的烦恼

  26. 另外,这段时间有几个不明白的地方,google对原创是否判定正确与忠诚?!五六篇原创文章,自己添加到我摘/雅虎/百度书签等我摘站以后,googel把网摘站里的引用文章收录了,而原始站内的这几篇原创文章无一例外将权,或者被K调,google能解释吗,至少我不能解释。如果预料中的假设成立,那么,所谓的依靠我摘站推广和吸引流量的方法,是否是毒瘤??

  27. 我也不明白为什么?我的(http://www.zgpiao.com)百度收录有4780,而gooel收录只有1500,而且又在逐渐减少不知道为什么,请懂的人帮帮我,这个地址可以查看我的收录情况http://www.zgpiao.com/t33/index.asp

  28. 我的网站(www.xinge360.com)用google,site:xinge360.com比site:www.xinge360.com,抓取的页面多些为什么。我在谷歌管理员工具已经设置过了www.xinge360.com为首选项.
    谢谢楼主解答。

  29. 我的网站也是这样,本来已经收录了2000条信息,可是到现在就只剩下700条了,过几天就少几百条。这样的情况要怎样解决,主要的问题出在哪里?请大家帮帮忙。
    网址:http://nbgj.eatmeishi.com

  30. 最近几十万的谷歌收录,现在只剩下几万了不知道如何是好呢
    看到大神的这篇文章还是很疑惑,尽管谷歌没有任何流量,但是看到收录减少还是很不舒服。

留个言呗:

您的邮箱不会被显示在页面上。标有*的是必填项。