Google自定义搜索引擎再观察

前些天提到Google推出了自定义搜索引擎,是Google在社会化搜索方面迈出的又一步。

现在的搜索引擎都已经意识到,仅仅靠算法很多时候并不能为用户返回最准确最需要的搜索结果。算法的智能和人还差着十万八千里,所以需要通过人的输入来对算法进行矫正。

社会化搜索像书签,标签,网摘,问答等,在这方面就能有很大贡献。

我对Google Co-op和自定义搜索引擎不太看好的原因是,Co-op不仅需要发布信息的人(也就是做Co-op的人)做很多工作,连搜索用户想看到Co-op的内容还要开帐号登录,这是很麻烦的一件事。

自定义搜索引擎好了一点,要定制搜索引擎的人还要做一些工作,不过使用这个自定义搜索引擎的人并不需要特殊做什么。

但是我还是不太看好。因为这个自定义搜索引擎并不是一个集中的Google自己的服务,像Del.icio.us网站那样,这样的服务可以立即推向上亿的人。

现在Google的自定义搜索引擎,要依靠一个个感兴趣的人做自己的搜索引擎,然后再告诉认识的人来使用他做的这个搜索引擎,所能触及的用户范围显然要小的多。就像我昨天做的那个SEO搜索引擎,肯定不会有多少人用。

不过前两天看到一篇对自定义搜索引擎开发主管的访谈,感觉这个产品在搜索算法方面还是相当有用的。

搜索引擎除了对关键词的相关性进行判断之外,还有两个问题一直无法解决。

第一是用户的意图及上下文关系。比如说一个用户搜索宝马,搜索引擎没办法知道这个用户的目的到底是什么,有可能是想买宝马的轮胎,有可能是汽车设计工程师在寻找资料,有可能是已经买了车的人想看看有什么负面评论,好让自己心里塌实点。

没有上下文关系,搜索引擎没办法知道用户心里到底想的是什么,想要的信息是什么。目前一般搜索引擎的做法是,把各种类型的信息混起来,都给出一些。

第二个没办法解决的问题是,就算搜索引擎通过某种方式能知道用户的准确意图,返回哪个网站更适合,也不好确定。

同样是上面的例子,如果搜索引擎确认用户想知道的是宝马汽车制作方面的知识,却还是不容易返回正确的网页。搜索引擎可以知道哪些网页和宝马汽车相关,但是并不容易知道哪些网页是给汽车工程师准备的,哪些网页是卖宝马的,哪些网页是以用户评论为主的,搜索引擎算法还没有先进到这个程度。

自定义搜索引擎就是为了解决第二个问题,

Google自定义搜索引擎允许用户选择哪些网站被收录在这个引擎之内。通常来说,做自定义搜索引擎的都会做一个行业的垂直引擎,这时候每一个自定义搜索引擎下面所收录的网站之间的关系就显现出来了。

而且这种关系不是算法算出来的,而是对这个行业有了解的人人工选出来的。当这些数据足够庞大的时候,Google就能知道哪些网站是什么行业,是给什么样的用户所使用的。

------首次发布日期: 2006年11月7日

作者: Zac
版权属于: SEO每天一贴
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。



4 条评论 “Google自定义搜索引擎再观察

  1. 我今天也试着做了一个(http://www.lulumama.com/node/252),效果不错,搜索结果内置在自己的网页当中,这在很大程度上改善了用户的使用体验。与以前只是可以搜索自己的网站不同,这个CSE可以自己设置搜索的信息源,给了站长很大的发挥空间。我相信在不久的将来,它会很流行。而且就一般的用户来说,也很有用,例如可以利用google page maker 制作自己的自定义的搜索引擎,只搜索自己认为信任的站点,这样也可以通过用户的行为来排除一些垃圾信息,所以我认为这个功能并不只针对做网站的人。

  2. 不知道这个方式对google对这个网站的收录有没有影响!昨天我用这个也做了一个行业垂直的搜索引擎,当然了只加了我一个网站,测试看看

留个言呗:

您的邮箱不会被显示在页面上。标有*的是必填项。