英文网站优化中的词干技术

词干技术(keyword stemming)在英文网站优化中比较明显,但对中文网站优化也有一定的借鉴意义。

词干技术指的是英文中某些词是由一个主要的词干衍生出来的,比如说work是一个词干,由这个词可以产生很多意义相同或相关但不同的时态,语态,单复数等形式,如working,worked,worker, works, workers。

网页内容的写作中,应该尽量把同一词干衍生出的不同形式自然的融合在句子当中,而不要仅使用单一形式。也就是说,如果你的目标关键词是work,最好working,worked,worker, works, workers等这些词也要适当出现。

这样做至少有两个好处,一是有助于搜索引擎建立网页主题概念。因为这些相同词干的词其实意义都是相同,或者极为相近的。

二是用户在搜索的时候,有可能使用各种各样的变体,不一定都是作者最喜欢用的那个词。如果你在网页中出现各种变体,你的网页有更高的可能性在不同搜索词结果中出现。

当然这些词的出现必须符合逻辑,符合语法,不干扰读者阅读。这样的写作还是有一定难度的。

相同的原理还可以衍生出两个注意的地方。

一是英文中不少词不太一样的拼法,但意义完全一样。比如说web site,website,site,这几个词其实在意义上没太大不同,可以互换使用,在不同的句子中完全可以交叉使用不同的说法。

再一个是在内容写作时,尽量把同一个词的变体及词的各种顺序排列都考虑进去,把这些都混起来使用在不同的地方。比如

web design
web development
site design
website design
web site designing
design web site
site developed
……

这些词的主题都是相同的,如果在一个网页上,这些词交互出现,那么对主关键词(web design)的优化具有很好的加强作用,并且也可以涵盖更多的搜索词。

中文网站的SEO,虽然没有直接对应词干技术的东西,但根据相同的原理,我们也可以延伸考虑。比如搜索引擎对一些意义很相近的词是否当作同一个意思。

“基础”和”入门”这两个词,虽然读音写法风马牛不相及,但意义是非常相近的。在某些情况下,搜索引擎在理解网页内容的时候,很有可能把这两个词当作一回事。除了直接建立同义词、近义词词库,还可能应用基于潜在语义索引的语义分析

------首次发布日期: 2006年08月30日

作者: Zac
版权属于: SEO每天一贴
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。



24 条评论 “英文网站优化中的词干技术

  1. 请教站长一个问题:

    我做一个站,不懂什么SEO,用的是一个BLOG程序,关键词过度优化。现在排名不错,我怕搜索引擎惩罚我,我是指百度,我如果现在把过度优化的痕迹都去掉,搜索引擎对我的站是会既往不咎呢,还会是一查到底?

    谢谢,经常关注你的博客,感觉很好~
    ====================================
    那么既往不咎的话,能不能说,这也是一种手段呢?

    还有如果我把过度优化的关键词都撤下来,排名一定会下降了,这个下降的过程要多少,几天还是几个月。

    谢谢!

  2. 《SELECT onchange=“jumplist(this)””》
    《OPTION selected value=”nowhere”》Other Brands《/OPTION》
    《OPTION value=”http://www.*****.net”》字《/OPTION》
    请问value里的url会不会收录,能不能找得到

  3. 昨晚不是我: 我相信在某种程度上已经达到了。

    >>那么既往不咎的话,能不能说,这也是一种手段呢?

    会被惩罚的手段。既往不咎是你被抓到之前改掉,也就是不能用的手段,叫什么也没意义。

    baigogle: 按Matt Cutts的说法,有的时候可以,但干嘛找麻烦呢?

  4. Zac,不是找麻烦?也是为了优化的考虑,因为在静态页太多,虽有排名好,但不利于更新,我是希望找不到,因为我的下面也有静态的锚文本。用js有利,一定程序上对用户友好。

  5. 大师,我有一个问题想请教:
    在英文网站优化中,如果我想改动一个已有PR,非核心词排名不错的网页标题,怎么改好

  6. 请教站长一个问题:

    我做一个站,不懂什么SEO,用的是一个BLOG程序,关键词过度优化。现在排名不错,我怕搜索引擎惩罚我,我是指百度,我如果现在把过度优化的痕迹都去掉,搜索引擎对我的站是会既往不咎呢,还会是一查到底?

    谢谢,经常关注你的博客,感觉很好~

留个言呗:

您的邮箱不会被显示在页面上。标有*的是必填项。