百分零部件网

登录

百度分词切词研究--长尾关键词的百度切词方法分析

发布时间:2008/11/27 10:38:06
浏览次数:631

 我们接上次讲的百度切词继续讲的详细一些

  对与百度的分词研究从开始做优化以来,我一直都没怎么在意,但有一次我在作优化时无意中发现一个词也就是差了一个字,结果排名大不相同。
我作的电动机保护器这个关键词,但是我的页面上的关键词设置却是“电机保护器”,可能有的朋友会说,这个没什么问题啊,“电动机保护器”不是包含了电机保护器这个关键词吗?如果没有仔细对百度的分词进行研究,大家可能看不出这两个词会有什么区别,不过大家只要稍微留心一下搜索出来的结果,就可以看出端倪了,百度在对这两个词分词出来是不一样的,虽然电动机包括了电机这个词,但是百度切分的时候电动机是一个词,电机也是一个词,虽然包含了,但是却影响的排名不一样,也就是一个词的匹对问题。
  当然这个说起来比较抽象,大家可能理解不了。因为举的这个例子也许不是很准确。那么我们就再深入的进行一下研究:
  1、百度分词是根据内容中,*次出现关键词相关词为标准来分的。例如"承德电磁流量计LDB"这个词
如果你的正文中*个出现的是"承德"这个词,那么你的页面上的关键词就会被拆分成"承德"和"电磁流量计LDB"两个词,“电磁流量计LDB”根据百度的词库匹对分析与页面的内容分析,之后会成立单独的一个关键词或者是再次的切词、分词,变为“电磁流量计”“LDB”。然后,标题中切记一定要包含关键词,但不是说一定要*匹配,但内容中出现的关键词要跟百度分词*匹配,在*匹配中又会根据文件URL路径的深度来进行排序,在关键词都*匹配的情况下,比如说目录比文件有优先权,根目录下的文件要比二级目录下的文件有优先权,*匹配的会排在前面,然后才是部分匹配的。 
  不知道这条大家是否理解,不理解的话多参详几次,再不明白可以本人

  2、在关键词没有*匹配的情况下,如果有分词,比如说:电磁流量计说明书下载
这个关键词,有一个网页里*次出现的关键词是电磁流量计说明书,并且有较高的关键词密度,但是这个网页中却没有”下载“这个关键词。而另一个网页里*次出现的关键词是下载,那么这个网页的关键词就会被拆分成 电磁流量计说明书 下载 两个词,虽然第二个网页里包含有“电磁流量计说明书” “下载” 但是*个网页还是会排在第二个网页的前面,这说明关键词的前面部分是zui重要的。
  不知道这条大家是否理解,不理解的话多参详几次,再不明白可以本人

  3、关键词*部分出现的频率是排名的关键,比如说 “电磁流量计说明书  下载”,如果两个网页都没有*匹配,都是含有两个分词,那么“电磁流量计说明书”这个分词密度高的网页将会排在前面。 
  不知道这条大家是否理解,不理解的话多参详几次,再不明白可以本人

  4、如果*匹配,但是关键词*出现是在页面内容的zui后面部分,那么这个网页的排名将比前面这些页面还要低。所以关键词尽早在内容中出现是非常重要的。

  5、百度根据*次出现的相关关键词切词,如果*次出现的相关关键词是关键词的尾部,那么就从后面开始切,如果是前面部分就从前面开始切,也就是根据网页内容的顺序和反序进行分词,顺序的时候就是以关键词前半部分为起点,反序的时候就是以关键词的后半部分为起点。例如:“电磁流量计说明书下载”这个关键词,如果你的网页中*次出现的关键词是“说明书下载”,那么你这个页面的关键词会被拆分成“说明书下载”和“电磁流量计”两个词。 
 

  6、可以根据百度的切词原理,自己来选择比较好作的关键词头部(也就是调整你网页内容中*次出现的关键词)。也就是进行人为切词,百度会进行从前往后判断,也会从后往前面切。

  7、如果切词出现前半部分和后半部分有重复的话,那么有重复的会比没重复的排名低,但如果都有重复那么就是根据前半部分的密度来判断。


  8、如果在关键词没有*匹配的情况下,并且关键词出现得不完整,比如说:LDB电磁流量计说明书,网页的内容包含的关键词中如果没有“LDB”这个词,那么切词就会从“电磁”开始,但是这样的网页都会排在比较靠后了,因为你关键词的前部分都没有包含LDB

  9、缺词的情况下下,如果与不缺词的网页进行比较的话,那还是根据切词前部分的密度进行排序,也就是说按照切词的顺序,如果切出来的词,前部分的密度比后部分的密度比例是关键,例如一个网页中,前部分与后部分关键词的比例是1:2,另外一个网页的比例是1:4,那么当然前面的那个网页排名要靠前。同样在缺词的情况下,切出来前词短的排名有优势

  10、如果不缺词,但是关键词后面部分比前面部分先出现,例如“LDB电磁流量计说明书下载” 说明书下载这个词先出现,但是“LDB电磁流量计”这个词的密度又不高的话,那么排名会比那些缺词的还要靠后

  11、同样是后词出现在前面,但是前词与后词的比例是关键,例如一个网页中包含有“LDB电磁流量计” “说明书下载”这样两个词,比例为1:1另外一个网页包含的是 “电磁流量计” “LDB” “说明书下载” 比例是2:1:1,那么前面的那个网页排名有优势,关键词的数量不是关键,出现的位置,以及分词的比例是非常关键的。越靠后的分词占的比例越多,排名越不利 。

  12、关键词在正文中出现的位置过于靠后也是不利的,主词的密度太低也不利,前面的网页情况都是在主词密度差不多的情况下进行比较的。

  不知道大家能不能看懂,如果能看懂的会,你就可以根据百度的分词去调整自己网页的关键词权重设计,这样就可以避免热词的竞争,但是又能作到热词。

相关技术文章:

分享到:

您的留言已提交成功~

采购或询价产品,请直接拨打电话联系

联系人:含玉

联系方式:
当前客户在线交流已关闭
请电话联系他 :