SEOVIP学习社区

 找回密码
 注册
搜索
查看: 2020|回复: 2

浅谈SEO网页特征向量

[复制链接]

该用户从未签到

zxczxc9951 发表于 2011-5-25 10:37:17 | 显示全部楼层 |阅读模式
先来说一下影响搜索引擎排名的四大因素,这四大因素分别是,
  一:网页信息(让网页的内容与关键字高度密合)
  二:网页权重(这体现在PR值上)
  三:用户行为(百度会参考用户的点击来衡量网页与关键字的相关度)
  四:目录参考(例如DMOZ 雅虎分类目录等人工编辑的目录)
  一般我们在查看网站后台统计的时候都会发现,权重较高的页面能获得长尾关键字的排名,但未能获得热门关键字的排名。这除了与网页权重的竞争之外,也与“网页信息”有一定的相关性。这就好比你的网页是优化SEO关键字的,但你在以SEO的热门关键字中并没有很好的排名,反而在一些:SEO教程,SEO搜索优化 这样的复合关键字(长尾)中拥有好的排名。这种情况往往体现在网页的特征向量的问题上。

  在搜索引擎技术中,有一个非常重要的概念,但在流行的SEO教程中很少看到,这个概念就是网页特征向量

1、 什么是网页特征向量?
  所谓网页特征向量就是通过对网页内容的分析,通过分词技术的处理,找出对网页内容最具有重要影响的短语、词和字,他们按照一定顺序排列,便构成了这篇网页内容的“特征向量”,“特征向量”可以看作是对网页正文信息的有损压缩,但他在内容上一般是足够的。

2、网页特征向量的启示
  用网页特征向量来代替网页的正文,是搜索引擎技术的一个原理。搜索引擎并不关心每个网页的具体内容,而只关心网页内容是否属于某个主题或者某个类别。因而,搜索引擎只能推论文章的分类、文章的关键词组和文章的特征,并不能体会文章的感情。如果你要表述一个很重要的关键词,请你不要整篇文章都是比喻!
  搜索引擎对网页实施特征向量计算更多的是数学上的计算,不同的搜索引擎采用的算法不尽相同。但是在对网页实施特征向量计算过程中最基础的不是算法,而是分词技术!
  我们可以看一下这个例子:搜索引擎会动态抓取正文的内容来做为SERP(搜索引擎反馈页面)的描述。这往往可以知道为什么只有准确、独特的Meta信息,才能为搜索引擎提供参考。很多时候我们看到新浪,网易上的娱乐文章都比较短,但却都可以获得好的排名,是因为精短的文章可以让搜索引擎更好地理解一篇网页的“重点内容”。使其在相关的关键字上能获得较高的排名。当然,这也与网页的权重,链接等多种因素相关。我的小站:广东汇众教育(http://sz.gamfe.com/)


该用户从未签到

hawkret 发表于 2011-5-31 17:52:46 | 显示全部楼层
谢谢,确实意识到密度的问题,唉又不知道该怎么去改,现在网站这样的模式不好改啊,指教下吧,http://www.xin95.com

该用户从未签到

andows 发表于 2011-7-10 22:03:24 | 显示全部楼层
DMOZ是王道
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|SEOVIP学习社区

GMT+8, 2024-11-23 05:50 , Processed in 0.034778 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表