SEOVIP学习社区

 找回密码
 注册
搜索
查看: 2126|回复: 0

联想词功能

[复制链接]

该用户从未签到

893184203 发表于 2012-7-27 16:04:02 | 显示全部楼层 |阅读模式
       百度会获取用户的查询信息和查询次数。假设说我要显示10个联想词,那么只要输出访问数量前十名的关键词即可。百度估计在这里还对关键词做了过滤,Google因为没有过滤是导致这次被处罚的最大原因。
    判断相关联想词。在这里,到底哪十个关键词可以被输出,主要得看这些关键词是否和用户所搜索的关键词是否相关。百度会在对用户查询词进行分词的基础上,计算关键词的相关性。同时, 计算用户查询和历史用户查询的相似性,相似性计算是通过两者重复关键词的权重之和得出。
    判断联想词的输出顺序。十个关键词是完全按照流量排序呢,还是按照其他规则进行排序?
    如果用户查询只是一个不可再分词的关键词就相对比较简单,只要调出跟这个关键词相关的查询字符,并且按照查询次数排序即可。而对于可以再进行分词运算的关键词查询则复杂得多,假设这个查询词可以切分为A、B、C三个最小单位的关键词,百度在提取相关关键词进行排序的时候,会有一个匹配关键词的权重过程,这里会运用到搜索引擎的一个特殊算法IDF公式,每个关键词的权重用关键词的IDF来计算,大的排序原则根据这个权重进行排序输出,如果两个历史查询包含相同的重复词汇集合,那么查询权重相同,则按照用户查询次数有高到低排序输出。


您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|SEOVIP学习社区

GMT+8, 2024-12-24 02:53 , Processed in 0.055235 second(s), 21 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表