SEO深度解读之HITS链接分析算法(2)
上图所示的页面文档集合里面包含了4个导出链接,假设该页面是阐述视频网站排行榜的相关内容信息,而4个导出链接均包含了不同的4个独立的视频站点,其中三个为已知的权威站点,第二个站点为我们作弊的站点。而此方式可以用来增加链接的投票推荐度。 最后一个HITS的缺陷在于它的结构不稳定,何为结构不稳定?简单来说就是在原来的网页文档集合里面,如果新增或删除网页链接,那么就会对HITS算法排名有着非常大的改变。比如大家都知道交换的链接除了相关性还需要讲究稳定性,却不知道稳定性这个概念正是因为HITS的缺陷而导致的,如果链接一旦不稳定,包括链接位置变动、链接被删除等都会影响算法结构的重新计算。从而影响了自身站点的关键词排名。 五、HITS算法实战应用(实验) 现在我们到了SEO实验阶段了,说千道万不如实战验证。由于文章的特殊性,所以本文只发布和分析一个案例。首先我们来了解下实验步骤! 步骤: 第一步:实验假设 假设一:枢纽页面与权威页面均成立(存在这种现象/说法); 假设二:假设一个网站在不操作任何外链、站内更新、站内布局调整的情况通过HITS算法的逻辑提升排名; 第二步:准备实验站点(记录实验时间和站点快照时间) 1、首先我们准备了一个地区SEO词排名在23位的站点,该站点的该词排名稳定23位超过1一个月(因为不排除其他外链、内容更新影响排名的下降或者提升),所以该站排名23位空档稳定一个月+最好。 2、然后我们记录好站点的快照时间以及最后更新文章的时间节点,保证页面没有被蜘蛛抓取更新过和页面做过内容变动(达到实验的最佳效果),如下图所示:
快照时间:2017年02月03日 11:42:34 第三步:HITS算法验证(记录实验时间和站点快照时间) 1、验证方式:Hub枢纽页面验证 2、验证详细步骤:首先我们知道一个好的枢纽页面里面肯定会包含一些权威页面或者包含了一些好的枢纽页面,那么我们是不可能去加一些百度、新浪这种链接给自己做导出的,因为并不符合相关性逻辑。那么我们添加的其实就是排名首页的太原SEO站点,如下图所示:
上图是实验站点添加的7个排名在首页的太原SEO网站站点,并且为了防止页面权重流失,均添加了Nofollow。那么肯定就会有一个问题,为何我们要添加首页的而不是排名第三页或者第五页的太原SEO的站点。其实如果大家往回去思考这个Hits算法就不难发现hits所强调的hub页面在某一个点(领域)上肯定是有权威性的,并且搜索引擎的目的是为了用户需求而产生检索结果。如果你把排名前10位的站点容纳在一个站点上面,就已经告诉了用户,我的这个站可以找到你想要的内容。并且我这个站的主题也是“太原SEO”,那么可以更加符合用户检索结果。 第四步:排名统计(记录实验时间和站点快照时间) 我们在来看一下添加加了Nofollow以后的单向链接的快照,如下图所示:
快照更新时间:2017年02月08日 21:45:06 虽然快照更新。但是排名记录23位,这个时候需要有耐心,因为快照更新不代表排名会更新,需要时间等待,我们用工具每天记录了该站点“太原SEO”的排名,如下图所示:
我们可以通过5118大数据平台看到从2月4日修改链接以后直到2月8日快照更新排名都没有提升过,直到快照更新后的5天时间,排名发生了变化,并且中途出现过排名波动退档到原来的位置。然后我们在来看一张排名截图,如下图所示:
从2月20日排名回档在到恢复以后直到目前文章截稿位置排名一直稳定第二页。说明整个实验操作过程排名提升了10个位置左右。 第五步:效果评估与总结(记录实验时间) 通过整个的算法原理分析、实验认证,大家可以很清晰的看到利用一些搜索引擎算法去做到一些事情。当然这里面可能有会有人提出质疑,一个实验会不会是巧合,由于类似实验我操作过不下数十次,成功率基本上高达90%,所以几乎不存在所谓的巧合。但是并不是每个朋友都可以去这么操作,因为里面有很多需要注意的细节。 1、为何我要选择一个站点排名在23位去做实验,而不是100后的站点?因为从Hits算法本身来说,如果你去采用一个100以后也就是没有排名的站点去做实验操作明显是有问题的,因为并不满足Hub的要求。搜索引擎认可一个站点需要一定的时间和信任度,在你网站没有任何信任度的情况下你去加一些很好的Hub链接放到自己的网站上面并不能产生很大的效果。 2、之所以在有排名的情况下去操作是因为这种微调效果非常好,并且记得加上Nofollow,利于防止权重流失。 3、如果你的域名是老域名(使用过的老域名站点),那么及时在没有排名的情况也可以去进行这类实验操作,因为老域名站点本身就具备一定的信任度,无需让搜索引擎长时间的去评定页面的质量(包含了信任度评分、页面价值评分等)。 总体来说,在搜索引擎里面,算法其实有非常多,包括公开的链接分析算法就有Hits算法、HillTop算法、SALSA算法、PageRank算法等等,在比如还有文档检索模型(包含向量空间模型、概率模型、布尔模型等),在比如还有倒排索引、TF-IDF等,其实这类算法在百度上都可以找到他们对应的透明的计算公式(涉及到高等数学),如果你能够前行研读和深究的话不难发现一些SEO排名的奥秘所在。 本文作者:SEO算法研究微信号/QQ号:1013240126 独家原创首发卢松松博客 来源:卢松松博客,欢迎分享,(QQ/微信:13340454) 原文地址:http://lusongsong.com/reed/8520.html (编辑:ASP站长网) |