信任指数系统算法之TrustRank算法

原创 深圳胜达SEO  2017-07-01 15:13  阅读 32 次

TrustRank算法是最近几年最受关注的,它基于链接关系的排名算法,TrustRank可以翻译为“信任指数”,顾名思义,它衡量网站在搜索引擎上的信任度,网站的TrustRank值越高,那么网站质量越高。

TrustRank算法最初来自于2004年斯坦福大学和雅虎的一项联合研究,用来检测垃圾网站,并且于2006年申请专利。TrustRank算法发明人还发表了一份专门的PDF文件,说明TrustRank算法的应用。感兴趣的朋友可以打开以下链接去查看文件

http://www.vldb.org/conf/2004/RS15P3.PDF

 

TrustRank算法

由于搜索引擎在计算网页排名的时候,非常依赖链接,而且链接的质量越来越显得重要。这种情况,需要对连接的来源站点质量进行判断。更重要的是,以前依靠链接和相关性来决定排名的方式,已遭到了各种各样作弊行为的挑衅,Spam的横行,直接导致了Google必须找到一种新的反作弊机制,以确保高质量的站点来获得搜索引擎的青睐。这种情况下Sandbox和TrustRank被提了出来。意图确保好的站点能获得更高的搜索表现,并加强对站点的审核。

Google自己关于TrustRank的最初论述也提到了这些。

1.域名注册时间在五年或五年以上;
2.网站托管在专用服务器上;
3.网站加载时间快;
4.网站内容是原创的;
5.访客在每个网页的停留时间超过90秒;
6.网站被多个国际IP段引用;
7.网站在其所属行业中拥有权威性。

这些都是商业网站和博客所应有的素质,而不是那些利用垃圾内容和虚假入站链接赚些快钱的网站所具备的。

TrustRank的工作原理:先用人工去识别高质量的页面(即“种子”页面),那么由“种子”页面指向的页面也可能是高质量页面,即其TrustRank也高,与“种子”页面的链接越远,页面的TrustRank越低。

TrustRank采用半自动的方法区分垃圾文件和高质量较文件。依靠专家去评估一系列“种子”页面的TrustRank值。一旦确定了“种子”页面,就容易区分好页面和垃圾页面,通过机器分析链接结构来确定其它页面的TrustRank值。

TrustRank的主要概念是:
高质量页面一般不连接垃圾页面,而垃圾页面总试图连接到好页面以提高其声望;
种子页面的候选者是专业网站,它们只基于优点而链接其它页面,如政府网站、非谋利性网站和严格管理的网站(DMOZ、Yahoo目录、Search Engine Watch等),它们不会链接垃圾页面的。
最权威和可信的网页就是”种子”页面本身。

在处理上TrustRank分两个步骤,源目标的选定和评分的传递。让专家手工识别出少量高质量网站,并赋予其信任值(trust value);TrustRank值会随着页面的传递而降低,随着页面与“种子”页面的跨度增加,其TrustRank值就会越低;

与PR值原理类似,若网页获得了来自高TrustRank值网页的连接,则也就获得了高TrustRank值。通过分析这种链接结构,并以此比较其它页面,进而发现那些没有作弊可能性的页面。TrustRank传递方式与PageRank相似,但web页面没有内在的TrustRank值,因此使得通过链接模式去获取TrustRank值变得更加困难。

PageRank不是Google用于决定页面相关性的唯一算法,TrustRank已经被融入PageRank中以改善搜索相关性,其重要性不言而喻,甚至已经超过PR值的作用。

而随着时间的推移,Trustrank引起的新问题开始渐渐凸显,成为google的新麻烦:搜索结果充斥着著名和权威站点的影子,即使这些页面内容可能是Spam。用一些权重高的站点发布同样的内容页,排名要明显高得多。优秀的个人或企业站点,尤其是新建的,即使内容再好,也难有排名优势。

这已严重影响了Google搜索结果的质量。因此,Trustrank在给Google带来众多积极意义的同时,其负面影响也凸显。Google如何改进算法和弥补不足,我们拭目以待。

虽然TrustRank算法最初是作为检测垃圾的方法,但在现在的搜索引擎排名算法中,TrustRank概念使用更为广泛,常常影响大部分网站的整体排名。所以,TrustRank才是真正重要,真正值得关注的。

历史上的今天:

本文地址:http://www.szsdseo.com/seosf/967.html
版权声明:本文为原创文章,版权归 深圳胜达SEO 所有,欢迎分享本文,转载请保留出处!

发表评论


表情