TrustRank算法的介紹

   TrustRank是近年來比較受關注的基于鏈接關系的排名算法。TrustRank可以叉燒包“信任指數”。

  TrustRank算法適合初來自于2004年斯坦福大學和雅虎的一項聯合研究,用來檢測垃圾網站,并且于2006年申請專利。TrustRank算法發明人還發表了一份專門的PDF文件,說明TrustRank算法的應用。

  TrustRank算法并不是由谷歌提出的,不過由于谷歌所占市場份額適合大,而且TrustRank在谷歌排名中也是一個非常重要的因素,所以有些人誤以為TrustRank是谷歌提出的。更讓人糊涂的是,谷歌曾經把TrustRank申請為商標注,但是TrustRank商標中的TrustRank指的是谷歌檢測含有惡意代碼網站的方法,而不是指排名算法中的信任指數。

  TrustRank算法基于一個基本假設:好的網站很少會鏈接到壞的網站。反之則不成立,也就是說,壞的網站很少鏈接到好網站這句話并不成立。正相反,很多垃圾網站會鏈接到高權威、高信任指數的網站,試圖提高自己的信任指數。

  基于這個假設,如果能挑選出可以百分之百信任的網站,這些網站的TrustRank評為適合高,這些TrustRank適合高的網站所鏈接到的網站信任指數稍微降低,但也會很高。與此類似,第二層被信任的網站鏈接出去的第三層網站,信任度繼續下降。由于種種原因,好的網站也不可避免地會鏈接到一些垃圾網站,不過離第一層網站點擊距離越近,所傳遞的信任指數越高,離第一級網站點擊距離越遠,信任指數將依次下降。這樣,通過TrustRank算法,就能給所有網站計算出相應的信任指數,離第一層網站眼都花了遠,成為垃圾網站的可能性就越大。

  計算TrustRank值首先要選擇一批種子網站,然后人工查看網站,設定一個初始TrustRank值。挑選種子網站有兩種方式,一種是選擇導出鏈接適合多的網站,因為TrustRank算法就是計算指數隨著導出鏈接的衰減。導出鏈接多的網站,在某種意義上可以理解為“逆向PR值”比較高。

  另一種挑選種子網站的方法是選PR值高的網站,因為PR值越高,在搜索結果頁面出現的概率就越大。這些網站才正是TrustRank算法適合關注的、需要調整排名的網站。那些PR值很低的頁面,在沒有TrustRank算法時排名也很靠后,計算TrustRank意義就不大了。

  根據測算,挑選出兩百個左右網站作為種子,就可以比較精確地計算出所有網站的TrustRank值。

  計算TrustRank隨鏈接關系減少的公式有兩種方式。一種是隨鏈接次數衰減,也就是說如果第一層頁面TrustRank指數是100,第二層頁面衰減為90,第三層衰減為80.第二種方法是按導出鏈接數目分配TrustRank值,也就是說,如果一個頁面的TrustRank值是100,頁面上有5個導出鏈接,每個鏈接將wfux20%rTrustRank值。衰減和分配這兩種方法通常綜合使用,整體效果都是隨著鏈接層次的增加,TrustRank值慢慢降低。

  得出網站和頁面的TrustRank值后,可以通過兩種方式影響排名。一種是把傳統排名算法挑選出的相關頁面,根據TrustRank值比較,重新做排名調整。另一種是設定一個適合低的TrustRank值門檻,只有超過這個門檻的頁面,才被認為有足夠的質量進入排名,低于門檻的頁面將被認為是垃圾頁面,從搜索結果中過濾出。去。

  雖然TrustRank算法適合初是作為檢測垃圾的方法,但在現在的搜索引擎排名算法中,TrustRank概念使用更為廣泛,常常影響大部分網站的整體排名。TrustRank算法適合初的針對的是頁面級別,現在在搜索引擎算法中,TrustRank值也通常表現在域名級別,整個域名的信任指數越高,整體排名能力就越強。

贊 (0) 評論 分享 ()

福建11选5走势图完整 贵州11选5玩法技巧 mg真人是真的吗 bet365有真人百家乐么 蓝彩混合过关中奖规则 快中彩票app下载 黑龙江22选5 万达二分彩开奖走势图 重庆幸运农场开奖走势爱彩网 黑龙江36选7走势图大星 码报管家婆彩图跑狗图 pk10抓7码方法 网上ag真人赌博是骗局 体彩排列5中几个有奖 四川时时彩合法吗 内蒙古快3走势一定牛 北京快乐8360开奖