查看完整版本: 由Google的專利清單推測PageRank的演算因素


firefox 2009-9-10 16:38

由Google的專利清單推測PageRank的演算因素

大多數搜尋引擎對於它們的如何評等網頁的演算法都是最高機密,Google當然也不例外,PageRank至少使用上百因素在排列目錄,每個因素本身和因素所佔比重可能不斷的在改變。儘管如此,以 Google 的專利清單大家或許可以猜出許多端倪!<BR><BR><FONT color=green size=3>網站的年齡</FONT> (除了有歷史的網站較佳外,剛上線的新網頁也有幾週時間會有較佳排序,換句話說剛上線網站若能抓緊蜜月期來經營,後續就會有較佳的排序) <BR><BR>自該網域註冊後過多久 <BR><BR><FONT color=green size=3>內容的年齡 <BR></FONT><BR>新內容增加的規律性 (內容更新不佳,會被認定該網站如一灘死水)<BR><BR><FONT color=green size=3>鏈接的年齡、連接站點的名譽和其相關程度</FONT> <BR><BR>一般站內因素 (例如原始碼結構性是否良好、靜態網頁優於動態網頁等)<BR><BR>負面站內因素 (例如,太多關鍵字匯標(meta tag),很顯然被優化過,會對站點造成傷害) <BR><BR><FONT color=green size=3>內容的獨特性</FONT> <BR><BR>使用於內容的相關術語 (搜尋引擎關聯到的術語的方式視同如何關聯到網頁的主要內容) <BR><BR><FONT color=green size=3>Google網頁級別 (只被使用在Google 的算法)</FONT> <BR><BR>外在鏈接、外部鏈接的鏈結文字、在那些和在網頁包含的那些鏈接 <BR><BR><FONT color=green size=3>引證和研究來源(表明內容是研究性質)</FONT> <BR><BR>在搜索引擎資料庫裡列舉的詞根與其相關的術語(如 finance/financing) <BR><BR><FONT color=green size=3>導入的逆向鏈結,以及該鏈結的文字 <BR></FONT><BR>一些導入鏈結的負面計分 (那些來自低價值頁、被交換或情色網站的逆向鏈結等) <BR><BR><FONT color=green size=3>逆向鏈結取得速率:</FONT>太多太快意味著「不自然」的鏈結購買活動 <BR><BR>圍繞在導出鏈結、導入的逆向鏈結周圍的文字。例如一個鏈結如果被 "Sponsored Links" (贊助商連結) 包圍,該鏈結可能會被忽略。 <BR><BR>用 "rel=nofollow" 建議搜尋引擎忽略該鏈接 <BR><BR>在站點該文件的結構深度 <BR><BR>從其他資源收集的網格表,譬如監視當搜尋結果導引用戶到某頁後,用戶有多頻繁按瀏覽器的返回鈕 <BR><BR>從來源像:Google AdWords/Adsense、Google 工具條等程序收集的網格表 <BR><BR>從第三方資料分享協議收集的網格資料 (譬如監測站點流量的統計程式提供商) <BR><BR><FONT color=green size=3>刪除導入鏈結的速率 <BR></FONT><BR>使用子網域、在子網使用關鍵字和內容質量等等,以及從這些活動來的負面計分 <BR><BR>和主文件語意上的連結 <BR><BR>文件增加或改動的速率 <BR><BR>主機服務商 IP 和該 IP 旗下其它站點的數量/質量<BR><BR>其他鏈結站會員 (link farm / link affiliation) 與被鏈結的站 (他們分享IP嗎? 有一個共同的郵遞地址在"聯絡我們 (Contact Us)" 頁嗎?) <BR><BR>技術細節像利用301重定向被移除的網頁、對不存在網頁顯示404伺服器標頭而非200伺服器標頭、適當的利用 robots.txt <BR><BR>主機服務商正常運行時間 <BR><BR>網站是否對不同類的用戶顯示不同的內容 (掩飾 (cloaking)) <BR><BR>未即時矯正、無效的導出的鏈結 <BR><BR>不安全或非法內容 <BR><BR>HTML代碼品質,以及錯誤出現數 <BR><BR>由搜尋引擎自他們搜尋結果觀察到的實際點擊通過率評等 <BR><BR>由最常存取搜尋結果的人手動評等
頁: [1]
查看完整版本: 由Google的專利清單推測PageRank的演算因素