官术网_书友最值得收藏!

2.5 搜索引擎算法

隨著互聯網信息的爆炸式增長,搜索引擎為了不斷提高用戶查詢效率與反饋信息的質量度,對自身算法進行不斷地調整與升級。在過去的幾年間,主流搜索引擎對自身算法進行了數次重要調整與升級,重點在于打擊各種違反搜索引擎友好度原則、有失公平性和質量性準則的作弊行為。接下來重點向大家介紹幾個算法,包括TrustRank算法、BadRank算法、谷歌熊貓算法、谷歌企鵝算法、百度綠蘿算法、百度石榴算法等。

2.5.1 TrustRank算法

TrustRank漢譯為“信任指數”,TrustRank算法是近年來比較受關注的基于鏈接關系的排名算法,其目的是從互聯網中篩選出優質的網頁(質量較高的網頁)。

TrustRank算法基于一個基本假設:質量好的網站基本不會去鏈接質量差的網站,反之則不成立。也就是說,質量差的網站很少鏈接到質量好的網站這句話并不成立。恰恰相反,很多垃圾網站反而會想盡一切辦法鏈接到高權威、高信任指數的網站,試圖以此來提升自己網站的信任指數。

基于這個假設,如果能挑選出可以百分之百被信任的網站,那么這些網站的TrustRank評分最高,而這些TrustRank評分最高的網站所鏈接的網站信任指數將會被稍微降低,但還是很高。同時,第二層被信任的網站所鏈接出去的第三層網站,信任程度將會繼續降低。由于各種原因,質量高的網站難免會鏈接到一些垃圾網站,不過距第一層網站點擊距離越近,所傳遞的信任指數就越高,其他網站的信任程度將依次降低,也就是說離第一層網站距離越遠,就越有可能被判定為垃圾網站。

2.5.2 BadRank算法

Badrank算法基于一個這樣的假設:如果該網頁與一個不可信任或有作弊行為的網頁之間存在鏈接關系,那么該網頁也有可能存在作弊行為。與TrustRank算法相反,BadRank算法的主要目的是從互聯網中篩選出質量低下的網頁。

BadRank算法與TrustRank算法的工作原理極其相似,首先是確定一批不可信任的網頁集合(網頁黑名單),再通過網頁與不可信任網頁間的鏈接關系及鏈接距離來計算網頁的不信任值,從而確定某個網頁是否為不可信任網頁。

2.5.3 谷歌PageRank

PageRank即網頁排名(又稱網頁級別,簡稱PR,Google左側排名或佩奇排名),是一種根據網頁之間相互的超鏈接計算的技術,Google用它來體現網頁的相關性和重要性,也是我們在搜索引擎優化操作中經常被用來評估網頁優化成效的因素之一。

PageRank是一種投票機制,通過網絡浩瀚的超鏈接關系來確定一個頁面的等級,用于衡量特定網頁相對于搜索引擎索引中其他網頁而言的重要程度。Google把從A頁面到B頁面的鏈接解釋為A頁面給B頁面投票,Google會根據投票的來源(甚至是來源的來源,即鏈接到A頁面的頁面)和投票目標的等級來決定新的等級。簡單來說,一個高等級的頁面可以幫助提升其他低等級頁面的等級(這是我們需要交換友情鏈接及發布外部鏈接的原因)。

谷歌把PageRank的級別定義為0~10,10為滿分。PR值越高說明該網頁越受歡迎。

例如一個網站PR值為1,表明這個網站不太具有流行度,而PR值為7~10則表明這個網站非常受歡迎(或者說極其重要)。一般PR值達到4,就是一個不錯的網站了。Google把自己的網站的PR值定為9,這說明Google網站是非常受歡迎的,也可以說這個網站非常重要。

2.5.4 谷歌HillTop算法

HillTop算法的指導思想與PageRank是一致的,都是通過網頁被鏈接的數量和質量來確定搜索結果的排序權重。但HillTop認為只計算來自具有相同主題的相關文檔鏈接對于搜索者的價值會更大,即主題相關網頁之間的鏈接對于權重計算的貢獻比主題不相關的鏈接價值要更高。比如,我們的網站是介紹“服裝”相關內容的,有10個鏈接都是從“服裝”相關的網站(如布料、布藝等)鏈接過來的,那么這10個鏈接比另外10個從“機械”“化工”相關網站鏈接過來的貢獻要大。

HillTop算法實際上是拒絕了部分通過隨意交換鏈接的方法來擾亂Google排名規則而得到較好排名的做法。

2.5.5 谷歌熊貓算法

谷歌熊貓(Panda)算法是Google公司2011年推出的一種反垃圾網站的搜索引擎算法,旨在降低低質量內容的網站排名,同時是Google的網頁級別評判標準之一。我們可以簡單地將熊貓算法理解為:反垃圾網站,降低低質量網站的排名。

谷歌熊貓算法主要的判斷依據是點擊流(Clickstream)、頁面內容(Page Content)和鏈接概況(Link Profiles),只要在這三者中表現優異,就不會被列為膚淺或劣質的網站。從大量的分析來看,目前谷歌熊貓算法的適用級別為網頁級別,并沒有細化到關鍵詞級別。同時一個網站內如果存在大量的低質量頁面,將會對整個網站的評級造成影響。

對于作為站長或者SEOer的我們而言,如何保障自己的網站不被熊貓算法打擊呢?

(1)獲取信任

不要大量地復制粘貼別人的內容,或者偽原創,盡量保證自己網站的內容質量,即網站內容原創,具有可讀性。

(2)培養權威

不要妄想為自己的網站增加大量的外部鏈接,外鏈的發布需要循序漸進,并且需要保證鏈接的自然性。

2.5.6 谷歌企鵝算法

谷歌企鵝(Penguin)算法于美國時間2012年4月24日推出,是谷歌繼2011年2月24日發布的“熊貓算法”之后再次推出的新算法。其目的是打擊那些通過過分SEO手段來提升排名的網站,意在降權那些充斥著廣告的網站。隨后,谷歌開始懲罰“過度優化”的網站,降低這些網站的排名,并鼓勵那些使用白帽技術的優化工程師。

對于這次谷歌針對過度優化的懲罰算法,雖然對于外貿行業來說是一個打擊,但正是谷歌算法的不斷完善,不斷凈化互聯網信息,讓我們這些做白帽SEO的更有發展潛力,這也體現了谷歌的公平性。只要我們嚴格遵守搜索引擎的算法規則,不使用黑帽手法、不作弊、避免關鍵詞堆砌及不隨機插入不相關的鏈接等,我們一樣可以獲得很好的排名。

針對企鵝算法,我們該如何應對呢?

? 避免關鍵詞堆砌

在更新網站內容時不要刻意添加關鍵詞,保持自然,密度在2%~8%即可。

? 堅決不使用黑帽手段

如頁面偽裝、PR劫持等。

? 避免重復內容

盡量多地提供原創內容,即便是微原創也一定要手動修改,這樣質量度更高,切不可借助工具進行內容的批量創建或偽原創。

? 避免垃圾鏈接

外鏈在質不在量,每天合理地添加高質量鏈接。

2.5.7 谷歌貓頭鷹算法

谷歌官方博客于2017年4月25日發帖,宣布推出“貓頭鷹”算法(Project Owl),提升權威度高的頁面的排名,降低低質量內容排名,尤其是查詢詞結果可能返回前面列出的幾種潛在問題內容時。“貓頭鷹”是谷歌內部的代碼名稱,準確地翻譯應該是“貓頭鷹項目”,在SEO行業,稱為貓頭鷹算法或貓頭鷹更新更容易理解。

貓頭鷹算法的產生原因是谷歌搜索面臨一類以前比較少見的問題,虛假新聞內容是源頭,進而帶來一系列相關問題,如編造的假新聞,帶有極度偏見、煽動仇恨的內容謠言,陰謀論類內容,冒犯性、誤導性內容等。

這類問題被用戶看到、搜索得多了,就會影響搜索框顯示的查詢詞建議,進一步帶來更多搜索,一步步放大效應。

貓頭鷹算法主要包括三方面內容:

(1)建議在搜索框的右下角加上一個“舉報不當的聯想查詢”按鈕(如圖2-25所示),用戶看到宣揚仇恨的、色情的、暴力的、危險的內容時,可以舉報。

圖2-25 舉報不當的聯想查詢

(2)在精選摘要下面加上反饋按鈕,作用和搜索建議的舉報按鈕一樣。精選摘要偶爾會犯敏感錯誤,比如搜索“美國國王是誰”,直接回答是特朗普。

(3)最重要的是提升高權威頁面排名,降低低質量頁面排名。

2.5.8 百度綠蘿算法

百度綠蘿算法是百度于2013年2月19日上線的一種搜索引擎反作弊的算法。該算法主要打擊超鏈中介、售賣鏈接、購買鏈接等超鏈作弊行為,旨在制止惡意交換鏈接、發布外鏈的行為,凈化互聯網生態圈。

2.5.9 百度石榴算法

百度石榴算法是百度于2013年5月17日上線的反垃圾網站的算法。

石榴算法的主要宗旨是打擊低質量網站,與之前的百度綠蘿算法相對應,這正是百度搜索引擎提高用戶體驗、提高搜索質量的有力手段。

算法上線后,劣質廣告少、無彈窗的優質頁面排名有所提升,當然,前提是主體內容有價值。相應的含有惡劣彈窗、有大量混淆頁面主體內容等垃圾廣告的頁面排名會大幅下降。

2.5.10 百度藍天算法

百度藍天算法是百度于2016年11月正式啟用的一種搜索引擎算法規則,是百度搜索引擎針對新聞源站點售賣軟文、目錄等嚴重違反新聞源規則并影響用戶搜索體驗行為而推出的一種算法。算法的目的是嚴厲打擊新聞源售賣軟文、目錄的行為,還用戶一片搜索藍天。

但凡觸犯“藍天算法”問題的站點將被百度清理出新聞源,同時降低其在百度搜索系統中的評價,并對有損用戶體驗的行為全力打擊,絕對不手軟。

2.5.11 百度颶風算法

百度颶風算法于2017年7月7日推出,旨在嚴厲打擊以惡劣采集為內容主要來源的網站,同時百度搜索將從索引庫中徹底清除惡劣采集鏈接,給優質原創內容提供更多展示機會,促進搜索生態良性發展。

颶風算法會例行產出懲罰數據,同時會根據情況隨時調整迭代,體現了百度對惡劣采集的零容忍。優質原創站點如發現站點索引量大幅減少且流量大幅下滑現象,可以在反饋中心進行反饋。

2.5.12 百度清風算法

百度清風算法于2017年9月27日推出,旨在嚴懲網站通過網頁標題作弊欺騙用戶并獲得點擊的行為,從而保證搜索用戶體驗,促進搜索生態良性發展。

清風算法可以總結為以下幾點。

標題作弊:主要指標題內容虛假,或在標題中故意堆砌關鍵詞等行為。

標題內容虛假:指標題表述的內容與網頁內容不相符,有欺騙用戶的嫌疑。

標題故意堆砌:指在標題中多次重復、過度堆砌關鍵詞。

以上類型的網站將會被百度搜索重點打擊。

2.5.13 百度天網算法

百度天網算法于2016年8月10日推出,主要是針對網頁搜索發現部分站點存在盜取用戶隱私的行為進行打擊,主要表現為網頁嵌入惡意代碼(多為JS代碼),用于盜取網民的QQ號、手機號。

2.5.14 百度驚雷算法

百度驚雷算法于2017年11月20日推出,嚴厲打擊通過刷點擊提升網站搜索排序的作弊行為,以此保證用戶搜索體驗,促進搜索內容生態良性發展。

驚雷算法會例行產出懲罰數據,對存在點擊流量作弊的行為進行懲罰,另對有判罰記錄的網站加以嚴懲,嚴重者將長期封禁。

2.5.15 百度細雨算法

百度細雨算法于2018年6月底推出,是為了保證用戶搜索體驗,促進供求黃頁類B2B站點生態健康發展而推出的。算法主要針對以下問題:

(1)頁面標題作弊,包含冒充官網、網頁標題堆砌關鍵詞等情況(如圖2-26所示)。

圖2-26 網頁標題堆砌關鍵詞

(2)商家為了在頁面中頻繁保留聯系方式而做出的各種低質受益行為,如受益方式變形、穿插受益等(如圖2-27所示)。

圖2-27 頁面頻繁留聯系方式

2.5.16 百度移動搜索冰桶算法

百度移動搜索冰桶算法于2014年8月底正式推出,目前已更新升級至4.0版本,是百度移動搜索針對低質站點及頁面進行的一系列調整,主要針對強行彈窗App下載、用戶登錄、大面積廣告等影響用戶正常瀏覽體驗的頁面,尤其以必須下載App才能正常使用的站點為代表,嚴重影響了正常用戶瀏覽體驗的移動站點。

2.5.17 百度閃電算法

2017年10月初,“閃電算法”上線,移動搜索頁面首屏加載時間將影響搜索排名。移動網頁首屏在2秒之內完成打開的,在移動搜索下將獲得提升頁面評價優待,獲得流量傾斜;同時,在移動搜索頁面首屏加載非常慢(3秒及以上)的網頁將會被打壓。

通過對以上搜索引擎算法的了解,我們來做一個簡單的總結,即符合搜索引擎友好度原則的網站優化方法:

(1)為自己網站添加優質的內容,并且保證其可讀性(避免抄襲別人的內容)。

(2)為網站交換高質量、高相關性的友情鏈接。

(3)穩步提升網站的外部鏈接(注意數量及質量)。

(4)不購買鏈接、不在網站亂掛廣告(尤其是影響用戶閱讀體驗的廣告)。

(5)不堆砌關鍵詞(過度優化)、不使用作弊手段。

如果不慎觸犯相關算法規則,請做以下檢查操作:

(1)是否有購買鏈接行為(包括文本鏈接)。

(2)是否批量復制或轉載他人網站的內容。

(3)近期是否使用過非常規優化手段(尤其是黑帽SEO手法)。

(4)是否過度優化,非自然地強制性加入關鍵詞錨文本。

(5)是否有批量發布外鏈行為(尤其是使用群發工具)。

主站蜘蛛池模板: 东阿县| 广水市| 宝坻区| 天气| 富川| 武冈市| 抚州市| 依兰县| 上饶市| 游戏| 上虞市| 平和县| 宝兴县| 兴国县| 迁安市| 宝应县| 寿光市| 文山县| 德格县| 莱阳市| 银川市| 达日县| 宜阳县| 泸水县| 磴口县| 通渭县| 林州市| 许昌市| 新和县| 任丘市| 噶尔县| 隆化县| 故城县| 调兵山市| 磐安县| 荔波县| 濉溪县| 淳安县| 江北区| 伽师县| 汶川县|