站長朋友們可能都知道SEO優化,但是卻很少知道什么是網頁信噪比,就算是一些SEO人員,可能也不關注這個概念。本文就把網頁信噪比這個概念重新帶入大家的視角,讓大家知道網頁信噪比這個概念,以便在建站的過程中能夠有所注意。
(一)網頁信噪比是什么
網頁信噪比是指一個網頁上的文字內容與html代碼的比率。從搜索引擎的原理來講,其抓取系統首先是將整個網頁下載下來,然后將里面的文字內容提取出來,經過分析去除html格式,清除噪音,然后分詞,最后存入索引庫。在這個過程中,搜索引擎也會經過去噪的過程,很明顯,網頁信噪比越高,搜索引擎抓取的效率就會越高,搜索引擎蜘蛛每天需要處理很多的數據,如何能夠快速的提取網頁的主題信息是個十分重要的任務。
(二)網頁信噪比的作用
在網頁優化中,搜索引擎主要抓取去除html標簽后的文本內容,這部分內容可以認為是不失真的聲音信號(因為信噪比本來就是一聲學概念,可以點擊這里查看百度詞條),而同時產生的那部分html標簽內容,可以被認為是噪聲。在聲學中,信噪比越高,說明聲音越清晰,同理,網頁信噪比越高,說明頁面中純文本內容相對越多,搜索引擎抓取頁面越容易。網頁上存在的信息并不都是有用的,也可分為有用信息和無用信息。搜索引擎的工作原理一般是通過對網站的標題、描述、關鍵詞和外部鏈接等因素的整合,判斷出你的網站類型,然后按照這個類型來識別你網站上的文字,如果文字和網站類型能夠沾上邊,則說明有用的信息就越多,如果相差很大,那就是無用信息,然后將有用信息和無用信息進行比值,比值越大說明內容相關度越高。可能你會想,如果我在一大段和網站類型無關的文字中插入關鍵詞,這樣是不是就能夠增加內容相關度呢?實際上,這是不對的,這樣嚴重影響了用戶體驗,而只是在堆積關鍵詞,很可能會被搜索引擎認定為作弊,所以,這也算是噪音。
(三)優化方法
當然一切能夠增加文本內容比率的方法都應該是提高網頁信噪比的方法,主要有:減少網頁中的圖片、flash、將html頁面內的css樣式轉化成外部調用的css樣式表,封裝css、js等,這些方法都能夠有效提高信噪比。任何一種計算方法,都是以蜘蛛讀取最少數據獲得最多有用信息為依據,這個原則是對搜索引擎最友好的原則。
(四)信噪比怎么查詢
一般人工去計算頁面信噪比這是不現實的,大家可以利用信噪比查詢工具去查詢,網上提供的信噪比查詢工具不多,推薦大家使用站長工具箱提供的信噪比查詢功能。一般來說,網頁信噪比大于30%是比較合理的,建議大家提高網頁內容相關性。剛剛使用了該工具查詢了本博客首頁,查詢結果是55.8%,工具表示本博客首頁的信噪比還是不錯的,不過,希望大家明白,工具只是一個參考,不能全信它,合理的使用工具可以讓工作更加方便。
文章來源:葉德華的博客http://www.yedward.net/index.php/archives/939,轉載請注明出處。
注:相關網站建設技巧閱讀請移步到建站教程頻道。