站長(cháng)在建設網站時,有時會遇到個問題,那就網頁相似度。什麼(me)是網頁相似度?所謂的網頁相似度,簡單地說,就是兩(liǎng)個頁面(miàn)的相似性。這(zhè)兩(liǎng)個頁面(miàn)可能(néng)是同站點上的頁面(miàn),也可能(néng)不是同站點上的頁面(miàn),也可能(néng)是其他站點上的頁面(miàn)。當個搜索引擎包含個網頁時,它通常會比較兩(liǎng)個網頁,看看它們是否相似。
所謂相似,我的意思是兩(liǎng)個web頁面(miàn)在頁面(miàn)内容上基本相同。在這(zhè)種(zhǒng)情況下,兩(liǎng)個web頁面(miàn)可以視爲相似的。當比較兩(liǎng)個網頁的搜索引擎,它使用個特定的算法比較,和搜索引擎通常使用兩(liǎng)種(zhǒng)方法來比較:個是基于web頁面(miàn)總結比較,如果多個網頁摘要的md5值是相同的,它證明了這(zhè)些網頁有高度的相似性。二是根據網頁關鍵詞,按詞頻順序,可以取N個高頻詞,如果其md5值相同,則可以認爲這(zhè)些網頁具有較高的相似度。谷歌搜索引擎將(jiāng)web頁面(miàn)的相似度設置爲60%。也就是說,如果兩(liǎng)個web頁面(miàn)的相似度超過(guò)60%,那麼(me)所比較的web頁面(miàn)將(jiāng)不再包括在内。如果相似度接近60%,比較的網頁也可以包括在内,但是搜索引擎給出的權重相對(duì)較。這(zhè)就是搜索引擎對(duì)待web相似性的方式。可以看出,網頁相似度對(duì)我們網站的影響主要在于被比較的網頁是否可以被包含,而對(duì)其他方面(miàn)沒(méi)有影響。
有兩(liǎng)個主要原因網絡相似的問題:(1)在同網站,舊web頁面(miàn)複制爲個網頁,導緻内部的頁面(miàn)标題,關鍵詞,描述信息,内容變化相對(duì)較少,結果判斷相似度高的搜索引擎。(2)在不同站點之間,將(jiāng)原來曾經(jīng)被收錄的網頁的内容拿來,,和稍微改變或僞原創,導緻更少的内容更改,或者隻是段調整,内容并沒(méi)有改變,這(zhè)類似于複制,被搜索引擎判定爲相似。相似度判斷網頁搜索引擎,是相當聰明的,不是我們想象的簡單的比較從頭到尾,而是智能(néng)的分析和比較,我們不冒風險,認爲複制别人的網頁内容,給出個簡單的改變就可以蒙混過(guò)關。
有了問題,我們就需求進(jìn)行矯正,下次防止再犯同樣的錯誤。關于網頁類似度的問題,我們曉得了形成(chéng)的緣由,就能(néng)夠有的放矢。有效的方法來解決相似的網頁是做你真正的原創,假如你的網頁内容是原創出來的,隻需内容質量高,就肯定不會由于網頁類似度的問題而不收錄,普通的都(dōu)能(néng)被收錄的。如果你沒(méi)有太多的時間的站長(cháng)寫原創文章,或限于水平問題不能(néng)寫高質量的原創文章,你也可以進(jìn)行僞原創,但是我們建議你避免相似的問題頁面(miàn),您需要重大改變原來的文章中,變化的程度,至少也要超過(guò)50%,所以你可能(néng)會包括搜索引擎。
此外,我們建議您網站管理員,在web頁面(miàn)中,爲了節省時間,如果你需要複制原始的網頁,然我們也建議您在web頁面(miàn)的标題,關鍵詞,描述信息和内容也大幅改變,否則你的網頁很難被收錄的。在進(jìn)行更改時,可以使用些不同的代碼替換原始代碼,例如使用iFrame框架替換内容的前部分等等。我做的網站建設領域很長(cháng)段時間,滿足相似性問題,因爲網站不包括,不少在谷歌adsense管理平台也有個HTML文檔的工具,如果兩(liǎng)個頁面(miàn)的标題和描述信息,網站管理員工具將(jiāng)提示您高相似度的兩(liǎng)頁,然我們可以修改。建議站長(cháng)們多進(jìn)入搜索引擎的管理平台,利用裡(lǐ)面(miàn)提供的功能(néng),有時會對(duì)網站建設非常有益。