亚洲无人区一区二区三区_农村玉米地少妇野战亚洲_国产欧美日韩VA另类在线播放_免费人成视频网站在线_国产在线精品一区二区高清不卡

什么是頁面去重

作者:lucy夢女孩 瀏覽:332 發(fā)布時間:2018-04-27
分享 評論 3

  搜索引擎優(yōu)化中,網(wǎng)站內(nèi)部優(yōu)化至關(guān)重要,其中網(wǎng)站內(nèi)部還需要注意頁面的重復(fù)。即:同一篇文章經(jīng)常會重復(fù)出現(xiàn)在同一個網(wǎng)站的不同網(wǎng)址上。

  搜索引擎并不喜歡這種重復(fù)性的內(nèi)容。用戶搜索時,如果在前兩頁看到的都是來自不同網(wǎng)站的同一篇文章,用戶體驗(yàn)就太差了。雖然都是內(nèi)容相關(guān)的。搜索引擎希望只返回相同文章中的一篇,所以在進(jìn)行索引前還需要識別和刪除重復(fù)內(nèi)容,這個過程就成為“優(yōu)化去重”。

  去重的基本方法是對頁面特征關(guān)鍵詞計(jì)算指紋,也就是說從頁面主題內(nèi)容中選取最有代表性的一部分關(guān)鍵詞(經(jīng)常是出現(xiàn)頻率最高的關(guān)鍵詞),然后計(jì)算這些關(guān)鍵詞的數(shù)字指紋。這里的關(guān)鍵詞選取是在分詞,去停止詞,消噪之后。實(shí)驗(yàn)表明,通常選取10個特征關(guān)鍵詞就可以達(dá)到比較高的計(jì)算準(zhǔn)確性,再選取更多詞對去重準(zhǔn)確性提高的貢獻(xiàn)也就不大了。

  典型的指紋計(jì)算方法如MD5算法(信息摘要算法第五版)和Rabin指紋計(jì)算方法等。這類指紋算法的特點(diǎn)是,輸入(特征關(guān)鍵詞)有任何微小的變化,都會導(dǎo)致計(jì)算出的指紋有很大差距。

  了解了搜索引擎的去重算法,SEO人員就應(yīng)該知道簡單地增加“的”“地”“得”,調(diào)換段落順序 還有的甚至是直接將文字替換這種所謂偽原創(chuàng),并不能逃過搜索引擎的去重算法,因?yàn)檫@樣的操作無法改變文章的特征關(guān)鍵詞。而且所搜引擎的去重算法很可能不止于頁面級別(頁面權(quán)重),而是進(jìn)行到段落級別,混合不同文章、交叉調(diào)換段落順序也不能使轉(zhuǎn)載和抄襲變成原創(chuàng)。