亚洲无人区一区二区三区_农村玉米地少妇野战亚洲_国产欧美日韩VA另类在线播放_免费人成视频网站在线_国产在线精品一区二区高清不卡

巧用robots避免蜘蛛黑洞

作者:zjadmin 瀏覽:2409 發(fā)布時(shí)間:2014-10-17
編輯 分享 評論 0

對于百度搜索引擎來說,蜘蛛黑洞特指網(wǎng)站通過極低的成本制造出大量參數(shù)過多,及內(nèi)容雷同但具體參數(shù)不同的動(dòng)態(tài)URL ,就像一個(gè)無限循環(huán)的“黑洞”將spider困住,蜘蛛浪費(fèi)了大量資源抓取的卻是無效網(wǎng)頁。
       比如很多網(wǎng)站都有篩選功能,通過篩選功能產(chǎn)生的網(wǎng)頁經(jīng)常會(huì)被搜索引擎大量抓取,而這其中很大一部分檢索價(jià)值不高,如“500-1000之間價(jià)格的租房”, 首先網(wǎng)站(包括現(xiàn)實(shí)中)上基本沒有相關(guān)資源,其次站內(nèi)用戶和搜索引擎用戶都沒有這種檢索習(xí)慣。這種網(wǎng)頁被搜索引擎大量抓取,只能是占用網(wǎng)站寶貴的抓取配額。那么該如何避免這種情況呢?
       我們以北京某團(tuán)購網(wǎng)站為例,看看該網(wǎng)站是如何利用robots巧妙避免這種蜘蛛黑洞的:
對于普通的篩選結(jié)果頁,該網(wǎng)站選擇使用靜態(tài)鏈接,
       同樣是條件篩選結(jié)果頁,當(dāng)用戶選擇不同排序條件后,會(huì)生成帶有不同參數(shù)的動(dòng)態(tài)鏈接,而且即使是同一種排序條件(如:都是按銷量降序排列),生成的參數(shù)也都是不同的。
對于該團(tuán)購網(wǎng)來說,只讓搜索引擎抓取篩選結(jié)果頁就可以了,而各種帶參數(shù)的結(jié)果排序頁面則通過robots規(guī)則拒絕**給搜索引擎。
       robots.txt的文件用法中有這樣一條規(guī)則:Disallow: /*?* ,即禁止搜索引擎訪問網(wǎng)站中所有的動(dòng)態(tài)頁面。該網(wǎng)站恰是通過這種方式,對百度蜘蛛優(yōu)先展示高質(zhì)量頁面、屏蔽了低質(zhì)量頁面,為 百度蜘蛛提供了更友好的網(wǎng)站結(jié)構(gòu),避免了黑洞的形成。

詞條統(tǒng)計(jì)

  • 瀏覽次數(shù):2409
  • 編輯次數(shù):0次歷史版本
  • 最近更新:2014-10-17
  • 創(chuàng)建者:zjadmin
  • 相關(guān)詞條

    相關(guān)問答

    相關(guān)百科

    相關(guān)資訊