觸屏版
全國服務熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
果***果
一、搜索引摯搜索抓取問題 搜索引摯每天要處理的抓取任務是數(shù)以億計的,更何況在24小時內(nèi)要爬行整個互聯(lián)網(wǎng)的大大小小的網(wǎng)站,難免不會產(chǎn)生一些錯誤的。那么當網(wǎng)站快照出現(xiàn)兩個內(nèi)容標題一樣,新舊程度不一樣的快照時,筆者認為這有可能是因為搜索引摯更新數(shù)據(jù)庫時,沒有把舊的頁面給刪除造成的。當蜘蛛再次爬行網(wǎng)站內(nèi)容時,抓取了新內(nèi)容自然都會返回新的快照,而這個新的快照中肯定要替代原本存于數(shù)據(jù)庫的那個快照,但是有時候由于數(shù)據(jù)處理的工作量特別大,難免不會出現(xiàn)一些錯誤,如筆者的小站的快照個人認為主要是搜索引摯在新快照覆蓋舊快照的問題上沒處理好,而使得原來要覆蓋舊快照的工作沒做,直接把新快照當成是一種新的獨立頁面,而舊的快照同樣也有效的存在數(shù)據(jù)庫中,當咱們用SITE查詢時,自然會返回兩個快照了。 二、首頁有多個網(wǎng)址路徑 眾所周知,一個網(wǎng)站中首頁都會存有兩個或兩個以上不同的路徑,而目標指向卻是同一個頁面。首頁出現(xiàn)多個網(wǎng)址路徑的機率很大。一般網(wǎng)站中的首頁默認URL地址是直接利用域名來顯示的,而筆者的網(wǎng)站是通過后臺生成靜態(tài)頁面的,剛開始是用http://域名.org/index.html來做首頁默認地址的,但是對于搜索引摯來說,帶INDEX.HTML和不帶的,兩個會區(qū)分成不同的地址,而搜索引摯顯示的時候,不管是帶不帶INDEX.HTML的,都會直接顯示出域名,自然就會出現(xiàn)上圖所示的那樣子了。所以,正常情況下,URL盡量要有唯一性,要不然網(wǎng)站就會出現(xiàn)跟筆者的小站一樣的情況了。這個可以在空間后臺的首頁默認文檔中把自己的默認首頁設置好就可以了。 三、網(wǎng)站空間雙IP的影響 網(wǎng)站有兩個不同的IP同時指向一個網(wǎng)站,那么在更新網(wǎng)站快照時,搜索引摯就會把網(wǎng)站分化成兩個快照,當然,有可能是空間自帶兩個IP的原因,但是搜索引摯怎么區(qū)分這個哪個IP是有網(wǎng)站呢?其實很簡單,通過分析域名的綁定情況來判斷,就像你用站長工具查詢網(wǎng)站時,都會顯示出網(wǎng)站所綁定的IP是哪個,而這樣的話,就會出現(xiàn)一個IP是沒有綁定的,卻也同樣存在網(wǎng)站,所以,搜索引摯就會給予綁定域名的那個IP顯示正常內(nèi)容,而沒綁定的卻可以訪問的那個IP自然就直接顯示URL地址了。而這一點,是筆者根據(jù)一個老前輩的指導所分析出來的,筆者覺得雙IP對網(wǎng)站快照并不是什么好事,而且很容易因為雙IP給網(wǎng)站帶來的負面影響。
麗麗
百度在一定時間內(nèi)要更新快照,而這次可能是忘了把上次的快照替換掉,所以就出現(xiàn)了2個快照