一区二区三区无码不卡无在线,婷婷五月综合激情

觸屏版
全國(guó)服務(wù)熱線：0571-87205688

價(jià)格查詢批量查詢一鍵轉(zhuǎn)入

查詢

或者

立即發(fā)布需求

爬蟲(chóng)抓取方式分類(lèi)說(shuō)明

作者：dengying 瀏覽：2044次發(fā)布時(shí)間：2015-05-25

編輯

評(píng)論

贊0

一個(gè)網(wǎng)站想被搜索引擎(百度、谷歌等)收錄，是靠索引爬蟲(chóng)抓取的。那么爬蟲(chóng)是怎么抓取的呢?下面跟大家解說(shuō)一下：

　　爬蟲(chóng)的抓取方式一般可以分為累積式抓取和增量式抓取兩種。

　　累積式抓取是指從某一個(gè)時(shí)間點(diǎn)開(kāi)始，通過(guò)遍歷的方式抓取系統(tǒng)所能允許存儲(chǔ)和處理的所有網(wǎng)頁(yè)。在理想的軟硬件環(huán)境下，經(jīng)過(guò)足夠的運(yùn)行時(shí)間，累積式抓取可以保證取到相當(dāng)規(guī)模的網(wǎng)頁(yè)集合。但由于Web數(shù)據(jù)的動(dòng)態(tài)特性，已抓取的網(wǎng)頁(yè)可能出現(xiàn)更新或死鏈的情況，因此積累式抓取到的網(wǎng)頁(yè)集合事實(shí)上并無(wú)法與真實(shí)環(huán)境中網(wǎng)絡(luò)數(shù)據(jù)保持一致。

　　增量式抓取是指在具有一定量規(guī)模的網(wǎng)頁(yè)集合的基礎(chǔ)上，采用更新數(shù)據(jù)的方式選取已在集合中的過(guò)時(shí)網(wǎng)頁(yè)進(jìn)行抓取，以保證所抓取的數(shù)據(jù)與真實(shí)網(wǎng)絡(luò)數(shù)據(jù)足夠接近。進(jìn)行增量式抓取的前提是，系統(tǒng)已經(jīng)抓取了足夠數(shù)量的網(wǎng)頁(yè)，并具有這些頁(yè)面被抓取的時(shí)間信息

上一篇：目錄式友情鏈接交換 下一篇：百度時(shí)效性資源判斷標(biāo)準(zhǔn)

評(píng)論(0人參與，0條評(píng)論)

發(fā)布評(píng)論

詞條統(tǒng)計(jì)

瀏覽次數(shù)：2044次

編輯次數(shù)：0次歷史版本

最近更新：2015-05-25

創(chuàng)建者：dengying

亚洲无人区一区二区三区_农村玉米地少妇野战亚洲_国产欧美日韩VA另类在线播放_免费人成视频网站在线_国产在线精品一区二区高清不卡

猜你喜歡

評(píng)論(0人參與，0條評(píng)論)

最新評(píng)論

詞條統(tǒng)計(jì)

相關(guān)詞條

相關(guān)問(wèn)答

相關(guān)百科

相關(guān)資訊