觸屏版
全國(guó)服務(wù)熱線:0571-87205688
網(wǎng)站日志既可使用工具,也可直接在看。直接在看源文件,信息會(huì)更加完整。網(wǎng)站日志是記錄Web服務(wù)器接收處理請(qǐng)求以及運(yùn)行時(shí)錯(cuò)誤等各種原始信息的以.log結(jié)尾的文件,確切地講,應(yīng)該是服務(wù)器日志。
網(wǎng)站日志最大的意義是記錄網(wǎng)站運(yùn)營(yíng)中空間等的運(yùn)營(yíng)情況,被訪問(wèn)請(qǐng)求的記錄。通過(guò)網(wǎng)站日志可以清楚地得知用戶(hù)在什么IP、什么時(shí)間、用什么操作系統(tǒng)、什么瀏覽器、什么分辨率顯示器的情況下訪問(wèn)了你網(wǎng)站的哪個(gè)頁(yè)面,是否訪問(wèn)成功。
網(wǎng)站日志的很多信息在百度統(tǒng)計(jì)、百度站長(zhǎng)工具等都已經(jīng)數(shù)據(jù)化或者圖表化,比如訪客訪問(wèn)了哪些文件、蜘蛛抓取哪些文件顯示404等。
網(wǎng)站日志數(shù)據(jù)分析解讀如下。
(1) 訪問(wèn)次數(shù)、停留時(shí)間、抓取量
從這些項(xiàng)數(shù)據(jù)中可以得知: 平均每歡抓取頁(yè)面數(shù)、單頁(yè)抓取停留時(shí)間和平均每次停留時(shí)間。平均每次抓取頁(yè)面數(shù)=總抓取量/訪問(wèn)次數(shù),單頁(yè)面抓取停留時(shí)間=每次停留/每次抓取,平均每次停留時(shí)間=總停留時(shí)間訪問(wèn)次數(shù)。
從這些數(shù)據(jù)可以看出蜘蛛的活躍度,網(wǎng)站對(duì)蜘蛛的親和度,以及抓取深度等,總抓取量、總訪問(wèn)次數(shù)、平均抓取量、總停留時(shí)間、單頁(yè)抓取停留、平均停留時(shí)間等指標(biāo)越高,通常表明網(wǎng)站友好性越好,站點(diǎn)質(zhì)量越高,越受搜索引擎喜歡。而單頁(yè)抓取停留時(shí)間表明網(wǎng)站頁(yè)面訪問(wèn)速度、時(shí)間越長(zhǎng),表明網(wǎng)站訪問(wèn)速度越慢,對(duì)搜索引擎抓取收錄較不利,我們應(yīng)盡量提高網(wǎng)頁(yè)加載速度,減少單一頁(yè)面停留時(shí)間,讓爬蟲(chóng)資源更多地去抓取收錄。另外,根據(jù)這些數(shù)據(jù)我們還可以統(tǒng)計(jì)出一段時(shí)間內(nèi)網(wǎng)站的整體趨勢(shì)表現(xiàn),如蜘蛛訪問(wèn)次數(shù)趨勢(shì)、停留時(shí)間趨勢(shì)、抓取趨勢(shì)。長(zhǎng)期觀察這些數(shù)據(jù),可以起到對(duì)優(yōu)化效果進(jìn)行評(píng)估的作用,并及時(shí)發(fā)現(xiàn)哪些頁(yè)面及目錄表現(xiàn)好,哪些表現(xiàn)不好,更貼近搜索引擎,也可及時(shí)發(fā)現(xiàn)異常變動(dòng),做好應(yīng)對(duì)。
(2) 目錄抓取統(tǒng)計(jì)
通過(guò)日志分析我們可以看到網(wǎng)站哪些目錄受蜘蛛喜歡、抓取目錄深度、重要頁(yè)面目錄抓取狀況、無(wú)效頁(yè)面目錄抓取狀況等。通過(guò)對(duì)比目錄下頁(yè)面抓取及收錄情況,我們可以發(fā)現(xiàn)更多問(wèn)題。對(duì)于重要目錄,我們需要通過(guò)內(nèi)外調(diào)整增加權(quán)重及爬取; 對(duì)于無(wú)效頁(yè)面,在Robots.TXT 中進(jìn)行屏蔽。
另外,通過(guò)多日日志統(tǒng)計(jì),我們可以看到站內(nèi)外行為給目錄帶來(lái)的效果,優(yōu)化是否合理,是否達(dá)到了預(yù)期效果。對(duì)于同一目錄,以長(zhǎng)期時(shí)間段來(lái)看,我們可以看到該目錄下頁(yè)面表現(xiàn)、根據(jù)行為推測(cè)表現(xiàn)的原因等。
(3 )頁(yè)面抓取
在網(wǎng)站日志分析中,我們可以看到具體被蜘蛛爬取的頁(yè)面。在這些頁(yè)面中,我們可以分析出蜘蛛爬取了哪些需要被禁止爬取的頁(yè)面、爬取了哪些無(wú)收錄價(jià)值頁(yè)面、爬取了哪些重復(fù)頁(yè)面URL等。為充分利用蜘蛛資源,我們需要將這些地址在Robots.txt中禁止爬取。
另外,我們還可以分析未收錄頁(yè)面原因,對(duì)于新文章,是因?yàn)闆](méi)有被爬取到而未收錄抑或爬取了但未放出。對(duì)于某些閱讀意義不大的頁(yè)面,可能我們需要它作為爬取通道,對(duì)于這些頁(yè)面,我們是否應(yīng)該做Noindex標(biāo)簽等。
(4)蜘蛛訪問(wèn)IP
通過(guò)蜘蛛的IP段和前三項(xiàng)數(shù)據(jù)來(lái)判斷網(wǎng)站的降權(quán)情況,IP分析的更多用途是判斷是否存在采集蜘蛛、假蜘蛛、惡意點(diǎn)擊蜘蛛等,從而對(duì)那些訪問(wèn)來(lái)源進(jìn)行屏蔽、禁止訪問(wèn)處理,以節(jié)省帶寬資源及減輕服務(wù)器壓力,留給訪客及蜘蛛更好的訪問(wèn)體驗(yàn)。
(5)訪問(wèn)狀態(tài)碼
蜘蛛經(jīng)常出現(xiàn)的狀態(tài)碼包括301、404等。出現(xiàn)這些狀態(tài)碼要及時(shí)處理,以避免對(duì)網(wǎng)站造成壞的影響。
(6)抓取時(shí)間段
通過(guò)分析對(duì)比多個(gè)單日蜘蛛小時(shí)爬取量,可以了解到特定蝴蛛對(duì)于本網(wǎng)站在特定時(shí)間的活躍時(shí)段。通過(guò)對(duì)比周數(shù)據(jù),可以看到特定蜘蛛在一周中的活躍周期。了解這個(gè)對(duì)于網(wǎng)定指導(dǎo)意義,而之前所謂小三大四等均為不科學(xué)說(shuō)法。
(7) 蜘蛛爬取路徑
在網(wǎng)站日志中我們可以跟蹤到特定IP 的訪問(wèn)路徑,如果我們跟蹤特定蜘蛛的訪問(wèn)路徑就能發(fā)現(xiàn)對(duì)于本網(wǎng)站結(jié)構(gòu)下蜘蛛的爬取路徑偏好。由此,我們可以適當(dāng)?shù)匾龑?dǎo)蜘蛛的爬取路徑,讓蜘蛛更多地爬取重要、有價(jià)值、新更新頁(yè)面。其中,爬取路徑中我們又可以分析頁(yè)面物理結(jié)構(gòu)路徑偏好以及URL 邏輯結(jié)構(gòu)爬取偏好。通過(guò)這些,可以讓我們從搜索引擎的視角去審視自己的網(wǎng)站。
seo分析,確定好在網(wǎng)站前期需要開(kāi)展的SEO 工作之后,剩下的即調(diào)配所需人力、物力,并制定推進(jìn)方案一步步完善各個(gè)優(yōu)化細(xì)節(jié),并跟蹤監(jiān)控優(yōu)化效果,最終一步步達(dá)成收錄、流量、關(guān)鍵詞排名及網(wǎng)站Alexa排名目標(biāo)。一個(gè)好的SEO方案不僅僅是知道該干什么,更重要的是將需要做的事情按部就班地推行下去,執(zhí)行力尤為最要,最好的辦法是將所有SEO工作分解細(xì)化,去執(zhí)行。
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論