亚洲无人区一区二区三区_农村玉米地少妇野战亚洲_国产欧美日韩VA另类在线播放_免费人成视频网站在线_国产在线精品一区二区高清不卡

搜索引擎基本工作原理

作者:云客159954 瀏覽:281 發(fā)布時間:2018-07-10
分享 評論 0

  SEO搜索引擎基本工作原理


  搜索對seo的基本原理三大階段:排序、索引、抓取。SEO搜索引擎的工作原理過程是非常復(fù)雜的



  抓取


  搜索引擎會拋出一種被稱作“機器人,蜘蛛”的軟件根據(jù)一定的規(guī)則掃描互聯(lián)網(wǎng)上面的網(wǎng)站 ,沿著網(wǎng)頁的鏈接從一個網(wǎng)頁到另一個網(wǎng)頁,從一個網(wǎng)站到另一個網(wǎng)站,獲得頁面HTML代碼,并存入數(shù)據(jù)庫。為了采集到最新的資料,會繼續(xù)回訪已抓取過的網(wǎng)頁。


  索引


  由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁進行分析,提取相關(guān)網(wǎng)頁信息,根據(jù)一定的相關(guān)度算法進行大量復(fù)雜計算,得到每一個網(wǎng)頁針對頁面文字中及超鏈中每一個關(guān)鍵詞的相關(guān)度,然后用這些相關(guān)信息建立網(wǎng)頁索引數(shù)據(jù)庫。


  排序


  當用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁。因為所有相關(guān)網(wǎng)頁針對該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照現(xiàn)成的相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。最后返回給用戶。


  搜索引擎的工作原理大體分為3步:爬行抓取——索引——排序。


  抓取:主要是數(shù)據(jù)收集。


  索引/預(yù)處理:提取文字——中文分詞——去除停止詞——消除噪聲——去重——索引。


  排序:搜索詞處理——匹配文件——初始子集選擇——相關(guān)性計算——過濾、調(diào)整——排名顯示。