搜索引擎優(yōu)化(英語:search engine optimization,縮寫為SEO),是一種通過了解搜索引擎的運作規(guī)則來調整網站,以及提高目的網站在有關搜索引擎內排名的方式。由于不少研究發(fā)現(xiàn),搜索引擎的用戶往往只會留意搜索結果最前面的幾個條目,所以不少網站都希望通過各種形式來影響搜索引擎的排序,讓自己的網站可以有優(yōu)秀的搜索排名。當中尤以各種依靠廣告維生的網站為甚。
所謂“針對搜索引擎作最優(yōu)化的處理”,是指為了要讓網站更容易被搜索引擎接受。搜索引擎會將網站彼此間的內容做一些相關性的數(shù)據比對,然后再由瀏覽器將這些內容以最快速且接近最完整的方式,呈現(xiàn)給搜索者。搜索引擎優(yōu)化就是通過搜索引擎的規(guī)則進行優(yōu)化,為用戶打造更好的用戶體驗,最終的目的就是做好用戶體驗。
對于任何一個網站來說,要想在網站推廣中獲取成功,搜索引擎優(yōu)化都是至為關鍵的一項任務。同時,隨著搜索引擎不斷變換它們的搜索排名算法規(guī)則,每次算法上的改變都會讓一些排名很好的網站在一夜之間名落孫山,而失去排名的直接后果就是失去了網站固有的可觀訪問流量。所以每次搜索引擎算演法的改變都會在網站之中引起不小的騷動和焦慮。可以說,搜索引擎優(yōu)化是一個愈來愈復雜的任務。
經過許多專業(yè)的SEO研究機構調查后發(fā)現(xiàn),當用戶利用搜索引擎查找數(shù)據、產品或服務時,大部分人通常只會點擊搜索結果當中,最前面出現(xiàn)的幾個鏈接,因此,大部分的網站都希望能通過各種方式或手法來試圖影響網站頁面在搜索引擊的排名。不過,搜索引擎的算法會不斷的更新,網站的排名也會因此會有動蕩,所以如果沒有持續(xù)做好SEO,很快地排名就很有可能會掉下來。
早期搜索引擎
網站管理員以及網絡內容提供者在90年代中期開始使用搜索引擎來優(yōu)化網站。此時第一代搜索引擎開始對互聯(lián)網分門別類。一開始,所有網站管理員得做的事只有提交所屬網站到各家搜索引擎。這些引擎跑一些蜘蛛機器人(spider)──截取于網頁程序中找到連至其他網頁的超鏈接──并且存儲所找到的數(shù)據。過程中同時包含了將網頁下載并存儲至搜索引擎擁有者的服務器中,這時有另外一個軟件稱為Indexer來截取頁面中不同的信息——頁面中的文字、文字的位置、文字的重要性以及頁面所包含的任何鏈接,之后將頁面置入清單中等待過些時日后,再來截取一次。隨著在線文件數(shù)目日積月累,越來越多網站員意識到自然搜索 (有機搜索) 條目的重要性,所以較普及的搜索引擎公司開始整理他們的列表,以顯示最恰當適合的網頁為優(yōu)先。搜索引擎與網站管理員的戰(zhàn)爭就此開始,并延續(xù)至今。
一開始搜索引擎是被網站管理員本身牽著走的。早期版本的搜索算法有賴于網站員提供信息,如關鍵字的基本定義標簽(meta tag)。當某些網站員開始濫用標簽,造成該網頁排名與鏈接無關時,搜索引擎開始舍棄標簽并發(fā)展更復雜的排名算法。由于數(shù)繁不及備載,僅枚舉數(shù)個分析目標如下:
· 在標題簽里的文字,如
引擎
· 域名,如 wikipedia.org
· 統(tǒng)一資源定位符下屬的目錄與檔名,如 http://zh.wikipedia.org/wiki/Seo
· 關鍵字密度
· 關鍵字接近度,如 '軟盤、軟碟' '硬盤、硬碟'
· 圖形鏈接的 Alt 屬性,如
但是經過多年的搜索引擎算法的調整,現(xiàn)在較重要的影響標簽為:
·
·
·
· 中的 alt屬性
由于這些都還在網站人員的眼皮下打滾,搜索引擎陸陸續(xù)續(xù)碰到諸多濫用與操縱排名等難題。為了要提供較好的結果給用戶,搜索引擎必須調適到讓他們的搜索結果表現(xiàn)出最適當?shù)慕Y果,而非某些不道德的網絡員產生的、只有塞滿關鍵字的無用網頁。由此,新種類的搜索引擎應運而生。
當代搜索引擎
Google由兩名在斯坦福大學深造的博士生拉里·佩奇(Larry Page) 和謝爾蓋·布爾(Sergey Brin)開始。他們帶來了一個給網頁評估的新概念,稱為“網頁級別” (PageRank),是Google搜索引擎算法[1]重要的開端。網頁級別十分倚賴導入鏈接(incoming link),并利用這種每個導入某網頁的鏈接相當于給該網頁價值投一票的理論創(chuàng)建起邏輯系統(tǒng)。越多導入鏈接意味著該網頁越有“價值”。而每個導入鏈接本身價值直接根據該鏈接從何而來的網頁級別,以及相反的該頁導出鏈接 (outgoing link) 。而在2009年的10月,Google網站管理工具正式移除了PageRank,而緊接著 Google 在2011年移除了 Firefox 的 Google Toolbar,并在2016年正式除 Google PageRank。
在網頁級別幫助下,Google 在服務相關的結果上證明它相當優(yōu)異。Google 成為了最普遍和最成功的搜索引擎。由于網頁級別納入站點外因子,Google認為它們會比頁內因子難以動手腳。
然而網站員們已經開發(fā)出對付Inktomi搜索引擎的鏈接操作工具和計劃。這些方法證明對Google 算法一樣管用。許多站集中于交換、買賣大量鏈接。隨著網站員尋求獲取鏈接只單單要影響Google送更多流量給該站,而不管對站點訪客是否有用,這種行為的增加,讓網頁級別對原始算法的信賴度漸漸被破壞了。
此時,是Google 和其它查尋引擎對廣大范圍的站外因子仔細查看的時候。開發(fā)更加聰明的算法有其他原因。互聯(lián)網已經擴大到擁有并無相關技術的廣大用戶。他們經常無法使用先進的提問技巧來獲取信息;而且他們得面對互聯(lián)網比起發(fā)展早期更龐大數(shù)據、更復雜的索引。搜索引擎必須開發(fā)具備預測性、語義性、語言性和啟發(fā)性算法。
目前,網頁級別的縮小版仍然被顯示在Google 工具條上,不過網頁級別只不過是Google考慮在網頁分級時超過100個因素里中的一個。
今天,大多數(shù)搜索引擎對它們的如何評等的算法保密。搜索引擎也許使用上百因素在排列目錄;每個因素本身和因素所占比重可能不斷地在改變。
大部分當代搜索引擎優(yōu)化的思路──哪些有效、哪些沒效──這些很大部分在于觀察與根據內線消息來的猜測。某些優(yōu)化員得在運行控制下的實驗中獲取不同最優(yōu)化方法的結果。
盡管如此,以下是搜索引擎發(fā)展它們算法時的一些引用,一份Google的專利清單[4]也許可以讓讀者猜出他們會走哪條路線:
· 站點的年齡
· 自該網域注冊后過多久
· 內容的年齡
· 新內容增加的規(guī)律性
· 鏈接的年齡,連接站點的名譽和其相關程度
· 一般站內因素
· 負面站內因素 (例如,太多關鍵字匯標(meta tag),很顯然被優(yōu)化過,會對站點造成傷害)
· 內容的獨特性
· 使用于內容的相關術語 (搜索引擎關系到的術語的方式視同如何關系到網頁的主要內容)
· Google網頁級別 (只被使用在Google 的算法)
· 外在鏈接、外部鏈接的鏈接文字、在那些和在站點/網頁包含的那些鏈接
· 引證和研究來源(表明內容是研究性質)
· 在搜索引擎數(shù)據庫里枚舉的詞根與其相關的術語(如 finance/financing)
· 導入的逆向鏈接,以及該鏈接的文字
· 一些導入鏈接的負面計分 (或許那些來自低價值頁、被交換的逆向鏈接等)
· 逆向鏈接獲取速率:太多太快意味著“不自然”的鏈接購買活動
· 圍繞在導出鏈接、導入的逆向鏈接周圍的文字。例如一個鏈接如果被 "Sponsored Links" (贊助商鏈接)包圍,該鏈接可能會被忽略。
· 用 "rel=nofollow" 建議搜索引擎忽略該鏈接
· 在站點該文件的結構深度
· 從其他資源收集的網格表,譬如監(jiān)視當搜索結果導引用戶到某頁后,用戶有多頻繁按瀏覽器的返回
· 從來源像:Google AdWords/AdSense、Google 工具條等程序收集的網格表
· 從第三方數(shù)據分享協(xié)議收集的網格數(shù)據 (譬如監(jiān)測站點流量的統(tǒng)計程序提供商)
· 刪除導入鏈接的速率
· 使用子網域、在子網使用關鍵字和內容品質等等,以及從這些活動來的負面計分
· 和主文件語義上的鏈接
· 文件增加或改動的速率
· 主機服務商 IP 和該 IP 旗下其它站點的數(shù)量/品質
· 其他鏈接站會員 (link farm / link affiliation) 與被鏈接的站 (他們分享IP嗎? 有一個共同的郵遞地址在"聯(lián)系我們 (Contact Us)" 頁嗎?)
· 技術細節(jié)像利用301重定向被移除的網頁、對不存在網頁顯示404服務器標頭而非200服務器標頭、適當?shù)睦?robots.txt
· 主機服務商正常運行時間
· 是否站點對不同類的用戶顯示不同的內容(稱為“掩飾”(cloaking))
· 未及時矯正、無效的導出的鏈接
· 不安全或非法內容
· HTML代碼品質,以及錯誤出現(xiàn)數(shù)
· 由搜索引擎自他們搜索結果觀察到的實際點擊通過率評等
· 由最常訪問搜索結果的人手動評等
評論(0人參與,0條評論)
發(fā)布評論
最新評論