統(tǒng)一資源定位符(Uniform Resource Locator,URL)是對(duì)可以從互聯(lián)網(wǎng)上得到的資源的位置和訪問方法的一種簡(jiǎn)潔的表示,是互聯(lián)網(wǎng)上標(biāo)準(zhǔn)資源的地址?;ヂ?lián)網(wǎng)上的每個(gè)文件都有一個(gè)唯一的URL,它包含的信息指出文件的位置以及瀏覽器應(yīng)該怎么處理它。

U
R
L
URL Uniform Resource Locator
URL鏈接對(duì)網(wǎng)站有多重要?就好比人身體的無數(shù)血管一樣,稍有不暢,就會(huì)帶來各種各樣的問題,URL優(yōu)化的效果跟站點(diǎn)在百度的權(quán)重關(guān)聯(lián)性不大,但是對(duì)收錄、蜘蛛爬行和傳遞權(quán)重有明顯的提升。
統(tǒng)一資源定位符 URL 是對(duì)可以從因特網(wǎng)上得到的資源的位置和訪問方法的一種簡(jiǎn)潔的表示。
URL 給資源的位置提供一種抽象的識(shí)別方法,并用這種方法給資源定位。
只要能夠?qū)Y源定位,系統(tǒng)就可以對(duì)資源進(jìn)行各種操作,如存取、更新、替換和查找其屬性。
URL 相當(dāng)于一個(gè)文件名在網(wǎng)絡(luò)范圍的擴(kuò)展。因此 URL 是與因特網(wǎng)相連的機(jī)器上的任何可訪問對(duì)象的一個(gè)指針。
URL結(jié)構(gòu)介紹
模式/協(xié)議(scheme):它告訴瀏覽器如何處理將要打開的文件。最常用的模式是超文本傳輸協(xié)議(Hypertext Transfer Protocol,縮寫為HTTP),這個(gè)協(xié)議可以用來訪問網(wǎng)絡(luò)。其他協(xié)議如下:
? http——超文本傳輸協(xié)議資源
? https——用安全套接字層傳送的超文本傳輸協(xié)議
? ftp——文件傳輸協(xié)議
? mailto——電子郵件地址
? ldap——輕型目錄訪問協(xié)議搜索
? file——當(dāng)?shù)仉娔X或網(wǎng)上分享的文件
? news——Usenet新聞組
? gopher——Gopher協(xié)議
? telnet——Telnet協(xié)議
第二部分:文件所在的服務(wù)器的名稱或IP地址,后面是到達(dá)這個(gè)文件的路徑和文件本身的名稱。服務(wù)器的名稱或IP地址后面有時(shí)還跟一個(gè)冒號(hào)和一個(gè)端口號(hào)。它也可以包含接觸服務(wù)器必須的用戶名稱和密碼。路徑部分包含等級(jí)結(jié)構(gòu)的路徑定義,一般來說不同部分之間以斜線(/)分隔。詢問部分一般用來傳送對(duì)服務(wù)器上的數(shù)據(jù)庫進(jìn)行動(dòng)態(tài)詢問時(shí)所需要的參數(shù)。
有時(shí)候,URL以斜杠“/”結(jié)尾,而沒有給出文件名,在這種情況下,URL引用路徑中最后一個(gè)目錄中的默認(rèn)文件(通常對(duì)應(yīng)于主頁),這個(gè)文件常常被稱為 index.html 或 default.htm。
URL優(yōu)化要點(diǎn)
URL一致性:URL 一致性是一個(gè)非常重要的指標(biāo),推薦大家一本書《走進(jìn)搜索引擎》里面有介紹spider是一種機(jī)器程序,而非人腦,雖然也有學(xué)習(xí)的過程,但是國內(nèi)網(wǎng)站千千萬,每個(gè)網(wǎng)站有不同的url規(guī)范,你如果url命名規(guī)則雜亂無章spider又怎能高效的辨別你的內(nèi)容規(guī)范? 這里舉個(gè)個(gè)人覺得做的比較好的case:“下載吧”。讀者可以去翻閱下載吧的網(wǎng)站。他的主體結(jié)構(gòu)為:首頁=>列表頁=>內(nèi)容頁 。這里因地制宜,只是舉例可能并不適合你的站點(diǎn)。
偏權(quán)重:通過分析發(fā)現(xiàn),每個(gè)站點(diǎn)的流量是有集中點(diǎn)的。這個(gè)從愛站的工具里面可以看出來。同一個(gè)網(wǎng)站 90%的流量都出自于某個(gè)目錄,在這里面內(nèi)容類型內(nèi)容質(zhì)量都是一樣的。相信大家在自己作站過程中也有所體會(huì),百度會(huì)偏向給權(quán)重到某個(gè)目錄??紤]到這個(gè)問題,url一致性和目錄規(guī)劃就更重要了。
爬行原理:蜘蛛爬行原理有 深度優(yōu)先和寬度優(yōu)先這里分開說一下:
(1)深度優(yōu)先:深度優(yōu)先適用于一些大站,蜘蛛很渴望得到他的內(nèi)容,比如新浪網(wǎng)易他們的目錄很長(zhǎng),也能收錄。假如我們給蜘蛛一個(gè)線程只能爬取一個(gè)頁面,爬行軌跡:首頁-封面頁-頻道頁-內(nèi)容頁,那么你網(wǎng)站的結(jié)構(gòu)是:首頁=> xxx/a=> xxx/a/b=> xxx/a/b/c/1.html=>。蜘蛛會(huì)沿著你的深度爬行進(jìn)去,但是無論多大的站,你的深度也必須有限,否則蜘蛛不可能無窮盡的挖掘進(jìn)去,爬累了自然就會(huì)離開。并且內(nèi)容也沒帶回去。
(2)寬度優(yōu)先:這個(gè)是我非常推崇的,而且我所有新站都是這種效果。我自己建了5天的站蜘蛛爬行800次。效果說明在扁平化的今天,寬度優(yōu)先是可以讓蜘蛛非常高效的爬行和返回的。url結(jié)構(gòu) xxx/a/ xxx/b/ xxx/c/ 這類的叫寬度優(yōu)化,爬行軌跡 :首頁-頻道頁A-頻道頁B-頻道頁C/首頁-頻道頁A-內(nèi)容頁A1-內(nèi)容頁A2-內(nèi)容頁A*
綜上所述。其實(shí)可以看出:寬度優(yōu)先的效率明顯高于深度優(yōu)先。而且蜘蛛的任務(wù)類別也單一,非常容易識(shí)別。同一線程爬取的幾乎是同一類型頁面,頁面樣式,外觀相同。蜘蛛不必花時(shí)間過于的去分析你的頁面內(nèi)結(jié)構(gòu),層次清晰。
爬蟲黑洞:這個(gè)問題不是什么新問題了。百度也有做專門的闡述,因?yàn)橐恍﹗rl處理不當(dāng)產(chǎn)生的動(dòng)態(tài)參數(shù)后綴,或是刻意圈住蜘蛛所做的無限循環(huán),這種的效果明顯是弊大于利。對(duì)URL 的規(guī)劃上一定要想辦法盡可能的處理掉無限動(dòng)態(tài)參數(shù)后綴,并且也要合理的給蜘蛛出口,這才是真正有利于SEO 的做法,關(guān)于處理爬蟲黑洞的辦法這里我不做多講解。
創(chuàng)建具有良好描述性、規(guī)范、簡(jiǎn)單的url,有利于用戶更方便的記憶和判斷網(wǎng)頁的內(nèi)容,也有利于搜索引擎更有效的抓取您的網(wǎng)站。網(wǎng)站設(shè)計(jì)之初,就應(yīng)該有合理的url規(guī)劃。
動(dòng)態(tài)URL怎樣能利于SEO
1、CGI/ Perl方面
網(wǎng)站頁面中使用的是 CGI 或者 Perl,可用一個(gè)腳本拾取環(huán)境變量前的所有字符,再將URL 中剩余字符賦值給一個(gè)變量。就可以在 URL 中使用該變量了。不過,對(duì)于內(nèi)置了部分 SSI(Server-Side Include:服務(wù)器端嵌入)內(nèi)容的網(wǎng)頁,主要的搜索引擎都能夠提供索引支持。以shtml 為后綴名的網(wǎng)頁也被解析成 SSI 文件,相當(dāng)于通常的html 文件。但這些網(wǎng)頁在其 URL 中使用的是cgi-bin 路徑,則有可能不被搜索引擎索引。
2、ASP方面
ASP(Active Server Pages: Web 服務(wù)器端網(wǎng)頁開發(fā)技術(shù))被用于基于微軟的網(wǎng)絡(luò)服務(wù)器中。使用 ASP 開發(fā)的網(wǎng)頁,一般后綴名為asp。只要避免在 URL 中使用符號(hào)“?”,大多數(shù)搜索引擎都能夠支持用 ASP 開發(fā)的網(wǎng)頁。
3、Cold Fusion方面
如果使用的是 Cold Fusion,那么就需要在服務(wù)器端重新對(duì)其進(jìn)行配置,使其能夠?qū)⒁粋€(gè)環(huán)境變量中的符號(hào)“?”用符號(hào)“/”代替,并將替換后的數(shù)值傳給 URL。這樣一來,最后到達(dá)瀏覽器端的就是一個(gè)靜態(tài)的URL 頁。當(dāng)搜索引擎對(duì)該轉(zhuǎn)換后的文件進(jìn)行檢索時(shí),它不會(huì)遭遇“?”,因而可繼續(xù)對(duì)整個(gè)動(dòng)態(tài)頁的索引,從而使網(wǎng)頁對(duì)搜索引擎仍然具有可讀性。
4、Apache 服務(wù)器
Apache 是最流行的 HTTP 服務(wù)器軟件之一。它有一個(gè)做 mod_rewrite 的重寫模塊,即 URL重寫轉(zhuǎn)向功能。該模塊能夠使你將包含環(huán)境變量的 URL 轉(zhuǎn)換為能夠?yàn)樗阉饕嬷С值?URL類型。對(duì)于那些發(fā)布后無須多少更新的網(wǎng)頁內(nèi)容如新聞,可采用該重寫轉(zhuǎn)向功能。
5、建立靜態(tài)入口
在“靜動(dòng)結(jié)合,以靜制動(dòng)”的原則指導(dǎo)下,還可以通過對(duì)網(wǎng)站做一些修改,盡可能增加網(wǎng)頁的搜索引擎可見度。如將網(wǎng)頁編入靜態(tài)主頁或網(wǎng)站地圖的一個(gè)鏈接中,以靜態(tài)目錄的方式呈現(xiàn)該動(dòng)頁面?;蛘邽閯?dòng)態(tài)頁面建立一個(gè)專門的靜態(tài)入口頁面,鏈接到動(dòng)態(tài)頁面,然后將靜態(tài)入口頁面遞交給搜索引擎。對(duì)一些重要的、內(nèi)容相對(duì)固定的頁面制作為靜態(tài)網(wǎng)頁,如包含有豐富關(guān)鍵詞的介紹、用戶幫助,以及含有重要頁面鏈接的地圖等。
網(wǎng)站的首頁盡量采用靜態(tài)形式,并將重要?jiǎng)討B(tài)內(nèi)容以文本鏈接方式全部呈現(xiàn),雖然增加了維護(hù)工作量,但從SEO的角度看是值得的。



皖公網(wǎng)安備 34010202600669



