中文字幕在线直播,成人免费图片免费观看,国内精品国语自产拍在线观看,国产欧美精品区一区二区三区

Google PageRank 技術(shù)解密
時(shí)間:2007年03月20日 內(nèi)容來(lái)源: 互諾科技 瀏覽量:0

1. 什么是PageRank
2. PageRank的決定因素
3. 如何查知PageRank
4. PageRank的重要性
5. Google的前1,000項(xiàng)搜索結(jié)果
6. PageRank與其它影響網(wǎng)站排名因素間的區(qū)別
7. 非PageRank因素闕值
8. 使用闕值推知兩種排名策略的價(jià)值
9. PageRank的計(jì)算
10. PageRank的反饋性
11. 如何控制PageRank
12. 導(dǎo)入鏈接(Links to Your Site)
13. 導(dǎo)出鏈接(Links out of your site)


一、什么是PageRank(網(wǎng)頁(yè)級(jí)別)

  PageRank(網(wǎng)頁(yè)級(jí)別)是Google用于評(píng)測(cè)一個(gè)網(wǎng)頁(yè)“重要性”的一種方法。在揉合了諸如Title標(biāo)識(shí)和Keywords標(biāo)識(shí)等所有其它因素之后,Google通過(guò)PageRank來(lái)調(diào)整結(jié)果,使那些更具“重要性”的網(wǎng)頁(yè)在搜索結(jié)果中另網(wǎng)站排名獲得提升,從而提高搜索結(jié)果的相關(guān)性和質(zhì)量。

  簡(jiǎn)單說(shuō)來(lái),Google通過(guò)下述幾個(gè)步驟來(lái)實(shí)現(xiàn)網(wǎng)頁(yè)在其搜索結(jié)果頁(yè)(SERPS)中的排名:
  1) 找到所有與搜索關(guān)鍵詞匹配的網(wǎng)頁(yè)
  2) 根據(jù)頁(yè)面因素如標(biāo)題關(guān)鍵詞密度等排列等級(jí)
  3) 計(jì)算導(dǎo)入鏈接的錨文本中的關(guān)鍵詞
  4) 通過(guò)PageRank得分調(diào)整網(wǎng)站排名結(jié)果
  事實(shí)上,真正的網(wǎng)站排名過(guò)程并不是這么簡(jiǎn)單,我們會(huì)在后面進(jìn)行詳細(xì)深入的闡述。

二、PageRank的決定因素

  Google的PageRank是基于這樣一個(gè)理論:若B網(wǎng)頁(yè)設(shè)置有連接A網(wǎng)頁(yè)的鏈接(B為A的導(dǎo)入鏈接時(shí)),說(shuō)明B認(rèn)為A有鏈接價(jià)值,是一個(gè)“重要”的網(wǎng)頁(yè)。當(dāng)B網(wǎng)頁(yè)級(jí)別(重要性)比較高時(shí),則A網(wǎng)頁(yè)可從B網(wǎng)頁(yè)這個(gè)導(dǎo)入鏈接分得一定的級(jí)別(重要性),并平均分配給A網(wǎng)頁(yè)上的導(dǎo)出鏈接。

  導(dǎo)入鏈接(也叫逆向鏈接)指鏈至你網(wǎng)站的站點(diǎn),也就是我們一般所說(shuō)的“外部鏈接”。而當(dāng)你鏈至另外一個(gè)站點(diǎn),那么這個(gè)站點(diǎn)就是你的“導(dǎo)出鏈接”,即你向其它網(wǎng)站提供的本站鏈接。

  PageRank反映了一個(gè)網(wǎng)頁(yè)的導(dǎo)入鏈接的級(jí)別(重要性)。所以一般說(shuō)來(lái),PageRank是由一個(gè)網(wǎng)站的導(dǎo)入鏈接的數(shù)量和這些鏈接的級(jí)別(重要性)所決定的。

三、如何知道一個(gè)網(wǎng)頁(yè)的PageRank得分

  可從http://toolbar.google.com上下載并安裝Google的工具欄,這樣就能顯示所瀏覽網(wǎng)頁(yè)的PageRank得分了。PageRank得分從0到10,若不能顯示PageRank得分,可檢查所安裝版本號(hào),需將老版本完全卸載,重啟機(jī)器后安裝最新版本即可。

四、PageRank的重要性

  搜索引擎網(wǎng)站排名算法中的各排名因子的重要性均取決于它們所提供信息的質(zhì)量。但如果排名因子具有易操縱性,則往往會(huì)被一些網(wǎng)站管理員利用來(lái)實(shí)現(xiàn)不良競(jìng)爭(zhēng)。例如初引入的排名因子之一--關(guān)鍵詞元標(biāo)識(shí)(Meta Keywords),是由于理論上它可以很好地概括反映一個(gè)頁(yè)面的內(nèi)容,但后來(lái)卻由于一些網(wǎng)站管理員的惡意操縱而不得不黯然退出。所以“加權(quán)值”--即我們對(duì)該因子提供信息的信任程度是由排名因子的易操縱程度和操縱程度共同決定的。

  PageRank無(wú)疑是頗難被操縱的一個(gè)排名因子了。但在它最初推出時(shí)針對(duì)的只是鏈接的數(shù)量,所以被一些網(wǎng)站管理員鉆了空子,利用鏈接工廠(chǎng)和訪(fǎng)客簿等大量低劣外部鏈接輕而易舉地達(dá)到了自己的目的。Google意識(shí)到這個(gè)問(wèn)題后,便在系統(tǒng)中整合了對(duì)鏈接的質(zhì)量分析,并對(duì)發(fā)現(xiàn)的作弊網(wǎng)站進(jìn)行封殺,從而不但有效地打擊了這種做法,而且保證了結(jié)果的相關(guān)性和精準(zhǔn)度。

五、Google的前1,000項(xiàng)搜索結(jié)果

  一般說(shuō)來(lái),網(wǎng)站排名因素包括網(wǎng)頁(yè)標(biāo)題(META TITLE),網(wǎng)頁(yè)正文中的關(guān)鍵詞密度,錨文本(也叫鏈接文本,指鏈接或超鏈的文本內(nèi)容)和PageRank所決定的。

  請(qǐng)記住:?jiǎn)慰縋ageRank是無(wú)法使你獲得比較理想的網(wǎng)站排名的。PageRank只是網(wǎng)站排名算法中的一個(gè)乘積因子,若你網(wǎng)站的其它排名因子的得分是零,就算你的PageRank是兩百億,最后的得分還是零。但這并不是說(shuō)PageRank就毫無(wú)價(jià)值,而是在什么情況下PageRank才能完全發(fā)揮其功力。

  如果在Google上進(jìn)行廣泛搜索,看起來(lái)好象有幾千個(gè)結(jié)果,但實(shí)際顯示最多前1,000項(xiàng)結(jié)果。例如對(duì)“car rental”,顯示搜索結(jié)果為5,110,000,但實(shí)際顯示結(jié)果只有826個(gè)。而且用時(shí)只有0.81秒。試想一下,0.84秒的時(shí)間就可以計(jì)算這五百萬(wàn)搜索結(jié)果的每個(gè)排名因子得分,然后給出最終我們所看到的網(wǎng)站排名結(jié)果嗎?

  答案就在于:搜索引擎選取與查詢(xún)條件最相關(guān)的那些網(wǎng)頁(yè)形成一個(gè)子集來(lái)加速搜索的速度。例如:假設(shè)子集中包含2,000個(gè)元素,搜索引擎所做的就是使用排名因子中的兩到三個(gè)因素對(duì)整個(gè)數(shù)據(jù)庫(kù)進(jìn)行查詢(xún),找到針對(duì)這兩三個(gè)排名因子得分較高的前2,000個(gè)網(wǎng)頁(yè)。(請(qǐng)記住,雖然可能有五百多萬(wàn)搜索結(jié)果,但最終實(shí)際顯示的1,000項(xiàng)搜索結(jié)果卻是從這個(gè)2,000頁(yè)的子集中提煉出來(lái)的。) 然后搜索引擎再把所有排名因子整合進(jìn)這2,000項(xiàng)搜索結(jié)果組成的子集中并進(jìn)行相應(yīng)的網(wǎng)站排名。由于按相性進(jìn)行排序,子集中越靠后的搜索結(jié)果(不是指網(wǎng)頁(yè))相關(guān)性(質(zhì)量)也就越低,所以搜索引擎只向用戶(hù)顯示與查詢(xún)條件最相關(guān)的前1,000項(xiàng)搜索結(jié)果。

請(qǐng)注意,在搜索引擎生成這2,000項(xiàng)網(wǎng)頁(yè)的子集中我們強(qiáng)調(diào)了“相關(guān)性”這個(gè)詞。即搜索引擎找尋的是與查詢(xún)條件有共同主題的網(wǎng)頁(yè)。如果這時(shí)候我們把PageRank考慮進(jìn)去,就很可能得到一些PageRank很高但主題只是略微相關(guān)的一些搜索結(jié)果。顯然這有違搜索引擎為用戶(hù)提供最為相關(guān)和精準(zhǔn)的搜索結(jié)果的原則。

  一旦理解了為什么會(huì)如此,就說(shuō)明了為什么你應(yīng)當(dāng)首先努力在“頁(yè)面”因子和錨文本上下足工夫,最后才是PageRank。所以關(guān)鍵在于:

  你必須首先在頁(yè)面因素和/或錨文本上下足工夫,使這些排名因子能夠獲得足夠的得分,從而使你的網(wǎng)站能夠按目標(biāo)關(guān)鍵詞躋身于這2,000項(xiàng)搜索結(jié)果的子集中,否則PageRank再高也與事無(wú)補(bǔ)。

六、PageRank和其它排名因子之間的不同

網(wǎng)頁(yè)Title標(biāo)識(shí) 僅能被列出一次。

正文中的關(guān)鍵詞 連續(xù)的重復(fù)只會(huì)降低關(guān)鍵詞的重要性,重要的是接近度。
錨文本 加權(quán)值極高,但存在上限,超過(guò)上限的錨文本信息將被忽略或降低權(quán)值。
PageRank 潛質(zhì)無(wú)窮,沒(méi)有上限的限制,但需要大量工作。
備注 其它排名因子都存在一個(gè)上限(闕值),超過(guò)上限部分其權(quán)值將降低或不再計(jì)分。PageRank則不存在此問(wèn)題。

七、非PageRank因子的上限闕值(Non-PageRank Factor Threshold)

  除了PageRank外,其它排名因子都存在一個(gè)闕值,也叫臨界值或差值。即當(dāng)增長(zhǎng)到一定值時(shí),因子的重要性反而開(kāi)始慢慢降低,則該值就是非PageRank因子的闕值。

  設(shè)闕值為1,000,如果網(wǎng)頁(yè)A和B是我們對(duì)某一查詢(xún)條件的其中兩個(gè)查詢(xún)結(jié)果,且A的總分?jǐn)?shù)(包括頁(yè)面因子得分和PageRank得分)是900,B是500,則顯然A會(huì)排在B的前面。但由于A和B的分?jǐn)?shù)均低于我們上面假設(shè)的非PageRank因子闕值,因而在不改變PageRank的情況下,我們可以通過(guò)對(duì)B頁(yè)進(jìn)行精心的頁(yè)面優(yōu)化使頁(yè)面因子分?jǐn)?shù)得到提高來(lái)使其排名超過(guò)A。但如果A的總得分升至1,100分,則B若還只是一味優(yōu)化頁(yè)面因子是遠(yuǎn)遠(yuǎn)不夠的。在這種情況下,提升PageRank就成為首要任務(wù)了。

  一般說(shuō)來(lái),Google的查詢(xún)結(jié)果頁(yè)中既可能包含一些分?jǐn)?shù)超過(guò)闕值的網(wǎng)頁(yè),也可能包含一些分?jǐn)?shù)低于闕值的網(wǎng)頁(yè)。所以:

  為了提高競(jìng)爭(zhēng)能力,必須在闕值范圍內(nèi)盡可能提高頁(yè)面的搜索引擎排名得分,否則會(huì)降低頁(yè)面的競(jìng)爭(zhēng)力!绊(yè)面因子”是接近和達(dá)到闕值最迅捷的方式,它與PageRank的結(jié)合使用才是提升網(wǎng)站排名得分的最佳優(yōu)化策略。

八、使用闕值推知兩種排名策略的價(jià)值

  闕值解釋了搜索引擎商所遵循的原則和不同的實(shí)施途徑,同時(shí)亦闡述了為什么會(huì)產(chǎn)生關(guān)于PageRank的一些誤解。我們可以把這兩種策略當(dāng)成兩個(gè)人A和B。

  A認(rèn)為“PageRank”并不重要。他們已有數(shù)年網(wǎng)頁(yè)優(yōu)化經(jīng)驗(yàn)并知道如何完美地利用“頁(yè)面因素”來(lái)達(dá)到優(yōu)化的目的。他們亦理解基本的錨文本,但對(duì)PageRank得分毫不在意。結(jié)果如何呢?由于最大化地使用了“頁(yè)面因子”,從而使A迅速達(dá)到“非PageRank因子的闕值”。所以通過(guò)精心選擇關(guān)鍵詞可使他們獲得較好的網(wǎng)站排名。而且只要網(wǎng)站內(nèi)容比較好,隨著時(shí)間推移總會(huì)有排名高的站點(diǎn)鏈接,涓涓細(xì)流匯成河。A最后亦得到了PageRank得分,并籍此鞏固了排名。

  B認(rèn)為“PageRank”十分重要。他掌握了很多關(guān)于提升PageRank得分的信息,并為提高該得分下足了工夫。結(jié)果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,結(jié)果卻得到了PageRank得分。而B(niǎo)在PageRank因子上下工夫,結(jié)果卻得到非PageRank因子得分。究其原因,就是由于提高PageRank得分需要外部鏈接,鏈接又具有錨文本,從而通過(guò)精心挑選外部鏈接的錨文本,B自發(fā)提高了其非PageRank因子的得分,從而贏得了較高的PageRank得分。

  雖然這只是兩個(gè)極端,但我們可以利用它們來(lái)推知這兩種途徑各自的優(yōu)缺點(diǎn):

對(duì)象 優(yōu)點(diǎn) 缺點(diǎn)
A:忽略PageRank 網(wǎng)站排名在短期內(nèi)就可得到提升

自我生成鏈接節(jié)省了工作量
需投入大量工作維持網(wǎng)站排名

對(duì)新競(jìng)爭(zhēng)者的應(yīng)變速度較慢

B:忽略頁(yè)面排名因子 可獲得可靠網(wǎng)站排名,并可在需要時(shí)輕松修改頁(yè)面因素使排名迅速提升

極可能從非搜索類(lèi)引擎來(lái)源上獲得更高訪(fǎng)問(wèn)量
網(wǎng)站排名提升較慢

操作難度較大

容易為SPAM過(guò)濾程序所制

  事實(shí)上,我們前面說(shuō)過(guò),最終排名得分=所有非PageRank因子實(shí)際得分x實(shí)際PageRank得分。亦即二者相輔相成,再加上隨著網(wǎng)上營(yíng)銷(xiāo)方式的發(fā)展壯大,關(guān)鍵詞的競(jìng)爭(zhēng)也變的愈來(lái)愈激烈,這種情況下只靠非PageRank因子得到好排名顯然是不可能的。而且非PageRank因子存在著闕值的局限性。同時(shí),對(duì)于競(jìng)爭(zhēng)性極高的關(guān)鍵詞,還存在著PageRank下限的問(wèn)題。也就是說(shuō),除非網(wǎng)站的PageRank得分超過(guò)這個(gè)下限標(biāo)準(zhǔn),否則網(wǎng)站排名很難上去。PageRank的下限由關(guān)鍵詞的競(jìng)爭(zhēng)度所決定。競(jìng)爭(zhēng)性一般的關(guān)鍵詞PageRank下限也不高,而對(duì)競(jìng)爭(zhēng)較為激烈的關(guān)鍵詞來(lái)說(shuō),它所要求的PageRank下限相應(yīng)就要高。而PageRank得分的提升又非常有難,這時(shí)候非PageRank因子就變的非常重要了。

  綜上所述:我們需要充分發(fā)揮各排名因子的優(yōu)勢(shì)來(lái)贏取理想的綜合排名得分。同時(shí)關(guān)鍵詞(競(jìng)爭(zhēng)度適宜)的精心選擇亦變的非常重要,它可以節(jié)省大量的支出。

九、PageRank的計(jì)算方法
  PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
  其中PageRank (A)表示給定頁(yè)面A的PageRank得分;
  D為阻尼因子,一般設(shè)為0.85;
  PageRank (T1)表示一個(gè)指向A頁(yè)的網(wǎng)站其本身的PageRank得分;
  C(T1)表示該頁(yè)面所擁有的導(dǎo)出鏈接數(shù)量;
  PageRank (Tn)/C(Tn)表示為每一個(gè)指向A頁(yè)的頁(yè)面重復(fù)相同的操作步驟。

  事實(shí)上,計(jì)算某個(gè)頁(yè)面的PageRank得分需要大量繁復(fù)計(jì)算。例如若計(jì)算A頁(yè)的PageRank得分則首先要知道所有鏈至A頁(yè)的網(wǎng)頁(yè)(導(dǎo)入鏈接)的PageRank得分。要想知道這些外部鏈接頁(yè)的PageRank得分,又需要先知道這些頁(yè)面的外部鏈接的PageRank得分,等等。我們只需要知道:

  A頁(yè)的外部鏈接B能夠帶給A的PageRank得分與B的導(dǎo)出鏈接數(shù)量成反比,即隨著B(niǎo)上導(dǎo)出鏈接數(shù)的增加,帶給A的PageRank得分亦隨之降低。這同樣表明了一個(gè)網(wǎng)頁(yè)的PageRank得分是該網(wǎng)頁(yè)對(duì)其它頁(yè)面投票的一個(gè)基本的度量形式。一個(gè)網(wǎng)頁(yè)可以投票給一個(gè)或多個(gè)導(dǎo)出鏈接,但其總投票權(quán)一定,并被平均分配給所有的導(dǎo)出鏈接。假設(shè)B的PageRank得分是5,且B上只有一條指向A的鏈接,那么A將獲得B全部的PageRank得分(B沒(méi)有損失任何東西,而A贏得了B的PageRank得分)。但如果B上有N個(gè)鏈接,則A只能得到B的PageRank得分的N分之一。

十、PageRank的反饋性

  PageRank的反饋機(jī)制說(shuō)明了為什么一個(gè)網(wǎng)站的導(dǎo)出鏈接能夠使網(wǎng)站自身受益。

  假設(shè)A頁(yè)鏈向B,根據(jù)PageRank計(jì)算公式,其初始PageRank為0.15,鏈接后的PageRank變?yōu)?。如果A鏈向C,而C又鏈回A,則A此時(shí)的PageRank變成了1.4594594595。也就是說(shuō)若A鏈向一個(gè)外部網(wǎng)頁(yè),而那個(gè)網(wǎng)頁(yè)又回鏈向A的話(huà),則使A的PageRank會(huì)增加。(如果A鏈向一個(gè)網(wǎng)頁(yè),而該網(wǎng)頁(yè)又鏈向C,C再鏈向A的話(huà),也會(huì)發(fā)生同樣的情形)。如果把所有相互鏈接的頁(yè)面看做是一個(gè)系統(tǒng)整體的話(huà),其實(shí)鏈接前后系統(tǒng)總的PageRank并沒(méi)有發(fā)生改變,只是由于不同鏈接關(guān)系的發(fā)生導(dǎo)致了PageRank對(duì)系統(tǒng)內(nèi)每個(gè)鏈接頁(yè)面的重新分布。

  其增量比較小,整體則視情況而定。但有一點(diǎn)是顯而易見(jiàn)的 – 提供導(dǎo)出鏈接的網(wǎng)頁(yè)往往會(huì)通過(guò)一種叫做PageRank反饋的機(jī)制提升了自身的PageRank。

結(jié)論:

  這表明和一些大型站點(diǎn)進(jìn)行互惠鏈接交換是比較明智的。這些大網(wǎng)站均采用鏈接結(jié)構(gòu),并對(duì)鏈接頁(yè)給予高度關(guān)注。你所鏈接的對(duì)象站點(diǎn)所包含的網(wǎng)頁(yè)數(shù)量及其設(shè)計(jì)結(jié)構(gòu)對(duì)于你網(wǎng)站的PageRank反饋總數(shù)有著顯著的影響。

十一、如何控制PageRank

  雖然PageRank因子很難控制,但我們可以通過(guò)其它技術(shù)來(lái)得到理想的結(jié)果。而且,良好優(yōu)化過(guò)的頁(yè)面因子整合較高的PageRank得分無(wú)疑會(huì)使網(wǎng)站更具競(jìng)爭(zhēng)力。

  PageRank因子的優(yōu)化可從下面三個(gè)方面著手:
  1. 導(dǎo)入鏈接。包括如何選取導(dǎo)入鏈接,獲得導(dǎo)入鏈接所付出的努力是與收獲呈正比的。
  2. 導(dǎo)出鏈接。包括導(dǎo)出鏈接的選取及它們?cè)谀憔W(wǎng)站上的合適位置,應(yīng)使PageRank得到最大回饋(Feedback) 和最小損耗(Leakage)。
  3. 網(wǎng)站內(nèi)部導(dǎo)航結(jié)構(gòu)和內(nèi)部頁(yè)面的聯(lián)接。實(shí)現(xiàn)PageRank在網(wǎng)站內(nèi)部的良好分布。

十二、導(dǎo)入鏈接(Links to Your Site)

  尋找導(dǎo)入鏈接時(shí),一般總是容易陷入這樣的誤區(qū):只看鏈接頁(yè)的PageRank得分,得分越高就越好。而事實(shí)上,一個(gè)鏈接頁(yè)的PageRank得分遵循平均分配原則被平均分配給該頁(yè)面上的所有鏈接。所以,只注重外部鏈接的PageRank得分的鏈接策略無(wú)疑是片面的。正確的做法應(yīng)該是既要考慮鏈接頁(yè)的PageRank,又要考慮該頁(yè)的鏈接數(shù)量(應(yīng)注意:PageRank的單位是網(wǎng)頁(yè)而不是網(wǎng)站,即每個(gè)頁(yè)面都有其特定的PageRank。所以在尋找鏈接時(shí)應(yīng)查看“鏈接”頁(yè)面的PageRank,也就是說(shuō),需要考慮的是放置你網(wǎng)站鏈接的那個(gè)頁(yè)面的PageRank得分情況。) 而且PageRank較高的站點(diǎn)對(duì)鏈接請(qǐng)求一般總是比較挑剔的。

結(jié)論:

  那些看起來(lái)較為適宜,具有良好質(zhì)量的網(wǎng)站都是理想的鏈接對(duì)象。先別去管它們的PageRank到底是多少,倘若它們既與你的網(wǎng)站相關(guān),又具有較高的質(zhì)量,那么總是會(huì)有益你的PageRank,只是個(gè)時(shí)間問(wèn)題罷了。另外,網(wǎng)站被DMOZ和Yahoo收錄亦能相當(dāng)有效地提升PageRank。

十三、導(dǎo)出鏈接(Links out of your site)

  導(dǎo)出鏈接并不會(huì)損失PageRank,但網(wǎng)站整體的PageRank將會(huì)降低。所以,選擇導(dǎo)出鏈接時(shí)宜遵循這樣的定律:
  1. 盡量保持自己網(wǎng)站的PageRank
  2. 盡量使內(nèi)部頁(yè)面分得盡可能多的PageRank

  向大家推薦一種方法:可以在網(wǎng)站上設(shè)立一個(gè)對(duì)導(dǎo)出鏈接的“評(píng)審”頁(yè)。用于放置對(duì)外部鏈接站點(diǎn)的評(píng)審內(nèi)容。每條評(píng)審內(nèi)容應(yīng)包括指向其相應(yīng)外部站點(diǎn)的超鏈。(注意:由于搜索引擎的SPIDERS無(wú)法支持JAVASCRIPT,所以不宜用JAVA程序打開(kāi)這些頁(yè)面。) ---廣東IDC數(shù)據(jù)中心