SEO的貝葉斯算法與偽命題

大學(xué)時(shí)候?qū)W離散數(shù)學(xué),啥都沒(méi)學(xué)好,但是還有一個(gè)東西觸動(dòng)了我。比如一個(gè)事物,我們常說(shuō)真的、假的事物(真命題、假命題),但是還有一個(gè)東西,有些事物對(duì)與錯(cuò)是有概率性,不一定對(duì)也不一定錯(cuò),這樣我們只能把概率融入到選擇中來(lái)進(jìn)行選擇,這就是貝葉斯算法。
2011年學(xué)了seo之后,沒(méi)料到這個(gè)算法影響了很多方面。在seo的很多方面都是這樣的,呈現(xiàn)了很多的兩面性,而且在一定概率之后,影響的因素會(huì)發(fā)生了很多的變化。seo實(shí)質(zhì)是追求平穩(wěn)態(tài)的一個(gè)動(dòng)態(tài)過(guò)程,例如圖上的就說(shuō)明白了很多問(wèn)題。所以你了解seo后,你發(fā)現(xiàn)現(xiàn)在所謂的seo培訓(xùn)都是不行的,因?yàn)樗麄兊亩际歉嬖V你哪些因素的影響了那些權(quán)重,其實(shí)任何的一個(gè)因素和其它因素之間,一個(gè)因素自身對(duì)網(wǎng)站影響都是具有著非線性、相對(duì)性、階段性的影響,下面我就慢慢解釋一下:
比如百度切詞,粒度越小,召回就越多,建立倒排索引時(shí),索引的長(zhǎng)度就越長(zhǎng);粒度的層次越多,索引的數(shù)量就越多。一個(gè)多,一個(gè)長(zhǎng)形成了不同的用戶體驗(yàn),搜索引擎一般采用性價(jià)比的方式來(lái)進(jìn)行選擇。例如搜索排序算法里存在著這里的例子,網(wǎng)頁(yè)排序與查詢的匹配程度,和網(wǎng)頁(yè)本身的好壞都有關(guān)系,如過(guò)兩者存在一定的差異,就只好采用貝葉斯算法進(jìn)行匹配……(本段節(jié)選百度博客)
在鏈接方面也存在著相同的東西。在網(wǎng)站權(quán)重理解上,我一般分成了三種,其中2個(gè)鏈接因素兩個(gè)內(nèi)容因素,兩個(gè)內(nèi)容因素是相反的,兩個(gè)鏈接因素也是相反的。這其實(shí)是出乎我的意料之外的。
以上所說(shuō)的解釋了一個(gè)東西,那就是seo的影響因素是相對(duì)性的,真假命題很多時(shí)候是貝葉斯算法在起著作用,下面的一個(gè)感想對(duì)我感觸非常大,也是這篇博客所要說(shuō)的:
昨晚第N次讀了夜息的金字塔鏈接模型,思考一下,在以前我曾經(jīng)讀了這篇文章后狠狠地研究了下鏈接模型和拓?fù)溥B接模型,例如我這篇博客的頭型就是最好的拓?fù)溥B接模型,但是我昨晚卻忽然覺(jué)得有些地方錯(cuò)誤了,就在2012年鐘聲敲響的時(shí)候,我忽然想也許夜息和我們都錯(cuò)了……
如果您已經(jīng)讀了那篇博客,其中有兩個(gè)概念不得不說(shuō),一個(gè)是鏈輪一個(gè)是站群,這兩個(gè)都是目前非常流行的seo策略,被很多人所推崇,前一段經(jīng)??吹竭@方面的研究,都在說(shuō)明網(wǎng)站權(quán)重傳遞是怎么的好,其中的原理就是鏈接之間的相互迭代傳遞,或者在圖論邏輯上是向量空間模型。
說(shuō)道向量空間模型,這里有一個(gè)問(wèn)題必須說(shuō)明的是,在數(shù)據(jù)結(jié)構(gòu)里搜索是如何存儲(chǔ)數(shù)據(jù)的。一般情況下我們認(rèn)為是單一節(jié)點(diǎn)存儲(chǔ)的,但是大量的鏈接關(guān)系的話,需要的存儲(chǔ)空間是非常巨大的,如何節(jié)省存儲(chǔ)呢,最簡(jiǎn)單就是把相同方向指向的放在一起,這樣一來(lái)一個(gè)問(wèn)題就產(chǎn)生了,如果采用鏈輪或者站群在第一層迭代和第二層迭代里數(shù)據(jù)是相同的(或者第二層迭代小于第一層迭代),如果搜索采用數(shù)據(jù)統(tǒng)計(jì)來(lái)研究網(wǎng)站鏈接的話,這么簡(jiǎn)單的數(shù)據(jù)蜘蛛不明白是什么神馬嗎……我嚇?biāo)啦铧c(diǎn)……(本人認(rèn)為搜索會(huì)進(jìn)行此數(shù)據(jù)統(tǒng)計(jì),而且會(huì)采用二叉樹(shù)節(jié)點(diǎn)計(jì)算來(lái)做鏈接的迭代計(jì)算。)
其實(shí),更加深究這些問(wèn)題,比如外鏈要不要做模型。我們可以這么一個(gè)設(shè)想,加入一個(gè)網(wǎng)站有101個(gè)頁(yè)面(1個(gè)首頁(yè)和100個(gè)內(nèi)頁(yè)),假設(shè)兩種特別情況,每個(gè)頁(yè)面都連向首頁(yè),但是相互之間不連接,首頁(yè)連向每個(gè)頁(yè)面;另一個(gè)條件是每個(gè)網(wǎng)頁(yè)都連向其他100個(gè)鏈接,那么對(duì)于一個(gè)網(wǎng)站來(lái)說(shuō),這兩種情況下網(wǎng)站權(quán)重一樣嗎?(這是在理想情況下,沒(méi)有任何外鏈情況下,切記首頁(yè)只是一個(gè)網(wǎng)頁(yè))
對(duì)于這個(gè)問(wèn)題我曾經(jīng)一度非常的糾結(jié),后來(lái)借助三權(quán)(頁(yè)權(quán)、位權(quán)和域權(quán))分立研究,發(fā)現(xiàn)了很多有趣的問(wèn)題,假如我們把上面的問(wèn)題改為另外一個(gè)問(wèn)題,加入一個(gè)人擁有一個(gè)公司100%的股份,價(jià)值是100W,或者一個(gè)人擁有100個(gè)公司每個(gè)公司1%股份,價(jià)值也是100W,請(qǐng)問(wèn)這個(gè)人的財(cái)富影響力變化了沒(méi)有?
其實(shí)結(jié)果是或許是這樣的,如果這個(gè)人比較強(qiáng)勢(shì),那么其影響力輻射到100個(gè)公司,其財(cái)富影響力最大可以到100個(gè)100W,如果一個(gè)人比較弱勢(shì),那么其影響力從100w到了0.這非常類似于谷歌的隨機(jī)沖浪模型,如何用戶體驗(yàn)很好,或許會(huì)點(diǎn)很多,也許只點(diǎn)擊進(jìn)入頁(yè)就走了……
就現(xiàn)實(shí)來(lái)說(shuō),其實(shí)還存在一個(gè)問(wèn)題,就是公司股權(quán)問(wèn)題,以上兩種之外還存在一個(gè)黃金點(diǎn)35.9W控制一個(gè)公司的股權(quán)(具體大家可以參考金融),那么這個(gè)很穩(wěn)定的控制影響力,可以控制200W和其他的一點(diǎn),這個(gè)我可以稱之為穩(wěn)定態(tài),而最初的兩種被稱為初始態(tài)和最終態(tài),而35.9是最好的比例點(diǎn),這點(diǎn)也可以解釋每個(gè)網(wǎng)頁(yè)最穩(wěn)定的最好的鏈接比例是多少,一個(gè)網(wǎng)頁(yè)有36個(gè)主題html鏈接有最穩(wěn)定的隨機(jī)沖浪點(diǎn)擊鏈接(大家可以測(cè)試下)。
這個(gè)問(wèn)題其實(shí)我是想說(shuō)的是偽命題,因?yàn)槊總€(gè)網(wǎng)站內(nèi)容不同,用戶體驗(yàn)不同,其連接位置、鏈接關(guān)鍵詞不同等,同一個(gè)網(wǎng)站任何一個(gè)網(wǎng)頁(yè)權(quán)重產(chǎn)生了差異性。但是任何鏈接模型都是在降低域權(quán)來(lái)提高位權(quán)的一個(gè)過(guò)程,兩者的權(quán)重和是沒(méi)有改變的,有改變的是其中的“現(xiàn)實(shí)過(guò)程”或隨機(jī)沖浪者可以達(dá)到的UV數(shù)量,而這個(gè)最終和頁(yè)權(quán)改變有關(guān)系。而頁(yè)權(quán)就是和你勞動(dòng)力有關(guān)系的一個(gè)權(quán)重,所以做了一圈總的能量是守恒的,而變化的是您的力氣化作了能量。(頁(yè)權(quán)、位權(quán)和域權(quán)是三種不同的權(quán)重計(jì)算方式,任何一個(gè)網(wǎng)頁(yè)都是由此三種權(quán)重傳遞而來(lái),看清楚了是三種不是三個(gè)……)
看到這里,連我這個(gè)解釋者都覺(jué)得很多人難以理解,其實(shí)這個(gè)意思簡(jiǎn)單就是說(shuō)無(wú)論站群或者鏈輪并沒(méi)有從本質(zhì)上改變網(wǎng)站權(quán)重,和連不連接模型一點(diǎn)關(guān)系都沒(méi)有,因?yàn)殒溳喓驼救翰](méi)有增加二度迭代的鏈接數(shù)量,所以說(shuō)搜索引擎不會(huì)K掉鏈輪和站群的,因?yàn)槭悄?ldquo;花費(fèi)的時(shí)間”轉(zhuǎn)化為了頁(yè)權(quán),而您在這段時(shí)間里也可以通過(guò)提高其他權(quán)重達(dá)到相同的效果。
PS:頭暈如麻,昨晚看了一晚的seo博客,今天大年初一睡了一天的覺(jué),本來(lái)想寫(xiě)篇文章探討下一個(gè)網(wǎng)站多少條外鏈效果最大,以后會(huì)逐次遞減的,可是寫(xiě)著寫(xiě)著自己都不知道寫(xiě)了神馬東東,大家隨意看看吧,很多地方寫(xiě)錯(cuò)了也不想改了,本來(lái)還有很長(zhǎng)的探討現(xiàn)在也沒(méi)心情寫(xiě)了,如果對(duì)此篇文章不懂的可以PM。
1,36個(gè)是相對(duì)穩(wěn)定態(tài),不是絕對(duì)值,不要追究為何不是35;
2,一些說(shuō)法都是相對(duì)說(shuō)法,都不是絕對(duì)的,所以你要站在相對(duì)論的前提下閱讀本篇文章;
3,本人研究seo時(shí)間很短,很慚愧地說(shuō)也沒(méi)有接受神馬培訓(xùn),不過(guò)看了很多免費(fèi)資料,自己造的一套seo理論是依據(jù)三權(quán)、五構(gòu)、七標(biāo)、十三點(diǎn)(核心是自然的平穩(wěn)態(tài)),里面內(nèi)容比較駁雜,以后慢慢通過(guò)寫(xiě)博客分享出來(lái),其中這篇文章當(dāng)中很多細(xì)節(jié)都需要解釋的,會(huì)在以后慢慢解釋;
4,本人覺(jué)得國(guó)平seo適合對(duì)網(wǎng)站進(jìn)行數(shù)據(jù)分析,而我的理論主要是對(duì)網(wǎng)站進(jìn)行seo架構(gòu)設(shè)計(jì),我正逐步分析大量網(wǎng)站來(lái)對(duì)理論進(jìn)行驗(yàn)證和修正,寫(xiě)這么多僅供參考,您可以鄙視我的無(wú)知,回復(fù)著請(qǐng)不要打擊我的熱心……