百度站長門診開放日Lee問答整理-首頁百度快照更新與排名沒有關(guān)系
轉(zhuǎn)載于站長網(wǎng):8月10日百度站長門診開放日Lee問答整理
問題1:我希望今天lee能對站長的問題,都盡量精準(zhǔn),能用數(shù)字說明的就說數(shù)字,如果一直說質(zhì)量什么的、對用戶體驗什么的,這各人理解起來差距很大的,比如什么叫對用戶有幫助,哈哈,站長不需要你對所有都說出標(biāo)準(zhǔn),但是至少這些站長們提的問題,您能確定化得數(shù)字就數(shù)字說明,謝謝了!
Lee:首先,公布數(shù)字是不可能的,任何一個搜索引擎都不會這么干,我們需要保證判斷算法的壽命。
問題2:一個網(wǎng)站內(nèi)有部分頁面的title等設(shè)置一樣,那么會不會影響到這些頁面的相關(guān)關(guān)鍵詞排名,還是從中選擇一個權(quán)重高的合適的頁面出來參與排名競爭?
Lee:這種問題請參考《百度搜索引擎優(yōu)化指南》,其中已經(jīng)有非常明確的說明,多個網(wǎng)頁title一樣,意味著這部分網(wǎng)頁搜索引擎判斷其中心內(nèi)容非常困難,也就不容易準(zhǔn)確的給其一個合理的權(quán)值。
問題3:請問:百度對于網(wǎng)站分隔符、網(wǎng)站結(jié)構(gòu)是否有自己的標(biāo)準(zhǔn)?目前醫(yī)療網(wǎng)站內(nèi)容同質(zhì)化嚴(yán)重,請問百度是如何來判定網(wǎng)站權(quán)重和自然排名的?
Lee:網(wǎng)站的結(jié)構(gòu)在保證用戶體驗的前提下,適當(dāng)?shù)淖鲆恍pider的優(yōu)化會有助于收錄,我們推薦扁平的樹型結(jié)構(gòu)。
《百度搜索引擎優(yōu)化指南》中有詳細(xì)的說明。
關(guān)于同質(zhì)內(nèi)容,先透露一下,我們正在設(shè)計一套較完善的原創(chuàng)識別算法,不久之后也會邀請站長朋友給我們一些建議及抄襲的實例用做算法調(diào)整之用。
問題4:此外網(wǎng)站一個網(wǎng)頁多大合適,有的頁面大小過200k,我一般都注意在110k以內(nèi),這個有數(shù)字標(biāo)準(zhǔn)嗎?
Lee:網(wǎng)頁大小建議以用戶能接受的程度為準(zhǔn),對百度來講,我們能接受的網(wǎng)頁大小肯定已經(jīng)超出普通網(wǎng)頁平均大小的數(shù)十倍,完全不用擔(dān)心。
問題5:百度對于一篇原創(chuàng)文章的判斷到底是怎樣的標(biāo)準(zhǔn)?比如一篇原創(chuàng)文章可能最先是一個新站或權(quán)重較低的站發(fā)布的,但是已經(jīng)被百度收錄后,發(fā)表到其他高權(quán)重門戶網(wǎng)站、論壇,這些網(wǎng)站可能會給文章來源站一個來源網(wǎng)址,可能是錨文本鏈接,也可能是純網(wǎng)址;但過了很久,百度都無法識別文章的真正來源,總會將文章來源給那些高權(quán)重站。試問,這樣對用戶的體驗好嗎?雖然之前有人問過類似問題,百度官方也有回答,但很模糊,想具體了解下,百度到底如何界定原創(chuàng)文章?
Lee:近期我們會就原創(chuàng)識別問題和大家做專門的交流,為了保證算法的壽命周期,我們不會公布算法的細(xì)節(jié),但大家的意見和碰到的具體問題,都考慮到算法中。
問題6:現(xiàn)在點擊器泛濫,導(dǎo)致很多內(nèi)容很不好的網(wǎng)站排名很好,認(rèn)真做內(nèi)容的網(wǎng)站反而不能排在前面,希望這個百度能重視,用戶體驗才是第一位的
Lee:如果大家遇到此類問題,請到投訴反饋,我們有專門的同學(xué)輪流分析并安排到合適的項目中去解決,我也是其中之一。
問題7:百度對于鏈接買賣、站群和克隆站的打擊策略是怎樣的?
Lee:超鏈應(yīng)該是用戶真心實意對網(wǎng)站的投票,買賣鏈接有違超鏈的本意,我們反對鏈接買賣。很快我們將就此類問題做一個專門的說明,同時也會說明我們對買賣鏈接的處理原則。
問題8:如果站長們不投訴,被誤傷的網(wǎng)站會一直被懲罰嗎?有沒有恢復(fù)的期限,是半年,還是一年?或者更長?
Lee:我們的策略都會定期的review/改進,不同的策略有不同的周期,天級到月級不等,我們會持續(xù)的改進策略,以減少誤傷。
問題9:針對一些大站 比如B2B 分類信息站 其大部分每天更新的都是產(chǎn)品詳細(xì)頁 因為客戶都比較懶,發(fā)布的信息都非常簡單 沒有幾個字 導(dǎo)致大部分頁面看起來相似度都很好(因為產(chǎn)品內(nèi)容詳細(xì)頁都是一個模板) 請問百度是怎么來評定這個站 并對其的收錄情況及評價情況有何標(biāo)準(zhǔn)?
Lee:搜索引擎對網(wǎng)頁價值的判斷,不是從字?jǐn)?shù)出發(fā)的,而是從其資源質(zhì)量出發(fā)的
只要是對用戶有價值的內(nèi)容,不論長短,我們都會給一個合理的評價如果這個網(wǎng)站上提供的內(nèi)容或者服務(wù)非常有價值,無可替代,那對搜索引擎來講,就是一個高質(zhì)量的網(wǎng)站。
問題10:現(xiàn)在憑借發(fā)布時間來判斷兩篇相同文章哪篇是原創(chuàng)還無法實現(xiàn),這一點百度說明過,但是現(xiàn)在的情況是很多新站,權(quán)重低的網(wǎng)站站長自己辛辛苦苦一點點碼字寫出來的原創(chuàng)文章,被高權(quán)重網(wǎng)站轉(zhuǎn)載,雖然注明了出處,但是對于百度來說,如果僅僅因為轉(zhuǎn)載網(wǎng)站權(quán)重高就判斷為原創(chuàng)文章,那就意味著低權(quán)重網(wǎng)站被誤判為抄襲或轉(zhuǎn)載,這樣顯然很不公平,請問對于判斷文章原創(chuàng)問題,百度搜索團隊是否有解決方案,或者直接回答我們“百度是否能判斷出哪篇文章才是原創(chuàng)的”。
Lee:剛剛已經(jīng)說過了,我們正在計劃在原創(chuàng)方面做一些改進。原創(chuàng)識別是一個很有技術(shù)含量的話題,不是簡單的幾種規(guī)則就能做好的,互聯(lián)網(wǎng)很復(fù)雜,人心更復(fù)雜,不過我們有信心逐步的去解決這個問題,其中也需要站長朋友多提供相關(guān)的問題和建議。
問題11:關(guān)于描述的抓取怎么抓取的,看到一個網(wǎng)站的描述,不是meta name="description" 里面的內(nèi)容而是企業(yè)簡介里面的內(nèi)容。感覺不是亂抓取,跪求大大回答
Lee:我們的《百度搜索引擎優(yōu)化指南》算是白寫了。。。其中有很詳細(xì)的說明,建議你認(rèn)真看一遍第22、23頁。
問題12:百度什么時候能發(fā)放,外鏈查詢工具,還有網(wǎng)站權(quán)重對百度是否有用的工具。
Lee:外鏈查詢工具請密切關(guān)注站長平臺,也許會有驚喜。
問題13:我的網(wǎng)站運營方式有點像中國知網(wǎng)文章內(nèi)容沒有顯示完整的會員必須登陸并要通過上傳原創(chuàng)文章交換的方式獲得積分才可以下載全文這樣會不會意味著用戶體驗不好百度予以降權(quán)?
Lee:知網(wǎng)就已經(jīng)是此類網(wǎng)站最佳的例子了,既然他在搜索引擎中表現(xiàn)很好,那還擔(dān)心什么。。。
問題14:自從大K站之后,許多的網(wǎng)站百度快照一直停留不動,不知道這是什么原因。是算法在調(diào)整,還是我們應(yīng)該在網(wǎng)站自身找原因。
Lee:關(guān)于快照的更新時間,尤其是首頁的更新時間,我一直建議不要參考,這個時間跟網(wǎng)站的價值沒有任何的關(guān)系,近期我們也會出一個專門的說明。
問題15:您好,專家,我想請教一下。為什么帶3w的網(wǎng)站最近老是不穩(wěn)定,有時候被收錄,有時候又找不到了。而,排名全部是集中在帶3w的上的,一沒有,排名都消失了。請問是什么原因,要如何解決?
Lee:看不到實例的話,誰也說不準(zhǔn)到底是什么原因
建議你到百度投訴 給一下具體的實例
應(yīng)該是一種異常現(xiàn)象
問題16:我們有一個專題專欄,里面大都是一些靜態(tài)頁面,但是百度一直不予收錄,不知道是什么原因,其他的都收錄了,就下面這個列表頁
中國文物網(wǎng)-深度列表
Lee:根據(jù)你提供的query,我找出這個欄目隨便看了幾個網(wǎng)頁,都收錄了
貴站犯了一個非常常見的錯誤,同一個網(wǎng)頁,有兩種以上的url形式,我們收錄的,是不帶index.aspx的那種。建議參考《百度搜索引擎優(yōu)化指南》中關(guān)于url規(guī)范的部分。
問題17:很想知道,在百度眼里什么樣的站是高質(zhì)量的站,每一個站都是從沒用戶到有用戶,一點點積累起來的。
看完7.19~7.31站長投訴反饋公告,只覺得有種想打人的沖動,不知道是不是普通站長太微小了,百度看不上,還是希望站長們一起放棄百度。
看見大把的垃圾站活著,自己辛辛苦苦做的站卻沒了,知道世界不公平,那也不能沒有游戲規(guī)則了吧,你們百度說別人的站是低質(zhì)量,舉例也說了,那我們不是這樣的站為什么也被K了呢?你們可以把你們認(rèn)為的低質(zhì)量都一樣舉例說明出來嗎?
Lee:關(guān)于這個問題,請大家換位思考一下,作用一個搜索引擎,所追求的最終目標(biāo)是為用戶提供最有價值的信息,我們希望大家有一個最低限度的判斷,那就是將自己作為一個普通的用戶,通過搜索引擎搜索到自己的網(wǎng)站時,自己相不相信自己網(wǎng)站上的信息,自己覺不覺得這是互聯(lián)網(wǎng)上最好的信息。
我們通過反饋渠道收集到聲稱自己網(wǎng)站是原創(chuàng)、高質(zhì)量網(wǎng)站的反饋,其中80%多都是無效的,甚至大量聲稱老中醫(yī)3-5天治愈絕癥的網(wǎng)站,通篇內(nèi)容讀不通,聲稱自己是高質(zhì)量的網(wǎng)站。
如果互聯(lián)網(wǎng)非常純潔,那我們也不會花費大量人力去識別網(wǎng)站的質(zhì)量,也就不會有誤傷。
但互聯(lián)網(wǎng)越來越不保險,我們的策略也越來越復(fù)雜,只要對技術(shù)有一定了解的人,都應(yīng)該知道誤傷是無法避免的,我們也盡最大的努力將誤傷降到最低限度。
我不知道你的網(wǎng)站是不是真的非常高質(zhì)量,如果確認(rèn),可以通過上面幾帖提到的反饋途徑反饋給我們來追查一下。
問題18:雖然百度的官方不承認(rèn)有降權(quán)蜘蛛的說法,但是例如:123.125.*段的蜘蛛出現(xiàn),網(wǎng)站在排名、收錄上快照、都會存在異常,是否可以理解為這段IP的蜘蛛雖然不是降權(quán)蜘蛛,但可以認(rèn)為是自身網(wǎng)站出現(xiàn)了問題,百度對于網(wǎng)站的考察和警示呢?是百度對網(wǎng)站所提出的警告呢?
Lee:Baiduspider只有一種,不存在什么降權(quán)蜘蛛。不過你所提到的對網(wǎng)站的警示,我們會在站長平臺中考慮。
問題19:我有一個商城類網(wǎng)站,因為會經(jīng)常產(chǎn)生大量下架商品,產(chǎn)生下架商品后,程序會返回一個只有模板的空頁面,沒有任何具體商品信息。以前我把這些下架商品所在的頁面設(shè)置為404,在日志里看到大量的404狀態(tài)碼,請問這樣會不會影響我網(wǎng)站的質(zhì)量,長期下去造成收錄和排名下降?
Lee:我們鼓勵站長為死鏈返回規(guī)范的404代碼,不歡迎給死鏈返回200代碼。
只要是正確的返回404,對網(wǎng)站沒有任何影響,還可以減少baiduspider抓取給服務(wù)器造成的負(fù)擔(dān)。如果死鏈數(shù)量較多,建議通過站長平臺提交死鏈列表,更高效一些。
問題20:<meta name="keywords" content="百度" /> 內(nèi)容是否還會參與排名?
Lee:meta keywords早就進歷史的垃圾堆了,我們會直接忽略。
問題21:LEE,問個技術(shù)問題。link標(biāo)簽 rel=canonical 屬性百度支持嗎? 這個問題很關(guān)鍵。我們有大量同質(zhì)的內(nèi)容。我們想把同質(zhì)內(nèi)容標(biāo)準(zhǔn)化。
Lee:canonical 目前不支持,不過已計劃要支持了。
更多網(wǎng)站優(yōu)化內(nèi)容請訪問:http://www.siweb.cn/seoblog/
百度關(guān)鍵詞排名優(yōu)化:http://siweb.cn/seo/baidu-seo.html