百度搜索引擎優(yōu)化白皮書(shū)(采集知名小說(shuō)網(wǎng)站的盜版小說(shuō)頁(yè)是怎樣的?(圖))
優(yōu)采云 發(fā)布時(shí)間: 2022-04-19 21:23百度搜索引擎優(yōu)化白皮書(shū)(采集知名小說(shuō)網(wǎng)站的盜版小說(shuō)頁(yè)是怎樣的?(圖))
采集名著(zhù)網(wǎng)站的盜版小說(shuō)頁(yè)。
3、內容差:
百度搜索引擎認為主要內容信息量少,或無(wú)有效信息,信息無(wú)效過(guò)期,均屬于內容質(zhì)量較差的頁(yè)面,對用戶(hù)沒(méi)有實(shí)質(zhì)性幫助,應減少其展示的機會(huì )。同時(shí),如果一個(gè)網(wǎng)站中此類(lèi)網(wǎng)頁(yè)的比例過(guò)大,也會(huì )影響百度搜索引擎對該網(wǎng)站的評分,尤其是UGC網(wǎng)站、電子商務(wù)網(wǎng)站、黃頁(yè)網(wǎng)站特別注意過(guò)期和無(wú)效網(wǎng)頁(yè)的管理。例如:
已下架的產(chǎn)品頁(yè)面,或已過(guò)期的團購頁(yè)面;
已過(guò)期的招聘和交易頁(yè)面;
資源已過(guò)期,如視頻已被刪除、軟件下載后無(wú)法使用等
4、沒(méi)有內容質(zhì)量可言:
沒(méi)有內容質(zhì)量的網(wǎng)頁(yè)是那些制作成本低、質(zhì)量低劣的網(wǎng)頁(yè);來(lái)自其他來(lái)源的內容 采集 被放到網(wǎng)上,沒(méi)有經(jīng)過(guò)最少的編輯和整理;*敏*感*詞*木馬等病毒;意圖;完全不能滿(mǎn)足用戶(hù)的需求,甚至是帶有欺騙性?xún)热莸木W(wǎng)頁(yè)。例如:
內容空洞短小,內容量少,但無(wú)法支撐頁(yè)面的主要用途;
問(wèn)答頁(yè)面有問(wèn)題沒(méi)有答案,或者答案根本解決不了問(wèn)題;
站點(diǎn)搜索結果頁(yè)面,但沒(méi)有給出相關(guān)信息
除了上述網(wǎng)頁(yè)之外,欺騙用戶(hù)和搜索引擎的網(wǎng)頁(yè)在“無(wú)內容質(zhì)量”組中占很大比例。百度搜索引擎將作弊網(wǎng)頁(yè)定義為:以不滿(mǎn)足用戶(hù)需求為目的,以不正當手段欺騙用戶(hù)和搜索引擎的網(wǎng)頁(yè)。目前,這部分網(wǎng)頁(yè)在互聯(lián)網(wǎng)上仍然是少數,但作弊網(wǎng)頁(yè)的價(jià)值是負面的,對用戶(hù)的危害很大。對于這類(lèi)網(wǎng)頁(yè),搜索引擎采取堅決打擊的態(tài)度。
2.衡量網(wǎng)頁(yè)質(zhì)量的2個(gè)維度-瀏覽體驗
不同質(zhì)量的網(wǎng)頁(yè)給用戶(hù)帶來(lái)的瀏覽體驗會(huì )有很大差異。一個(gè)高質(zhì)量的網(wǎng)頁(yè)應該給用戶(hù)一個(gè)積極的瀏覽體驗。用戶(hù)希望看到干凈且易于閱讀的網(wǎng)頁(yè)。版面混亂、廣告過(guò)多會(huì )影響用戶(hù)對網(wǎng)頁(yè)主要內容的訪(fǎng)問(wèn)。在百度搜索引擎網(wǎng)頁(yè)質(zhì)量體系中,用戶(hù)獲取網(wǎng)頁(yè)主要內容的成本與瀏覽體驗成反比,即獲取成本越高,瀏覽體驗越低。對于內容質(zhì)量相近的網(wǎng)頁(yè),瀏覽體驗較好的網(wǎng)頁(yè)更有可能獲得較高的排名,而對于瀏覽體驗較差的網(wǎng)頁(yè),百度搜索引擎會(huì )視情況降低其展示概率甚至拒絕收錄 .
影響用戶(hù)瀏覽體驗的因素有很多。目前百度搜索引擎主要從內容布局和廣告影響兩個(gè)方面考慮網(wǎng)頁(yè)。
內容布局
用戶(hù)進(jìn)入網(wǎng)頁(yè)時(shí)首先看到的是內容布局。布局決定了用戶(hù)對網(wǎng)頁(yè)的第一印象,也決定了用戶(hù)獲取內容的成本。
廣告影響
百度搜索引擎明白網(wǎng)站的生存和發(fā)展需要資金支持,支持在網(wǎng)頁(yè)上投放合法廣告。網(wǎng)頁(yè)的主要目的應該是滿(mǎn)足用戶(hù)的需求,最好的狀態(tài)是“主內容和廣告共同滿(mǎn)足用戶(hù)需求,內容為主,廣告為輔”,廣告不應成為網(wǎng)頁(yè)的主體。
我們舉個(gè)例子,看看百度搜索引擎是如何對網(wǎng)頁(yè)的瀏覽體驗進(jìn)行分類(lèi)的。站長(cháng)可以根據這個(gè)對比測試自己網(wǎng)站的瀏覽體驗:
1、瀏覽體驗不錯:
頁(yè)面布局合理,用戶(hù)獲取主要內容的成本低。一般具有以下特點(diǎn):
布局合理,布局美觀(guān),易于閱讀和瀏覽;
用戶(hù)需要的內容在網(wǎng)頁(yè)中占據最重要的位置;
能夠通過(guò)頁(yè)面標簽或頁(yè)面布局清楚地區分哪些廣告;
廣告不占據主要內容的位置,不妨礙用戶(hù)獲取主要內容;
2、瀏覽體驗差:
頁(yè)面布局和廣告投放影響用戶(hù)對主要內容的獲取,增加用戶(hù)獲取信息的成本,使用戶(hù)反感。包括但不限于:
文字內容不換行,不分段,用戶(hù)閱讀困難;
字體和背景顏色相似,難以區分內容;
頁(yè)面布局不合理,網(wǎng)頁(yè)首屏看不到有價(jià)值的主要內容;
廣告屏蔽了主要內容;或者在一般分辨率下,第一屏都是廣告,看不到主要內容;
彈出式廣告太多;
干擾閱讀的浮動(dòng)廣告過(guò)多
點(diǎn)擊鏈接時(shí)出現意外彈窗;
廣告和內容混淆,難以區分;
2.網(wǎng)頁(yè)質(zhì)量的三個(gè)維度——可訪(fǎng)問(wèn)性
用戶(hù)希望從搜索引擎中快速獲得所需的信息。百度搜索引擎盡力為用戶(hù)提供一次可以直接獲取所有信息的網(wǎng)頁(yè)結果。百度搜索引擎認為不能直接獲取主要內容的網(wǎng)頁(yè)對用戶(hù)不友好,會(huì )根據情況調整其展示概率。
百度搜索引擎會(huì )從正常打開(kāi)、權限限制、有效性三個(gè)方面來(lái)判斷網(wǎng)頁(yè)的可訪(fǎng)問(wèn)性。對于可以正常訪(fǎng)問(wèn)的頁(yè)面,可以參與正常排序;對于有權限限制的頁(yè)面,可以通過(guò)其他維度進(jìn)行排名。觀(guān)察;對于無(wú)效網(wǎng)頁(yè),展示機制將被降級甚至從數據庫中刪除。
1、可以正常訪(fǎng)問(wèn)的網(wǎng)頁(yè)
不受權限限制,可直接訪(fǎng)問(wèn)所有主要內容頁(yè)面。
2、受限網(wǎng)頁(yè)
網(wǎng)頁(yè)有兩種類(lèi)型:打開(kāi)權限和資源訪(fǎng)問(wèn)權限
1)開(kāi)放權限
指需要登錄才能打開(kāi)網(wǎng)頁(yè)。未經(jīng)許可,根本看不到具體內容。普通用戶(hù)無(wú)法獲取或獲取成本非常高。百度搜索引擎會(huì )降低其展示概率。不包括以登錄為主要功能的網(wǎng)頁(yè)。
2)資源訪(fǎng)問(wèn)權限
指獲取網(wǎng)頁(yè)的主要內容,如文檔、軟件、視頻等,需要權限或需要安裝插件才能獲取完整內容。分三種情況:
提供優(yōu)質(zhì)、正版內容網(wǎng)站,由于內容建設成本高,查看全文或下載雖然需要權限或安裝插件,但在用戶(hù)的預期之內,而百度搜索引擎則認為權限行為不正確。用戶(hù)造成傷害并被視為正??稍L(fǎng)問(wèn)的頁(yè)面。
對于一些非優(yōu)質(zhì)、非正版的資源,來(lái)自用戶(hù)的轉載甚至機器采集,本身成本低,內容不唯一,用戶(hù)可以獲取資源,有權限限制——用戶(hù)需要注冊登錄或支付Check,百度搜索引擎會(huì )根據具體情況決定是否調整其顯示。
還有一些視頻和下載資源頁(yè)面。也許自己的資源質(zhì)量還不錯,但是需要安裝很冷門(mén)的插件才能正常訪(fǎng)問(wèn)。例如,如果他們要求安裝“xx大片播放器”,百度搜索引擎就會(huì )懷疑他們有惡意傾向。 .
3、無(wú)效網(wǎng)頁(yè)
通常是指帶有死鏈接和無(wú)效主要資源的網(wǎng)頁(yè)。百度搜索引擎認為這些頁(yè)面無(wú)法提供有價(jià)值的信息。如果網(wǎng)站上此類(lèi)頁(yè)面過(guò)多,也會(huì )影響百度搜索引擎的收錄和評分。建議站長(cháng)對此類(lèi)網(wǎng)頁(yè)進(jìn)行相應設置,及時(shí)登錄百度站長(cháng)平臺,并使用死鏈接提交工具通知百度搜索引擎。
無(wú)效網(wǎng)頁(yè)包括但不限于:
404、403、503等網(wǎng)頁(yè);
程序代碼錯誤報告頁(yè)面;
打開(kāi)后提示內容被刪除,或者因為內容不存在而跳轉到首頁(yè)的頁(yè)面;
收錄已刪除內容、已刪除視頻頁(yè)面的論壇帖子(主要在 UGC 網(wǎng)站上)
3 Internet Web資源現狀
根據CNNIC 2014年初發(fā)布的《中國互聯(lián)網(wǎng)發(fā)展統計報告》:截至2013年12月,中國網(wǎng)頁(yè)數量為1500億,同比增長(cháng)22.2% 2012 年同期。2013 年,中國單個(gè)網(wǎng)站 的平均網(wǎng)頁(yè)數和單個(gè)網(wǎng)頁(yè)的平均字節數均保持增長(cháng),表明中國互聯(lián)網(wǎng)上的內容是更豐富:網(wǎng)站平均頁(yè)數達到4.69萬(wàn),同比增長(cháng)2.3%。
為保證搜索質(zhì)量,提高用戶(hù)滿(mǎn)意度,百度搜索引擎每周都會(huì )對網(wǎng)頁(yè)質(zhì)量進(jìn)行抽樣評估。但從過(guò)去一年的評價(jià)數據中,我們發(fā)現優(yōu)質(zhì)網(wǎng)頁(yè)的絕對數量非常少,幾乎沒(méi)有增加;普通網(wǎng)頁(yè)的比例在下降,相應地,劣質(zhì)網(wǎng)頁(yè)的比例顯著(zhù)增加。截至2014年5月,統計顯示,在百度網(wǎng)絡(luò )搜索發(fā)現的海量網(wǎng)頁(yè)中,只有7.4%是優(yōu)質(zhì)網(wǎng)頁(yè),21%是劣質(zhì)網(wǎng)頁(yè),7個(gè)1. 6%。
百度搜索引擎網(wǎng)頁(yè)質(zhì)量百度站長(cháng)平臺網(wǎng)站死鏈接
百度搜索力求通過(guò)一系列篩選、識別、分析、賦能等工作,將更多優(yōu)質(zhì)網(wǎng)頁(yè)呈現給用戶(hù),每天打擊數以萬(wàn)計的劣質(zhì)網(wǎng)頁(yè)網(wǎng)站 ,涉及數百萬(wàn)網(wǎng)頁(yè)級別,最大限度地減少劣質(zhì)網(wǎng)頁(yè)對用戶(hù)的干擾。根據下圖2014年5月網(wǎng)頁(yè)呈現分析數據,當前呈現在用戶(hù)面前的網(wǎng)頁(yè)質(zhì)量分布中,優(yōu)質(zhì)網(wǎng)頁(yè)占比40%,劣質(zhì)網(wǎng)頁(yè)降為11%——雖然這個(gè)變化已經(jīng)很明顯了,但是百度搜索還是希望和廣大站長(cháng)一起努力,把劣質(zhì)的比例降到一個(gè)更低的水平。
百度搜索引擎網(wǎng)頁(yè)質(zhì)量百度站長(cháng)平臺網(wǎng)站死鏈接
上述劣質(zhì)網(wǎng)頁(yè)包括劣質(zhì)網(wǎng)頁(yè)和垃圾網(wǎng)頁(yè)。低質(zhì)量網(wǎng)頁(yè)的問(wèn)題分布如下圖所示:
百度搜索引擎網(wǎng)頁(yè)質(zhì)量百度站長(cháng)平臺網(wǎng)站死鏈接
從上圖我們可以看出,目前低質(zhì)量網(wǎng)頁(yè)中最嚴重的問(wèn)題是廣告過(guò)多導致瀏覽體驗不佳,占據網(wǎng)頁(yè)主要位置,彈窗超出預期窗口,內容為空且短,網(wǎng)頁(yè)獲取資源需要權限,過(guò)時(shí)的信息也是低質(zhì)量網(wǎng)頁(yè)的重要組成部分。
除了低質(zhì)量頁(yè)面外,完全沒(méi)有質(zhì)量的垃圾頁(yè)面問(wèn)題分布如下圖所示:
百度搜索引擎網(wǎng)頁(yè)質(zhì)量百度站長(cháng)平臺網(wǎng)站死鏈接
壞鏈接對用戶(hù)、網(wǎng)站和搜索引擎沒(méi)有意義,它們占垃圾郵件的比例最大。二是對用戶(hù)和搜索引擎造成極大傷害的作弊網(wǎng)頁(yè)。大量浪費用戶(hù)時(shí)間的網(wǎng)頁(yè),如無(wú)效資源、未回答的問(wèn)題、不相關(guān)的搜索結果頁(yè)面,都不是搜索引擎想要呈現給用戶(hù)的。
給站長(cháng)的4條百度搜索引擎建議
以上描述了百度搜索引擎判斷網(wǎng)頁(yè)質(zhì)量的標準。與這些標準相對應,站長(cháng)在實(shí)際工作中應該遵循幾個(gè)原則:
設計網(wǎng)頁(yè)時(shí)要考慮用戶(hù),而不是搜索引擎
始終將用戶(hù)體驗放在首位
根據用戶(hù)需求創(chuàng )建內容
考慮如何讓你的網(wǎng)站獨一無(wú)二的價(jià)值
尋找長(cháng)期的、不分青紅皂白的廣告弊大于利
及時(shí)刪除低質(zhì)量?jì)热?/p>
不要試圖以任何方式欺騙用戶(hù)和搜索引擎
下載《百度搜索引擎網(wǎng)頁(yè)質(zhì)量白皮書(shū)》完整版移至百度文庫