百度搜索引擎優(yōu)化白皮書(shū)(采集知名小說(shuō)網(wǎng)站的盜版小說(shuō)頁(yè)是怎樣的?(圖))
優(yōu)采云 發(fā)布時(shí)間: 2022-04-17 19:33百度搜索引擎優(yōu)化白皮書(shū)(采集知名小說(shuō)網(wǎng)站的盜版小說(shuō)頁(yè)是怎樣的?(圖))
采集名著(zhù)網(wǎng)站的盜版小說(shuō)頁(yè)。
3、內容不佳:
百度搜索引擎認為,主要內容的內容信息量少,或者沒(méi)有有效信息,信息無(wú)效過(guò)期,都是內容質(zhì)量較差的頁(yè)面,對用戶(hù)沒(méi)有實(shí)質(zhì)性幫助,應該減少他們展示的機會(huì )。同時(shí),如果一個(gè)網(wǎng)站中此類(lèi)網(wǎng)頁(yè)的比例過(guò)大,也會(huì )影響百度搜索引擎對該網(wǎng)站的評分,尤其是UGC網(wǎng)站、電子商務(wù)網(wǎng)站、黃頁(yè)網(wǎng)站特別注意過(guò)期和無(wú)效網(wǎng)頁(yè)的管理。例如:
已下架的產(chǎn)品頁(yè)面,或已過(guò)期的團購頁(yè)面;
已過(guò)期的招聘和交易頁(yè)面;
資源已過(guò)期,如視頻已被刪除、軟件下載后無(wú)法使用等。
4、沒(méi)有內容質(zhì)量可言:
沒(méi)有內容質(zhì)量的網(wǎng)頁(yè)是指制作成本低、制作粗制濫造的網(wǎng)頁(yè);來(lái)自其他地方的內容 采集 被放到網(wǎng)上,沒(méi)有經(jīng)過(guò)最少的編輯和整理;*敏*感*詞*木馬等病毒;收錄作弊行為或意圖;完全不能滿(mǎn)足用戶(hù)需求,甚至收錄欺騙性?xún)热莸木W(wǎng)頁(yè)。例如:
內容空洞短小,內容量少,但不能支撐頁(yè)面的主要用途;
問(wèn)答頁(yè)面有問(wèn)題但沒(méi)有答案,或者答案根本沒(méi)有解決問(wèn)題;
現場(chǎng)搜索結果頁(yè)面,但沒(méi)有給出相關(guān)信息
除了上面提到的網(wǎng)頁(yè)之外,欺騙用戶(hù)和搜索引擎的網(wǎng)頁(yè)在無(wú)內容質(zhì)量集合中占很大比例。百度搜索引擎將作弊網(wǎng)頁(yè)定義為:以不滿(mǎn)足用戶(hù)需求為目的,以不正當手段欺騙用戶(hù)和搜索引擎的網(wǎng)頁(yè)。目前,這部分網(wǎng)頁(yè)在互聯(lián)網(wǎng)上還屬于少數,但作弊網(wǎng)頁(yè)的價(jià)值是負面的,對用戶(hù)的危害很大。對這類(lèi)網(wǎng)頁(yè),搜索引擎采取堅決打擊的態(tài)度。
2.2維衡量網(wǎng)頁(yè)質(zhì)量-瀏覽體驗
不同質(zhì)量的網(wǎng)頁(yè)帶來(lái)的瀏覽體驗會(huì )有很大差異。一個(gè)高質(zhì)量的網(wǎng)頁(yè)應該給用戶(hù)一個(gè)積極的瀏覽體驗。用戶(hù)希望看到干凈且易于閱讀的網(wǎng)頁(yè)。版面混亂、廣告過(guò)多會(huì )影響用戶(hù)對網(wǎng)頁(yè)主要內容的訪(fǎng)問(wèn)。在百度搜索引擎網(wǎng)頁(yè)質(zhì)量體系中,用戶(hù)獲取網(wǎng)頁(yè)主要內容的成本與瀏覽體驗成反比,即獲取成本越高,瀏覽體驗越低。面對內容質(zhì)量相近的網(wǎng)頁(yè),瀏覽體驗較好的網(wǎng)頁(yè)更有可能獲得較高的排名,而對于瀏覽體驗較差的網(wǎng)頁(yè),百度搜索引擎會(huì )降低其展示概率甚至拒絕收錄
影響用戶(hù)瀏覽體驗的因素有很多。目前,百度的搜索引擎主要從內容布局和廣告影響兩個(gè)方面考慮網(wǎng)頁(yè)。
內容布局
用戶(hù)進(jìn)入網(wǎng)頁(yè)時(shí)首先看到的是內容布局。布局決定了用戶(hù)對網(wǎng)頁(yè)的第一印象,也決定了用戶(hù)獲取內容的成本。
廣告影響力
百度搜索引擎明白網(wǎng)站的生存和發(fā)展需要資金支持,支持在網(wǎng)頁(yè)上投放合法廣告。網(wǎng)頁(yè)的主要目的應該是滿(mǎn)足用戶(hù)需求。最好的狀態(tài)是“主內容和廣告一起滿(mǎn)足用戶(hù)的需求,內容為主,廣告為輔”,廣告不應該是網(wǎng)頁(yè)的主體。
我們舉個(gè)例子來(lái)感受一下百度搜索引擎是如何對網(wǎng)頁(yè)的瀏覽體驗進(jìn)行分類(lèi)的。站長(cháng)可以對比測試自己網(wǎng)站的瀏覽體驗:
1、瀏覽體驗不錯:
頁(yè)面布局合理,用戶(hù)獲取主要內容的成本低。一般具有以下特點(diǎn):
排版合理,版面美觀(guān),易于閱讀和瀏覽;
用戶(hù)需要的內容在網(wǎng)頁(yè)上占據最重要的位置;
能夠通過(guò)頁(yè)面標簽或頁(yè)面布局清楚地區分哪些廣告;
廣告不搶占主要內容的位置,不妨礙用戶(hù)對主要內容的獲??;
百度搜索引擎網(wǎng)頁(yè)質(zhì)量白皮書(shū)完成版2、瀏覽體驗差:
頁(yè)面布局和廣告投放影響用戶(hù)對主要內容的獲取,增加了用戶(hù)獲取信息的成本,使用戶(hù)反感。包括但不限于以下幾種情況:
正文內容不換行,不分段,用戶(hù)閱讀困難;
字體和背景顏色相似,難以區分內容;
頁(yè)面布局不合理,網(wǎng)頁(yè)首屏看不到有價(jià)值的主要內容;
廣告屏蔽了主要內容;或者一般分辨率下,第一屏都是廣告,看不到主要內容;
彈出廣告太多;
干擾閱讀的浮動(dòng)廣告過(guò)多
單擊鏈接時(shí),會(huì )出現意外的彈出窗口;
廣告與內容混淆,不易區分;
2.網(wǎng)頁(yè)質(zhì)量的三個(gè)維度——可訪(fǎng)問(wèn)性
用戶(hù)希望從搜索引擎中快速獲得所需的信息。百度搜索引擎為用戶(hù)提供的網(wǎng)頁(yè)結果盡可能一次直接獲取所有信息。百度搜索引擎認為,不能直接獲取主要內容的網(wǎng)頁(yè)對用戶(hù)不友好,會(huì )根據情況調整其展示概率。
百度搜索引擎會(huì )從正常打開(kāi)、權限限制、有效性三個(gè)方面來(lái)判斷網(wǎng)頁(yè)的可訪(fǎng)問(wèn)性。對于可以正常訪(fǎng)問(wèn)的頁(yè)面,可以參與正常排序;對于有權限限制的頁(yè)面,將通過(guò)其他維度進(jìn)行觀(guān)察;對于無(wú)效網(wǎng)頁(yè),其展示機制將被降級甚至從數據庫中刪除。
1、可以正常訪(fǎng)問(wèn)的網(wǎng)頁(yè)
沒(méi)有權限限制,可以直接訪(fǎng)問(wèn)網(wǎng)頁(yè)的所有主要內容。
2、受限網(wǎng)頁(yè)
此類(lèi)網(wǎng)頁(yè)分為開(kāi)放權限和資源訪(fǎng)問(wèn)權限兩種
1)開(kāi)放權限
這意味著(zhù)您需要登錄才能打開(kāi)網(wǎng)頁(yè)。未經(jīng)許可,您根本看不到具體內容。普通用戶(hù)無(wú)法獲取或獲取成本非常高。百度搜索引擎會(huì )降低其展示概率。不包括以登錄為主要功能的網(wǎng)頁(yè)。
2)資源訪(fǎng)問(wèn)權限
指獲取網(wǎng)頁(yè)的主要內容,如文檔、軟件、視頻等,需要權限或者需要安裝插件才能獲取完整的內容。會(huì )出現三種情況:
網(wǎng)站 提供優(yōu)質(zhì)正版內容,由于內容建設成本高,查看全文或下載雖然需要權限或安裝插件,但在用戶(hù)的預期之內,百度搜索引擎不認為許可行為對用戶(hù)造成傷害。,它被視為與通??稍L(fǎng)問(wèn)的頁(yè)面相同。
對于一些非優(yōu)質(zhì)、非正版資源,來(lái)自用戶(hù)轉載甚至機器采集,本身成本低,內容不唯一,用戶(hù)獲取資源和權限限制——用戶(hù)需要注冊登錄或付費查看,百度搜索引擎將根據具體情況決定是否調整其呈現方式。
還有一些視頻和下載資源頁(yè)面。也許自己的資源質(zhì)量還不錯,但是需要安裝很冷門(mén)的插件才能正常訪(fǎng)問(wèn)。例如,如果他們要求安裝“xx大片播放器”,百度搜索引擎就會(huì )懷疑他們有惡意傾向。
3、無(wú)效網(wǎng)頁(yè)
常指網(wǎng)頁(yè)的死鏈接和主要資源故障。百度搜索引擎認為這些頁(yè)面無(wú)法提供有價(jià)值的信息。如果網(wǎng)站上此類(lèi)頁(yè)面過(guò)多,也會(huì )影響百度搜索引擎的收錄和評分。建議站長(cháng)對此類(lèi)網(wǎng)頁(yè)進(jìn)行相應設置,及時(shí)登錄百度站長(cháng)平臺,使用死鏈接提交工具通知百度搜索引擎。
無(wú)效網(wǎng)頁(yè)包括但不限于:
404、403、503等網(wǎng)頁(yè);
程序代碼錯誤頁(yè)面;
打開(kāi)后提示內容被刪除,或者因為內容不存在而跳轉到首頁(yè)的頁(yè)面;
收錄已刪除內容、已刪除視頻頁(yè)面的論壇帖子(主要在 UGC 網(wǎng)站上)
3 互聯(lián)網(wǎng)網(wǎng)頁(yè)資源現狀
根據CNNIC 2014年初發(fā)布的《中國互聯(lián)網(wǎng)發(fā)展狀況統計報告》:截至2013年12月,中國網(wǎng)頁(yè)數量為1500億,同比增長(cháng)22.2% 2012年同期。2013年,中國單個(gè)網(wǎng)站的平均網(wǎng)頁(yè)數和單個(gè)網(wǎng)頁(yè)的平均字節數均保持增長(cháng),可見(jiàn)中國互聯(lián)網(wǎng)上的內容更多豐富:網(wǎng)站的平均頁(yè)數達到4.69萬(wàn),比去年同期增長(cháng)2.3%。
為保證搜索質(zhì)量,提高用戶(hù)滿(mǎn)意度,百度搜索引擎每周都會(huì )進(jìn)行網(wǎng)頁(yè)質(zhì)量抽樣評估。但從過(guò)去一年的評價(jià)數據來(lái)看,我們發(fā)現優(yōu)質(zhì)網(wǎng)頁(yè)的絕對數量很少,幾乎沒(méi)有增加;普通網(wǎng)頁(yè)的比例在下降,相應地,劣質(zhì)網(wǎng)頁(yè)的比例顯著(zhù)增加。截至2014年5月,統計顯示,在百度網(wǎng)絡(luò )搜索發(fā)現的海量網(wǎng)頁(yè)中,只有7.4%是優(yōu)質(zhì)網(wǎng)頁(yè),21%是劣質(zhì)網(wǎng)頁(yè),7個(gè)1. 6%。
百度搜索通過(guò)一系列篩選、識別、分析、賦能等工作,力求將更多優(yōu)質(zhì)網(wǎng)頁(yè)呈現給用戶(hù)。每天,它與數以萬(wàn)計的劣質(zhì)網(wǎng)站作斗爭,涉及數百萬(wàn)個(gè)網(wǎng)頁(yè)??梢詼p少用戶(hù)對劣質(zhì)網(wǎng)頁(yè)的干擾。根據下圖2014年5月網(wǎng)頁(yè)呈現分析數據,當前呈現在用戶(hù)面前的網(wǎng)頁(yè)質(zhì)量分布中,優(yōu)質(zhì)網(wǎng)頁(yè)占比為40%,劣質(zhì)網(wǎng)頁(yè)占比降至11%。雖然這種變化已經(jīng)非常明顯,但百度網(wǎng)搜還是希望與廣大站長(cháng)一起努力,將劣質(zhì)的比例降低到更低的水平。
上述低質(zhì)量網(wǎng)頁(yè)包括低質(zhì)量網(wǎng)頁(yè)和垃圾網(wǎng)頁(yè)。低質(zhì)量網(wǎng)頁(yè)的分布如下圖所示:
從上圖我們可以看出,低質(zhì)量網(wǎng)頁(yè)中最嚴重的問(wèn)題是廣告過(guò)多導致瀏覽體驗不佳,占據了網(wǎng)頁(yè)的主要位置,超出了預期的彈窗,內容為空而短,網(wǎng)頁(yè)需要權限才能獲取資源和過(guò)期。信息也是低質(zhì)量網(wǎng)頁(yè)的重要組成部分。
除低質(zhì)量頁(yè)面外,完全沒(méi)有質(zhì)量的垃圾頁(yè)面問(wèn)題分布如下圖所示:
死鏈接對用戶(hù)、網(wǎng)站 和搜索引擎沒(méi)有任何意義,它們占垃圾郵件的比例最大。二是對用戶(hù)和搜索引擎造成極大傷害的作弊網(wǎng)頁(yè)。大量浪費用戶(hù)時(shí)間的網(wǎng)頁(yè),如無(wú)效資源、未回答的問(wèn)題、不相關(guān)的搜索結果頁(yè)面,并不是搜索引擎想要呈現給用戶(hù)的。
百度搜索引擎給站長(cháng)的4條建議
以上介紹了百度搜索引擎判斷網(wǎng)頁(yè)質(zhì)量的標準。與這些標準相對應,站長(cháng)在實(shí)際工作中應該遵循幾個(gè)原則:
設計網(wǎng)頁(yè)時(shí)要考慮用戶(hù),而不是搜索引擎
永遠把用戶(hù)體驗放在第一位
根據用戶(hù)需求創(chuàng )建內容
多思考如何讓您的 網(wǎng)站 具有獨特的價(jià)值
長(cháng)遠來(lái)看,濫發(fā)廣告弊大于利
及時(shí)刪除低質(zhì)量?jì)热?/p>
不要試圖以任何方式欺騙用戶(hù)和搜索引擎