[花瓣網(wǎng)]花瓣網(wǎng)-采集瀑布流數據的思想的詳細說(shuō)明
優(yōu)采云 發(fā)布時(shí)間: 2020-08-08 14:34瀑布流,也稱(chēng)為瀑布流布局. 這是一種流行的網(wǎng)站頁(yè)面布局.
視覺(jué)外觀(guān)是鋸齒狀的多列布局. 當頁(yè)面滾動(dòng)條向下滾動(dòng)時(shí),此布局將繼續加載數據塊并將其附加到當前尾部.
用戶(hù)快速瀏覽的快速閱讀模式可以在短時(shí)間內獲得更多信息,而瀑布流中的延遲加載模式避免了用戶(hù)單擊鼠標的翻頁(yè)操作.
拼湊而成的,固定寬度而不是固定高度的設計使頁(yè)面與傳統的矩陣圖片布局模式不同,巧妙地使用了視覺(jué)層次結構,任意視線(xiàn)緩解了視覺(jué)疲勞,并給人以折衷主義的感覺(jué).
關(guān)注年輕一代的個(gè)體心理. 因此,此頁(yè)面布局在今天非常流行.
那么如何采集瀑布數據?
今天我們以花瓣網(wǎng)為例向您解釋:
1. 獲取網(wǎng)頁(yè)后,分析網(wǎng)頁(yè)形式,發(fā)現網(wǎng)頁(yè)呈瀑布流形式,需要FIDDLER捕獲后才能獲取真實(shí)地址
將LIMIT參數修改為200,以便采集器可以獲得200個(gè)列表頁(yè)面.
2. 編寫(xiě)URL采集規則
3. 獲取列表頁(yè)面后,設置內容采集規則
商業(yè)版本的功能用于圖像采集,內容帶有前綴和后綴.
注意: 此網(wǎng)頁(yè)使用瀑布流格式,您需要捕獲數據包以獲得真實(shí)地址
FIDDLER數據包捕獲教程
數據包捕獲工具的合作伙伴可以從百度自行下載并安裝它,操作非常簡(jiǎn)單.
聯(lián)系我們
客戶(hù)服務(wù)QQ: 800019423
客戶(hù)服務(wù)電話(huà):
購買(mǎi)軟件: