內容采集(介紹采集使用優(yōu)采云7.0采集論壇數據的方法采集網(wǎng)站 )
優(yōu)采云 發(fā)布時(shí)間: 2021-10-17 23:04內容采集(介紹采集使用優(yōu)采云7.0采集論壇數據的方法采集網(wǎng)站
)
介紹一下采集優(yōu)采云7.0采集論壇數據采集網(wǎng)站的使用方法:
使用功能點(diǎn):
l 翻頁(yè)設置
l 分頁(yè)信息抽取
新浪體育頻道:新浪體育頻道是全球最大的中文體育資訊頻道,涵蓋全球體育賽事、多媒體,全方位再現*敏*感*詞*體育賽事。新浪體育包括國內足球、國際足球、NBA、綜合體育等重大節目,跟蹤報道來(lái)自世界各地的體育明星和熱門(mén)運動(dòng)隊,在*敏*感*詞*業(yè)界享有盛譽(yù)。
新浪體育論壇采集 資料說(shuō)明:本文來(lái)自新浪體育論壇信息采集。本文僅以“新浪體育論壇資訊采集”為例。在實(shí)際操作過(guò)程中,您可以根據自己的需要更改新浪論壇其他內容的數據。
新浪體育論壇采集字段詳情:帖子標題、帖子作者、帖子發(fā)布時(shí)間、帖子回復、帖子瀏覽量、帖子最后發(fā)帖時(shí)間、帖子最后回復人。
第一步:創(chuàng )建采集task1)進(jìn)入主界面選擇,選擇自定義模式
2) 將上述網(wǎng)址的網(wǎng)址復制粘貼到網(wǎng)站輸入框,點(diǎn)擊“保存網(wǎng)址”
3) 保存URL后,頁(yè)面會(huì )在優(yōu)采云采集器中打開(kāi)。紅框內的評測信息為本次演示的內容。
第 2 步:創(chuàng )建翻頁(yè)循環(huán)
l 找到翻頁(yè)按鈕,設置翻頁(yè)周期
l 設置ajax翻頁(yè)時(shí)間
1) 將頁(yè)面下拉到底部,找到下一頁(yè)按鈕,鼠標點(diǎn)擊,在右側的操作提示框中選擇“更多操作”
2)選擇“循環(huán)點(diǎn)擊單個(gè)鏈接”
第三步:分頁(yè)表單信息采集
l 選擇需要采集的字段信息,創(chuàng )建采集列表
l編輯采集字段名
1) 移動(dòng)鼠標選中表格中的任意空白信息,右鍵單擊,如圖,方框中的數據將被選中并變?yōu)榫G色,點(diǎn)擊上方提示中的“TR”對
2)選中數據當前行的數據將全部選中,點(diǎn)擊“選擇子元素”
3) 在右側操作提示框中勾選提取的字段,刪除不需要的字段,點(diǎn)擊“全選”
4)點(diǎn)擊“采集以下數據”
注意:提示框中的字段會(huì )出現一個(gè)“X”,點(diǎn)擊刪除該字段。
5) 修改采集任務(wù)名稱(chēng)和字段名稱(chēng),在下方提示中點(diǎn)擊“保存并啟動(dòng)采集”
6)根據采集的情況選擇合適的采集方式,這里選擇“啟動(dòng)本地采集”
注意:本地采集占用采集的當前計算機資源,如果采集有時(shí)間要求或當前計算機長(cháng)時(shí)間無(wú)法執行采集你可以使用云采集功能,云采集在網(wǎng)絡(luò )采集中進(jìn)行,不需要當前電腦支持,可以關(guān)閉電腦,可以設置多個(gè)云節點(diǎn)共享任務(wù)。10個(gè)節點(diǎn)相當于10臺電腦分配任務(wù)幫你采集,速度降低到原來(lái)的十分之一;采集收到的數據可以在云端存儲三個(gè)月,隨時(shí)可以導出。第四步:數據采集并導出
1)采集 完成后,選擇合適的導出方式,導出采集的好數據