>定向采集使用教程
優(yōu)采云 發(fā)布時(shí)間: 2022-05-04 14:47功能介紹:
定向采集功能提供兩種模式:
一種是提交一個(gè)網(wǎng)址,用戶(hù)選擇頁(yè)面上的某些位置的鏈接,系統進(jìn)行持續跟蹤,發(fā)現所選區域存在新網(wǎng)址時(shí)進(jìn)行抓取。這種模式叫跟蹤采集,采集任務(wù)添加之后持續跟蹤運行,但只跟蹤一個(gè)單獨頁(yè)面,不支持設置翻頁(yè)。
另一種是提交一個(gè)網(wǎng)址和翻頁(yè)頁(yè)碼,用戶(hù)選擇頁(yè)面上的某些位置的鏈接,系統進(jìn)行抓取,直到把每個(gè)翻頁(yè)上的相同位置鏈接全部抓取完為止。這種模式叫單次采集,系統抓取完所有翻頁(yè)之后就會(huì )停止。
使用方法:
一、進(jìn)入任務(wù)目標管理,點(diǎn)擊定向采集,文章來(lái)源選擇定向采集。
二、點(diǎn)擊下方出現的“跟蹤采集”或“單次采集”按鈕,添加要采集的目標網(wǎng)址和設置閱讀量,注意:目標網(wǎng)址通常是一個(gè)文章列表頁(yè)的網(wǎng)址
如何獲取文章列表頁(yè)網(wǎng)址:參考示例
三、添加完目標網(wǎng)址后,點(diǎn)擊對應的“規則設置”按鈕,在彈出的對話(huà)框中選擇要采集的鏈接。
四、規則設置窗口左上角有操作說(shuō)明按鈕,有重新加載、抓取測試、全部取消和確定保存按鈕。窗口基本操作非常簡(jiǎn)單,在下面顯示的網(wǎng)頁(yè)中隨意移動(dòng)鼠標,選中想要采集的鏈接,然后保存就可以了。
五、所有設置完成后,可以看到每個(gè)定向采集任務(wù)后面的規則設置變成綠色。記得點(diǎn)擊右上角確定按鈕保存欄目設置。