最近中文字幕2019高清,亚洲人成高清在线播放,男生淦哭男生图片动漫有字,国产亚洲精品九九久在线观看,无码av专区丝袜专区

頭條號定向采集設置教程

優(yōu)采云 發(fā)布時(shí)間: 2023-09-12 11:10

近日,我們升級了定向采集功能,以支持指定采集某個(gè)頭條號文章,以下是詳細教程(其實(shí)很簡(jiǎn)單?。?br> 
第一節:獲取采集目標網(wǎng)址
首先,我們要找到想要采集的頭條號的文章列表,比如我們從它的某一篇文章頁(yè)面,點(diǎn)擊右邊頭像,進(jìn)入賬號主頁(yè):
 


 


可以看到頁(yè)面有“全部”、“文章”、“視頻”、“微頭條”等標簽,我們目前只支持“文章”和“微頭條”內容的采集,比如現在我們以“文章”為例,點(diǎn)擊“文章”標簽,然后復制瀏覽器地址欄的整個(gè)網(wǎng)址:
 


我們復制到的網(wǎng)址如下:$(document).ready(function() {$('pre code').each(function(i, block) { hljs.highlightBlock( block); }); });

https://www.toutiao.com/c/user/token/MS4wLjABAAAAWOefk69PqM_KvLpX6zGiM4wTmre7pBfKQWbcymKegyM/?tab=article


如果你復制到的網(wǎng)址和這個(gè)不一樣,還有其他參數,沒(méi)關(guān)系,不影響的。
 
第二節:添加定向采集目標
下面我們開(kāi)始設置定向采集。定向采集分兩種,一種叫“跟蹤采集”,用來(lái)持續跟蹤頁(yè)面上的新文章,只要有新文章出現,就采集。另一種叫“單次采集”,通常用于采集某個(gè)文章列表的歷史文章,可以自動(dòng)翻頁(yè)。
如果你是想要做跟蹤采集,只需把上面的網(wǎng)址填到定向采集里面就可以了:
 


如果你是想要采集歷史文章,那就選單次采集,分別填入上面的網(wǎng)址和要采集的頁(yè)碼范圍。注意,頭條號定向采集每頁(yè)網(wǎng)址數是20條,只能從第1頁(yè)開(kāi)始采集,最多采集前100頁(yè)。比如,如果你填的頁(yè)碼范圍是1-10,那么系統采到第10頁(yè)后就停止。如果頁(yè)碼范圍是1-80,那么系統采到第80頁(yè)后停止。而如果你填的頁(yè)碼是101-200,系統還是會(huì )從第1頁(yè)開(kāi)始,然后采到第100頁(yè)結束。
 


添加完以后我們就看到了定向任務(wù)列表:
 


 
第三節:選擇定向采集鏈接,保存任務(wù)
我們點(diǎn)擊任務(wù)右邊的“規則設置”按鈕,在彈出頁(yè)面中選擇需要采集的鏈接。在采集系統運行過(guò)程中,如果頁(yè)面上(包括分頁(yè)上)對應位置有鏈接,系統就會(huì )去采集。通常,你只需要把全部鏈接都選中,然后保存就可以了。
 


 


 
注意事項:頭條號采集需要按順序翻頁(yè),因此在采集歷史文章時(shí),盡量不要把采集需求量設得很大(建議不超過(guò)100篇每小時(shí)),否則系統會(huì )自動(dòng)開(kāi)啟多線(xiàn)程并行采集,從而文章采集失敗率升高。
 
定向采集完整圖文教程在這里

0 個(gè)評論

要回復文章請先登錄注冊


官方客服QQ群

微信人工客服

QQ人工客服


線(xiàn)

最近中文字幕2019高清,亚洲人成高清在线播放,男生淦哭男生图片动漫有字,国产亚洲精品九九久在线观看,无码av专区丝袜专区