無(wú)人看管的免費自動(dòng)采集器v3.4.6綠色版本
優(yōu)采云 發(fā)布時(shí)間: 2020-08-08 00:35無(wú)人看管的免費自動(dòng)采集器是可以自動(dòng)采集信息的軟件. 無(wú)需手動(dòng)操作,該軟件也可以稱(chēng)為ET. 該軟件會(huì )在24小時(shí)內自動(dòng)完成采集工作,即使是年度設備也可以運行很長(cháng)時(shí)間. 此外,該軟件不需要繁瑣的安裝步驟,并且支持查看采集目錄和采集的文章. 一般的操作流程是制定計劃->配置采集規則以從目標中獲取信息->配置中間規則->配置違規行為以發(fā)送信息添加到您的網(wǎng)站->自動(dòng)開(kāi)始工作,操作簡(jiǎn)單,只需遵循軟件提示完成. 目前該軟件支持Windows XP簡(jiǎn)體中文版,Windows 2000簡(jiǎn)體中文版,Windows 2003簡(jiǎn)體中文版,Windows Vista簡(jiǎn)體中文版;對于其他語(yǔ)言環(huán)境中的Windows系統,可以使用其中的一些,用戶(hù)可以自己嘗試,開(kāi)發(fā)人員沒(méi)有提供相應的技術(shù)支持,用戶(hù)可以選擇下載.
軟件功能
設置劫持功能代碼
許多地區的電信寬帶用戶(hù)在上網(wǎng)時(shí)將被迫訪(fǎng)問(wèn)信息,用一些代碼替換訪(fǎng)問(wèn)信息,以便用戶(hù)只能通過(guò)代碼中的框架查看他們最初想要訪(fǎng)問(wèn)的網(wǎng)頁(yè). 通常用于顯示電信. 此行為稱(chēng)為劫持瀏覽器. 發(fā)生這種情況時(shí),ET采集的源代碼只能獲取被劫持的代碼,而不能獲取要采集的網(wǎng)頁(yè)的源代碼. 通過(guò)設置這些劫持代碼的特征字符串,ET將嘗試突破劫持來(lái)訪(fǎng)問(wèn)真實(shí)的Web源代碼,并且最多可以重試5次以訪(fǎng)問(wèn)網(wǎng)站.
設置UserAgent
網(wǎng)站使用userAgent來(lái)確定當前用戶(hù)正在使用的瀏覽器,并根據該瀏覽器可以支持的情況提供相應的功能. 當瀏覽器訪(fǎng)問(wèn)網(wǎng)頁(yè)時(shí),通常會(huì )發(fā)送一個(gè)標識字符串來(lái)告訴網(wǎng)站它是什么瀏覽器軟件. 我們訪(fǎng)問(wèn)的某些網(wǎng)站將限制UserAgent. 我們可以在基本設置中修改UserAgent,或者單擊“獲取此計算機”. UserAgent按鈕獲取本地IE默認的UserAgent.
自動(dòng)工作
選擇要執行的工作計劃后,單擊主窗口左下方的自動(dòng)按鈕以開(kāi)始全自動(dòng)工作. 從那時(shí)起,用戶(hù)可以扔掉鼠標和鍵盤(pán),放下煩人的網(wǎng)站更新,并和朋友一起出去玩. Traveling,網(wǎng)站內容具有自己的ET,可以為您靜默采集更新.
處理文章
在商品列表區域中有要處理的商品時(shí),單擊主窗口左下方的“處理商品”按鈕,將按順序采集在商品列表區域中要處理的第一條商品. 在文章列表區域中雙擊,無(wú)論該文章是否已處理,都將為該文章采集一個(gè)文章條目.
工作記錄
此列記錄ET的每個(gè)步驟的工作過(guò)程和狀態(tài),包括兩部分: 目錄采集和文章處理. 通過(guò)工作記錄,我們可以知道采集是否正確完成或發(fā)生了什么問(wèn)題;當出現問(wèn)題時(shí),根據提示,結合信息欄中的其他反饋內容,用戶(hù)可以快速,準確地找到故障原因并解決.
采集源代碼
此列顯示執行期間采集的文章列表頁(yè)面,文章頁(yè)面,文章分頁(yè)等的源代碼. 此列的源代碼可用于促進(jìn)規則測試,并為規則定制提供基礎.
分析數據
此列顯示文章處理中每個(gè)數據項的信息,從分析的原創(chuàng )代碼到排序的代碼,再到URL校正后的代碼,用戶(hù)可以通過(guò)查看此列來(lái)了解設置的數據項. 規則是否正確,歸類(lèi)組規則是否完整以及最終信息是否滿(mǎn)足您的要求. 例如: 當工作記錄列提示錯誤“正數大于或小于發(fā)布設置”時(shí),我們可以檢查此列中的“正文”數據項以了解其是否大于或小于是否是發(fā)布設置,無(wú)論是正常原因還是組織組設置不正確. 要調整每個(gè)設置.
發(fā)送代碼
此列顯示ET發(fā)送到發(fā)布網(wǎng)站的數據,包括文章審閱部分和文章發(fā)布部分;用戶(hù)可以使用此列中的信息通過(guò)一系列分析和排序操作來(lái)了解最終提交給發(fā)布網(wǎng)站的數據,以檢查自己采集規則的數據項和發(fā)布規則的參數設置是否正確和完整.
退貨信息
此列顯示了ET將數據發(fā)送到發(fā)布網(wǎng)站后網(wǎng)站的反饋,包括文章評論反饋和文章發(fā)布反饋;通過(guò)查看此列,我們可以清楚地了解采集過(guò)程中出現問(wèn)題的大多數原因. 當某些接口返回錯誤信息時(shí),該信息可能是HTML代碼. 不熟悉HTML代碼的用戶(hù)很難閱讀. 單擊WEB瀏覽按鈕可在操作系統的默認瀏覽器中方便地查看它們.
步驟標記
單擊[Step]按鈕將標記插入規則或將所選字符串替換為標記. 標記代碼是一個(gè)可選項目,代表URL中定期更改的數字字符串. [step]標簽可以在自動(dòng)列表網(wǎng)址規則中使用,并且可以多次使用
子循環(huán)標簽
單擊[子循環(huán)]按鈕以將標記插入規則或將所選字符串替換為標記. 標記代碼是可選的,它表示在URL中定期更改的數字字符串. [Step]標記每個(gè)步驟,[Sub-loop]標記一個(gè)循環(huán),即嵌套循環(huán);當只有一個(gè)自動(dòng)列表規則時(shí)使用[sub-loop]標簽時(shí),它等效于[step]標簽; [sub-loop]標簽在自動(dòng)列表URL規則中只能使用一次.
軟件功能
該軟件沒(méi)有第三方惡意插件,病毒*敏*感*詞*木馬和其他對計算機有害的信息
支持無(wú)人值守,自動(dòng)完成采集操作
自動(dòng)操作時(shí)間長(cháng),24小時(shí)不間斷采集工作
該軟件具有良好的穩定性和性能,在沒(méi)有特殊情況下不會(huì )被丟棄.
下載文件和文章的速度很快
支持偽原創(chuàng )功能,您可以將別人的東西轉換成自己的東西
可以支持將任何信息采集到軟件中
支持導出或導入信息
安裝方法
不需要安裝此軟件. 找到下載的壓縮包并解壓縮,然后雙擊“ 優(yōu)采云采集器 3.exe”應用程序以進(jìn)入軟件界面.
使用方法
從列表中采集縮略圖
1. 在系統導航欄中找到集合配置功能,單擊進(jìn)入相關(guān)界面,然后在選擇列表中進(jìn)行設置.
2. 找到列表分析規則后,單擊頁(yè)面地址,然后選擇縮略圖. 添加后,您將獲得如圖所示的代碼.
3. 然后在[縮略圖數據項]中設置其相關(guān)參數. 請注意,當[縮略圖數據項]中的采集規則留為空白時(shí),數據項的值就是[縮略圖標記](méi)的采集結果.
4. 將鼠標滑動(dòng)到頁(yè)面底部,因為我們采集的縮略圖通常是圖片的地址,因此請選中“文件”選項中的“ [作為文件URL]”.
5. 單擊要下載的文件,然后在啟用下載之前勾選選項框.
6. 最后,必須使用發(fā)布配置的發(fā)布項目窗口中的數據項標記來(lái)分配網(wǎng)站的縮略圖參數才能生效.
7. ET3支持多層列表. 在多層列表中使用[縮略圖標記](méi),最后一次使用[縮略圖標記](méi)的采集結果將用作[縮略圖數據項]的值.
常見(jiàn)問(wèn)題
同名標簽在ET3多層列表中的用法
在新的ET3多層列表中,每個(gè)列表頁(yè)面的列表分析規則具有相同的名稱(chēng),可以稱(chēng)為“文章標題”,“縮略圖”,“附加信息”和其他標簽,然后是每個(gè)列表頁(yè)面這些同名標簽之間的關(guān)系是什么,以及如何使用它們.
一個(gè),同一列表頁(yè)面的標簽
與單列表頁(yè)面一樣,可以在URL綜合中調用從頁(yè)面列表分析獲得的[頁(yè)面地址]和[附加信息].
兩個(gè),在不同列表頁(yè)面上具有相同名稱(chēng)的標簽
1,[文章標題]
從多個(gè)列表頁(yè)面獲得的[文章標題]在刪除第一個(gè)和最后一個(gè)空白字符后,將從上到下合并,并用空格分隔.
合并的內容將用作“列表數據文章標題”,在采集目錄時(shí)將顯示該內容,并可在數據排序中調出該內容.
如果未在數據項中設置“標題”數據項的采集規則,它將用作“標題”數據項的值.
2,[縮略圖]
如果有多個(gè)帶有[thumbnail]標記的列表頁(yè)面,則只有上次獲得的[thumbnail]才有效.
它將用作“列表數據縮略圖”,可用于數據排序.
如果“縮略圖”數據項未設置任何采集規則,它將用作“縮略圖”數據項的值.
3,[附加信息]
[附加信息]具有三個(gè)標簽,用法相同.
如果使用[附加信息]]標簽有多個(gè)列表頁(yè),則只有上次獲得的[附加信息]]有效.
它將用作“列表數據附加信息”,可在數據排序中調用.
從版本3.1.7開(kāi)始,如果列表分析規則中未使用[附加信息]標簽,但URL合成中使用了[附加信息]標簽,則該標簽的值將調用相同的上方列表頁(yè)面中的名稱(chēng)[其他信息]標簽的值,即上方列表頁(yè)面中具有相同名稱(chēng)的最后一個(gè)有效標簽的值.
為什么不能在發(fā)布配置的檢查URL中調用數據項
在發(fā)布配置的檢查URL欄中,只有一個(gè)[文章標題]按鈕,并且其他數據項的值無(wú)法在此處調用.
由于在使用檢查URL進(jìn)行商品重復檢查時(shí)ET尚未執行數據項的采集,因此自然無(wú)法調用數據項的值. 這是一種提高效率并節省時(shí)間的設計.
如果在采集所有數據項之后執行文章重復檢查,那么當重復文章時(shí),以前的所有工作將無(wú)用,從而造成極大的浪費.
當用戶(hù)有多個(gè)數據項值來(lái)參與重復檢查的需要時(shí),可以將文章重復檢查功能添加到發(fā)布界面文件中,并且檢查URL將保留為空白,并且檢查URL將不能用于文章重復檢查.