怎樣使用優(yōu)采云采集指定網(wǎng)站內容?
優(yōu)采云 發(fā)布時(shí)間: 2016-12-18 11:42
? ? 該功能依托于私有詞庫功能。私有詞庫使用教程>>>
? ? 為提高方便性,現私有詞庫已作如下調整:
? ? 1. 每個(gè)欄目至少添加5個(gè)關(guān)鍵詞的限定,現已取消,但仍然建議盡量多設置關(guān)鍵詞,否則越到后期采集效率越低。
? ? 2. 私有詞庫現在提供刪除功能。
? ? 要采集指定網(wǎng)站,只需要在填寫(xiě)關(guān)鍵詞時(shí),在關(guān)鍵詞之前添加"site:www.site.com"這樣的前綴(域名不加http://或https://),就跟使用搜索引擎的site功能一樣。
? ? 如果想要采集目標網(wǎng)站所有內容,則后面不跟關(guān)鍵詞。
? ? 如果想要采集目標網(wǎng)站指定內容,則在site:www.xxx.com后面添加相應關(guān)鍵詞,中間用空格隔開(kāi)。? ?注意:仍然是每行一個(gè)關(guān)鍵詞,site命令只對其所在行的關(guān)鍵詞生效,允許任意混合模式:部分關(guān)鍵詞指定網(wǎng)站,另一部分關(guān)鍵詞不指定,則全網(wǎng)采集。
? ? 其他操作跟就普通私有詞庫一樣。
?
?
? ? 為提高方便性,現私有詞庫已作如下調整:
? ? 1. 每個(gè)欄目至少添加5個(gè)關(guān)鍵詞的限定,現已取消,但仍然建議盡量多設置關(guān)鍵詞,否則越到后期采集效率越低。
? ? 2. 私有詞庫現在提供刪除功能。
? ? 要采集指定網(wǎng)站,只需要在填寫(xiě)關(guān)鍵詞時(shí),在關(guān)鍵詞之前添加"site:www.site.com"這樣的前綴(域名不加http://或https://),就跟使用搜索引擎的site功能一樣。
? ? 如果想要采集目標網(wǎng)站所有內容,則后面不跟關(guān)鍵詞。
? ? 如果想要采集目標網(wǎng)站指定內容,則在site:www.xxx.com后面添加相應關(guān)鍵詞,中間用空格隔開(kāi)。? ?注意:仍然是每行一個(gè)關(guān)鍵詞,site命令只對其所在行的關(guān)鍵詞生效,允許任意混合模式:部分關(guān)鍵詞指定網(wǎng)站,另一部分關(guān)鍵詞不指定,則全網(wǎng)采集。
? ? 其他操作跟就普通私有詞庫一樣。
?
?