水淼萬能文章采集器是一款簡單易用的文章采集工具,用戶只需要輸入關鍵詞就能夠快速采集主要搜索引擎的新聞源和泛網頁。本款網站文章采集器不僅具有采集速度快、操作簡單的特點,它還可以精確提取網頁里的正文部分保存為文章,并且支持去標簽、鏈接、郵箱等格式化處理。
水淼軟件出品的一款基于高精度正文識別算法的互聯網文章采集器。支持按關鍵詞采集各大搜索引擎的新聞和網頁,還支持采集指定網站欄目下的全部文章;谒底灾餮邪l(fā)的正文識別智能算法,能在互聯網紛繁復雜的網頁中盡可能準確地提取出正文內容。
正文識別有 3 種算法,“標準”、“嚴格”和“精確標簽”。其中“標準”和“嚴格”是自動模式,能適應絕大多數網頁的正文提取,而“精確標簽”只需指定正文標簽頭,如“<div class="text">”,就能通吃所有網頁的正文提取。
關鍵詞采集目前支持的搜索引擎有:百度、搜狗、360、谷歌、必應、雅虎
采集指定網站文章的功能也非常簡單,只需要稍微設置(不需要復雜的規(guī)則),就能批量采集目標網站的文章了。
因為墻的問題,要使用谷歌搜索和谷歌轉譯文章的功能,需要使用VPN換國外IP。
內置文章轉譯功能,也就是可以將文章從一種語言如中文轉到另一種語言如英文,再從英文轉回中文。
采集文章+翻譯偽原創(chuàng)可以滿足廣大站長朋友們在各領域主題的文章需求。
而一些公關處理、信息調查公司所需的由專業(yè)公司開發(fā)的信息采集系統,售價往往達到上萬甚至更多,而水淼的這款軟件也是一款信息采集系統,功能跟市面上昂貴售價的軟件有相通之處,但價格只有區(qū)區(qū)幾百元,性價比如何試試就知。
功能特點
一、依托于水淼軟件獨家萬能正文識別智能算法,可實現任何網頁正文自動提取準確率95%以上。
二、只需輸入關鍵詞,就能采集到百度新聞和網頁、搜狗新聞和網頁、360新聞和網頁、谷歌新聞和網頁、必應新聞和網頁、雅虎;可批量關鍵詞全自動采集。
三、可定向采集指定網站欄目列表下的所有文章,智能化匹配,無需編寫復雜規(guī)則。
四、文章轉譯功能,可對采集好的文章,將其翻譯到英文再翻譯回中文,實現翻譯偽原創(chuàng),支持谷歌和有道翻譯。
五、史上比較簡單比較智能文章采集器,支持全功能試用,效果如何一試就知!
更新日志
修復百度網頁搜索時間設置失效問題并取消百度新聞時間設置(已不支持);微信采集時增加正文比較少字數的設置支持(原先只有自動識別的可以設置字數,而微信是內置精確標簽的所以不能設置字數,現在可以了);文章查看切換顯示時增加自動刷新目錄樹;關鍵詞采集正文字數不足時補充提示設置的字數值。
文件信息
文件大。2465792 字節(jié)
文件說明:萬能文章采集器
文件版本:3.0.1.0
MD5:B6D60E618EB79DBEE6449FD26A0C362A
SHA1:338A8CBE74E769368127EF06FEF5B508A82E5B3B
CRC32:25314E18
包含文件
gzip.dll
shuimiao.rc
分頁最大值.txt
水淼·萬能文章采集器.exe-
優(yōu)先標題標簽.txt
正文最少字數.txt
指定標題位置.txt
水淼萬能文章采集器是一款好用的全網在線文章搜索采集軟件。我們可以使用水淼萬能文章采集器輸入關鍵詞搜索全網的文章內容,并進行文章內容采集;
極速小編這一次就給大家演示一下怎么使用水淼萬能文章采集器使用關鍵詞搜索在線文章吧。點擊軟件主界面中的關鍵字輸入框,就可以開始輸入關鍵字了;
水淼萬能文章采集器支持同時搜索多個關鍵字,每個關鍵字之間用符號“/”隔開。極速小編輸入了“蘋果/iPhone/ipad”;
接下來我們可以選擇搜索的網頁。我們可以選擇百度網頁、百度新聞、搜狗網頁、搜狗新聞、搜狗微信、360網頁、360新聞、谷歌網頁、谷歌新聞、必應網頁、必應新聞、雅虎、今日頭條、一點資訊。極速小編選擇了百度網頁;
接下來我們可以設置采集的文章的保存路徑。點擊保存目錄右邊的選項按鈕,打開文件夾瀏覽窗口,選擇采集文章保存文件夾;
在文件夾瀏覽窗口中,找到想要用來保存采集得到的文章的文件夾,用鼠標點擊選中文件夾后點擊確定,就可以完成文章保存目錄修改了;
接下來我們就可以開始進行文章采集了。點擊開始采集就可以開始搜索百度網頁中的文章內容;