極速下載站 —— 提供優(yōu)質(zhì)軟件下載服務,感受全新的極速下載體驗!

最近更新 | 軟件專題 | 軟件分類 | 軟件排行

您的位置:極速下載站資訊首頁軟件教程電腦軟件教程 → 如何采集腳本顯示商品信息的網(wǎng)頁? ET采集使用教程

如何采集腳本顯示商品信息的網(wǎng)頁? ET采集使用教程

時間:2017-07-01 09:49:02  作者:琪琪  瀏覽量:49

如何采集腳本顯示商品信息的網(wǎng)頁? ET采集使用教程預覽圖

一些網(wǎng)站的內(nèi)容,是用腳本顯示的,以阿里巴巴的商品詳情為例:
當我們從阿里巴巴的商品網(wǎng)頁源代碼中搜索詳細信息時,會發(fā)現(xiàn)網(wǎng)頁源代碼中沒有這些數(shù)據(jù)。這是因為阿里巴巴的商品詳細信息是用AJAX技術(shù)動態(tài)顯示的,也就是通常所說的腳本顯示。因此要獲取詳細信息,只要找到這個包含商品詳細信息的腳本網(wǎng)址即可。

1、獲得腳本網(wǎng)址

直接分析網(wǎng)頁源代碼對于不夠精通HTML語言、JS語言的朋友來說比較困難,因此我們通過一些工具能快速找到這個網(wǎng)址,例如最新IE8/IE9里的開發(fā)人員工具、抓包軟件等都可以。

例如,在IE中,按F12打開開發(fā)人員工具后,點腳本,然后在搜索欄里輸入一句商品詳細信息中的字符串,就可以快速找到這個腳本并獲得它的網(wǎng)址;

(注:使用抓包軟件的獲得網(wǎng)址的方法,請用戶自行百度該軟件教程)

通過工具軟件,我們能快速找到這個腳本網(wǎng)址類似“laputa.china.alibaba.com/offer/ajax/OfferDesc.do?offerId=XXXX&callback=rndXXXX”

圖:采集腳本信息網(wǎng)頁

這個網(wǎng)址有兩個參數(shù),我們只能從商品網(wǎng)頁源代碼中獲得offerid=xxx這一個參數(shù)(最新版ET的采集頁下級頁面分析規(guī)則支持多參數(shù)),所以我們嘗試將第二個參數(shù)callback=rndXXXX去掉來訪問這個網(wǎng)址,但不能獲得正確的內(nèi)容。

然后我們再將這個參數(shù)改為一個固定值,例如callback=rnd1,然后訪問網(wǎng)址“laputa.china.alibaba.com/offer/ajax/OfferDesc.do?offerId=XXXX&callback=rnd1”。

查看結(jié)果,我們獲得了正確的商品信息內(nèi)容。

由此可知,第2個參數(shù)不影響我們采集信息,只需要把它改為隨便一個固定值即可。

2、設置采集配置-采集頁

現(xiàn)在我們使用采集配置-采集頁功能,在內(nèi)容頁中用“下級頁面網(wǎng)址規(guī)則”的頁面地址標記獲得參數(shù)offerId的值,然后在“下級頁面網(wǎng)址合成”中,合成為“laputa.china.alibaba.com/offer/ajax/OfferDesc.do?offerId=<%fileid%>&callback=rnd1”,然后新建一個采集頁“商品詳細信息頁”。

圖:采集腳本信息網(wǎng)頁

3、關(guān)聯(lián)數(shù)據(jù)項

正確設置用于采集商品信息的數(shù)據(jù)項的分析規(guī)則,然后在采集配置-采集頁中將它關(guān)聯(lián)到“商品詳細信息頁”。

圖:采集腳本信息網(wǎng)頁

到此,關(guān)于這個商品詳細信息的相關(guān)設置就已經(jīng)完成。

最后和一般采集規(guī)則做各個相同的設置步驟即可,我們采集如淘寶等其他用腳本顯示內(nèi)容的網(wǎng)頁時都可以使用這種方法。

ET采集 3.4 免費版

ET采集圖片
  • 軟件性質(zhì):國產(chǎn)軟件
  • 授權(quán)方式:免費版
  • 軟件語言:簡體中文
  • 軟件大�。�18097 KB
  • 下載次數(shù):997 次
  • 更新時間:2019/4/3 22:08:02
  • 運行平臺:WinXP,Win7...
  • 軟件描述:ET采集,網(wǎng)站更新必備的采集軟件,無需人工值守,24小時自動實時監(jiān)控目標,實時高... [立即下載]

相關(guān)資訊

相關(guān)軟件

電腦軟件教程排行
最新電腦軟件教程
軟件教程分類

更多常用電腦軟件

更多同類軟件專題