Web Data Miner(數(shù)據(jù)提取工具)是一款簡(jiǎn)單好用的數(shù)據(jù)提取工具,可幫助用戶從網(wǎng)站上提取需要的數(shù)據(jù),并將其導(dǎo)出到Excel表格中。軟件支持創(chuàng)建任務(wù),在短時(shí)間內(nèi)即可完成所有頁(yè)面的提取工作,不僅省了去大量的麻煩,同時(shí)也節(jié)省了很多時(shí)間,提高工作的效率,通過是還支持自動(dòng)保存以及自動(dòng)暫停功能,有效避免數(shù)據(jù)丟失,并消除了某些網(wǎng)站被IP地址阻塞的風(fēng)險(xiǎn)。

功能介紹
1、以表格形式從網(wǎng)頁(yè)中提取數(shù)據(jù)。
2、從不同的布局網(wǎng)站提取數(shù)據(jù)。
3、從網(wǎng)頁(yè)中提取文本,html,圖像,鏈接和URL。
4、從外部鏈接和自定義鏈接中提取數(shù)據(jù)。
5、自動(dòng)跟隨頁(yè)面提取數(shù)據(jù)。
6、保存提取的數(shù)據(jù)以消除丟失數(shù)據(jù)的風(fēng)險(xiǎn)。
7、自動(dòng)暫停可防止礦工被某些網(wǎng)站阻止。
8、將收藏的網(wǎng)站列表添加為書簽。
9、用戶可以安排將來的日期和時(shí)間來提取數(shù)據(jù)。
10、將數(shù)據(jù)保存為CSV,TXT格式。
常見問題
1、如何開始記錄配置的過程?
輸入網(wǎng)站URL,然后等待加載瀏覽器。一旦打開了要抓取數(shù)據(jù)的網(wǎng)站,您必須單擊“開始配置”按鈕。
輸入網(wǎng)站URL,然后等待加載瀏覽器。一旦網(wǎng)站為After star配置之后,您必須單擊要從網(wǎng)頁(yè)中刪除的項(xiàng)目。Web Data Miner工具從打開的網(wǎng)頁(yè)中刪除單擊的項(xiàng)目或類似項(xiàng)目。
2、如何從網(wǎng)頁(yè)中選擇要報(bào)廢的數(shù)據(jù)?
Web Data Miner具有良好的功能,可從網(wǎng)頁(yè)中剪貼文本,html,圖像和鏈接,在“捕獲的數(shù)據(jù)工具箱”窗口中,您可以選擇用于剪貼數(shù)據(jù)類型的選項(xiàng)。例如,我們選擇捕獲文本,然后單擊捕獲文本按鈕。
Web Data Miner具有良好的功能,可從網(wǎng)頁(yè)中剪貼文本,html,圖像和鏈接,在“捕獲的數(shù)據(jù)工具箱”窗口中,您可以選擇用于剪貼數(shù)據(jù)類型的選項(xiàng)。例如,我們選擇捕獲文本,然后單擊捕獲文本按鈕。
Web Data Miner會(huì)自動(dòng)識(shí)別相似的項(xiàng)目并添加到給定列名稱中的捕獲數(shù)據(jù)預(yù)覽列表中。通過類似的過程,您可以從網(wǎng)頁(yè)中抓取更多數(shù)據(jù)。
3、如何從下一個(gè)后續(xù)鏈接中提取數(shù)據(jù)?
追蹤連結(jié):
如果要從網(wǎng)頁(yè)中存在的另一個(gè)鏈接中刪除更多數(shù)據(jù),則必須選擇“跟隨鏈接”選項(xiàng)。當(dāng)您單擊“跟隨鏈接”按鈕時(shí),智能數(shù)據(jù)刮板將導(dǎo)航到單擊項(xiàng)目鏈接,并且在頁(yè)面加載后,您可以通過相同的過程從導(dǎo)航頁(yè)面中刮取更多數(shù)據(jù)。
網(wǎng)絡(luò)數(shù)據(jù)挖掘器 網(wǎng)絡(luò)數(shù)據(jù)挖掘器 網(wǎng)絡(luò)數(shù)據(jù)挖掘器 網(wǎng)絡(luò)數(shù)據(jù)挖掘器
停止捕捉:
捕獲后,您只需要停止即可開始挖掘。
4、如何根據(jù)您記錄的配置從網(wǎng)站開始挖掘數(shù)據(jù)?
開始挖掘
通過單擊“開始挖掘”按鈕配置所有數(shù)據(jù)時(shí),可以從WebPages挖掘數(shù)據(jù)。
5、從多個(gè)頁(yè)面報(bào)廢數(shù)據(jù)
要從多個(gè)頁(yè)面抓取數(shù)據(jù),您必須配置“設(shè)置下一頁(yè)鏈接”。 設(shè)置下一頁(yè)鏈接時(shí),您可以允許智能數(shù)據(jù)抓取器從所有要挖掘的頁(yè)面或頁(yè)面數(shù)中挖掘數(shù)據(jù)。
6、如何暫停,停止和保存提取的數(shù)據(jù)?
您可以在采礦時(shí)暫停和停止該過程。挖掘完成后,您可以將挖掘數(shù)據(jù)保存到Excel(.csv)文件或文本文件中。
7、如何從可以是自定義鏈接和鏈接列表的外部鏈接中提取數(shù)據(jù)?
使用外部鏈接
自定義鏈接:在“自定義鏈接”選項(xiàng)中,您可以提供更改字段為數(shù)字的鏈接。它還將有助于從多個(gè)頁(yè)面中抓取數(shù)據(jù)。在此選項(xiàng)中,您將鏈接分為三個(gè)部分。如果包含則在更改字段之前鏈接,更改字段之前更改字段和更改字段之后(最后提交)的字段(如果包含),您還可以設(shè)置要挖掘的頁(yè)面數(shù)。更改字段將以1的增量更改。
鏈接列表:在此列表中,您可以提供許多鏈接或從文本文件中加載包含相似數(shù)據(jù)的鏈接,并且在配置了*個(gè)鏈接后,智能數(shù)據(jù)抓取工具從所有鏈接中挖掘數(shù)據(jù)。
8、如何更改自動(dòng)暫停,自動(dòng)保存和頁(yè)面加載超時(shí)的設(shè)置?
設(shè)定值
自動(dòng)保存礦工數(shù)據(jù):當(dāng)您通過設(shè)置“頁(yè)數(shù)后保存”和“保存位置”允許智能數(shù)據(jù)刮板自動(dòng)保存數(shù)據(jù)時(shí),它將在挖掘時(shí)在給定位置自動(dòng)保存數(shù)據(jù)。
自動(dòng)暫停:您還可以通過設(shè)置給定分鐘后和給定分鐘數(shù)的暫停來設(shè)置自動(dòng)暫停。此設(shè)置可以防止礦工被某些網(wǎng)站阻止。
超時(shí):您還可以設(shè)置網(wǎng)頁(yè)加載的超時(shí)時(shí)間。
9、如何計(jì)劃任務(wù)以使流程自動(dòng)化?
在“計(jì)劃程序”窗口中,您可以看到列表計(jì)劃任務(wù),您可以編輯,刪除,還可以計(jì)劃新任務(wù)。
您可以通過給定的任務(wù)名稱調(diào)度時(shí)間配置文件來調(diào)度新任務(wù)并保存文件。
10、如何為您喜歡的網(wǎng)站添加書簽?
通過使用書簽按鈕,您可以為自己喜歡的網(wǎng)站添加書簽。