您的位置:首页 电脑软件 WebHarvy
WebHarvy

WebHarvy

功能强大的网络爬虫软件,支持多种数据抓取和解析方式

安全无毒

版  本:5.2.0.155

软件大小:58.17 KB

授权类型:国产

收费类型:免费

软件语言:简体中文

应用平台:WinAll

更新时间:2024-01-15

WebHarvy是一款强大而易于使用的网络数据提取工具,可让用户从各类网站中轻松地抓取和提取有用的数据,无需编写复杂的脚本或代码,只需简单的点击和拖拽操作,就能够自定义提取规则和数据字段,实现自动化的数据采集和导出,不论是采集产品价格、评论、联系信息还是新闻文章等,WebHarvy都能快速而准确地提取所需数据,并以多种常见格式(如CSV、Excel等)进行导出,方便后续分析、处理和利用。

功能列表

智能识别模式

WebHarvy自动识别网页中出现的数据模式。如果你需要从一个网页刮项目(姓名,地址,电子邮件,价格等)的列表,你不需要做任何额外的配置。如果数据重复,WebHarvy会自动刮。

导出捕获的数据

可以保存从各种格式的网页中提取的数据。 WebHarvy网站刮板的当前版本允许你导出的刮数据作为XML,CSV,JSON或TSV文件。您还可以刮下数据导出到一个SQL数据库。

从多个页面提取

通常网页显示数据,如在多个页面中的产品目录。 WebHarvy可以自动抓取并从多个网页中提取数据。只是指出了“链接到下一页'和WebHarvy网站刮板将自动刮从所有页面的数据。

直观化的操作界面

WebHarvy官方版是一个可视化的网页提取工具。其实完全没有必要编写任何脚本或代码用来提取数据。使用webharvy的内置浏览器浏览网页。选择用鼠标点击来提取数据。它是那么容易!

基于关键字的提取

基于关键字的提取可让您捕捉从搜索结果页面输入关键字的列表数据。您创建的配置将被自动重复所有给定输入关键字,而挖掘的数据。可以指定任意数量的输入关键字

提取分类

WebHarvy网站刮板允许您从一个链接列表,从而导致一个网站内的相似页面抽取数据。这使您可以使用一个单一的配置刮网站内的类别或小节。

使用正则表达式提取

WebHarvy可以应用正则表达式(正则表达式)在文本或网页的HTML源代码,并提取去匹配的部分。这种强大的技术为您提供了更多的灵活性,同时拼抢的数据。

WebHarvy

软件特色

1、WebHarvy自动检索网页中产生的数据方式。因而,假如您必须从网页上刮除新项目列表(名字,详细地址,电子邮箱,价钱等),不用实行一切别的配备。假如数据反复,WebHarvy会全自动删掉它

2、WebHarvy可以应用正则表达式(正则表达式)在文本或网页的HTML源代码,并提取去匹配的部分。这种强大的技术为您提供了更多的灵活性,同时拼抢的数据

3、通常网页显示数据,如在多个页面中的产品目录。 WebHarvy可以自动抓取并从多个网页中提取数据。只是指出了“链接到下一页'和WebHarvy网站刮板将自动刮从所有页面的数据

4、您能够以多种多样文件格式储存从网页中提取的数据。WebHarvy Web Scraper的当今版本号容许您将爬取的数据导出来为Excel,XML,CSV,JSON或TSV文档。您还可以将爬取的数据导出来到SQL数据库

5、WebHarvy自动识别网页中出现的数据模式。如果你需要从一个网页刮项目(姓名,地址,电子邮件,价格等)的列表,你不需要做任何额外的配置。如果数据重复,WebHarvy会自动刮

6、通常,网页在多个页面上显示产品列表等数据。WebHarvy可以自动抓取并从多个页面提取数据。只需指出“链接到下一页”,WebHarvy Web Scraper就会自动从所有页面中抓取数据

更新历史

WebHarvy 最新版 5.2.0.155

修复了页面启动的时候可能导致禁用连接

可以对页面模式配置专属的连接方式

可以自动搜索HTML上可以配置的资源

增加了键盘向下滚动下一页的功能

增加了通过Java脚本加载下一页。

添加了URL配置的功能

可以将关键字输入一个列表上2搜索

下载地址

电脑下载地址