【火车采集器下载】火车采集器 v9.8.0 破解版

软件介绍

知识兔

火车采集器是一款非常专业的网页数据采集软件,用户只需要通过简单的配置就能够轻松从网页中获取文字、图片等各种资源。火车采集器与其他同类软件不同的是能够支持远程下载,支持探测文件真实地址,支持代理、防盗等多种功能,强大的PHP和c#加持,用户可以得到任何你想要的文件资源。

火车采集器下载截图

软件特色

知识兔

1、全自动
无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。
2、本地编辑
本地可视化编辑已采集的数据。
3、采集测试
这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。
4、管理方便
使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。
5、支持所有网站编码
完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。
6、多种发布方式
支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。

软件功能

知识兔

1、规则自定义:通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
2、多任务,多线程:可以同时进行多个信息采集任务,每个任务可以使用多个线程。
3、所见即所得:任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。
4、数据保存:数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。
5、断点续采:信息采集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。
6、网站登录:支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。
7、计划任务:通过这个功能可以让你的采集任务定时、定量或者一直循环执行。
8、采集范围限制:可以根据采集的深度和网址的标识来限制采集的范围。
9、文件下载:可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。
10、结果替换:可以将采集的结果根据规则替换成你定义的内容。
11、条件保存:可以根据某个条件来决定那些信息保存,那些信息过滤。
12、过滤重复内容:软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。
13、特殊链接识别:运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来。
14、数据发布:可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件。
15、预留编程接口:定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。 

火车采集器使用教程

知识兔

1、从本网站下载安装,安装完成后打开,选择免费用户,密码可以自己随意输入:123456就可以。点击登录。

第一步
2、进入页面你会看到许多软件自带文件夹,不用管,或者删掉。点击新建右侧倒三角符号,选择新建分组。输入名称点保存即可。

第二步

第二步
3、下方会以文件夹出现你刚刚建立的分组名称。在文件夹上单击鼠标左键选中文件夹。

第三步
4、选中文件件后单击鼠标右键,选择新建任务。会出现如下对话框,随意输入任务名。

第四步
5、点击添加,会出现一个对话框,输入你要采集的网站或网站内某一个栏目的网址。点击右侧添加,下方会出现添加的网址,再点完成。

第五步

第五步

第五步
6、再点击下方的添加,在出的对话框里,会看到必须包含这一项,再把同样的网址输入进去点击保存。

第六步
7、刚刚我们完成的是第一步,选择第二步采集内容规则。如果只是简单的采集内容,可以直接在对话框中选择标题和内容,点击进入填写采集文章的源码。如果不懂源码,你可以随意打开一个网页,按键盘上的F12,下面就会出现页面的源码。

第七步

第七步
8、填写完之后点击确定即可,在右侧的典型页面你可以把要采集的网址输入进去,测试下是否采集到你想要采集的内容。

第八步
9、完成后,选择第三部发布内容,点击下方启用前面的选框,按步骤填写即可。

第九步
10、填完后选择保存,会返回初始页面,选中你刚刚输入的任务名,后面三个框要选中,点击鼠标右键开始任务即可,你想要的内容就会出现在你保存的文件夹内。

第十步

安装方法

知识兔

1、在知识兔下载火车采集器文件
2、解压文件(推荐使用WinRAR)
3、点击exe文件开始安装

下载仅供下载体验和测试学习,不得商用和正当使用。

下载体验

请输入密码查看下载!

如何免费获取密码?

点击下载

标签

发表评论