【GooSeeker下载】GooSeeker爬虫 V9.0.3 官方版
软件介绍
GooSeeker是一款网页数据采集浏览器,它具备网络爬虫的特点,用户可以采集网页文字、图标、超链接等多种网页内容。它还具备可视化操作,让被赋予实际意义的页面信息采集更加容易,而且还支持会员互助抓取功能,可让网络社区会员帮你完成采集工作,更加效率。即刻拥有这款工具,立即玩转大数据!
GooSeeker软件特色
【可视化免编程】
全图形化操作界面,可视化操作,无需变成基础,熟悉电脑即可轻松操作,只需在网页上点点鼠标进行操作,即可生成抓取规则,抓取结果即时验证
【模板资源套用】
分享的资源库拥有大量可抓取的模板,均经过官方验证,可直接进行套用,一键抓取即可获得想要的数据
【通用网络爬虫】
支持所有语言抓取,没有地域限制,没有网站类型限制,动态静态网页采集方式都一样
【会员互助抓取】
当需要大批量频繁采集时,在社区以悬赏的方式发布采集任务,接受了任务的会员就会用自己的电脑为任务发布者分担采集任务,实现异地并行抓取
【不限深度和广度】
针对大型网站,通过抓取网页中的超链接,爬虫可以深入到所有层级页面抓取所需数据,并转化为结构化的信息
【抓指数抓图表】
爬虫软件不仅能抓取文本数据、图片、表格,还能模拟鼠标移动并抓取在指数图表上悬浮显示的数据,让整个互联网成为一个数据资料库
【本地化存储保护隐私】
软件在本地电脑上运行,抓取结果文件也存储在本地电脑中,方便数据保护和备份,隐私安全有保障
【自动登陆验证码识别】
软件具有自动登录功能,可以自动登录账号、自动识别并输入验证码,有效防止数据抓取中断,无需人工监视
【定时自启动采集】
软件可以设置周期性自动采集,实现持续的增量数据采集,有利于舆情监控、商品比价和大数据挖掘
【爬虫群并行抓取】
当面临大批量采集任务时,可以在同一台电脑启动多个爬虫,同时采集一个或多个网站的数据;还可以把爬虫分布到不同地点的不同电脑上同时抓取,提高抓取效率
【启动“集搜”多爬虫抓数据】
“集搜”功能能够支持同一台电脑手工启动并行运行多个爬虫窗口,无需编程,只需在DS打数机的操作界面的抓取规则列表上点击”集搜”按钮,就能为该规则启动一个爬虫窗口
【手机网站数据抓取】
爬虫不仅可以抓取PC网站上的数据,还可以抓取手机网站上的数据,全面把握PC端和移动端最新消息资讯
GooSeeker数据抓取过程说明
1、打开DS打数机,在“搜索框”输入所要使用的规则主题名称
2、右击“主题名”,弹出菜单选择“统计线索”,可以看到有多少个线索等待抓取,线索就是网址
3、 点击单搜,DS打数机就开始自动进行数据的抓取工作,并会将结果以XML的格式存储下来
4、 遇到提示“没有线索了,可添加新线索或者激活已有的线索”,说明线索已经采集完一遍了。如果要再次采集,右击“主题名”,选择“线索管理–激活所有线索”;如果要采集其他相同结果的网页,选择“添加”,再把多个网址拷贝进去,就可以“批量采集”了
5、DS打数机中,点击“爬虫群–启动”
6、在“会员中心–规则管理–我的规则” 中,点击“导入数据”,可以直接导入XML数据
7、导出数据,导出成功后,即可下载
GooSeeker常见问题
1、GooSeeker为什么连接不上服务器?
如果以前安装高版本的火狐浏览器,其内部插件会干扰GooSeeker软件所用的较低版本火狐,建议卸载高版本火狐并清理;另外360安全卫生这类防护软件也会组织连接服务器,建议关闭。
2、保存信息结构描述文件失败:not writable?
1)主题名重复了,换个主题名就行
2)“爬虫路线”工作台上,如果有下级线索,也要注意不能与别人重名。都有“查重”按钮,可以检查一下
3、网络爬虫状态错误,无法从FAILED状态启动爬虫?
这个报错是说服务器连接失败,失败的时候显示为红色状态,正常是绿色
安装方法
1、在知识兔下载GooSeeker软件安装包并使用压缩软件进行解压,双击“GooSeekerSetup_V9.0.3.exe”进入软件安装程序向导
2、首先设置安装时的语言,默认就是简体中文,点击“确定”
3、设置自定义的软件安装路径然后点击“下一步”
4、设置开始菜单文件夹的快捷方式然后点击“下一步”
5、选择附加任务然后点击“下一步”
6、准备好之后点击“安装”
7、等待安装过程
8、安装结束之后点击“结束”退出软件安装向导即可
更新日志
1、解决Mac版菜单失灵问题
2、连续打码增强成高仿真输入
3、连续打码处理图片功能增加适应性
下载仅供下载体验和测试学习,不得商用和正当使用。
发表评论