Springboot项目RZSpider3.3.8版本发布-网页爬虫后台管理
一.项目介绍此项目建立在开源项目bootdo和若依系统基础上,如有侵权请及时与我联系,其详情请见:https://gitee.com/lcg0124/bootdo.git,https://gitee.com/y_project/RuoYiSpringboot作为基础框架,使用mybatis作为持久层框架,使用官方推荐的thymeleaf做为模板引擎,shiro作为安全框架详情请见:htt...
·
一.项目介绍
- 此项目建立在开源项目bootdo和若依系统基础上,如有侵权请及时与我联系,其详情请见:https://gitee.com/lcg0124/bootdo.git,https://gitee.com/y_project/RuoYi
- Springboot作为基础框架,使用mybatis作为持久层框架,使用官方推荐的thymeleaf做为模板引擎,shiro作为安全框架详情请见:https://github.com/search?utf8=%E2%9C%93&q=springboot&type=
- 在此基础上,添加爬虫目录,工具目录,游戏目录以及聊天系统,添加网址设置等
- 为什么不叫crawler而叫spider,因为喜欢Spider-Man!
- 此项目源码请见:https://github.com/ricozhou/RZSpider3.0
二.使用方式
1.基本功能
2.网页爬虫
- 基本认知:此爬虫系统内置5个已写好爬虫,后台ID分别是10001-10005,请不要随意修改,支持语言JAVA,JAVASCRIPT,PYTHON等,可自定义,但后台安全需要另行配置
- 权限认知:超级管理员和管理员可以定义爬虫类型和添加编写自定义爬虫,普通用户可添加已有的爬虫管理及爬虫任务
- 自定义爬虫:接口已写好,源码资源文件已内置文件流的jar包和源码,以及连接数据库的jar包和源码,自定义爬虫有示例代码,后台编译运行,注意安全
- 爬虫任务:添加爬虫任务可修改默认参数,爬虫管理自带一个默认参数,请根据格式修改内容,可设置任务启动频次
- 启动任务:定时任务和固有频次任务会自动添加至任务详情并启动,只执行一次的任务需设置启动时间并启用任务,每次任务详情ID表示一次任务,对应启动会覆盖原有数据
- 导出数据:数据格式以excel为主,内置爬虫及自定义爬虫可解析则以excel输出,无法解析的则以文本格式输出,下载包括准确任务数据以及未筛选全数据,可选择下载
- 其他认知:内置爬虫使用htmlunit,后台ID段是10001-19999,自定义爬虫后台ID段是20001-29999
3.博客管理
- 基本认知:附带一个博客模块,详见:https://blog.csdn.net/rico_zhou/article/details/83617549
4.图书管理
- 基本认知:此系统属个人系统,未添加借阅管理,可自行添加,支持批量上传,请下载模板以供参考,支持导出excel
5.通用工具
- 基本认知:已内置了几个简单的工具,如二维码生成,解析,计算器,OCR,文本格式化,代码格式化等等,可自定义添加,需修改代码
- 权限认知:超级管理员和管理员可以添加工具,普通员工可添加已有工具并运行和下载
- 添加工具:分为网页版和客户端版工具,网页版可包含客户端,网页版可直接运行,可上传源码,安装包等,但对应文件只能一个
- 启用工具:工具启用都是网页版,下载的源码及安装版等则属于客户端版,但上传文件可自行添加
6.简单游戏
- 与通用工具目录相同,使用同上
7.聊天工具
- 基本认知:尚未完善
8.配置文件
- 基本认知:基本配置详见bootdo和若依系统源码
- 添加配置:主要是文件application.yml的filepath配置
- 详情配置:uploadPath:上传图片文件所在位置,必填。uploadCachePath:缓存文件夹,必填。uploadToolPath:上传工具文件所在位置,必填。 uploadGamePath:上传游戏文件所在位置。customSpiderPath:自定义爬虫文件所在位置,必填。javaCompilerPath:java编译器所在位置(tool.jar目录),选填,不填则默认系统编译器。jreRunPath:java运行环境(jre)所在位置(jre目录),选填,不填则使用系统java环境。后期将简化配置,使用默认文件夹
9.基础设置
- 基础设置包括主题设置,下载管理直链管理,包括登录背景设置,首页介绍,代码包名前缀,示例代码,手册,音乐插件设置等等
- 登录背景可设置内置特效,首页介绍即首页显示内容,代码包名前缀即自定义爬虫代码包名,示例代码即创建自定义爬虫时的默认代码,手册即介绍,音乐插件使用zplayer,鸣谢!
- 下载管理,可自定义下载文件并生成下载外链,设置下载限制次数时间等等
- 直链管理,可自定义音频,视频,图片,zip,html等文件,生成直链,可在线浏览文件内容
- 系统工具有清理缓存功能,会将配置文件下无用文件清除,数据库中自定义爬虫测试数据清除等等
10.注意事项
- 配置文件不要只写盘符,尽量使用不同的文件夹,目录均不添加斜杠“/”“”
- 自定义爬虫是将前台书写的代码传到后台编译运行,需要自行设置服务器安全,或者修改源码
- 系统工具有清理缓存功能,会将配置文件下无用文件清除,因此配置文件的目录一定要慎配
三.联系方式
1.基本方式
- 此项目建立在开源项目bootdo和若依系统基础上,点击链接加入群聊【BootDo交流二群】:614726589【若依交流二群】:1389287 感谢!
- 本人联系方式,QQ:2320095772
- 邮箱,QQ邮箱:2320095772@qq.com
- 博客:http://www.rzspider.top/rzblog
- 在线预览:https://www.rzspider.top 用户名:testadmin 密码:testadmin 开源项目请勿攻击! 谢谢!
四.更新日志
1.v3.3.8 2018年10月26
- 新增博客浏览日志,记录浏览博客的基本信息
- 新增博客概览,对博客网站进行数据统计
- 新增公告管理
- 新增博客搬家功能,目前仅支持CSDN博客搬入
- 新增文章中代码高亮
- 优化博客浏览
- 修复其他若干bug
2.v3.3.2 2018年10月16
- 新增直链管理,可在线查看网页
- 新增专栏图标
- 新增编辑器代码高亮
- 新增文章下载功能
- 调整手机屏幕自适应
- 优化博客浏览
- 修复其他若干bug
3.v3.2.16 2018年10月10
- 新增博客模块
- 新增博客管理,博客设置,文章管理,标签管理,专栏管理等
- 新增博客网站高度自定义
- 新增网站图标网站名称自定义
- 新增网站样式设置,颜色设置,左右侧边栏设置等
- 新增网站图标网站名称自定义
- 修复其他若干bug
4.v3.2.14 2018年9月29
- 新增博客模块
- 新增博客管理,博客设置,文章管理,标签管理,专栏管理等
- 新增博客网站高度自定义
- 新增网站图标网站名称自定义
- 修复其他若干bug
5.v3.2.3 2018年9月10
- 新增下载管理,可生成外链供他人无登录下载
- 新增网站设置,ip,端口,域名等保存
- 新增邮件服务设置,默认发件人等
- 添加自定义爬虫编程前验证项目文件
- 修复其他若干bug
6.v3.2.1 2018年9月5
- 新增音乐搜索添加,搜索网易云音乐添加
- 新增音乐导出JSON
- 更新zbplay音乐插件
- 支持注册成Windows服务
- 添加自定义爬虫对nodejs支持
- 修复其他bug
6.v3.2.0 2018年8月31
- 新增表格搜索框提示功能
- 新增自定义爬虫参数可视化添加
- 新增爬虫自定义参数自动可视化显示
- 新增自定义爬虫字段描述和版本号
- 新增爬虫代码备份,查看及导出
- 新增5个内置爬虫,ID:10003~10007
- 新增爬虫任务数据预览
- 新增工具箱,无需登录
五.图片预览
欢迎交流学习!
更多推荐
已为社区贡献2条内容
所有评论(0)