个人技术分享

CrawlSpace爬虫部署框架介绍

全新的爬虫部署框架,为了适应工作的爬虫部署的使用,需要自己开发一个在线编写爬虫及部署爬虫的框架,框架采用的是Django2.2+bootstap依赖scrapyd开发的全新通用爬虫在线编辑部署及scrapy项目的部署框架。项目实现的五大块的功能及许多在维护爬虫的过程中用的许多实用的操作功能。

首页通用爬虫的模块编写采集全站的数据:

alt 爬虫项目的运行列表

alt 日志结果查看

alt 定时任务列表

alt 任务配置查看

alt 主机信息列表

alt 主机创建

alt 项目打包及部署

alt 项目调度

alt scrapy项目在线编辑

alt 节点可视化监控,支持在线检测主机状态并提示功能

alt

通用爬虫月度数据源可视化统计

alt

alt 以上就是crawlspace的现有功能,相比其他的部署,这个部署框架更加的便于维护爬虫项目,操作更加灵活方便,交互更加便捷舒适,功能更加完善,信息的显示更加清晰,同时支持手机端在线操作!

本文由 mdnice 多平台发布