# 👨💻 WorkAggregation
基于数据技术的互联网行业招聘信息聚合系统
本系统以Python为核心,依托web展示,所有功能在网页就可以完成操作,爬虫、分析、可视化、互动独立成模块,互通有无。具体依托python的丰富库实现,爬虫使用Requests爬取,使用lxml、beautifulsoup4解析。使用numpy、pandas分析数据,使用pyecharts做可视化,使用Flask进行web后台建设。数据通过csv、MySQL、配置文件来进行存储互通。
为了拓展功能编写了定时器,微信推送,为了适应团队合作编写了函数注册器,参数迭代器。爬虫数据来自前程无忧、齐鲁人才网、猎聘网、拉勾网等等网站,需要的基本数据一应俱全。
## 觉得不错欢迎给star⭐哦
## 部分网站爬虫可能已无法使用 注意使用时的爬虫选项
## ~~在线demo http://58.87.66.50/~~ 服务器到期
## ToDo
- 缺失爬虫补充
- 改善爬取时UI
## 截图
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123347.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123917.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123715.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123555.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220124101.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123731.png"/>
## 环境
- Windows \ Linux (未测试)
- Python 3.6 : **numpy , pandas , Requests , pyecharts , lxml , PyMySQL**
- MySQL 8.0.11
- Chrome(内核版本60以上)
## 安装
1. 运行 install_package.bat(出错管理员权限下尝试)
2. 修改mysql配置 位于/analysis/analysis_main.py
系统本身有一个可视化的配置文件,即您不需要再导入数据进行分析,如果想重新分析,需要导入数据库数据还需按照数据库字段修改input_data.py内容
3. 将js.7z 解压放在/static 目录下
4. 运行 server.py 来运行web服务器
5. 使用Chrome访问 http://127.0.0.1
### 数据库字段
<img src="https://github.com/xming521/picture/blob/master/db.png"/>
## 架构
系统大致结构如下图,spider目录存放爬虫代码,analysis目录承担了导入、分析、渲染图表、交互等功能,data目录存放原始数据,conf目录存放图表、mysql配置文件。导入处理分析入口统一由analysis_main控制,由server调用,其他功能直接由server调用,所有功能在主页就可以启动。


## 鸣谢
鸣谢 server酱、 pyechart 、腾讯云等的产品或技术支持
没有合适的资源?快使用搜索试试~ 我知道了~
Python基于数据技术的互联网行业招聘信息聚合系统源代码+数据库+使用说明

共75个文件
png:28个
py:14个
html:10个

1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 40 浏览量
2024-08-07
16:59:23
上传
评论
收藏 11.27MB ZIP 举报
温馨提示
基于数据技术的互联网行业招聘信息聚合系统 本系统以Python为核心,依托web展示,所有功能在网页就可以完成操作,爬虫、分析、可视化、互动独立成模块,互通有无。具体依托python的丰富库实现,爬虫使用Requests爬取,使用lxml、beautifulsoup4解析。使用numpy、pandas分析数据,使用pyecharts做可视化,使用Flask进行web后台建设。数据通过csv、MySQL、配置文件来进行存储互通 环境 Windows \ Linux (未测试) Python 3.6 : numpy , pandas , Requests , pyecharts , lxml , PyMySQL MySQL 8.0.11 Chrome(内核版本60以上) 安装 运行 install_package.bat(出错管理员权限下尝试) 修改mysql配置 位于/analysis/analysis_main.py 系统本身有一个可视化的配置文件,即您不需要再导入数据进行分析,如果想重新分析,需要导入数据库数据还需按照数据库字段修改input_data.py内容 将js.7z 解压放
资源推荐
资源详情
资源评论

























收起资源包目录


























































































共 75 条
- 1
资源评论


yanglamei1962

- 粉丝: 3007
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 高级人工智能-5.pptx
- 【河北省】专业技术人员标准化的理论方法与实践试卷4答案.doc
- 工程报验申请表.doc
- 基于STC89C52单片机-红外智能循迹小车(同名9240).doc
- 深度强化学习各算法详解及 Pytorch 实现方法 深度强化学习各类算法介绍与 Pytorch 实现方式 深度强化学习各算法的介绍及 Pytorch 实现详解 深度强化学习不同算法介绍与 Pytorc
- 实验幼儿园儿童园内饮食记录表.doc
- 公司物流服务方案.doc
- 小学英语人称代词表格总结.doc
- 移位指令SFTPPT课件.ppt
- 计量经济学-四元线性回归模型案例分析.doc
- 计算机专业假期社会实践报告范文.docx
- 天天讲安全表格.doc
- 公司信用管理总结.doc
- 民营企业高管绩效考核研究.doc
- 教师网络远程培训心得体会四篇.doc
- 水果拼盘店创业计划书.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
