租房系统进度记录
2017/02/18
开始采集自如的房源数据,当日采集数据1060
2017/04/23
开始采集蘑菇租房的数据
2017/05/01
前端可视化自如的租房数据(已弃用)
2017/05/01
自如房源数据采集范围扩大
2017/05/04
开始采集我爱我家的房源数据
2017/05/05
对自如的房源数据进行多元线性回归建模
2017/06/10
1、租用阿里云服务器
2、三大房源数据统一格式化,迁移数据库
3、采集代码全部重写,迁移到scrapy框架实现采集
4、实现全自动采集
2017/0703
1、采集数据量超过130万
2、阶段性总结前期的工作,确定后续的工作方向
2017/07/06
1、使用flask+bootstrap+jinja+jquery+echarts搭建好api数据采集监控页面。
2017/0707
开发涨跌榜功能,每天更新最新的租房价格涨跌数据,可以进行排序,筛选,查看涨跌幅等
2017/07/08
1、使用blueprint对flask路由拆分,模块结构划分。
2、flask部署到阿里云上flask+nginx+uwsgi+supervisor项目部署
2017/07/09
1、0603的自如数据整合进主库,完成了所有数据的统一存放
2、数据库进行备份
3、开发数据查询api
4、制作首页和建好地图的链接
2017/07/10
开发地图页面第一版,增加价格趋势查询,对数据加载做前后台缓存优化
2017/07/12
增加涨跌走势图
2017/07/15
增加每日平均涨跌
2017/07/20
数据已经准备到位了,为了分析租房价格方面的影响因素,我开始学习《利用Python进行数据分析》这本书,nice,新的挑战开始了。
2017/07/22
网站的端口由80改为了8003,为了避免因网站没有备案被封停
首页 - 租房系统
2017/08/04
1、数据导入本地做分析,开始做分析
2、重构项目目录
2017/08/06
1、网站界面改版,使用flask-login加入登录功能。
未来工作
1、加入搜索功能,支持地铁、区域、价格范围、出租类型、朝向
2、监控提醒功能