作家|裸睡的猪
书篇|屠敏
2019年国庆节快到了。
今年订购新的设计吧。
游戏肯定会去玩。
不然怎么庆祝祖国的生日?
那去哪里玩呢?人少也高吗?
我们不是程序员啊。
然后使用数据分析,
看看值得去的地方!
目标
请使用Python分析一下国庆节的哪些景点。有趣、便宜、人少的地方。否则,要拍照就得赶紧拍!
带来数据
因为要进行数据分析,首先要获取数据,所以一开始在一些官方网站上查找了旅行信息。毕竟官方数据可信度很高,但是我什么都没得到,有点失望!
然后再找其他的替代方案。也就是说,去掉登网站的景区售票数据,还可以反映景区的热度!
笔者首先想到“去哪里”,这里一定是安利要去哪里,同一个酒店同一个房间,去的地方价格基本最低,所以笔者也用得最多!
选择学习对象就开始吧!
注:本教程仅用于学习通信,请勿用于商业用途!
1.单页数据爬网
我们可以在哪里的门票页面()搜索:* *国庆旅游景点* * * *、*名称、地区、热量、销售、价格、等级、地理信息等推荐景点的信息。应该说信息比较完整。良心!
然后按F12键打开浏览器调试窗口,查找加载数据的URL(翻页时显示)。
直接返回Json数据真的很方便。
最后,您可以使用requests库创建get请求。
这样一页数据被抓住了,不是很简单吗?
下到这里,从门票页面收集数据很简单。不需要登录,不需要代理,甚至没有header也能成功。之后批次截图页面没有限制,比淘宝简单多了!
2.提取有效信息
现在得到了数据,请查看数据结构,提取所需的属性。
这里猪哥提取了id、名字、星星、分数、门票价格、销售额、地区、坐标、介绍等信息,基本有效信息都保存下来了!
3.保存到excel中
提取所需数据后,可以保存。其中,我们使用pandas库存储excel文件。
没有安装Pandas库的学生将安装以下内容:
Pip install xlrd
Pip install openpyxl
Pip install numpy
Pip install pandas
这里完成了一页数据处理。爬,分析,保存第三阶段~
4.大量攀爬
大量攀登也很简单。您可以先找到页面数据,再单击页面数几次,比较不同的参数。
过了一会儿,我们可以看到page参数是页面参数。因此,我们可以在外部写for循环,传递页数,进行大量攀登。
那36是我在主页上看到的。当然,可以实现自动判断是否完成。每次判断返回的助手就可以了!
看看大规模攀登的效果。
分析资料
数据都下载完毕后,要想办法分析这些数据。猪哥哥简单地做了几个分析。
旅游地门票销售排名分析
旅游地门票销售排名分析
各省各等级旅游地数量分析。
旅游目的地销售量热力分析。
推荐旅游地分析
我们使用的可视化库仍然是:pyecharts库,更多的维度分析等着你思考~
1.旅游地门票销售排名分析
首先,我来分析一下旅游景点门票销售排名。
我们制作了透视表,并根据销售量排序!最后,生成直方图,一起看效果。
我们可以看到迪士尼门票销量排名第一
2.旅游目的地销售排名分析
销售额=单价*销售额,通过将每行的价格与销售额相乘来计算销售额。
我们将获得的销售数据放回df中,然后重新排序。
迪士尼真的很吸金!
3.各省各等级旅游地数量分析
由于时间原因,这项分析尚未完成。我想分析一下各省各等级景点的数量,但由于时间原因,还没有完成,所以感兴趣的学生可以下载源代码,亲自试用。课后作业巴巴~
4.旅游地销售热力分析
以前也积累了很多热力,都是使用的FIHART库。今天我们有点不同。我们打算利用百度地图开放API(免费)来制造热力。你首先要做的是申请百度地图开放平台的应用程序。操作很简单。怎么样直接申请百度或者看看这篇文章。
需要注意的是,申请应用程序时,类型必须选择浏览器。
然后,您可以下载百度的热力demo的html,在html中将AK代码替换为自己的。
如果换Ak代码,就要换JSON数据,我们老师会制作和基本数据格式相同的JSON数据,然后再换一次。
最后,可以仔细观察效果栏、动态地图支持扩大缩小、各省、市、区旅游地热力
5.推荐旅游地分析
我应该推荐什么景点?笔者认为,高评分,销售量少,价格便宜。
推荐系数和分数成正比,与销售量、价格成反比,所以笔者设计了最简单的算法。
盲推荐系数=分数/(售价)* 1000
看看这个简单推荐算法的结果。
可以看出,这个盲人推荐TOP20中国外景点很多(尤其是日本)。国内国庆节来的地方其实人挺多的!
如果你觉得我设计的推荐算法太low,你可以自己想想怎么让设计更合理,自己调试一下,看看其他结果。
源地址:欢迎明星。
声明:本文投稿于“裸猪”公众号(ID: IT-PIG)。著作权归作者所有。
[结尾]
CSDN博客诚心入驻了!
通过共享、协作、开源、技术的道路,我们有共同进步的规范。
如果技术足够干燥,内容牢固,共享足够积极,
欢迎来到CSDN大家庭!
1.《关于csdn官网我想说Python 分析国庆热门旅游景点,告诉你哪些地方好玩、便宜、人又少》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《关于csdn官网我想说Python 分析国庆热门旅游景点,告诉你哪些地方好玩、便宜、人又少》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/1953663.html