当前位置:首页 > 科技数码

关于csdn官网我想说Python 分析国庆热门旅游景点,告诉你哪些地方好玩、便宜、人又少

作家|裸睡的猪

书篇|屠敏

2019年国庆节快到了。

今年订购新的设计吧。

游戏肯定会去玩。

不然怎么庆祝祖国的生日?

那去哪里玩呢?人少也高吗?

我们不是程序员啊。

然后使用数据分析,

看看值得去的地方!

目标

请使用Python分析一下国庆节的哪些景点。有趣、便宜、人少的地方。否则,要拍照就得赶紧拍!

带来数据

因为要进行数据分析,首先要获取数据,所以一开始在一些官方网站上查找了旅行信息。毕竟官方数据可信度很高,但是我什么都没得到,有点失望!

然后再找其他的替代方案。也就是说,去掉登网站的景区售票数据,还可以反映景区的热度!

笔者首先想到“去哪里”,这里一定是安利要去哪里,同一个酒店同一个房间,去的地方价格基本最低,所以笔者也用得最多!

选择学习对象就开始吧!

注:本教程仅用于学习通信,请勿用于商业用途!

1.单页数据爬网

我们可以在哪里的门票页面()搜索:* *国庆旅游景点* * * *、*名称、地区、热量、销售、价格、等级、地理信息等推荐景点的信息。应该说信息比较完整。良心!

然后按F12键打开浏览器调试窗口,查找加载数据的URL(翻页时显示)。

直接返回Json数据真的很方便。

最后,您可以使用requests库创建get请求。

这样一页数据被抓住了,不是很简单吗?

下到这里,从门票页面收集数据很简单。不需要登录,不需要代理,甚至没有header也能成功。之后批次截图页面没有限制,比淘宝简单多了!

2.提取有效信息

现在得到了数据,请查看数据结构,提取所需的属性。

这里猪哥提取了id、名字、星星、分数、门票价格、销售额、地区、坐标、介绍等信息,基本有效信息都保存下来了!

3.保存到excel中

提取所需数据后,可以保存。其中,我们使用pandas库存储excel文件。

没有安装Pandas库的学生将安装以下内容:

Pip install xlrd

Pip install openpyxl

Pip install numpy

Pip install pandas

这里完成了一页数据处理。爬,分析,保存第三阶段~

4.大量攀爬

大量攀登也很简单。您可以先找到页面数据,再单击页面数几次,比较不同的参数。

过了一会儿,我们可以看到page参数是页面参数。因此,我们可以在外部写for循环,传递页数,进行大量攀登。

那36是我在主页上看到的。当然,可以实现自动判断是否完成。每次判断返回的助手就可以了!

看看大规模攀登的效果。

分析资料

数据都下载完毕后,要想办法分析这些数据。猪哥哥简单地做了几个分析。

旅游地门票销售排名分析

旅游地门票销售排名分析

各省各等级旅游地数量分析。

旅游目的地销售量热力分析。

推荐旅游地分析

我们使用的可视化库仍然是:pyecharts库,更多的维度分析等着你思考~

1.旅游地门票销售排名分析

首先,我来分析一下旅游景点门票销售排名。

我们制作了透视表,并根据销售量排序!最后,生成直方图,一起看效果。

我们可以看到迪士尼门票销量排名第一

2.旅游目的地销售排名分析

销售额=单价*销售额,通过将每行的价格与销售额相乘来计算销售额。

我们将获得的销售数据放回df中,然后重新排序。

迪士尼真的很吸金!

3.各省各等级旅游地数量分析

由于时间原因,这项分析尚未完成。我想分析一下各省各等级景点的数量,但由于时间原因,还没有完成,所以感兴趣的学生可以下载源代码,亲自试用。课后作业巴巴~

4.旅游地销售热力分析

以前也积累了很多热力,都是使用的FIHART库。今天我们有点不同。我们打算利用百度地图开放API(免费)来制造热力。你首先要做的是申请百度地图开放平台的应用程序。操作很简单。怎么样直接申请百度或者看看这篇文章。

需要注意的是,申请应用程序时,类型必须选择浏览器。

然后,您可以下载百度的热力demo的html,在html中将AK代码替换为自己的。

如果换Ak代码,就要换JSON数据,我们老师会制作和基本数据格式相同的JSON数据,然后再换一次。

最后,可以仔细观察效果栏、动态地图支持扩大缩小、各省、市、区旅游地热力

5.推荐旅游地分析

我应该推荐什么景点?笔者认为,高评分,销售量少,价格便宜。

推荐系数和分数成正比,与销售量、价格成反比,所以笔者设计了最简单的算法。

盲推荐系数=分数/(售价)* 1000

看看这个简单推荐算法的结果。

可以看出,这个盲人推荐TOP20中国外景点很多(尤其是日本)。国内国庆节来的地方其实人挺多的!

如果你觉得我设计的推荐算法太low,你可以自己想想怎么让设计更合理,自己调试一下,看看其他结果。

源地址:欢迎明星。

声明:本文投稿于“裸猪”公众号(ID: IT-PIG)。著作权归作者所有。

[结尾]

CSDN博客诚心入驻了!

通过共享、协作、开源、技术的道路,我们有共同进步的规范。

如果技术足够干燥,内容牢固,共享足够积极,

欢迎来到CSDN大家庭!

1.《关于csdn官网我想说Python 分析国庆热门旅游景点,告诉你哪些地方好玩、便宜、人又少》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《关于csdn官网我想说Python 分析国庆热门旅游景点,告诉你哪些地方好玩、便宜、人又少》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/1953663.html

上一篇

关于cn域名个人注册我想说个人或企业如何注册域名

下一篇

关于gmail网络电话我想说见到这2人,请立即报警!举报有奖

关于csdn官网我想说V 语言强势登顶 GitHub TOP1,欲取 Go 而代之?

  • 关于csdn官网我想说V 语言强势登顶 GitHub TOP1,欲取 Go 而代之?
  • 关于csdn官网我想说V 语言强势登顶 GitHub TOP1,欲取 Go 而代之?
  • 关于csdn官网我想说V 语言强势登顶 GitHub TOP1,欲取 Go 而代之?

关于csdn官网我想说iOS App研发的最后冲刺:内测与部署

  • 关于csdn官网我想说iOS App研发的最后冲刺:内测与部署
  • 关于csdn官网我想说iOS App研发的最后冲刺:内测与部署
  • 关于csdn官网我想说iOS App研发的最后冲刺:内测与部署
关于csdn官网我想说没有十全十美的技术!携程事件之后,技术专家们的建议与反思

关于csdn官网我想说没有十全十美的技术!携程事件之后,技术专家们的建议与反思

csdn官网相关介绍,[按编辑]行车停机事件留给了业界无数的反思。当局起初说:“部分服务器受到未知攻击”,但由于“紧急恢复”推迟,5月29日凌晨恢复服务后,“是工作人员的错误操作造成的”。网上流传着数据库数据和备份数据被物...

关于csdn官网我想说Spark性能调优

  • 关于csdn官网我想说Spark性能调优
  • 关于csdn官网我想说Spark性能调优
  • 关于csdn官网我想说Spark性能调优

关于csdn官网我想说放弃使用 15 年的 macOS,我决定换成 Linux

  • 关于csdn官网我想说放弃使用 15 年的 macOS,我决定换成 Linux
  • 关于csdn官网我想说放弃使用 15 年的 macOS,我决定换成 Linux
  • 关于csdn官网我想说放弃使用 15 年的 macOS,我决定换成 Linux

关于csdn官网我想说腾讯应届生年薪40万起步;苹果今晚或将发布“刘海屏”MacBook Pro|极客头条

  • 关于csdn官网我想说腾讯应届生年薪40万起步;苹果今晚或将发布“刘海屏”MacBook Pro|极客头条
  • 关于csdn官网我想说腾讯应届生年薪40万起步;苹果今晚或将发布“刘海屏”MacBook Pro|极客头条
  • 关于csdn官网我想说腾讯应届生年薪40万起步;苹果今晚或将发布“刘海屏”MacBook Pro|极客头条

关于csdn官网我想说程序员必备的12个网站,你知道多少?

  • 关于csdn官网我想说程序员必备的12个网站,你知道多少?
  • 关于csdn官网我想说程序员必备的12个网站,你知道多少?
  • 关于csdn官网我想说程序员必备的12个网站,你知道多少?

关于csdn官网我想说360 回应安全云盘出现交易异常;苹果官网陆续限购 iPhone;GitHub 屏蔽微软工程师的开源项目 | 极客头条

  • 关于csdn官网我想说360 回应安全云盘出现交易异常;苹果官网陆续限购 iPhone;GitHub 屏蔽微软工程师的开源项目 | 极客头条
  • 关于csdn官网我想说360 回应安全云盘出现交易异常;苹果官网陆续限购 iPhone;GitHub 屏蔽微软工程师的开源项目 | 极客头条
  • 关于csdn官网我想说360 回应安全云盘出现交易异常;苹果官网陆续限购 iPhone;GitHub 屏蔽微软工程师的开源项目 | 极客头条