你上周末如期来了吗?
数据应用学院每个周末都会向大家展示
最高质量和有价值的开放课程,
我们不收任何费用;
为了让更多的人知道数据领域真正需要的是什么,
为了让想学数据的同学勇敢的迈出第一步,
为了让已经驰骋赛场的朋友实时了解,
业界最热门的最新知识!
欢迎访问我们的主公开课页面,了解每周公开课
欢迎大家访问我们的Youtube观看您错过的公开课录音
2018年12月1日星期六——你对《时代周刊》了解多少?
时间序列预测简介
也许当你听到时间序列预测时,脑子里唯一想到的就是股价预测。事实上,在行业中,涉及到销售目标、财务规划、库存管理、物流管理、动态定价、营销等,都需要进行时间序列预测。
时间序列预测也渗透到了不同的领域:
金融领域:国内生产总值、各种金融/金融因素
互联网:广告点击,流量监控
营销:销售和促销活动
所属行业:电力负荷、生产线异常检测
生物医学:心电图
时间序列预测的预测区间通常分类如下。
预测间隔:
短期预测:调度、安排生产和运输
中期预测:资源安排,采购原材料/新设备,安排招聘(比如每个月/季度)
长期预测:战略规划。基于环境市场和内部容量规划(例如,每年)
时间序列预测的一般模型如下图所示,当前时间之后t时间内的预测值可以通过一个与过去的观测值和外部环境变量相关的函数来计算。
二.传统时间序列模型
下图是记录历年澳大利亚游客数量的曲线。从图中可以看出,数据是逐年递增的,并且在一年之中有季节性的变化,幅度是逐年递增的。为了预测未来几年的数据,有以下传统的时间序列模型可供选择。在图中,绿色部分是实际值,红色部分是预测值。
简单平均模型
顾名思义,简单平均模型将多年的观测值进行平均,以获得预测值。显然,它的预测值很低,因为它没有考虑到逐年上升的趋势。
滑动平均模型
移动平均和简单平均的区别在于,它不选择所有的观测值进行平均,只选择过去几年的观测值进行平均,所以会更接近实际值。
指数平均模型
指数平均模型比前两种模型更合理。它的思想是,值越接近预测值,就越接近预测值;否则,它就越没有意义。因此,过去的观测值是加权平均的。可见预测值更接近真实值。
霍尔特线性趋势模型
所谓的霍尔特线性趋势模型是在指数平均模型的基础上,加上一个线性趋势,在图中是hbt。Lt是指数平均的结果,h是预测步数,bt是上升斜率,也是加权平均得到的(更接近预测值的两点之间的斜率更有参考价值)。
预测结果如下图所示。我们得到了我们想要的,并为预测值增加了上升趋势。
霍尔特-温特斯季节预测模型
同样,我们可以再次使用指数平滑来增加季节性。霍尔特-温特斯季节模型就是这样产生的,它将不同时期的(yt-lt)指数平滑。
已经预测的很完美了。你有吗
自回归积分移动平均模型
自回归积分移动平均模型是传统时间序列预测模型的另一大类,它认为预测值与过去值之间存在直接的线性关系,并假设它满足一个具有p特征的线性回归模型。如果这样考虑的话,实际上是默认了过去的值之间没有相关性,但事实并非如此,所以要用q阶移动平均来去除相关性,其次要用差值法把季节性趋势抹去,在预测的时候加回来。
然后,总结传统时间序列模型的优缺点:
* * *优势
#线性模型,简单易懂
#仅依靠历史数据
#参数很少,参数的意义很明确
* * *缺点
#很难添加其他功能(价格、产品描述、产品类别)
#很难考虑序列之间的相关性
#难以应用于多个序列(数百万个产品)
#需要人工预缺失值处理
#需要对每个系列进行统计分析,以确定拟合参数。
3.机器学习
时间序列预测的机器学习模型的选择不再是大问题,XGBoost,Lightgbm)已经成为热门选择。
特征工程也是时间序列预测的重要组成部分。共同特征工程需要完成:手动添加季节特征、趋势、滞后特征、类别代码和目标代码。
老师在做时间序列预测时强调了交叉验证和普通机器学习的区别。做时间序列预测,因为有数据生成的顺序,所以不能选择一部分数据进行训练,另一部分进行验证。因此,我们必须选择旧数据进行训练,选择新数据进行验证,如下图所示。第二种方法适用于数据量比较大的时候。fold1验证后,前面的数据被丢弃,后面的数据被交叉验证。
方法一
方法2
是不是觉得满脑子干货,想学点别的?
傻笑
这个周末,我们要么去那里,要么原地踏步!
本周公开课的预习
1.《姨妈周期 除了预测姨妈周期,时间序列还能干嘛?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《姨妈周期 除了预测姨妈周期,时间序列还能干嘛?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/1536397.html