相关性分析是网络分析中常用的分析方法之一。通过分析不同特征或数据之间的关系,找出业务运营中的关键影响因素和驱动因素。并预测业务发展。本文将介绍五种常用的分析方法。在介绍相关性分析之前,需要注意的是相关性不等于因果关系。
Rxy代表样本相关系数,Sxy代表样本协方差,Sx代表x的样本标准差,Sy代表Y的样本标准差..以下是Sx和Sy的Sxy协方差和标准差的计算公式。因为是样本协方差和样本标准差,所以分母为n-1。
Sxy样本协方差计算公式:
这是b1的计算公式。我们通过已知成本X和广告曝光y计算b1的价值。
以上介绍是双变量的单向回归法。如果在Excel中使用回归分析有两个以上的变量,选择自变量和因变量对应的范围。以下是多元回归方程。
5.信息熵和互信息
最后一种相关分析方法是信息熵和互信息。过去,我们一直在分析两组关于消费成本和广告曝光率的数据。实际工作中,影响最终效果的因素可能有很多,不一定都是数值。例如,我们从更高的维度来看以前的数据。广告曝光只是一个过程指标,最终分析和关注的是用户是否购买。影响这一结果的因素不仅仅是消费成本或其他数字指标。可能是某个特征值。比如用户所在城市、用户性别、年龄区间分布、是否首次访问网站等。这些不能用数字来衡量。
衡量这些文本特征值之间相关性的方法是互信息。这样就可以找出哪些特征与最终结果密切相关。下面是我们模拟的一些用户特征和数据。在这些数据中,我们忽略了之前的消费成本和广告曝光数据,只关注特征和地位的关系。
信息熵和互信息的具体计算过程,请参考《决策树分类预测算法原理与实现》一文,文中直接给出了各特征的互信息值和排序结果。经计算,城市与购买状况相关性最高,北京用户购买率较高。
到目前为止,已经介绍了五种相关分析方法,每种方法都有自己的特点。其中图表法最直观,相关系数法可以看出变量之间的成对相关性,回归方程可以细化相关性并生成预测模型,互信息可以度量文本特征之间的相关性。
建议使用国内新一代大数据用户行为分析平台:几个极客,国内前四个支持无埋点、前端埋点、后端埋点、API导入的混合数据采集方式;自动监控网站、APP、applet等渠道分析推广效果,是日益增多的黑客必不可少的互联网数据分析工具。Digital geek支持实时多维分析、漏斗分析、留存分析、路径分析等十种数据分析方法,以及APP数据分析、网站统计、web分析、小程序数据统计、用户画像等应用场景。它是用户行为分析领域第一个应用定量分析和定性分析方法的数据分析产品。基于用户行为的大数据分析智能系统提供会员营销和AB测试两种数据智能产品,使企业快速提高用户转化率和留存率,实现数据驱动增长。
1.《样本相关系数 5种常用的相关分析方法》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《样本相关系数 5种常用的相关分析方法》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/junshi/1559821.html