本文转载自微信微信官方账号Supermath Modeling,版权归原作者和发表媒体所有。
我们从高中开始学习正态分布,现在没有它就做不了数据分析和机器学习。你想过正态分布有什么特别的吗?为什么那么多关于数据科学和机器学习的文章都是围绕正态分布展开的?本文作者专门写了一篇文章,试图用通俗易懂的方式阐明正态分布的概念。
钟形曲线的平均值为100,标准偏差为1。
平均值是曲线的中心。这是曲线的最高点,因为大多数点都在平均值附近;曲线两侧点的数量是相等的。曲线中心的点数量最多;曲线下的面积是变量能取的所有值的概率和;因此曲线下面的总面积为 100%。x之前可能服从一个未知分布,但是归一化之后的z服从正态分布。嗯,这就是批量归一化或者其他归一化的优点。
2.Box-cox变换
可以使用Python的SciPy包将数据转换成正态分布:
scipy.stats.boxcox
3.约-约布森变换
此外,你还可以使用强大的约-约翰逊变换。Python的科学工具包学习提供了适当的功能:
sklearn . preparation . power transformer
最后,非常重要的一点是,不做任何分析就假设变量服从正态分布是不明智的。
以遵循泊松分布、学生t分布或二项式分布的样本为例,如果错误地假设变量服从正态分布,可能会得到错误的结果。
1.《正态分布概率计算公式 最接近神的数学公式—正态分布》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《正态分布概率计算公式 最接近神的数学公式—正态分布》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/fangchan/1687661.html