暨南大学多元统计分析与R语言建模
网站:回复“STAT001”获取
开始时间:2018年5月15日~ 2018年7月15日
随着大数据、云计算和人工智能时代的到来,一门集数学、统计和计算机科学于一体的数据科学正在全球迅速崛起。多元统计分析,简称多元分析,是统计学的一个重要分支,近几十年来也发展迅速。多元统计分析方法已经成为处理多元数据不可缺少的技术和方法,也是大数据分析的重要工具。
课程概述
多元统计分析是以概率统计的数学科学为基础,应用线性代数的基本原理和方法,结合计算机对实际数据和信息进行收集、整理和分析的科学。所以它的原理比较抽象,对学生的数学基础要求也比较高。教学中有大量的数学公式、数学符号、矩阵运算和统计计算,必须依靠现代计算工具。本书基于广泛使用的统计分析软件R语言。
r语言是属于GNU系统的自由、自由、开源的软件。它是统计计算和统计映射的优秀工具。在当前保护知识产权的大环境下,R语言的开发和利用将对我国的统计事业具有重大的现实意义。
这本书是一个关于R的应用教材。由于它主要针对本科生和研究生,这本书侧重于解释R的工作原理和建立其模型。r语言涉及的学科范围很广,学生有必要了解和掌握一些基本概念和原理。R语言的基本统计分析请参考作者撰写的《R语言数据统计分析程序设计》(2014)。打好基础后,深入学习会容易很多。本着用简单的方式解释事物的目的,这本书会配合大量的图表等形式,尽可能使用通俗的语言,让读者在不丢失细节的情况下容易理解。
写这本书的指导思想是:在不失去严谨性的前提下,明显区别于纯数学教材,力求突出实际案例的应用和统计思想的渗透,结合R语言全面系统地介绍多元分析的实用方法。在系统介绍多元分析的基本理论和方法的同时,尽量将多元分析的方法与实际应用相结合,注意定性分析和定量分析的紧密结合,尽量将自己在多元分析应用于实践中的经验和体会进行整合。几乎每种方法都强调自己的优缺点和实际应用中应该注意的问题。为了让读者掌握本书的内容,并考虑到本课程的适用性和实用性,每章都给出一些简单的思路和练习。我们鼓励读者使用一些实际数据来实现这些方法。多元分析的应用离不开计算机,本书中的案例主要是利用迅速崛起的R语言实现的。这本书的一个显著特点是,在每种方法之后,都用实例简要介绍了R语言的实际操作和实现过程。
教学目标
多元统计分析方法涉及复杂的数学理论,计算繁琐。大多数多元统计方法不能用手工计算,必须有计算机和统计软件的支持,所以不可能用书面形式一步一步地写出计算步骤。作者认为,对于普通科技工作者来说,不仅要了解多元统计方法的数学原理,还要掌握具体的计算步骤。重要的是了解多元统计方法的分析目的、基本思路、分析逻辑、应用条件和结果解释。因此,读者可以忽略相关章节对数学理论和具体计算过程的介绍,重点阅读每种方法的应用条件、基本分析思路、具体应用举例和结果说明。
课程大纲
1.多元统计分析概述45
(1)统计分析方法介绍(15分钟)
(2)统计技术和软件应用(15分钟)
(3)多元统计分析概述(15分钟)
2.多元数据的数学表达及R语言45的使用
(1)多元数据的数学表达式(15分钟)
(2)R语言入门(15分钟)
(3)多元数据的R调用(15分钟)
3.多元数据的可视化表示及R语言45的使用
(1)数据可视化分析的思路(15分钟)
(2)目视分析和R使用(15分钟)
(3)视觉分析案例研究(15分钟)
4.相关回归分析和R语言使用60
(1)多重线性相关分析(15分钟)
(2)多元线性回归分析(15分钟)
(3)相关和回归的R分析(15分钟)
(4)相关回归案例分析(15分钟)
5.广义和一般线性模型及R语言的使用60
(1)型号选择(15分钟)
(2)广义线性模型(15分钟)
(3)一般线性模型(15分钟)
(4)相关案例分析(15分钟)
6.判别分析和R语言使用60
(1)判别分析导论(15分钟)
(2)线性判别分析(15分钟)
(3)贝叶斯判别分析(15分钟)
(4)歧视案例分析(15分钟)
7.聚类分析和R语言使用60
(1)聚类分析的概念(15分钟)
(2)系统聚类(15分钟)
(3)快速聚类(15分钟)
(4)案例分析(15分钟)
8.主成分分析和R语言使用45
(1)主成分分析的思路(15分钟)
(2)主成分分析计算(15分钟)
(3)主成分案例分析(15分钟)
9.因素极化和R语言使用60
(1)因素分析的内容(15分钟)
(2)因素负荷(15分钟)
(3)因素轮换和评分(15分钟)
(4)因素分析案例分析(15分钟)
10.对应分析和r语言使用60
(1)对应分析简介(15分钟)
(2)列联表分析(15分钟)
(3)相应的分析方法(15分钟)
(4)对应分析案例研究(15分钟)
11.典型相关分析与r语言60的使用
(1)典型相关分析介绍(15分钟)
(2)典型相关分析过程(15分钟)
(3)典型相关分析测试(15分钟)
(4)典型相关案例分析(15分钟)
12.多维标度法和R语言使用45
(1)多维标度法介绍(15分钟)
(2)多维标度算法(15分钟)
(3)多维标度法案例分析(15分钟)
13.综合评价法与r语言60的使用
(1)综合评价介绍(15分钟)
(2)指标体系的建立(15分钟)
(3)综合评价法(15分钟)
(4)综合评价案例分析(15分钟)
基本原理
基础数学知识,学过“概率论与数理统计”,或者自学过“线性代数”中的矩阵运算。
证书要求
本课程的学习环节包括:观看讲课视频,掌握每次讲课的案例分析,完成每次讲课的习题,完成单元测试题,参与课程讨论,参加期末考试。
该课程的学术成果由两部分组成:
[2]王斌编著《数据统计分析与R语言程序设计》,北京大学出版社,2014年8月
[3]王斌编著《计量经济学模型及R语言的应用》,北京大学出版社,2015.5
[4]王斌会研究R语言的博客:Rstat.leanote.com
常见问题
r语言是属于GNU系统的自由、免费、开源软件,是统计计算、数据分析、统计映射的优秀工具。
作为一款免费的统计软件,它有UNIX、LINUX、MacOS和WINDOWS版本,可以免费下载使用。r的官网是https://www.r-project.org。可以从官网下载r安装程序,各种插件,文档。R的安装程序只有8个基本模块,其他外部模块可以通过CRAN(https://CRAN . R-project . org)获取。
战犬瑞克斯
主演:凯特·玛拉·汤姆·费尔顿/布莱德利·惠特福德
1.《多元统计分析 暨南大学《多元统计分析及R语言建模》公开课》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《多元统计分析 暨南大学《多元统计分析及R语言建模》公开课》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/caijing/1494947.html