作者简介

狗梦,r语言的资深粉丝。

个人微信官方账号:r语言和生态系统服务。

和R接触快三年了,期间断断续续摸索了一些知识,但还是不够全面系统。期待通过这个微信官方账号和大家互相学习交流经验,从中收获点什么!所有的软件学习都需要遵循它从哪里来,是什么,如何使用的规则。在研究一切之前,有必要对R有一个初步的了解。

1.r的过去和未来?

产地:

U R语言由s统计绘图语言演变而来,可视为s的“方言”。

美国语言于20世纪70年代诞生于贝尔实验室,由里克·贝克尔、约翰·钱伯斯和艾伦·威尔克斯开发。

U Splus是一款基于s语言开发的商业软件,可以轻松编写函数和构建模型,具有良好的可扩展性,在国外学术界得到广泛应用。

u1995年,新西兰奥克兰大学统计系的robert君子和RossIhaka在S语言源代码的基础上,编写了一个可以执行S语言的软件,并将该软件的所有源代码公开,即R软件,其命令统称为R语言。

趋势:

r语言,从最初的以统计和绘图为目的的计算机语言,至今还能持续很久。在可预见的未来,R语言在数据处理和图形显示方面肯定会发挥更大的作用。在TIOBE最近发布的4月份改版语言列表中,可以看到R的排名在逐渐上升,与R语言相关的岗位越来越多,所以R语言的市场并不广泛!

2.R有什么优势?

r与其他统计软件的比较:

SAS:速度快,统计分析模块多,扩展性差,价格贵。

SPSS:复杂的用户图形界面很好学,但是编程很难。

r是唯一的:

GNU软件:软件本身和包的自由、开放源代码。

强大的绘图功能:如果想可视化复杂数据,R无疑是首选。

资源丰富:几乎涵盖了各行业数据分析中的所有方法。

扩展性好:编写函数和包非常方便,可以跨平台胜任复杂的数据分析和绘制精美的图形。

完整的帮助系统:每个功能都有统一格式的帮助,运行实例。

下图显示了r映射函数的一个示例。

选取了UCI的数据集,包括13款汽车的398个样本。选择MPG作为驱动变量y,排量、马力、死重作为自变量,进行多元统计分析。首先生成的三点矩阵图可以用r:

散点图矩阵

3.生态学家为什么要学R?

随着生态观测手段的不断发展和更新,大数据是生态发展的趋势。近年来,R语言已经成为生态学领域的热门软件,特别是在森林样地处理、地理信息技术和空互处理、统计制图等领域。面对海量数据,要求生态学领域的研究人员从数据整理、清理、综合分析、精细制图等方面对数据进行综合统计,而R语言的使用往往不仅方便数据处理,而且有利于高质量论文的发表。比如群落生态学中的数据通常是多维数据,R语言的Vegan包可以进行多元统计分析,计算α和β多样性,PCA,RDA,CCA排序和方差分解,物种多度曲线只需要简单的函数就可以完成,结果的可视化程度极高。

在发表论文方面,R语言在论文中的使用越来越频繁。赖江山总结了2012-2016年以来,20种影响因子在3以上的生态期刊上的20325篇研究论文使用语言作为数据分析工具的情况。可以看出,以R语言为分析工具的生态学研究论文比例在过去五年中呈现出快速增长的趋势,2016年已超过50%,占全国的一半。R语言已经成为生态学研究中最重要的数据分析工具,这是不争的事实。

以R语言为数据分析工具的20种SCI生态期刊2012-2016年发表的研究论文比例趋势

与国外期刊相比,国内生态期刊选择R作为数据分析工具的论文比例明显劣势。虽然近五年在《生态学杂志》、《植物生态学杂志》、《生物多样性》和《应用生态学杂志》发表的论文中使用R语言的比例逐渐增加,但其动机仍然不足。

国内生态期刊论文使用R语言作为数据分析工具的趋势

4.如何学习R?

关于R语言的一些学习资料推荐如下:

r官网:https://www.r-project.org/

几本书:实战中的R语言,统计建模与R软件,现代统计图形,定量生态学——R语言的应用

微信微信官方账号:R语言中文社区,摸石头学R语言,数据立方体,EasyCharts,收集大数据

R学习网站:统计之都,R期刊,R星球等

注:请批评指正文章不足之处!

关于爬行动物三大案例实战的回复

回复Python 1小时破冰介绍

回复数据挖掘和数据挖掘的R语言介绍

回复人工智能三个月。人工智能

回复数据分析师的成长路径

回复机器学习的商业应用机器学习

回复数据科学实战数据科学

常见算法回复常见数据挖掘算法

1.《r语言官网 R语言——初步认识》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《r语言官网 R语言——初步认识》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/jiaoyu/1725389.html