原始链接:
https://rvi EWS . rst udio . com/2019/03/01/some-r-packages-for-roc-curves/
在本文中,我将描述如何在CRAN中搜索用于绘制ROC曲线的包,并强调六个有用的包。
虽然我最初对包有一些想法,比如ROCR和pROC,我发现它们在过去很有用,但我决定使用加博尔·卡萨尔迪相对较新的包pkgsearch来搜索CRAN,看看有什么。函数package_search将一个文本字符串作为输入,并使用基本的文本挖掘技术搜索所有的CRAN。该算法搜索包文本字段,并为找到的每个包生成一个分数,该分数由反向依赖和下载的数量加权。
1用于数据操作的library# 1
2包下载统计的library #
3库 #用于搜索包
经过一些反复试验,我决定使用下面的查询,包括一些有趣的roc相关的包。
1rocPkg <。-pkg_search
2
然后,通过过滤掉孤立包和分数不超过190的包,我把rocPkg减少到46个包。
1rocPkgShort & lt。-RocpkG % & gt;%
2filter % >;%
3select% gt;%
4安排)
5头
为了完成选择过程,我做了大量的工作,浏览了软件包文档,选择了我认为通常对大多数数据科学家有用的东西。下图用光创宇的dlstats包查看我选择配置的六个包的下载历史。
1图书馆
2短列表<。- c
3下载<。- cran_stats
4ggplot) +
5 geom _ line+geom _ point)+
6 scale _ y _ continuous
ROCR - 2005
ROCR已经存在了近14年,是绘制ROC曲线的坚如磐石的工具。特别喜欢performance函数通过输入真阳性率tpr和假阳性率fpr等参数来设置曲线计算方法。这不仅具有令人放心的透明性,还显示了通过输入适当的参数来计算二进制分类器的几乎所有性能指标的灵活性。例如,要生成精度-召回曲线,您需要输入prec和rec。虽然没有小插曲,但是包的文档很好。
以下代码使用包中包含的合成数据集,并绘制默认的ROCR ROC曲线。在本文中,我将使用相同的数据集。
1图书馆
2##加载所需的包:gplots
3##
4##附加包:“gplots”
5##以下对象被屏蔽“包:统计”:
6##
7##低
8#绘制单次预测运行的ROC曲线
9#并根据截止值给曲线上色。
10数据
11df <。- data.frame
12页<。-预测
13perf <。-性能
14批次
pROC - 2010
从下载曲线可以明显看出,pROC也很受数据科学家的欢迎。我喜欢是因为很容易得到AUC的置信区间。
1图书馆
2##“类型”引用为引用。
3##
4##附加包:“pROC”
5##以下对象被屏蔽“包:统计”:
6##
7##封面,光滑,变化
8pROC _ obj & lt-roc
15
16
17sens.ci & lt- ci.se
18绘图
19 # # plot . ci . se中的警告: Low
20##定义形状。
21磅
PRROC - 2014
虽然没有ROCR和普罗克那么受欢迎,但中华民国最近似乎卷土重来了。输入的术语有点妥协,但是一旦理解了ROC.curve函数,就可以很容易的画出干净的ROC曲线。如插图所示,PRROC实际上是为了制作一条精确-召回曲线而创建的。
1图书馆
2
3PRROC _ obj & lt-roc . curve
5批次
plotROC - 2014
PlotROC是用ggplot绘制ROC曲线的理想选择。我的猜测是,它似乎只有有限的受欢迎程度,因为该文件使用了医学术语,如“疾病状态”和“标记”。然而,文档非常好。
这个包提供了很多功能ggplot几何,可以生成复杂的图形。下图包含一些样式,包括Clopper和Pearson的精确方法置信区间。
1图书馆
2rocplot & lt。-ggplot)+geom_roc
3 rocplot+style _ roc+geom _ rocci
四
prerec-2015
Precrec是另一个绘制ROC和精度-召回曲线的库。
1图书馆
2##
3##附加包:“预录制”
4##以下对象被“包:进程”屏蔽:
5##
6## auc
7precrec _ obj & lt。- evalmod
8自动批次
evalmod函数的参数选项使生成各种模型特征的基本图形变得容易。
1precrec _ obj2 & lt。- evalmod
2自动绘图
ROCit - 2019
ROCit是绘制ROC曲线和可视化其他二元分类的新工具。它很快在一月份流行起来,并继续流行。如果我通过下载自动过滤原始搜索,我永远也找不到它。默认图表包含您的den统计数据的位置。
1图书馆
2##警告:包“ROCit”是在3.5.2版下构建的
3ROCit _ obj & lt- rocit
4批次
其他可视化是可能的。下图显示了阳性和阴性反应的累积密度。KS统计显示两条曲线之间的最大距离。
1ksplot
在本文中,我试图深入研究CRAN,揭示R包含的一些绘制ROC曲线和可视化其他二进制分类器的资源,但我只涉及到皮肤。此外,我故意忽略了许多用于特殊应用的软件包,如生存ROC,它根据回顾生存数据计算与时间相关的roc曲线,以及cvAUC,它包含评估交叉验证的AUC度量的功能。不过,希望这个小练习能帮你找到你要找的东西。
1.《ROC曲线 画ROC曲线的R包总结》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《ROC曲线 画ROC曲线的R包总结》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/1800894.html