查看原文
其他

R语言 | 让统计更easy的easystats集合包

大邓 大邓和他的Python
2024-09-09


easystats 是 R 包集合,可提供统一且easy的代码进行 统计分析。


与 tidyverse 有何不同?

tidyverse包集合,是 R语言 中非常流行的软件包集合(ggplot、dplyr、tidyr......),它也使 R 的使用更加容易。那么,您应该选择 tidyverse 还是 easystats?

两个都选!

事实上,这两个生态系统的设计考虑了非常不同的目标。tidyverse 包主要用于 数据操作和探索。而 easystats 更关注分析的最后阶段:理解和解释您的结果,并在手稿或报告中报告它们。您绝对可以在 tidyverse 工作流程中使用 easystats 功能!

easystats + tidyverse = ❤️


easystats生态圈

每个 easystats 包都有不同的范围和用途。这意味着您最好的开始方式是探索并选择您认为可能对您有用的那些。但是,由于它们的构建考虑了"更大的图景",您会意识到使用更多它们会创建一个流畅的工作流程,因为这些包旨在协同工作。理想情况下,这些软件包可以协同工作,涵盖统计分析和数据可视化的所有方面。

  • report:📜 🎉 生成自动统计报告
  • correlation:🔗 相关性的多合一包
  • modelbased:📈 基于统计模型估计效果、组平均值和组间对比
  • bayestestR:👻 非常适合贝叶斯统计的初学者或专家
  • effectize: 🐉 计算、转换、解释和使用效果大小和标准化参数的索引
  • see :🎨 创建漂亮结果可视化的绘图
  • parameters:📊 获取有关模型包含参数所有信息的表格
  • performance:💪模型的质量和性能指标(R2、ICC、LOO、AIC、BF、...)
  • insight:🔮 对于开发人员来说,一个包可以帮助您使用不同的模型和包
  • datawizard:🧙 清理和转换数据的魔法药水

截止2022-09-21, easystats生态中各个包的下载情况

TotalinsightbayestestRparametersperformancedatawizardeffectsizecorrelationseemodelbasedreporteasystats
10,001,0953,085,7391,373,3791,363,6781,285,5061,159,0971,060,079277,541251,03894,08948,8762,073


安装

install.packages("easystats")

炫一下

easystats到底如何好用,今天只实验report包,该包号称 “从 R 到你的手稿”

报告的主要目标是弥合 R 的输出与手稿中包含的格式化结果之间的差距。它根据最佳实践指南(例如 APA 期刊风格)自动生成模型和数据框架的报告,确保结果报告的标准化和质量。

生成iris数据集描述性统计信息的英文报告

report(iris)

Run

The data contains 150 observations of the following 5 variables:

  - Sepal.Length: n = 150, Mean = 5.84, SD = 0.83, Median = 5.80, MAD = 1.04, range: [4.30, 7.90],
Skewness = 0.31, Kurtosis = -0.55, 0% missing
  - Sepal.Width: n = 150, Mean = 3.06, SD = 0.44, Median = 3.00, MAD = 0.44, range: [2, 4.40], Skewness
= 0.32, Kurtosis = 0.23, 0% missing
  - Petal.Length: n = 150, Mean = 3.76, SD = 1.77, Median = 4.35, MAD = 1.85, range: [1, 6.90],
Skewness = -0.27, Kurtosis = -1.40, 0% missing
  - Petal.Width: n = 150, Mean = 1.20, SD = 0.76, Median = 1.30, MAD = 1.04, range: [0.10, 2.50],
Skewness = -0.10, Kurtosis = -1.34, 0% missing
  - Species: 3 levels, namely setosa (n = 50, 33.33%), versicolor (n = 50, 33.33%) and virginica (n =
50, 33.33%)

生成线性回归模型的报告

library(report)

model <- lm(Sepal.Length ~ Species, data = iris)
report(model)

Run

We fitted a linear model (estimated using OLS) to predict Sepal.Length with Species (formula:
Sepal.Length ~ Species). The model explains a statistically significant and substantial proportion of
variance (R2 = 0.62, F(2, 147) = 119.26, p < .001, adj. R2 = 0.61). The model's intercept,
corresponding to Species = setosa, is at 5.01 (95% CI [4.86, 5.15], t(147) = 68.76, p < .001). Within
this model:

  - The effect of Species [versicolor] is statistically significant and positive (beta = 0.93, 95% CI
[0.73, 1.13], t(147) = 9.03, p < .001; Std. beta = 1.12, 95% CI [0.88, 1.37])
  - The effect of Species [virginica] is statistically significant and positive (beta = 1.58, 95% CI
[1.38, 1.79], t(147) = 15.37, p < .001; Std. beta = 1.91, 95% CI [1.66, 2.16])

Standardized parameters were obtained by fitting the model on a standardized version of the dataset.
95% Confidence Intervals (CIs) and p-values were computed using a Wald t-distribution approximation.

更多内容请阅读 report包 的文档。

精选文章

从符号到嵌入:计算社会科学的两种文本表示

长期征稿 | 欢迎各位前来投稿

17G数据集 | 深交所企业社会责任报告

百度指数 | 使用qdata采集百度指数

推荐 | 社科(经管)文本分析快速指南

视频分享 | 文本分析在经管研究中的应用

MS | 使用网络算法识别创新的颠覆性与否

使用cntext训练Glove词嵌入模型

认知的测量 | 向量距离vs语义投影

Wordify | 发现和区分消费者词汇的工具

在jupyter中显示pdf内容

EmoBank | 中文维度情感词典

Asent库 | 英文文本数据情感分析

视频专栏课 | Python网络爬虫与文本分析

资料 | 量化历史学与经济学研究

PNAS | 文本网络分析&文化桥梁Python代码实现

BERTopic库 | 使用预训练模型做话题建模

tomotopy | 速度最快的LDA主题模型

管理世界 | 使用文本分析词构建并测量短视主义

Wow~70G上市公司定期报告数据集

100min视频 | Python文本分析与会计

在jupyter内运行R代码

blogdown包 | 使用R语言维护Hugo静态网站
R语言 | 使用posterdown包制作学术会议海报

R语言 | 将多个txt汇总到一个csv文件中

继续滑动看下一个
大邓和他的Python
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存