图片来源 | Midjourney & Canva
KDnuggets 的姊妹网站,Statology,拥有由专家编写的大量统计学相关内容,这些内容在短短几年内积累而成。我们决定通过整理并分享一些精彩教程,帮助我们的读者了解这一宝贵的统计、数学、数据科学和编程资源。
1. 谷歌网络安全证书 - 快速进入网络安全职业生涯。
2. 谷歌数据分析专业证书 - 提升你的数据分析技能
3. 谷歌 IT 支持专业证书 - 在 IT 领域支持你的组织
学习统计学可能很困难。它可能令人沮丧。而且,最重要的是,它可能令人困惑。这就是为什么Statology在这里提供帮助。
这一系列教程涉及描述数据这一永恒重要的话题。每当我们试图理解数据时,能够以特定方式描述数据是很重要的。这些描述工具也有助于与他人分享数据的总结性方面。掌握以下常见的数据描述方法是理解数据的关键,同时也能帮助你更好地理解 Statology 上的其他内容。
集中趋势的度量是一个代表数据集中心点的单一值。这个值也可以被称为数据集的“中心位置”。
在统计学中,有三种常见的集中趋势度量:
-
均值
-
中位数
-
众数
这些度量方法使用不同的方法找到数据集的中心位置。根据你分析的数据类型,其中一种度量可能比其他两种更适合使用。
当我们分析数据集时,我们通常关心两件事:
-
“中心”值的位置。我们通常用均值和中位数来衡量“中心”。
-
值的“分散程度”。我们用范围、四分位差、方差和标准差来衡量“分散”。
在统计学中,我们通常希望了解数据集的分布情况。特别地,有四个方面是了解分布时很有帮助的:
1. 形状
该分布是对称的还是偏向一侧的?
该分布是单峰的(一个峰)还是双峰的(两个峰)?
2. 异常值
该分布中是否存在任何异常值?
3. 中心
分布的均值、中位数和众数是多少?
4. 分布
该分布的范围、四分位距、标准差和方差是多少?
想要获取更多类似内容,请继续关注 Statology,并订阅他们的每周通讯,以确保不会错过任何信息。
Matthew Mayo (@mattmayo13) 拥有计算机科学硕士学位和数据挖掘研究生文凭。作为 KDnuggets 和 Statology 的执行编辑,以及 Machine Learning Mastery 的特约编辑,Matthew 致力于使复杂的数据科学概念易于理解。他的专业兴趣包括自然语言处理、语言模型、机器学习算法和探索新兴的 AI。他的使命是使数据科学社区的知识民主化。Matthew 从 6 岁起就开始编程。