·发表于 Towards Data Science ·阅读时间:7 分钟·2024 年 5 月 16 日
--
作者提供的鸢尾花图,由 Midjourney 创建
机器学习和统计学常常因其复杂的数学基础而让人感到畏惧。然而,有些概念,如置换检验,却出奇地直观,并且可以通过简单的实验来理解。置换检验是评估不同领域结果显著性的重要工具,从心理学到数据科学均有应用。让我们通过一个生动的例子来探讨这一强大概念:学习德语中颜色的名称。在这里,你是机器学习(ML),一个复杂的神经网络,唯一通过自然方式——生育一个孩子——创造出来的!
德语中的颜色,原始数据集。图片由作者提供。
假设我给你一个数据集,里面用相同颜色的墨水标注每个颜色的名称。你研究它几分钟,记住这些颜色名称,然后我测试你。令人印象深刻的是,你几乎准确地说出了所有颜色的名称,只有一个小小的错误。