统计学在机器学习中如此重要?
![]() 引发了一些问题,例如:
尽管它们看起来很简单,但必须回答这些问题才能将原始观察结果转化为我们可以使用和共享的信息。 除了原始数据,我们还可以通过设计实验来收集观察数据。从这些实验结果中,我们可能会遇到更复杂的问题,例如:
这些问题很重要。问题的答案对项目,利益相关者以及有效的决策都是至关重要的。 需要统计方法来找到关于数据的问题的答案。 我们可以看到,为了了解用于训练机器学习模型的数据并解释测试不同机器学习模型的结果,都需要统计方法。 这只是冰山一角,因为预测建模项目中的每个步骤都将需要使用统计方法。 什么是统计学? 统计学是数学的一个子领域。 它指的是处理数据和使用数据回答问题的方法的集合。 Statistics is the art of making numerical conjectures about puzzling questions. […] The methods were developed over several hundred years by people who were looking for answers to their questions. — Page xiii, Statistics, Fourth Edition, 2007. 这是因为该领域包括处理数据的方法包,对于初学者而言,它看起来像是很大的东西,而且是不确定的。很难看出属于统计方法的方法与属于其他研究领域的方法之间的界限。通常,技术既可以是统计中的经典方法,又可以是用于特征选择或建模的现代算法。 尽管统计工作知识不需要深入的理论知识,但一些重要的且易于理解的定理可以为统计和概率之间的关系提供有价值的基础。 两个例子包括大数定律和中心极限定理;第一个有助于理解为什么较大的样本通常更好,第二个则为我们如何比较样本之间的期望值(例如平均值)提供了基础。 (编辑:四平站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

