109个数据科学面试问答,你绝对不能错过的宝藏库!
|
计算就是数据科学家通过原始数据来做出预测和建模的过程。没有杰出的统计学知识,是很难成为一个成功的数据科学家的。因此,一个优秀的面试官大概率会通过一些统计向的数据科学问题,来试探你对这个领域的理解。那么面试者最好对一些基本的统计问题有所准备,以此为数据面试做更充分的准备。 下列是我们搜寻到的一些常见统计问题: 1. 什么是中心极限定理?它为什么很重要? “假设,我们有兴趣来估算所有人的平均身高。搜集世界上每个人的数据是不可能的。虽然我们不能获得每个人的身高测量数据,但我们仍可以从一些人身上取样。那么问题就变成了,对于这个单一的样本推测出的整个人口的平均身高,你的看法是怎么样的。中心极限定理其实也就是在讨论这个问题。” 2. 什么是抽样? 你知道多少种抽样方法? “数据抽样是一种统计分析技术,用于选择、操作和分析具有代表性的数据点子集,以识别正在测试的更大数据集中的模式和趋势。” 3. I类错误和II类型错误的区别是什么? “当原假设为真但被拒绝时,会发生I类错误。如果原假设是不成立的,但却错误地没有被拒绝,就会发生 II 类错误。” 4. 什么是线性回归?P 值、系数、和R平方值这些术语又是什么意思?它们各自的重要性又是怎样的? 线性回归是快速预测分析的好工具。举例来讲,房子的价格取决于许多因素,比如它的大小或位置。为了看到这些变量之间的关系,我们需要建立一个线性回归模型,它可以预测变量之间的最佳匹配线,并且可以帮助得出这两个因素之间是正相关还是负相关。 5. 线性回归需要什么样的假设? 有四个主要假设:
![]() (编辑:四平站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

