加入收藏 | 设为首页 | 会员中心 | 我要投稿 四平站长网 (https://www.0434zz.com.cn/)- 云服务器、对象存储、基础存储、视频终端、数据应用!
当前位置: 首页 > 大数据 > 正文

推荐 :在数据科学中需要多少数学方法?

发布时间:2021-06-03 20:41:28 所属栏目:大数据 来源:互联网
导读:I.引言 如果您渴望成为数据科学家,那么您无疑会想到以下问题: 我几乎没有数学背景,可以成为一个数据科学家吗? 数据科学中的哪些基本数学技能很重要? 有许多好的软件包可用于构建预测模型或数据可视化。一些最常见的用于描述性和预测性分析的软件包包括:
I.引言
如果您渴望成为数据科学家,那么您无疑会想到以下问题:
我几乎没有数学背景,可以成为一个数据科学家吗?
数据科学中的哪些基本数学技能很重要?
有许多好的软件包可用于构建预测模型或数据可视化。一些最常见的用于描述性和预测性分析的软件包包括:
Ggplot2
Matplotlib
Seaborn
Scikit-learn
Caret
TensorFlow
PyTorch
Keras
借助这些软件包,任何人都可以构建模型或进行数据可视化。但是,扎实的数学背景知识对于模型微调(fine-tuning)以生成具有最佳性能的可靠模型至关重要。建立模型是一回事,但解释模型并得出可用于数据驱动决策的有意义的结论,是另一回事。重要的是,在使用这些软件包之前,您必须了解每个软件包的数学基础,这样才能避免将这些软件包仅仅用作“黑匣子”工具。
II.案例:建立多元回归模型
假设我们现在将要建立一个多元回归模型。在此之前,我们需要问自己以下问题:
我的数据集有多大?
我的特征变量和目标变量是什么?
哪些预测特征与目标变量最相关?
哪些特征很重要?
我应该进行特征缩放吗?
我的数据集应如何划分为训练集和测试集?
什么是主成分分析(PCA)?
我应该使用PCA删除冗余特征吗?
如何评估我的模型?我应该使用R2_score,平均平方误差(MSE)还是平均绝对误差(MAE)?
如何提高模型的预测能力?
我应该使用正则化回归模型吗?
哪些是回归系数?
哪些是截距?
我应该使用非参数回归模型,例如K近邻回归还是支持向量回归(SVR)?
我的模型中有哪些超参数,如何对其进行微调以获得性能最佳的模型?
没有良好的数学背景,您将无法解决上面提出的问题。最重要的是,在数据科学和机器学习中,数学技能与编程技能同等重要。因此,想成为数据科学家,您必须花时间研究数据科学和机器学习的理论和数学基础。您能否构建可应用于实际问题的可靠且有效的模型,取决于您的数学技能。
现在,让我们讨论数据科学和机器学习所需的一些基本数学技能。

(编辑:四平站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读