加入收藏 | 设为首页 | 会员中心 | 我要投稿 四平站长网 (https://www.0434zz.com.cn/)- 云服务器、对象存储、基础存储、视频终端、数据应用!
当前位置: 首页 > 站长资讯 > 动态 > 正文

最简单的解决方案往往是最好的解决方案

发布时间:2021-05-04 13:29:49 所属栏目:动态 来源:互联网
导读:成为数据科学家并不意味着你必须使用机器学习模型解决所有问题。 如果CASE WHEN查询足以完成工作,则坚持这样做。 如果线性回归足以完成任务,则不要构建10层神经网络。 更简单的解决方案有很多好处,包括更快的实施时间,更少的技术负担以及总体上更容易的

成为数据科学家并不意味着你必须使用机器学习模型解决所有问题。 如果CASE WHEN查询足以完成工作,则坚持这样做。 如果线性回归足以完成任务,则不要构建10层神经网络。

更简单的解决方案有很多好处,包括更快的实施时间,更少的技术负担以及总体上更容易的可维护性。

 

坚持使用你喜欢的工具很容易,但是使用创造新工具是有原因的——它们是用来填补现有的空白的。通过花时间探索新的库和包,我发现了一些令人难以置信的工具,它们为我节省了大量时间。以下是其中的一些:

Gradio是一个Python包,它允许你用三行代码就可以为你的机器学习模型构建和部署一个web应用。它的作用与Streamlit或Flask相同,但我发现它更容易部署模型。

Pandas Profiling是另一个自动进行探索性数据分析并将其整合到报告中的软件包。我发现当我使用较小的数据集时,这非常有用。最棒的是它只需要一行代码!

Kedro是一个开发工作流工具,允许你创建可移植的ML管道。它将软件工程最佳实践应用到你的代码中,使其可重现性、模块化和文档化良好。

 

有些步骤是不能匆忙的。特别是应该花时间深入理解试图解决的业务问题和正在使用的数据。

(编辑:四平站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读