首页 国内 国际 要闻 社会 文化 健康 科技 教育 旅游 财经 实时

推荐 :在数据科学中需要多少数学技能?

2021-02-23 13:30:50 来源:热点资讯
分享: 微信

本文为大家介绍了在数据科学和机器学习中所需要的基本数学技能,并且分类给出了相应的主题建议。

Jeswin Thomas on Unsplash

尽管已经有许多出色的计算工具可供数据科学家执行其工作,数学技能在数据科学和机器学习中仍然是必不可少的,因为这些工具通常仅仅会像是“黑匣子”,而如果没有理论基础,您将无法回答核心的分析性问题。

I.引言

如果您渴望成为数据科学家,那么您无疑会想到以下问题:

我几乎没有数学背景,可以成为一个数据科学家吗?

数据科学中的哪些基本数学技能很重要?

有许多好的软件包可用于构建预测模型或数据可视化。一些最常见的用于描述性和预测性分析的软件包包括:

Ggplot2 Matplotlib Seaborn Scikit-learn Caret TensorFlow PyTorch Keras

借助这些软件包,任何人都可以构建模型或进行数据可视化。但是,扎实的数学背景知识对于模型微调(fine-tuning)以生成具有最佳性能的可靠模型至关重要。建立模型是一回事,但解释模型并得出可用于数据驱动决策的有意义的结论,是另一回事。重要的是,在使用这些软件包之前,您必须了解每个软件包的数学基础,这样才能避免将这些软件包仅仅用作“黑匣子”工具。

II.案例:建立多元回归模型

假设我们现在将要建立一个多元回归模型。在此之前,我们需要问自己以下问题:

我的数据集有多大? 我的特征变量和目标变量是什么? 哪些预测特征与目标变量最相关? 哪些特征很重要? 我应该进行特征缩放吗? 我的数据集应如何划分为训练集和测试集? 什么是主成分分析(PCA)? 我应该使用PCA删除冗余特征吗? 如何评估我的模型?我应该使用R2_score,平均平方误差(MSE)还是平均绝对误差(MAE)? 如何提高模型的预测能力? 我应该使用正则化回归模型吗? 哪些是回归系数?

哪些是截距?

我应该使用非参数回归模型,例如K近邻回归还是支持向量回归(SVR)?

我的模型中有哪些超参数,如何对其进行微调以获得性能最佳的模型?

没有良好的数学背景,您将无法解决上面提出的问题。最重要的是,在数据科学和机器学习中,数学技能与编程技能同等重要。因此,想成为数据科学家,您必须花时间研究数据科学和机器学习的理论和数学基础。您能否构建可应用于实际问题的可靠且有效的模型,取决于您的数学技能。

现在,让我们讨论数据科学和机器学习所需的一些基本数学技能。

Ⅲ. 数据科学和机器学习的基本数学技能

1、 统计学和概率论

统计学和概率论可以用于特征的可视化、数据预处理、特征变换、数据填补、降维、特征工程、模型评估等环节。以下是您需要熟悉的主题:

均值,中位数,众数,标准差/方差,相关系数,协方差矩阵; 概率分布(二项分布、泊松分布、正态分布),p值,贝叶斯定理(精度、召回率、阳性预测值、阴性预测值、混淆矩阵、ROC曲线); 中心极限定理,R2_score,MSE(均方误差),A / B测试,蒙特卡洛模拟…

2、 多变量微积分

大多数机器学习模型都是使用具有多个特征或预测变量的数据集构建的。因此,熟悉多变量演算对于建立机器学习模型非常重要。以下是您需要熟悉的主题:

多变量函数; 导数和梯度; 阶跃函数,Sigmoid函数,Logit函数,ReLU函数(整流线性单位函数,Rectified Linear Unit); 成本函数; 函数绘图; 函数的最小值和最大值…

3、 线性代数

线性代数是机器学习中最重要的数学技能。当数据集被表示为矩阵,线性代数则可用于数据预处理、数据转换、降维和模型评估。以下是您需要熟悉的主题:

向量; 向量的范数; 矩阵,转置矩阵,矩阵的逆,矩阵的行列式,矩阵的迹; 点积,特征值,特征向量…

4、 优化方法

大多数机器学习算法通过最小化目标函数来执行预测建模,因而机器学习必须应用于测试数据的权重才能获得预测标签。以下是您需要熟悉的主题:

成本函数/目标函数; 似然函数; 损失函数; 梯度下降算法及其变体(例如,随机梯度下降算法)… IV.结论

总而言之,我们讨论了数据科学和机器学习所需的基本数学和理论技能,已经有许多免费在线课程教授这些必要的数学技能。想成为数据科学家,请务必牢记,理论基础对于构建高效且可靠的模型至关重要。因此,您应该投入足够的时间来研究每种机器学习算法背后的数学理论。

译者简介:刘思婧,清华大学新闻系研一在读,数据传播方向。文理兼爱,有点小情怀的数据爱好者。希望结识更多不同专业、不同专长的伙伴,拓宽眼界、优化思维、日日自新。

 


(责任编辑:热点资讯)


免责声明:本站所有文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考;文章版权归原作者所有!本站作为信息内容发布平台,信息均由网友投稿发布,页面展示内容的目的在于传播更多信息;本站内容不参与任何的商业性质服务与用途,阁下应知本站所提供的内容不能做为操作依据。如本文内容影响到您的合法权益(含文章中内容、图片等),请及时联系我们,我们核实后会及时删除处理。

相关文章

推荐 :在数据科学中需要多少数学技能?

本文为大家介绍了在数据科学和机器学习中所需要的基本数学技能,并且分类给出了相应的主题建议。Jeswin Thomas on Unsplash尽管已经有许多出色的计算工具可供数据科学家执行其工作,数学技能在数据科学和机器学习中仍然...

来源:热点资讯

苹果电池容量阈值为80%,较低时需要换电池吗?得换原装的吗?

苹果电池容量阈值为80%,较低时需要换电池吗?得换原装的吗?手机电池一个会发生自然老化随着使用次数越来越多性能逐渐降低的部件。很多人使用了两三年的苹果手机,可能电池的性能只有81%、82%的水平。最直观的感受就是电池...

来源:深圳房产频道

韩国5G用户去年年底达到1185万 12月份新增90万

【TechWeb】2月23日消息,据国外媒体报道,目前全球已有众多国家推出了5G商用网络,5G用户的数量也在不断增加,全球率先推出5G商用服务的韩国,也是如此。外媒援引韩国科技信息通信部公布的数据报道称,韩国5G用户在去年年底达到...

来源:深圳都市报

中国电信董事长柯瑞文:中国5G套餐用户累计超过3.2亿

【TechWeb】2月23日消息,在2021MWC上海展开幕式上,中国电信集团有限公司董事长柯瑞文通过线上的方式发表了题为“Hello5G和合共生”的主题演讲,分享了中国电信对未来5G发展的一些实践和思考。柯瑞文表示,2020年...

来源:深圳财经频道

特斯拉本周将向以色列交付首批汽车

【TechWeb】2月23日消息,据国外媒体报道,电动汽车制造商特斯拉本周将向以色列交付首批汽车。本月初,特斯拉在以色列推出Model 3,并正式在以色列开启在线销售。一开售,2021年第一季度可交付的所有汽车都以闪电般的速度销售...

来源:民生晚报

荣耀两款新机获FCC认证:Mate40同款66W快充

2月20日消息,前不久,荣耀正式发布2021开年旗舰荣耀V40,作为新荣耀的首款高端旗舰,新机在首销当日便取得傲人战绩,据官方介绍,仅用时3分46秒,荣耀V40便在线上四大平台全部售罄,抢手程度堪称火爆。当然,除了高端市场,份额巨大的中...

来源:深圳文化之窗

Redmi Note10 Pro设计细节曝光:居中单孔+大小眼矩阵镜头

【TechWeb】除了近期密集预热、即将于2月25日正式发布的全新Redmi K40系列旗舰外,Redmi旗下还将有另外一款新机很可能在接下来的3月与大家见面,它就是曝光比K40系列还早的Redmi Note 10系列。现在有最新消息,继该机的全...

来源:深圳都市晚报

三星承诺为130多款手机和平板提供至少四年的安全更新

站长之家(ChinaZ.com) 2月23日 消息:三星电子于昨日发布新闻稿,表示,自首次发布手机后,三星Galaxy设备将获得至少四年的安全更新。三星表示,通过每月或每季度的安全更新,三星希望让用户放心使用它们的Galaxy设备,包括智能手...

来源:深圳都市晚报

具惠善吐露近况称向前看 直言:离婚不是什么大事

近日,具惠善在出演某节目时被问及离婚相关问题时透露心声,直言:离婚不是什么大事。当主持人问到“伤心的事情发生之后你过还好吗”,具惠善笑称:“已经过去很久了,我也在向前看,离婚不是什么大事。”据了解,7...

来源:民生晚报

《甜蜜》热播 海清变身“拼命三娘”替夫还债

由海清、任重联合主演的女性现实主义题材剧集《甜蜜》正在热播。极具冲击性的剧情一经播出,就让剧目斩获大众关注,田蜜替夫还债的相关剧情话题,不仅登上微博热搜也引起热议,大众纷纷感叹、惋惜田蜜的遭遇。剧播至...

来源:广东时代新闻

合作联系

联系方式

中华网新媒体 财经频道
互动/投稿邮箱:
852414410@qq.com
网上不良信息举报QQ:852414410
内侵权删除处理QQ:852414410
本站涵盖的内容、图片、视频等内容均由网友自助投稿或发布,本站不对内容真实性承担责任。若涉内容及版权问题,请联系我们进行删除!