导数、偏导数、方向导数、梯度、梯度下降

 我来答
机器1718
2022-07-04 · TA获得超过6826个赞
知道小有建树答主
回答量:2805
采纳率:99%
帮助的人:159万
展开全部

机器学习中的大部分问题都是优化问题,而绝大部分优化问题都可以使用梯度下降法处理,那么搞懂什么是梯度、什么是梯度下降法就非常重要!这是基础中的基础,也是必须掌握的概念!
提到梯度,就必须从导数(derivative)、偏导数(partial derivative)和方向导数(directional derivative)讲起,弄清楚这些概念,才能够正确理解为什么在优化问题中使用梯度下降法来优化目标函数,并熟练掌握梯度下降法(Gradient Descent)。
文章小节安排如下:
1.导数
2.导数和偏导数
3.导数和方向导数
4.导数和梯度
5.梯度下降法

一张图读懂导数和微分:

偏导数的定义如下:

可以看到, 导数与偏导数本质是一致的,都是当自变量的变化趋于0时,函数值的变化量与自变量变化量比值的极限。直观来说,偏导数也是函数在某一点上沿坐标轴正方向的变化率。
区别在于:
导数,指的是一元函数中,函数 在某一处沿 轴正方向的变化率;
偏导数,指的是多元函数中,函数 在某一点处沿着某一坐标轴 正方向的变化率。

方向导数的定义如下:


在前面导数和偏导数的定义中,均是沿坐标轴正方向讨论函数的变化率。那么当我们讨论函数沿任意方向的变化率时,也就引出了方向导数的定义,即: 某一点在某一趋近方向上的导数值。
通俗的解释是:
我们不仅要知道函数在坐标轴正方向上的变化率(即偏导数),而且还要设法求得函数在其他特定方向上的变化率。而方向导数就是函数在其他特定方向上的变化率。

梯度的定义如下:

梯度的提出职位回答一个问题:
函数在变量空间的某一点处,沿着哪一方向有最大的变化率?
梯度定义如下:
函数在某一点的梯度是这样一个向量,它的方向与取得最大方向导数的方向一致,而它的模为方向导数的最大值。
这里需要注意三点:
1)梯度是一个向量,即有方向有大小;
2)梯度的方向是最大方向导数的方向;
3)梯度的模是最大方向导数的值。

提问:导数与偏导数与方向导数是向量么?
向量的定义是有方向(direction)和大小(magnitude)的量。
从前面的定义可以这样看出,偏导数和方向导数表达的是函数在某一点沿某一个方向的变化率,也是具有方向和大小的。因此从这个角度理解,我们可以把偏导数和方向导数看作是一个向量,向量的方向就是变化率的方向,向量的模就是变化率的大小。
那么沿着这样一种思路,就可以如下理解梯度:
梯度即函数在某一点最大的方向导数,函数沿梯度方向函数有最大的变化率。

既然在在变量空间的某一点处,函数沿梯度方向局域最大的变化率,那么在优化目标函数的时候,自然是 沿着负梯度方向去减少函数值 ,以此来达到我们的优化目标。
如何沿着负梯度方向减少函数值呢?既然梯度是偏导数的集合,如下:

同时梯度和偏导数都是向量,那么参考向量运算法则,我们在每个变量轴上减少对应变量值即可,梯度下降法可以描述如下:

以上就是提嘟嘟下降法的由来,大部分的机器学习任务,都可以利用 来进行优化。

总结

已赞过 已踩过<
你对这个回答的评价是?
评论 收起
图为信息科技(深圳)有限公司
2021-01-25 广告
边缘计算可以咨询图为信息科技(深圳)有限公司了解一下,图为信息科技(深圳)有限公司(简称:图为信息科技)是基于视觉处理的边缘计算方案解决商。作为一家创新企业,多年来始终专注于人工智能领域的发展,致力于为客户提供满意的解决方案。... 点击进入详情页
本回答由图为信息科技(深圳)有限公司提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式