最小二乘法

 我来答
万事通小罗
2024-01-06 · 超过20用户采纳过TA的回答
知道答主
回答量:23
采纳率:0%
帮助的人:2712
展开全部

一、最小二乘法简介

最小二乘法是一种用于寻找数据最佳拟合线或曲线的方法。它的核心思想是,通过最小化    观测数据点与拟合线(或曲线)之间的垂直距离的平方和,来确定最佳拟合的参数。

想象一组散点数据,你想要找到一条直线或曲线,使得所有这些点到这条线(或曲线)的距离之和的平方尽可能小。最小二乘法就是为了找到这条线(或曲线),使得这个距离之和的平方最小。

这个方法在很多领域都有应用,比如统计学、机器学习和工程。通过数学计算,你可以找到最小二乘法的解析解,确定最佳拟合线的斜率和截距(如果是线性拟合的话),或者更复杂的参数(如果是多项式或非线性拟合)。

总的来说,最小二乘法是一种寻找最佳拟合模型的数学方法,通过最小化数据点与拟合模型之间的误差来找到最优解。

二、公式及分析

最小二乘法的基本公式是用于线性回归的。在简单线性回归中,我们试图拟合一个线性模型 y = mx + b 来最好地描述数据。

假设我们有 n 个数据点,表示为 (x_i, y_i),其中 i 是数据点的索引。我们的目标是找到最佳的斜率 m 和截距 b,使得拟合线与数据点的误差平方和最小。

拟合的线性模型的预测值为 {y}_i = mx_i + b。数据点 y_i 和预测值 {y}_i 之间的误差是 e_i = y_i - {y}_i。

最小二乘法的目标是最小化所有数据点的误差平方和:

为了找到最小化误差平方和的解析解,我们对误差平方和关于参数 m 和 b 分别求导数,并令导数等于零,然后解这个方程组。这样可以得到最佳的斜率 m 和截距 b 的估计值。

最终得到的解析解公式为:

这些公式通过对误差平方和进行求导,然后将导数等于零解方程得到。它们给出了最小二乘法用于简单线性回归的斜率和截距的估计值。

三、公式由来

当使用最小二乘法解决简单线性回归时,我们希望最小化误差平方和:

其中,S 是误差平方和,n 是数据点的数量,(x_i, y_i) 是每个数据点的坐标,m 是斜率,b 是截距。

要找到最小化 S 的 m 和 b,我们分别对 S 关于 m 和 b 求偏导数,并令偏导数等于零。

首先对 S 求关于 m 的偏导数:

接下来对 S 求关于 b 的偏导数:

然后,令这些偏导数等于零,然后解方程组来找到最优的 m 和 b 值。这些导数为零的方程将帮助我们找到最小化误差平方和的斜率和截距的估计值。

机器1718
2022-07-04 · TA获得超过6816个赞
知道小有建树答主
回答量:2805
采纳率:99%
帮助的人:159万
展开全部
最近在看线性回归,一步步往下追,追到了最小二乘法公式

最小二乘法公式是一个数学的公式,在数学上称为 曲线拟合 ,此处所讲最小二乘法,专指 线性回归方程 最小二乘法公式为b=y(平均)-a*x(平均)。

最小二乘

找到一个(组)估计值,使得实际值与估计值的距离最小。本来用两者差的绝对值汇总并使之最小是最理想的,但绝对值在数学上求最小值比较麻烦,因而替代做法是,找一个(组)估计值,使得实际值与估计值之差的平方加总之后的值最小,称为最小二乘。“二乘”的英文为least square,其实英文的字面意思是“平方最小”。这时,将这个差的平方的和式对参数求导数,并取一阶导数为零,就是OLSE。

最小二乘法的核心是权衡,因为你要在很多条线中间选择,选择出距离所有的点之和最短的;

换一种方式描述最小二乘法:

(1)已知多条近似交汇于同一个点的直线,想求解出一个近似交点:寻找到一个距离所有直线距离平方和最小的点,该点即最小二乘解;

(2)已知多个近似分布于同一直线上的点,想拟合出一个直线方程:设该直线方程为y=kx+b,调整参数k和b,使得所有点到该直线的距离平方之和最小,设此时满足要求的k=k0,b=b0,则直线方程为y=k0x+b0。

举个最简单的例子理解最小二乘

假设身高是变量X,体重是变量Y,我们都知道身高与体重有比较直接的关系。生活经验告诉我们:一般身高比较高的人,体重也会比较大。但是这只是我们直观的感受,只是很粗略的定性的分析。在数学世界里,我们大部分时候需要进行严格的定量计算:能不能根据一个人的身高,通过一个式子就能计算出他或者她的标准体重

接下来,我们会找一些人进行采样,我们会得到一堆数据(x1,y1),(x2,y2),⋯,(xn,yn),其中x是身高,y是体重。

得到这堆数据以后,接下来肯定是要处理这堆数据了。生活常识告诉我们:身高与体重是一个近似的线性关系,用最简单的数学语言来描述就是y=β0+β1x。于是,接下来的任务就变成了:怎么根据我们现在得到的采样数据,求出这个β0与β1呢?这个时候,就轮到最小二乘法发飙显示威力了。

最小二乘的cost function

在讲最小二乘的详情之前,首先明确两点:1.我们假设在测量系统中不存在有系统误差,只存在有纯偶然误差。比如体重计或者身高计本身有问题,测量出来的数据都偏大或者都偏小,这种误差是绝对不存在的。(或者说这不能叫误差,这叫错误)2.误差是符合正态分布的,因此最后误差的均值为0(这一点很重要)

最小二乘法的求解

根据样本的回归模型很容易得出:

我擦....

用到了求导,到此为止,打住....

链接:https://www.jianshu.com/p/4f5ba63ae291

来源:
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式