当数据量很大时用最小二乘拟合matlab比用插值拟合更好,说明原因

吉林农业大学信息技术学院

常用數据插值、拟合方法的

(3)线性最小二乘拟合matlab; 

、掌握知识点: 

了解插值的基本原理了解拉格朗日插值、线性插值和样条插值的基本

数據拟合和最小二乘法。 

、知识点提示: 

所求曲线或曲面通过所有已知数据点的问题就是插值问题 

1)、曲线拟合是指:已知平面上

在某种准則下与所有数据点最为接近,即曲

线拟合的最好 

线性最小二乘拟合matlab是解决曲线拟合最常用的方法,

使得(2)式最小称为

最小二乘准则。这种拟合方法称为线性最小二乘拟合matlab其结果为:

当模型中的被估参数与函数值为非线性依从关

系时,就形成非线性最小二乘问题 

帮助(注意‘method’不同参数绘制图形上的区

分别表示数据点的横纵坐标向量,x

为需要插值的横坐标数据

本文建立偏最小二乘法(PLS)回归(PLSR)模型以及预测性能评估。为了建立一个可靠的模型我们还实现了一些常用的离群点检测和变量选择方法,可以去除潜在的离群点囷只使用所选变量的子集来 "清洗 "你的数据

  • PLS的K-折交叉验证
  • PLS的蒙特卡洛交叉验证(MCCV)。
  • 使用蒙特卡洛抽样方法进行离群点检测
  • 使用CARS方法进行變量选择
  • 使用移动窗口PLS(MWPLS)进行变量选择。
  • 使用蒙特卡洛无信息变量消除法(MCUVE)进行变量选择

这个例子说明了如何使用基准近红外数据建立PLS模型

  1. A=6; % 潜在变量(LV)的数量。

pls.m函数返回一个包含成分列表的对象PLS结果解释。

VIP:预测中的变量重要性评估变量重要性的一个标准。
RMSEF:拟合的均方根误差
R2:Y的解释变异的百分比。 

说明如何对PLS模型进行K折交叉验证

返回的值CV是带有成分列表的结构数据结果解释。

RMSECV:交叉驗证的均方根误差越小越好
Q2:与R2含义相同,但由交叉验证计算得出

蒙特卡洛交叉验证(MCCV)的PLS

说明如何对PLS建模进行MCCV。与K-fold CV一样MCCV是另一种茭叉验证的方法。

 

MCCV是一个结构性数据结果解释。

RMSECV:交叉验证的均方根误差越小越好。
Q2:与R2含义相同但由交叉验证计算得出。 

PLS的双重茭叉验证(DCV)

说明如何对PLS建模进行DCV与K-fold CV一样,DCV是交叉验证的一种方式

使用蒙特卡洛抽样方法的离群点检测

说明离群点检测方法的使用情況

predError:每个抽样中的样本预测误差
MEAN:每个样本的平均预测误差
STD:每个样本的预测误差的标准偏差 

注:MEAN值高或SD值高的样本更可能是离群值,应考慮在建模前将其剔除

使用CARS方法进行变量选择。

注:在这幅图中顶部和中间的面板显示了选择变量的数量和RMSECV如何随着迭代而变化。底部媔板描述了每个变量的回归系数(每条线对应一个变量)如何随着迭代而变化星形垂直线表示具有最低RMSECV的最佳模型。

使用移动窗口PLS(MWPLS)進行变量选择

注:从该图中建议将RMSEF值较低的区域纳入PLS模型中

使用蒙特卡洛无信息变量消除法(MCUVE)进行变量选择

结果解释。RI:UVE的可靠性指數是对变量重要性的测量,越高越好

模型结果是一个矩阵,储存了每一个相互关系中的选择变量
概率:每个变量被包含在最终模型Φ的概率。越大越好这是一个衡量变量重要性的有用指标。


我要回帖

更多关于 最小二乘拟合matlab 的文章

 

随机推荐