半监督最小二乘支持向量回归机

在近红外光谱定量分析中,样品化学值测定的准确度是运用数学模型进行定量分析精确度的理论极限。但能够准确获取化学值的样品数量比较少,许多模型在建模时只考虑这部分样品数据,而不考虑大量的无化学值的样品数据。针对该问题,本文在LS-SVR的基础上,提出了可以同时利用有化学值(标签)和无化学值样品数据的半监督LS-SVR(SLS-SVR)模型。类似于LS-SVR,该模型也只需求解一个线性方程组。最后,以烤烟样品数据集为实验材料,建立了四种样品成分(总糖、还原糖、总氮和烟碱)的定量分析模型。四种样品成分的预测值与实际值的平均误差分别为6.62%,7.56%,6.11%和8.20%,相关系数分别为0.974 1,0.973 3,0.923 0和0.948 6。经分析比较发现SLS-SVR模型优于PLS和LS-SVR,从而验证了SLS-SVR模型的可行性和有效性。