专利名称:果品近红外光谱波长选择和快速定量分析方法及装置的制作方法
技术领域:
本发明涉及涉及了一种水果品质的近红外光谱快速准确定量分析的方法和装置, 特别是果品的近红外光谱进行波长选择和快速定量分析方法及装置。
背景技术:
随着近红外光谱分析方法和化学计量学方法的发展,近红外光谱分析技术在食品 和农产品品质检测中的应用日趋广泛。近红外光谱分析方法以其快速、无损、准确以及测量 和分析过程绿色等优点成为产品在线检测和快速分析首选的检测手段。近红外光谱分析技 术的应用关键是如何有效的从待测对象复杂、重叠、变动背景的光谱中提取相关信息。近红 外光谱的波长范围为750-2500 nm,每个波长对应的光谱均是某个因素或多个因素共同作 用结果的反应。因此,在近红外光谱建模过程进行波长优化选择是提取有效果光谱信息的 关键。波长选择不但可以简化模型,更重要的是能将不相关或非线性变量进行剔除,增强 校正模型的预测能力。因此波长选择对于近红外光谱分析具有重要意义。波长选择的实质 是搜寻波长点,即建模变量的最优组合,使得所建预测模型的预测误差最小。对于果品的近红外光谱而言,一条光谱包含有维生素C、糖分以及各种多酚类物质 的吸收或反射信息,而且各组分的谱带重叠严重,用单波长数据建立某一组分的校正模型 会产生较大的误差,然而,直接从光谱中选取波峰或波谷的吸收值作为组分的特征波长几 乎是不现实的。因此,在利用化学计量学方法对果品近红外光谱数据建立光谱预测模型时, 需要确定特征组分的相关波长点,从而减小建:驮げ庠怂闶奔洌约疤蕹旁氡冉系偷 光谱点,从而提高模型的预测精度。
发明内容
本发明提供了一种果品近红外光谱波长选择和快速定量分析方法及装置;该装置 和方法是根据光谱仪采集的光谱信号携带有待分析目标物信息的特点,结合快速的线性和 非线性计量方法对红外光谱进行准确快速定量分析。近红外光谱分析技术用于果品内部品质快速分析过程中,为了克服建模波长冗 余、运算时间长以及噪声信息引入模型的缺点,本发明提供了一种基于蒙特卡罗无信息变 量消除方法的波长选择方法和装置,用于提高果品近红外光谱预测模型的稳健性和精度。实现上述技术方案的装置包括经数据信号线相连的光谱仪、预处理器、波长筛选 器、偏最小二乘回归分析器。所述的近红外光谱的波长范围为780 nm - 2500 nm ;
所述的预处理器采取中心化和矢量归一化对光谱仪采集的原始信号进行处理; 所述中的波长选择器的核心算法是采用基于蒙特卡罗技术的无信息变量消除方法,该 方法采用蒙特卡洛技术计算变量的稳定性值。通过选择变量的稳定性值大小来确定保留的 变量,该方式简单方便。详细的算法步骤如下
(1)所有的样本被随机分成校正集和测试集。为保证预测样本的理化值全部被训练集样本的理化值所涵盖,使得预测结果更为准确,三个具有最高理化值的样本和三个具有最 低理化值的样本都放进训练集里;
(2)利用蒙特卡罗技术,从校正集里随机选取一定数目OVi)个样本建构PLS子模型,该 步骤被重复M次。然后,计I根据公式
进一步计算得到每个变量的稳定性值向量· (IXp);
(3)根据上述步骤得到的稳定性值,保留一定数目GV7.)的有用信息变量,用来建立PLS 回归模型。实际计算中,采用从高到低排列所有变量的稳定性数值,设定第乂个变量的稳 定性值为阈值(cutoff value),低于此阈值的稳定性值所对应的变量被移除。最佳乂数值 的选择采用交叉验证均方根误差(RMSECV)来选择。其中,乂就是通过波长筛选器处理后保 留的变量数;
所述的偏最小二乘回归分析器,是采用偏最小二乘回归方法,对经波长筛选器处理后 输出的变量矩阵建立预测模型并计算预测均方根误差(RMSEP)和预测相关系数O )并保 存;通过对不同保留波长数目下偏最小二乘回归模型的RMSEP和进行比较,并进行误差分 析,选取最佳的保留数目。最后将上述优化后的波长点保存,并用于后续水果样品品质的近 红外光谱预测分析。 由于本发明采用以上的技术方案,得到以下效果
通过波长筛选器,实现了近红外光谱建模波长的优。佣岣吡四P偷脑げ饩群 稳健性。完成了在较短时间内从近红外光谱仪得到近红外光谱信号并建立准确的定量模型 的操作,提高了近红外光谱定量分析的效率和精度。图1果品近红外光谱波长选择和快速定量分析方法和装置示意图; 图2水果样品的近红外光谱图3波长筛选器处理后各个波长点的稳定性分布图; 图4模型的交叉验证均方根误差随波长筛选器输出变量数目的变化图; 图5水果品质的参考值和经波长筛选器和偏最小二乘回归分析器优化处理后模型的 预测值的相关图。
具体实施例方式具体实施方式
结合下面实施实例进行说明。我们以梨的近红外光谱为例,对梨内 部的糖度指标经波长筛选后的模型进行分析。图1为果品近红外光谱波长选择和快速定量分析方法和装置示意图,图2为水果 样品的近红外光谱图,光谱范围为750 1800 nm,每条光谱包括1051个数据点。水果的光 谱经KS方法进行划分,按照2 1的比例划分为校正集和测试集,校正集用于建立模型,测 试集用于模型的检验和评价。采用蒙特卡洛采样方法,从校正集中随机选取义(这里取Ari= /7/2,其中/7为校正集的样本数),建立I个PLS回归模型(设定1=1000)。将所有PLS回归模
型的系数构成回归系数矩阵(J0)。根据公式
权利要求
1.果品近红外光谱波长选择和快速定量分析方法及装置,其特征在于包括数据信号 线相连的光谱仪、预处理器、波长筛选器、偏最小二乘回归分析器; 所述的近红外光谱的波长范围为780 nm - 2500 nm ; 所述的预处理器采取中心化和矢量归一化对光谱仪采集的原始信号进行处理; 所述中的波长筛选器的核心算法是采用基于蒙特卡罗技术的无信息变量消除方法,该 方法采用蒙特卡洛技术计算变量的稳定性值。
全文摘要
本发明涉及果品近红外光谱波长选择和快速定量分析方法及装置,包括数据信号线相连的光谱仪、预处理器、波长筛选器、偏最小二乘回归分析器;所述的近红外光谱的波长范围为780nm-2500nm。通过波长筛选器,实现了近红外光谱建模波长的优。佣岣吡四P偷脑げ饩群臀冉⌒。完成了在较短时间内从近红外光谱仪得到近红外光谱信号并建立准确的定量模型的操作,提高了近红外光谱定量分析的效率和精度。
文档编号G01N21/35GK102128805SQ20101060110
公开日2011年7月20日 申请日期2010年12月23日 优先权日2010年12月23日
发明者刘燕德, 郝勇 申请人:华东交通大学