郑剑1,2,周竹3,4,仲山民1,2,周厚奎3 ,4
1浙江农林大学农业与食品科学学院(临安311300);2.浙江省农产品品质改良技术研究重点实验室(临安311300):3.浙江省林业智能监测与信息技术研究重点实验室(临安311300);4.浙江农林大学,智慧农林业研究中心(临安311300)
摘要为了实现带壳褐变板栗的快速无损分选,研究了基于近红外光谱技术的褐变板栗粟测方法。实验在1 000-2 500 nm波段范围内采集带壳板栗的反射光利用竞争性自适应权重法(CARS)筛选波长变量,采用偏最小二乘一线性判别分析法(PLS-LDA)建立褐变板栗的识别模型,并与全光谱变量所建立的识别模型进行比较。结果显示,经二阶导数处理的光谱结合CARS-PLS-LDA方法可以有效识别褐变板栗,所建模型对测试集样本的敏感性、特异性和识别正确率分别为0.85%,0.90%和88.73%,优于未经变量优选的识别模型。筛选的波长变量个数为224个,仅占全部变量的14.390,不仅降低了模型复杂度,而且提高了识别准确率。研究结果表明,近红外光谱技术结合CARS与PLS-LDA可以检测带壳褐变板栗,为板栗的快速自动分选提供了理论依据。
关键词近红外光谱:褐变;竞争性自适应权重法;偏最小二乘一线性判别分析:板栗
板栗味道香甜,营养丰富,富含蛋白质、脂肪、维生素A、B1、B2、C和钙、磷、铁、钾等多种矿物质元素,是一种较为理想的保健食品来源。然而,板栗在贮藏和加工过程中易产生褐变,使板栗的口感和营养成分降低,严重影响板栗的品质,从而降低其经济价值。目前,褐变板栗的检测方法主要为肉眼观察,人工分拣,检测效率低下,难以满足板栗大批量
加工的需求。因此,开展褐变板栗快速检测分选研究对于板栗的贮藏与深加工具有重要的意义。
近红外光谱技术( NIRS)可利用近红外光谱区域( 780~2 500 nm)的全谱或部分波段光谱对被测物进行分析。因其无损、快速和便捷等优点,在果蔬等农产品品质检测中得到了广泛的研究。在板栗品质检测方面,周竹等和Moscetti等分别研究了带壳霉变板栗、虫害板栗的近红外光谱检测方法;刘洁和傅谊等建立了板栗主要成分如水分、蛋白质等的近红外光谱定量分析模型。上述研究表明:采用近红外光谱技术可以检测板栗的部分品质。然而,利用近红外光谱技术进行褐变板栗检测的研究不多。此外,近红外光谱通常包含1 000~2 000多个波长变量的光谱数据,采用全谱数据分析建模时,光谱中的大量冗余信息会增加模型建立的工作量,且易使模型产生过拟合,从而影响其稳定性。
试验提出采用近红外光谱技术检测带壳褐变板栗,拟采用一种较新的变量提取算法——竞争性自适应权重法( CARS)先对光谱波长变量进行优选,再应用偏最小二乘一线性判别分析法( PLS-LDA)建立带壳褐变板栗识别模型,并与未进行变量优选的模型进行比较,以期确定最优的带壳褐变板栗的检测方法与模型,为褐变板栗快速检测仪的研究与开发提供理论依据与技术支撑。
1材料与方法
1.1材料与仪器
1.1.1材料与试剂
供试板栗:产自山东沂蒙山和浙江丽水,市售。剔除虫害板栗,选取大小均匀的板栗,将其标号放置在4℃~6℃冷库中存放2个月,后取出在室温下放置10 d,至部分板栗内部出现不同程度的褐变,挑选试验用板栗640个。试验前,使待测样品与室温平衡。
1.1.2主要仪器与设备
傅里叶变换近红外光谱仪:Antaris II型,ThermoScientific Co.,USA。
1.2方法
1.2.1光谱采集
采用Antaris II傅里叶变换近红外光谱仪对板栗果仁进行光谱采集。该仪器使用InGaAs检测器,内置参比背景,光源为25 W卤素灯(仪器标配)。通过漫反射式积分球附件进行光谱采集。光谱扫描范围设置为1 000~2 500 nm,扫描次数为32次,分辨率为8cm-1。选择栗仁平整的面作为光谱采集面,选择栗仁平整面的中心及周边四个方位上等距的区域作为光谱采集点,并将5次采集的光谱平均作为该样品的原始光谱。
1.2.2栗仁褐变评价
光谱采集完成后,在平行采集面8 mm的位置切开板栗,以判断是否褐变及褐变程度。将板栗剖面置于A4打印纸上,采用Canon 5D3数码相机(分辨率5 184×3 456)对被切剖面拍照,拍照时使剖面正对镜头。图片通过ENVI 4.7( Research System Inc.,USA)选择感兴趣区域进行处理,计算褐变面积比(褐变面积占整个剖面面积的比例)。
1.2.3 CARS变量筛选
采用CARS进行光谱变量优选。CARS是一种模仿进化论中的“适者生存”原则进行变量筛选的新方法。其筛选过程如图1所示。该研究中,CARS的最大因子数和采样次数分别设置为20和10 000。
1.2.4建模方法及模型评价
采用PLS-LDA建立板栗褐变的识别模型。PLS-LDA是偏最小二乘法与线性判别分析法的有效结合,该方法先利用PLS算法对光谱矩阵和类别属性进行分解,然后将光谱矩阵的得分向量与类别属性进行线性判别分析。如利用m个得分向量建立PLS-LDA模型,则其判别方程为:
在PLS-LDA建模过程中,采用蒙特卡洛交互检验来确定最优主成分数,蒙特卡洛交互检验的取样比率为0.75,模拟次数为5 000。
所建模型的评价指标包括敏感性、特异性以及预测总正确率。其定义如式(2)~(4)所示。
式中:TP、TN、FP和FN分别表示真阳性、真阴性、假阳性和假阴性。试验中规定阳性和阴性分别代表正常板栗和褐变板栗。通常,敏感性、特异性以及总正确率越高,说明所建模型性能越好。
试验所有程序均在Matlab 2010a( The Math WorksInc.,USA)上运行实现。
2结果与分析
2.1板栗褐变的评价结果
试验共使用板栗样本640个。表1给出了试样的形态学参数。从表1中可以看出试样的各项形态学指标均在正常的分布范围内。通过切剖观察,最终确认463个板栗褐变,褐变面积比例范围为0.23%~100%。
图2为典型样本的剖面图。图3为463个褐变样本的褐变程度分布。图3表明:此次试验板栗褐变程度范围宽,试样数据具有很强的代表性。将所有褐变样本依据褐变面积比梯度以2:1比例进行划分,而正常栗仁样本则采用Kennard-Stone( KS)算法”71按照2:1比例划分,最终组成校正集的正常、褐变样本数分别为1 18和309个,组成测试集的正常、褐变样本数分别为59和154个。
2.2板栗的光谱分析
图4给出了正常板栗和褐变板栗的原始光谱及其偏差光谱。从图4中可以看出,正常板栗和褐变板栗的光谱在1 200,1 450和1 940 nm处均有明显的吸收峰,在1 780,2 180和2 276 nm附近均略有波峰。在板栗谱图中,1 200 nm附近区域为甲基和亚甲基中C-H键二级倍频的特征吸收谱带,1450 nm左右区域包含了水分和糖分中O-H基团伸缩振动的一级倍频信息,
1 940 nm为水分中O-H键伸缩振动和弯曲振动的组合频带特征谱带,1 780 nm反映了糖分中C-H键的一级倍频和蛋白质中N-H键的组合频信息,2 180 nm为蛋白质中羧基一级倍频和胺基耦合频谱带,2 276 nm则为淀粉中O-H基团和C-C基团伸缩振动的频谱带。从图4中还可以看出,正常板栗和褐变板栗的平均光谱图趋势基本相似,前者平均光谱吸光度要略高于后者,但它们的偏差光谱带部分重合。因此,需要进一步结合化学计量学方法对光谱进行分析处理,以便建立带壳板栗褐变的鉴别模型。
2.3 CARS变量优选
受近红外光谱仪器、光谱采集环境和试样等因素的影响,板栗光谱中常出现噪声、谱图基线漂移和平移等现象,为了减少上述因素的影响,应对原始光谱( None)进行光谱预处理。试验首先采用标准正态变量变换( SNV)、去趋势变换(Detrend)、一阶导数( FD)和二阶导数(SD)等方法对原始光谱进行预处理,随后采用CARS算法进行特征变量优选。
图5给出了原始光谱经二阶导数预处理后采用CARS法的选择示意图。图5(a)为优选过程中挑选的板栗褐变检测波长变量随采样次数的变化趋势,随着采样次数的增加,所选变量个数由快到慢递减,对应粗选与精选两个阶段;图5 (b)为交叉检验所得交叉验证错误率( CVE)的变化曲线,前2 916次采样所建模型的CVE值逐渐减小,表明变量选择过程逐步剔除了与褐变板栗检测无关的变量,从2 917次采样起所建模型的CVE开始增大,这表明选择过程剔除了与褐变板栗检测相关的关键变量;图5 (c)中“*”是建模过程中最小CVE所对应的采样次数,图中各线表示各波长变量回归系数随采样次数增加的变化趋势。最终,二阶导数预处理光谱经CARS变量选择后,共有224个变量被保留,如图6所示。
2.4模型的建立与比较
分别将各种光谱预处理下经CARS算法优选的特征波长所对应的光谱数据作为输入,采用PLS-LDA建立褐变板栗的识别模型。表2给出了不同光谱预处理所得特征波长的光谱数据所建模型的结果。为了突出特征波长所建模型的优越性,表2还给出了全波段光谱变量模型的结果。
从表2中可以看出,未采用CARS变量筛选之前,各种光谱预处理方法均不能有效提高褐变板栗识别率。无论是校正集还是测试集,各种预处理方法所建模型的特异性均较低( 0.53~0.74),表明褐变板栗的识别错误率较高。在经过CARS变量筛选之后,各种预处理方法均能提高褐变板栗的识别正确率。其中,二阶导数光谱预处理效果最优,224个波长变量所建PLS-LDA模型对校正集的敏感性、特异性以及识别正确率分别为0.97%.0.98%和97.66%,当模型用于测试集数据时,测试集的敏感性、特异性以及识别正确率分别为0.85%%,0.90%和88.73%。其他光谱预处理方法虽然也能提高识别准确率,且所用的波长变量个数更少( 46~62),然而由于丢失了一些褐变板栗识别的关键变量,校正集和测试集的敏感性较差( 0.61~0.69),意味着正常板栗不能被准确识别。
综上所述,应用近红外光谱技术结合CARS方法可以剔除一些板栗褐变检测无关的波长变量,从而快速准确地识别褐变板栗。板栗在加工过程中,脱壳是一个重要的步骤,若能采用光谱技术对带壳褐变板栗进行检测,可以使褐变板栗直接被剔除,减少不必要的脱壳,从而提高加工效率。可进一步采用近红外光谱技术研究不同产地,不同品种等因素下的褐变板栗识别,从而提高模型的适用性,以期在实际应用中取得满意的结果。
3结论
采用近红外光谱技术联合竞争性自适应权重法( CARS)对带壳褐变板栗进行快速无损检测研究。板栗二阶导数光谱经CARS变量筛选后获得的224个特征波长所建PLS-LDA模型对带壳褐变板栗的识别效果最优。该模型对校正集和测试集的敏感性、特异性和识别正确率分别为0.97%,0.85%,0.98%,0.90%,97.66%和88.73%。研究结果表明,采用CARS方法能有效筛选褐变板栗识别的重要波长变量,不仅能简化模型,而且可以提高识别准确率。
上一篇:何首乌保健酒制备工艺
下一篇:返回列表