作者:郑晓敏
传统的材性分析方法繁琐耗时,无法满足实时快速测定的需求…。近红外光谱(770~2500 nm)属于分子振动的倍频与合频光谱,能够反映含氢基团X-H的吸收信息,其中X为0、C、N、S等。用化学计量学方法在近红外光谱图和样品物化性质之间建立数学模型,可以快速、高效、无损地预测未知样品相应的信息数据。近年国内外学者利用近红外光谱技术在制浆造纸工业原料分类、纤维长度测定、纸浆得率与性能预测等方面做了大量研究,同时也对制浆原料材性的分析预测进行了较深入的探索。He W等人用常规方法测定了制浆材样品的木素、纤维素含量,建立了校正模型,验证了近红外光谱技术预测制浆材化学成分的可行性。多种松树样本,建立用于预测纤维素和木素的全局性近红外模型,均能满足定量分析的要求;同时得出种类齐全、数量足够多的样本集有助于提高模型的准确性和稳定性的结论。通过线性和非线性方法解析近红外光谱,成功预测了蓝桉、火炬松和长叶松的基本密度。但以满足制浆造纸工业的实际应用为目标,针对单一树种主要材性的综合研究较少。
杨木培育周期短、适应性强、纤维形态好、综纤维素含量及原木白度高,是优良的制浆造纸原料。其中欧美杨、意大利杨、美洲黑杨及近年培育成功的三倍体毛白杨在我国种植范围最广,使用最多。本实验测定了这4种常用制浆杨木样品及其混合样品的综纤维素、木素、苯-醇抽出物含量及基本密度,结合其近红外光谱使用偏最小二乘法( PLS)建立校正模型,以满足对未知杨木样品材性的快速测定。
1实验
1.1原料
实验以欧美杨、意大利杨、美洲黑杨和三倍体毛白杨4种制浆造纸中常用的杨木原料为样品。选取具有代表性的植株,按常规取样方法去皮后切削成统一规格,纵向厚度约为2 mm,截面尺寸约为20 mm×10 mm的木片,分树种共采集77个样品。另将4种木片以任意比例随机混合,组成32个混合样品。待采集全部光谱及材性数据后,每种杨木随机选取4个样品,混合杨木随机选出8个样品,共24个样品组成具有代表性的验证集用于模型的独立验证,其余85个样品作为校正集用于模型的建立。样品来源及使用情况见表1。
1.2仪器与样品光谱采集
采用华夏科创仪器有限公司研发的阿达玛近红外光谱仪获取样品近红外光谱。与常用的傅里叶光谱仪相比,阿达玛近红外光谱仪采样点少,但其内部部件集成于一块电路板且没有运动部件,易改装为适宜制浆造纸生产环境的实时检测设备,且该光谱仪微镜表面为防潮性较好的铝材料,工作温度为-10~ 75℃,适应性强。仪器光源为卤钨灯光源,检测器为In-GaAs;设定仪器参数如下:扫描波长范围为1600~2500 nm;分辨率为8 cm-1;采样点为100;光谱重复扫描次数为50次。采集校正集与验证集样品的近红外光谱,为充分获取木片信息,每个样品重复装样3次,取其平均光谱为样品原始光谱。
1.3样品材性测定
全部样品采集完近红外光谱后,置于粉碎机中磨成木粉并过筛,选取能通过0.38 mm筛孔而不能通过0.25 mm筛孔的木粉,按GB/T 2677.10-1995测定综纤维素含量,GB/T 2677. 8-1994测定酸不溶木素含量,GB/T 2677. 6-1994测定苯.醇抽出物含量。基本密度依据澳大利亚标准Appita PIS-79/Standard-October 1979木片基本密度的测定方法测定。样品采集数据时做2份平行样,取其平均值为测定值。
1.4分析过程与评价标准
近红外光谱法的分析过程分为如下部分:采集原始数据;对近红外光谱进行预处理;在提取不同主成分数时采用偏最小二乘法( PaItial Least Squares,PLS)和交互验证建立校正模型;当预测残差平方和( Prediction Residiual Error Sum of Squares, PRESS)最小时,校正模型为最优,此时对应的主成分数为最佳主成分数;对校正模型进行独立验证,确定模型对单一样品和混合样品的预测情况。
RPD值是验证集的标准差与RMSEP的比值,目的是将模型对验证集样品的预测结果标准化。通常RPD值大于3,说明模型质量好,可用于质量控制;RPD值接近1时,模型没有实际价值。
而AD直观反映了预测值和真实值之差,应在模型实际应用时许可的误差范围以内。
2结果与讨论
2.1样品测定值分布
杨木样品的综纤维素、木素、苯一醇抽出物含量及基本密度分布如表2所示。由表2可知,4种杨木样品的综纤维素含量为76. 52%。81. 32%,标准差为1. 38 %;木素含量为16. 83%~22. 01%,标准差为1. 41%;苯-醇抽出物含量为1.14%~3.78%,标准差为0.67%;基本密度在0. 3426~0.4108g/cm3的区间上,标准差为0. 0181g/cm3。测定值总体分布较均匀,利于建立稳定准确的校正模型。
2.2样品的近红外光谱
图1为4种杨木样品的近红外光谱图,横坐标为光谱波长,纵坐标表征样品对光谱的吸收强弱。由图1可见,4种杨木样品的材性不同,近红外光谱曲线存在差别,这为材性的快速测定奠定了基础。
2.3光谱预处理及模型的建立
由于噪声信号、样品状态等对谱图的干扰,建模之前往往要对原始光谱进行预处理,以消除噪音信息,增加样品之间的差异,从而提高模型的稳定性和适用性。常用预处理方法有均值中心化、一阶导数、二阶导数、多元散射校正( MSC)、标准正态变量变换(SNV)、正交信号校正(OSC)等。用Matlab7.0软件分别对4个待建模型对应的原始谱图进行预处理,所用预处理方法如表3所示。为精确建立模 型,往往对建模波段进行优选,以减少多余光谱信息的影响。但阿达玛近红外光谱仪采样点为100,小于常见傅里叶光谱仪103数量级的采样点个数,在近红外光谱吸收带较宽且重叠严重的前提下,难以做到精确区分谱带归属而不损失较多信息量,故本研究使用全光谱区间参与建模。
利用Matlab7.0软件,通过交互验证的方法确定最佳主成分数。对某一主成分数^,从校正集中每次选取一个样品,对校正集中其余样品使用偏最小二乘法( PLS)建立校正模型来预测此样品。再从校正集中另外选取一个样品,重复上述过程。经反复建模及预测,直到校正集中每个样品均被预测一次且仅被预测一次,则得到对应这一主成分数的PRESS值,当PRESS值最小时,对应的主成分数为最佳主成分数,此时校正模型质量最优。表3显示了各最优校正模型相应的最佳主成分数。由表3知,综纤维素模型的 R2cv值为0.9381,RMSECV值为0.34%;木素模型的 R2cv值为0.9430,RMSECV值为0.29%;苯-醇抽出物模型的R2cv值为0.9391,RMSECV值为0.15%;基本密度模型的R2cv值为0.9267,RMSECV值为0.0044 g/cm,:4个模型的R2cv值均接近1且RMSECV值较小,模型相关性和准确性较好。校正模型的预测能力需结合独立验证来进一步评价。
2.4独立验证
用建立好的校正模型对验证集中单一杨木样品和混合杨木样品分别进行预测并与标准方法的测定值比对。结果显示,模型对单一样品和混合样品的预测情况不存在明显差异,模型同样可以用于混合杨木样品的预测,详细数据见表4。用整个验证集对4个模型进行独立验证,相关参数见表3。由表3可知,各模型的R2cv值均小于R2cv值,RMSEP值均略大于
RMSECV值,可见验证集样品具有代表性,建模和预测过程中不存在较大的误差。综纤维素、木素、苯-醇抽出物及基本密度模型的RPD值分别为3.24、3. 33、3.36和3.46,模型质量好,可适用于质量控制。RMSEP分别为0.40%、0.42%、0.19%和0.0050g/cm3,AD范围分别为-0.49%~0.77%、-0.66%一0.63%、-0.28%一0.33 %、-0.0094~0. 0068g/cm3,基本满足制浆造纸工业在线快速测定的误差要求。用综纤维素、木素、苯.醇抽出物及基本密度的预测值和实测值分别做散点图,结果见图2—图5。由图可知,预测值和实测值分布在450线两侧且偏差不大,模型有良好的稳定性。
3结论
3.1用常规方法测定了4种杨木共109个样品中的化学成分含量和基本密度并采集样品近红外光谱,经预处理后用其中85种样品作为校正集分别建立综纤维素、木素、苯-醇抽出物、基本密度的校正模型,模型交互验证的决定系数(R2cv)分别为0.9381、0.9430、0.9391、0.9267;交互验证均方根误差(RMSECV)分另0为0. 34%、0.29%、0.15%、0.0044g/cm3,模型相关性和准确性较好。
3.2用4个校正模型分别对验证集中的24个样品进行预测,独立验证的决定系数(R2cv)分别为0.9050、0.9098、0.9112、0.9165;预测均方根误差 (RMSEP)分别为0.40 %、0.42%、0.19%和0.0050g/cm3;相对分析误差( RPD)分别为3.24、3.33、3.36和3.46;绝对偏差范围分别为- 0.49%~077%、-0.66%~0.63%、-0.28%~0.33%、-0. 0094~0.0068g/cm3。模型对单一样品和混合样岳的预测情况不存在明显差异,且基本满足制浆造纸工业快速测定中的误差要求,可用于实际生产中杨木样品及混合杨木样品的快速测定。
3.3本实验采用的杨木样品材性数据分布较均匀,模型具有较好的代表性和准确性。可以用近红外光谱法全面地预测制浆造纸常用杨木的材性,为制浆造纸工业实时分析和在线检测的实现提供了可能。