光谱学与光谱分析SpectroscopyandSpectralAnalysis Vol41,No.5<ppl593-1601
May,2021
第41卷,第5期
2021年5月
王冬13,吴静珠2",韩平13",王坤2
1.北京农业质量标准与检测技术研究中心,北京100097
2.北京工商大学食品安全大数据技术北京市重点实验室,北京100048
3.农业农村部农产品质量安全风险评估实验室(北京),北京100097
摘要农产品及食品的品质与安全一直以来都是人们关注的焦点,不仅关系着人们的身体健康,而且关系着社会稳定甚至国家安全+由于农产品及食品的品质不合格引发的安全事件备受社会各界的广泛关注+对农产品及食品的品质的监管长久以来都是分析检测领域的重点和难点+我国人口众多,对农产品和食品的消费
量非常大+面对如此大量农产品及食品品质的无损快速检测需求,光谱法以其快速、无损、高效、环境友好、可现场检测等诸多特点,为农产品及食品品质的无损快速分析提供了良好的解决方案+然而,传统的光谱法在检测过程中所使用的数据量十分庞大,不仅在建立校正模型过程中会消耗大量时间,而且难以完成大量农产品及食品的品质在线高通量无损快速检测+大量数据的计算成为限制光谱类分析仪器工作效率的主要瓶颈之一,并且大量数据的计算对仪器设备的硬件配置也提出了非常高的要求,从而间接地提高了光谱分析技术的应用成本+近年来,关键变量筛选技术脱颖而出,并成为光谱分析的一个新热点+通过筛选,采用少量关键变量建立校正模型即可得到和全谱数据建模准确度相差无几的分析结果,从而可以有效提高分析仪器的工作效率并间接地降低光谱分析技术的应用成本,进而为农产品及食品品质的高通量检测提供了可靠的技术支持、为满足人民日益增长的美好生活需要提供科技保障+针对光谱关键变量筛选在粮食及粮食作物、蔬菜、水果、经济作物、肉类、食品品质与安全领域的无损检测应用进行综述,对光谱关键变量筛选技术的应用从筛选方法、应用范围、应用效果等方面进行了分类总结归纳,并就光谱关键变量筛选技术在农产品及食品品质无损检测中的应用从变量筛选方法特点及趋势、所选变量的稳定性和可靠性、所选变量的实际意义等方面进行了展望+
关键词光谱分析;关键变量筛选;无损检测;农产品品质;食品品质与安全
中图分类号:0657.33文献标识码:R DOI:10.3964".issn.1000-0593(2021)05-1593-09
引言
农产品和食品的品质优劣一直是人们关注的热点+农产品及食品品质与安全不仅关系着人们的身体健康,而且关系着社会稳定甚至国家安全+近年来,由于农产品及食品品质不合格导致的安全事件依然多发,造成了不良的社会影响+我国对农产品及食品的消费量非常大,对大量农产品及食品品质的无损快速检测成为当前亟待解决的问题+长久以来,对农产品和食品品质的高通量无损快速检测一直是分析检测领域的重点和难点
光谱分析法,尤其近红外光谱分析,以其无损、快速、高效、环境友好以及可实现在线及现场检测等诸多特点#为
农产品及食品品质无损快速检测提供了良好的解决方案+然而,传统的光谱分析法在分析过程中所涉及的大量数据成为该方法应用过程中的瓶颈,主要表现为3个方面:(1)庞大的数据量增加建模过程的计算成本;(2)庞大的数据量对仪器装备的硬件提出了很高的要求,间接增加了技术应用成本* (3)对样品的预测仍采用全谱数据导致仪器工作效率降低,无法满足农产品及食品品质高通量无损快速检测的需求+面对上述困难,近年来,尤其近十余年来,光谱变量筛选算法脱颖而出,并成为光谱分析的一个新热点⑵+通过对
收稿日期:2020-05-26,修订日期:2020-10-09
基金项目:北京市农林科学院科技创新能力建设专项储备性研究课题(KJCX20180409),北京工商大学
食品安全大数据技术北京市重点实验室开放课题(BUBD-2017KF-11),科技部国家重点研发计划项目(017YFD0201607)资助
作者简介:王冬,1982年生,北京农业质量标准与检测技术研究中心副研究员e-mail:
通讯作者e-mail:;*************
1594光谱学与光谱分析第41卷
光谱数据筛选关键变量#基于所选的少量关键变量数据即可建立准确度较高的校正模型#有效提高了工作效率#并间接地降低光谱分析的应用成本#进而为农产品及食品品质的高通量检测提供了可靠的技术支持+目前#常用的关键变量筛选算法主要有以下几个类型:(1)根据偏最小二乘(partial least square,PLS)模型的一些参数进行变量筛选如无信息变量消除(umnf。fmative variable elimination,UVE))竞争自适应重加权采样(competitive adaptive re-weighted sampling,CARS)等;(2)基于智能优化算法进行变量筛选如遗传算法(genetic algorithm,GA))模拟退火算法(simulated annealing,SA)等;(3)连续投影算法(successive projection algorithm,SPA)*(4)模型集分析策略变量筛选算法!78",如变量组合集分析(variable combination population analysis,VCPA))自举柔性收缩算法(bootstrapping soft shrinkage,BOSS)等*(5)变量区间选择算法如区间偏最小二乘(interval partial least square,iPLS)、移动窗口偏
最小二乘(moving window partial least square,MWPLS)+此夕卜,为了提高变量筛选算法所选变量稳定性,近年来,蒙特卡洛(Monte-Carlo,MC)方法皿⑴正越来越多地被运用到关键变量筛选过程中,通过多次蒙特卡洛方法抽样选择关键变量,对所选变量进行频次统计,以提高所选变量的稳定性+本文针对光谱关键变量筛选在农产品及食品品质无损快速检测中的应用,分别就粮食及粮食作物、蔬菜、水果、经济作物、肉类、食品品质与安全等方向进行综述,对光谱关键变量筛选技术的应用从筛选方法、应用范围、应用效果等方面进行了分类总结归纳,并就光谱关键变量筛选技术在农产品及食品品质无损检测中的应用从变量筛选方法特点及趋势、所选变量的稳定性和可靠性、所选变量的实际意义等方面进行了展望+
1光谱关键变量筛选在粮食及粮食作物品质无损检测中的应用
粮食是指烹饪食品中各种植物种子的总称,富含蛋白质、维生素、膳食纤维、脂肪等营养物质,是人们获取能量的最主要来源,是国家之根本,其重要程度不言而喻+对粮食的品质检测关系到粮食储备、流通、消费等诸多环节+—些学者就粮食及粮食作物品质的无损快速检测过程中关键变量的筛选进行了研究,并取得了一定的成果+
杨赛等[12"采用联合偏度算法(joint skewness algorithm)对玉米种子在438〜1000nm范围内的高光谱成像数据筛选关键变量,筛选了高光谱图像的最优波段,基于支持向量机分别建立了基于平均光谱、图像
熵及二者联合特征的种子分类模型*结果表明,在10个最优波段条件下,联合特征分类模型的识别准确度达到96.28%,高于全波段联合特征识别模型的93.47%+Wang等采用波段范围400〜1000nm 的高光谱成像研究玉米种子硬度、弹性和回弹性的变化,采用正交信号校正(orthogonal signal correction,OSC)对数据进行预处理,采用SPA算法筛选关键变量,结合PLS回归建立校正模型*结果表明,针对硬度、弹性、回弹性3个指标分别筛选了7个、7个和6个关键变量,OSC-SPA-PLS回归模型的预测测定系数(determination coefficient of prediction,用)分别为0.8365,0.8217和0.7930,预测均方根误差(root mean square error of prediction,RMSEP)分另U为0.21,0.05和0.06+Elhadi Adam等口""采用高光谱技术研究了玉米叶斑病的早期检测,整合了导向规则化随机森林(guided regularized random forest,GRRF)算法和传统随机森林(random forest,RF)算法用于分类*结果表明,健康玉米叶片和处于叶斑病侵染早期阶段的叶片之间,生化浓度存在统计学差异,有关的关键波长位于420,795,779,1543, 1747和1010nm*使用上述变量建立随机森林分类器的总体准确度为88%,kappa值为0.75+Wang等口5"使用高光谱遥感技术估算光合素的状况对于有效评估玉米产量的影响,采用连续小波变换(continuous wavelet transform, CWT)结合UVE算法筛选关键变量并建立PLS模型*结果表明,叶绿素Chi、类胡萝卜素Car的!分别为0.9435和0.8807,均方根误差(root mean square error,RMSE)分别为0.094和0.013,相对预测性能(ratio of prediction to deviation,RPD)分别为2.65和2.38+Gao等口6"采用随机森林算法基于高光谱成像数据研究了杂草和玉米的分类方法,筛选了30个关键变量并建立随机森林模型,对玉米、卷心菜、土大黄和桔梗的平均正确识别率分别为1000,0.789,0.691和0.752+宦克为等""采用CWT结合多元散射校正(multiple s
catter correction,MSC)及支持向量机(support vector machine,SVM)优化了小麦蛋白质定量模型,在优化参数下用CWT结合UVE、SPA筛选关键变量,并建立SVM模型, RMSEP达到0.39+Liang等口8"采用最小二乘支持向量回归(least square support vector regression,LSSVR)和随机森林回归(andom forest regression,RFR)估算小麦叶片氮含量,模型!不低于0.72+
由此可见关键变量筛选算法在粮食及粮食作物品质无损快速检测方面有一定的应用效果可为粮食及粮食作物品质的高通量无损快速检测提供技术支持+其中,恰当地选择关键变量甚至可以建立准确度更高的校正模型+
2光谱关键变量筛选在蔬菜品质无损检测中的应用
蔬菜是指可以做菜、烹饪成为食品的植物或菌类,是人们日常饮食中必不可少的食物之一。蔬菜可提供人体所必需的多种维生素和矿物质等营养物质,此外,蔬菜中还有多种多样的植物化学物质,是人们公认的对健康有效的成分,对慢性疾病、退行性疾病有很好的预防作用+目前,近红外技术已在蔬菜品质无损检测中得以应用[19",其中不乏一些学者就蔬菜品质无损快速检测过程中关键变量的筛选进行了研究,并取得了一定的成果+
Liu等!0"采用近红外光谱研究了除草剂胁迫下油菜叶片中总氨基酸含量测定模型,采用直接正交信号校正(direct OSC,DOSC)算法进行数据预处理,采用SPA选择关键变量,所建直接正交信号校正-连续投影
算法-最小二乘支持向
第5期光谱学与光谱分析1595量机(DOSC-SPA-east square SVM#DOSC-SPA-LSSVM)模
型的相关系数厂=0.9968+Zhang等!1"采用近红外光谱研究了除草剂胁迫下油菜叶片中天冬氨酸含量的定量模型#采用SPA#MC-UVE和随机森林算法选择关键变量;其中#SPA-LSSVM模型具有最佳预测性能#预测相关系数:p= 0.9962+罗微等!2"采用近红外光谱研究了白菜种子的鉴别#采用SPA选取特征波长#建立LSSVM模型和偏最小二乘判别分析(PLS-discriminat analysis,PLS-DA)模型#其中LSSVM模型的训练集和预测集识别率均达到100%+Anna Luiza Bizerra Brito等!3"采用近红外光谱研究了生菜分类#采用GA和SPA筛选关键变量#建立线性判别分析(linear discriminant analysis,LDA)模型;其中GA-LDA模型的预测集正确率达到95.4%+Su等采用近红外高光谱成像和傅里叶变换中红外显微光谱研究甘薯烹饪过程中成分的变化并鉴定甘薯品种#采用CARS算法结合SPA筛选关键变量#建立了5变量CARS-SPA-PLS预测模型#预测集^P=0.913+ Angel Dacal-Nieto等!5"将随机森林算法用于马铃薯块茎空心病的近红外高光谱检测#所建RF-SVM模型的分类正确率达到89.1%+Cen等!6"采用可见-近红外高光谱成像研究了冷害黄瓜的鉴别#采用信息特征选择(mutual information feature selection,MIFS)#最大相关最小冗余(max-relevance min-redundancy,MRMR)和顺序前向选择(sequential forward selection,SFS)算法筛选关键波段#结合贝叶斯判别、SVM)K最临近(K-nearest neighbor,KNN)算法建立判别模型;结果表明,SFS-SVM模型的判别准确率达到90.5%〜100%+Andre M K Pedro等⑵"采用近红外光谱测定番茄产品中的总
固形物、可溶性固形物和天然素含量,采用SPA 筛选关键变量,并建立PLS模型;结果表明#总固形物、可溶性固形物、番茄红素、(胡萝卜素的相关系数(:)分别为0.9998,0.9996,0.9996和0.9981,RMSEP分别为0.42,0.63,21.58和0.73+Wu等!8"采用可见-短波近红外光谱对干紫菜中的蛋白质含量进行定量检测,对数据采用标准正态变量变换(standard normal variate,SNV)预处理,建立了UVE-SPA-LSSVM,SPA-LSSVM,UVE-SPA-PLS, SPA-PLS,UVE-SPA-MLR,SPA-MLR模型,其中采用了UVE的模型较未采用UVE的模型,其RPD值平均提高3866%+Xiao等!9"采用近红外高光谱成像测定双抱蘑菇切片中可溶性固形物含量(soluble solid content,SSC),采用OSC进行数据预处理,采用CARS算法筛选关键变量,采用SVM建立校正模型+结果表明,所建模型!P=0.883,RPD =3.04+Kaveh Mollazade3采用可见-短波近红外高光谱成像研究了纽扣蘑菇褐变的无损鉴别#采用CARS算法筛选关键变量,建立PLS-DA模型,识别蘑菇褐变的准确率,校正集和验证集分别为80.6%和80.3%+
从以上内容可见,变量筛选算法在蔬菜品质无损快速检测中具有较好的应用效果,可为大量蔬菜的品质无损快速检测提供技术支持+其中不乏将多种变量筛选算法相结合的报道,例如将UVE与SPA相结合,在消除无信息变量的基础上进一步去掉变量间的共线性,其对关键变量的筛选结果优于单一变量筛选算法+3光谱关键变量筛选在水果品质无损检测中的应用
水果是指多汁且主要味觉为甜味和酸味、可食用的植物果实+水果不但含有丰富的营养物质,而且具有促进消化等保健作用+水果品质无损快速分级正成为主流趋势#而基于近红外技术对水果进行无损快速检
测则可为水果品质无损快速分级提供有效的解决方案+根据水果品质的不同制定差异化价格进行销售,更好地实现物尽其用,在提高水果利用率的同时还可避免浪费+—些学者就水果品质无损速测过程中关键变量的筛选开展了研究,并取得了一定的成果+王转卫等!1"采用近红外漫反射光谱研究了富士苹果品质指标的无损快速检测方法#采用主成分分析(principal
component analysis,PCA)、SPA和UVE筛选关键变量,并结合LSSVM和极限学习机(extreme learning machine, ELM)建立校正模型;结果表明,SPA-ELM模型预测SSC, pH值准确度更高,RMSEP分别为0.44和0.0068,PCA-ELM预测硬度、含水率准确度更高,RMSEP分别为0.26和0.62。Che等!2"采用可见-短波近红外光谱研究了苹果淤伤的检测,采用随机森林算法筛选关键变量,平均准确度达到99.9%,并根据随机森林模型优选出675和960nm附近2个特征波段+Dong等[33]采用近红外高光谱成像对富士苹果在13周储存期内的SSC、硬度、水分和pH进行无损检测,采用SPA、UVE算法筛选关键变量,并结合PLS、LSSVM A反向传递网络建模(back propagation network modeling,BPNM)方法建立校正模型;结果表明,全部模型均可准确预测SSC和水分,SPA-LSSVM和全谱BPNM可粗略估算pH值,而采用上述任何模型预测硬度皆无法得到准确结果+在预测SSC、水分和pH值方面,SPA-LSSVM模型更具综合性,预测相关系数分别为0.961,0.984和0.882。Li 等采用近红外光谱研究了梨中SSC的无损检测,采用MC-UVE和SPA算法相结合筛选关键变量,结合PLS算法建立校正模型;结果表明,与MC-UVE-PLS和SPA-PLS模型相比,MC-UVE-SPA-PLS模型稳健性更好,而采用MC-UVE-SPA-PLS模型的18个关键变量
所建SSC模型的校正集、预测集相关系数()分别为0.88和0.88,RMSE分别为0.49和0.35+进一步地,Li等!5"采用可见-近红外光谱研究了多品种梨硬度的无损检测,采用MC-UVE-SPA从全谱1344个变量中筛选了17个关键变量,分别结合PLS和LSSVM建立校正模型;结果表明,MC-UVE-SPA-LSSVM 模型预测准确度更高,“翠冠”、“黄花”、“清香”三种梨的预测集相关系数(:)分别为0.94,0.93和0.92,RMSEP分别为0.91,0.92和0.96。Zhang等!6"采用可见-短波近红外高光谱成像研究了砀山梨糖含量的无损快速检测,采用MC-UVE#SPA#CARS#GA#CARS-SPA和GA-SPA筛选关键变量,分别结合PLS、LSSVM、反向传递人工神经网络(back propagation-artificial neural network,BP-A N N)建立校正模型;结果表明,CARS-PLS和GA-SPA-PLS模型准确度更高,预测相关系数(:》”)分别为0.8971和0.8969,RM-
1596光谱学与光谱分析第41卷
SEP分别为0.39%和0.35%+Guo等⑶"采用近红外光谱研究了4个品种桃的无损鉴别#采用PCA#UVE和SPA分别从全谱2074个变量中筛选出8个主成分、1067个、10个特
征波长#分别结合LSSVM和ELM建立桃品种鉴别模型;结
果表明#PCA-LSSVM#UVE-LSSVM模型以及PCA-ELM 模型的准确率可达到100%#其他模型准确率皆不低于96%+Zhang等!8"采用可见-短波近红外高光谱成像检测桃表面缺陷#采用MC-UVE和SPA筛选关键变量#结合PLS
算法建立判别模型;结果表明#基于少量特征波长可建立人
工缺陷、非人工缺陷模型#人工缺陷、非人工缺陷、对照和样品总准确度分别为87.5%#96.7%#95.0%和93.3%+Yu 等!9"采用可见一短波近红外高光谱研究枇杷缺陷的识别#采用CARS算法选择了12个关键变量#结合PLS-DA算法建
立判别模型;结果表明#CARS-PLS-DA模型对有缺陷枇杷的总体识别准确率为92.3%+Huang等嗣采用可见-近红外
高光谱成像研究了桑葚中总花青素含量和抗氧化活性的检
测#采用SPA,UVE和CARS三种波长选择算法筛选关键
变量#结合PLS和LSSVM建立校正模型;结果表明#9变
量CARS-LSSVM模型预测总花青素含量的准确度更高#交
互验证!2=0.959,RPD=4.964,而18变量CARS-LSSVM
模型预测抗氧化活性的准确度更高,交互验证!2=0.995, RPD=14.255+Zhao等⑷"采用可见-短波近红外高光谱成像研究桑葚中总可溶性固形物(total soluble solid,TSS)的检
测,采用随机蛙跳(random frog,RF)算法从512个变量中筛
选关键变量,结合PLS,LSSVM建立TSS的校正模型;结
果表明,RF-LSSVM(径向核函数)模型的校正集、交互验证
集、预测集相关系数$)分别为0.999,0.958和0.956,校正
均方根误差(root mean square error of calibration,RMSEC)、
交互验证均方根误差(root mean square error of cross validation,RMSECV)、RMSEP分别为0.061,0.453和0.430。Elfatih Abdel-Rahman等!2"采用可见-近红外高光谱数据研究甘蔗叶中氮浓度的检测,采用随机森林(random forest,
RF)算法筛选关键变量,结合逐步多元回归算法建立校正模型;结果表明,非线性RF回归模型测定系数!2=0.67,验证均方根误差(root mean square error of validation,RM-SEV)=0.15%+Zhang等!3"采用可见-短波近红外光谱建立哈密瓜SSC校正模型,采用CARS,UVE,CARS-SPA,
UVE-SPA筛选关键变量,分别结合PLS和LSSVM建立校正模型;结果表明,哈密瓜赤道区域多光谱模型略优于总体
多光谱模型,UVE-SPA-PLS模型和CARS-SPA-LSSVM模
型预测相关系数(!p)分别为0.9143和0.9143,RMSEP分别为0.8359和0.8958+Hu等[⑷采用可见-短波近红外光
谱对哈密瓜SSC进行定量测定,采用SPA,MC-UVE,
CARS和MC-UVE-SPA筛选关键变量,结合多元线性回归(multiplelinearregression,MLR),PLS和LSSVM建立校正模型;结果表明,MC-UVE-SPA筛选的18个变量建模准确度更高,MC-UVE-SPA-PLS,MC-UVE-SPA-LSSVM, MC-UVE-SPA-MLR模型预测哈密瓜SSC的RMSEP在0.95〜0.99之间+Mithun等!5"采用高光谱数据结合RGB 数据对天然成熟和人工催熟香蕉进行识别,采用随机森林(random forest,RF)筛选关键变量,结合多层感知前向神经网络建立校正模型,自然成熟和人工催熟香蕉的识别准确度分别达到9874%和89.49%+
从以上内容可见,变量筛选算法在水果品质无损快速检测中具有较好的应用效果,可为大量水果的品质无损快速检测提供技术支持,将为水果收购入库、精品出库、分级销售过程中的品质无损快速检测提供重要技术支持+
4光谱关键变量筛选在经济作物品质无损检测中的应用
经济作物亦称-工业原料作物.一般指为工业,特别是轻工业提供原料的作物+我国纳入人工栽培的经济作物种类繁多,包括纤维作物(如棉、麻等)、油料作物(如芝麻、花生等)、糖料作物(如甘蔗、甜菜等)、三料(饮料、香料、调料)作物、药用作物、染料作物、观赏作物、水果和其他经济作物等+近年来,近红外技术越来越多地被应用于经济作物品质的无损检测!6",其中一些学者就关键变量筛选进行了探索并取得了一定的成果+
Zheng等基于CARS算法提出稳定CARS(stable CARS,SCARS)算法,用于建立烟草品质模型过程中关键变量的筛选;结果表明,与MWPLS,MCUVE和CARS相比,SCARS可选择更少的变量,所建PLS模型的潜变量数更少且RMSECV更小。买书魁等!8"采用近红外光谱建立酿酒高粱中支链淀粉和直链淀粉的定量分析模型,采用UVE, SPA,UVE-GA和UVE-SPA筛选关键变量,结合PLS算法建立校正模型;结果表明,基于UVE-GA筛选关键变量所建模型具有更高的准确度,支链淀粉、支链淀粉!2分别为0.9523和0.9417,RMSEP分别为1.28和0.09,RPD分别为12.1和34.18+陈斌等!9"采用近红外光谱建立油菜籽含油率定量分析模型,采用CARS,GA,SPA,UVE,向后区间偏最小二乘(backward interval partial least squares,BI-PLS)、协同区间偏最小二乘(synergy interval partial least squares,SIPLS)算法筛选关键变量,结合PLS、LSSVM建立定量分析模型;结果表明,对于PLS模型,BIPLS-GA所选的26关键变量建模效果最好,预测相关系数(p)、RMSEP分别为0.9330和0.0075,对于LSSVM模型,SIPLS-GA所选的13关键变量建模效果最好,预测相关系数(p)、RMSEP分别为0.9192和0.0055+Sun等!0"采用近红外高
光谱成像研究茶叶中水分的分布情况,分别采用SPA, CARS,SPA-逐步回归(stepwise regression,SR),CARS-SR 算法筛选关键变量,结合MLR建立校正模型以实现茶叶中水分分布的可视化;结果表明,采用Savitzky-Golay平滑结合多元散射校正(multiple scattering correction,MSC)预处理,结合CARS-SR-MLR所建模型具有更好的预测性能,!P 和RMSEP分别为0.8631和0.0163+Cecilia Masemola 等将蒙特卡洛交互验证CARS(Monte-Carlo cross validation CARS,MCCV-CARS)用于桉树叶片可见-近红外光谱的关键变量筛选,结合PLS算法建立氮含量校正模型;结果表明,鲜叶片、干叶片氮含量模型!P分别为0.82和0.88,
第5 期光谱学与光谱分析
1597
RMSEP 分别为0. 14和0.13+耿响等!52"采用近红外光谱建 立棉、麻样品鉴别模型#采用UVE , SPA 和CARS 算法筛选
关键变量#结合PLS 建立判别模型;结果表明# CARS 算法
将原光谱1 475个变量减少至67个#所建PLS 模型较另两 种算法更佳#校正测定系数(!C )、RMSEC 、交互验证测定系
数
(!
C v )、RMSECV 分别为 0.987, 1.24%, 0.980 和
1.57% + Yuan 等!53"将4种变量筛选算法CARS , MC-UVE ,
SPA,特征投影图(latent projective graph, LPG)用于茯苓近 红外光谱关键变量的筛选,并建立PLS-DA 模型;结果表 明,PCA 模式空间中,白茯苓和茯苓皮表现出明显差异,针 对白茯苓、茯苓皮所选关键变量数分别为13和10,根据变 量筛选结果所建Fisher 判别函数模型可靠且有效+ Xie 等!54"
采用傅里叶变换近红外光谱(Foufier-ransform near-infrared
spectroscopy, FT-NIRS)测定发酵冬虫夏草菌丝体中精氨酸
含量,采用CARS 和SPA 筛选关键变量,结合LSSVM 算法
建立校正模型;结果表明,CARS-LSSVM 模型的!P , RM
SEP 和RPD 分别为0. 837 0, 0. 084 1和2. 474 1,经关键变
量筛选,输入变量数仅占原变量数的2.04% +从以上内容可见,变量筛选算法在经济作物品质无损快
速检测中具有较好的应用效果,可为经济作物的品质无损快
速检测提供技术支持,进而可为提高产品附加值、增强产品
市场竞争力提供技术保障+
5光谱关键变量筛选在肉类品质无损检测中
的应用
肉类是指动物的皮下组织和肌肉,可以提供丰富的蛋白
质、脂肪和热量+我国肉类消费总量近年来稳居世界前列*
在采用近红外技术研究肉类品质的无损快速检测!5556"中,针 对肉类品质无损检测过程中的关键变量筛选,一些学者进行
了探索并取得了一定的成果+
马世榜等!57"采用可见-近红外光谱对生鲜牛肉挥发性盐 基氮进行定量分析,采用UVE 和SPA 筛选关键变量,结合
LSSVM 建立校正模型*结果表明,Savitzky-Golay 平滑后,
UVE-SPA-LSSVM 建模使变量数减少了 99.5% ,预测相关 系数和标准差分别为0.925和4.615 mg ・(100 g ) 1 + Pu
等!58"采用近红外高光谱成像研究羔羊肉品质无损检测,采
用 UVE, SPA,克隆选择算法(clonal selection algorithm,
CSA)筛选关键变量,并将三种方法结合为UVE-SPA-CSA ,
经过合并与优化,对蛋白质、脂肪、水含量采用7个关键变
量建立MLR 模型*结果表明,脂肪、蛋白质、水含量的校正
相关系数$c )分别为0. 95, 0. 80和0. 91, RPD 分别为4. 13,
1. 31和
2. 53+王文秀等!59"采用可见-短波近红外、长波近红
外及二者融合数据建立猪肉脂肪、蛋白质定量分析模型,采 用 CARS 、随机蛙跳(random frog , RF )、MC-UVE-SPA 算
法筛选关键变量*结果表明,融合数据基于CARS 筛选变量
数据建模效果最佳,脂肪、蛋白质PLS 模型相关系数S )分
别为0. 950 5和0. 951 0+ Jia 等!0"采用可见-短波近红外高光
谱成像研究鲜鸡胸肉pH 值,采用CARS 算法筛选了 20个
关键变量,建立PLS 回归模型*结果表明,基于所选关键变
量建模的验证集测定系数!V ), RMSEV 和RPD 分别为
0. 94, 0. 06和3. 55,作为对比,未选择变量建模的! , RM SEV 和RPD 分别为0.87, 0.16和2. 02+崔腾飞等皿采用
近红外高光谱成像技术研究富硒鸡蛋、无公害鸡蛋、普通鸡 蛋的鉴别,从卷积平滑、基线校正、SNV
、标准化四种预处
理中优选卷积平滑作为数据预处理方法,采用SPA , UVE 和BIPLS 分别筛选了 8, 107和155个关键变量,并分别建
立全谱(full spectra , FS ) , SPA , UVE , BIPLS 的 PLS-DA 模
型* 结果表明 BIPLS-PLS-DA 模型识别准确率最高 校正
集、预测集识别率分别为95. 24%和78 18% + Wu 等!2"采用 高光谱成像研究了虾中掺入明胶的检测,采用UVE 结合
SPA 筛选关键变量,采用LSSVM 算法建立校正模型*结果
表明,UVE-SPA 从原光谱462个变量中筛选出13个关键变
量,基于关键变量所建LSSVM 模型预测测定系数(!P )达到
0.965+ He 等!3"采用高光谱成像建立三文鱼中假单胞菌分
布模型,分别采用SPA 和CARS 算法筛选关键变量,结合
PLS 回归算法建立校正模型* 结果表明 CARS-PLS 模型更
优,其预测测定系数!P)和RMSEP 分别达到0. 91和0. 49 +
Cheng 等抽"采用可见-短波近红外高光谱成像研究针对鱼片
活菌计数的可行性,采用连续投影算法筛选了 7个关键波长
变量,分别结合PLS 和LSSVM 算法建立校正模型*结果表
明,SPA-PLS 模型效果更优,其预测测定系数!P , RMSEP
北京食品和 RPD 分别为 0. 90 , 0. 57 和 3. 13 +
从以上内容可见 变量筛选算法在肉类品质无损快速检
测中具有较好的应用效果 其中不乏采用所选关键变量建立
模型优于全谱建模的例子,可为肉类品质无损快速检测提供
技术支持 进而可为提高产品附加值、 增强产品市场竞争力
提供技术保障+
6光谱关键变量筛选在食品品质与安全无损
检测中的应用
食品一直以来是人们获取能量的重要来源 对人类的重 要性不言而喻+食品安全(food safety )指食品无毒、无害,符
合应当有的营养要求,对人体健康不造成任何急性、亚急性 或者慢性危害+食品安全不仅关系着人们的身体健康,还关
系到社会稳定甚至国家安全+在食品品质与安全无损检测方
面,近红外技术近年来得以广泛应用*面对巨大的检测工作
量,一些学者就光谱变量筛选在食品品质与安全无损检测中
的应用开展了研究,并取得了一定的成果+
Li 等!5"采用傅里叶变换近红外光谱建立苹果汁掺假的
鉴别模型,采用SPA 结合遗传算法(genetic algorithm ,
GA )、粒子优化算法(particle swarm optimization , PSO )、
组搜索优化器(group search optimizer , GSO )、萤火虫算法
(firefly algorithm, FA)四种智能优化算法筛选关键变量,
并结合PLS 算法建立校正模型*结果表明,SPA-PSO 算法
可将建模变量数降低至4个,基于4个关键变量数据的PLS
模型预测测定系数(!P )、RMSEP 分别为0. 998 6和
0.062 8+ Wu 等!6"采用近红外、中红外光谱建立奶粉中钙含
量的定量校正模型,采用UVE 结合SPA 筛选关键变量,分
发布评论