鸡蛋新鲜度为鸡蛋运输、加工以及销售等环节中所需要考察的重要指标。随着鸡蛋新鲜度越来越受重视,新鲜度检测水平亟待提高,其中优化新鲜度检测模型、提高检测效率至关重要。近年来,国内外学者运用光谱分析、介电特性、电子鼻、机器视觉等检测技术对鸡蛋新鲜度无损检测进行了相关理论研究。其中光谱分析技术因其具有采样速度快、操作方便等特点一直都是鸡蛋新鲜度常用且有效的检测手段,通过采集鸡蛋光谱数据结合数学运算处理方法获取新鲜度信息。
为了提高鸡蛋新鲜度光谱分析速率,减少光谱噪声信息的影响,通过对光谱数据进行相关处理以优化模型虽然特征选择或者特征提取在一定程度上降低了数据运算量、提高了检测效率,但是使用中仍可能出现以下问题,一方面特征提取是将光谱数据从高维度空间通过运算映射到一个低维度空间中,再利用低维数据进行建模,其光谱数据参与运算的数量本质并没有减少;另一方面特征选择法获得的波长个数可能出现较多的情况。
因此,针对上述问题,湖北工业大学农机工程研究设计院的段宇飞和华中农业大学工学院的王巧华结合特征选择和特征提取方法的优势,将两者进行有机融合,首先运用竞争性自适应重加权(CARS)算法特征选择获取一阶微分处理后鸡蛋光谱的特征波长,然后利用非线性特征提取方法中的局部切空间排列(LTSA)算法对特征波长进行有效信息再提取,结合支持向量回归(SVR)建立鸡蛋新鲜度定量预测模型,以期达到良好的检测效果,方法融合后进一步提升鸡蛋新鲜度光谱检测效率,提高预测精度,优化检测模型。
结果与分析
以下研究中的鸡蛋光谱处理与分析均基于一阶微分处理后的光谱数据。
1 CARS特征选择与建模分析
由于全光谱中存在的部分无效干扰信息降低了定量模型预测精度,同时数据量较多也增加了模型复杂度和运算时间,通过特征选择方法能够有效获取光谱特征波长,提升模型检测效率。CARS是一种以进化论“适者生存”为依据的特征变量筛选方法,结合衰减函数和自适应加权采样对变量进行逐步保留与剔除,最终找出交叉验证均方根误差(RMSECV)最小的光谱数据子集作为最优变量组合。本研究利用CARS算法对训练集中的鸡蛋光谱数据进行波长优选,其中蒙特卡洛采样次数设置为50,CARS算法选择特征波长的运算过程见图3。
由图3a可知,伴随着采样次数的增加,参与运算的变量个数逐步减少,在采样初期变量个数迅速递减;由图3b可以得出,由于每次采样时光谱数据子集合发生变化,因此RMSECV会得到不同的结果,并呈现先下降后上升的变化趋势,误差值先下降说明采样初期剔除了一些无用的光谱信息从而提高了模型精度,误差值随后上升说明随着采样次数的增加,变量个数逐步减少导致部分有效的光谱波长被消除,降低了模型精度;由图3c所示,当采样运行次数为21次时,RMSECV达到最小值,说明此时采样所得到的光谱数据子集合为最优波长组合。
利用SVR对CARS算法选取的特征波长变量建立鸡蛋新鲜度定量模型,其中SVR的核函数采用径向基函数,惩罚因子和核参数通过十折交叉验证寻优。模型得到训练集交叉验证相关系数(Rcv)为0.880 5,RMSECV为8.59,预测集相关系数(Rp)为0.888 9,预测集均方根误差(RMSEP)为8.42,其模型预测效果如图4所示。
结果显示,通过SVR结合特征选择后的光谱数据建立鸡蛋新鲜度定量模型结果相比于波长特征选择前全光谱建模得到的RMSECV值减少了1.09,表明CARS特征选择算法有效地筛选了鸡蛋光谱变量,提高了模型精度,同时光谱数据量减少了355个,简化了检测模型,每个鸡蛋样本平均检测时间为0.053s。虽然与全光谱相比数据量大幅减少,很大程度上提高了光谱检测效率和精度,但是可以看出变量个数仍然相对较多,进一步提取有效光谱特征,减少参模数据量对于优化模型、提升检测效率有利。
2 融合LTSA特征提取与建模分析
在LTSA对鸡蛋光谱数据进行特征提取中,低维空间目标维数d和近邻点数k是需要调节的两个重要参数,d选取1~35,k选取45~100,d和k的步长都设置为1,对两个参数的所有取值进行组合形成“网格”,结合不同参数组合进行LTSA特征提取,并分别建立比较特征提取后的多个检测模型,其结果显示,当d=31、k=88时,模型得到的RMSECV达到最小值。
通过选取d 29~32为例说明LTSA算法中k值对提取特征的影响,从图5A观察固定d时结合不同k值的结果,发现RMSECV值均变化平稳,说明k值选取的约束较小,确定d后k值对模型的影响不大;选取k 86~89为例说明LTSA算法中d值对提取特征的影响,从图5B观察固定k时结合不同d值的结果,发现RMSECV随d值变化较大,得出在d较小时,RMSECV值较大,且大于特征提取前得到的模型误差值,说明在提取维数较低时,部分有用信息被弱化导致模型精度差;随着d值的增加,由于有用特征信息被有效提取出来,RMSECV值逐步变小,模型精度随之提高,在d为31时RMSECV值达到最低;继续增加提取维数,RMSECV值开始增大,表明提取的过大维数中存在干扰不利信息导致模型精度反而降低。
本实验选取RMSECV最小时的d和k值作为LTSA算法最优参数,结合特征提取的光谱数据建立SVR新鲜度定量模型得到Rcv=0.896 0,RMSECV=8.04,Rp=0.898 3,RMSEP=8.18,其模型预测效果如图6所示。将CARSSVR模型与CARS-LTSA-SVR模型分析比较,后者相比前者RMSECV值减少了0.55,RMSEP值减少了0.24,Rcv和Rp均有所提升,参模维数减少了14个,可知CARSLTSA-SVR模型预测效果更好,每个鸡蛋样本平均检测时间为0.032s,模型运行时间更短,表明单一使用CARS特征选择的波长中可能还是存在部分冗余信息,融合LTSA特征提取算法能够进一步消除不利影响,不仅减少了模型复杂度,而且提高了模型运行效率,增强了模型稳定性与适用性。
结 论
本实验将CARS算法特征选择与LTSA算法特征提取相结合共同用于鸡蛋光谱数据的处理加工中,再利用SVR建立鸡蛋新鲜度(哈夫单位值)定量模型,获得以下结论:1)采用CARS特征选择对一阶微分预处理后的鸡蛋光谱进行特征变量选择,使光谱维数相比于特征选择前的预处理数据减少了355个,RMSECV值相比于变量提取前的模型减少了1.09,表明CARS特征选择在一定程度上有效地消除了无用信息的影响;2)利用LTSA对CARS选择的特征波长数据进行特征再提取,与仅使用CARS算法处理后建模相比,光谱维数继续减少14个,模型精度再次提高,表明LTSA特征提取法能够进一步在CARS特征选择的数据中获取有效信息,减少了冗余,简化了模型,其模型精度及速率均高于先前的研究;3)CARS-LTSA融合算法共同处理鸡蛋可见-近红外光谱数据有效,所建立SVR定量模型用于鸡蛋新鲜度光谱快速无损检测可行,表明将特征选择与特征提取方法综合利用,在光谱数据分析处理中尽可能地减少光谱数据量、增强模型稳定性以及提高光谱检测效率具有一定的优势,可为光谱检测模型的优化提供一定的参考依据。
本文《基于特征选择与特征提取融合的鸡蛋新鲜度光谱快速检测模型优化》来源于《食品科学》2020年41卷12期273-278页,作者:段宇飞,王巧华。DOI:10.7506/spkx1002-6630-20190213-060。点击下 阅读原文 即可查看文章相关信息。
为进一步促进动物源食品科学的发展,带动产业的技术创新,更好的保障人类身体健康和提高生活品质,北京食品科学研究院和中国食品杂志社在成功召开“2019年动物源食品科学与人类健康国际研讨会(宁波)”的基础上,将与青海大学农牧学院于2020年10月22-23日在西宁共同举办“2020年动物源食品科学与人类健康国际研讨会”。研讨会将就肉、水产、禽蛋、乳制品等动物源食品科学基础研究、现代化加工技术,贮藏、保鲜及运输,质量安全与检测技术,营养及风味成分分析,副产物综合利用,法律、法规及发展政策等方面的重大理论研究展开深入探讨,交流和借鉴国外经验,为广大食品科研工作者和生产者提供新的思路,指明发展方向。
在此,我们诚挚的邀请您出席本次国际研讨会,共聚人脉、共享资源、共谋发展!
修改/编辑:袁月;责任编辑:张睿梅
图片来源于百度图片及文章原文
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.