当前位置: 首页> 交通专利数据库 >详情
原文传递 基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法
专利名称: 基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法
摘要: 本发明提供了一种基于PCA‑Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法。本发明针对拉曼峰相似的两种食源性致病菌——大肠杆菌0157:H7以及布鲁氏菌S2株识别精度不足的问题,提出一种基于PCA‑Stacking的拉曼集成分类算法,找到了鲁棒性更好的数学统计模型和计算方法。针对拉曼光谱中存在的毛刺,基线漂移问题,使用Savitzky‑Golay滤波器和非对称最小二乘实现光谱的预处理。通过网格搜索模型参数,证明了Stacking集成算法相比于K近邻、逻辑回归、支持向量机单一算法模型有更高的分类准确率。
专利类型: 发明专利
国家地区组织代码: 上海;31
申请人: 上海应用技术大学
发明人: 史如晋;夏钒曾;夏志平;曾万聃;曲晗;李乾学;杨瑞君
专利状态: 有效
申请日期: 2019-02-11T00:00:00+0800
发布日期: 2019-05-21T00:00:00+0800
申请号: CN201910111235.0
公开号: CN109781706A
代理机构: 上海汉声知识产权代理有限公司
代理人: 胡晶
分类号: G01N21/65(2006.01);G;G01;G01N;G01N21
申请人地址: 200235 上海市徐汇区漕宝路120-121号
主权项: 1.一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,包括: 对原始大肠杆菌O157:H7、布鲁氏菌S2株的拉曼光谱进行归一化处理,对所述拉曼光谱去噪并扣除荧光背景; 对去噪并扣除荧光背景后的拉曼光谱提取主成分; 对提取主成分后的数据集进行X:Y比例的划分,其中,x+Y=100,X%作为测试集,Y%作为训练集; 基于所述训练集训练多个基础层次模型,基于每个基础层次模型的输出训练各个对应的元模型,将各个元模型聚合为Stacking模型; 采所述测试集验证所述Stacking模型的准确率。 2.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,使用Savitzky-Golay滤波器和非对称最小二乘对所述拉曼光谱去噪。 3.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,对去噪并扣除荧光背景后的拉曼光谱提取主成分,包括: 对去噪并扣除荧光背景后的拉曼光谱进行PCA降维处理,计算特征贡献率,根据所述特征贡献率提取所述拉曼光谱的主成分。 4.如权利要求3所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,根据所述特征贡献率提取所述拉曼光谱的主成分,包括: 根据所述特征贡献率得到对应的帕累托图,根据所述帕累托图提取所述拉曼光谱的主成分。 5.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,所述基础层次模型包括有K近邻、逻辑回归和支持向量机中的任两种以上单一分类器。 6.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,所述的X=30,Y=70。
所属类别: 发明专利
检索历史
应用推荐