专利名称: |
基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法 |
摘要: |
本发明提供了一种基于PCA‑Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法。本发明针对拉曼峰相似的两种食源性致病菌——大肠杆菌0157:H7以及布鲁氏菌S2株识别精度不足的问题,提出一种基于PCA‑Stacking的拉曼集成分类算法,找到了鲁棒性更好的数学统计模型和计算方法。针对拉曼光谱中存在的毛刺,基线漂移问题,使用Savitzky‑Golay滤波器和非对称最小二乘实现光谱的预处理。通过网格搜索模型参数,证明了Stacking集成算法相比于K近邻、逻辑回归、支持向量机单一算法模型有更高的分类准确率。 |
专利类型: |
发明专利 |
国家地区组织代码: |
上海;31 |
申请人: |
上海应用技术大学 |
发明人: |
史如晋;夏钒曾;夏志平;曾万聃;曲晗;李乾学;杨瑞君 |
专利状态: |
有效 |
申请日期: |
2019-02-11T00:00:00+0800 |
发布日期: |
2019-05-21T00:00:00+0800 |
申请号: |
CN201910111235.0 |
公开号: |
CN109781706A |
代理机构: |
上海汉声知识产权代理有限公司 |
代理人: |
胡晶 |
分类号: |
G01N21/65(2006.01);G;G01;G01N;G01N21 |
申请人地址: |
200235 上海市徐汇区漕宝路120-121号 |
主权项: |
1.一种基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,包括: 对原始大肠杆菌O157:H7、布鲁氏菌S2株的拉曼光谱进行归一化处理,对所述拉曼光谱去噪并扣除荧光背景; 对去噪并扣除荧光背景后的拉曼光谱提取主成分; 对提取主成分后的数据集进行X:Y比例的划分,其中,x+Y=100,X%作为测试集,Y%作为训练集; 基于所述训练集训练多个基础层次模型,基于每个基础层次模型的输出训练各个对应的元模型,将各个元模型聚合为Stacking模型; 采所述测试集验证所述Stacking模型的准确率。 2.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,使用Savitzky-Golay滤波器和非对称最小二乘对所述拉曼光谱去噪。 3.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,对去噪并扣除荧光背景后的拉曼光谱提取主成分,包括: 对去噪并扣除荧光背景后的拉曼光谱进行PCA降维处理,计算特征贡献率,根据所述特征贡献率提取所述拉曼光谱的主成分。 4.如权利要求3所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,根据所述特征贡献率提取所述拉曼光谱的主成分,包括: 根据所述特征贡献率得到对应的帕累托图,根据所述帕累托图提取所述拉曼光谱的主成分。 5.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,所述基础层次模型包括有K近邻、逻辑回归和支持向量机中的任两种以上单一分类器。 6.如权利要求1所述的基于PCA-Stacking建立的食源性致病菌拉曼光谱识别模型的训练方法,其特征在于,所述的X=30,Y=70。 |
所属类别: |
发明专利 |