专利名称: |
一种基于决策树算法的变压器色谱峰定性方法和系统 |
摘要: |
本发明公开了一种基于决策树算法的变压器色谱峰定性方法和系统,方法包括以下步骤:S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集;S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树;S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。本发明构建简单,抗漂移性能好,能够有效剔除假峰,能够实现有效色谱峰的正确分类,分类快且容错性好。 |
专利类型: |
发明专利 |
国家地区组织代码: |
福建;35 |
申请人: |
福建工程学院 |
发明人: |
单杰;陈昊旻;张政国;卜冠南 |
专利状态: |
有效 |
申请日期: |
2019-09-10T00:00:00+0800 |
发布日期: |
2019-12-31T00:00:00+0800 |
申请号: |
CN201910851009.6 |
公开号: |
CN110632191A |
代理机构: |
浙江千克知识产权代理有限公司 |
代理人: |
裴金华 |
分类号: |
G01N30/02(2006.01);G;G01;G01N;G01N30 |
申请人地址: |
350118 福建省福州市闽侯县上街镇大学新区学府南路33号 |
主权项: |
1.一种基于决策树算法的变压器色谱峰定性方法,其特征在于,包括以下步骤: S10:数据准备与选取:从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集; S20:决策树模型构建:利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树; S30:结果测试:利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。 2.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述步骤S30之后还包括: S40:决策树模型重构建:用于若测试结果不符合预设标准,则添加训练样本进入所述训练样本集,并重复步骤S10之后的步骤直至步骤S30判断出测试结果符合预设标准。 3.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述训练样本集的特征属性阈值自适应包括以下步骤: S211:利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合; S212:从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值。 4.根据权利要求3所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述步骤S212中包括: 计算每个特征属性的所述候选划分点集合中的每个候选划分点对训练样本集进行划分所获得的信息增益; 选取信息增益最大的候选划分点作为该特征属性的阈值。 5.根据权利要求3或4所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述决策树结点特征属性的选取包括: S221:计算每个特征属性阈值的增益率; S222:选取增益率最大的所述特征属性作为决策树结点。 6.根据权利要求5所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述依据特征属性阈值和结点特征属性递归形成决策树包括: 重复执行步骤S211、S212、S221以及S222,确定决策树的根结点和每个分支的结点,直至数据分类结束,形成最终的决策树。 7.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述特征属性集至少包括峰高、峰宽、峰面积以及峰位置。 8.根据权利要求1所述的一种基于决策树算法的变压器色谱峰定性方法,其特征在于,所述步骤S20还包括在所述决策树形成后对所述决策树进行修剪。 9.一种基于决策树算法的变压器色谱峰定性系统,其特征在于,包括: 数据准备与选取模块,用于从现场变压器油色谱在线监测装置中提取获得训练样本集、测试样本集以及特征属性集; 决策树模型构建模块,用于利用决策树算法对所述训练样本集进行训练,构建决策树,构建过程包括训练样本集的特征属性阈值自适应、决策树结点特征属性的选取以及依据特征属性阈值和结点特征属性递归形成决策树; 结果测试模块,用于利用所述测试样本集测试所述决策树,查看结果是否符合预设标准,若符合,则使用所述决策树用于变压器色谱峰定性。 10.根据权利要求9所述的一种基于决策树算法的变压器色谱峰定性系统,其特征在于,所述决策树模型构建模块包括: 二分处理单元,用于利用二分法处理所述训练样本集,获取训练样本集的每个特征属性的候选划分点集合; 阈值自适应单元,用于从每个特征属性的所述候选划分点集合中选取最优划分点作为该特征属性的阈值; 结点确认单元,用于计算每个特征属性阈值的增益率,选取增益率最大的所述特征属性作为决策树结点。 |
所属类别: |
发明专利 |