当前位置: 首页> 学位论文 >详情
原文传递 基于CRISP-DM的流程可视化数据挖掘工具的研究与实现
论文题名: 基于CRISP-DM的流程可视化数据挖掘工具的研究与实现
关键词: CRISP-DM;流程可视化;过程模型;数据挖掘;轨道交通;自动售检票系统
摘要: 知识发现和数据挖掘已成为当今计算机领域的研究热点。如何从海量数据中获取到有用的信息和知识,挖掘出数据中隐含的未知规律,是人类迫切需要解决的问题。本文对数据挖掘工具的相关技术进行了研究,结合跨行业数据挖掘标准流程(cross industry standard process for data mining,CRISP-DM)过程模型、流程可视化等技术,设计并实现了应用于轨道交通自动售检票(automatic farecollection,AFC)系统的数据挖掘工具。
   本文作者的主要研究工作如下:
   (1)对数据挖掘、过程模型和可视化数据挖掘技术进行了理论研究,详细分析了轨道交通AFC系统的数据和业务。
   (2)设计和实现了轨道交通AFC系统数据挖掘工具的三层体系结构(客户端层、服务器层和数据库层)及四级层次结构(数据驱动接口层、数据处理层、数据挖掘层和可视化显示层),提高海量数据处理性能。
   (3)研究了CRISP-DM的方法学。根据CRISP-DM过程模型的六个阶段(商业目标理解、数据理解、数据预处理、建立模型、验证模型和模型实施)和四个层次(阶段、一般任务、具体任务和过程实例),设计各阶段的任务和输出,利用数据挖掘上下文完成一般任务层与具体任务层之间的映射,实现过程模型的重用。
   (4)着重研究和实现了数据挖掘流程的可视化。将数据挖掘流图以有向图的方式表示和存储,使用节点表和连接线表分别存储流程图中所有节点和连接线,对数据流和命令流的交互及传递进行控制。详细描述了数据挖掘数据源的获取方法,以及数据挖掘流程的任务节点、控制节点、连接线和数据流图的设计。
   (5)对数据挖掘工具的可扩展性方法进行了研究。以一个实例展示了基于CRISP-DM的流程可视化数据挖掘工具的使用效果。
   实践表明,该数据挖掘工具操作界面灵活友好,使用其对轨道交通AFC系统的数据进行挖掘、分析和预测,能够提高运营管理决策水平、降低运维成本。
  
作者: 郭鑫
专业: 计算机软件与理论
导师: 成长生
授予学位: 硕士
授予学位单位: 东华大学
学位年度: 2009
正文语种: 中文
检索历史
应用推荐