当前位置: 首页> 学位论文 >详情
原文传递 基于多源数据的出行时空频繁模式研究
论文题名: 基于多源数据的出行时空频繁模式研究
关键词: 居民出行;时空特征;频繁模式;多源数据;规则格网
摘要: 近年来,居民的出行行为特征研究逐渐成为交通工程学、城市地理学等研究领域的热点课题。与此同时,智能设备与空间地理信息技术的普及也使得可获取的数据资源日益丰富、数据体量也逐步增大,进而推动相关分析技术发展成熟,为数据驱动下城市级别的居民出行特征研究提供了理论支撑。
  本文融合网约车订单数据和地铁刷卡数据,从时间和空间两个维度出发,探索其时空分布特征,并采用聚类算法对出行时空频繁模式进行挖掘。具体来说,本文首先对出行时空频繁模式进行定义,在空间上,利用嵌入式网络聚类提取空间线模式,并将其扩展至时空立方体模型中,结合指数归一化与自然间断点法进行频繁程度评价。此外,引入空间填充曲线对格网进行编码以简化时空模型,再利用K-means算法对简化后的时空点进行聚类。以苏州市辖区为案例,首先使用网约车数据在市辖区范围内挖掘居民出行时空频繁模式以把握居民出行的大体特征,随后分别对网约车和地铁出行时空模式进行分析,在此基础上进行多源数据融合,挖掘出主城区内居民的出行时空频繁模式。
  本文的主要成果总结如下:
  (1)空间填充曲线是一种降低空间维度的技术,能够将多维空间数据转换至一维空间并依据索引实现多维数据的存储和查询。本文采用希尔伯特(Hilbert)空间填充曲线,对居民出行的起讫点及中间时刻进行时空点模式简化,并利用K-means算法对简化后的时空点进行聚类。苏州市的案例研究表明,该方法能够挖掘出不同时刻各个交通源之间的交通需求,可以为城市交通规划与管理提供数据支持。
  (2)地铁刷卡数据只包括居民乘坐地铁出行的进出站点,无法直接获取居民的出行轨迹。考虑到地铁作为轨道交通,线路固定,本文对研究区域进行网格化处理后匹配地铁站点与格网,并将地铁线路轨迹转换为格网序列。本文的苏州案例研究表明,该方法能够较好地实现地铁数据的“点转线”,为多源数据的融合提供了新思路。
  (3)针对居民出行活动特征,提出了时空频繁模式并详细阐述了出行时空模式频繁程度评价方法。利用网约车订单数据和地铁刷卡数据进行多源数据融合。通过在苏州主城区的案例研究表明,本文提出的时空频繁模式挖掘能够有效地提取居民出行的频繁模式,进而把握居民出行活动特征,为城市交通建设和规划提供依据。
作者: 李琳华
专业: 地图制图学与地理信息工程
导师: 付晓
授予学位: 硕士
授予学位单位: 东南大学
学位年度: 2022
检索历史
应用推荐