“轨迹数据的挖掘和可视化” 项目简介

轨迹数据就是时空环境下,通过对一个或多个移动对象运动过程的采样所获得的数据信息,包括采样点位置、采样时间、速度等,这些采样点数据信息根据采样先后顺序构成了轨迹数据。例如具有定位功能的智能手机,轨迹数据反映了手机持有者某一时间段的行动状况,移动互联网络可以通过无线信号定位手机所在位置,进而采样记录,通过连接采样点形成手机持有者的运动轨迹数据;GPS定位终端,固定采样频率的记录终端所在位置的经纬度信息,通过无线网络将数据收集到服务器上;RFID标签技术,对物体进行标记,将物体的移动线路通过RFID识别器完成定位和位置数据记录,形成物体的移动轨迹。

作为数据挖掘的一个新兴分支,轨迹挖掘的研究热点集中在轨迹聚类、轨迹分类、离群点检测、兴趣区域、隐私保护、位置推荐等方面。我们的研究目标是:挖掘轨迹数据的模式,优化实际的交通和城市应用。具体的研究的内容包括以下几个方面:

  1. 轨迹大数据的存储架构和方法,数据的清洗和预处理:基于Hadoop、Spark等平台存储轨迹数据,进行数据预处理、数据聚类、计算对象相似度等;
  2. 交通模式分析:基于移动节点(汽车、行人等)的GPS数据,分析行为模式;进行叫车推荐、数据统计和分析等;发现城市生活的规律,并开发有趣的应用;
  3. 轨迹数据可视化:对基于轨迹数据的交通和城市应用提供可视化优化,提供良好的用户交互界面;