数据下的城市拥堵秘密:“抄小路”也是一门智慧

DT财经 2018-04-11 12:08 阅读:1611
摘要:文/张忠元、成慧敏城市高速发展带来的交通拥堵问题一直是帝、魔两都的“心头病”,然而,帝都并非每条路都堵。本文数据侠创新性利⽤出租车运营轨迹数据来分析⽀路利⽤情况,得出北京市存在支路利用率低的问题,并为


文/张忠元、成慧敏

城市高速发展带来的交通拥堵问题一直是帝、魔两都的“心头病”,然而,帝都并非每条路都堵。本文数据侠创新性利⽤出租车运营轨迹数据来分析⽀路利⽤情况,得出北京市存在支路利用率低的问题,并为城市研究提供新思路。

本文转自公众号市政厅(ID:shi-zheng-ting)


随着大数据时代到来,中国着⼒建设交通信息化⼯程,旨在将各类交通⼤数据应⽤于城市管理,充分利⽤各类交通数据资源。作为城市交通的必不可少的⼀部分,出租车以GPS数据记录了司机在受到路⽹限制条件下载客的时空轨迹[1]。


出租车司机有丰富的经验,他们往往会根据经验选择最优的路线。出租车司机出行主要依靠4种道路:城市道路分为快速路、主⼲路、次⼲路和⽀路[2-3]。


长期以来,在道路⽹规划中,人们往往把⽬光聚集在快速路以及⼲路建设上,⽽忽略了⽀路⽹的规划建设,导致城市路⽹衔接不畅。本应为⼈们带来较⼤便利性的⽀路体系变成了各类“断头路”、“瓶颈路”和“错位路”。


⾃2016年2⽉6⽇中共中央国务院发布《关于进一步加强城市规划建设管理工作的若干意见》后,⼈们才开始⾼度重视该问题。但是,⼈们关于上述意见的讨论还仅限于定性研究,据我们所知,⽬前还没有⼈从定量的层⾯提供建议。


在此,我们基于收集到的北京市出租车运营数据和纽约出租车运营数据,试图量化回答两个问题:


1. 北京市是否存在⽀路利⽤率低的问题?


2. 如果存在,那么哪些地⽅⽀路利⽤率低的情况最严重?


一、数据与方法


我们收集到2012年11⽉北京市和纽约市的出租车运营轨迹数据,其中包括5134909条北京市出租车和纽约市11797410条黄色出租车的运营记录。图1为北京和纽约的出租车位置分布图,颜色越亮表示车流量越大。


(图片说明:a 北京市出租车位置分布图,b 纽约市出租车位置分布图)


为研究支路利用率的问题,我们首先构造出绕路比指标:R=Dt/Dl


其中Dl指两点之间的直线距离,Dt指两者之间的行驶距离。


行驶距离为出租车的行车记录仪记录下来的距离,直线距离由我们通过计算上车坐标与下车坐标之间的球面距离而得。R值越大,说明行驶距离与直线距离之间的差异越大。R值和⽀路利⽤率紧密相关。如果城市⽀路利⽤率越⾼,即出行的直线距离和⾏驶距离的差别越⼩,R就越接近1。反之,如果城市⽀路利⽤率越低,R就越⼤。这样的特征在短距离的旅⾏中表现得尤为突出(有研究表明,短途出行时,出租车司机更倾向于选择支路[4])。


二、北京与纽约的对比


北京市与纽约市都是以汽车和地铁作为主要客运交通⼯具的特⼤型城市。2012年11⽉,两市出租车运营直线距离和上车时间分布密度如图2所示。


从运营距离看,两市出租车的运营直线距离都集中在0到5000⽶,且都呈现右偏分布的特征;从上车时间看,两市出租车的运营时间都呈现出约三个波峰的分布特征,且三个波峰出现的位置基本相同。因此,两市出租车运营状况具有⼀定可⽐性。


(图片说明:上车时间(左图)与直线距离(右图)分布密度图。左图中的X轴表示时间,1表示凌晨1点,2表示凌晨2点,….,23表示晚上11点。)


整体对比


如表1所示,北京市R的平均数是1.582,纽约市R的平均数是1.477。我们使⽤t检验⽅法检验两市的R是否具有显著性的差异。结果显⽰,北京市R显著⼤于纽约市R,说明从总体看来,北京市⽀路利⽤率显著低于纽约市⽀路利⽤率。


(图表说明:不同城市的R值特征。其中MN表示均值,MD表示中位数,STD表示标准差,Q1表示四分之一的中位数,Q3表示四分之三的中位数。)


按上车时间分组比较


我们对上车时间,按照1⼩时为组距,分组统计两市出租车的R。我们对每⼀组R 都做了T检验。检验结果如图3所示,⼏乎所有时段,北京市绕路⽐显著⼤于纽约市绕路⽐,车流量较⼤的时段,两市绕路⽐都较⾼,车流量较⼩的时段,两市绕路⽐都较低,北京市绕路⽐的波动⽐纽约市绕路⽐更明显。


按直线距离分组比较


我们对直线距离,按照500 ⽶为组距,分组统计两市出租车的R。本⽂对每⼀组R 都做了T检验。检验结果如图3所示,直线距离⼩于6500 ⽶时,北京市R值显著⾼于纽约市的R值。值得注意的是,69.06% 的北京市出租车运营和87.64% 的纽约市出租车运营处于该范围。


(图片说明:绕路⽐按上车时间(左图)和直线距离(右图)分组⽐较;实线表⽰北京市, 虚线表⽰纽约市,红⾊区块表⽰北京市R值显著⾼于纽约市R值,蓝⾊表⽰纽约市R值显著⾼于北京市R值,白色表示t检验结果不显著。)


按时间距离交叉分组比较


最后,我们直线距离按500⽶为组距,对上车时间以1⼩时为组距进⾏了交叉分组, 对每组的结果进⾏了t 检验。检验结果如图4所示,北京市绕路⽐显著⼤于纽约市绕路⽐的区域呈现出明显的集群特征。在北京,小于5000米的短途出行时,绕路比显著高于纽约,该特征在白天尤为明显。


综上,我们得出结论:北京市的确存在支路利用率低的问题。


(图片说明:绕路比按时间距离交叉分组比较。图中X轴表示直线距离,纵轴表示上车时间。 红色格子表示北京市R显著高于纽约市,蓝色格子表示纽约市R值显著高于北京市,颜色越深,差异越大。白色表示t检验结果不显著。)


以上分析显⽰, 北京市确实存在⽀路利⽤率低的问题。


三、绕路比高的出租车,主要的上车点及下车点在哪?


那么,到底北京哪些上车点,存在⽀路利⽤率低的问题? 同理,哪些下车点存在⽀路利⽤率低下的问题也是我们关⼼的。


时间特征分析


车流量高峰期时,为避让拥堵路段,有些出租车司机选择其他路段,同时带来一定副作用——绕路,从而降低R值衡量支路利用率的可信度。因此我们主要关心非高峰期时段的情况。我们将时间划分为24 个⼩时,如图5所⽰,不同时间段下R 值的分布呈现以下特征:


(1)7-9 点为上班⾼峰时期: 该时段内R 值⾼的上车点分布较为分散。


(2)10-17 点⽩天⾮⾼峰期: 该时段内R 值⾼的上车点主要集中在中关村和北京南站等区域。


(3)18-22 点为下班⾼峰期: 该时段内R 值⾼的上车点分布比较分散。


(4)23-6 点为夜间⾮⾼峰期: 该时段内R 值⾼的上车点主要集中在军事博物馆和⼤望路区域附近。


(图片说明:图中红⾊⽅格表⽰绕路⽐较⾼的地点。按时间分组展⽰:a 图表⽰7点到9点,b 图表⽰10点到17点,c 图表⽰18点到22点 ,d 图表⽰23 点到凌晨6 点。)


空间特征分析


我们将0到20000⽶的直线距离划分为41 个区间,每个区间的长度均为500 ⽶。如图6所⽰,不同距离段下R 值的分布呈现以下特征:


(1)0-1000 ⽶短距离出⾏: 这段距离出⾏的出租车绕路⽐值最⾼,R 值⾼的上车点集中分布在五棵松、军事博物馆等区域。


(2)1000-5000 ⽶中短距离出⾏: 中短距离出⾏的R 值⽐短距离出⾏时低, 说明这段距离的绕路情况⽐短距离时有所缓和, 主要集中在北京南站、国家图书馆和王府井等区域。


(3)5000-10000米中长距离出⾏: 这段距离出⾏的出租车R 值⾼的上车点集中分布在北京南站、丰台科技园等区域。


(4)10000-20000米长距离出⾏: 这段距离出⾏的出租车R 值⾼的上车点集中分布在北京的郊区,北边集中在西二旗,南边集中在丰台科技园。


(图片说明:图中红⾊⽅格表⽰绕路⽐较⾼的地点。按直线距离分组展⽰:a 图表⽰1000米以内,b 图表⽰1000-5000米,c 图表⽰5000-10000米 ,d 图表示10000米以上)


综上,我们得出以下结论: 北京市R值高的上车点主要集中在王府井、国家图书馆、北京南站、中关村、军事博物馆和和五棵松⼀带。同理,我们也可以对下车点进行分析,北京市R值高的下车点主要集中在王府井、北京南站、军事博物馆、国家图书馆、五棵松和积水潭等区域。


哪些地方的支路利用率低?


目前为止,我们静态分析了哪些上车点上车和哪些下车点下车会绕路较远, 那么绕路绕得⽐较远的路程是从哪⾥上车和哪⾥下车的?


为解决这个问题,接下来以动态的视⾓,从两⽅⾯开展分析:


⼀⽅⾯,⾼R值的上车点主要集中在王府井、中关村、国家图书馆、北京南站、军事博物馆和和五棵松区域附近。从这些上车点出发的出租车,是去哪些地⽅下车会绕路绕远呢?分析结果如图7所示。


另⼀⽅⾯,⾼R值的下车点主要集中在王府井、北京南站、军事博物馆、国家图书馆、五棵松和积水潭等区域附近。到达这些下车点的出租车,都是从哪些地方出发导致绕路绕得远呢?分析结果如图8所示。


(图片说明:固定上车点,找R值高的下车点。图中紫⾊和绿⾊⽅格表⽰固定的上车点, 其中绿⾊⽅格表⽰从该点出发到达该点绕路比也高。红色方格表示从绿色(或紫色)方格出发,且绕路⽐较⾼的车辆到达的终点。)


(图片说明:固定下车点,找R值高的上车点。固定下车点,找R值高的上车点。图中紫⾊和绿⾊⽅格表⽰固定的下车点, 其中绿⾊⽅格表⽰从该点出发到达该点绕路比也高。红色方格表示到达绿色(或紫色)方格,且绕路⽐较⾼的车辆出发的上车点。)


当固定⾼R值的上车点时,我们发现,其对应的下车点都在上车点附近。应用同样的思路,固定其下车点,我们也发现对应的上车点都是在下车点。这⼀结论和我们之前的分析⼀致,即⾼R值的记录都是短途旅⾏,⽽短途旅⾏中更多依赖⽀路,因此,我们能够找出⽀路利⽤率低的地⽅。


⾼R值的上车点和下车点重合的区域为王府井、北京南站、军事博物馆、国家图书馆、五棵松,说明这些区域的⽀路利⽤率低下的情况⽐较严重,在这些区域邻近范围内⾏驶都会绕路绕得远。


结论与建议


我们创新性利⽤出租车运营轨迹数据来分析⽀路利⽤情况,不仅为城市研究提供新思路,得出的结论也具有很强的实际意义。我们通过⼀系列分析,得出北京市确实存在⽀路利⽤率低的问题,⽽⽀路利⽤率最低的区域主要集中在王府井、北京南站、军事博物馆、国家图书馆、五棵松这些区域。


其实北京市存在很多⽀路,只是由于各种原因,⽐如没有路标指⽰、⽀路与其他道路之间不连通等,导致⽀路利⽤率低下。建议管理者着重在这些区域加强⽀路规范化管理,包括对违规占道售卖和停放的管理、对路⾯硬化和绿化的管理以及加强⽀路路标指引建设的管理等。


参考文献:

[1] H. Cai, X. Zhan, J. Zhu, X. Jia, A. S. Chiu, and M. Xu, Physica A: Statistical Mechanics and its Applications 457, 590 (2016).
[2] S. A. Arhin, L. N. Williams, A. Ribbiso, and M. F. Anderson, Journal of Civil Engineering Research 5, 10 (2015).
[3] T. Toledo, H. Farah, S. Morik, and T. Lotan, Transportation research part F: tra_c psychology and behaviour 26, 180 (2014).
[4] 李恒鑫. 基于紧凑城市理念步⾏原则的街区尺度与道路模式研究.Master’s thesis, 南京⼤学, 2014


编辑 | 王旭晶: wangxujing@dtcj.com

题图 | 站酷海洛

▍数据侠门派


本文数据侠张忠元,中央财经大学统计与数学学院教授。成慧敏,中央财经大学统计与数学学院博士生。


▍加入数据侠


“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”,投稿、合作请联系datahero@dtcj.com。

版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
阅读量: 1611
0