杭轩
(同济大学道路与交通工程教育部重点实验室,上海201804)
【摘要】交通枢纽是城市交通体系的重要组成部分,由若干种运输形式所连接的固定设备和移动设备组成的整体。利用多项logit模型构建了乘客换乘方式选择模型,设计SP调查问卷,根据上海虹桥机场调查数据实测数据,对模型参数进行了标定。结果显示模型具有较高的精度,对于大型交通枢纽的换乘交通组织具有指导意义,有较高的理论和实用价值。
【关键词】logit模型;交通枢纽;换乘
1研究背景
交通枢纽是城市交通体系的重要组成部分,是不同运输方式的交通网络交汇点。它是由若干种运输形式所连接的固定设备和移动设备组成的整体,共同承担着枢纽所在区域的直通作业、中转作业、枢纽地方作业以及城市对外交通的相关作业等运输任务。
在综合交通体系中,换乘衔接起着关键性的作用,但是许多大城市在公共交通的规划和建造过程中,由于忽视了公共交通与其它交通方式的换乘接驳问题,缺乏有效的接驳系统,造成出行者换乘不便。
不论是在交通枢纽的规划、设计、建设中,还是在日后的管理运营中,都需要对其中各种方式的换乘量有详细的了解和掌握,而这就需要对个体出行者的行为进行分析和预测。本文研究基于logit模型的城市交通枢纽换乘选择模型实际上是一种离散选择模型,是从个体角度出发,提出各种交通方式的效用函数,从而分析出行者对换乘方式的选择情况。由此可见,该模型具有较高的应用价值和理论意义。
2 Logit模型介绍
离散选择模型DCM(discrete choice model)被广泛应用于交通方式划分预测,该模型在交通方式划分预测模型中运用很广泛,理论基础为最大随机效用RUM(random utility maximization),从微观经济学的角度客观解释了对人的交通方式选择行为,目前应用极其广泛。模型主要分为两类:第一类为Logit模型,随机效用项符合Gumbel分布;第二类模型为Probit模型,随机效用项符合正态分布。根据Logit模型改进后又可分成两大类模型,一是分层类的Logit模型,另一个为直接分类的Logit模型。分层类的Logit改进模型也可分为两类,其一为合并Logit改进模型,其二为分裂Logit改进模型。
3模型构建
3.1 多项logit模型
多项logit模型(Multinomial Logit Model,以下简称ML模型)的基本建模思想是效用最大化。在国内外的交通领域该模型主要用于出行方式选择的研究。即:以出行者个体作为研究对象,出行者个体对出行方式进行选择时,在不同的情景假设情况下选出对自己最有利的出行方式,即选择最自己而言效用最大的方案。出行者个体的效用函数为:
式(1)中:
Uiq表示出行者个体q选择换乘方式i的效用值;
Uiq表示出行者个体q选择换乘方式i的可观测效用值;
£表示出行者个体q采用出行方式i的随机效用值,假设服从Gumbel分布;
根据ML模型,每个出行者选择某种换乘方式的可能性为:
式(2)中:
P表示出行者个体q选择换乘方式i的概率;
%表示出行者个体q选择换乘方式i的可观测效用值;
A表示出行者个体q的选择方案集合。
由此可见,要确定一个乘客选择某种换乘方式的概率,关键在于确定各种换乘方式对该乘客的效用值,也即确定影响效用函数的各变量和参数。
3.2 影响因素分析
在确定乘客换乘方式选择时,应进行预调查研究。交通枢纽最常见的换乘方式选择有:出租车、公交车、地铁、步行等等,由于步行的可达范围较小,与其他几种主要交通方式并没有可比性,因此仅考虑出租车、公交车、地铁这三种方式。根据已有的研究成果,我们可以选择交通费用、出租车耗时、地铁耗时、公共汽车耗时、出行者年龄和出行者收入为变量建立模型。其中前四个变量为选择方案特性变量,后两个变量为出行者特性变量。
3.2.1 出行费用与时间
经验表明,对大多数人而言费用越高、耗时越多的交通方式越不容易被选择,因为费用和时间实际上是出行成本的体现。在出租车、公交车和地铁这三种方式中,人对花费的感受应当是相同的,即地铁公交与出租车同时增加一元钱的成本对我们的选择不产生影响,因此选择一个变量费用来描述这三种方式的花费;而时间成本的花费对我们的选择可能会产生不同的影响,即公交地铁和出租车同时增加一小时的出行时间,我们的选择就可能跟原来大不相同。
3.2.2 出行者年龄
出行者的年龄对交通方式选择可能有较大影响,但是一个30岁的人在选择交通方式时不可能与40岁的人有本质的区别。因此我们结合研究经验将年龄划分为三个年龄段,分别是:1~20岁,20—40岁,40岁以上。
3.2.3 出行者收入
显然出行者的收入水平对换乘方式的选择也会产生影响,高收入的人可能更倾向于选择舒适的交通方式,而低收入人群受到收入的制约只能选择一些便宜却不够舒适的交通方式。根据经验,我们将出行者的月收入分为三个层次:0~3000元,3000~6000元,6000元以上。
3.3 建立效用函数
通过以上分析,可以建立如表1的特性变量表。
由表中数据可知,特性变量共有6个,所需标定参数共有12个。表中各个变量取值范围如表2所示。
这三种换乘方式的效用函数表达式如式(3):
4问卷设计
SP调查(Stated Preference Survey)是指,为了获得“人们对假定条件下的多个方案所表现出来的主观偏好”而进行的实际调查对实际行动进行的调查称为RP(Revealed Preference Survey)调查,这是一般传统使用的方法。其设计方法有全面设计、正交设计和均匀设计几种。
均匀设计方法为我国学者方开泰与王元教授于1978年所开创,是在正交设计基本思想的基础上发展而来的x。其优点是所需要的试验点数目较少,能很好地弥补正交设计的不足。故本文采用这种方法设计问卷。
本文中共考虑6个特性变量,分别是这三种交通方式的出行时间和费用,同时还需要被调查者的年龄和收入信息。这六个有待调查的变量都是6水平,因此在设计调查问卷时未保证问卷的实用性和精确性,可以参考6因素6水平均匀设计表进行设计,要求被调查的样本范围尽量包含各个年龄阶段和收入层次。
查询混合均匀设计表(如表3),得出以下调查表格(如表5)。
5参数标定与模型验证
5.1 数据调查来源
调查数据来源于虹桥机场客流问卷调查,三天内随机调查422人。其中各年龄段和各收入等级的调查人数比例如图1和2所示。
5.2 极大似然法标定模型参数
乘客n选择换乘方式i的效用:
式中,0是未知参数向量(待标定),Xi。是出行者n选出换乘方式i的影响因素向量(1中各变量)。由此可知乘客n选择i方式的概率:
那么调查数据中,每种方式组合被选中和选不中的概率为:
因此,出行者1,…,n,…,N同时出现调查表中情况的概率为:
其对数似然函数L为:
根据调查数据,各个特性向量xi。已知,只需解出当L取最大值时,O各分量的值,即可得到模型的各个未知参数。可以证明式(8)是关于O的凸函数,因此L的极大似然估计值O可以通过对式(8)求导后令各偏导数为0求得。本文利用matlab的最优化工具箱来标定0的各个分量。
无约束非线性最优化问题可以用fminunc函数来求解:[x, fval, exitflag, output, grad, hessian]=fminunc(…),其中X为迭代初始值;fval为最优点x处的函数值;exifflag为函数收敛性条件;output为输出优化信息;grad为x处的梯度值.hessian为x处的海瑟矩阵。
为了验证效用函数中影响因素与乘客乘车效用的相关性,本文采用t检验来检验影响因素是否显著。第k个影响因素的显著性tk的计算公式为:
其中,Vk为总体协方差矩阵的第k个对角元素。总体协方差矩阵的估计值为迭代最终一步的海瑟矩阵的逆矩阵。
5.3 模型验证
根据上节所述内容和实际调查数据,可以利用matlab最优化工具箱的fminunc函数得到标定的特性变量系数,以及各个系数的t检验值。
从以上参数标定结果(见表4)来看,时间和费用的增加总体上会减少出行者的效用,这与日常的生活经验是一致的。其中出租车耗时的系数为-0.010,地铁为-0.013,公交为-0.023。这意味着随着耗时的增加,出租车受到的影响最小,地铁次之,公交车是最大的。可能的原因是每增加单位时间的出行成本,公交车的舒适性不足导致了乘客感受到的效用损失比其他两种换乘方式大很多。
可以看出,大部分变量的显著性都比较高,但是年龄和收入这两个变量的显著性不明显,可能是由于调查问卷的样本量较小,且这两项变量的层次水平数太少所导致。
6结语
模型选择的特征变量的多少,效用函数选择线性形式,调查的样本量多少都会影响多项logit模型的精确性。本文中各项影响因素与用户选择的倾向均符合预期,本文所采用的多项logit模型较好地说明了乘客在交通枢纽的换乘选择方式。