离散选择模型(Logit模型)练习

基本信息

我们希望研究个体在出行时选择交通方式的影响因素,数据中的各个变量及其取值的意义如下:

问题

1. 长表数据是离散选择模型特有的数据格式,初学者常常会犯一些低级错误, 例如:(1)遗漏了某个备选项,在一个包含4选项的选择中只输入了3行;(2)一次选择没有选中任何备选项,或选中了多个备选项。 这些问题可能导致模型估计时报错。

下表中显示了3次选择(Group=1,2,3), 这3次选择的结果应当分别为火车、巴士、私家车。请检查表中的“Choice”列,看看它是否有输入错误,如果有,请改正。

Group Mode Choice TTME INVT INVC
1 1 69 100 59
1 2 34 372 31
1 3 35 417 25
1 4 0 180 10
2 1 69 125 115
2 2 34 892 98
2 3 35 882 53
2 4 0 720 23
3 1 69 100 59
3 2 40 345 20
3 3 35 417 13
3 4 0 284 12

2. 请检查你下载到的数据:本数据集共包含了次选择, 其中,在第10次选择中(Group=10),航空的行程时间是分钟, 巴士的行程时间是分钟。

请以选择结果为因变量,TTME、INVT、INVC为自变量,拟合Logit模型,并回答下面的问题。
注意:由于本数据是有标签的数据(labelled data),所以模型中需要带上常数项(ASC)。同时,NLogit要求路径为全英文,需要重命名文件名中的中文字符。

3.考察本模型的拟合效果:模型的对数似然值是 , McFadden R2是
(请注意,NLogit软件报告的是相对于Constant-only模型的R2,需要进行修正, 可参考本文计算。)

4. 行程时间(INVT)这个自变量的系数估计值是多少?

5. 行程费用(INVC)这个自变量的p值是多少?(p值反映显著性,只有当p值小于一定的显著水平,如0.05时,结果才有意义)

6. 关于各备选项的ASC常数项,火车的ASC估计值是多少?(ASC常数项反映了在控制了各解释变量以后,不同备选项的固有效用差异。)

7. 计算支付意愿(WTP):当其他条件不变时,乘客愿意为行程时间每1小时的减少而多支付多少元钱?

8. 对于你数据中的第10个样本,模型预测选择者选择4种交通方式的概率分别为多少?请使用小数(而非百分数)填写,并保留至少3位有效数字。

  • 1=航空:
  • 2=火车:
  • 3=巴士:
  • 4=私家车:

9. 还是这个样本,如果因为公交优先政策,使得巴士的站点等候时间缩短20分钟(但是缩短后仍然至少为5分钟),同时由于拥挤收费政策,使私家车的行程费用增加至原来的2倍, 那么模型预测该选择者对于4种交通方式的选择概率分别为多少?请使用小数(而非百分数)填写,并保留至少3位有效数字。

  • 1=航空:
  • 2=火车:
  • 3=巴士:
  • 4=私家车:

10. 根据第8题的概率,对选择结果进行模拟预测,在空格中填入交通方式的序号:1=航空、2=火车、3=巴士、4=私家车。 对于蒙特卡洛模拟,请按课堂上讲授的方式把0~1区间划分为4段,分别对应1、2、3、4四种交通方式的概率,并根据给定的随机数进行模拟。

  • 最大概率模拟:本次选择将选择第种交通方式
  • 蒙特卡洛模拟,随机数=0.4:本次选择将选择第种交通方式
  • 蒙特卡洛模拟,随机数=0.8:本次选择将选择第种交通方式