本节课的练习数据为美国加利福尼亚州的房价数据(California Housing Prices), 其空间单元是美国的街区(block),每1行即是1个街区。各变量的意义如下:
我们的目的是通过线性回归模型,对房价变量"median_house_value"进行解释和预测。请根据要求估计模型,并回答下面的题目。为保证精度,小数请保留至少3位有效数字, 如果p值小于0.001,请填入"<0.001"。
请以median_house_value为因变量,housing_median_age、population、households、median_income、avg_num_rooms、avg_num_bedrooms、ocean_proximity为自变量,建立线性回归模型。
请注意:ocean_proximity是一个分类变量,需要以虚拟变量的形式纳入模型,请以样本量最多、最具代表性的"<1H OCEAN(距离海洋小于1小时车程)"为参照水平。