/7f7718378176/image-20220719132100964.png

线性回归

问题描述

如图,试用计算机完成下面统计分析:

1.应用最小二乘法求经验回归方程;
2.以拟合值y^i\widehat{y}_i为横坐标,残差e^i\widehat{e}_i
3.考虑因变量的变换U=Y12U=Y^{\frac{1}{2}},再对新变量U和X重复1和2的统计分析。

求解

1.模型摘要

模型 R R 方 调整后 R 方 标准估算的错误 德宾-沃森
1 .839a .705 .699 1.57749 2.095
a. 预测变量:(常量), 每小时用电量
b. 因变量:每月总用电量

R²值为0.705,较为接近1,模型的拟合程度较好

从直方图和回归标准化残差的正态P-P图中我们可以发现变量是接近正态的,在近似正态的条件下可以进行线性回归

拟合方程为

y=0.829+0.004xy=-0.829+0.004x

以拟合值y^i\widehat{y}_i为横坐标,残差e^i\widehat{e}_i为纵坐标

问题描述

求解

电池寿命统计

个案数 平均值 标准 偏差 标准 错误 平均值的 95% 置信区间 最小值 最大值
下限 上限
生产厂A 6 43.1667 3.81663 1.55813 39.1614 47.1720 38.00 48.00
生产厂B 6 30.5000 3.08221 1.25831 27.2654 33.7346 26.00 34.00
生产厂C 6 46.5000 5.57674 2.27669 40.6476 52.3524 39.00 52.00
总计 18 40.0556 8.15636 1.92247 35.9995 44.1116 26.00 52.00

方差齐性检验

莱文统计 自由度 1 自由度 2 显著性
基于平均值 2.333 2 15 .131
基于中位数 .557 2 15 .584
基于中位数并具有调整后自由度 .557 2 7.877 .594
基于剪除后平均值 2.151 2 15 .151

“基于中位数并具有调整后自由度”的方差检验结果对应的显著性值为0.594>0.05,可以认为样本间的方差是齐性的,所以可以使用方差齐性条件下对应的分析方法进行后续分析。使用ANOVA方差分析的结果分析样本的显著性。

平方和 自由度 均方 F 显著性
组间 855.111 2 427.556 23.251 0 .000
线性项 对比 33.333 1 33.333 1.813 0 .198
线性项 偏差 821.778 1 821.778 44.689 0 .000
组内 275.833 15 18.389
总计 1130.944 17

电池寿命样本组间的显著性为0.000<<0.05,因此可以拒绝原假设,即认为三个生产商之间具有显著性差异,生产商对于电池寿命的长短具有显著影响,并且电池寿命样本组间也具有显著性差异。

μAμB95%同时置信区间为[7.3896,17.9437]μAμC95%同时置信区间为[8.6104,1.9437]μBμC95%同时置信区间为[21.2771,10.7229]\begin{array}{l} \mu_{A}-\mu_{B} 的 95 \% 同时置信区间为[7.3896,17.9437]\\ \mu_{A}-\mu_{C} 的 95 \% 同时置信区间为 [-8.6104,1.9437]\\ \mu_{B}-\mu_{C} 的95\%同时置信区间为 [-21.2771,-10.7229]\\ \end{array}

结合多重比较表分析得出:我们有95%的概率断言μA>μB\mu_{A}>\mu_{B}μC>μB\mu_{C}>\mu_{B}再结合“描述”表,从点估计的角度再结合多重比较表μAμB\mu_{A}-\mu_{B}μAμC\mu_{A}-\mu_{C}中的95%置信区间的大致情况,我们综合分析可以得出结论:生产厂C最好,生产厂A其次,生产厂B最差。

问题描述

求解

浓度和温度 的显著性均大于0.05,因此影响不大

作者

GWJ

发布于

2022-07-22

更新于

2022-07-22

许可协议

评论