某人记录了21天每天使用空调器的时间和使用烘干器的次数,并监视电表以计算出每天的耗电量,数据见下表,试研究耗电量(KWH)与空调器使用的小时数(AC)和烘干器使用次数(DRYER)之间的关系,建立并检验回归模型,诊断是否有异常点。
序号  1    2    3    4    5    6    7    8    9      10    11
KWH    35    63    66    17    94    79    93    66    94    82    78
AC    1.5  4.5  5.0  2.0  8.5  6.0  13.5  8.0  12.5  7.5  6.5
空调用电计算
DRYER  1    2    2    0    3    3    1    1    1      2    3
序号  12    13    14    15    16    17    18    19    20    21
kWH    65    77    75    62    85    43    57    33    65    33
AC    8.0  7.5  8.0  7.5  12.0  6.0  2.5  5.0  7.5  6.0
DRYER  1    2    2    1    1    0    3    0    1    0
耗电量因素分析回归模型
摘要:本文针对题目中给出的耗电量(KWH)与空调器使用的小时数(AC)和烘干器使用次数(DRYER)分别建立了二元线性、纯二次、交叉、完全二次回归模型,经过模型比较得出题目中给出的数据比较符合二元线性回归模型。对模型进行求解得到二元线性回归方程为,根据残差图分析知第21个数据为异常数据。
模型假设
1、 假设测的数据真实可靠;
2、 假设耗电量只与题目中给的空调器使用的小时数和烘干器使用次数有关,与其他因素无关。
符号说明
1表示空调器使用的小时数(单位:小时);
2表示烘干器使用次数(单位:次)。
模型建立
二元线性回归模型为:
其中为回归系数。
模型求解
由程序(参见附录)求得回归系数,画出残差图可知第21个数据为异常数据。
附录
x2=[1  2    2    0    3    3    1    1    1      2    3 1    2    2    1    1    0    3    0    1    0];
disp('多元线性回归')
X=[ones(21,1) x1' x2'];
[b,bint,r,rint,stats]=regress(y',X);
b
stats
rcoplot(r,rint)
disp('纯二次回归')
Y=[ones(21,1) x1' x2' (x1.^2)' (x2.^2)'];
[b,bint,r,rint,stats]=regress(y',Y);
b
stats
disp('完全二次回归')
Y=[ones(21,1) x1' x2' (x1.^2)'  2*(x1.*x2)' (x2.^2)'];
[b,bint,r,rint,stats]=regress(y',Y);
b
stats
disp('交叉回归')
Y=[ones(21,1) x1' x2' 2*(x1.*x2)'];
[b,bint,r,rint,stats]=regress(y',Y);
b
stats