The regression equation is
Y = - 82.7 + 3.10 X1 + 0.369 X2
Predictor Coef SE Coef T P
Constant -82.65 93.70 -0.88 0.395
X1 3.098 1.993 1.55 0.146
X2 0.3693 0.2148 1.72 0.111
S = 4.75590 R-Sq = 89.8% R-Sq(adj) = 88.1%
Analysis of Variance
Source DF SS MS F P
Regression 2 2400.6 1200.3 53.07 0.000
Residual Error 12 271.4 22.6
Total 14 2672.0
Source DF Seq SS
X1 1 2333.7
X2 1 66.9
Unusual Observations
Obs X1 Y Fit SE Fit Residual St Resid
4 6.2 125.00 115.30 2.12 9.70 2.28R
R denotes an observation with a large standardized residual.
是单次15中不同组合的试验预测??


最新回复
乖乖 (2006-5-24 12:02:39)
QUOTE:
你的残差图分析如何?按照我的判断基准,如果这些判断均符合的话,我会接受这个方程式!
蚂蚁 (2006-5-24 17:13:19)
QUOTE:
这种情况很有可能是高阶项显著。欧立威 (2006-5-24 17:19:38)
QUOTE:
P值不是唯一的标准.现在需要作模型检验, 模型优化,比如异常点剔除, 最佳子集回归等等.
你会发现P值会好起来的.
seamoongudu (2006-5-24 17:22:53)
simpdiv2000 (2006-5-24 19:56:28)
high1998 (2006-5-24 21:06:37)
QUOTE:
xuling0688 (2006-5-24 21:26:16)
线性回归的方差分析是显著的,
但系数的显著性判断,都大于0.05。请问还有意义吗?
造成上述情况的主要原因就是多元回归分析中出现的自变量间的相关。
请你把15组数据都发表出来,肯定可以看到X1与X2的高度相关。
最早发现此问题的是著名统计学家Hald,他在1952年举出一个例子,
讨论的是混凝土散热量(Y)与混凝土中4种成份含量(X1-X4)的回归
方程。模型总效果高度显著,但对于4个自变量都不显著。50多年来,
这个例子一直有人在关注。其数据如下,大家可以算算。
x1 x2 x3 x4 y
7 26 6 60 78.5
1 29 15 52 74.3
11 56 8 20 104.3
11 31 8 47 87.6
7 52 6 33 95.9
11 55 9 22 109.2
3 71 17 6 102.7
1 31 22 44 72.5
2 54 18 22 93.1
21 47 4 26 115.9
1 40 23 34 83.8
11 66 9 12 113.3
10 68 8 12 109.4
xuling0688
xuling0688 (2006-5-24 21:40:18)
如回归分析表,虽然线性回归的方差分析是显著的,拟合也和年强 ,但系数的显著性判断,都大于0.05请问还有意义吗?
The regression equation is
Y = - 82.7 + 3.10 X1 + 0.369 X2
Predictor Coef SE Coef T P
Constant -82.65 93.70 -0.88 0.395
X1 3.098 1.993 1.55 0.146.
X2 0.3693 0.2148 1.72 0.111
忘了告诉你该怎么办了:
一般说来,应该逐个删去最不显著的自变量(注意一次只能删一个),
获得下次的结果之后,再进行下一轮论的判断.
由于你上面的系数检验结果告诉我们, X1比X2更差些,因此应该先删去X1,
再来进行回归. 我敢肯定: 只含X2的这个方程, 就一定是显著的了.由于你只有2个自变量,这时得到的只含变量X2的方程就是最好的方程了.
xuling0688
欧立威 (2006-5-24 22:39:47)
QUOTE:
这个其实可以这样理解:R-SQ其实衡量的是-模型可解释方差/总方差=(1-残差/总方差),所以虽然各个自变量和常数项都不显著,但是只要模型的拟合度良好, R-SQ仍然有可能很好。所以R-SQ衡量的是回归模型不是几个自变量。俗话说“三个臭皮匠,顶得诸葛亮”。
对于多元回归,模型简化是必要的,但是不能简单一一删除,最好用最佳子集回归。选择夸克系数和RSQ以及简化程度最好的一种。当然在这之前还有其他的简化方法。
flyblood (2006-5-25 08:05:06)
simpdiv2000 (2006-5-26 19:28:15)
谢谢
flyblood (2006-5-27 09:29:21)
S称为剩余估计标准差,公式写不出,一会贴图吧,从公式的意义来看表面看是Y对估计值
~y的平均离差,在回归分析中,S反映了所有观测值Y对估计值~y的平均变异程度.对给定的自变量X值,观察值Y并非总是在回归直线上的,而是分布在它的周围,这样就形成了一定的离差,它背后反映的就是独立变量X来估计从属变量Y时所产生的误差,若是这个离差的值越小,即按照给定的x值来估计Y的误差越小.
呵呵,还是需要高人指点一下SE Coef 的计算方法和意义~
谢谢!
(
xianyuner123 (2006-5-27 10:00:52)
QUOTE:
xuling兄弟的解答令我茅塞顿开,PF.simpdiv2000 (2006-5-27 11:30:36)