终于搞清楚组内偏差是怎么计算的了

先给出以下6组数据。其中a为b的2倍,c,d,e是用来分组的。
a              b           c         d         e
2.28        1.14        1        1        1
2.44        1.22        2        1        1
2.56        1.28        3        3       
2.54        1.27        4        4       
8.22        4.11        5        5       
1.66        0.83        6        6       
3.12        1.56        7        7       
3.58        1.79        8        8       
2.00        1.00        9        9       
0.86        0.43        10        10       
0.88        0.44        11        11       
2.84        1.42        12        12       
       
首先,我猜测组内只有一个数据的组内方差是0,为了验证这个,首先计算b的组内方差,使用d来分组,d中只有前两个数据相同,既b中只有前两个属于同一组,其它数据分别自己成组。计算得到的组内标准差为0.0708982。然后再计算b组中前两个数据的组内偏差,值依然为0.0708982,说明猜测是正确的。
但是如果每组数据都是一个,那么组内偏差是否为零呢?
我们计算b的组间偏差,使用c来分组,发现结果并不为0,而是0.772083,总偏差为0.975003。
这又是怎么回事呢? 不要急,我们再计算a的组间偏差和总偏差,结果为1.54417和1.95001。
发现规律了么?没错,后者是前者的2倍。
也就是说如果数据的所有分组都是一个数据的话,那么组间偏差就是总偏差乘以一个系数得到的

这个不会也有人发过了吧,要是那样以后真没法混下去了。

[ 本帖最后由 alexyao 于 2006-3-14 16:36 编辑 ]
我也来说两句 查看全部回复

最新回复

  • aiyinsitan (2006-3-14 17:25:08)

    QUOTE:

    原帖由 alexyao 于 2006-3-14 16:02 发表
    先给出以下6组数据。其中a为b的2倍,c,d,e是用来分组的。
    a              b           c         d         e
    2.28        1.14        1        1        1
    2.44        1.22        2        1        1
    2.56        1.28        3        3       
    2.54        1.27        4        4       
    8.22        4.11        5        5       
    1.66        0.83        6        6       
    3.12        1.56        7        7 ...
    当subgroup  size=1的时候,是用移动极差来估计西格玛的~~~~~~~~~~~``

    不过,对你的研究精神表示鼓励
  • alexyao (2006-3-14 18:26:29)

    能具体解释一下,如何计算移动极差及使用它计算组内偏差么?
  • cliffnest (2006-3-14 21:18:10)

    不懂啊,高人举例说明
  • drinkingsnow (2006-3-14 21:57:54)

    QUOTE:

    原帖由 aiyinsitan 于 2006-3-14 17:25 发表



    当subgroup  size=1的时候,是用移动极差来估计西格玛的~~~~~~~~~~~``

    不过,对你的研究精神表示鼓励
    高……
    实在是高……
  • baidu2000 (2006-3-18 16:26:17)

    不懂!到底怎么弄的啊?
  • 闪电电 (2006-3-18 22:16:54)

    小弟只能是学习了
  • howard (2006-3-19 09:17:22)

    對於組間/組內變異的計算,請參考如下離差平方和的解釋:


    圖片1.JPG

  • howard (2006-3-19 09:22:00)

    其中最後等式的第一項就是組內變異,第二項就是組間變異。
    若以相等的樣本個數(subgroup size=n),則簡化如下:


    圖片2.JPG

  • howard (2006-3-19 09:25:36)

    如果要估計的是組內變異數(方差)與組間的變異數,則必須除以相對的自由度;其中:
            總自由度=nk-1
    組間變異的自由度=k-1
            組內變異的自由度=(nk-1)-(k-1)=k(n-1)
            nk-1一定都比k(n-1)大

    在此順便提醒大家一件事:我們在談的總變異=組內變異+組間變異,這件事指的是離差平方和(就是上面的公式)而不是變異異數。在使用MINITAB計算製程能力分析時,可能會碰到過Stdev(within)比Stdev(overall)大的現象。沒有有呢?

    這種現象並不是上面紅字的敘述有誤,而是因為自由度的關係。


    圖片3.JPG

  • howard (2006-3-19 09:28:16)

    如果說組間的差異很小時,就是上述(1)式的第二項幾乎等於0;相對的總變異幾乎是來自於組內變異的的貢獻,除上相對的自由度時,自然會產生變異數(overall)<變異數(within)的結果,所以就會有Stdev(overall)<Stdev(within)的現象。

    這樣的現象可能來自於兩種情況:
    1.分組不恰當,可以重新考慮分組再重計算
    2.製程本身就是很爛,這個是最需要立即去面對的問題
  • lang13 (2006-3-19 11:59:44)

    专业!!!!!!!!!!!!!!
  • Marcia (2006-3-20 10:05:52)

    按照俺老板的话就是,相当professional
  • yyyy203 (2006-3-23 11:10:42)

    very good
  • yyyy203 (2006-3-23 11:14:17)

    howard ,ouxiang
  • howard (2006-3-24 02:46:48)

    QUOTE:

    原帖由 yyyy203 于 2006-3-23 11:14 发表
    howard ,ouxiang
    不好意思....
    這是什麼意思
  • yyyy203 (2006-3-24 07:10:43)

    就是传说中的偶像啊,呵呵
  • yili9593 (2006-3-24 10:03:17)

    真的不错的东西呀!
  • fininb (2006-3-24 10:29:27)

    good!

    真的不错的东西呀!
  • 天空在微笑 (2006-3-28 09:54:40)

    好东西,买单了
  • sun_sun (2006-6-21 23:04:53)

    QUOTE:

    原帖由 howard 于 2006-3-19 09:28 发表
    如果說組間的差異很小時,就是上述(1)式的第二項幾乎等於0;相對的總變異幾乎是來自於組內變異的的貢獻,除上相對的自由度時,自然會產生變異數(overall)<變異數(within)的結果,所以就會有Stdev(overall)<Stde ...
    分组越多,那组间变异越小,组内变异越大,那为何不直接分组为1呢?

    是不是我分组为1,那组内肯定没有变异啊,我虽然知道不对谁给我解释一下啊?


    而且如howard大师所说,制程太好的时候,也会出现组间方差太小,比如今天生产值为1.01,1.02.1.03,明天也是1.01,1.02.1.03,这不是挺好的啊,