如何正确选择数据分布?

在做过程能力分析之前,我们都要先鉴定数据的分布,本人于此有些疑问:
原则都清楚,P值大于0.05即可,选P值中最大的;
但实际操作时,如果同时正态的P值和其他非正态分布的P值都大于0.05时,是不是不需要再仔细比较就直接选正态分布呢?还是坚持选MAX(P)? 例如:
A: Normal P-Value=0.06, Weibull P-Value=0.20
B: Normal P-Value=0.20, Weibull P-Value>0.25
以上两种情况下选正态还是韦布分布研究过程能力?
本人通常都选正态做,但总觉得很不妥,期待大家指点!
我也来说两句 查看全部回复

最新回复

  • georgecho (2008-7-23 22:12:35)

    我觉得情形A,选择Weibull分布,毕竟P值大很多;
    情形B,如果从过程特性上看,数据应该是正态分布的则使用正态分布,因为此时正态分布没有Weibull分布显著有可能是样本量不足引起的。
  • hyc1754 (2008-7-24 09:24:44)

    多谢指点!
    再问一个问题:
    在分析数据分布时,有什么方法分辨样本中的异常值并将其剔除吗?
    因为在实际操作的时候,经常碰到一些线性尺寸的数据呈非正态分布,觉得可能存在异常数据导致的错误结果.
  • verdy (2008-7-31 12:42:48)

    不知道分布怎么能判断数据是异常的呢`~~