|
$ @: F4 F( O3 i& ?, ]- \$ B( h2 y我的理解是这样的。无论研究的变量是离散的,还是连续的。只要是“有大量独立的而且均匀的随机变量相加而成”。那么这些变量的分布将近似于正态分布. L. v7 ^+ r9 k# c) d6 D
对于本身就遵从正态分布的变量就不用说了。即使变量不遵从正态分布的变量。采取上面的方式处理也可以具有正态分布的特征, K, m0 G- d* P( D: M
这与我原来学过的即使不是正态分布,其子集的均值分布也遵从正态分布应该是一个意思7 O; o. Q0 k( L& }4 Q y5 D5 q
举例说明:布匹的疵点遵从泊松分布。如果我们把每10匹布作为一个子集。那么这每10匹布的子集的疵点总数遵从正态分布。
" A& a6 m8 ]% R) v( ?6 H* _2 {这里有个前提,就是子集的数量必须是大量的,也就是大抵是5匹为一子集、还是10匹为一子集,还是20匹为一子集合适。实际操作中这点十分重要。
3 `, \ ` e" w) q一个亲身的经历:以前上世纪 八十年代中期,那时工厂都是用的国产设备。每匹布疵点大多在15-20多个。那时每子集为5匹,以此绘制控制图很适用。后来我去广东外资厂。用的是进口设备。每匹疵点0-2个。这样按原来5匹一子集根本就反应不出问题。要达到原来的控制效果至少要50匹一子集。这是不现实的。判断系统是否正常,凭经验就行。控制图在这种情况下已经不适用。子集的均值、标准差与总体的均值、标准差的关系记得是: ; b7 ]+ U1 E, L. T1 B7 f* h
记得是 子集的均值/总体的期望(均值)= N + B s' k" M, R( J
记得是 子集的标准差/总体的标准差= 1/ N
9 a) E, e8 {1 g5 [2 T* n, X其准确度与总体的数量无关,只与子集的数量有关 ( N-1)/N --可能还应该有个根号,但记不得了 --我们抽样就是利用这个原理。如样品100个准确度就是99%* {& u! ]8 K/ v3 l8 V! U1 ~
以上N 为每个子集的匹数 |
|