рефераты бесплатно
 

МЕНЮ


Реферат: Эконометрические методы управления качеством и сертификации продукции

Табл. 3.

Результаты 1000 испытаний

по двум альтернативным признакам (случай несовместности )

Х=0 Х=1 Всего
У=0 904 48 952
У=1 48 0 48
Всего 952 48 1000

Судя по данным табл.3, дефекты всегда встречаются поодиночке  - если есть один, то другого нет. В результате входной уровень дефектности по каждому признаку по-прежнему равен 0,048, в то время как доля дефектных изделий (т.е. имеющих хотя бы один дефект) вдвое выше, т.е. входной уровень дефектности для изделия в целом равен 0,096.

Случай независимости результатов контроля по двум независимым признакам (табл.4) лежит между крайними случаями поглощения и несовместности. Независимость альтернативных признаков обосновывается путем статистической проверки с помощью описанного ниже критерия n1/2V, значение которого для данных табл.4 равно 1,866.

Табл. 4.

Результаты 1000 испытаний

по двум альтернативным признакам (случай независимости)

Х=0 Х=1 Всего
У=0 909 43 952
У=1 43 5 48
Всего 952 48 1000

Согласно данным табл.4, входной уровень дефектности для каждого из двух альтернативных признаков по-прежнему равен 0,048, в то время как для изделий в целом он равен 0,091, т.е. на 5,5% меньше, чем в случае несовместности, и на 47% больше, чем в случае поглощения.

Проблема состоит в том, что таблицы и стандарты по статистическому приемочному контролю относятся обычно к случаю одного контролируемого параметра. А как быть, если контролируемых параметров несколько? Приведенные выше примеры показывают, что входной уровень дефектности изделия в целом не определяется однозначно по входным уровням дефектности отдельных его параметров.

Как должны соотноситься характеристики планов контроля по отдельным признакам с характеристиками  плана контроля по двум (или многим) признакам одновременно? Рассмотрим распространенную рекомендацию - складывать уровни дефектности, т.е. считать, что уровень дефектности изделия в целом равен сумме уровней дефектности по отдельным его параметрам. Она, очевидно, опирается на гипотезу несовместности дефектов, а потому во многих случаях преувеличивает дефектность, а потому ведет к использованию излишне жестких планов контроля, что экономически невыгодно.

Зная специфику применяемых технологических процессов, в ряде конкретных случаев можно предположить, что дефекты по различным признакам возникают независимо друг от друга. Это предположение необходимо обосновывать по статистическим данным. Если же оно обосновано, следует рассчитывать входной уровень дефектности по формуле

1 - p00   =  p1 + p2 - p1p2 ,

 соответствующей независимости признаков.

 Итак, необходимо уметь проверять по статистическим данным гипотезу независимости двух альтернативных признаков. Речь идет о статистической проверке нулевой гипотезы

Н0:  p11 = p1 p2  (22)

(что эквивалентно проверке равенства p00 = (1 - p1)(1 - p2)). Нетрудно проверить, что гипотеза о справедливости равенства (22) эквивалентна гипотезе

 Н0 : p00 p11 - p10 p01  = 0. (23)

В простейшем случае предполагается, что проведено n независимых испытаний (Xi , Yi), i = 1,2,...,n, в каждом из которых проконтролированы два альтернативных признака, а вероятности результатов контроля не меняются от испытания к испытанию. Общий вид статистических данных приведен в табл.5.

Табл. 5.

Общий вид результатов контроля

по двум альтернативным признакам.

Х=0 Х=1 Всего
У=0

a

b

a+b

У=1

c

d

c+d

Всего

a+c

b+d

n

В табл.5 величина a - число испытаний, в которых (Xi , Yi) = (0,0), величина b - число испытаний, в которых (Xi , Yi) = (1,0), и т.д.

Случайный вектор (a, b, c, d) имеет мультиномиальное распределение с числом испытаний n и вектором вероятностей исходов (p00 , p10 , p01 , p11 ). Состоятельными оценками этих вероятностей являются дроби a/n, b/n, c/n, d/n соответственно. Следовательно, критерий проверки гипотезы (23) может быть основан на статистике

Z = ad - bc . (24)

Как вытекает из известной формулы для ковариаций мультиномиального вектора (см., например, формулу (6.3.5) в учебнике С.Уилкса [14] на с. 153),

М(Z) = n (p10 p01  - p00 p11), (25)

что равно 0 при справедливости гипотезы независимости (23).

Связь между переменными X и Y обычно измеряется коэффициентом, отличающимся от Z нормирующим множителем:

V = (ad - bc) { (a + b)(a + c)(b + d)(c + d) } - 1/2(26)

(см. классическую монографию М. Дж. Кендалла и А. Стьюарта [15, с.723], на которую уже были ссылки, в частности, в главе 5). При справедливости гипотезы Н0 и больших n случайная величина nV2 имеет хи-квадрат распределение с одной степенью свободы, а n1/2V имеет стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1 (см. [15, с.736]).

Рассмотрим еще один пример. Пусть проведено 100 испытаний, результаты которых описаны в табл.6. Тогда

V = (50 . 20 - 10 . 20) (60 . 70 . 30 . 40)-1/2 =

= (1000 - 200) . 5940000-1/2 = 800 / 2245 = 0,35635,

n1/2V = 3,5635  .

Табл. 6.

Результаты 100 испытаний

по двум альтернативным признакам.

Х=0 Х=1 Всего
У=0 50 10 60
У=1 20 20 40
Всего 70 30 100

Поскольку полученное значение n1/2V превышает критическое значение при любом применяемом в статистике уровне значимости, то гипотезу о независимости признаков необходимо отклонить.

К сожалению, приведенный простой метод годится не всегда. При статистическом анализе реальных данных возникают проблемы, связанные с отсутствием достаточно больших однородных выборок, т.е. выборок, в которых постоянны параметры вероятностных распределений. Реально единицы продукции представляются на контроль партиями, из каждой партии контролируются лишь несколько изделий, т.е. малая выборка. При этом от партии к партии меняются параметры p00, p10, p01, p11, описывающие уровень дефектности. Поэтому необходимы статистические методы, позволяющие проверять гипотезу независимости признаков по совокупности малых выборок. Построим один из возможных методов.

Рассмотрим вероятностную модель совокупности k малых выборок объемов n1 , n2 ,..., nk соответственно. Пусть j -я выборка (Xjt , Yjt), t = 1, 2,..., nj , имеет распределение, задаваемое вектором параметров (p00j, p10j, p01j, p11j) в соответствии с ранее введенными обозначениями, j = 1,2,...,k .  Будем проверять гипотезу

Н0:  p11j = (p10j + p11j) (p01j + p11j), j = 1,2,...,k, (27)

или в эквивалентной формулировке

 Н0 :  p11j p00j -  p10j p01j , j = 1,2,...,k .(28)

Основная идея состоит в нахождении асимптотического распределения статистики типа n1/2V при росте числа k малых выборок, а именно, статистики

 S = g1 Z1 +  g2 Z2 + ... +  gk Zk , (29)

где Z1 , Z2 ,..., Zk - статистики, рассчитанные по формуле (24) для каждой из k  выборок, т.е. Zj = ajdj - bjcj , j = 1,2,...,k, а g1 , g2 , ... , gk - некоторые весовые коэффициенты, которые, в частности, могут совпадать. Поскольку

 М(S) = g1 М(Z1) +  g2 М(Z2) + ... +  gk М(Zk),(30)

то при справедливости гипотезы независимости (27) - (28) имеем М(S) = 0 согласно соотношению (25). Поскольку слагаемые в сумме (29) независимы, то при росте k случайная величина S в силу Центральной Предельной Теоремы является асимптотически нормальной. Дисперсия этой величины равна сумме дисперсий слагаемых:

 D(S) = g12 D(Z1 ) +  g22 D(Z2) + ... +  gk2 D(Zk) . (31)

Для оценивания дисперсии S необходимо использовать несмещенные оценки дисперсий в каждой из k выборок (и в этом одна из основных "изюминок" разбираемого метода). Предположим, что построены статистики Tj такие, что

М(Tj) = D(Zj) , j = 1,2,...,k .  (32)

Тогда при некоторых математических "условиях регулярности", на которых нет необходимости здесь останавливаться, несмещенная оценка дисперсии статистики S, имеющая согласно формулам (31) и (32) вид

 L = g12 T1 +  g22 T2 + ... +  gk2 Tk , (33)

в силу закона больших чисел такова, что дробь  D(S) / L приближается к 1 при росте числа выборок (сходимость по вероятности). Отсюда следует, что распределение случайной величины Q = S L-1/2 приближается при росте числа выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Следовательно, критерий проверки гипотезы (27) - (28) независимости признаков, состоящий в том, что при - 1,96 < Q < 1,96 гипотеза принимается, а при Q , выходящих за пределы интервала  (- 1,96; 1,96) , гипотеза отклоняется, имеет уровень значимости, приближающийся к 0,05 при росте числа выборок. Мощность этого критерия зависит от величины М(S)D(S)-1/2 при альтернативе.

Для реализации намеченного плана осталось научиться несмещенно оценивать D(Zj). К сожалению, в литературе по несмещенному оцениванию не рассматривают случай мультиномиального распределения, поэтому кратко опишем процедуру построения несмещенной оценки D(Zj). Поскольку согласно формулам (24) и (25)

D(Zj) = М( Zj2 ) - (М( Zj ))2  = М (aj2dj2) - 2 М (ajbjcjdj) +

+ М (bj2cj2) + nj2 (p11j p00j  -  p10j p01j)2, (34)

то для вычисления D(Zj) достаточно найти входящие в правую часть формулы (34) начальные смешанные моменты мультиномиального распределения (четвертого порядка). Теоретически это просто - известен вид характеристической функции мультиномиального распределения (см., например, формулу (6.3.4) в монографии [14, с.152]), а начальные смешанные моменты равны значениям ее соответствующих производных в 0,  деленным на нужную степень мнимой единицы (формула (5.2.3) в монографии [4, с.131]). Например, с помощью описанной процедуры после некоторых вычислений получаем, что (для упрощения записи здесь и далее опустим индекс j)

М (a2d2) = n(n-1)(n-2)(n-3)p11 2p002 + n(n-1)(n-2)(p112p00 +

+ p11 p002 ) + n(n-1)p11 p00 . (35)

Формула (35) показывает, что начальные смешанные моменты мультиномиального распределения являются многочленами от параметров p11, p00, p10, p01 этого распределения, однако конкретный вид этих многочленов достаточно громоздок, поэтому не будем их здесь выписывать, ограничившись формулой (35) в качестве образца.

Страницы: 1, 2, 3, 4, 5, 6


ИНТЕРЕСНОЕ



© 2009 Все права защищены.