Основы теории статистического вывода



Процедура проверки нулевой гипотезы в общем случае включает следующие этапы:

1.      задается допустимая вероятность ошибки первого рода (Ркр=0,05)

2.      выбирается статистика критерия (Т)

3.      ищется область допустимых значений

4.      по исходным данным вычисляется значение статистики Т

5. если Т (статистика критерия) принадлежит области принятия нулевой гипотезы, то нулевая гипотеза принимается (корректнее говоря, делается заключение, что исходные данные не противоречат нулевой гипотезе), а в противном случае нулевая гипотеза отвергается и принимается альтернативная гипотеза.[1] Это основной принцип проверки всех статистических гипотез.

Статистическая гипотеза – это предположение о свойствах случайных величин или событий, которое мы хотим проверить по имеющимся данным. 

Примеры статистических гипотез в педагогических исследованиях:

Гипотеза 1. Успеваемость класса стохастически (вероятностно) зависит  от уровня обучаемости учащихся.

Гипотеза 2. Усвоение начального курса математики не имеет существенных различий у учащихся , начавших обучение с 6 или 7 лет.

Гипотеза 3.  Проблемное обучение в первом классе эффективнее по сравнению с традиционной методикой обучения в отношении общего развития учащихся.

1. Результаты наблюдений имеют нормальное распределение с нулевым математическим ожиданием. Н0: σ = 1, или Н0m = 0, σ произвольно; 2. Результаты наблюдений имеют функцию распределения N(0,1). Н0m = 0, σ = 1 или Н0:(F(х) ≡ Ф(х)) – три«-« = при всех х;3. Результаты наблюдений имеют нормальное распределение.  (тут деленное на сигма) при некоторых m, σ;4. Результаты наблюдений в двух независимых выборках имеют одно и то же нормальное распределение. Н0m1 m2, σ1 = σ2, причем m1и σ1 произвольны;5. Результаты наблюдений в двух независимых выборках имеют одно и то же распределение. Н0F(x) ≡ G(x), где F(x) – произвольная функция распределения;

Нулевая гипотеза – это основное проверяемое предположение, которое обычно формулируется как отсутствие различий, отсутствие влияние фактора, отсутствие эффекта, равенство нулю значений выборочных характеристик и т.п. Примером нулевой гипотезы в педагогике является утверждение о том, что различие в результатах выполнения двумя группами учащихся одной и той же контрольной работы вызвано лишь случайными причинами.

Другое проверяемое предположение (не всегда строго противоположное или обратное первому) называется конкурирующей илиальтернативной гипотезой.  Так, для упомянутого выше примера гипотезы Н0 в педагогике одна из возможных альтернатив Н1  будет определена  как:  уровни выполнения работы в двух группах учащихся различны и это различие определяется влиянием неслучайных факторов, например, тех или других методов обучения.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость проверить ее. Так как проверку производят статистическими методами, то данная проверка называется статистической.

При проверке статистических гипотез возможны ошибки (ошибочные суждения) двух видов:

—   можно отвергнуть нулевую гипотезу, когда она на самом деле верна (так называемая ошибка первого рода);

—   можно принять нулевую гипотезу, когда она на самом деле не верна (так называемая ошибка второго рода).

Ошибка, состоящая в принятии нулевой гипотезы, когда она ложна, качественно отличается от ошибки, состоящей в отвержении гипотезы, когда она истинна. Эта разница очень существенна вследствие того, что различна значимость этих ошибок. Проиллюстрируем вышесказанное на следующем примере.[2]

Пример 1. Процесс производства некоторого медицинского препарата весьма сложен. Несущественные на первый взгляд отклонения от технологии вызывают появление высокотоксичной побочной примеси. Токсичность этой примеси может оказаться столь высокой, что даже такое ее количество, которое не может быть обнаружено при обычном химическом анализе, может оказаться опасным для человека, принимающего это лекарство. В результате, прежде чем выпускать в продажу вновь произведенную партию, ее подвергают исследованию на токсичность биологическими методами. Малые дозы лекарства вводятся некоторому количеству подопытных животных, например, мышей, и результат регистрируют. Если лекарство токсично, то все или почти все животные гибнут. В противном случае норма выживших велика.

Исследование лекарства может привести к одному из возможных способов действия: выпустить партию в продажу (а1), вернуть партию поставщику для доработки или, может быть, для уничтожения (а2).

Ошибки двух видов, связанные с действиями а1 и а2 совершенно различны, различна и важность избежания их. Сначала рассмотрим случай, когда применяется действие а1, в то время когда предпочтительнее а2. Лекарство опасно для пациента, в то время как оно признано безопасным. Ошибка этого вида может вызвать смерть пациентов, употребляющих этот препарат. Это ошибка первого рода, так как нам важнее ее избежать.

Рассмотрим случай когда предпринимается действие а2, в то время когда а1 является более предпочтительным. Это означает, что вследствие неточностей в проведении эксперимента партия нетоксичного лекарства классифицировалась как опасная. Последствия ошибки могут выражаться в финансовом убытке и в увеличении стоимости лекарства. Однако случайное отвержение совершенно безопасного лекарства, очевидно, менее нежелательно, чем, пусть даже изредка происходящие гибели пациентов. Отвержение нетоксичной партии лекарства – ошибка второго рода.

Допустимая вероятность ошибки первого рода (Ркр) может быть равна 5% или 1% (0.05 или 0.01).

Уровень значимости – это вероятность ошибки первого рода при принятии решения (вероятность ошибочного отклонения нулевой гипотезы).

Альтернативные гипотезы принимаются тогда и только тогда, когда опровергается нулевая гипотеза. Это бывает в случаях, когда различия, скажем, в средних арифметических экспериментальной и контрольной групп настолько значимы (статистически достоверны), что риск ошибки отвергнуть нулевую гипотезу и принять альтернативную не превышает одного из трех принятых уровней значимостистатистического вывода:

первый уровень — 5% (р=5%); где допускается риск ошибки в выводе в пяти случаях из ста теоретически возможных таких же экспериментов при строго случайном отборе испытуемых для каждого эксперимента;

второй уровень — 1%, т. е. соответственно допускается риск ошибиться только в одном случае из ста;

третий уровень — 0,1%, т. е. допускается риск ошибиться только в одном случае из тысячи.

Последний уровень значимости предъявляет очень высокие требования к обоснованию достоверности результатов эксперимента и потому редко используется. В педагогических исследованиях, не нуждающихся в очень высоком уровне достоверности, представляется разумным принять 5% уровень значимости.

Статистика критерия (Т) — некоторая функция от исходных данных, по значению которой проверяется нулевая гипотеза. Чаще всего статистика критерия является числовой функцией, но она может быть и любой другой функцией, например, многомерной функцией.

Всякое правило, на основе которого отклоняется или принимается нулевая гипотеза называется критерием для проверки данной гипотезы. Статистический критерий (критерий) – это случайная величина, которая служит для проверки статистических гипотез.

Критическая область – совокупность значений критерия, при котором нулевую гипотезу отвергают. Область принятия нулевой гипотезы (область допустимых значений) – совокупность значений критерия, при котором нулевую гипотезу принимают. При справедливости нулевой гипотезы вероятность того, что статистика критерия попадает в область принятия нулевой гипотезы должна бытьравна 1-Ркр.

Проверка статистической гипотезы состоит в том, чтобы сформулировать такое правило, которое позволило бы по результатам соответствующих наблюдений принять или отклонить гипотезу. Правило, согласно которому гипотеза принимается или отвергается, называется статистическим критерием проверки гипотезы.

2.1. гипотеза о виде распределения

 Пусть имеется выборка  наблюдаемой случайной величины с функцией распределения .

а) Простой гипотезой является утверждение =, где  полностью задана.

б) Сложной гипотезой является утверждение 

Для проверки гипотезы о виде распределения используются критерии: Колмогорова, Смирнова,  и  Мизеса (при негруппированных наблюдениях),  Пирсона, отношения правдоподобия (при группированных наблюдениях).

 

Пример 2.1

Дана выборка объема :

 

1

2

3

4

15

8

4

3

Требуется проверить гипотезу о согласии данной выборки с законом Пуассона.

Решение

Зададимся уровнем значимости .

Поскольку распределение случайных величин является дискретным, для проверки гипотезы о согласии воспользуемся критерием  Пирсона.

,   .

ОМП для параметра  является . Для данной выборки . Тогда ,  ,   .

 

Статистика Пирсона:

 

В случае оценивания по данной выборке  параметров распределения статистика  Пирсона подчиняется -распределению с  степенью свободы, где  – число групп. В данном случае число степеней свободы равно . Находим по таблице из приложения 3 критическое значение статистики Пирсона при . Поскольку , то гипотеза о согласии данной выборки с распределением Пуассона отвергается. Отметим, что если , то гипотеза о согласии не отвергается.

Пример 2.2

В следующей таблице представлены результаты измерений длин чайных ложечек в сантиметрах.

 

9.65

9.05

9.20

9.79

6.69

9.14

9.93

11.95

10.20

10.21

8.58

9.82

11.75

9.05

12.31

10.47

10.10

8.40

10.77

10.19

8.78

10.36

7.30

11.03

12.47

11.06

10.31

7.43

9.87

10.29

9.41

10.37

9.52

10.15

5.36

11.02

8.52

8.34

10.94

9.33

10.01

9.87

9.43

8.27

10.34

9.48

9.61

10.95

10.01

9.86

 Требуется проверить гипотезу о согласии данной выборки с распределением Лапласа.

Решение

Зададимся уровнем значимости .

Поскольку мы имеем непрерывную случайную величину, то для проверки гипотезы о согласии воспользуемся критерием типа Колмогорова, статистика которого имеет вид: , где . Объем выборки  – упорядоченные по возрастанию выборочные значения,  – функция распределения Лапласа.

Для нахождения ОМП параметров распределения воспользуемся программной системой ISW 4.0 [10]: .

Вычисляем значение статистики Колмогорова . Находим по таблице из приложения 5 критическое значение статистики Колмогорова при . Поскольку , то гипотеза о согласии данной выборки с распределением Лапласа не отвергается.

2.2. гипотеза независимости

 

В эксперименте наблюдается двумерная случайная величина  с неизвестной функцией распределения, и есть основания предполагать, что  и  независимы. В этом случае нужно проверить гипотезу независимости:

:,

где и  – некоторые одномерные функции распределения.

Для проверки гипотезы независимости используется критерий  Пирсона. Если исходные данные негруппированы, то предварительно производится группировка наблюдений.

 Пример 2.3

В следующей таблице представлены значения показателя  и значения показателя  в течение 12 лет.

 Год

Год

1986

152

170

1992

177

200

1987

159

179

1993

179

207

1988

162

187

1994

184

215

1989

165

189

1995

186

216

1990

170

193

1996

190

220

1991

172

199

1997

191

225

Проверить гипотезу о независимости величин  и .

 Решение

Для проверки гипотезы независимости воспользуемся критерием независимости . Зададимся уровнем значимости . Составим таблицу сопряженности двух признаков: :

X

 

Y

 

(151,161]

(161,171]

(171,181]

(181,191]

(165,180]

2

0

0

0

2

(180,195]

0

3

0

0

3

(195,210]



Страницы: Первая | 1 | 2 | 3 | Вперед → | Последняя | Весь текст




sitemap sitemap