Вероятность недопущения ошибки второго рода при проверке статистических гипотез называется

Тема 3.5.
СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

План лекции:

  1. Понятие гипотезы.

  2. Схема статистической
    проверки гипотезы.

Список литературы:

  1. Вентцель, Е.С.
    Теория вероятностей [Текст] / Е.С.
    Вентцель. – М.: Высшая школа, 2006. – 575 с.

  2. Гмурман, В.Е. Теория
    вероятностей и математическая статистика
    [Текст] / В.Е. Гмурман. — М.: Высшая школа,
    2007. — 480 с.

  3. Кремер, Н.Ш. Теория
    вероятностей и математическая статистика
    [Текст] / Н.Ш.
    Кремер — М: ЮНИТИ, 2002. – 543 с.

п.1. Понятие
гипотезы.

Одна
из
часто
встречающихся на практике задач,
связанных с при­менением статистических
методов, состоит в решении вопроса о
том, должно ли на основании данной
выборки быть принято или, напро­тив,
отвергнуто некоторое предположение
(гипотеза) относительно ге­неральной
совокупности (случайной величины).

Например,
новое
лекарство испытано на определенном
числе лю­дей. Можно ли сделать по
данным результатам лечения обоснованный
вывод о том, что новое лекарство более
эффективно, чем применявшие­ся ранее
методы лечения? Аналогичный вопрос
логично задать, говоря о новом правиле
поступления в вуз, о новом методе
обучения, о пользе быстрой ходьбы, о
преимуществах новой модели автомобиля
или тех­нологического процесса и т.
д.

Процедура
сопоставления высказанного предположения
(гипотезы) с выборочными данными
называется проверкой
гипотез.

Задачи
статистической проверки гипотез
ставятся
в следующем виде: относительно некоторой
генеральной совокупности высказыва­ется
та или иная гипотеза Н.
Из
этой генеральной совокупности из­влекается
выборка. Требуется указать правило, при
помощи которого можно было бы по выборке
решить вопрос о том, следует ли
отклонить
гипотезу Н
или
принять
ее.

Следует
отметить, что статистическими методами
гипотезу можно
только опровергнуть или не опровергнуть,
но
не доказать. Например,
для
проверки утверждения (гипотеза Н)
автора,
что «в рукописи нет ошибок», рецензент
прочел (изучил)
несколько страниц рукописи.

Если
он обнаружил хотя бы одну ошибку, то
гипотеза Н
отверга­ется,
в противном случае — не отвергается,
говорят, что «результат проверки с
гипотезой согласуется».

Выдвинутая
гипотеза может быть правильной или
неправильной, поэтому возникает
необходимость ее проверки.

Под
статистической
гипотезой
(или
просто гипотезой)
понима­ют
всякое высказывание (предположение) о
генеральной совокупности, проверяемое
по
выборке.

Статистические
гипотезы делятся на гипотезы о параметрах
рас­пределения известного вида (это
так называемые параметрические
ги­потезы)
и гипотезы о виде неизвестного
распределения (непараметри­ческие
гипотезы).

Например,
статистическими являются гипотезы:

  1. генеральная
    совокупность распределена по закону
    Пуассона;

  2. дисперсии
    двух нормальных совокупностей равны
    между собой.

В
первой гипотезе сделано предположение
о виде неизвестного распределения, во
второй – о параметрах двух известных
распределений.

Гипотеза
«на Марсе есть жизнь» не является
статистической, т.к. в ней не идёт речь
ни о виде, ни о параметрах распределения.

Наряду
с выдвинутой гипотезой рассматривают
и противоречащую ей гипотезу. Если
выдвинутая гипотеза будет отвергнута,
то имеет место противоречащая гипотеза.

Таким
образом, одну из гипотез выделяют в
качестве основной
(или
нулевой)
и
обозначают Но,
а другую, являющуюся логическим отрицанием
Н0,
т. е. противоположную Но

в качестве конкурирующей
(или
альтер­нативной)
гипотезы
и обозначают Н1.

Гипотезу,
однозначно фиксирующую распределение
наблюдений, называют простой

ней идет речь об одном значении параметра),
в противном случае — сложной.

Например,
гипотеза Но,
состоящая
в том что математическое ожи­дание
случайной
величины
X
равно ао,
т.е. М(Х)=ао
является
простой. В качестве альтернативной
гипотезы можно рассматривать ги­потезу
Н1:
М(Х)≠
а
о
(сложная
гипотеза).

Имея
две гипотезы Но
и
Н1,
надо
на основе выборки Х1,…
п
принять
либо основную гипотезу Н0,
либо
конкурирующую Н1.

Правило,
по которому принимается решение принять
или откло­нить гипотезу Но
(соответственно,
отклонить или принять Н1),
назы­вается
статистическим
критерием К
(или
просто критерием)
проверки
гипотезы Но.

Проверку
гипотез осуществляют на основании
результатов выбор­ки Х1,
Х2,…,
Хп,
из
которых формируют функцию выборки Кп
1,
Х2,…,
Хn),
называемой статистикой
критерия.

Основной
принцип проверки гипотез
состоит
в следующем. Мно­жество возможных
значений статистики критерия Кп
разбивается
на два непересекающихся подмножества:
критическую
область
S,
т.
е. область отклонения гипотезы Но
и
область

принятия
этой
гипоте­зы. Если фактически наблюдаемое
значение статистики критерия (т. е.
значение критерия, вычисленное по
выборке: Кнабл
=
К(х12,…,
хп))
попадает
в критическую область S,
то
основная гипотеза Но
отклоняет­ся
и принимается альтернативная гипотеза
Н1;
если
же Кнабл
попадает
в
,
то
принимается Но,
а
Н1
отклоняется.

При
проверке гипотезы может быть принято
неправильное реше­ние, т.
е. могут быть допущены ошибки двух родов:

Ошибка
первого рода
состоит
в том, что отвергается нулевая гипо­теза
Но,
когда
на самом деле она верна.

Ошибка
второго рода
состоит
в том, что отвергается альтернатив­ная
гипотеза Н1,
когда
она на самом деле верна.

Рассматриваемые
случаи наглядно иллюстрирует следующая
таб­лица.

Гипотеза
Н0

Отвергается

Принимается

верна

ошибка
1-го рода

правильное
решение

неверна

правильное
решение

ошибка
2-го рода

Вероятность
ошибки 1-го рода (обозначается через α)
называется
уровнем
значимости критерия.

Очевидно,
α
=
P1Но).
Чем
меньше α,
тем
меньше вероятность отклонить верную
гипотезу. Допустимую ошибку 1-го рода
обычно за­дают заранее.

В
одних случаях считается возможным
пренебречь событиями, ве­роятность
которых меньше 0,05 (α=
0,05
означает, что в среднем в 5 случаях из
100 испытаний верная гипотеза будет
отвергнута), в других случаях, когда
речь идет, например, о разрушении
сооружений, гибе­ли судна и т. п., нельзя
пренебречь обстоятельствами, которые
могут появиться с вероятностью,
равной
0,001.

Обычно
для α
используются
стандартные значения: α
=
0,05;
0,01; 0,005; 0,001.

Вероятность
ошибки 2-го рода обозначается через β,
т.е.
β
= Р(Н0Н1).

Величину
1- β,
т.
е. вероятность недопущения ошибки 2-го
рода (отвергнуть неверную гипотезу
принять верную Н1),
называется
мощностью
критерия.

Чем
больше мощность критерия, тем вероятность
ошибки 2-го рода меньше, что, конечно,
желательно (как и уменьшение α).

Последствия
ошибок 1-го, 2-го рода могут быть совершенно
раз­личными: в одних случаях надо
минимизировать α,
в
другом — β.
Так,
применительно к производству, к торговле
можно сказать, что α

риск поставщика (т.е. забраковка по
выборке всей партии изделий, удовлетворяющих
стандарту), β — риск потребителя (т.е.
прием по выборке всей партии изделий,
не удовлетворяющей стандарту);
применительно к судебной системе, ошибка
1-го рода приводит к оправданию виновного,
ошибка 2-го рода — осуждению невиновного.
Или, например, если отвергнуто правильное
решение «продолжить строительство
жилого дома», то эта ошибка первого рода
повлечёт материальный ущерб; если же
принято неправильное решение «продолжать
строительство», несмотря на опасность
обвала стройки, то эта ошибка второго
рода может повлечь гибель людей.

Отметим,
что одновременное
уменьшение ошибок
1-го
и 2-го рода возможно лишь при увеличении
объема выборок.
Поэтому
обычно при заданном уровне значимости
α
отыскивается
критерий с наибольшей мощностью.

п.2. Схема
статистической проверки гипотезы.

Методика
проверки гипотез сводится к следующему:

  1. Располагая
    выборкой Х1,
    Х2,…,Хп,
    формируют
    нулевую гипотезу Но
    и
    альтернативную Н1.

  2. В
    каждом конкретном случае подбирают
    статистику критерия Кп12,…,
    Хп).

  3. По
    статистике критерия Кп
    и
    уровню значимости а
    определяют
    критическую область S

    ).
    Для
    ее отыскания достаточно найти критическую
    точку kкр,
    т.е. границу (или квантиль), отделяющую
    область S
    от

    .

Границы
областей определяются, соответственно,
из соотношений: Р(Kп
>
kкр)
= а,
для
правосторонней критической области S;
Р(Kп
<
kкр)
= а,
для
левосторонней критической обла­сти
S;
Р(Kп
<

)
= Р(Kп
>

)
=,
для двусторонней критической области
S.

Для
каждого критерия имеются соответствующие
таблицы, по ко­торым и находят
критическую точку, удовлетворяющую
приведен­ным выше соотношениям.

  1. Для
    полученной реализации выборки

    подсчитывают значение критерия, т.е.
    Кнабл
    =
    К(х1,х2,…,
    хп)=
    k
    .

  2. Если

    (например,

    для правосторонней области S),
    то нулевую гипотезу Н0
    отвергают, если же

    (),
    то нет оснований, чтобы отвергнуть
    гипотезу Но.

Во
многих случаях закон распределения
изучаемой случайно вели­чины неизвестен,
но есть основания предположить, что он
имеет вполне определенный вид: нормальный,
биномиальный или какой-либо дру­гой.

Пусть
необходимо проверить гипотезу Но
о
том, что случайная
величина
X
под­чиняется
определенному закону распределения,
заданному функцией распределения Fо(х),
т.
е. Но:
Fх(х)=Fо(х).
Под
альтернативной гипо­тезой Н1
будем
понимать в данном случае то, что просто
не выполнена основная (т.е. Н1:
Fх(х)≠
Fо(х)).

Для
проверки гипотезы о распределении
случайной величины X
проведем
выборку, которую оформим в виде
статистического ряда:

xi

x1

x2

Xm

ni

n1

n2

nm

где



объем выборки.

Требуется
сделать заключение: согласуются ли
результаты наблю­дений с высказанным
предположением. Для этого используем
специ­ально подобранную величину —
критерий согласия.

Критерием
согласия
называют
статистический критерий проверки
гипотезы о предполагаемом законе
неизвестного распределения. (Он
используется для проверки согласия
предполагаемого вида распреде­ления
с опытными данными на основании выборки.)

Существуют
различные критерии согласия: Пирсона,
Колмогорова, Фишера, Смирнова и др.
Критерий согласия Пирсона — наиболее
часто употребляемый кри­терий для
проверки простой гипотезы о законе
распределения.

Рассмотрим
применение критерия согласия Пирсона
для проверки гипотезы о нормальном
распределении исследуемой случайной
величины X.

По
результатам выборки подсчитывают:

— эмпирическую абсолютную частоту для
каждого варианта;

оценку математического ожидания;

— несмещённую оценку среднего
квардатического отклонения; числа

в предположении нормальности случайной
величины X
с параметрами
,
;
числа

— теоретические частоты, где n
– объем выборки.

В
качестве критерия проверки нулевой
гипотезы примем случайную величину
.
Доказано, что при

закон распределения этой случайной
величины, независимо от закона
распределения изучаемой величины X,
стремиться к известному закону

с f
степенями
свободы. Число f
находят из равенства
,
где i
– число частичных интервалов, r
– число параметров предполагаемого
распределения. В случае нормального
закона r=2.

Построим
правостороннюю критическую область,
исходя из требования, что вероятность
попадания критерия в эту область, в
предположении справедливости нулевой
гипотезы, была равна принятому уровню
значимости α:
.
Точка

по данным f
и α находится по таблице критических
точек распределения
.
На основании выборки вычисляем
.
Если
,
то нулевую гипотезу отвергают, в противном
случае её можно принять.

5

Ошибки I и II рода при проверке гипотез, мощность

Общий обзор

Принятие неправильного решения

Мощность и связанные факторы

Проверка множественных гипотез

Общий обзор

Большинство проверяемых гипотез сравнивают между собой группы объектов, которые испытывают влияние различных факторов.

Например, можно сравнить эффективность двух видов лечения, чтобы сократить 5-летнюю смертность от рака молочной железы. Для данного исхода (например, смерть) сравнение, представляющее интерес (напри­мер, различные показатели смертности через 5 лет), называют эффектом или, если уместно, эффектом лечения.

Нулевую гипотезу выражают как отсутствие эффекта (например 5-летняя смертность от рака мо­лочной железы одинаковая в двух группах, получаю­щих разное лечение); двусторонняя альтернативная гипотеза будет означать, что различие эффектов не равно нулю.

Критериальная проверка гипотезы дает возможность определить, достаточно ли аргументов, чтобы отвергнуть нулевую гипотезу. Можно принять только одно из двух решений:

  1. отвергнуть нулевую гипотезу и принять альтер­нативную гипотезу
  2. остаться в рамках нулевой гипотезы

Важно: В литературе достаточно часто встречается понятие «принять нулевую гипотезу». Хотелось бы внести ясность, что со статистической точки зрения принять нулевую гипотезу невозможно, т.к. нулевая гипотеза представляет собой достаточно строгое утверждение (например, средние значения в сравниваемых группах равны ).

Поэтому фразу о принятии нулевой гипотезы следует понимать как то, что мы просто остаемся в рамках гипотезы.

Принятие неправильного решения

Возможно неправильное решение, когда отвергают/не отвергают нулевую гипотезу, потому что есть только выборочная информация.

 
Верная гипотеза
H0 H1
Результат

 применения 

критерия
H0 H0 верно принята H0 неверно принята 

(Ошибка второго рода)
H1 H0 неверно отвергнута 

(Ошибка первого рода)
H0 верно отвергнута

Ошибка 1-го рода: нулевую гипотезу отвергают, когда она истинна, и делают вывод, что имеется эффект, когда в действительности его нет. Максимальный шанс (вероятность) допустить ошибку 1-го рода обозначается α (альфа). Это уровень значимости критерия; нулевую гипотезу отвергают, если наше значение p ниже уровня значимости, т. е., если p < α.

Следует принять решение относительно значения а прежде, чем будут собраны данные; обычно назначают условное значение 0,05, хотя можно выбрать более ограничивающее значение, например 0,01.

Шанс допустить ошибку 1-го рода никогда не превысит выбранного уровня значимости, скажем α = 0,05, так как нулевую гипотезу отвергают только тогда, когда p< 0,05. Если обнаружено, что p > 0,05, то нулевую гипотезу не отвергнут и, следовательно, не допустят ошибки 1-го рода.

Ошибка 2-го рода: не отвергают нулевую гипотезу, когда она ложна, и делают вывод, что нет эффекта, тогда как в действительности он существует. Шанс возникновения ошибки 2-го рода обозначается β (бета); а величина (1-β) называется мощностью критерия.

Следовательно, мощность — это вероятность отклонения нулевой гипотезы, когда она ложна, т.е. это шанс (обычно выраженный в процентах) обнаружить реальный эффект лечения в выборке данного объема как статистически значимый.

В идеале хотелось бы, чтобы мощность критерия составляла 100%; однако это невозможно, так как всегда остается шанс, хотя и незначительный, допустить ошибку 2-го рода.

К счастью, известно, какие факторы влияют на мощность и, таким образом, можно контролировать мощность критерия, рассматривая их.

Мощность и связанные факторы

Планируя исследование, необходимо знать мощность предложенного критерия. Очевидно, можно начинать исследование, если есть «хороший» шанс обнаружить уместный эффект, если таковой существует (под «хорошим» мы подразумеваем, что мощность должна быть по крайней мере 70-80%).

Этически безответственно начинать исследование, у которого, скажем, только 40% вероятности обнаружить реальный эффект лечения; это бесполезная трата времени и денежных средств.

Ряд факторов имеют прямое отношение к мощности критерия.

Объем выборки: мощность критерия увеличивается по мере увеличения объема выборки. Это означает, что у большей выборки больше возможностей, чем у незначительной, обнаружить важный эффект, если он существует.

Когда объем выборки небольшой, у критерия может быть недостаточно мощности, чтобы обнаружить отдельный эффект. Эти методы также можно использовать для оценки мощности критерия для точно установленного объема выборки.

Вариабельность наблюдений: мощность увеличивается по мере того, как вариабельность наблюдений уменьшается.

Интересующий исследователя эффект: мощность критерия больше для более высоких эффектов. Критерий проверки гипотез имеет больше шансов обнаружить значительный реальный эффект, чем незначительный.

Уровень значимости: мощность будет больше, если уровень значимости выше (это эквивалентно увеличению допущения ошибки 1-го рода, α, а допущение ошибки 2-го рода, β, уменьшается).

Таким образом, вероятнее всего, исследователь обнаружит реальный эффект, если на стадии планирования решит, что будет рассматривать значение р как значимое, если оно скорее будет меньше 0,05, чем меньше 0,01.

Обратите внимание, что проверка ДИ для интересующего эффекта указывает на то, была ли мощность адекватной. Большой доверительный интервал следует из небольшой выборки и/или набора данных с существенной вариабельностью и указывает на недостаточную мощность.

Проверка множественных гипотез

Часто нужно выполнить критериальную проверку значимости множественных гипотез на наборе данных с многими переменными или существует более двух видов лечения.

Ошибка 1-го рода драматически увеличивается по мере увеличения числа сравнений, что приводит к ложным выводам относительно гипотез. Следовательно, следует проверить только небольшое число гипотез, выбранных для достижения первоначальной цели исследования и точно установленных априорно.

Можно использовать какую-нибудь форму апостериорного уточнения значения р, принимая во внимание число выполненных проверок гипотез.

Например, при подходе Бонферрони (его часто считают довольно консервативным) умножают каждое значение р на число выполненных проверок; тогда любые решения относительно значимости будут основываться на этом уточненном значении р.

Связанные определения:
p-уровень
Альтернативная гипотеза, альтернатива
Альфа-уровень
Бета-уровень
Гипотеза
Двусторонний критерий
Критерий для проверки гипотезы
Критическая область проверки гипотезы
Мощность
Мощность исследования
Мощность статистического критерия
Нулевая гипотеза
Односторонний критерий
Ошибка I рода
Ошибка II рода
Статистика критерия
Эквивалентные статистические критерии

В начало

Содержание портала

Скачать материал

Основы теории проверки статистических гипотез. 


Доцент Аймаханова А.Ш.

Скачать материал

  • Сейчас обучается 266 человек из 64 регионов

  • Сейчас обучается 392 человека из 61 региона

Описание презентации по отдельным слайдам:

  • Основы теории проверки статистических гипотез. 


Доцент Аймаханова А.Ш.

    1 слайд

    Основы теории проверки статистических гипотез.

    Доцент Аймаханова А.Ш.

  • План лекции: 1. Статистические гипотезы в медико-  
    биологических исследо...

    2 слайд

    План лекции:
    1. Статистические гипотезы в медико-
    биологических исследованиях.
    2. Параметрические критерии различий.
    3. Непараметрические критерии.
    4. Критерии согласия.

  • Процедура сопоставления высказанного предположения (гипотезы) с выборочными...

    3 слайд

    Процедура сопоставления высказанного предположения (гипотезы) с выборочными данными называется проверкой гипотез.
    Задачи статистической проверки гипотез:
    Относительно некоторой генеральной совокупности высказывается та или иная гипотеза Н0.
    Из этой генеральной совокупности извлекается выборка.
    Требуется указать правило, при помощи которого можно было бы по выборке решить вопрос о том, следует ли отклонить гипотезу Н0 или принять ее.

  • Статистическая гипотеза- это предположение о виде распределения или о велич...

    4 слайд

    Статистическая гипотеза- это предположение о виде распределения или о величинах неизвестных параметров генеральной совокупности, которая может быть проверена на основании выборочных показателей.
    Примеры статистических гипотез:
    Генеральная совокупность распределена по нормальному закону Гаусса.
    Дисперсии двух нормальных совокупностей равны между собой.

  • Статистические гипотезы

Параметрические   Непараметрические

    5 слайд

    Статистические гипотезы

    Параметрические   Непараметрические

  • Нулевой гипотезой Н0  называется основная гипотеза, которая проверяется.
А...

    6 слайд

    Нулевой гипотезой Н0 называется основная гипотеза, которая проверяется.
    Альтернативной гипотезой Н1, называется гипотеза, конкурирующая с нулевой, то есть противоречащая ей.
    Простой называют гипотезу, содержащую только одно предположение. a=a0
    Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
    Статистическим критерием проверки гипотезы Н0 называется правило, по которому принимается решение принять или отклонить гипотезу Н0.

  • Основной принцип проверки гипотезПроверку гипотез осуществляют  на основании...

    7 слайд

    Основной принцип проверки гипотез
    Проверку гипотез осуществляют на основании результатов выборки X1,X2,…,Xn , из которых формируют функцию выборки Tn=T(X1,X2,…,Xn ), называемой статистикой критерия.

    Tn=T(X1,X2,…,Xn )

    критическая область S область принятия гипотезы

  • Возможные ошибки при проверке гипотез

Первого рода                 Второго р...

    8 слайд

    Возможные ошибки при проверке гипотез

    Первого рода   Второго рода

  • Уровнем значимости критерия () называется вероятность допустить ошибку 1-...

    9 слайд

    Уровнем значимости критерия () называется вероятность допустить ошибку 1-го рода.
    Вероятность ошибки 2-го рода обозначается через β.
    Мощностью критерия называется вероятность недопущения ошибки 2-го рода (1- β).
    Р(отвергнуть Н0/Н0 верна) или Р(Н1/Н0)
    βР(принять Н0/Н0 неверна) или βР(Н0 /Н1)
    1-βР(принять Н1/Н1 верна)
    Чем больше мощность критерия, тем вероятность ошибки 2-го рода меньше.
    Разумное соотношение между  и β находят, исходя из тяжести последствий каждой из ошибок.

  • Методика проверки гипотез:1. Формирование нулевой Н0 и альтернативной Н1  гип...

    10 слайд

    Методика проверки гипотез:
    1. Формирование нулевой Н0 и альтернативной Н1 гипотез исходя из выборки X1,X2,…,Xn .
    2. Подбор статистики критерия Tn=T(X1,X2,…,Xn )
    3. По статистике критерия Tn и уровню значимости  определяют критическую точку tкр, то есть границу, отделяющую область от S.
    4. Для полученной реализации выборки Х=(X1,X2,…,Xn ) подсчитывают значение критерия, то есть Tнабл=T(X1,X2,…,Xn )t
    5. Если tS (например, t> tкр для правосторонней области S), то нулевую гипотезу Н0 отвергают; если же t (t <tкр), то нет оснований, чтобы отвергнуть гипотезу Н0.

  • t-критерий Стьюдента: Общий вид:

    11 слайд

    t-критерий Стьюдента:
    Общий вид:

  • Случай независимых выборок....

    12 слайд

    Случай независимых выборок.

    df= n1+n2-2

    n1=n2=n

    df=n-1
    n1≠n2

  • Случай зависимых выборок. 






















   df=n-1...

    13 слайд

    Случай зависимых выборок.

    df=n-1

  • Вывод:                                  Критерий Стьюдента может быть использ...

    14 слайд

    Вывод:

    Критерий Стьюдента может быть использован для проверки гипотезы о различии средних только для двух групп.
    Критерий Стьюдента применяется в случае малых выборок, что характерно для медико- биологических экспериментов.
    Если схема эксперимента предполагает большее число групп, воспользуйтесь дисперсионным анализом.
    Если критерий Стьюдента был использован для проверки различий между несколькими группами, то истинный уровень значимости можно получить, умножив уровень значимости, на число возможных сравнений.

  • F- критерий Фишера:                                 1&gt;2df1=n1-1,     df2=n2-1

    15 слайд

    F- критерий Фишера:

    1>2
    df1=n1-1, df2=n2-1

  • Критерии различия называют непараметрическими, если он не базируется на пре...

    16 слайд

    Критерии различия называют непараметрическими, если он не базируется на предположении о типе распределения генеральной совокупности и не использует параметры этой совокупности.
    Применение непараметрических методов целесообразно:
    на этапе разведочного анализа;
    при малом числе наблюдений (до 30);
    когда нет уверенности в соответствии данных закону нормального распределения.

  • Непараметрические критерии представлены основными группами:
критерии различ...

    17 слайд

    Непараметрические критерии представлены основными группами:
    критерии различия между группами
    независимых выборок;
    критерии различия между группами
    зависимых выборок.

  • Различия между независимыми группами

U критерий Манна-Уитни
 двухвыборочный...

    18 слайд

    Различия между независимыми группами

    U критерий Манна-Уитни
    двухвыборочный критерий
    Колмогорова – Смирнова.

  • Различия между зависимыми группами

z – критерий знаков 
Т – критерий Уилкокс...

    19 слайд

    Различия между зависимыми группами

    z – критерий знаков
    Т – критерий Уилкоксона парных
    сравнений

  • Критерии согласия: Критерием согласия  называют статистический критерий прове...

    20 слайд

    Критерии согласия:
    Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

    Пирсона (Хи-квадрат),
    Колмогорова,
    Фишера,
    Смирнова.

  • Критерий согласия χ2 (хи-квадрат) Пирсона.Н0: «между эмперическим распределен...

    21 слайд

    Критерий согласия χ2 (хи-квадрат) Пирсона.
    Н0: «между эмперическим распределением и теоретической моделью нет никакого различия».

    Если эмпирические частоты (ni) сильно отличаются от теоретических (npi) ,то проверяемую гипотезу Но следует отвергнуть; в противном случае-принять.

  • Критерий согласия χ2 (хи-квадрат) Пирсона.


n-объем выборки
k-число интервал...

    22 слайд

    Критерий согласия χ2 (хи-квадрат) Пирсона.

    n-объем выборки
    k-число интервалов разбиения выборки
    ni-число значений выборки, попавших в і-й интервал
    npi — теоретическая частота попадания значений случайной величины Х в і-й интервал.

  • Критерий согласия χ2 (хи-квадрат) Пирсона. или 


О-фактически наблюдаемое чи...

    23 слайд

    Критерий согласия χ2 (хи-квадрат) Пирсона.
    или

    О-фактически наблюдаемое число
    Е- теоретически ожидаемое число

  • Поправка Йейтса  




Для распределения признаков, которые принимают всего 2...

    24 слайд

    Поправка Йейтса

    Для распределения признаков, которые принимают всего 2 значения.

  • Правило применения критерия χ2.*По формуле  вычисляют -           выборочное...

    25 слайд

    Правило применения критерия χ2.
    *По формуле вычисляют — выборочное
    значение статистики критерия.
    *выбрав уровень значимости α критерия,
    по таблице -распределения находим критическую точку

    *Если ≤ , то гипотеза Н0 не противоречит опытным данным;
    если > , то гипотеза Н0 отвергается.
    Неоходимым условием применения критерия Пирсона является наличие в каждом из интервалов не менее 5 наблюдений

  • ЛИТЕРАТУРА:                                  Медик В.А.,Токмачев М.С.,Фишман...

    26 слайд

    ЛИТЕРАТУРА:

    Медик В.А.,Токмачев М.С.,Фишман Б.Б.Статистика в медицине и биологии. М.: Медицина, 2000.
    Лукьянова Е.А. Медицинская статистика.- М.: Изд. РУДН, 2002.
    Рокицкий П.Ф. Биологическая статистика.- Высшая школа, 1973.
    И.В. Павлушков и др. Основы высшей математики и математической статистики.
    (учебник для медицинских и фармацевтических вузов) М., «ГЭОТАР — МЕД»; 2003

  •   СПАСИБО ЗА ВНИМАНИЕ.

Найдите материал к любому уроку, указав свой предмет (категорию), класс, учебник и тему:

6 298 378 материалов в базе

  • Выберите категорию:

  • Выберите учебник и тему

  • Выберите класс:

  • Тип материала:

    • Все материалы

    • Статьи

    • Научные работы

    • Видеоуроки

    • Презентации

    • Конспекты

    • Тесты

    • Рабочие программы

    • Другие методич. материалы

Найти материалы

Другие материалы

  • 20.12.2020
  • 225
  • 2
  • 06.12.2020
  • 230
  • 2
  • 19.11.2020
  • 387
  • 8
  • 12.11.2020
  • 587
  • 9
  • 23.10.2020
  • 207
  • 1
  • 15.10.2020
  • 603
  • 2
  • 22.09.2020
  • 229
  • 4
  • 14.09.2020
  • 116
  • 0

Вам будут интересны эти курсы:

  • Курс повышения квалификации «Педагогическая риторика в условиях реализации ФГОС»

  • Курс повышения квалификации «Основы управления проектами в условиях реализации ФГОС»

  • Курс профессиональной переподготовки «Организация логистической деятельности на транспорте»

  • Курс профессиональной переподготовки «Логистика: теория и методика преподавания в образовательной организации»

  • Курс повышения квалификации «Финансы: управление структурой капитала»

  • Курс профессиональной переподготовки «Разработка эффективной стратегии развития современного вуза»

  • Курс профессиональной переподготовки «Управление информационной средой на основе инноваций»

  • Курс профессиональной переподготовки «Риск-менеджмент организации: организация эффективной работы системы управления рисками»

  • Курс профессиональной переподготовки «Организация деятельности специалиста оценщика-эксперта по оценке имущества»

  • Курс профессиональной переподготовки «Методика организации, руководства и координации музейной деятельности»

  • Курс профессиональной переподготовки «Организация и управление службой рекламы и PR»

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

  • 1 Методика проверки статистических гипотез
  • 2 Альтернативная методика на основе достигаемого уровня значимости
  • 3 Типы критической области
  • 4 Ошибки первого и второго рода
  • 5 Свойства статистических критериев
  • 6 Типы статистических гипотез
  • 7 Типы статистических критериев
    • 7.1 Критерии согласия
    • 7.2 Критерии сдвига
    • 7.3 Критерии нормальности
    • 7.4 Критерии однородности
    • 7.5 Критерии симметричности
    • 7.6 Критерии тренда, стационарности и случайности
    • 7.7 Критерии выбросов
    • 7.8 Критерии дисперсионного анализа
    • 7.9 Критерии корреляционного анализа
    • 7.10 Критерии регрессионного анализа
  • 8 Литература
  • 9 Ссылки

Статистическая гипотеза (statistical hypothesys) — это определённое предположение о распределении вероятностей, лежащем в основе наблюдаемой выборки данных.

Проверка статистической гипотезы (testing statistical hypotheses) — это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.

Статистический тест или статистический критерий — строгое математическое правило, по которому принимается или отвергается статистическая гипотеза.

Методика проверки статистических гипотез

Пусть задана случайная выборка x^m = (x_1,ldots,x_m) — последовательность m объектов из множества X.
Предполагается, что на множестве X существует некоторая неизвестная вероятностная мера mathbb{P}.

Методика состоит в следующем.

  1. Формулируется нулевая гипотеза H_0 о распределении вероятностей на множестве X. Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы — основная или нулевая H_0 и альтернативная H_1. Иногда альтернатива не формулируется в явном виде; тогда предполагается, что H_1 означает «не H_0». Иногда рассматривается сразу несколько альтернатив. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры приводятся ниже.
  2. Задаётся некоторая статистика (функция выборки) T:: X^m to mathbb{R}, для которой в условиях справедливости гипотезы H_0 выводится функция распределения F(T) и/или плотность распределения p(T). Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика T. Вывод функции распределения F(T) при заданных H_0 и T является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для F(T); в статистических пакетах имеются готовые вычислительные процедуры.
  3. Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число alpha in [0,1]. На практике часто полагают alpha=0.05.
  4. На множестве допустимых значений статистики T выделяется критическое множество Omega_alpha наименее вероятных значений статистики T, такое, что mathbb{P}{TinOmega_alphaleft|H_0right.} = alpha. Вычисление границ критического множества как функции от уровня значимости alpha является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.
  5. Собственно статистический тест (статистический критерий) заключается в проверке условия:

Итак, статистический критерий определяется статистикой T
и критическим множеством Omega_alpha, которое зависит от уровня значимости alpha.

Замечание.
Если данные не противоречат нулевой гипотезе, это ещё не значит, что гипотеза верна.
Тому есть две причины.

Альтернативная методика на основе достигаемого уровня значимости

Широкое распространение методики фиксированного уровня значимости было вызвано сложностью вычисления многих статистических критериев в докомпьютерную эпоху. Чаще всего использовались таблицы, в которых для некоторых априорных уровней значимости были выписаны критические значения. В настоящее время результаты проверки гипотез чаще представляют с помощью достигаемого уровня значимости.

Достигаемый уровень значимости (пи-величина, англ. p-value) — это наименьшая величина уровня значимости,
при которой нулевая гипотеза отвергается для данного значения статистики критерия T:

p(T) = min { alpha:: TinOmega_alpha },

где
Omega_alpha — критическая область критерия.

Другая интерпретация:
достигаемый уровень значимости p(T) — это вероятность при справедливости нулевой гипотезы получить значение статистики, такое же или ещё более экстремальное, чем T.

Если достигаемый уровень значимости достаточно мал (близок к нулю), то нулевая гипотеза отвергается.
В частности, его можно сравнивать с фиксированным уровнем значимости;
тогда альтернативная методика будет эквивалентна классической.

Типы критической области

Обозначим через t_alpha значение, которое находится из уравнения F(t_alpha) = alpha, где F(t) = mathbb{P}left{ T<t right} — функция распределения статистики T.
Если функция распределения непрерывная строго монотонная,
то t_alpha есть обратная к ней функция:

t_alpha = F^{-1}(alpha).

Значение t_alpha называется также alphaквантилем распределения F(t).

На практике, как правило, используются статистики T с унимодальной (имеющей форму пика) плотностью распределения.
Критические области (наименее вероятные значения статистики) соответствуют «хвостам» этого распределения.
Поэтому чаще всего возникают критические области одного из трёх типов:

  • Левосторонняя критическая область:
определяется интервалом Omega_alpha = (-infty,, t_alpha).
пи-величина: p(T) = F(T).
  • Правосторонняя критическая область:
определяется интервалом Omega_alpha = (t_{1-alpha},,+infty).
пи-величина: p(T) = 1-F(T).
  • Двусторонняя критическая область:
определяется двумя интервалами Omega_alpha = (-infty,, t_{alpha/2}) cup (t_{1-alpha/2},,+infty);
пи-величина: p(T) = min left{ 2F(T),; 2(1-F(T)) right}.

Ошибки первого и второго рода

  • Ошибка первого рода или «ложная тревога» (англ. type I error, alpha error, false positive) — когда нулевая гипотеза отвергается, хотя на самом деле она верна. Вероятность ошибки первого рода:
alpha = mathbb{P}left{ TinOmega_alpha | H_0 right}.
  • Ошибка второго рода или «пропуск цели» (англ. type II error, beta error, false negative) — когда нулевая гипотеза принимается, хотя на самом деле она не верна. Вероятность ошибки второго рода:
beta(H_1) = mathbb{P}left{ TnotinOmega_alpha | H_1 right}.
  Верная гипотеза
 H_0   H_1 
Результат
 применения 
критерия
 H_0  H_0 верно принята H_0 неверно принята 
(Ошибка второго рода)
 H_1  H_0 неверно отвергнута 
(Ошибка первого рода)
H_0 верно отвергнута

Свойства статистических критериев

Мощность критерия:
1 - beta(H) = mathbb{P}left{ TinOmega_alpha | H right} — вероятность отклонить гипотезу H_0, если на самом деле верна альтернативная гипотеза H.
Мощность критерия является числовой функцией от альтернативной гипотезы H.

Несмещённый критерий:
1-beta(H) geq alpha
для всех альтернатив H
или, что то же самое,
mathbb{P}left{ TinOmega_alpha | H right} geq mathbb{P}left{ TinOmega_alpha | H_0 right}
для всех альтернатив H.

Состоятельный критерий:
beta(H) to 0 при mtoinfty для всех альтернатив H.

Равномерно более мощный критерий.
Говорят, что критерий с мощностью 1-beta(H) является равномерно более мощным, чем критерий с мощностью 1-beta'(H), если выполняются два условия:

  1. beta(H_0) = beta'(H_0);
  2. beta(H_1) leq beta'(H_1) для всех рассматриваемых альтернатив H_1neq H_0, причём хотя бы для одной альтернативы неравенство строгое.

Типы статистических гипотез

  • Простая гипотеза однозначно определяет функцию распределения на множестве X. Простые гипотезы имеют узкую область применения, ограниченную критериями согласия (см. ниже). Для простых гипотез известен общий вид равномерно более мощного критерия (Теорема Неймана-Пирсона).
  • Сложная гипотеза утверждает принадлежность распределения к некоторому множеству распределений на X. Для сложных гипотез вывести равномерно более мощный критерий удаётся лишь в некоторых специальных случаях.

Типы статистических критериев

В зависимости от проверяемой нулевой гипотезы статистические критерии делятся на группы, перечисленные ниже по разделам.

Наряду с нулевой гипотезой, которая принимается или отвергается по результату анализа выборки, статистические критерии могут опираться на дополнительные предположения, которые априори предпологаются выполненными.

  • Параметрические критерии предполагают, что выборка порождена распределением из заданного параметрического семейства. В частности, существует много критериев, предназначенных для анализа выборок из нормального распределения. Преимущество этих критериев в том, что они более мощные. Если выборка действительно удовлетворяет дополнительным предположениям, то параметрические критерии дают более точные результаты. Однако если выборка им не удовлетворяет, то вероятность ошибок (как I, так и II рода) может резко возрасти. Прежде чем применять такие критерии, необходимо убедиться, что выборка удовлетворяет дополнительным предположениям. Гипотезы о виде распределения проверяются с помощью критериев согласия.
  • Непараметрические критерии не опираются на дополнительные предположения о распределении. В частности, к этому типу критериев относится большинство ранговых критериев.

Критерии согласия

Критерии согласия проверяют, согласуется ли заданная выборка с заданным фиксированным распределением, с заданным параметрическим семейством распределений, или с другой выборкой.

  • Критерий Колмогорова-Смирнова
  • Критерий хи-квадрат (Пирсона)
  • Критерий омега-квадрат (фон Мизеса)

Критерии сдвига

Специальный случай двухвыборочных критериев согласия.
Проверяется гипотеза сдвига, согласно которой распределения двух выборок имеют одинаковую форму и отличаются только сдвигом на константу.

  • Критерий Стьюдента
  • Критерий Уилкоксона-Манна-Уитни

Критерии нормальности

Критерии нормальности — это выделенный частный случай критериев согласия.
Нормально распределённые величины часто встречаются в прикладных задачах, что обусловлено действием закона больших чисел.
Если про выборки заранее известно, что они подчиняются нормальному распределению, то к ним становится возможно применять более мощные параметрические критерии.
Проверка нормальность часто выполняется на первом шаге анализа выборки, чтобы решить, использовать далее параметрические методы или непараметрические.
В справочнике А. И. Кобзаря приведена сравнительная таблица мощности для 21 критерия нормальности.

  • Критерий Шапиро-Уилка
  • Критерий асимметрии и эксцесса

Критерии однородности

Критерии однородности предназначены для проверки нулевой гипотезы о том, что
две выборки (или несколько) взяты из одного распределения,
либо их распределения имеют одинаковые значения математического ожидания, дисперсии, или других параметров.

Критерии симметричности

Критерии симметричности позволяют проверить симметричность распределения.

  • Одновыборочный критерий Уилкоксона и его модификации: критерий Антилла-Кёрстинга-Цуккини, критерий Бхаттачария-Гаствирса-Райта
  • Критерий знаков
  • Коэффициент асимметрии

Критерии тренда, стационарности и случайности

Критерии тренда и случайности предназначены для проверки нулевой гипотезы об
отсутствии зависимости между выборочными данными и номером наблюдения в выборке.
Они часто применяются в анализе временных рядов, в частности, при анализе регрессионных остатков.

Критерии выбросов

Критерии дисперсионного анализа

Критерии корреляционного анализа

Критерии регрессионного анализа

Литература

  1. Вероятность и математическая статистика: Энциклопедия / Под ред. Ю.В.Прохорова. — М.: Большая российская энциклопедия, 2003. — 912 с.
  2. Кобзарь А. И. Прикладная математическая статистика. Справочник для инженеров и научных работников. — М.: Физматлит, 2006. — 816 с.

Ссылки

  • Statistical hypothesis testing — статья в англоязычной Википедии.

Возможно, вам также будет интересно:

  • Вероятность не допустить ошибку второго рода называется
  • Вероятность возникновения ошибок спаривания при транскрипции
  • Вероятность битовой ошибки это
  • Вероятность битовой ошибки формула
  • Вероятность битовой ошибки от отношения сигнал шум

  • Понравилась статья? Поделить с друзьями:
    0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии