Исключение грубых ошибок испытаний критерий ирвина

При
однократных измерениях обнаружить
промах не представляется возможным.
Для уменьшения вероятности появления
промахов измерения проводят два-три
раза и за результат принимают среднее
арифметическое полученных отсчетов.
При многократных измерениях для
обнаружения промахов используют
статистические критерии, предварительно
определив, какому виду распределения
соответствует результат измерений.

Вопрос
о том, содержит ли результат наблюдений
грубую погрешность, решается общими
методами проверки статистических
гипотез. Проверяемая гипотеза состоит
в утверждении, что результат наблюдения
х, не содержит грубой погрешности, т.е.
является одним из значений измеряемой
величины. Пользуясь определенными
статистическими критериями, пытаются
опровергнуть выдвинутую гипотезу. Если
это удается, то результат наблюдений
рассматривают как содержащий грубую
погрешность и его исключают.

Для
выявления грубых погрешностей задаются
вероятностью q (уровнем
значимости) того, что сомнительный
результат действительно мог иметь место
в данной совокупности результатов
измерений.

Критерий
«трех сигм» 
применяется
для результатов измерений, распределенных
по нормальному закону. По этому критерию
считается, что результат, возникающий
с вероятностью q <
0,003, маловероятен и его можно считать
промахом, если |х̅-хi|
> 3Sx ,
где Sx —
оценка СКО измерений. Величины х
и Sx вычисляют
без учета экстремальных значений xi.
Данный критерий надежен при числе
измерений n 20…
50.

Это
правило обычно считается слишком
жестким, поэтому рекомендуется [4]
назначать границу цензурирования в
зависимости от объема выборки: при

6
< n <
100 она равна 4Sx;
при 100 < n <
1000 — 4,5Sx;
при 1000 < n <
10000 — 5Sx.
Данное правило также применимо только
для нормального закона.

В
общем случае границы цензурирования trpSx выборки
зависят не только от объема n,
но и от вида распределения. Назначая ту
или иную границу, необходимо оценить
уровень значимости q,
т.е. вероятность исключения какой-либо
части отсчетов, принадлежащих
обрабатываемой выборке. В [4] приводится
выражение для приближенного расчета
коэффициента trpпри
уровне значимости q < l/(n +
1):

где e —
эксцесс распределения. Данные выражения
применимы для:

• кругловершинных
двухмодальных распределений с e =
1,5,…, 3, являющихся композицией дискретного
двузначного и нормального распределений;

• островершинных
двухмодальных распределений с e =
1,5,…, 6, являющихся композицией дискретного
двузначного распределения и распределения
Лапласа;

• композиций
равномерного и экспоненциальных
распределений с показателем степени a =
1/2 при e = 1,8,…,6;

• экспоненциальных
распределений с e = 1,5,…,6.

Критерий
Романовского 
применяется,
если число измерений n <
20. При этом вычисляется отношение
|(х̅ — xi)/SX|
= b и сравнивается с критерием bт,
выбранным по табл. 7.1. Если b ³ bт,
то результат хi считается
промахом и отбрасывается. 

Пример
7.1
.
При диагностировании топливной системы
автомобиля результаты пяти измерений
расхода топлива составили: 22, 24, 26, 28, 30
л на 100 км. Последний результат вызывает
сомнение. Проверить по критерию
Романовского, не является ли он промахом.

Найдем
среднее арифметическое значение расхода
топлива и его СКО без учета последнего
результата, т.е. для четырех измерений.
Они соответственно равны 25 и 2,6 л на 100
км.

Поскольку n <
20, то по критерию Романовского при уровне
значимости 0,01 и n =
4 табличный коэффициент bт  =
1,73. Вычисленное для последнего, пятого
измерения b = |(25 – 30)|/2,6
= 1,92 > 1,73 .

Критерий
Романовского свидетельствует о
необходимости отбрасывания последнего
результата измерения.

Значения критерия Романовского

q

n
=4

n
= 6

 n = 8

 n = 10

 n = 12

 n = 15

 n
= 20

0,01

1,73

2,16

2,43

2,62

22,75

2,90

3,08

0,02

1,72

2,13

2,37

2,54

2,66

2,80

2,96

0,05

1,71

2,10

2,27

2,41

2,52

2,64

2,78

0,10

1,69

2,00

2,17

2,29

2,39

2,49

2,62

Метод
Ирвина

Критерий
вариационного размаха

Является
одним из простых методов исключения
грубой погрешности измерений (промаха).
Для его использования определяют размах
вариационного ряда упорядоченной
совокупности наблюдений(x1 ≤ x2 ≤ … ≤
xk ≤ … ≤ xn ) : Rn = xn − x1 .
(3.6)

Если
какой-либо член вариационного ряда,
например xk , резко отличается от всех
других, то производят проверку, используя
следующее

неравенство:
X − z ⋅
Rn < xk < X + z ⋅
Rn (3.7) где X – выборочное
среднее арифметическое значение,
вычисленное

после
исключения предполагаемого промаха;
z – критериальное значение.

Нулевую
гипотезу (об отсутствии грубой погрешности)
принимаютесли указанное неравенство
выполняется. Если xk не удовлетворяет
условию

(3.7),
то этот результат исключают из
вариационного ряда. Коэффициент z
зависит от числа членов вариационного
ряда n, что представлено в таблице 3.3.

Таблица
3.3 – Критерий вариационного размаха

n
5 6 7 8-9 10-11 12-15 16-22 23-25
26-63 64-150

z
1,7 1,6 1,5 1,4 1,3 1,2 1,1 1,0
0,9 0,8

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #



В статье рассмотрены различные критерии отбрасывания грубых погрешностей измерений, применяемые в практической деятельности, на основе рекомендаций ведущих специалистов-метрологов, а также с учетом действующих в настоящий момент нормативных документов.


Приведен пример использования Excel при оценке грубых погрешностей по критериям Стьюдента и Романовского при обработке реальных результатов измерений.



Ключевые слова:



грубые погрешности, критерии согласия, сомнительные значения, уровень значимости, нормальное распределение, критерий согласия Стьюдента, критерий Романовского, выборка, отклонения, Excel.

Одним из важнейших условий правильного применения статистических оценок является отсутствие грубых ошибок при наблюдениях. Поэтому все грубые ошибки должны быть выявлены и исключены из рассмотрения в самом начале обработки наблюдений.

Единственным достаточно надежным способом выявления грубых ошибок является тщательный анализ условий самих испытаний. При этом наблюдения, проводившиеся в нарушенных условиях, должны отбрасываться, независимо от их результата. Например, если при проведении эксперимента, связанного с электричеством, в лаборатории на некоторое время был выключен ток, то весь эксперимент обязательно нужно проводить заново, хотя результат, быть может, не сильно отличается от предыдущих измерений. Точно так же отбрасываются результаты измерений на фотопластинках с поврежденной эмульсией и вообще на любых образцах с обнаруженным позднее дефектом.

На практике, однако, не всегда удается провести подобный анализ условий испытания. Чаще всего приходится иметь дело с окончательным цифровым материалом, в котором отдельные данные вызывают сомнение лишь своим значительным отклонением от остальных. При этом сама «значительность» отклонения во многом субъективна — зачастую приходится сталкиваться со случаями, когда исследователь отбрасывает наблюдения, которые ему не понравились, как ошибочные исключительно по той причине, что они нарушают уже созданную им в воображении картину изучаемого процесса.

Строгий научный анализ готового ряда наблюдений может быть проведен лишь статистическим путем, причем должен быть достаточно хорошо известен характер распределения наблюдаемой случайной величины. В большинстве случаев исследователи исходят из нормального распределения. Каждая грубая ошибка будет соответствовать нарушению этого распределения, изменению его параметров, иными словами, нарушится однородность испытаний (или, как говорят

,

однородность наблюдений), поэтому выявление грубых ошибок можно трактовать как проверку однородности наблюдений.

Промахи, или грубые погрешности, возникают при единичном измерении и обычно устраняются путем повторных измерений. Причиной их возникновения могут быть:

  1. Объективная реальность (наш реальный мир отличается от идеальной модели мира, которую мы принимаем в данной измерительной задаче);
  2. Внезапные кратковременные изменения условий измерения (могут быть вызваны неисправностью аппаратуры или источников питания);
  3. Ошибка оператора (неправильное снятие показаний, неправильная запись и т. п.).

В третьем случае, если оператор в процессе измерения обнаружит промах, он вправе отбросить этот результат и провести повторные измерения.

В настоящее время определение грубой погрешности приведено в ГОСТ Р 8.736–2011: «Грубая погрешность измерения: Погрешность измерения, существенно превышающая зависящие от объективных условий измерений значения систематической и случайной погрешностей» [1, с. 6].

Общие подходы к методам отсеивания грубых погрешностей, как это уже давно принято в практике измерений, заключаются в следующем.

Задаются вероятностью

Р

или уровнем значимости

α

(

) того, что результат наблюдения содержит промах. Выявление сомнительного результата осуществляют с помощью специальных критериев. Операция отбрасывания удаленных от центра выборки сомнительных значений измеряемой величины называется «цензурированием выборки».

Проверяемая гипотеза состоит в утверждении, что результат наблюдения

x

i


не содержит грубой погрешности, т. е. является одним из значений случайной величины

x

с законом распределения Fx(x), статистические оценки параметров которого предварительно определены. Сомнительным может быть в первую очередь лишь наибольший x

max

или наименьший xmin из результатов наблюдений.

Предложим для практического использования наиболее простые методы отсева грубых погрешностей.

Если в распоряжении экспериментатора имеется выборка небольшого объема

n

≤ 25, то можно воспользоваться методом вычисления максимального относительного отклонения [2, с. 149]:

(1)

где

x


i

— крайний (наибольший или наименьший) элемент выборки, по которой подсчитывались оценки среднего значения

и среднеквадратичного отклонения

;


τ


1-


p

— табличное значение статистики

τ

, вычисленной при доверительной вероятности

.

Таким образом, для выделения аномального значения вычисляют значение статистики,

(2)

которое затем сравнивают с табличным значением

τ

1-α


:

τ





τ

1-α


. Если неравенство

τ



τ


1-α

соблюдается, то наблюдение не отсеивают, если не соблюдается, то наблюдение исключают. После исключения того или иного наблюдения или нескольких наблюдений характеристики эмпирического распределения должны быть пересчитаны по данным сокращенной выборки.

Квантили распределения статистики

τ

при уровнях значимости

α

= 0,10; 0,05; 0,025 и 0,01 или доверительной вероятности


=

0,90; 0,95; 0,975 и 0,99 приведены в таблице 1. На практике очень часто используют уровень значимости

α

= 0,05 (результат получается с 95 %-й доверительной вероятностью).

Функции распределения статистики

τ

определяют методами теории вероятностей. По данным таблицы, приведенной в источниках [2, с. 283; 3, с. 184] при заданной доверительной вероятности

или уровне значимости

α

можно для чисел измерения п = 3–25 найти те наибольшие значения

которые случайная величина

может еще принять по чисто случайным причинам.

Процедуру отсева можно повторить и для следующего по абсолютной величине максимального относительного отклонения, но предварительно необходимо пересчитать оценки среднего значения

и среднеквадратичного отклонения

для выборки нового объема

Таблица 1


Квантили распределения максимального относительного отклонения при отсеве грубых погрешностей [2, с. 283]


n

Уровень значимости

α


n

Уровень значимости

α

0,10

0,05

0,025

0,01

0,10

0,05

0,025

0,01

3

1,41

1,41

1,41

1,41

15

2,33

2,49

2,64

2,80

4

1,65

1,69

1,71

1,72

16

2,35

2,52

2,67

2,84

5

1,79

1,87

1,92

1,96

17

2,38

2,55

2,70

2,87

6

1,89

2,00

2,07

2,13

18

2,40

2,58

2,73

2,90

7

1,97

2,09

2,18

2,27

19

2,43

2,60

2,75

2,93

8

2,04

2,17

2,27

2,37

20

2,45

2,62

2,78

2,96

9

2,10

2,24

2,35

2,46

21

2,47

2,64

2,80

2,98

10

2,15

2,29

2,41

2,54

22

2,49

2,66

2,82

3,01

11

2,19

2,34

2,47

2,61

23

2,50

2,68

2,84

3,03

12

2,23

2,39

2,52

2,66

24

2,52

2,70

2,86

3,05

13

2,26

2,43

2,56

2,71

25

2,54

2,72

2,88

3,07

14

2,30

2,46

2,60

2,76

В литературе можно встретить большое количество методических рекомендаций для проведения отсева грубых погрешностей измерений, подробно рассмотренных в [4, с. 25]. Обратим внимание на некоторые из существующих критериев отсеивания грубых погрешностей.

  1. Критерий «трех сигм» применяется для случая, когда измеряемая величина

    x

    распределена по нормальному закону. По этому критерию считается, что с вероятностью

    Р

    = 0,9973 и значимостью

    α

    = 0,0027 появление даже одной случайной погрешности, большей, чем

    маловероятное событие и ее можно считать промахом, если



    x

    i


    > 3

    S

    x


    , где

    S

    x







    оценка среднеквадратического отклонения (СКО) измерений. Величины

    и

    S

    x


    вычисляют без учета экстремальных значений

    x

    i


    . Данный критерий надежен при числе измерений

    n

    ≥ 20…50 и поэтому он широко применяется. Это правило обычно считается слишком жестким, поэтому рекомендуется назначать границу цензурирования в зависимости от объема выборки: при

6 <

n

≤100 она равна 4

S

x


; при 100 <

n

≤1000 − 4,5

S

x


; при 1000 <

n

≤10000–5

Sx

. Данное правило также используется только при нормальном распределении.

Практические вычисления проводят следующим образом [5, с. 65]:

  1. Выявляют сомнительное значение измеряемой величины. Сомнительным значением может быть лишь наибольшее, либо наименьшее значение наблюдения измеряемой величины.
  2. Вычисляют среднее арифметическое значение выборки

    без учета сомнительного значения

    измеряемой величины.

(3)

  1. Вычисляют оценку СКО выборки

    без учета сомнительного значения

    измеряемой величины.

(4)

  1. Вычисляют разность среднеарифметического и сомнительного значения измеряемой величины и сравнивают.

Если

то сомнительное значение отбрасывают, как промах.

Если

то сомнительное значение оставляют как равноправное в ряду наблюдений.

Данный метод «трех сигм» среди метрологов-практиков является самым популярным, достаточно надежным и удобным, так как при этом иметь под рукой какие-то таблицы нет необходимости.

  1. Критерий В. И. Романовского применяется, если число измерений невелико,

    n

    ≤ 20. При этом вычисляется соотношение

(5)

где

— результат, вызывающий сомнение,

— коэффициент, предельное значение которого

определяют по таблице 2. Если

, сомнительное значение

исключают («отбрасывают») как промах. Если


,

сомнительное значение оставляют как равноправное в ряду наблюдений [5, с. 65].

Таблица 2

Значение критерия Романовского

Уровень значимости,

α

Число измерений,

n


n

= 4


n

= 6


n

= 8


n

= 10


n

= 12


n

= 15


n

= 20

0,01

1,73

2,16

2,43

2,62

2,75

2,90

3,08

0,02

1,72

2,13

2,37

2,54

2,66

2,80

2,96

0,05

1,71

2,10

2,27

2,41

2,52

2,64

2,78

0,10

1,69

2,00

2,17

2,29

2,39

2,49

2,62

Несмотря на многообразие существующих и применяемых на практике методов отсеивания грубых погрешностей в настоящее время действует национальный стандарт ГОСТ Р 8.736–2011, который является основным нормативным документом в данной области. В новом стандарте для исключения грубых погрешностей применяется критерий Граббса.

  1. Статистический критерий Граббса (Смирнова) исключения грубых погрешностей основан на предположении о том, что группа результатов измерений принадлежит нормальному распределению [1, с. 8]. Для этого вычисляют критерии Граббса (Смирнова) G1 и G2, предполагая, что наибольший хmax или наименьший xmin результат измерений вызван грубыми погрешностями.

и

(6)

Сравнивают G1 и G2 с теоретическим значением GT критерия Граббса (Смирнова) при выбранном уровне значимости α. Таблица критических значений критерия Граббса (Смирнова) приведена в приложении к стандарту [1, с. 12]. Следует отметить, что критические значения критерия Граббса (Смирнова) GT отличаются от критических значений критериев

t

-статистик или значений критериев Стьюдента при одних и тех же величинах уровней значимости, что может вызывать некоторые трудности у пользователей при выборе конкретного метода отсеивания погрешностей, соответствующего нормативным документам.

Если G1>GТ, то хmax исключают как маловероятное значение. Если G2>GТ, то xmin исключают как маловероятное значение. Далее вновь вычисляют среднее арифметическое и среднее квадратическое отклонение ряда результатов измерений и процедуру проверки наличия грубых погрешностей повторяют.

Если G1

GТ, то хmax не считают промахом и его сохраняют в ряду результатов измерений. Если G2

GТ, то xmin не считают промахом и его сохраняют в ряду результатов измерений.

Отсев грубых погрешностей можно производить и для больших выборок (

n

= 50…100). Для практических целей лучше всего использовать таблицы распределения Стьюдента. Этот метод исключения аномальных значений для выборок большого объема отличается простотой, а таблицы распределения Стьюдента имеются практически в любой книге по математической статистике, кроме того, распределение Стьюдента реализовано в пакете Excel. Распределение Стьюдента относится к категории распределений, связанных с нормальным распределением. Подробно эти распределения рассмотрены в учебниках по математической статистике [3, с. 24].

Известно, что критическое значение

τ


p

(

p

— процентная точка нормирования выборочного отклонения) выражается через критическое значение распределения Стьюдента

t

α, n-2


[6, с. 26]:

(7)

Учитывая это, можно предложить следующую процедуру отсева грубых погрешностей измерения для больших выборок (

n

= 100):

1) из таблицы наблюдений выбирают наблюдение имеющее наибольшее отклонение;


2)

по формуле

вычисляют значение статистики

τ

;


3)

по таблице (или в программе Excel) находят процентные точки

t

-распределения Стьюдента

t


(



α,


n


-2



)

:

t


(95




%, 98)

= 1,6602, и

t

(



99




%, 98)

= 3,1737;

По предыдущей формуле в программе Excel вычисляют соответствующие точки

t


(95




%, 100)

= 1,66023и

t


(99




%, 100)

=3,17374.

Сравнивают значение расчетной статистики с табличными критическими значениями и принимают решение по отсеву грубых погрешностей.

Рекомендуемый метод отсева грубых погрешностей удобен еще тем, что максимальные относительные отклонения могут быть разделены на три группы: 1)

2)

3)

.

Наблюдения, попавшие в первую группу, нельзя отсеивать ни в коем случае. Наблюдения второй группы можно отсеять, если в пользу этой процедуры имеются еще и другие соображения экспериментатора (например, заключения, сделанные на основе изучения физических, химических и других свойств изучаемого явления). Наблюдения третьей группы, как правило, отсеивают всегда.

Рассмотрим далее пример с использованием средств программного пакета Excel, который позволяет снизить трудоемкость расчетов при осуществлении данной процедуры. К сожалению, в настоящее время средства Excel не позволяют автоматизировать расчеты по всем известным критериям отсеивания грубых погрешностей, поэтому проиллюстрируем рассмотренные методы с использованием доступных в Excel критериев Стьюдента.


Пример 1.

Имеется выборка из 100 шт. резисторов с номинальным сопротивлением

R


н

= (150,0 ± 5 %) кОм, которая используется для оценки качества партии резисторов (генеральная совокупность). Используя критерий Стьюдента, отсеем грубые погрешности (промахи) при измерениях.

  1. Заносим данные измерений в таблицу Excel в ячейки В2:В101
  2. Составляем вариационный ряд — располагаем данные в порядке возрастания с помощью функции «Сортировка по возрастанию» в ячейках С2:С101 (рис. 1)

Фрагмент диалогового окна с данными измерений и вариационного ряда

Рис. 1. Фрагмент диалогового окна с данными измерений и вариационного ряда

3. Находим среднее значение выборки с помощью мастера функций в категории «Статистические» и функции — СРЗНАЧ, результат в ячейке Н3 (рис. 2).

Фрагмент диалогового окна при нахождении среднего значения выборки

Рис. 2. Фрагмент диалогового окна при нахождении среднего значения выборки

  1. Находим среднеквадратическое отклонение —

    S


    x

    . Выделяем ячейку Н4, вызываем «Мастер функций», категория «Статистические», функция — СТАНДОТКЛОН, результат в ячейке Н4–1,20 (рис. 3).

Фрагмент диалогового окна при нахождении среднего квадратического отклонения

Рис. 3. Фрагмент диалогового окна при нахождении среднего квадратического отклонения

  1. Находим максимальное значение в выборке —

    x


    макс

    . Выделяем ячейку Н5, в категории «Статистические», функция — МАКС, выделяем мышкой вариационный ряд C2:С101, результат в ячейке Н5–153,10 (рис. 4).

Фрагмент диалогового окна при нахождении максимального значения

Рис. 4. Фрагмент диалогового окна при нахождении максимального значения

  1. Находим минимальное значение в выборке —

    x


    мин

    . Выделяем ячейку Н6, в категории «Статистические», функция — МИН, выделяем мышкой вариационный ряд C2:С101, результат в ячейке Н6–147,6 (рис. 5).

Фрагмент диалогового окна при нахождении минимального значения

Рис. 5. Фрагмент диалогового окна при нахождении минимального значения

  1. Находим максимальное и минимальное отклонения — Δ

    макс

    и Δ

    мин

    . Вводим в ячейки Н7 и Н8 формулы:

  1. Находим теоретическое значение —

    t


    теор

    . для максимального и минимального отклонений. Вводим в ячейки Н9 и Н12 формулу

. и

  1. Находим табличное значение

    t


    табл.

    Выделяем ячейку Н10, вызываем в категории «Статистические» функцию — СТЬЮДЕНТ.ОБР, «Вероятность» — 0,95, степени свободы (

    n

    -2) — 98, результат в ячейке Н10–1,66 (рис. 6).

Фрагмент диалогового окна при нахождении табличного значения критерия Стьюдента

Рис. 6. Фрагмент диалогового окна при нахождении табличного значения критерия Стьюдента

  1. Сравниваем теоретическое значение

    t


    теор

    = 2,24 критерия Стьюдента для максимального значения — 153,1 кОм с табличным значением:

    t


    табл

    .= 1,6605.
  2. Аналогично п. 9 проверим на наличие грубой погрешности у минимального значения в выборке — 147,6 кОм. Результат в ячейке Н12–2,35 (рис. 7).

Фрагмент диалогового окна при окончательном анализе данных

Рис. 7. Фрагмент диалогового окна при окончательном анализе данных

  1. Делаем вывод о наличии грубых ошибок в данных измерениях. Рассмотренная процедура подтвердила наши сомнения относительно достоверности максимального и минимального значений в данной выборке, т. е., указанные результаты могут быть отброшены из результатов измерений, и проверка может быть повторена снова без этих данных.

Пример расчета теоретического критерия Романовского по аналогичным формулам в Excel и диалоговое окно представлены на рис. 8, при условии α = 0,05, число измерений

n

= 20, β

табл

= 2,78 (из таблицы 2).

Фрагмент диалогового окна при расчете критерия Романовского

Рис. 8. Фрагмент диалогового окна при расчете критерия Романовского


Выводы

  1. Для использования различных критериев отбрасывания грубых погрешностей измерений необходимо учитывать требования действующих нормативных документов.
  2. Рассмотренный пример показал, что расчеты погрешностей по критерию Стьюдента с использованием таблиц и формул Excel значительно упрощаются, а процесс отбрасывания грубых погрешностей можно осуществить наиболее качественно и быстро.

Литература:

1. ГОСТ Р 8.736–2011 Государственная система обеспечения единства измерений. Измерения прямые многократные. Методы обработки результатов измерений. Основные положения. — М.: ФГУП Стандартинформ, 2013. — 24 с.

2. Пустыльник Е. И. Статистические методы анализа и обработки наблюдений. — М.: Наука, 1968. — 288 с.

3. Львовский Е. Н. Статистические методы построения эмпирических формул: Учеб. пособие. — М.: Высш. школа, 1982. — 224 с.

4. Фаюстов А. А. Ещё раз о критериях отсеивания грубых погрешностей. — Законодательная и прикладная метрология, 2016, № 5, с. 25–30.

5. Сергеев А. Г. Метрология: Учебник. — М.: Логос, 2005. — 272 с.

6. Большев Л. Н., Смирнов Н. В. Таблицы математической статистики. — М.: Наука, Главная редакция физико-математической литературы, 1983. — 416 с.

Основные термины (генерируются автоматически): диалоговое окно, сомнительное значение, уровень значимости, измеряемая величина, погрешность, критерий, нормальное распределение, ячейка, вариационный ряд, минимальное значение.

1. Методы исключения результатов с грубыми погрешностями.

Вопросы:
1. Основные понятия и определения
методов
исключения
результатов
с
грубыми погрешностями.
2. Критерии проверки результатов с
грубыми
погрешностями:
Ирвина,
Романовского, вариационного размаха,
Диксона, Райта, Смирнова, Шовене.

2. 1. Основные понятия и определения методов исключения результатов с грубыми погрешностями.

Грубые погрешности (промахи) относятся к числу погрешностей,
изменяющимся случайным образом при повторных наблюдениях. Они
явно превышают по своему значению погрешности, оправданные
условиями проведения эксперимента. Под промахом понимается
значение погрешности, отклонение которого от центра распределения
существенно
превышает значение, оправданное объективными
условиями измерения. Поэтому с точки зрения теории вероятности
появление промаха маловероятно.
Причинами грубых погрешностей могут быть неконтролируемые
изменения условий измерений, неисправность, ошибки оператора и др.
Для исключения грубых погрешностей применяют аппарат
проверки статистических гипотез.
В метрологии используются статистические гипотезы, под
которыми понимают гипотезы о виде неизвестного распределения, или
о параметрах известных распределений.
Примеры статистических гипотез:
1) рассматриваемая выборка (или ее отдельный результат)
принадлежит генеральной совокупности;

3.

2) генеральная совокупность распределена по нормальному закону;
3) дисперсии двух нормальных совокупностей равны между собой.
В двух гипотезах сделано предположение о виде неизвестного
распределения и принадлежности отдельных (подозрительных)
результатов данному виду распределения, а в третьей — о параметрах
двух известных распределений. Наряду с выдвинутой гипотезой
рассматривают и противоречащую ей гипотезу. Нулевой (основной)
называют выдвинутую гипотезу. А конкурирующей (альтернативной)
называют ту, которая противоречит нулевой.
При выдвижении и принятии гипотезы могут иметь место
следующие четыре случая:
1) гипотеза принимается, причем и в действительности она
правильная;
2) гипотеза верна, но ошибочно отвергается. Возникающую при
этом ошибку называют ошибкой первого рода, а вероятность ее
появления называют уровнем значимости и обозначают q(α) ;
3) гипотеза отвергается, причем в действительности она неверна;
4) гипотеза неверна, но ошибочно принимается. Возникающую при
этом ошибку называют ошибкой второго рода, а вероятность ее
появления обозначают β .

4.

Величину 1− β, т. е. вероятность, что гипотеза будет
отвергнута, когда она ошибочна, называют мощностью
критерия.
Следует заметить, что в нормативной документации по
статистическому контролю качества продукции и учебниках по
управлению качеством вероятность признать негодной партию
годных изделий (т. е., совершить ошибку первого рода)
называют “риском производителя”, а вероятность принять
негодную партию – “риском потребителя”.
Все
статистические
критерии
являются
случайными
величинами, принимающими определенные значения (таблицы
критических
значений).
Областью
принятия
гипотезы
(областью допустимых значений) называют совокупность
значения критерия, при которых гипотезу принимают.
Критической называют совокупность значений критерия, при
которых нулевую гипотезу отвергают. Область принятия
гипотезы и критическая область разделены критическими
точками, в качестве которых и выступают табличные значения
критериев.
Область непринятия гипотезы может быть односторонней
(правосторонней или левосторонней) и двух сторонней.
Правосторонней
называют
критическую
область,

5.

Левосторонней называют критическую область, определяемую
•неравенством

 
K
< k , где k – отрицательное число.
набл
кр
кр
Двусторонней называют критическую область, определяемую
неравенствами Kнабл > k1; Kнабл < k2 где k2 > k1. Если критичсекие
точки симметричны относительно нуля, двусторонняя критическая
область определяется неравенствами: Kнабл < — kкр, Kнабл > kкр, или
равносильным неравенством kкр.
Основной
принцип
проверки
статистических
гипотез
формулируется следующим образом: если наблюдаемое (опытное)
значение критерия принадлежит критической области – гипотезу
отвергают, если наблюдаемое значение критерия принадлежит
области принятия гипотезы – гипотезу принимают.
Проверку статистической гипотезы проводят для принятого
уровня значимости q(принимается равным 0,1; 0,05; 0,01 и т. д.).
Так принятый уровень значимости q=0,05 означает, что
выдвинутая нулевая статистическая гипотеза может быть принята
с доверительной вероятностью P = 0,95. Или есть вероятность
отвергнуть эту гипотезу (совершить ошибку первого рода), равная
P =0,95.

6.

•  
Нулевая
статистическая
гипотеза
подтверждает
принадлежность проверяемого “подозрительного” результата
измерения (наблюдения) данной группе измерений.
Формальным критерием аномальности результата наблюдений
(а, следовательно, и основанием для принятия конкурирующей
гипотезы: “подозрительный” результат не принадлежит данной
группе измерений) при этом служит граница, отнесенная от
центра распределения на величину tS , т. е
,

  
где – результат наблюдения, проверяемый на наличие грубой
погрешности;
t – коэффициент, зависящий от вида и закона
распределения, объема выборки, уровня значимости.
Таким образом, границы погрешности зависят от вида
распределения, объема выборки и выбранной доверительной
вероятности.

7.

•  
При обработке уже имеющихся результатов наблюдений
произвольно отбрасывать отдельные результаты не следует, так
как это может привести к фиктивному повышению точности
результата измерений. Группа измерений (выборка) может
содержать несколько грубых погрешностей и их исключение
производят последовательно, по одному.
Все методы исключения грубых погрешностей (промахов)
могут быть разделены на два основных типа:
а) методы исключения при известном генеральном СКО;
б) методы исключения при неизвестном генеральном СКО.
В первом случае и СКО вычисляется по результатам всей
выборки, во втором случае из выборки перед вычислением
удаляются подозрительные результаты.
В случае ограниченного числа наблюдений и (или) сложности
оценки
параметров
закона
распределения
рекомендуется
исключать грубые
погрешности,
используя
приближенные
коэффициенты вида распределения. При этом исключаются
значения xi < xr- и xi > xr+ , где xr- , xr+ – границы промахов,
определяемые выражениями:

8.

•  
;

 
 
где A – коэффициент, значение которого выбирается в
зависимости от заданной доверительной вероятности в
диапазоне от 0,85 до 1,30;
γ – контрэксцесс, значение которого зависит от формы
закона распределения величины (ЗРВ).
После исключения промахов операции по определению
оценок центра распределения и СКО результатов наблюдений и
измерений необходимо повторить.
Поскольку на практике чаще встречаются измерения при
неизвестном СКО (ограниченное число наблюдений), то
рассмотрены следующие критерии проверки подозрительных (с
точки зрения погрешностей) результатов наблюдений: Ирвина,
Романовского, вариационного размаха, Диксона, Смирнова,
Шовене.

9.

Поскольку критериальные требования (коэффициенты),
определяющие границу, за которой находятся “грубые” (в
смысле погрешностей) результаты наблюдений у разных
авторов различны, то проверку следует выполнять
сразу по
нескольким критериям (рекомендуется использовать не меньше
трех, из рассматриваемых ниже). Окончательное заключение о
принадлежности
“подозрительных”
результатов
рассматриваемой совокупности наблюдений следует делать по
большинству критериев.

10. 2. Критерии проверки результатов с грубыми погрешностями: Ирвина, Романовского, вариационного размаха, Диксона, Райта,

Смирнова, Шовене.
Критерий Ирвина.
•  2.1
Для полученных экспериментальных
данных определяют
коэффициент по формуле:

 
где ,– наибольшие значения случайной величины;
S – среднее квадратическое отклонение, вычисленное по
всем значениям выборки.
Затем этот коэффициент сравнивается с табличным
значением , возможные значения которого приведены в таблице
1.

11.

•  Таблица 3.1 – Критерий Ирвина
Число измерений
n

 
1
2
3
10
20
30
50
100
400
1000
.
Уровень значимости
q=0,05
2
2,8
2,2
1,5
1,3
1,2
1,1
1,0
0,9
0,8
q=0,01
3
3,7
2,9
2,0
1,8
1,7
1,6
1,5
1,3
1,2
Если , то нулевая гипотеза не подтверждается, т. е.
результат — ошибочный, и он должен быть исключен при
дальнейшей обработке результатов наблюдений.

12.

Критерий Романовского.
•  2.2
Конкурирующая гипотеза о наличии грубых погрешностей в
подозрительных
результатах
выполняется неравенство:
подтверждается,
если

 
где – квантиль распределения Стьюдента при заданной
доверительной вероятности с числом степеней свободы k = n –
kn
(kn
— число подозрительных результатов наблюдений).
Фрагмент
квантилей
для
распределения
Стьюдента
представлен в таблице 2.
Точечные оценки распределения
и СКО S результатов
наблюдений вычисляется без учета kn
подозрительных
результатов наблюдений.Число степеней свободы k
Доверительная

 
 
 
 
 
 
  (квантили

 
 
  Стьюдента).

 
 
 
 
Таблица
3.2 – Критерий
Стьюдента
вероятность p
0,90
0,95
0,99

 
3
2,3
5
3,1
8
5,8
4

 
4
2,1
3
2,7
8
4,6
0

 
5
2,0
1
2,5
7
4,0
3

 
6
1,9
4
2,4
5
3,7
1

 
8
1,8
6
2,3
1
3,3
6

 
10
1,8
1
2,2
3
3,1
7

 
12
1,7
8
2,1
8
3,0
6

 
18
1,7
3
2,1
0
2,9
8

 
22
1,72
2,07
2,82

 
30
1,7
0
2,0
4
2,7
5

 
40
1,6
8
2,0
2
2,7
0

 
 
60 120
1,67 1,6
6
2,00 1,9
8
2,86 2,6
2

 
1,6
4
1,9
6
2,5
8

13.

2.3 Критерий вариационного размаха.
Является
одним
из
простых
методов
исключения
грубой
погрешности измерений (промаха). Для его использования определяют
размах вариационного ряда упорядоченной совокупности наблюдений
( x1 ≤ x2 ≤ … ≤ xk ≤ …≤ xn ) :
•  
Если какой-либо член вариационного ряда, например xk, резко
отличается от всех других, то производят проверку, используя
следующее неравенство:
,

 
где – выборочное среднее арифметическое значение, вычисленное
после исключения предполагаемого промаха;
z – критериальное значение.
Нулевую гипотезу (об отсутствии грубой погрешности) принимают,
если указанное неравенство выполняется. Если
не удовлетворяет
этому условию, то этот результат исключают из вариационного ряда.

14.

Коэффициент z зависит от числа членов вариационного ряда
n, что представлено в таблице 3.
Таблица 3.3 – Критерий вариационного размаха.
n
5
6
7
8-9
10-11
12-15
z
1,7
1,6
1,5
1,4
1,3
1,2
1622
1,1
23-25
26-63
1,0
0,9
64150
0,8
2.4 Критерий Диксона
Критерий основан на предположении, что погрешности
измерений подчиняются нормальному закону и проверка гипотезы
о принадлежности нормальному закону распределения. При
использовании критерия вычисляют коэффициент Диксона
(наблюдаемое значение критерия) для проверки наибольшего или
наименьшего экстремального значения в зависимости от числа
измерений. В таблице 4 приведены
формулы для вычисления
коэффициентов. Коэффициенты r10, r11 применяют, когда имеется
один выброс, а
r21 и
r22 — когда два выброса. Требуется
первоначальное упорядочение результатов измерений (объема
выборки). Критерий применяется, когда выборка может содержать
более одной грубой погрешности.

15.

Таблица 3.4 – Формулы коэффициентов Диксона.
Число
измерений
n
(обьем
выборки)
1
1
3-7
3-7

 
Коэффицие
нт
Диксона
8-10
8-10
r11
r11
11-13
11-13
rr21
21
14-25
r22
22
2
r210
r10
Для
Для
наименьшего
наибольшего
экстремальног эксперименталь
о
ного
параметра
параметра
3
4
3
4
Вычисленные
для
выборки
по
формулам
значения
коэффициентов Диксона r
сравнивают с принятым (табличным)
значением критерия Диксона rq (таблица 5).
Нулевая
гипотеза
об
отсутствии
грубой
погрешности
выполняется, если выполняется неравенство r < rq .
Если r > rq, то результат признается грубой погрешностью и
исключается из дальнейшей обработки.

16.

Таблица 5 – Критериальные значения коэффициентов
Диксона (при принятом уровне значимости q).
Статист
Число
ика
измерени
й

 
 
1
2
r10
3
4
5
6
7
r11
8
9
10
r21
11
12
13
r22
14
15
16
17
18
19
20
21
22
23
24
25
rq при уровне значимости q
0,1
3
0,886
0,679
0,557
0,482
0,434
0,479
0,441
0,409
0,517
0,490
0,467
0,462
0,472
0,452
0,438
0,424
0,412
0,401
0,391
0,382
0,374
0,367
0,360
0,05
4
0,941
0,765
0,642
0,560
0,507
0,554
0,512
0,477
0,576
0,546
0,521
0,546
0,525
0,507
0,490
0,475
0,462
0,450
0,440
0,430
0,421
0,413
0,406
0,02
5
0,976
0,846
0,729
0,644
0,586
0,631
0,587
0,551
0,538
0,605
0,578
0,602
0,579
0,559
0,542
0,527
0,514
0,502
0,491
0,481
0,472
0,464
0,457
0,01
6
0,988
0,899
0,780
0,698
0,637
0,683
0,636
0,597
0,679
0,642
0,615
0,641
0,616
0,595
0,577
0,561
0,547
0,535
0,524
0,514
0,505
0,497
0,489

17.

2.5 Критерии «3 σ » , Райта.
Критерий “правило трех сигм” является одним из простейших для
проверки
результатов,
подчиняющихся
нормальному
закону
распределения. Сущность правила трех сигм: если случайная величина
распределена нормально, то абсолютная величина ее отклонения от
математического ожидания не превосходит утроенного среднего
квадратического отклонения.
На практике правило трех сигм применяют так: если распределение
изучаемой случайной величины неизвестно, но условие, указанное в
приведенном правиле, выполняется, то есть основания предполагать, что
изучаемая величина распределена нормально; в противном случае она не
распределена нормально. С этой целью для выборки (включая
подозрительный результат) вычисляется центр распределения и оценка
СКО результата наблюдений. Результат, который удовлетворяет условию
, считается имеющим грубую погрешность и удаляется, а ранее
вычисленные характеристики распределения уточняются.
Этому критерию аналогичен критерий Райта, основанный на том, что
если остаточная погрешность больше четырех сигм, то этот результат
измерения является грубой погрешностью и должен быть исключен при
дальнейшей обработке. Оба критерия надежны при числе измерений
больше 20…50. Их правомочно применять, когда известна величина
генерального среднеквадратического отклонения (S) .
•  

18.

Может оказаться, что при новых значениях и S другие
•результаты

 
попадут в категорию аномальных. Однако дважды
использовать критерии грубой погрешности не рекомендуется.

 
2.6 Критерий Смирнова.
Критерий Смирнова используется при объемах выборки n ≥
25 или при известных значениях генеральных среднего и СКО.
Он устанавливает менее жесткие границы грубой погрешности.
Для реализации этого критерия вычисляются действительные
значения квантилей распределения (наблюдаемое значение
критерия) по формуле:

 
Найденное значение сравнивается
приведенным в таблице 6.
с
критериальным
,

19.

•  Таблица 6 – Квантили распределения.
Объем
Выборк
иn

 
1
1
2
3
4
5
6
7
8
9
10
15
20
25
30
40
50
100
250
500

 
Предельное значение при уровне значимости q
0,100
2
1,282
1,632
1,818
1,943
2,036
2,111
2,172
2,224
2,269
2,309
2,457
2,559
2,635
2,696
2,792
2,860
3,076
3,339
3,528
0,050
3
1,645
1,955
2,121
2,234
2,319
2,386
2,442
2,490
2,531
2,568
2,705
2,799
2,870
2,928
3,015
3,082
3,285
3,534
3,703
0,0010
4
2,326
2,575
2,712
2,806
2,877
2,934
2,981
3,022
3,057
3,089
3,207
3,289
3,351
3,402
3,480
3,541
3,723
3,946
4,108
0,005
5
2,576
2,807
2,935
3,023
3,090
3,143
3,188
3,227
3,260
3,290
3,402
3,480
3,539
3,587
3.662
3,716
3,892
4,108
4,263
0,001
6
3,090
3,290
3,403
3,480
3,540
3,588
3,628
3,622
3.692
3,719
3,820
3,890
3,944
3,988
4,054
4,108
4,263
4,465
4,607

20.

2.7 Критерий Шовене.
Критерий Шовене применяется для законов, не противоречащих
нормальному, и строится на определении числа ожидаемых
результатов наблюдений nож, которые имеют столь же большие
погрешности, как и подозрительный. Гипотеза о наличии грубой
погрешности принимается, если выполняется условие:
•  
nож ≤ 0,5 .
Порядок проверки гипотезы следующий:
1) вычисляются среднее арифметическое
и СКО S результатов
наблюдений для всей выборки;
2) из таблицы нормированного нормального распределения
(Справочное пособие – интегральная функция нормированного
нормального распределения) по величине определяется вероятность
появления подозрительного результата в генеральной совокупности
чисел n:

 
;

21.

•  3) число ожидаемых результатов n
ож
, определяется по формуле:
nож= n.
Указанные выше критерии во многих случаях оказываются
“жесткими”. Тогда рекомендуется пользоваться критерием грубой
погрешности » k», зависящим от объема выборки n и принятой
доверительной вероятности Р.
Таблица 7 – Зависимость критерия грубой погрешности k от
объема выборки n и доверительной вероятности Р.
n
9
Р=95,0
0
4,42
Р=99,0
0
7,10
Р=99,7
3
11,49
10
4,31
6,99
10,26
12
4,16
6,38
8,80
15
4,03
5,88
7,66
20
3,90
5,41
6,73
N
2
5
3
0
4
0
5
0

 
Р=95,0
0
3,84
Р=99,0
0
5,14
Р=99,7
3
6,25
3,80
5,00
5,95
3,75
4,82
5,56
3,73
4,70
5,34

22.

Для распределений, отличных от нормального, таких
классов, как двух модальных кругловершинных композиций
нормального и дискретного распределения c эксцессом ε = 1,53,0; островершинных двумодальных; композиций дискретного
двузначного распределения и распределения Лапласа с
эксцессом ε = 1,5-6,0; композиций равномерного распределения
с экспоненциальным распределением эксцесса ε = 1,8-6,0 и
классом
экспоненциальных
распределений
в
пределах
изменения эксцесса ε = 1,8-6,0 граница грубой погрешности
определяется величиной ± ( ) или ± (), где:
•  
где γ – контрэксцесс;

23.

Погрешности в определении оценок
•отрицательно

 
коррелированными, т. е.
S СКО и
являются
возрастание СКО S
сопровождается уменьшением . Поэтому определение границ
грубой погрешности для законов, отличных от нормального, с
эксцессом ε ≤ 6 с помощью критерия
является достаточно
точным и может широко использоваться на практике.
Оценки , S и ε должны вычисляться после исключения
подозрительных результатов из выборки. После расчета границ
грубой погрешности результаты наблюдений, оказавшиеся
внутри
границ,
возвращаются,
а
ранее
найденные
характеристики распределения уточняются.
Для равномерного распределения за границы грубой
погрешности можно принять величину ± .

Возможно, вам также будет интересно:

  • Исключение unknown software exception 0xc0000025 euro truck simulator 2 как исправить ошибку
  • Искатели роковая ошибка наполеона
  • Искатели ошибка князя игоря
  • Иск к кадастровому инженеру об исправлении реестровой ошибки
  • Искажение цитаты какая ошибка

  • Понравилась статья? Поделить с друзьями:
    0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии