Kievuz

Актуальность изучения методов статистической обработки результатов измерений

Статистическая обработка результатов эксперимента

Актуальность изучения методов статистической обработки результатов измерений

В этом разделе приведены часто используемые термины, необходимые для понимания изложенного материала.

Числовые характеристики выборки – обобщенные показатели, позволяющие:

  • дать количественную оценку эмпирическим распределениям;
  • сравнивать выборки между собой.

Статистической гипотезой (гипотезой) называется утверждение относительно истинных значений параметров исследуемой генеральной совокупности.

Нулевая гипотеза (Но) – предположение о том, что между параметрами генеральных совокупностей  разница равна нулю и различия между ними носят не систематический, а случайный характер.

Альтернативная гипотеза (Н1) – гипотеза, противоположная нулевой.

Уровень значимости  —  вероятность отклонения  нулевой гипотезы, когда она верна или другими словами вероятность ошибки.

Критерий — метод проверки статистических гипотез.

Критерий хи-квадрат, критерий лямбда Колмогорова–Смирнова – критерии согласия, часто используемые для проверки гипотезы о нормальности распределения.

t – критерий Стьюдента – критерий, позволяющий оценить, насколько статистически существенно различаются средние арифметические двух выборок.

F – критерий Фишера – метод, позволяющий проверить гипотезу, что две независимые выборки получены из генеральных совокупностей X и Y  с одинаковыми дисперсиями sx2 и sY2 .

Критерий Манна-Уитни — непарамтерический критерий проверки статистических гипотез.  Применяется для независимых выборок.

О методах математической статистики и ее практическом применении можно прочесть в книге «Компьютерная обработка данных экспериментальных исследований»

Критерий Вилкоксона – непараметрический критерий проверки статистических гипотез. Применяется для связанных выборок.

Корреляционный анализ – метод статистической обработки результатов, сущность которого состоит в определении степени взаимосвязи между двумя случайными величинами X  и Y.

Лекция 2.  Числовые  характеристики выборки

В своей статье, опубликованной в 1989 году В.М. Зациорский указал, какие числовые характеристики должны быть представлены в публикации, чтобы она имела научную ценность.

Он писал, что исследователь  “…должен назвать: 1) среднюю величину (или другой так называемый показатель положения); 2) среднее квадратическое отклонение (или другой показатель рассеяния) и 3) число испытуемых.

Без них его публикация научной ценности иметь не будет “с. 52.

После проведения эксперимента исследователь получает определенные результаты. Чтобы его результаты можно было сравнить с данными других исследователей, необходимо рассчитать числовые характеристики выборки. Наибольшее практическое значение имеют  характеристики  положения, рассеивания и асимметрии (табл.1).

Таблица 1 — Название и обозначение числовых характеристик выборки

Характеристики
Положения Вариативности Формы распределения
Среднее арифметическое (М) Размах вариации (R) Коэффициент асимметрии (As)
Мода (Мо) Дисперсия (S2) Коэффициент эксцесса (Ex)
Медиана (Ме) Стандартное отклонение (S)

Характеристики  положения

Среднее арифметическое  (М) – одна из основных характеристик выборки.  Этот показатель характеризуется тем, что сумма отклонений от него выборочных значений (с учетом знака) равна нулю.

где: n  – объем выборки, xi   – варианты выборки.

Среднее арифметическое, вычисленное  на основе выборочных данных, как правило, не совпадает с генеральным средним.  Чтобы оценить, насколько выборочное среднее арифметическое отличается от генерального среднего, вычисляется ошибка среднего арифметического или ошибка репрезентативности (m).

где: S — стандартное отклонение (см. далее).

В научных публикациях очень часто окончательный результат приводится в следующем виде:  М±m.  В качестве примера приведем фрагмент таблицы из публикации Г.Г.Лапшиной (табл. 2).

Таблица 2 — Антропометрический  и функциональный статусы студенток, n= 83 (по: Г.Г.Лапшиной, 1989)

Показатели М±m s
Длина тела, см 163,7±0,9 5,8
Масса тела, кг 60,8±1,2 7,5

Медианой (Me) – называется такое значение признака, когда одна половина значений экспериментальных данных меньше ее, а вторая половина — больше.

Мода (Мо) – представляет собой значение признака, встречающееся в выборке наиболее часто.

Характеристики вариативности

Средние значения не дают полной информации о варьирующем признаке, поэтому наряду со средними значениями вычисляют характеристики вариации.-

Размах вариации (R) вычисляется как разность между максимальным и минимальным значением признака: R= Xmax-Xmin.

Информативность этого показателя невелика, так как распределения результатов могут иметь одинаковый размах варьирования, а их форма будет очень отличаться.

Дисперсия (S2) – средний квадрат отклонений значений признака от среднего арифметического  (4):

Наиболее часто в публикациях приводится не дисперсия, а стандартное отклонение (S). Этот показатель также называется среднеквадратическим отклонением или СКО (5):

Во многих публикациях этот показатель обозначается s, однако мы рекомендуем применять обозначения, используемые в книге В.С. Иванова (1990): S – выборочное стандартное отклонение, сигма – стандартное отклонение генеральной совокупности. В качестве примера приведем фрагмент таблицы из статьи Л.Н. Жданова (1996).

Таблица 3 — Зависимость возраста достижения лучшего результата и количество необходимого для этого времени от возраста начала спортивной специализации у конькобежцев, дистанция 500 м, 225 спортсменов (по: Л.Н.Жданову, 1996).

Возраст начала спортивной специализации, лет Спортивная квалификация Мальчики, юноши
Возраст лучшего результата Количество лет с начала специализации
М S
10 МC 20,0 0,5 10,0
КМС 17,6 0,5 7,6
I,II 15,0 0,3 5,0

Коэффициент  вариации (V%). Чтобы сопоставить вариативность  признаков, измеренных в различных единицах, используется относительный показатель (6), которы йназывается коэффициентов вариации.

Коэффициент вариации используют для оценки однородности выборки. Если V < 10% – выборка однородна, то есть, получена из одной генеральной совокупности. Очень часто в публикациях приводят  четыре  показателя: объем выборки, среднее арифметическое, стандартное отклонение и коэффициент вариации (К.А.Ежевская, 1995).

Характеристики  асимметрии

Коэффициент асимметрии (As) характеризует “скошен­ность“ эмпирического распределения.

Коэффициент эксцесса (Ex) определяет характер эмпирического распределения: остро- или плосковершинный.

Лекция 3. Закон нормального распределения

Корректное  использование критериев проверки статистических  гипотез предполагает знание  закона распределения. Так, например, использование t – критерия  Стьюдента и  F-критерия Фишера требует нормального распределения экспериментальных данных. К сожалению, многие исследователи это не учитывают.

Большинство экспериментальных распределений, полученных при исследованиях в области физической культуры и спорта может быть описано с помощью нормального  распределения. График плотности вероятности  нормального распределения имеет следующий вид (рис. 1).

Рис. 1

На рис. 1 представлено распределение роста женщин с параметрами:  мю (генеральное среднее) – 170 см, s = 5 см.

Нормальное распределение обладает следующими свойствами:

1. Нормальная кривая имеет колокообразную форму, симметричную относительно  x =  мю.

2. Точки перегиба отстоят от мю  на  ± сигма .

3. Нормальное распределение полностью определяется двумя параметрами: мю и сигма.

4. Медиана и мода  совпадают и равны  мю.

5. В интервал  мю ± сигма     попадают  68 %  всех результатов.

    В интервал  мю ± 2 сигмы  попадают  95%   всех  результатов.

    В интервал  мю ± 3 сигмы  попадают  99 %  всех результатов.

Чтобы проверить, соответствует ли распределение нормальному закону, существует много методов. Можно использовать свойства нормального распределения  (равенство среднего, моды и медианы). Однако более точные результаты дают критерии согласия. В зависимости от объема выборки (n) следует использовать различные критерии:

если объем выборки небольшой (n = 10) – критерий Шапиро – Уилки;

если  объем выборки более 40 — критерий хи-квадрат и критерий Колмогорова-Смирнова;

Лекция 4. Проверка статистических гипотез

          Рассчитав числовые характеристики выборки, экспериментатор получает возможность сравнивать свои результаты с данными других исследователей или сравнить результаты, показанные контрольной и экспериментальной группой.

Иногда задача работы состоит в том, чтобы сравнить результат, показанный группой спортсменов до и после эксперимента.  В этом случае, чтобы дать ответ, существуют ли достоверные различия в результатах, нужно проверить статистические гипотезы, использовав для этого специальные методы —  критерии значимости.

Таким образом, критерий значимости — это метод проверки статистической гипотезы.

          При использовании критериев значимости выдвигается нулевая гипотеза(Ho) — предположение о том, что  в параметрах генеральных совокупностей из которых получены данные, представленные в выборках, разница равна нулю и различия между ними носят не систематический, а случайный характер. Противоположная гипотеза называется альтернативной (Н1).

Для проверки статистических гипотез применяются параметрические и непараметрические критерии. Параметрические критерии включают в формулу расчета параметры распределения, в нашем случае нормального.

поэтому первым условием использования параметрических критериев является нормальное распределение результатов исследования. Вторым условием применения параметрических критериев является статистическая шкала, в которой представлены данные.

Такими шкалами являются интервальная шкала и шкала отношений (данные, представлены в этих шкалах измеряются в кг, м, с и т.д).

  Непараметрические критерии (или ранговые критерии) построены по другому принципу и не требуют нормального распределения экспериментальных результатов. Кроме того, эти критерии можно применять к данным, представленным в порядковой шкале (баллы).

Параметрические критерии

К параметрическим критериям относят: критерий Стьюдента для независимых выборок и критерий Стьюдента для связанных выборок.

t–критерий Стьюдента для независимых выборок

Условия применения: обе выборки независимы и получены из генеральных совокупностей X и Y, имеющих нормальное распределение с параметрами μx , μy , σx  σy .

Гипотеза: Ho: μx= μy  (предполагается равенство средних арифметических генеральных совокупностей).

 Альтернатива: H1: μx ≠ μy или H1  μx >μy  или H1: μx 0 или H1: md < 0.

Значение t – критерия Стьюдента   определяется по формуле (10):

где: `d – среднее арифметическое разностей, Sd`    стандартное отклонение.

Непараметрические критерии

Применение параметрических критериев (t – критерия Стьюдента) связано с целым рядом допущений.

Например, сравнивая выборочные средние значения с помощью t – критерия Стьюдента, принимались следующие предположения: обе выборки являются случайными, то есть каждая из них получена в результате независимых измерений, обе выборки получены из генеральных совокупностей, имеющих нормальное распределение, дисперсии генеральных совокупностей равны между собой. На практике эти предположения строго никогда не выполняются, поэтому применение параметрических критериев всегда связано с опасностью ошибочных выводов, возникающих из-за нарушения принятых допущений. В последнее время в математической статистике интенсивно разрабатываются непараметрические методы, которые строятся так, чтобы их применение зависело от возможно меньшего числа допущений.

Параметрические критерии применимы только для сравнения выборочных данных, представляющих собой результаты измерений, выраженных в единицах метрических шкал (метры, килограммы, секунды и т.д.).

Но в спортивных исследованиях часто приходится иметь дело с данными, выраженными в шкалах порядка, например, произвольная нумерация игроков в команде, места, занятые спортсменами в соревнованиях и т.д.

Такие данные нельзя сравнивать с помощью параметрических критериев, а непараметрические критерии могут быть успешно применены  и к данным этого типа.

Сравнение  двух независимых выборок (критерий Манна-Уитни для независимых выборок)

 Условие применения. Применение критерия Вилкоксона основано на единственном предположении: выборки получены из однотипных непрерывных распределений. При этом вид распределения генеральных совокупностей никак не оговаривается.

Гипотеза: Ho: Mex = Mey (предполагается равенство медиан двух генеральных совокупностей).

Альтернатива: H1: Mex ¹ Mey  или H1: Mex  > Mey или H1: Mex  < Mey (в зависимости от того, что требуется доказать: простое различие медиан или то, что результаты в экспериментальной группе больше чем в контрольной).

Сравнение двух связанных выборок (критерий Вилкоксона для связанных выборок)

Гипотеза: Ho: Med = 0

Альтернатива: H1: Med ¹ 0  или H1: Med  > 0  или H1: Med  0,05). Если вычисленное по выборке значение критерия превышает критические значения при   a=0,05; a=0,01 или a=0,001, то различия считаются статистически значимыми. Это  записывается следующим образом: p

Источник: https://allasamsonova.ru/ngu-im-p-f-lesgafta/studenty/kodjei/lekcii-kodei/

Лекция № 15. Статистическая обработка результатов количественного анализа

Актуальность изучения методов статистической обработки результатов измерений

При проведении количественного анализа обычно измеряют или определяют расчетным путем на основании проведенных измерений различные физические величины: массу вещества, концентрацию раствора, объем жидкости, интенсивность окраски вещества, оптическую плотность среды, окислительно-восстановительные потенциалы, показатели преломления света и другие аналитические сигналы.

Однако даже если строго соблюдены все требования, предусмотренные методикой, результаты отдельных независимых анализов одного и того же объекта все равно, как правило, несколько различаются.

Эти различия целесообразно оценить количественно, чтобы понять, насколько достоверны найденные результаты.

Подобная оценка обычно подразумевает получение метрологических характеристик на основе положений теории вероятности (теории ошибок).

Метрология (от греч. metron ‑ мера и logos ‑ слово, учение) — наука об измерениях и методах достижения их единства и требуемой точности. Один из основных разделов метрологии посвящен методам определения погрешности измерений и созданию эталонов.

Классификация погрешностей

Погрешностью измерения называют отклонение результата измерения от истинного значения измеряемой величины.

Погрешности могут быть классифицированы по нескольким признакам. При классификации по способу выражения различают абсолютные и относительные погрешности, по характеру проявления —систематические, случайные и грубые, по способу обработки результатов параллельных определений —средние арифметические и средние квадратичные и так далее.

Абсолютную погрешность анализа Δxi определяют из соотношения:

Δxi = хi ‑ x,

где xi— результат анализа; — истинное содержание анализируемого компонента в пробе.

Отношение абсолютной погрешности измерения к истинному значению измеряемой величины называют относительной погрешностью измерения.

Обычно относительную погрешность выражают в процентах, хотя могут быть использованы и доли единицы.

Истинное содержание анализируемого компонента в пробе остается неизвестным вследствие погрешности анализа. В практических расчетах вместо истинного используют так называемое действительное содержание, равное среднему арифметическому нескольких параллельных определений.

Погрешность измерения зависит от многих факторов: от класса точности применяемых приборов, методики измерения, индивидуальных особенностей наблюдателя и так далее.

Погрешность измерения, которая при повторных измерениях остается постоянной или закономерно изменяется, называют систематической погрешностью.

Знак данной систематической погрешности от опыта к опыту не меняется. Систематическая погрешность или только занижает, или только завышает результат.

Погрешность, которая при повторных измерениях изменяется случайным образом, называют случайной погрешностью измерения.

Знак случайной величины в серии измерений не остается постоянным и от опыта к опыту меняется.

Грубые погрешности, существенно превышающие ожидаемые при данных условиях, называют промахами.

Они обычно бывают следствием грубых оперативных погрешностей аналитика (потеря раствора с осадком при фильтровании, потеря осадка при прокаливании или взвешивании и так далее).

Систематические погрешности обусловлены либо постоянно действующими причинами (и поэтому повторяются при многократном проведении анализа), либо изменяются по постоянно действующему закону.

Источники систематических ошибок

Невозможно с исчерпывающей полнотой перечислить все источники систематических ошибок. Основные источники систематических погрешностей следующие.

Методические —обусловлены особенностями методики анализа. Например, аналитическая реакция прошла не до конца; имеются потери осадка вследствие его частичной растворимости в растворе или при его промывании; наблюдается соосаждение примесей с осадком, вследствие чего масса осадка возрастает, и так далее.

Инструментальные —обусловлены несовершенством используемых приборов и оборудования. Так, например, систематическая погрешность взвешивания на лабораторных аналитических весах составляет ±0,0002 г. Систематическая погрешность в титриметрических методах анализа вносится вследствие неточности калибровки бюреток, пипеток, мерных колб, мерных цилиндров, мензурок и так далее.

Индивидуальные —обусловлены субъективными качествами аналитика. Так, например, дальтонизм может влиять на определение конечной точки титрования при визуальной фиксации изменения окраски индикатора.

Правильность результатов анализа определяется наличием или отсутствием систематических погрешностей.

Существуют следующие способы выявления систематических погрешностей. 

Использование стандартных образцов 

Общий состав стандартного образца должен быть близким к составу анализируемой пробы, а содержание определяемого компонента в стандартном образце должно быть точно известно.

Анализ стандартного образца — наиболее надежный способ выявления наличия или отсутствия систематической погрешности и оценки правильности результата анализа.

Анализ исследуемого объекта другими методами

Исследуемый объект анализируют методом или методами, которые не дают систематической погрешности (метрологически аттестованы), и сравнивают результаты анализа с данными, полученными при анализе того же объекта с использованием оцениваемой методики. Сравнение позволяет охарактеризовать правильность оцениваемой методики (или метода) анализа.

Метод добавок или метод удвоения — используют при отсутствии стандартных образцов и метрологически аттестованной методики (или метода) анализа.

Анализируют образец, используя оцениваемую методику. Затем удваивают массу анализируемой пробы или увеличивают (уменьшают) массу в иное число раз, снова находят содержание определяемого компонента в уже новой пробе и сравнивают результаты анализов.

Случайные погрешности

Случайные ошибки показывают отличие результатов параллельных определений друг от друга и характеризуют воспроизводимость анализа. Причины случайных погрешностей однозначно указать невозможно. При многократном повторении анализа они или не воспроизводятся, или имеют разные численные значения и даже разные знаки.

Некоторые понятия математической статистики и их использование в количественном анализе

Случайная величина (применительно к количественному анализу) — измеряемый аналитический сигнал (масса, объем, оптическая плотность и др.) или результат анализа.

Варианта —отдельное значение случайной величины, то есть отдельное значение измерения аналитического сигнала или определяемого содержания.

Генеральная совокупность —идеализированная совокупность результатов бесконечно большого числа измерений (вариант) случайных величин.

Относительная вероятность результатов в генеральной совокупности при выполнении химико-аналитических определений в большинстве случаев описывается функцией Гаусса (распределением Гаусса).

Однако на практике невозможно (да и не нужно) проводить бесконечно большое число аналитических определений, поэтому используют не генеральную совокупность, а выборочную совокупность — выборку.

Выборка (выборочная совокупность) —совокупность ограниченного числа статистически эквивалентных вариант, рассматриваемая как случайная выборка из генеральной совокупности.

Другими словами, выборочная совокупность — это совокупность результатов измерений аналитических сигналов или определяемых содержаний, рассматриваемая как случайная выборка из генеральной совокупности, полученной в указанных условиях.

Объем выборки —число вариант п, составляющих выборку. При статистической обработке результатов количественного анализа используют выборку, описываемую распределением

Стьюдента.

Распределением Стьюдента предпочтительно пользоваться при объеме выборки п < 20.

Правильностью измерений называют качество измерений, отражающее близость к нулю систематических погрешностей.

Сходимостью измерений называют качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях.

Более широкий смысл вкладывается в понятие «воспроизводимость».

Воспроизводимостью измерений называют качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в различных условиях (в разное время, разными методами и так далее).

Точностью измерений называют качество измерений, отражающее близость их результатов к истинному значению измеряемой величины.

Высокая точность измерений соответствует малым погрешностям всех видов как систематическим, так и случайным. Количественно точность может быть выражена обратной величиной модуля относительной погрешности. Если, например, относительная погрешность измерения характеризуется значением 0,01 %, то точность будет равна 1/10-4 = 104.

Результат анализа, приближающийся к истинному содержанию компонента настолько, что может быть использован вместо него, следует называть действительным содержанием.

Статистическая обработка и представление результатов количественного анализа

Расчет метрологических параметров

На практике в количественном анализе обычно проводят не бесконечно большое число определений, а п = 56 независимых определений, то есть имеют выборку (выборочную совокупность) объемом 5 — 6 вариант. В оптимальном случае рекомендуется проводить 5 параллельных определений (объем выборки п 5).

При наличии выборки рассчитывают следующие метрологические параметры в соответствии с распределением Стьюдента.

Среднее, то есть среднее значение определяемой величины:

Среднее из конечной выборки отличается от действительного значения а (которое обычно не известно).

Доверительный интервал (доверительный интервал среднего) — интервал, в котором с заданной доверительной вероятностью Р находится действительное значение определяемой величины (генеральное среднее):

Доверительная вероятность Р —вероятность нахождения действительного значения определяемой величины а в пределах доверительного интервала. Изменяется от 0 до 1 или (что то же самое) от 0 % до 100 %.

В фармацевтическом анализе при контроле качества лекарственных препаратов доверительную вероятностьчаще всего принимают равной Р == 0,95 = 95 % и обозначают как Р0,95.

 При оценке правильности методик или методов анализа доверительную вероятность обычно считают равной Р = 0,99 = 99 %.

Численные значения рассчитаны для различных возможных величин Р и и табулированы в справочниках.

В табл. 1.1 приведены численные значения коэффициента Стьюдента, рассчитанные при разных величинах п и Р.

Чем больше п,тем меньше tP,sОднако при п > 5 уменьшение tP,sужесравнительно невелико, поэтому на практике обычно считают достаточным проведение пяти параллельных определений (п = 5).

Исключение грубых промахов

Некоторые из результатов единичных определений (вариант), входящих в выборочную совокупность, могут заметно отличаться от величин остальных вариант и вызывать сомнения в их достоверности.

Для того чтобы статистическая обработка результатов количественного анализа была достоверной, выборка должна быть однородной, то есть она не должна быть отягощена сомнительными вариантами — так называемыми грубыми промахами.

 Эти грубые промахи необходимо исключить из общего объема выборки, после чего можно проводить окончательное вычисление статистических характеристик.

Если объем выборки невелик 5

Источник: http://talantchild.ru/2018/11/30/%D0%BB%D0%B5%D0%BA%D1%86%D0%B8%D1%8F-%E2%84%96-%D1%80%D0%B0%D1%81%D1%87%D0%B5%D1%82%D1%8B-%D0%B2-%D0%BA%D0%BE%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D1%82%D0%B2%D0%B5%D0%BD%D0%BD%D0%BE%D0%BC-%D0%B0%D0%BD/

ovdmitjb

Add comment