Характеристика рассеивания. Характеристики рассеяния результатов измерений. Оценка параметров генеральной совокупности. Точечная и интервальная оценка. Доверительный интервал. Уровень значимости

Рассеивание случайной величины характеризует её разброс относительно точки математического ожидания. Так как разброс элементов спектра случайной величины происходит по обе стороны от центра рассеивания, то для его учета используют либо четные степени центральных моментов, либо абсолютные центральные моменты. Достаточно рассмотреть центральный момент второго порядка m 2 и абсолютный центральный момент первого порядка t 1 . Первый из них называется дисперсией , а второй – средним отклонением . Изучим их подробнее.

Дисперсия случайной величины Х имеет несколько обозначений:

ДСВ ;

D(X ) = = m 2 = E ( 2) = (59)

НСВ ,

Оператор дисперсии D обладает следующими свойствами:

1) D (C ) = 0

2) D (CX ) = C 2 ·D (X ) . (60)

3) D (C +X ) = D (X )

Ситуация с доказательством свойств оператора дисперсии аналогична той, которая была отмечена для оператора математического ожидания. Остановимся на физическом смысле этих свойств.

Первое свойство говорит, что постоянная величина не имеет разброса. Комментарий не требуется.

При изменении масштаба по оси абсцисс (второе свойство ), новое значение дисперсии получается из старого путем умножения последнего на величину квадрата масштабного коэффициента.

Третье свойство дисперсии заключается в том, что при переносе начала координат на величину C по оси абсцисс дисперсия случайной величины не меняется, так как центрирование компенсирует перенос.

Объединение этих свойств выражается реакцию оператора дисперсии на линейное преобразование случайной величины X :

D(C 1 + C 2 ∙ X ) = C 2 2 ∙ D (X ) . (61)

Из определения дисперсии следует, что ее размерность равна квадрату размерности случайной величины, которую она характеризует. Это не всегда удобно для восприятия. Например, если сказать, что некоторое расстояние S = 567,89 м , а его дисперсия D (S ) = 9∙10 -4 м 2 , то сопоставление этих величин, имеющих отличающиеся размерности , не дает представления о точности измерений. Этот факт способствовал использованию дополнительно в качестве характеристики рассеивания другого показателя – стандарта .

Стандарт или среднее квадратическое отклонение (СКО) представляет собой положительное значение квадратного корня из дисперсии и характеризует разброс СВ относительно ее центра рассеивания в тех же единицах, в каких выражена и сама случайная величина:

(62)

Свойства стандарта определяются свойствами дисперсии:

1) s C = 0

2) s CX = C ·s X (63)

3) s C + X = s X

Если теперь мы охарактеризуем ранее приведенное расстояние S=567,89 м стандартом s S =3*10 -2 м , то наше представление о точности этого расстояния будет адекватным.

Среднее отклонение – это абсолютный центральный момент первого порядка для случайной величиныХ , обозначаемый буквой ϑ X и вычисляемый по определению (58) при r = 1 :

ДСВ ;

ϑ X = τ 1 = E (| |)= (64)

НСВ .

Свойства среднего отклонения аналогичны свойствам стандарта (убедитесь в этом в качестве Упражнения 2.1 ):

1) ϑ X = 0

2)ϑ CX = |C |·ϑ X (65)

3) ϑ C + X = ϑ X

2.2.6 Примеры одномерных распределений .

Рассмотрим законы распределений некоторых дискретных и непрерывных случайных величин, играющих важную роль в теории и практике.

Индикатор события.

Индикатор события I A представляет собой частный случай испытаний Бернулли. Это дискретная случайная величина, принимающая только два возможных значения 0 и 1 с вероятностями (1 – p ) и p соответственно. Здесь p = P (A ) – вероятность наступления события A , описанного на некотором пространстве W . Рассмотрим все введенные выше характеристики для этой случайной величины в качестве примера и с целью их использования при изучении более сложных законов.

Дано :X = I A = {x 1 = 0; x 2 = 1} ; P (x 1) = P (Ā ) = 1 – p =q ; P (x 2) = P (A ) = p .

Найти : 1) F (I A ) – ? 2) E (I A ) – ? 3) D (I A ) – ? 4) s I – ?

Решение :

1)Функцию распределения разместим в расширенной таблице ряда распределения, как это предложено в (44):

X = I A -
P(X = I A ) q p -
F(I A ) q

Числовые характеристики определим по формулам (51), (59) и (62):

2)E (I A ) = 0∙q + 1∙p = p ;

3)D (I A ) = =a 2 - = 0 2 ∙q +1 2 ∙p p 2 = p ∙(1 – p ) = pq ;

4) = .

Индикатор событий используется при изучении повторных испытаний и решении других задач как вспомогательная случайная величина.

2.2.6.2 Равномерное распределение .

В качестве иллюстрации, поясняющей материал раздела 2.2 для непрерывных случайных величин, исследуем непрерывное равномерное распределение на некотором отрезке [a ; b ]. Распределение называется равномерным на отрезке, если его плотность вероятности постоянна на этом отрезке и равна нулю за его пределами. Представим изучение данного распределения в виде решения задачи.

Дано : f (x ) = c , [a ; b ] ; f (x ) = 0 вне этого отрезка.

Найти : 1 ) постоянную плотность распределения c – ?, 2 ) F (x ) – ?, 3 )E (X ) – ?, 4 ) Mo(X ) – ?, 5 ) Me(X ) – ?, 6 ) D (X ) – ?, 7 ) s X – ?, 8 ) ϑ X – ?, 9 )P (x 1 <X <x 2) – ?

Решение : Выполнить самостоятельно в качестве Упражнения 2.2 .

Ответы : 1 ) c = 1 / (b a ) ; 2 ) F (x ) = (x a ) / (b a ) ; 3 ) E (X ) = (a + b )/2 ;

4 ) Mo(X ) – не определена; 5 ) Me(X ) = E (X ) ; 6 ) D (X ) = (b a ) 2 / 12 ;

7 ) s x = (b a ) /() ;8 ) ϑ X = (b a ) / 4 ; 9 ) P (x 1 < X < x 2) = (x 2 – x 1)/(b a ) , когда ]x 1 ; x 2 [ [a ;b ] .

Графики плотности и функции равномерного распределения представлены на следующих рисунках (Рис.19 и 20 ).

f (x ) F (x )

c

S =1 c =1/

0 a E (X ) b X 0 a E (X ) b X

Рис. 2.19 Плотность равномерного Рис. 2.20 Функция равномерного

Как ни важны средние характеристики, но не менее важной характеристикой массива числовых данных является поведение остальных членов массива по отношению к среднему показателю, на сколько они отличаются от средних показателей, как много членов массива значительно отличаются от среднего. На тренировках по стрельбе говорят о кучности результатов, в статистике исследуют характеристики рассеяния (разброса).

Отличие какого-либо значения х, от среднего значения х называют отклонением и вычисляют как разность х, - х. При этом отклонение может принимать как положительные значения, если число больше среднего, так и отрицательные значения, если число меньше среднего. Однако в статистике часто важно иметь возможность оперировать одним числом, характеризующим «кучность» всех числовых элементов массива данных. Любое суммирование всех отклонений членов массива приведет к нулю, так как положительные и отрицательные отклонения взаимно уничтожатся. Чтобы избежать обнуления, используют для характеристики рассеяния квадраты разностей, точнее, среднее арифметическое квадратов отклонений. Такую характеристику рассеяния называют выборочная дисперсия.

Чем больше дисперсия, тем больше рассеяние значений случайной величины. Для вычисления дисперсии используют приближенное значение выборочного среднего х с запасом на один разряд по отношению ко всем членам массива данных. В противном случае при суммировании большого количества приближенных значений будет накапливаться существенная ошибка. В связи с размерностью числовых значений следует отметить один недостаток такого показателя рассеяния, как выборочная дисперсия: единица измерения дисперсии D является квадратом единицы измерения значений х, характеристикой которых дисперсия является. Чтобы избавиться от этого недостатка, в статистике введена такая характеристика рассеяния, как выборочное среднее квадратичное отклонение , которое обозначается символом а (читается «сигма») и вычисляется по формуле

В норме более половины членов массива данных отличаются от среднего показателя меньше, чем на величину среднего квадратичного отклонения, т.е. принадлежат отрезку - а; х + а]. Иначе говорят: средний показатель с учетом разброса данных равен х ± а.

Введение еще одной характеристики рассеяния связано с размерностью членов массива данных. Все числовые характеристики в статистике вводятся с целью сравнения результатов исследования разных числовых массивов, характеризующих разные случайные величины. Однако сравнивать средние квадратичные отклонения от разных средних величин разных массивов данных не показательно, особенно если еще и размерность этих величин отличается. Например, если сравнивается длина и вес каких- либо объектов или рассеяния при изготовлении микро- и макроизделий. В связи с вышеизложенными соображениями вводится характеристика относительного рассеяния, которая называется коэффициентом вариации и вычисляется по формуле

Для подсчета числовых характеристик рассеяния значений случайной величины удобно использовать таблицу (табл. 6.9).

Таблица 6.9

Подсчет числовых характеристик рассеяния значений случайной величины

Xj - X

(Xj-X) 2 /

В процессе заполнения этой таблицы находится выборочное среднее х, которое в дальнейшем будет использоваться в двух видах. Как итоговая средняя характеристика (например, в третьем столбце таблицы) выборочное среднее х должно быть округлено до разряда, соответствующего наименьшему разряду какого-либо члена массива числовых данных х г Однако этот показатель используется в таблице при дальнейших вычислениях, и в этой ситуации, а именно при вычислениях в четвертом столбце таблицы, выборочное среднее х должно быть округлено с запасом на один разряд по отношению к наименьшему разряду какого-либо члена массива числовых данных х { .

Итогом вычислений при помощи таблицы типа табл. 6.9 будет получение значения выборочной дисперсии, а для записи ответа надо на основе значения выборочной дисперсии посчитать значение среднего квадратичного отклонения а.

В ответе указывается: а) средний результат с учетом разброса данных в виде х±о ; б) характеристика стабильности данных V. В ответе следует оценить качество коэффициента вариации: плохой или хороший.

Допустимым коэффициентом вариации как показателем однородности или стабильности результатов в спортивных исследованиях считается 10-15%. Коэффициент вариации V = 20% в любых исследованиях считается весьма большим показателем. Если объем выборки п > 25, то V > 32% - очень плохой показатель.

Например, для дискретного вариационного ряда 1; 5; 4; 4; 5; 3; 3; 1; 1; 1; 1; 1; 1; 3; 3; 5; 3; 5; 4; 4; 3; 3; 3; 3; 3 табл. 6.9 будет заполнена следующим образом (табл. 6.10).

Таблица 6.10

Пример подсчета числовых характеристик рассеяния значений

*1

fi

1

Л п 25 = 2,92 = 2,9

D _S_47,6_ п 25

Ответ : а) средняя характеристика с учетом разброса данных равна х ± а = = 3 ± 1,4; б) стабильность полученных измерений находится на низком уровне, так как коэффициент вариации V = 48% > 32%.

Аналог табл. 6.9 может быть использован и для вычисления характеристик рассеяния интервального вариационного ряда. При этом варианты х г будут заменены представителями промежутков x v ja абсолютные частоты вариант f { - на абсолютные частоты промежутков f v

На основании вышеизложенного можно сделать следующие выводы.

Выводы математической статистики правдоподобны, если обрабатывается информация о массовых явлениях.

Обычно исследуется выборка из генеральной совокупности объектов, которая должна быть репрезентативна.

Опытные данные, полученные в результате исследования какого-либо свойства объектов выборки, представляют собой значение случайной величины, поскольку исследователь заранее не может предсказать, какое именно число будет соответствовать определенному объекту.

Для выбора того или иного алгоритма описания и первичной обработки опытных данных важно уметь определять тип случайной величины: дискретная, непрерывная или смешанная.

Дискретные случайные величины описываются дискретным вариационным рядом и его графической формой - полигоном частот.

Смешанные и непрерывные случайные величины описываются интервальным вариационным рядом и его графической формой - гистограммой.

При сравнении нескольких выборок по уровню сформированное™ некоторого свойства используют средние числовые характеристики и числовые характеристики рассеяния случайной величины по отношению к средним.

При вычислении средней характеристики важно правильно выбрать вид средней характеристики, адекватный области ее применения. Структурные средние значения мода и медиана характеризуют структуру расположения вариант в упорядоченном массиве опытных данных. Количественное среднее значение дает возможность судить о среднем размере вариант (выборочная средняя).

Для вычисления числовых характеристик рассеяния - выборочной дисперсии, среднего квадратичного отклонения и коэффициента вариации - эффективен табличный способ.

Главная характеристика рассеивания вариационного ряда называется дисперсией

Главная характеристика рассеивания вариационного ряда называется дисперсией . Выборочная дисперсия D в рассчитывается по следующей формуле:

где x i – i -ая величина из выборки, встречающаяся m i раз; n – объём выборки; – выборочная средняя; k – количество различных значений в выборке. В рассматриваемом примере: x 1 =72, m 1 =50; x 2 =85, m 2 =44; x 3 =69, m 3 =61; n =155; k =3; . Тогда:

Заметим, что чем больше значение дисперсии, тем сильнее отличие значений измеряемой величины друг от друга. Если в выборке все значения измеряемой величины равны между собой, то дисперсия такой выборки равна нулю.

Дисперсия обладает особыми свойствами.

Свойство 1. Значение дисперсии любой выборки неотрицательно, т.е. .

Свойство 2. Если измеряемая величина постоянна X=c, то дисперсия для такой величины равна нулю: D [ c ]= 0.

Свойство 3. Если все значения измеряемой величины x в выборке увеличить в c раз, то дисперсия данной выборки увеличится в c 2 раз: D [ cx ]= c 2 D [ x ], где c = const .

Иногда вместо дисперсии используют выборочное среднее квадратическое отклонение , которое равно арифметическому квадратному корню из выборочной дисперсии: .

Для рассмотренного примера выборочное среднее квадратическое отклонение равно .

Дисперсия позволяет оценить не только степень различия измеряемых показателей внутри одной группы, но может быть использована и для определения отклонения данных между разными группами. Для этого используется несколько видов дисперсии.

Если в качестве выборки берётся какая-либо группа, то дисперсия данной группы называется групповой дисперсией . Чтобы выразить численно различия между дисперсиями нескольких групп, существует понятие межгрупповой дисперсии . Межгрупповой дисперсией называется дисперсия групповых средних относительно общей средней:

где k – число групп в общей выборке, - выборочная средняя для i -ой группы, n i – объём выборки i -ой группы, - выборочная средняя для всех групп.

Рассмотрим пример.

Средняя оценка за контрольную работу по математике в 10 «А» классе составила 3.64, а в 10 «Б» классе 3.52. В 10 «А» учится 22 человека, а в 10 «Б» - 21. Найдём межгрупповую дисперсию.

В данной задаче выборка разбивается на две группы (два класса). Выборочная средняя для всех групп равна:

.

В таком случае межгрупповая дисперсия равна:

Поскольку межгрупповая дисперсия близка к нулю, то мы можем сделать вывод, что оценки одной группы (10 «А» класса) в малой степени отличаются от оценок второй группы (10 «Б» класса). Иными словами, с точки зрения межгрупповой дисперсии рассмотренные группы в незначительной степени отличаются по заданному признаку.

Если общая выборка (например, класс учеников) разбита на несколько групп, то помимо межгрупповой дисперсии можно рассчитать ещё внутригрупповую дисперсию . Такая дисперсия является средней величиной для всех групповых дисперсий.

Внутригрупповая дисперсия D внгр рассчитывается по формуле:

где k – количество групп в общей выборке, D i – дисперсия i -ой группы объёма n i .

Существует взаимосвязь между общей (D в ), внутригрупповой ( D внгр ) и межгрупповой ( D межгр ) дисперсиями:

D в = D внгр + D межгр .

Наряду с наиболее вероятным значением риска важное значение имеет разброс возможных значений риска относительно его центрального значения. Учет разброса показателей необходим и при решении задач социально-гигиенического мониторинга.

Наиболее распространенными характеристиками разброса случайной величины являются дисперсия и среднеквадратичное отклонение.

Дисперсия случайной величины ξ обозначаемая как D (ξ) (используются также обозначения V (ξ) и σ 2 (ξ)), характеризует наиболее вероятное значение квадрата отклонения случайной величины от своего математического ожидания.

Для дискретной случайной величины, принимающей значения х i с вероятностями р i , дисперсия определяется как взвешенная сумма нитратов отклонений х i от математического ожидания ξ с весовыми коэффициентами, равными соответствующим вероятностям:

D(ξ) =

Для непрерывной случайной величины ξ ее дисперсия определяется по формуле:

D(ξ) =

Дисперсия обладает следующими практически важными свойствами:

1.Дисперсия любой случайной величины неотрицательна:

D(ξ) ≥ 0

2. Дисперсия постоянной величины равна 0:

D(C) = 0

где С - константа.

3. Дисперсия случайной величины ξ равна разности между математическим ожиданием квадрата этой случайной величины и квадратом математического ожидания ξ:

D(ξ) = M [ξ – M (ξ)] 2 = M(ξ 2) – ( .

4. Прибавление константы к случайной величине не изменяет дисперсии; умножение случайной величины на константу а приводит к умножению дисперсии на а 2 :

D(aξ + b) = a 2 D(ξ),

где а и b - константы.

5. Дисперсия суммы независимых случайных величин равна сумме их дисперсий:

где ξ и η - независимые случайные величины.

Среднеквадратичным отклонением случайной величины ξ (используются также термин «стандартное отклонение») называется число σ (ξ) равное квадратному корню из дисперсии ξ:

Среднеквадратичное отклонение измеряет отклонение случайной нвеличины от ее математического ожидания в тех же величинах, в которых измеряется сама случайная величина (в отличие от дисперсии, размерность которой равна квадрату размерности исходной случайной величины). Для нормального распределения среднеквадратичное отклонение равно параметру σ. Таким образом, математическое ожидание и стандартное отклонение представляют собой полный набор характеристик нормального распределения и однозначно определяют вид плотности распределения. Для распределений, отличающихся от нормального, эта пара показателей не является столь же эффективной характеристикой распределения.


В качестве характеристики рассеяния случайной величины используется также коэффициент вариации. Коэффициентом вариации случайной величины ξ имеющей ненулевое математическое ожидание, называется число V (ξ) равное отношению среднеквадратичного отклонения ξ к ее математическому ожиданию:

Коэффициент вариации измеряет рассеяние случайной величины в долях ее математического ожидания и часто выражается в процентах от последнего. Этой характеристикой не следует пользоваться, если математическое ожидание близко к 0 или существенно меньше стандартного отклонения (в этом случае малые ошибки при определении математического ожидания приводят к высокой погрешности для коэффициента вариации), а также, если вид плотности распределении существенно отличается от гауссовского.

Коэффициент асимметрии (As ) определяет 3-ю степень отклонении случайной величины от математического ожидания и определяется по формуле:

На практике этот показатель используется в качестве оценки симметричности распределения. Для любого симметричного распределения он равен 0. Если же плотность распределения несимметрична (что часто может иметь место при оценке риска смерти и рисков, связанных с загрязнением воды и воздуха), то положительный коэффициент асимметрии соответствует случаю, когда левое плечо кривой плотности круче правого, а отрицательный - случаю, когда правое плечо круче левого (рис 4.17).

Для асимметричных распределений стандартное отклонение не является хорошим показателем рассеяния случайной величины. Для характеристики рассеяния в этом случае можно использовать такие показатели, как квартили, квантили и процентили.

Первой квартилью случайной величины ξ, имеющей функцию распределения F(х), называется число Q 1 являющееся решением уравнения

F(Q 1) = 1/4

т. е. такое число, для которого вероятность того, что ξ принимает значения, меньшие Q 1 , равна 1/4, вероятность того, что она принимает значения, большие Q 1 равна 3/4.

Второй квартилью (Q 2 ) случайной величины называется ее медиана, а третьей (Q 3 ) - решение уравнения

F(Q 3) = 3/4

Квартили делят ось абсцисс на 4 интервала: [-∞,Q 1 ], [Q 1 , Q 2 ], [Q 2 , Q 3 ] и [Q 3 , + ∞] в каждый из которых случайная величина попадает c равной вероятностью, а фигуру, ограниченную осью абсцисс и графиком плотности распределения - на 4 области с одинаковой площадью. И интервале между первой и третьей квартилями сосредоточено 50% распределения случайной величины. Для симметричных распределений первая и третья квартили одинаково удалены от медианы.

Квантилью порядка р случайной величины ξ с функцией распределения F(х) называется число х , являющееся решением уравнения

Таким образом, квартили являются квантилями порядка 0,25, 0,5 и 0,75. Если порядок квантили р выражается в процентах, то соответствующие значения х называются процентилями, или р -процентными точками распределения.

На рис. 4.18 показаны, наряду с квантилями, 2,5- и 97,5-процентные точки распределения. Между этими точками сосредоточено 95% распределения случайной величины, поэтому заключенный между ними интервал называют 95 %-м доверительным интервалом среднего (в частности, при оценке рисков - 95 %-м доверительным интервалом риска).

Задача 2. Какие из перечисленных ниже сведений о случайной величине ξ позволяют отвергнуть предположение о том, что она распределена по нормальному закону:

а) ξ - дискретная случайная величина;

б) математическое ожидание ξ отрицательно;

в) распределение ξ унимодально;

г) математическое ожидание ξ не равно ее медиане;

д) коэффициент асимметрии ξ отрицателен;

е) стандартное отклонение ξ больше ее математического ожидания;

ж) ξ характеризует распределение продолжительности острых заболеваний органов дыхания на исследуемой территории;

з) ξ характеризует распределение продолжительности жизни на исследуемой территории;

и) медиана ξ не совпадает с центром интервала между первой и третьей квартилями.

Ответ: Предположение о нормальном законе распределения случайной величины несовместимо с утверждениями а), г), д), з), и).

Рис. 4.17. Зависимость между знаком Рис.4.18. Квартили и процентили:

коэффициента асимметрии и формой иллюстрация с помощью функции

функции плотности распределения

К основным статистическим характеристикам ряда измерений (вариацион­ного ряда) относятся характеристики положения (средние характе­ристики, или центральная тенденция выборки ); характеристики рассеяния (ва­риации, или колеблемости ) и характеристики формы распределения.

К характеристикам положения относятся среднее арифметическое значе­ние (среднее значение ), мода и медиана.

К характеристикам рассеяния (вариации, или колеблемости ) относятся: размах вариации , дисперсия , среднее квадратическое (стандартное ) отклонение , ошибка средней арифметической (ошибка средней ), коэффициент вариации и др.

К характеристикам формы относятся коэффициент асимметрии, мера ско­шенности и эксцесс.

Характеристики положения

Среднее арифметическое значение – одна из основных характеристик вы­борки.

Она, как и другие числовые характеристики выборки, может вычисляться как по необработанным первичным данным, так и по результатам группировки этих данных.

Точность вычисления по необработанным данным выше, но процесс вычисления оказывается трудоёмким при большом объёме выборки.

Для несгруппированных данных среднее арифметическое определяется по формуле:

где n - объем выборки, х 1 , х 2 , ... х n - результаты измерений.

Для сгруппированных данных:

где n - объем выборки, k – число интервалов группировки, n i – частоты интервалов, x i – срединные значения интервалов.

Мода

Определение 1. Мода - наиболее часто встречающаяся величина в данных вы­борки. Обозначается Мо и определяетсяпо формуле:

где - нижняя граница модального интервала, - ширина интервала группи­ровки, - частота модального интервала, - частота интервала, предшествую­щего модальному, - частота интервала, последующего за модаль­ным.

Определение 2. Модой Мо дискретной случайной величины называется наиболее вероятное её значение.

Геометрически моду можно интерпретировать как абсциссу точки максимума кривой распределения. Бывают двухмодальные и многомодальные распределения. Встречаются распределения, которые имеют минимум, но не имеют максимума. Такие распределения называются антимодальными .

Определение. Модальным интервалом называется интервал группировки с наибольшей частотой.

Медиана

Определение . Медиана - результат измерения, который находится в сере­дине ранжированного ряда, иначе говоря, медианой называется значение признака Х , когда одна половина значений экспериментальных данных меньше её, а вторая половина – больше, обозначается Ме .

Когда объем выборки n - четное число, т. е. результатов измерений четное количество, то для определения медианы рассчитывается среднее значение двух показателей выборки, находящихся в середине ранжированного ряда.

Для данных, сгруппированных в интервалы, медиану определяют по фор­муле:

,

где - нижняя граница медианного интервала; ширина интервала группи­ровки, 0,5n – половина объёма выборки, - частота медианного интервала, - накопленная частота интервала, предшествующего медианному.

Определение. Медианным интервалом называется тот интервал, в котором накопленная частота впервые окажется больше половины объёма выборки (n/ 2) или накопленная частость окажется больше 0,5.

Численные значения среднего, моды и медианы отличаются, когда имеет место несимметричная форма эмпирического распределения.

Характеристики рассеяния результатов измерений

Для математико-статистического анализа результатов выборки знать только характеристики положения недостаточно. Одна и та же величина среднего значе­ния может характеризовать совершенно различные выборки.

Поэтому кроме них в статистике рассматривают также характеристики рассеяния (вариации, или колеблемости ) результатов .

Размах вариации

Определение. Размахом вариации называется разница между наибольшим и наименьшим результатами выборки, обозначается R и определяется

R =X max - X min .

Информативность этого показателя невелика, хотя при малых объёмах вы­борки по размаху легко оценить разницу между лучшим и худшим результатами спортсменов.

Дисперсия

Определение. Дисперсией называется средний квадрат отклонения значений признака от среднего арифметического.

Для несгруппированных данных дисперсия определяется по формуле

s 2 = , (1)

где Х i – значение признака, - среднее арифметическое.

Для данных, сгруппированных в интервалы, дисперсия определяется по формуле

,

где х i – среднее значение i интервала группировки, n i – частоты интервалов.

Для упрощения расчётов и во избежание погрешностей вычисления при округ­лении результатов (особенно при увеличении объёма выборки) используются также другие формулы для определения дисперсии. Если среднее арифметическое уже вычислено, то для несгруппированных данных используется следующая фор­мула:

для сгруппированных данных:

.

Эти формулы получаются из предыдущих раскрытием квадрата разности под знаком суммы.

Читайте также: