Нормальное распределение случайной величины. Нормальное распределение непрерывной случайной величины Свойства нормального распределения в статистике

Определение 1

Случайная величина $X$ имеет нормальное распределение (распределение Гаусса), если плотность её распределения определяется формулой:

\[\varphi \left(x\right)=\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(x-a)}^2}{2{\sigma }^2}}\]

Здесь $aϵR$ -- математическое ожидание, а $\sigma >0$ -- среднее квадратическое отклонение.

Плотность нормального распределения.

Покажем, что эта функция действительно является плотностью распределения. Для этого проверим следующее условие:

Рассмотрим несобственный интеграл $\int\limits^{+\infty }_{-\infty }{\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(x-a)}^2}{2{\sigma }^2}}dx}$.

Сделаем замену: $\frac{x-a}{\sigma }=t,\ x=\sigma t+a,\ dx=\sigma dt$.

Так как $f\left(t\right)=e^{\frac{-t^2}{2}}$ четная функция, то

Равенство выполняется, значит, функция $\varphi \left(x\right)=\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(x-a)}^2}{2{\sigma }^2}}$ действительно является плотностью распределения некоторой случайной величины.

Рассмотрим некоторые простейшие свойства функции плотности вероятности нормального распределения $\varphi \left(x\right)$:

  1. График функции плотности вероятности нормального распределения симметричен относительно прямой $x=a$.
  2. Функция $\varphi \left(x\right)$ достигает максимума при $x=a$, при этом $\varphi \left(a\right)=\frac{1}{\sqrt{2\pi }\sigma }e^{\frac{-{(a-a)}^2}{2{\sigma }^2}}=\frac{1}{\sqrt{2\pi }\sigma }$
  3. Функция $\varphi \left(x\right)$ убывает, при $x>a$, и возрастает, при $x
  4. Функция $\varphi \left(x\right)$ имеет точки перегиба при $x=a+\sigma $ и $x=a-\sigma $.
  5. Функция $\varphi \left(x\right)$ асимптотически приближается к оси $Ox$ при $x\to \pm \infty $.
  6. Схематический график выглядит следующим образом (рис. 1).

Рисунок 1. Рис. 1. График плотности нормального распределения

Заметим, что, если $a=0$, то график функции симметричен относительно оси $Oy$. Следовательно, функция $\varphi \left(x\right)$ четна.

Функция нормального распределения вероятности.

Для нахождения функции распределения вероятности при нормальном распределении воспользуемся следующей формулой:

Следовательно,

Определение 2

Функция $F(x)$ называется стандартным нормальным распределением, если $a=0,\ \sigma =1$, то есть:

Здесь $Ф\left(x\right)=\frac{1}{\sqrt{2\pi }}\int\limits^x_0{e^{\frac{-t^2}{2}}dt}$ - функция Лапласса.

Определение 3

Функция $Ф\left(x\right)=\frac{1}{\sqrt{2\pi }}\int\limits^x_0{e^{\frac{-t^2}{2}}dt}$ называется интегралом вероятности.

Числовые характеристики нормального распределения.

Математическое ожидание: $M\left(X\right)=a$.

Дисперсия : $D\left(X\right)={\sigma }^2$.

Среднее квадратическое распределение: $\sigma \left(X\right)=\sigma $.

Пример 1

Пример решения задачи на понятие нормального распределения.

Задача 1 : Длина пути $X$ представляет собой случайную непрерывную величину. $X$ распределена по нормальному закону распределения среднее значение которого равно $4$ километра, а среднее квадратическое отклонение равно $100$ метров.

  1. Найти функцию плотности распределения $X$.
  2. Построить схематически график плотности распределения.
  3. Найти функцию распределения случайной величины $X$.
  4. Найти дисперсию.
  1. Для начала представим все величины в одном измерении: 100м=0,1км

Из определения 1, получим:

\[\varphi \left(x\right)=\frac{1}{0,1\sqrt{2\pi }}e^{\frac{-{(x-4)}^2}{0,02}}\]

(так как $a=4\ км,\ \sigma =0,1\ км)$

  1. Используя свойства функции плотности распределения, имеем, что график функции $\varphi \left(x\right)$ симметричен относительно прямой $x=4$.

Максимум функция достигает в точке $\left(a,\frac{1}{\sqrt{2\pi }\sigma }\right)=(4,\ \frac{1}{0,1\sqrt{2\pi }})$

Схематический график имеет вид:

Рисунок 2.

  1. По определению функции распределения $F\left(x\right)=\frac{1}{\sqrt{2\pi }\sigma }\int\limits^x_{-\infty }{e^{\frac{-{(t-a)}^2}{2{\sigma }^2}}dt}$, имеем:
\
  1. $D\left(X\right)={\sigma }^2=0,01$.

Рассмотрим частный случай, когда параметры распределения m = 0 .σ = 1 . Нормальное распределение N(0;1) называется стандартным нормальным распределением. В этом случае плотность распределения

(22)

Кривая распределения, построенная по формуле стандартного нормального распределения имеет колоколообразныи вид, вертикальная ось является осью симметрии, горизонтальная - асимптотой. Максимальное значение ординаты равно

При значениях аргумента х = ± 3 значения функции близки к нулю: при общей площади под кривой распределения, равной единице, в этом диапазоне лежит 99,73%. Заметим, что в диапазоне х = ± 2 лежит 95,44% площади под кривой распределения, а в диапазоне х = ±1 - 68,26%.

Рисунок 3.- Кривая стандартного нормального распределения

При изменении параметра т график сдвигается вправо или влево так, что прямая х= т - ось симметрии

Рисунок 4- Влияние параметра т на вид кривой нормального распределения

При увеличении параметра σ максимум кривой распределения снижается, при уменьшении, а кривая вытягивается вверх, при этом по условию нормировки площадь под кривой распределения остается постоянной (и равной единице)

Рисунок 5 – Влияние параметра σ на вид кривой нормального распределения.

Вновь рассмотрим стандартное нормальное распределение N(0,1). Функция такого распределения иногда называется функцией Лапласа, она имеет специальное обозначение Ф(х).Можно записать уравнение

(23)

Эnа функция табулирована. Например, Ф(2,48) = = 0,9934. График функции показан на рис.

Рисунок 6 - График функции стандартного нормального распределения

Из симметрии графика вытекает соотношение

Ф(-х) = 1-Ф(х)

Табулированы и квантили нормального распределения

Квантиль нормального распределения порядка р - это число u p , для которого Ф(u p) = p .Например,=1,645

Из симметрии графика функции стандартного нормального распределения и формулы вытекает полезное соотношение для квантилей:

u 1- p = u p

Можно установить связь между функцией распределения F(x) для распределения N(m,σ) и функцией стандартного нормального распределения:

(24)

Вероятность попадания нормально распределенной случайной величины в интервал от x 1 до x 2 определяется по формуле

Часто в расчетах надо найти вероятность того, что случайная величина Х не слишком сильно отклонится от своего математического ожидания m:

Правило «трех сигм»

Пусть, например ε = 3σ. Используя таблицы функции стандартного нормального распределения найдем:

поэтому вероятность того, что случайная величина отклонится от математического ожидания больше, чем на Зσ, ничтожно мала:



Такое событие практически невозможно. В связи с этим на практике часто используется так называемое правило «трех сигм» : отклонение нормально распределенной случайной величины от ее математического ожидания, как правило, не превышает утроенного стандартного отклонения.

Рассмотрим применение свойств нормального распределения

Пример.1 На станке-автомате изготавливаются валики номинальным диаметром 10 мм. Стандартное отклонение, характеризующее точность станка, составляет σ = 0,03 мм. Сколько в среднем валиков из ста удовлетворяют стандарту, если для этого требуется, чтобы диаметр отклонялся от номинального не более чем на 0,05 мм?

В теории вероятностей рассматривается достаточно большое количество разнообразных законов распределения. Для решения задач, связанных с построением контрольных карт, представляют интерес лишь некоторые из них. Важнейшим из них является нормальный закон распределения , который применяется для построения контрольных карт, используемых при контроле по количественному признаку , т.е. когда мы имеем дело с непрерывной случайной величиной. Нормальный закон распределения занимает среди других законов распределения особое положение. Это объясняется тем, что, во-первых, наиболее часто встречается на практике, и, во-вторых, он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях. Что касается второго обстоятельства, то в теории вероятностей доказано, что сумма достаточно большого числа независимых (или слабо зависимых) случайных величин, подчиненных каким угодно законам распределения (при соблюдении некоторых весьма нежестких ограничений), приближенно подчиняется нормальному закону, и это выполняется тем точнее, чем большее количество случайных величин суммируется. Большинство встречающихся на практике случайных величин, таких, например, как ошибки измерений, могут быть представлены как сумма весьма большего числа сравнительно малых слагаемых - элементарных ошибок, каждая из которых вызвана действием отдельной причины, независящей от остальных. Нормальный закон проявляется в тех случаях, когда случайная переменная Х является результатом действия большого числа различных факторов. Каждый фактор в отдельности на величину Х влияет незначительно, и нельзя указать, какой именно влияет в большей степени, чем остальные.

Нормальное распределение (распределение Лапласа–Гаусса ) – распределение вероятностей непрерывной случайной величины Х такое, что плотность распределения вероятностей при - ¥ <х< + ¥ принимает действительное значение:

Ехр (3)

То есть, нормальное распределение характеризуется двумя параметрами m и s, где m - математическое ожидание; s- стандартное отклонение нормального распределения.

Величина s 2 – это дисперсия нормального распределения.

Математическое ожидание m характеризует положение центра распределения, а стандартное отклонение s (СКО) является характеристикой рассеивания (рис. 3).

f(x) f(x)


Рисунок 3 – Функции плотности нормального распределения с:

а) разными математическими ожиданиями m; б) разными СКО s .

Таким образом, значением μ определяется положением кривой распределения на оси абсцисс. Размерность μ - та же, что и размерность случайной величины X . С ростом математического ожидания mобе функции сдвигается параллельно вправо. С убывающей дисперсией s 2 плотность все больше концентрируется вокруг m, в то время как функция распределения становится все более крутой.

Значением σ определяется форма кривой распределения. Поскольку площадь под кривой распределения должна всегда оставаться равной единице, то при увеличении σ кривая распределения становится более плоской. На рис. 3.1 показаны три кривые при разных σ: σ1 = 0,5; σ2 = 1,0; σ3 = 2,0.

Рисунок 3.1 – Функции плотности нормального распределения с разными СКО s .

Функция распределения (интегральная функция) имеет вид (рис. 4):

(4)

Рисунок 4 – Интегральная (а) и дифференциальная (б) функции нормального распределения

Особенно важно то линейное преобразование нормально распределенной случайной переменной Х , после которого получается случайная переменная Z с математическим ожиданием 0 и дисперсией 1. Такое преобразование называется нормированием:

Его можно провести для каждой случайной переменной. Нормирование позволяет все возможные варианты нормального распределения свести к одному случаю: m = 0, s = 1.

Нормальное распределение с m = 0, s = 1 называется нормированным нормальным распределением (стандартизованным) .

Стандартное нормальное распределение (стандартное распределение Лапласа–Гаусса или нормированное нормальное распределение) – это распределение вероятностей стандартизованной нормальной случайной величины Z , плотность распределения которой равна:

при - ¥ <z < + ¥

Значения функции Ф(z) определяется по формуле:

(7)

Значения функции Ф(z) и плотности ф(z) нормированного нормального распределения рассчитаны и сведены в таблицы (табулированы). Таблица составлена только для положительных значений z поэтому:

Ф (z) = 1 Ф (z) (8)

С помощью этих таблиц можно определить не только значения функции и плотности нормированного нормального распределения для заданного z , но и значения функции общего нормального распределения, так как:

; (9)

. 10)

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины Х , подчиненной нормальному закону с параметрами m и s, на определенный участок. Таким участком может быть, например, поле допуска на параметр от верхнего значения U до нижнего L .

Вероятность попадания в интервал от х 1 до х 2 можно определить по формуле:

Таким образом, вероятность попадания случайной величины (значение параметра) Х в поле допуска определяется формулой

Можно найти вероятность того, что случайная переменная Х окажется в пределах μ k s. Полученные значения для k =1,2 и 3 следующие (также смотрим рис. 5):

Таким образом, если какое-либо значение появляется за пределами трехсигмового участка, в котором находятся 99,73% всех возможных значений, а вероятность появления такого события очень мала (1:270), следует считать, что рассматриваемое значение оказалось слишком маленьким или слишком большим не из-за случайного варьирования, а из-за существенной помехи в самом процессе, способной вызывать изменения в характере распределения.

Участок, лежащий внутри трехсигмовых границ, называют также областью статистического допуска соответствующей машины или процесса.

Во многих задачах, связанных с нормально распределенными случайными величинами, приходится определять вероятность попадания случайной величины , подчиненной нормальному закону с параметрами , на участок от до . Для вычисления этой вероятности воспользуемся общей формулой

где - функция распределения величины .

Найдем функцию распределения случайной величины , распределенной по нормальному закону с параметрами . Плотность распределения величины равна:

Отсюда находим функцию распределения

. (6.3.3)

Сделаем в интеграле (6.3.3) замену переменной

и приведем его к виду:

(6.3.4)

Интеграл (6.3.4) не выражается через элементарные функции, но его можно вычислить через специальную функцию, выражающую определенный интеграл от выражения или (так называемый интеграл вероятностей), для которого составлены таблицы. Существует много разновидностей таких функций, например:

;

и т.д. Какой из этих функций пользоваться – вопрос вкуса. Мы выберем в качестве такой функции

. (6.3.5)

Нетрудно видеть, что эта функция представляет собой не что иное, как функцию распределения для нормально распределенной случайной величины с параметрами .

Условимся называть функцию нормальной функцией распределения. В приложении (табл. 1) приведены таблицы значений функции .

Выразим функцию распределения (6.3.3) величины с параметрами и через нормальную функцию распределения . Очевидно,

Теперь найдем вероятность попадания случайной величины на участок от до . Согласно формуле (6.3.1)

Таким образом, мы выразили вероятность попадания на участок случайной величины , распределенной по нормальному закону с любыми параметрами, через стандартную функцию распределения , соответствующую простейшему нормальному закону с параметрами 0,1. Заметим, что аргументы функции в формуле (6.3.7) имеют очень простой смысл: есть расстояние от правого конца участка до центра рассеивания, выраженное в средних квадратических отклонениях; - такое же расстояние для левого конца участка, причем это расстояние считается положительным, если конец расположен справа от центра рассеивания, и отрицательным, если слева.

Как и всякая функция распределения, функция обладает свойствами:

3. - неубывающая функция.

Кроме того, из симметричности нормального распределения с параметрами относительно начала координат следует, что

Пользуясь этим свойством, собственно говоря, можно было бы ограничить таблицы функции только положительными значениями аргумента, но, чтобы избежать лишней операции (вычитание из единицы), в таблице 1 приложения приводятся значения как для положительных, так и для отрицательных аргументов.

На практике часто встречается задача вычисления вероятности попадания нормально распределенной случайной величины на участок, симметричный относительно центра рассеивания . Рассмотрим такой участок длины (рис. 6.3.1). Вычислим вероятность попадания на этот участок по формуле (6.3.7):

Учитывая свойство (6.3.8) функции и придавая левой части формулы (6.3.9) более компактный вид, получим формулу для вероятности попадания случайной величины, распределенной по нормальному закону на участок, симметричный относительно центра рассеивания:

. (6.3.10)

Решим следующую задачу. Отложим от центра рассеивания последовательные отрезки длиной (рис. 6.3.2) и вычислим вероятность попадания случайной величины в каждый из них. Так как кривая нормального закона симметрична, достаточно отложить такие отрезки только в одну сторону.

По формуле (6.3.7) находим:

(6.3.11)

Как видно из этих данных, вероятности попадания на каждый из следующих отрезков (пятый, шестой и т.д.) с точностью до 0,001 равны нулю.

Округляя вероятности попадания в отрезки до 0,01 (до 1%), получим три числа, которые легко запомнить:

0,34; 0,14; 0,02.

Сумма этих трех значений равна 0,5. Это значит, что для нормально распределенной случайной величины все рассеивания (с точностью до долей процента) укладывается на участке .

Это позволяет, зная среднее квадратическое отклонение и математическое ожидание случайной величины, ориентировочно указать интервал её практически возможных значений. Такой способ оценки диапазона возможных значений случайной величины известен в математической статистике под названием «правило трех сигма». Из правила трех сигма вытекает также ориентировочный способ определения среднего квадратического отклонения случайной величины: берут максимальное практически возможное отклонение от среднего и делят его на три. Разумеется, этот грубый прием может быть рекомендован, только если нет других, более точных способов определения .

Пример 1. Случайная величина , распределенная по нормальному закону, представляет собой ошибку измерения некоторого расстояния. При измерении допускается систематическая ошибка в сторону завышения на 1,2 (м); среднее квадратическое отклонения ошибки измерения равно 0,8 (м). Найти вероятность того, что отклонение измеренного значения от истинного не превзойдет по абсолютной величине 1,6 (м).

Решение. Ошибка измерения есть случайная величина , подчиненная нормальному закону с параметрами и . Нужно найти вероятность попадания этой величины на участок от до . По формуле (6.3.7) имеем:

Пользуясь таблицами функции (приложение, табл. 1), найдем:

; ,

Пример 2. Найти ту же вероятность, что и в предыдущем примере, но при условии, что систематической ошибки нет.

Решение. По формуле (6.3.10), полагая , найдем:

Пример 3. По цели, имеющей вид полосы (автострада), ширина которой равна 20 м, ведется стрельба в направлении, перпендикулярном автостраде. Прицеливание ведется по средней линии автострады. Среднее квадратическое отклонение в направлении стрельбы равно м. Имеется систематическая ошибка в направлении стрельбы: недолет 3 м. Найти вероятность попадания в автостраду при одном выстреле.

Читайте также: