Дисперсия случайной величины

Черновик. Черновик. Черновик. Не бросайте меня в терновый куст.

Мера разброса случайной величины. Второй центральный момент.

Дисперсия — это мера отклонения значений выборки от её среднего.

Для иллюстрации рассмотрим два примера: очень простой и простой.

Содержание

Предположим, у нас есть две выборки размера $n = 5 : X = \\(lC 7, 8, 10, 12, 13 \\(rC$ и $Y = \\(lC 2, 7, 12, 13, 16 \\(rC .$ Средние этих выборок равны x bar = y bar = 10 , но видно, что первая выборка гораздо более компактно располагается вокруг своего среднего значения, а вторая — более рассеянна относительно него.

Попробуем численно показать этот интуитивный факт. Для этого посмотрим, насколько сильно в среднем отклоняются от среднего значения наших выборок. Чтобы нивелировать влияние отклонений в разные стороны от среднего (что-то дало отклонение в плюс, а что-то в минус), мы используем сумму квадратов отклонений значений от среднего. Такой показатель и будем называть дисперсией и обозначим $roman D \[X\] :$ $roman D \[X\] = {sum from i=1 to n (x sub i - x bar ) sup 2} over {n}$

Отметим, что в академической традиции, подражающей западной, дисперсию принято называть вариацией (калькирование английского слова variance) и обозначать $roman Var \[X\]$ , что вносит путаницу, когда русскоязычные студенты начинает изучать, например, метод вариации постоянной в курсе дифференциальных уравнений. Поэтому мы будем придерживаться термина дисперсия и указанного выше обозначения или обозначения через sigma sub X sup 2 .

Рассчитаем дисперсии для обеих выборок из нашего примера.

Для первой выборки: $roman D \[ X \] = size -2 {{(7 - 10) sup 2 + (8 - 10) sup 2 + (10 - 10) sup 2 + (12 - 10) sup 2 + (13 - 10) sup 2} over 5} = size -2 {26 over 5} = 5,2 }$

Для второй выборки: $roman D \[ Y \] = size -2 {{(2 - 10) sup 2 + (7 - 10) sup 2 + (12 - 10) sup 2 + (13 - 10) sup 2 + (16 - 10) sup 2} over 5} = size -2 {122 over 5} = 24,4$

Видно, что вторая выборка более разреженна относительно её арифметрического центра.

Дисперсия, как было сказано выше, средняя сумма квадратов отклонений от среднего. Для случайной величины среднее — это математическое ожидание. Мы можем сказать, что дисперсия — это математическое ожидание квадратов отклонения значения случайной величины от её математического ожидания (в роли деления на число наблюдений выступает взвешивание по вероятностям в формуле математического ожидания): $roman D \[X\] = roman M \[(X - roman M \[X\]) sup 2 \] .$

Напомним три факта, связанное с понятием МатематическоеОжиданиеСлучайнойВеличины:

Математическое ожидание случайной величины — это число, константа: $roman M \[X\] = c .$
Математическое ожидание константы — это сама эта константа: $roman M \[c\] = c .$
Константу можно вынести за знак математического ожидания: $roman M \[cX\] = c roman M \[X\] .$
Математическое ожидание линейной комбинации случайных величин — это линейная комбинация математических ожиадний: $roman M \[a X + b Y + c\] = a roman M \[X\] + b roman M \[Y\] + c .$

Раскроем скобки в записи дисперсии и воспользуемся свойством линейности математического ожидания: $roman D \[X\] = roman M \[ X sup 2 - 2 X roman M \[X\] + ( roman M \[X\]) sup 2 \] = roman M \[X sup 2 \] - roman M \[ 2 X roman M \[X\] \] + roman M \[ ( roman M \[X\]) sup 2 \].$

Рассмотрим слагаемые по отдельности. Первое слагаемое мы оставим без изменений. Из второго слагаемого мы можем вынести константу $2 roman M \[X\]$ , в результате чего получим $roman M \[2 X roman M \[X\]\] = 2 roman M \[X\] roman M \[X\] = 2 ( roman M \[X\]) sup 2 .$ Под знаком математического ожидания третьего слагаемого стоит квадрат математического ожидания, т. е. тоже константа поэтому $roman M\[( roman M \[X\]) sup 2 \] = ( roman M \[X\]) sup 2 .$ Запишем дисперсию, использовав преобразованные слагаемые: $roman D \[X\] = roman M \[X sup 2 \] - 2 ( roman M \[X\]) sup 2 + ( roman M \[X\]) sup 2 = roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 .$

Мы можем воспользоваться любой из этих формул для расчёта дисперсии: $roman D \[X\] = roman M \[(X - roman M \[X\]) sup 2 \] = roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 .$

Предположим, что у нас есть две случайных величины и , законы распределения которых заданы таблично: $left | matrix { ccol {x sub i above p sub i} ccol {5 above 0\\\",\\\"1} ccol {7 above 0\\\",\\\"5} ccol {10 above 0\\\",\\\"4} } right |$ $left | matrix { ccol {y sub i above p sub i} ccol {2 above 0\\\",\\\"2} ccol {9 above 0\\\",\\\"7} ccol {13 above 0\\\",\\\"1} } right |$

Математические ожидания этих случайных величины равны: $lpile { roman M \[X\] = sum from i=1 to 3 x sub i p sub i = 5 cdot 0\\\",\\\"1 + 7 cdot 0\\\",\\\"5 + 10 cdot 0\\\",\\\"4 = 8 , above roman M \[Y\] = sum from i=1 to 3 y sub i p sub i = 2 cdot 0\\\",\\\"2 + 9 cdot 0\\\",\\\"7 + 13 cdot 0\\\",\\\"1 = 8 . }$

Рассчитаем дисперсию случайных величин и Y , воспользовавшись второй формулой. Рассчитаем сначала математические ожидания квадратов случайных величин: $lpile { roman M \[X sup 2 \] = sum from i=1 to 3 x sub i sup 2 p sub i = 5 sup 2 cdot 0\\\",\\\"1 + 7 sup 2 cdot 0\\\",\\\"5 + 10 sup 2 cdot 0\\\",\\\"4 = 67, above roman M \[Y sup 2 \] = sum from i=1 to 3 y sub i sup 2 p sub i = 2 sup 2 cdot 0\\\",\\\"2 + 9 sup 2 cdot 0\\\",\\\"7 + 13 sup 2 cdot 0\\\",\\\"1 = 74\\\",\\\"4 . }$

Финально, получим дисперсии: $lpile { roman D \[X\] = roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 = 67 - 8 sup 2 = 3 above roman D \[X\] = roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 = 74\\\",\\\"4 - 8 sup 2 = 10\\\",\\\"4 }$

КатегорияПрикладнаяМатематика | КатегорияТеорияВероятностей

Поиск Wiki

Пользовательские действия

Дисперсия случайной величины

Содержание

Очень простой пример

Определение для случайных величин

Простой пример