Дисперсия случайной величины

Черновик. Черновик. Черновик. Не бросайте меня в терновый куст.

Мера разброса случайной величины. Второй центральный момент.

Дисперсия — это мера отклонения значений выборки от её среднего.

Для иллюстрации рассмотрим два примера: очень простой и простой.

Содержание

Очень простой пример

Предположим, у нас есть две выборки размера n = 5 : X = \\(lC 7, 8, 10, 12, 13 \\(rC и Y  = \\(lC 2, 7, 12, 13, 16 \\(rC . Средние этих выборок равны x bar = y bar = 10 , но видно, что первая выборка гораздо более компактно располагается вокруг своего среднего значения, а вторая — более рассеянна относительно него.

Попробуем численно показать этот интуитивный факт. Для этого посмотрим, насколько сильно в среднем отклоняются от среднего значения наших выборок. Чтобы нивелировать влияние отклонений в разные стороны от среднего (что-то дало отклонение в плюс, а что-то в минус), мы используем сумму квадратов отклонений значений от среднего. Такой показатель и будем называть дисперсией и обозначим roman D \[X\] : roman D \[X\] = {sum from i=1 to n (x sub i - x bar ) sup 2} over {n}

Отметим, что в академической традиции, подражающей западной, дисперсию принято называть вариацией (калькирование английского слова variance) и обозначать roman Var \[X\], что вносит путаницу, когда русскоязычные студенты начинает изучать, например, метод вариации постоянной в курсе дифференциальных уравнений. Поэтому мы будем придерживаться термина дисперсия и указанного выше обозначения или обозначения через sigma sub X sup 2.

Рассчитаем дисперсии для обеих выборок из нашего примера.

Для первой выборки: roman D \[ X \] = 
size -2 {{(7 - 10) sup 2 + (8 - 10) sup 2 + (10 - 10) sup 2 + (12 - 10) sup 2 + (13 - 10) sup 2} over 5} = size -2 {26 over 5} = 5,2
}

Для второй выборки: roman D \[ Y \] = 
size -2 {{(2 - 10) sup 2 + (7 - 10) sup 2 + (12 - 10) sup 2 + (13 - 10) sup 2 + (16 - 10) sup 2} over 5} = size -2 {122 over 5} = 24,4

Видно, что вторая выборка более разреженна относительно её арифметрического центра.

Определение для случайных величин

Дисперсия, как было сказано выше, средняя сумма квадратов отклонений от среднего. Для случайной величины среднее — это математическое ожидание. Мы можем сказать, что дисперсия — это математическое ожидание квадратов отклонения значения случайной величины от её математического ожидания (в роли деления на число наблюдений выступает взвешивание по вероятностям в формуле математического ожидания): roman D \[X\] = roman M \[(X - roman M \[X\]) sup 2 \] .

Напомним три факта, связанное с понятием МатематическоеОжиданиеСлучайнойВеличины:

  1. Математическое ожидание случайной величины — это число, константа: roman M \[X\] = c .
  2. Математическое ожидание константы — это сама эта константа: roman M \[c\] = c .
  3. Константу можно вынести за знак математического ожидания: roman M \[cX\] = c roman M \[X\] .
  4. Математическое ожидание линейной комбинации случайных величин — это линейная комбинация математических ожиадний: roman M \[a X + b Y + c\] = a roman M \[X\] + b roman M \[Y\] + c .

Раскроем скобки в записи дисперсии и воспользуемся свойством линейности математического ожидания: roman D \[X\] = 
roman M \[ X sup 2 - 2 X roman M \[X\] + ( roman M \[X\]) sup 2 \] = 
roman M \[X sup 2 \]  - roman M \[ 2 X roman M \[X\] \] + roman M \[ ( roman M \[X\]) sup 2 \].

Рассмотрим слагаемые по отдельности. Первое слагаемое мы оставим без изменений. Из второго слагаемого мы можем вынести константу 2 roman M \[X\], в результате чего получим roman M \[2 X roman M \[X\]\] = 2 roman M \[X\] roman M \[X\] = 2 ( roman M \[X\]) sup 2 . Под знаком математического ожидания третьего слагаемого стоит квадрат математического ожидания, т. е. тоже константа поэтому roman M\[( roman M \[X\]) sup 2 \] = ( roman M \[X\]) sup 2 . Запишем дисперсию, использовав преобразованные слагаемые: roman D \[X\] = 
roman M \[X sup 2 \] - 2 ( roman M \[X\]) sup 2 + ( roman M \[X\]) sup 2 =
roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 .

Мы можем воспользоваться любой из этих формул для расчёта дисперсии: roman D \[X\] = 
roman M \[(X - roman M \[X\]) sup 2 \] = 
roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 .

Простой пример

Предположим, что у нас есть две случайных величины X и Y, законы распределения которых заданы таблично: left |
 matrix {
  ccol {x sub i above p sub i}
  ccol {5 above 0\\\",\\\"1}
  ccol {7 above 0\\\",\\\"5}
  ccol {10 above 0\\\",\\\"4}
 }
right | left |
 matrix {
  ccol {y sub i above p sub i}
  ccol {2 above 0\\\",\\\"2}
  ccol {9 above 0\\\",\\\"7}
  ccol {13 above 0\\\",\\\"1}
 }
right |

Математические ожидания этих случайных величины равны: lpile {
 roman M \[X\] = sum from i=1 to 3 x sub i p sub i = 
 5 cdot 0\\\",\\\"1 + 7 cdot 0\\\",\\\"5 + 10 cdot 0\\\",\\\"4 = 8 , above
 roman M \[Y\] = sum from i=1 to 3 y sub i p sub i = 
 2 cdot 0\\\",\\\"2 + 9 cdot 0\\\",\\\"7 + 13 cdot 0\\\",\\\"1 = 8 .
}

Рассчитаем дисперсию случайных величин X и Y , воспользовавшись второй формулой. Рассчитаем сначала математические ожидания квадратов случайных величин: lpile {
 roman M \[X sup 2 \] = 
 sum from i=1 to 3 x sub i sup 2 p sub i = 
 5 sup 2 cdot 0\\\",\\\"1 + 7 sup 2 cdot 0\\\",\\\"5 + 10 sup 2 cdot 0\\\",\\\"4 =  67, above
 roman M \[Y sup 2 \] = 
 sum from i=1 to 3 y sub i sup 2 p sub i = 
 2 sup 2 cdot 0\\\",\\\"2 + 9 sup 2 cdot 0\\\",\\\"7 + 13 sup 2 cdot 0\\\",\\\"1 = 74\\\",\\\"4 .
}

Финально, получим дисперсии: lpile {
 roman D \[X\] = 
 roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 =
 67 - 8 sup 2  = 3 above
 roman D \[X\] = 
 roman M \[X sup 2 \] - ( roman M \[X\]) sup 2 =
 74\\\",\\\"4 - 8 sup 2 = 10\\\",\\\"4
}


КатегорияПрикладнаяМатематика | КатегорияТеорияВероятностей