МетодНаименьшихКвадратов

Это старая версия (1.484) МетодНаименьшихКвадратов.

Содержание

ПО КРИТЕРИЮ НИКИТЕНКОВА ЭТО ПЛОХАЯ СТАТЬЯ ПО МАТЕМАТИКЕ!

Статью под снос и переделку. То, что я здесь напитиримил, перенесу в longcheatsheet для тех, кому нужно очень глубоко копать именно в математических обоснованиях метода, причем преимущественно в области применения МНК для статистического оценивания. --АтрашкевичАндрей

Общие комментарии к статье:

Статья пишется максимально подробно с той целью, чтобы человек, ни разу до этого не сталкивавшийся с МНК мог понять и его сущность, и то, как получаются оценки коэффициентов линейного полинома, аппроксимирующего данные. Входные требования: дифференциальное исчисление функций многих переменных, основы линейной алгебры (где-то в районе первых трех лекций стандартного университетского курса).
Эту статью нужно читать с листочком и карандашом, повторяя действия (дифференцируя, проводя подстановки, рисуя, особенно рисуя). Это не Талмуд, тут заучивание не катит. Пишущий слушает (и читает) дважды.
В статье нет фраз: «очевидно, что ...» и прочих благоглупостей. Любой пропуск в рассуждениях смерти подобен. А учебники, в которых много таких фраз должны отправляться в помойное ведро. Там им и место.

WoLongCheatSheet

Задача: У нас есть два набора данных

Допусти у нас есть две выборки: X = ( x sub 1 , x sub 2 , ..., x sub i , ..., x sub n ) и Y = ( y sub 1 , y sub 2 , ..., y sub i , ..., y sub n )

Оцениваем y sub i = beta sub 0 + beta sub 1 x sub i + epsilon sub i с помощью y hat sub i = b sub 0 + b sub 1 x sub i , где size +3 nothing hat — знак оценки, поэтому: b sub 0 = beta hat sub 0 и b sub 1 = beta hat sub 1 .

Отклонение в значении обозначим e = (y sub i - y hat sub i)

Будем минимизировать сумму квадратов отклонений: SSE
=
size +3 sum from i=1 to n e sub i sup 2
=
size +3 sum from i=1 to n (y sub i - y hat sub i ) sup 2
=
size +3 sum from i=1 to n (y sub i - (b sub 0 + b sub 1 x sub i )) sup 2
=
size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) sup 2 -> min from {b sub 0 , ~ b sub 1}

Условие первого порядка: $\[1\] ~~ left { lpile { \[1.1\] ~ {partial SSE} over {partial b sub 0} = {partial size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) sup 2} over {partial b sub 0} = {-2} size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) = 0 above \[1.2\] ~ {partial SSE} over {partial b sub 1} = {partial size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) sup 2} over {partial b sub 1} = {-2} size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) x sub i = 0 } right nothing$

Рассмотрим $1.1$ :

Рассмотрим $1.2$ :

Система $1$ в результате преобразований превращается в систему $2$ : $\[2\] ~~ left { lpile { \[2.1\] ~ b sub 0 + b sub 1 {size +3 sum from i=1 to n x sub i} over n = {size +3 sum from i=1 to n y sub i} over n above \[2.2\] ~ b sub 0 {size +3 sum from i=1 to n x sub i} over n + b sub 1 {size +3 sum from i=1 to n x sub i sup 2} over n = {size +3 sum from i=1 to n x sub i y sub i} over n } right nothing$

Обозначим: x bar = {size +3 sum from i=1 to n x sub i} over n , y bar = {size +3 sum from i=1 to n y sub i} over n , {x sup 2} bar = {size +3 sum from i=1 to n x sub i sup 2} over n , xy bar = {size +3 sum from i=1 to n x sub i y sub i} over n и перепишем систему $2$ : $\[3\] ~~ left { lpile { \[3.1\] ~ b sub 0 + b sub 1 x bar = y bar above \[3.2\] ~ b sub 0 x bar + b sub 1 {x sup 2} bar = xy bar } right nothing$

Выразим из $3.1$ значение b sub 0 : b sub 0
=
y bar - b sub 1 x bar

и подставим его в $3.2$ : lpile {
( y bar - b sub 1 x bar ) x bar + b sub 1 {x sup 2} bar
=
xy bar
above
x bar y bar - b sub 1 x bar sup 2 + b sub 1 {x sup 2} bar
=
xy bar
above
b sub 1 ({x sup 2} bar - x bar sup 2 )
=
xy bar - x bar y bar
above
b sub 1
=
{xy bar - x bar y bar}
over
{{x sup 2} bar - x bar sup 2}
}

Проведём обратную подстановку (потом вколотить сюда mark или что там):

В итоге получаем формулы для коэффициентов:

Обычно, далее в учебниках пишут что-то вроде: «Очевидно, что в числителе коэффициента b sub 1 стоит ковариация случайных величин и , а в знаменателе — дисперсия (вариация) ». Если дело происходит на лекции, то студенты уверенно кивают: им всё понятно, они не задают вопросов, они не говорят, что им ничего не ясно, и что вообще всё это выглядит как урок древнетибетского. Примерно 5-7% из прослушавших курс ТВМС может действительно сразу увидеть ковариацию и вариацию в числителе и знаменателе или увидеть после указания (кстати, сама эта форма записи ковариации тоже обычно сопровождается фразой, «очевидно, что ...»). Остальные просто продолжают поддерживать монологичную цитатно-догматическую традицию высшего образования, не понимая практически ничего.

Поэтому вывод формул в терминах вариаций-ковариаций будет сделан отдельно. И крайне подробно.

КатегорияПрикладнаяМатематика

Поиск Wiki

Пользовательские действия

Содержание

Метод наименьших квадратов