МетодНаименьшихКвадратов

Это старая версия (1.396) МетодНаименьшихКвадратов.

Содержание

ПО КРИТЕРИЮ НИКИТЕНКОВА ЭТО ПЛОХАЯ СТАТЬЯ ПО МАТЕМАТИКЕ!

Статью под снос и переделку. То, что я здесь напитиримил, перенесу в longcheatsheet для тех, кому нужно очень глубоко копать именно в математических обоснованиях метода, причем преимущественно в области применения МНК для статистического оценивания. --АтрашкевичАндрей

Общие комментарии к статье:

Статья пишется максимально подробно с той целью, чтобы человек, ни разу до этого не сталкивавшийся с МНК мог понять и его сущность, и то, как получаются оценки коэффициентов линейного полинома, аппроксимирующего данные. Входные требования: дифференциальное исчисление функций многих переменных, основы линейной алгебры (где-то в районе первых трех лекций стандартного университетского курса).
Эту статью нужно читать с листочком и карандашом, повторяя действия (дифференцируя, проводя подстановки, рисуя, особенно рисуя). Это не Талмуд, тут заучивание не катит. Пишущий слушает (и читает) дважды.
В статье нет фраз: «очевидно, что» и прочих благоглупостей. Любой пропуск в рассуждениях смерти подобен. А учебники, в которых много таких фраз должны отправляться в помойное ведро. Там им и место.

Типографские вопросы:

перед знаком суммы size +3 или size +4?
диактрический знак должен быть только над буквой, или над буквой с индексом? То есть так , или так $b sub 0 = {beta sub 0} accent size +3 \\\"^\\\"$ ? И если второе, то как это сделать не таким уродливым?
отбивается ли запятая пробелом при pile наборе (условие первого порядка в этой статье)?
надо ли увеличивать размер внешних скобок, если есть внутренние?
Это не работает (в отличии от )

Я честнА-честнА переделаю статью так, чтобы формулы были красивыми и правильными. Пока набираю по наитию. Иначе, с моим-то уровнем типографской грамотности, работа просто встанет. --АтрашкевичАндрей

Далее идет не статья, а черновик longcheatsheet'а.

Оцениваем y sub i = beta sub 0 + beta sub 1 x sub i + epsilon sub i с помощью y hat sub i = b sub 0 + b sub 1 x sub i , здесь size +3 nothing hat — знак оценки, поэтому b sub 0 = beta hat sub 0 и b sub 1 = beta hat sub 1 .

Задача безусловной оптимизации — минимизация суммы квадратов отклонений (SSE: Sum of Square Errors): SSE =
size +3 sum from i=1 to n e sub i sup 2 =
size +3 sum from i=1 to n (y sub i - y hat sub i ) sup 2 =
size +3 sum from i=1 to n (y sub i - (b sub 0 + b sub 1 x sub i )) sup 2 =
size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) sup 2 -> min from {b sub 0 , ~ b sub 1 suchthat R}

Условие первого порядка: $\[1\] ~~ left { lpile { \[1.1\]: ~ {partial SSE} over {partial b sub 0} ~ = ~ 0 above \[1.2\]: ~ {partial SSE} over {partial b sub 1} ~ = ~ 0 } right nothing$

Рассмотрим $\[1.1\]: ~ {partial SSE} over {partial b sub 0} = 0$

Откуда: $lpile { size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) = size +3 sum from i=1 to n y sub i - size +3 sum from i=1 to n b sub 0 - size +3 sum from i=1 to n b sub 1 x sub i = size +3 sum from i=1 to n y sub i - n b sub 0 - b sub 1 size +3 sum from i=1 to n x sub i = 0 ~, above n b sub 0 + b sub 1 size +3 sum from i=1 to n x sub i = size +3 sum from i=1 to n y sub i ~ \[2.1\] }$

Рассмотрим $\[1.2\]: ~ {partial SSE} over {partial b sub 1} = 0$

Откуда: $lpile { size +3 sum from i=1 to n (y sub i - b sub 0 - b sub 1 x sub i ) x sub i = size +3 sum from i=1 to n (x sub i y sub i - b sub 0 x sub i - b sub 1 x sub i sup 2 ) = size +3 sum from i=1 to n x sub i y sub i - b sub 0 size +3 sum from i=1 to n x sub i - b sub 1 size +3 sum from i=1 to n x sub i sup 2 = 0 ~, above b sub 0 size +3 sum from i=1 to n x sub i + b sub 1 size +3 sum from i=1 to n x sub i sup 2 = size +3 sum from i=1 to n x sub i y sub i ~ \[2.2\] }$

В результате преобразований система $1$ может быть записана в виде системы $2$ : $\[2\] ~~ left { lpile { \[2.1\]: ~ n b sub 0 + b sub 1 size +3 sum from i=1 to n x sub i = size +3 sum from i=1 to n y sub i ~, above \[2.2\]: ~ b sub 0 size +3 sum from i=1 to n x sub i + b sub 1 size +3 sum from i=1 to n x sub i sup 2 = size +3 sum from i=1 to n x sub i y sub i } right nothing$

Умножив оба уравнения в система $2$ на ~ size -2 1 over size -2 n ~ получим: $\[3\] ~~ left { lpile { \[3.1\]: ~ b sub 0 + b sub 1 {size +3 sum from i=1 to n x sub i} over n = {size +3 sum from i=1 to n y sub i} over n ~, above \[3.2\]: ~ b sub 0 {size +3 sum from i=1 to n x sub i} over n + b sub 1 {size +3 sum from i=1 to n x sub i sup 2} over n = {size +3 sum from i=1 to n x sub i y sub i} over n } right nothing$

Заменим: x bar = {size +3 sum from i=1 to n x sub i} over n , ~ y bar = {size +3 sum from i=1 to n y sub i} over n , ~ {x sup 2} bar = {size +3 sum from i=1 to n x sub i sup 2} over n , ~ xy bar = {size +3 sum from i=1 to n x sub i y sub i} over n

и перепишем систему $3$ в новых обозначениях: left {
lpile {
b sub 0 + b sub 1 x bar = y bar
above
b sub 0 x bar + b sub 1 {x sup size -2 2} bar = xy bar
}
right nothing

Из первого уравнения этой системы можем выразить b sub 0 = y bar - b sub 1 x bar и подставить во второе: lpile {
( y bar - b sub 1 x bar ) x bar + b sub 1 {x sup size -2 2} bar = xy bar ~,
above
y bar x bar - b sub 1 {x bar} sup size -2 2 + b sub 1 {x sup size -2 2} bar = xy bar ~,
above
b sub 1 ({x sup size -2 2} bar - {x bar} sup size -2 2 ) = xy bar - y bar x bar ~,
above
b sub 1 = {xy bar - y bar x bar} over {{x sup size -2 2} bar - {x bar} sup size -2 2}
}

Проверем обратную замену, умножив затем числитель и знаменатель на n sup 2 :

Финально можно получить формулы для коэффициентов: lpile {
b sub 0 = {size +3 sum from i=1 to n y sub i} over n - b sub 1 {size +3 sum from i=1 to n x sub i} over n ~,
above
b sub 1 = {n size +3 sum from i=1 to n x sub i y sub i - size +3 sum from i=1 to n y sub i size +3 sum from i=1 to n x sub i} over { n size +3 sum from i=1 to n x sub i sup 2 - left ( size +3 sum from i=1 to n x sub i right ) sup 2}
}

Далее обычно пишут: ну, совершенно очевидно, что в числителе стоит ковариация и , а в знаменателей стоит дисперсия . Кому это очевидно? Тому, кто выучивает десять разных записей формул? Студенты все умно кивают головой на лекции после этой фразы. Еще бы, действительно. Это ж просто очевидно. как дважды два. Ответственно заявляю: это ни разу не очевидно. Это вообще надо отдельно выводить.

КатегорияПрикладнаяМатематика

Поиск Wiki

Пользовательские действия

Содержание

Метод наименьших квадратов