Содержание
Метод наименьших квадратов
- ПО КРИТЕРИЮ НИКИТЕНКОВА ЭТО ПЛОХАЯ СТАТЬЯ ПО МАТЕМАТИКЕ!
- Статью под снос и переделку. То, что я здесь напитиримил, перенесу в longcheatsheet для тех, кому нужно очень глубоко копать именно в математических обоснованиях метода, причем преимущественно в области применения МНК для статистического оценивания. --АтрашкевичАндрей
Общие комментарии к статье:
- Статья пишется максимально подробно с той целью, чтобы человек, ни разу до этого не сталкивавшийся с МНК мог понять и его сущность, и то, как получаются оценки коэффициентов линейного полинома, аппроксимирующего данные. Входные требования: дифференциальное исчисление функций многих переменных, основы линейной алгебры (где-то в районе первых трех лекций стандартного университетского курса).
- Эту статью нужно читать с листочком и карандашом, повторяя действия (дифференцируя, проводя подстановки, рисуя, особенно рисуя). Это не Талмуд, тут заучивание не катит. Пишущий слушает (и читает) дважды.
- В статье нет фраз: «очевидно, что ...» и прочих благоглупостей. Любой пропуск в рассуждениях смерти подобен. А учебники, в которых много таких фраз должны отправляться в помойное ведро. Там им и место.
WoLongCheatSheet
У нас есть два набора данных, полученных экспериментально (результат повторяемого эксперимента или данные технологических измерений) или в результате статистического наблюдения (социологические или экономические данные). Мы предполагаем, что между этими данными существует линейная зависимость (т. е. они описываются линейной функцией). Необходимо найти такую линейную функцию (коэффициенты: свободного члена и тангенса угла наклона), которая бы наилучшим образом описывала эти данные. Для этого, подберем такие коэффициенты, которые бы минимизировали сумму квадратов отклонений реальных значений от оцененных.
Допустим у нас есть две выборки: и .
Ищем и в уравнении .
Отклонение в значении обозначим .
Будем минимизировать сумму квадратов отклонений:
Условие первого порядка:
Рассмотрим :
Рассмотрим :
Система в результате преобразований превращается в систему :
Обозначим: , , , и перепишем систему :
Выразим из значение :
и подставим его в :
Проведём обратную подстановку (потом вколотить сюда mark или что там):
В итоге получаем формулы для коэффициентов:
Обычно, далее в учебниках пишут что-то вроде: «Очевидно, что в числителе коэффициента стоит ковариация случайных величин и , а в знаменателе — дисперсия (вариация) ». Если дело происходит на лекции, то студенты уверенно кивают: им всё понятно, они не задают вопросов, они не говорят, что им ничего не ясно, и что вообще всё это выглядит как урок древнетибетского. Примерно 5-7% из прослушавших курс ТВМС может действительно сразу увидеть ковариацию и вариацию в числителе и знаменателе или увидеть после указания (кстати, сама эта форма записи ковариации тоже обычно сопровождается фразой, «очевидно, что ...»). Остальные просто продолжают поддерживать монологичную цитатно-догматическую традицию высшего образования, не понимая практически ничего.
Поэтому вывод формул в терминах вариаций-ковариаций будет сделан отдельно. И крайне подробно.
КатегорияПрикладнаяМатематика