Содержание
Метод наименьших квадратов
- ПО КРИТЕРИЮ НИКИТЕНКОВА ЭТО ПЛОХАЯ СТАТЬЯ ПО МАТЕМАТИКЕ!
- Статью под снос и переделку. То, что я здесь напитиримил, перенесу в longcheatsheet для тех, кому нужно очень глубоко копать именно в математических обоснованиях метода, причем преимущественно в области применения МНК для статистического оценивания. --АтрашкевичАндрей
Общие комментарии к статье:
- Статья пишется максимально подробно с той целью, чтобы человек, ни разу до этого не сталкивавшийся с МНК мог понять и его сущность, и то, как получаются оценки коэффициентов линейного полинома, аппроксимирующего данные. Входные требования: дифференциальное исчисление функций многих переменных, основы линейной алгебры (где-то в районе первых трех лекций стандартного университетского курса).
- Эту статью нужно читать с листочком и карандашом, повторяя действия (дифференцируя, проводя подстановки, рисуя, особенно рисуя). Это не Талмуд, тут заучивание не катит. Пишущий слушает (и читает) дважды.
- В статье нет фраз: «очевидно, что» и прочих благоглупостей. Любой пропуск в рассуждениях смерти подобен. А учебники, в которых много таких фраз должны отправляться в помойное ведро. Там им и место.
Типографские вопросы:
- перед знаком суммы size +3 или size +4?
- диактрический знак должен быть только над буквой, или над буквой с индексом? То есть так , или так ? И если второе, то как это сделать не таким уродливым?
- отбивается ли запятая пробелом при pile наборе (условие первого порядка в этой статье)?
- надо ли увеличивать размер внешних скобок, если есть внутренние?
- Это не работает (в отличии от )
- Я честнА-честнА переделаю статью так, чтобы формулы были красивыми и правильными. Пока набираю по наитию. Иначе, с моим-то уровнем типографской грамотности, работа просто встанет. --АтрашкевичАндрей
Далее идет не статья, а черновик longcheatsheet'а.
Оцениваем с помощью , здесь — знак оценки, поэтому и
Задача безусловной оптимизации — минимизация суммы квадратов отклонений (SSE: Sum of Square Errors):
Условие первого порядка:
Рассмотрим
Откуда:
Рассмотрим
Откуда:
В результате преобразований система может быть записана в виде системы :
Умножив оба уравнения в система на получим:
Заменим:
и перепишем систему в новых обозначениях:
Из первого уравнения этой системы можем выразить и подставить во второе:
Проверем обратную замену, умножив затем числитель и знаменатель на :
Финально можно получить формулы для коэффициентов:
- Далее обычно пишут: ну, совершенно очевидно, что в числителе стоит ковариация и , а в знаменателей стоит дисперсия . Студенты все умно кивают головой на лекции после этой фразы. Еще бы, действительно. Это ж просто очевидно. Как дважды два.
- Кому это очевидно? Тому, кто выучивает десять разных записей формул? Если человек занимается подобным выучиванием, то он не математик и не статистик, а питиримящий сорокинец. С наличием Гугла такое заучивание контрпродуктивно (до Гугла же были справочники по ТВМС).
- Потому что нет культуры диалога на лекции. Потому что страшно спросить у лектора, показавшись дураком (гораздо лучше ничего не спрашивать и дураком оставаться). Потому что привит цитатно-догматический метод образования. Ответственно заявляю: это ни разу не очевидно. Это вообще надо отдельно выводить причём совершенно особенным образом, проведя замену при дифференцировании по .
- И, кстати, после этой фразы я понял, что мне придется перенабирать всю статью, чтобы сделать этот переход возможным.
КатегорияПрикладнаяМатематика