Нетрудно заметить, что практически каждый мой пост сопровождается графиком, с проведённым к этому графику трендом.
Столь частое применение какого-либо ресурса предполагает необходимость с ним (в нём), по возможности, подробнее разобраться, и более того, придумать что-нибудь аналогичное, простое и альтернативное.
Естественно, что я попытался это сделать.
Пока из этого получился «Метод равных площадей».
До него я догадался сам, но заслуга не велика, задачка, не выходит за рамки 7 класса средней школы.
Также, вполне естественно, что до этого додумались задолго до меня, и набор в поисковике «Метод равных площадей», даст ссылки на соответствующие страницы.
«Метод равных площадей» практически не упоминается в информационном пространстве, чего не скажешь про «метод наименьших квадратов».
Это явно несправедливо, и более того, аппроксимация данных с его помощью выглядит логичнее и адекватнее. Во всяком случае, при решении простых задач.
Осталось кратко описать, в чём суть, и в чём популярность одного, а не другого.
Вероятнее всего, победное шествие метода наименьших квадратов связано с использованием такой единицы измерения как среднеквадратическое отклонение.
С помощью данной единицы оценивают разброс значений, каких-либо данных или результатов измерений.
А раз в этом измеряют, то это и используют.
Почему это удобно и почему именно среднеквадратическое?
- Исчезают минусы. (-1)*(-1) = 1
- Появляется возможность использовать дифференциальное исчисление.
- Больший разброс значений даёт и большее среднеквадратическое отклонение. Тогда как при использовании других измерителей, в частных случаях, это не всегда так.
Т.о., удобно.
Но, всё же, удобство это явно не критерий истины.
Мало ли, что ещё нам удобно.
И не придётся ли за это удобство дорого заплатить?
Скорее да, чем нет.
Изложение «метода наименьших квадратов» лёгко найти в интернете на множестве ресурсов, и, наверное, нет смысла в 1001 раз его повторять.
Но всё же, я сделаю это, кратко или не очень.
Рис.1.
У нас есть опытные данные, допустим дивиденды. И нужно так провести между ними линию( например, прямую), чтобы она, по возможности, была максимально равноудалена от этих точек.
Т.к., уравнение прямой : y=ax+b, а значения точек (х,у), нам известны, то надо найти коэффициенты прямой, «а» и «b».
Рис.2.
Неизвестных два, значит, нужны и два уравнения. Иначе решение неоднозначно.
Соответственно дальше, ведётся поиск двух уравнений связывающих наши неизвестные.
Отклонение точек от прямой, обычно обзывают греческой буквой сигма, « σ».
Отклонение первой точки:
σ (1 )= y(1) – a x(1) - b
Отклонение второй точки:
σ (2 )= y(2) – a x(2) - b
и т.д.
Если не сильно забивать себе голову высокими материями, то первое уравнение очевидно, и следует из геометрических представлений.
Так как все сигмы распложены по разные стороны прямой, то часть из них отрицательная, а часть положительная, а равноудаленность точек предполагает, что сумма этих сигм должна быть равна нулю.
Итак, записываем:
Σσ (1…4 )= Σy(1…4) – a Σx(1…4) - b =0
Это уравнение получается немедленно, если вы предварительно не ангажированы методом наименьших квадратов (МНК).
Адепты же (МНК), приходят к этому уравнению, почёсывая правой пяткой левое ухо.
Что делают они.
Естественно, что сначала возводят сигму в квадрат.
У нас же среднеквадратическое отклонение.
σ (1 ) ^ 2 = (y(1) – a x(1) - b) ^ 2
σ (2 ) ^ 2 = (y(2) – a x(2) - b) ^ 2
и т.д.
Далее, точно также всё суммируют.
Σσ ^ 2 (1…4 )= (Σy(1…4) – a Σx(1…4) – b)^ 2
А затем, берут частные производные нашей сигмы по неизвестным а и b.
Я подозреваю, что не так много читающих, помнят, что это означает.
Попытаюсь подробнее.
Что значит частная производная?
Это нахождение зависимости, в данном случае нашей сигмы, не от неизвестной «х», а от неизвестной «а» или «b».
Т.о., у нас все другие изменения, кроме как изменения, допустим по «b», зафиксированы.
И смотрим, как «σ» изменяется от «b».
Рис.3.
Для чего это делается?
А чтобы приравнять нашу производную нулю.
Это стандартный прием с использованием дифференциального исчисления, поиск минимумов и максимумов.
Там где производная (или изменение) равна нулю, там и функция не изменяется,
это может быть: минимум, максимум или перегиб.
Следовательно, взяв от нашей суммы среднеквадратичных сигм частные производные и приравняв их нулю, мы и получим те два уравнения, из которых можно найти «а» и «b».
Дальше алгебра и правила дифференцирования.
У нас сложная функция. Во-первых, сама «сигма» это функция, во-вторых, она в квадрате.
Скорее всего, мало кто помнит, как дифференцируются сложные функции, поэтому сделаю это подробно, используя инвариантность дифференциала.
Сначала дифференцируем квадрат сигмы по самой сигме.
d (σ ^ 2) /dσ = 2σ ( Также как и , d (х^ 2)/ dх = 2х, так всем привычнее),
=> d (σ ^ 2) = 2σ* dσ
Далее дифференцируем σ по b, => dσ /db = -1
(σ= y – a x- b, в данном случае, «b» у нас неизвестная. Коэффициент перед b равен (-1).
Он и есть производная по b)
Итак, переписываем. => dσ = -1* db
Подставляем в предыдущую формулу:
d (σ ^ 2) = 2σ*( -1)* db
=> d (σ ^ 2) = -2σ* db
=> d (σ ^ 2)/ db = -2σ
Т.о., производную по «b» мы нашли. Осталось приравнять её нулю.
-2σ =0.
«-2» улетает, 0/(-2)=0
И мы получаем результат: σ = y– a x- b = 0
Это точно такое же уравнение, которое я сразу записал исходя из элементарных геометрических соображений в самом начале. Знаки суммы Σ, для простоты изложения я опустил.
Σσ (1…4 )= Σy(1…4) – a Σx(1…4) - b =0
Т.о., ученик 7 класса, не имея понятия о производных, исходя из здравого смысла и геометрических представлений, решил бы эту задачу в одну строчку.
А адепт МНК, половину дня пачкал бы бумагу и мозги, почёсывая правой пяткой левое ухо.
«Многие знания — многие печали».
Теперь нам нужно второе уравнение, связывающее «а» и «b».
И здесь пути методов МНК и равных площадей расходятся.
Сначала, я вновь погружусь в транс, войдя в состояние ученика 7кл.ср. школы, и напишу второе, простое и логичное уравнение, составляющее метод равных площадей.
Снова смотрим на рис.1.
Наши точки на графике соединены отрезками, и в совокупности, мы имеем ломаную линию.
Также как сумма всех сигм расположенных по разные стороны прямой должна быть равна нулю, так и площади, заключённые между нашими отрезками, вокруг прямой, при равноудалённости, должны быть равны нулю.
Выражаю это равенство алгебраически.
Sломаной(1…4 )= Sпрямой(1…4 ), или
Sломаной(1…4 ) - Sпрямой(1…4 ) = 0
Осталось вывести формулу площади под ломаной линией и формулу площади под прямой, которую связать с «а» и «b», и задача будет решена.
Это задачи 6-7кл.ср.школы.
Sломаной. Имеем точки: А В С Д Е.
Площадь под ними: (А+В)/2+( В + С)/2+( С + Д)/2+( Д + Е)/2= (А+Е)/2 +В+С+Д
Sпрямой. Имеем точки: у1, у4.
у1=а*х1 +в
у4=а*х4 +в
Sпрямой = (у4+у1)/2 * (х4-х1) => (а*х4 +в + а*х1 +в)/2* (х4-х1) =>
=> а/2(х4+х1)*(х4-х1) + в *(х4-х1)
Это всё.
Все значения, кроме «а» и «b», известны.
Осталось записать два уравнения с двумя неизвестными и примитивно решить их методом подстановки.
Итак, метод равных площадей. Два уравнения, (в нашем случае с прямой).
Σσ (1…4 )= Σy(1…4) – a Σx(1…4) - b =0
∫ σ (1…4 )= ((у1+у4)/2+у2+у3) - а/2(х4+х1)*(х4-х1) - в *(х4-х1)
Если же записать это для любого случая, в общем виде, то второе уравнение:
∫ σ (1…4 )dx= ∫ y(1…4) dx – a∫ x(1…4) dx - b∫ dx =0
Теперь выходим из семиклассного транса и возвращаемся к МНК.
Второе уравнение здесь ищут дифференцированием квадрата нашей сигмы по «а».
Сначала, то же самое, что и по «b»
d (σ ^ 2) /dσ = 2σ ( Также как и , d (х^ 2)/ dх = 2х, так всем привычнее),
=> d (σ ^ 2) = 2σ* dσ
Далее дифференцируем σ по а, => dσ /dа = -х
(σ= y – a x- b, в данном случае, «а» у нас неизвестная. Коэффициент перед «а» равен (-х).
Он и есть производная по «а»)
Итак, переписываем. => dσ = -х* dа
Подставляем в предыдущую формулу:
d (σ ^ 2) = 2σ*( -х)* dа
=> d (σ ^ 2) = -2σх* dа
=> d (σ ^ 2)/ dа = -2σх
Т.о., производную по «а» мы нашли. Осталось приравнять её нулю.
-2σх =0.
«-2» улетает, 0/(-2)=0
И мы получаем результат: σх = (y– a x- b)х = 0
Записываем это в общем виде, вспоминая, про Σ.
Σyх(1…4)- аΣх^2(1…4)- b Σх(1…4)=0
Это второе уравнение МНК, совсем не соответствует тому, что мы получили методом равных площадей.
∫ y(1…4) dx – a∫ x(1…4) dx - b∫ dx =0
И, понятно, что результаты по этим методам разойдутся.
В чью пользу мне пока сказать трудно.
Равенство площадей, на мой взгляд, логичнее.
Далее необходим эксперимент с реальными данными.
Так как все, затаив дыхание следят за кульбитами Газпрома, то его дивидендную историю и выберем в качестве подопытного кролика.
Эту историю я трансформировал в Zю-модель.
Рис.4.
Провёл к ней тренд и получил в exel формулу. Всё на графике.
Далее, посчитал то же самое по методу равных площадей. Нашёл формулу и нанёс на график.
Рис.5.
Разница существенная, и видимо, это «погрешность» наименьших квадратов.
Прошу любить и жаловать метод. Считается элементарно и идеально, вручную.
Осталось посмотреть, как разойдётся стоимость Газпрома, в одном случае и в другом.
Рис.6.
|
Дивы,начисл.Z.-модель,Р/а
|
Равные площади,р/а
|
МНК,р/а
|
1
|
0,3
|
г0
|
0,421358
|
-0,4894
|
2
|
0,44
|
г1
|
0,827215
|
0,0061
|
3
|
0,4
|
г2
|
1,233072
|
0,5016
|
4
|
0,69
|
г3
|
1,638929
|
0,9971
|
5
|
1,19
|
г4
|
2,044786
|
1,4926
|
6
|
1,5
|
г5
|
2,450643
|
1,9881
|
7
|
2,54
|
г6
|
2,8565
|
2,4836
|
8
|
2,66
|
г7
|
3,262357
|
2,9791
|
9
|
0,36
|
г8
|
3,668214
|
3,4746
|
10
|
2,39
|
г9
|
4,074071
|
3,9701
|
11
|
3,85
|
г10
|
4,479928
|
4,4656
|
12
|
8,97
|
г11
|
4,885785
|
4,9611
|
13
|
5,99
|
г12
|
5,291642
|
5,4566
|
14
|
7,2
|
г13
|
5,697499
|
5,9521
|
15
|
7,2
|
г14
|
6,103356
|
6,4476
|
16
|
7,89
|
г15
|
6,509213
|
6,9431
|
17
|
8,0397
|
г16
|
6,91507
|
7,4386
|
18
|
8,0397
|
г17
|
7,320927
|
7,9341
|
19
|
8,0397
|
г18
|
7,726784
|
8,4296
|
20
|
8,0397
|
г19
|
8,132641
|
8,9251
|
21
|
8,0397
|
г20
|
8,538498
|
9,4206
|
22
|
|
г21
|
8,944355
|
9,9161
|
23
|
|
г22
|
9,350212
|
10,4116
|
24
|
|
г23
|
9,756069
|
10,9071
|
25
|
|
г24
|
10,16193
|
11,4026
|
26
|
|
г25
|
10,56778
|
11,8981
|
27
|
|
г26
|
10,97364
|
12,3936
|
28
|
|
г27
|
11,3795
|
12,8891
|
|
|
|
|
|
|
|
|
109,7674
|
121,9662
|
МНК =122р/а.
Метод равных площадей = 110р/а.
Замечу, что разница, видимо, это цена среднеквадратических удобств.
Такие дела.
|