Форма входа

Поиск

Календарь

«  Июнь 2017  »
ПнВтСрЧтПтСбВс
   1234
567891011
12131415161718
19202122232425
2627282930

Архив записей

Наш опрос

Оцените мой сайт
Всего ответов: 105

Статистика


Онлайн всего: 40
Гостей: 40
Пользователей: 0




Пятница, 15.11.2024, 08:48
Приветствую Вас Гость | RSS
Фондовый рынок
Главная | Регистрация | Вход
Блог


Главная » 2017 » Июнь » 3 » Метод равных площадей и метод наименьших квадратов.
16:02
Метод равных площадей и метод наименьших квадратов.

Нетрудно заметить, что практически каждый мой пост сопровождается графиком, с проведённым к этому графику трендом.

Столь частое применение какого-либо ресурса предполагает необходимость с ним (в нём), по возможности, подробнее разобраться, и более того, придумать что-нибудь аналогичное, простое и альтернативное.

Естественно, что я попытался это сделать.

Пока из этого получился «Метод равных площадей».

До него я догадался сам, но заслуга не велика, задачка, не выходит за рамки 7 класса средней школы.

Также, вполне естественно, что до этого додумались задолго до меня, и набор в поисковике «Метод равных площадей», даст ссылки на соответствующие страницы.

«Метод равных площадей» практически не упоминается в информационном пространстве, чего не скажешь про «метод наименьших квадратов».

Это явно несправедливо, и более того, аппроксимация данных с его помощью выглядит логичнее и адекватнее. Во всяком случае, при решении простых задач.

Осталось кратко описать, в чём суть, и в чём популярность одного, а не другого.

Вероятнее всего, победное шествие метода наименьших квадратов связано с использованием такой единицы измерения как среднеквадратическое отклонение.

С помощью данной единицы оценивают разброс значений, каких-либо данных или результатов измерений.

А раз в этом измеряют, то это и используют.

Почему это удобно и почему именно среднеквадратическое?

  1. Исчезают минусы. (-1)*(-1) = 1
  2. Появляется возможность использовать дифференциальное исчисление.
  3. Больший разброс значений даёт и большее среднеквадратическое отклонение. Тогда как при использовании других измерителей, в частных случаях, это не всегда так.

Т.о., удобно.

Но, всё же, удобство это явно не критерий истины.

Мало ли, что ещё нам удобно.

И не придётся ли за это удобство дорого заплатить?

Скорее да, чем нет.

Изложение «метода наименьших квадратов» лёгко найти в интернете на множестве ресурсов, и, наверное, нет смысла в 1001 раз его повторять.

Но всё же, я сделаю это, кратко или не очень.

Рис.1.

У нас есть опытные данные, допустим дивиденды. И нужно так провести между ними линию( например, прямую), чтобы она, по возможности, была максимально равноудалена от этих точек.

Т.к., уравнение прямой : y=ax+b, а значения точек (х,у), нам известны, то надо найти коэффициенты прямой, «а» и «b».

Рис.2.

Неизвестных два, значит, нужны и два уравнения. Иначе решение неоднозначно.

Соответственно дальше, ведётся поиск двух уравнений связывающих наши неизвестные.

Отклонение точек от прямой, обычно обзывают греческой буквой сигма, « σ».

Отклонение первой точки:

σ (1 )= y(1) – a x(1) - b

Отклонение второй точки:

σ (2 )= y(2) – a x(2) - b

и т.д.

Если не сильно забивать себе голову высокими материями, то первое уравнение очевидно, и следует из геометрических представлений.

Так как все сигмы распложены по разные стороны прямой, то часть из них отрицательная, а часть положительная, а равноудаленность точек предполагает, что сумма этих сигм должна быть равна нулю.

Итак, записываем:

Σσ (1…4 )= Σy(1…4) – a Σx(1…4) - b =0

Это уравнение получается немедленно, если вы предварительно не ангажированы методом наименьших квадратов (МНК).

Адепты же (МНК), приходят к этому уравнению, почёсывая правой пяткой левое ухо.

Что делают они.

Естественно, что сначала возводят сигму в квадрат.

У нас же среднеквадратическое отклонение.

σ (1 ) ^ 2 = (y(1) – a x(1) - b) ^ 2

σ (2 ) ^ 2 = (y(2) – a x(2) - b) ^ 2

и т.д.

Далее, точно также всё суммируют.

Σσ ^ 2 (1…4 )= (Σy(1…4) – a Σx(1…4) – b)^ 2

А затем, берут частные производные нашей сигмы по неизвестным а и b.

Я подозреваю, что не так много читающих, помнят, что это означает.

Попытаюсь подробнее.

Что значит частная производная?

Это нахождение зависимости, в данном случае нашей сигмы, не от неизвестной «х», а от неизвестной «а» или «b».

Т.о., у нас все другие изменения, кроме как изменения, допустим по «b», зафиксированы.

И смотрим, как «σ» изменяется от «b».

Рис.3.

Для чего это делается?

А чтобы приравнять нашу производную нулю.

Это стандартный прием с использованием дифференциального исчисления, поиск минимумов и максимумов.

Там где производная (или изменение) равна нулю, там и функция не изменяется,

это может быть: минимум, максимум или перегиб.

Следовательно, взяв от нашей суммы среднеквадратичных сигм частные производные и приравняв их нулю, мы и получим те два уравнения, из которых можно найти «а» и «b».

 

Дальше алгебра и правила дифференцирования.

У нас сложная функция. Во-первых, сама «сигма» это функция, во-вторых, она в квадрате.

Скорее всего, мало кто помнит, как дифференцируются сложные функции, поэтому сделаю это подробно, используя инвариантность дифференциала.

Сначала дифференцируем квадрат сигмы по самой сигме.

d (σ ^ 2) /dσ = 2σ ( Также как и , d (х^ 2)/ dх = 2х, так всем привычнее),

=> d (σ ^ 2) = 2σ* dσ

Далее дифференцируем σ по b, => dσ /db = -1

(σ= y – a x- b, в данном случае, «b» у нас неизвестная. Коэффициент перед b равен (-1).

Он и есть производная по b)

Итак, переписываем. => dσ = -1* db

Подставляем в предыдущую формулу:

d (σ ^ 2) = 2σ*( -1)* db

=> d (σ ^ 2) = -2σ* db

=> d (σ ^ 2)/ db = -2σ

Т.о., производную по «b» мы нашли. Осталось приравнять её нулю.

-2σ =0.

«-2» улетает, 0/(-2)=0

И мы получаем результат: σ = y– a x- b = 0

Это точно такое же уравнение, которое я сразу записал исходя из элементарных геометрических соображений в самом начале. Знаки суммы Σ, для простоты изложения я опустил.

Σσ (1…4 )= Σy(1…4) – a Σx(1…4) - b =0

Т.о., ученик 7 класса, не имея понятия о производных, исходя из здравого смысла и геометрических представлений, решил бы эту задачу в одну строчку.

А адепт МНК, половину дня пачкал бы бумагу и мозги, почёсывая правой пяткой левое ухо.

«Многие знания — многие печали».

Теперь нам нужно второе уравнение, связывающее «а» и «b».

И здесь пути методов МНК и равных площадей расходятся.

Сначала, я вновь погружусь в транс, войдя в состояние ученика 7кл.ср. школы, и напишу второе, простое и логичное уравнение, составляющее метод равных площадей.

Снова смотрим на рис.1.

Наши точки на графике соединены отрезками, и в совокупности, мы имеем ломаную линию.

Также как сумма всех сигм расположенных по разные стороны прямой должна быть равна нулю, так и площади, заключённые между нашими отрезками, вокруг прямой, при равноудалённости, должны быть равны нулю.

Выражаю это равенство алгебраически.

Sломаной(1…4 )= Sпрямой(1…4 ), или

Sломаной(1…4 ) - Sпрямой(1…4 ) = 0

Осталось вывести формулу площади под ломаной линией и формулу площади под прямой, которую связать с «а» и «b», и задача будет решена.

Это задачи 6-7кл.ср.школы.

Sломаной. Имеем точки: А В С Д Е.

Площадь под ними: (А+В)/2+( В + С)/2+( С + Д)/2+( Д + Е)/2= (А+Е)/2 +В+С+Д

Sпрямой. Имеем точки: у1, у4.

у1=а*х1 +в

у4=а*х4 +в

Sпрямой = (у4+у1)/2 * (х4-х1) => (а*х4 +в + а*х1 +в)/2* (х4-х1) =>

=> а/2(х4+х1)*(х4-х1) + в *(х4-х1)

Это всё.

Все значения, кроме «а» и «b», известны.

Осталось записать два уравнения с двумя неизвестными и примитивно решить их методом подстановки.

Итак, метод равных площадей. Два уравнения, (в нашем случае с прямой).

Σσ (1…4 )= Σy(1…4) – a Σx(1…4) - b =0

∫ σ (1…4 )= ((у1+у4)/2+у2+у3) - а/2(х4+х1)*(х4-х1) - в *(х4-х1)

Если же записать это для любого случая, в общем виде, то второе уравнение:

∫ σ (1…4 )dx= ∫ y(1…4) dx – a∫ x(1…4) dx - b∫ dx =0

 

Теперь выходим из семиклассного транса и возвращаемся к МНК.

Второе уравнение здесь ищут дифференцированием квадрата нашей сигмы по «а».

Сначала, то же самое, что и по «b»

d (σ ^ 2) /dσ = 2σ ( Также как и , d (х^ 2)/ dх = 2х, так всем привычнее),

=> d (σ ^ 2) = 2σ* dσ

Далее дифференцируем σ по а, => dσ /dа = -х

(σ= y – a x- b, в данном случае, «а» у нас неизвестная. Коэффициент перед «а» равен (-х).

Он и есть производная по «а»)

Итак, переписываем. => dσ = -х* dа

Подставляем в предыдущую формулу:

d (σ ^ 2) = 2σ*( -х)* dа

=> d (σ ^ 2) = -2σх* dа

=> d (σ ^ 2)/ dа = -2σх

Т.о., производную по «а» мы нашли. Осталось приравнять её нулю.

-2σх =0.

«-2» улетает, 0/(-2)=0

И мы получаем результат: σх = (y– a x- b)х = 0

Записываем это в общем виде, вспоминая, про Σ.

Σyх(1…4)- аΣх^2(1…4)- b Σх(1…4)=0

Это второе уравнение МНК, совсем не соответствует тому, что мы получили методом равных площадей.

∫ y(1…4) dx – a∫ x(1…4) dx - b∫ dx =0

И, понятно, что результаты по этим методам разойдутся.

В чью пользу мне пока сказать трудно.

Равенство площадей, на мой взгляд, логичнее.

Далее необходим эксперимент с реальными данными.

Так как все, затаив дыхание следят за кульбитами Газпрома, то его дивидендную историю и выберем в качестве подопытного кролика.

Эту историю я трансформировал в Zю-модель.

Рис.4.

Провёл к ней тренд и получил в exel формулу. Всё на графике.

Далее, посчитал то же самое по методу равных площадей. Нашёл формулу и нанёс на график.

Рис.5.

Разница существенная, и видимо, это «погрешность» наименьших квадратов.

Прошу любить и жаловать метод. Считается элементарно и идеально, вручную.

Осталось посмотреть, как разойдётся стоимость Газпрома, в одном случае и в другом.

Рис.6.

 

 

Дивы,начисл.Z.-модель,Р/а

Равные площади,р/а

МНК,р/а

1

0,3

г0

0,421358

-0,4894

2

0,44

г1

0,827215

0,0061

3

0,4

г2

1,233072

0,5016

4

0,69

г3

1,638929

0,9971

5

1,19

г4

2,044786

1,4926

6

1,5

г5

2,450643

1,9881

7

2,54

г6

2,8565

2,4836

8

2,66

г7

3,262357

2,9791

9

0,36

г8

3,668214

3,4746

10

2,39

г9

4,074071

3,9701

11

3,85

г10

4,479928

4,4656

12

8,97

г11

4,885785

4,9611

13

5,99

г12

5,291642

5,4566

14

7,2

г13

5,697499

5,9521

15

7,2

г14

6,103356

6,4476

16

7,89

г15

6,509213

6,9431

17

8,0397

г16

6,91507

7,4386

18

8,0397

г17

7,320927

7,9341

19

8,0397

г18

7,726784

8,4296

20

8,0397

г19

8,132641

8,9251

21

8,0397

г20

8,538498

9,4206

22

 

г21

8,944355

9,9161

23

 

г22

9,350212

10,4116

24

 

г23

9,756069

10,9071

25

 

г24

10,16193

11,4026

26

 

г25

10,56778

11,8981

27

 

г26

10,97364

12,3936

28

 

г27

11,3795

12,8891

 

 

 

 

 

 

 

 

109,7674

121,9662

 

МНК =122р/а.

Метод равных площадей = 110р/а.

Замечу, что разница, видимо, это цена среднеквадратических удобств.

Такие дела.

Просмотров: 793 | Добавил: Воронноров | Рейтинг: 5.0/4
Всего комментариев: 2
1 olegm2006  
Зато в случае с МНК можно брать квадраты относительных отклонений. На рынке, где валюты постоянно обесцениваются, а активы растут, это может быть удобно. С площадями пришлось бы как-то нормализовать исходные данные.

2 Воронноров  
0
Да, в экономике, конечно, господствуют относительные цифры, предполагающие точку отсчёта в виде единицы.
К нулю их не приравняешь.

Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]

Copyright MyCorp © 2024