Контрольная работа - Модель парной нелинейной регрессии(параболической, логарифмической) - файл n1.docx

Контрольная работа - Модель парной нелинейной регрессии(параболической, логарифмической)
скачать (103.2 kb.)
Доступные файлы (1):
n1.docx104kb.20.11.2012 01:44скачать

n1.docx

КОНТРОЛЬНАЯ РАБОТА №3.


ВАРИАНТ 5.

СОДЕРЖАНИЕ КОНТРОЛЬНОЙ РАБОТЫ


Задание 1.

Исследуется зависимость динамики фондового индекса США (, % за месяц) от российского биржевого индекса (,% за месяц) по данным за последние 15 месяцев (- порядковый номер месяца). Статистические данные приведены в таблице.

Требуется:

  1. Построить диаграмму рассеяния и нанести прямую регрессии. Убедиться, что между исследуемыми финансовыми показателями существует нелинейная взаимосвязь.

  2. Считая, что регрессия по представляется многочленом второй степени, найти оценки коэффициентов параболической регрессии и составить соответствующее уравнение.

  3. Построить кривую регрессии и нанести ее на диаграмму рассеяния.



1

2

3

4

5

6

7

8

9

10

11

12

13

14

15



12

13

14

16

17

18

6

7

8

8

9

10

10

10

11



9

7

6

5

5

6

12

14

11

10

9

9

8

7

8


Решение:

Задание 1.

Построим диаграмму рассеяния и нанесем прямую регрессии
Убедимся, что между исследуемыми финансовыми показателями существует нелинейная взаимосвязь.

1 Прямолинейная зависимость

Уравнение прямой y = a+bx, таким образом, используя метод наименьших квадратов, минимизируем функцию . Для нахождения коэффициентов a и b, продифференцируем по каждому параметру a и b приравняем, 0 и получим систему уравнений.


Для вычисления параметров a и b прямой заполняем расчетную таблицу:




х

у

Х*у

Х*х

У*у

1

12

9

108

144

81

2

13

7

91

169

49

3

14

6

84

196

36

4

16

5

80

256

25

5

17

5

85

289

25

6

18

6

108

324

36

7

6

12

72

36

144

8

7

14

98

49

196

9

8

11

88

64

121

10

8

10

80

64

100

11

9

9

81

81

81

12

10

9

90

100

81

13

10

8

80

100

64

14

10

7

70

100

49

15

11

8

88

121

64

Сумма

169

126

1303

2093

1152

средн

11,26667

8,4

86,86667

139,5333

76,8

Параметры уравнения регрессии


y = -0.62 x + 15.35
Линейное уравнение регрессии имеет вид y = -0.62 x + 15.35

1. Параметры уравнения регрессии.

Выборочные средние.


Выборочные дисперсии.

Среднеквадратическое отклонение

1.1. Коэффициент корреляции

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X высокая и обратная.

1.2. Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = -0.62 x + 15.35

1.3. Коэффициент эластичности.

1.4. Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

1.5. Индекс корреляции (эмпирическое корреляционное отношение).
где

Sy0 = 93.6 + 21.64 = 115.24

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
1.6. Коэффициент детерминации.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= -0.882 = 0.7688

x


y


x 2


y 2


x • y


y(x)


(yi-ycp) 2


(y-y(x))2


(xi-xcp)2


|y - yx|:y


12


9


144


81


108


7.95


0.36


1.11


0.5378


0.117


13


7


169


49


91


7.33


1.96


0.1091


3


0.0472


14


6


196


36


84


6.71


5.76


0.5085


7.47


0.1189


16


5


256


25


80


5.48


11.56


0.2293


22.4


0.0958


17


5


289


25


85


4.86


11.56


0.0191


32.87


0.0277


18


6


324


36


108


4.24


5.76


3.08


45.34


0.2926


6


12


36


144


72


11.65


12.96


0.1223


27.74


0.0291


7


14


49


196


98


11.03


31.36


8.8


18.2


0.2119


8


11


64


121


88


10.42


6.76


0.341


10.67


0.0531


8


10


64


100


80


10.42


2.56


0.1731


10.67


0.0416


9


9


81


81


81


9.8


0.36


0.6382


5.14


0.0888


10


9


100


81


90


9.18


0.36


0.033


1.6


0.0202


10


8


100


64


80


9.18


0.16


1.4


1.6


0.1477


10


7


100


49


70


9.18


1.96


4.76


1.6


0.3117


11


8


121


64


88


8.56


0.16


0.3187


0.0711


0.0706


169


126


2093


1152


1303


126


93.6


21.64


188.93


1.67


2.Параболическая зависимость

Для вычисления коэффициентов параболической регрессии находим суммы:

=12+13+14+16+17+18+6+7+8+8+9+10+10+10+11=169

=126

=12І+13І+…+11І=2093

=28153

=404837

=12*9+13*7+…+11*8=1303

=14883

Откуда получаем систему

404837а+28153b+2093с=14883

28153а+2093b+169с=1303

2093а+169b+15с=126

Решаем систему методом крамера, получаем
404837 28153 2093

∆= 28153 2093 169

2093 169 15

Запишем систему в виде:
BT = (14883,1303,126)

Главный определитель:

∆ = 404837∙(2093∙15-169∙169)-28153∙(28153∙15-169∙2093)+2093∙(28153∙169-2093∙2093) = 6127968 = 6127968

Заменим 1-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

1 = 14883∙(2093∙15-169∙169)-1303∙(28153∙15-169∙2093)+126∙(28153∙169-2093∙2093) = 349496
Заменим 2-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

2 = 404837∙(1303∙15-126∙169)-28153∙(14883∙15-126∙2093)+2093∙(14883∙169-1303∙2093) = -12239080
Заменим 3-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

3 = 404837∙(2093∙126-169∙1303)-28153∙(28153∙126-169∙14883)+2093∙(28153∙1303-2093∙14883) = 140602224
Выпишем отдельно найденные переменные Х


Проверка.

404837•0.057+28153•-1.9972+2093•22.9443 = 14883

28153•0.057+2093•-1.9972+169•22.9443 = 1303

2093•0.057+169•-1.9972+15•22.9443 = 126

Таким образом а=0,057,

b=-1,9972,

с=22,9443
уравнение регрессии имеет вид

у(х)=0,057хІ-1,9972х+22,9443

найдем коэффициент корреляции.

ӯ = 1/15*126=11,27

=14,60735

=217,1535


0,96578





х

у

У(хᵢ)

(у(хᵢ)-уᵢ)І

(уᵢ-уˉ)І

1

12

9

7,1859

3,290959

5,1529

2

13

7

6,6137

0,149228

18,2329

3

14

6

6,1555

0,02418

27,7729

4

16

5

5,5811

0,337677

39,3129

5

17

5

5,4649

0,216132

39,3129

6

18

6

5,4627

0,288691

27,7729

7

6

12

13,0131

1,026372

0,5329

8

7

14

11,7569

5,031498

7,4529

9

8

11

10,6147

0,148456

0,0729

10

8

10

10,6147

0,377856

1,6129

11

9

9

9,5865

0,343982

5,1529

12

10

9

8,6723

0,107387

5,1529

13

10

8

8,6723

0,451987

10,6929

14

10

7

8,6723

2,796587

18,2329

15

11

8

7,8721

0,016358

10,6929

Сумма

169

126

125,9387

14,60735

217,1535

среднее

11,26667

8,4

8,395913

0,973823

14,4769


проверяем на значимость:
t=0,96578=13,42586>t(15-2)=1,771

откуда следует. что коэффициент корреляции значим.
= 1,1678%

= 0.9657


3Логарифмическая зависимость
y = a + b lnx

Параметры уравнения регрессии

y = -7.18 ln(x) + 25.43
Логарифмическое уравнение регрессии имеет вид y = -7.18 ln(x) + 25.43
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а и подставим во второе уравнение

Получаем b = -7.18, a = 25.43

Уравнение регрессии:

y = -7.18 ln(x) + 25.43

1. Параметры уравнения регрессии.

Выборочные средние.


Выборочные дисперсии.

Среднеквадратическое отклонение

1.1. Коэффициент корреляции

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

В нашем примере связь между признаком Y фактором X весьма высокая и обратная.

1.2. Уравнение регрессии (оценка уравнения регрессии).
Логарифмическое уравнение регрессии имеет вид y = -7.18 ln(x) + 25.43

1.3. Коэффициент эластичности.

1.4. Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

1.5. Индекс корреляции (эмпирическое корреляционное отношение).
где

Sy0 = 93.6 + 16.42 = 110.02

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
1.6. Коэффициент детерминации.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= -0.912 = 0.8245

ln(x)


y


x 2


y 2


x • y


y(x)


(yi-ycp) 2


(y-y(x))2


(xi-xcp)2


|y - yx|:y


2.48


9


6.17


81


22.36


7.59


0.36


1.98


0.0127


0.1565


2.56


7


6.58


49


17.95


7.02


1.96


0.0003


0.0371


0.0025


2.64


6


6.96


36


15.83


6.49


5.76


0.2357


0.0712


0.0809


2.77


5


7.69


25


13.86


5.53


11.56


0.2779


0.1602


0.1054


2.83


5


8.03


25


14.17


5.09


11.56


0.0085


0.2124


0.0184


2.89


6


8.35


36


17.34


4.68


5.76


1.74


0.2684


0.2197


1.79


12


3.21


144


21.5


12.57


12.96


0.321


0.337


0.0472


1.95


14


3.79


196


27.24


11.46


31.36


6.45


0.1818


0.1814


2.08


11


4.32


121


22.87


10.5


6.76


0.2481


0.0858


0.0453


2.08


10


4.32


100


20.79


10.5


2.56


0.2519


0.0858


0.0502


2.2


9


4.83


81


19.78


9.66


0.36


0.431


0.0307


0.0729


2.3


9


5.3


81


20.72


8.9


0.36


0.0099


0.0049


0.0111


2.3


8


5.3


64


18.42


8.9


0.16


0.8106


0.0049


0.1125


2.3


7


5.3


49


16.12


8.9


1.96


3.61


0.0049


0.2715


2.4


8


5.75


64


19.18


8.22


0.16


0.0468


0.0007


0.027


35.58


126


85.92


1152


288.16


126


93.6


16.42


1.5


1.4



Вывод о возможности использования модели для прогнозирования

Для аппроксимации было использовано 3 вида зависимостей: прямолинейная, параболическая, логарифмическая.




прямолинейная

параболическая

логарифмическая

Уравнение

y = -0.62 x + 15.35

у=0,057хІ-1,9972х+22,9443


y = -7.18 ln(x) + 25.43


r

-0,8768

0.9657

-0,908



0.8122

0.9658

0.8508



11,16 %

1,1658%

9,35%

в прямолинейной и логарифмической зависимостях связь обратная. точнее всего аппроксимирует парабола, её связь прямая и тесная, >r, минимальна и равна 1.658%.

Вывод: наилучшая модель для прогнозирования – параболическая, наихудшая – прямолинейная. Это объясняется тем, что выпуклость данных кривых различна.


задание2.

Считая, что регрессия по представляется многочленом второй степени, найдем оценки коэффициентов параболической регрессии и составим соответствующее уравнение.

Для вычисления коэффициентов параболической регрессии находим суммы:

=12+13+14+16+17+18+6+7+8+8+9+10+10+10+11=169

=126

=12І+13І+…+11І=2093

=28153

=404837

=12*9+13*7+…+11*8=1303

=14883

Откуда получаем систему

404837а+28153b+2093с=14883

28153а+2093b+169с=1303

2093а+169b+15с=126

Решаем систему методом крамера, получаем
404837 28153 2093

∆= 28153 2093 169

2093 169 15

Запишем систему в виде:
BT = (14883,1303,126)

Главный определитель:

∆ = 404837∙(2093∙15-169∙169)-28153∙(28153∙15-169∙2093)+2093∙(28153∙169-2093∙2093) = 6127968 = 6127968

Заменим 1-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

1 = 14883∙(2093∙15-169∙169)-1303∙(28153∙15-169∙2093)+126∙(28153∙169-2093∙2093) = 349496
Заменим 2-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

2 = 404837∙(1303∙15-126∙169)-28153∙(14883∙15-126∙2093)+2093∙(14883∙169-1303∙2093) = -12239080
Заменим 3-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

3 = 404837∙(2093∙126-169∙1303)-28153∙(28153∙126-169∙14883)+2093∙(28153∙1303-2093∙14883) = 140602224
Выпишем отдельно найденные переменные Х


Проверка.

404837•0.057+28153•-1.9972+2093•22.9443 = 14883

28153•0.057+2093•-1.9972+169•22.9443 = 1303

2093•0.057+169•-1.9972+15•22.9443 = 126

Таким образом а=0,057,

b=-1,9972,

с=22,9443
уравнение регрессии имеет вид

у(х)=0,057хІ-1,9972х+22,9443

найдем коэффициент корреляции.

ӯ = 1/15*126=11,27

=14,60735

=217,1535


0,96578





х

у

У(хᵢ)

(у(хᵢ)-уᵢ)І

(уᵢ-уˉ)І

1

12

9

7,1859

3,290959

5,1529

2

13

7

6,6137

0,149228

18,2329

3

14

6

6,1555

0,02418

27,7729

4

16

5

5,5811

0,337677

39,3129

5

17

5

5,4649

0,216132

39,3129

6

18

6

5,4627

0,288691

27,7729

7

6

12

13,0131

1,026372

0,5329

8

7

14

11,7569

5,031498

7,4529

9

8

11

10,6147

0,148456

0,0729

10

8

10

10,6147

0,377856

1,6129

11

9

9

9,5865

0,343982

5,1529

12

10

9

8,6723

0,107387

5,1529

13

10

8

8,6723

0,451987

10,6929

14

10

7

8,6723

2,796587

18,2329

15

11

8

7,8721

0,016358

10,6929

Сумма

169

126

125,9387

14,60735

217,1535

среднее

11,26667

8,4

8,395913

0,973823

14,4769


проверяем на значимость:
t=0,96578=13,42586>t(15-2)=1,771

откуда следует. что коэффициент корреляции значим.
= 1,1678%

= 0.9657


задание3.

Построим кривую регрессии и нанесем ее на диаграмму рассеяния.

уравнение регрессии имеет вид

у(х)=0,057хІ-1,9972х+22,9443

12

7,1859

13

6,6137

14

6,1555

16

5,5811

17

5,4649

18

5,4627

6

13,0131

7

11,7569

8

10,6147

8

10,6147

9

9,5865

10

8,6723

10

8,6723

10

8,6723

11

7,8721



Задание 2.

Поквартальная динамика чистой прибыли компании (, млн.руб.) представлена в таблице.

Требуется:

  1. Оценить параметры линейного тренда методом наименьших квадратов (МНК).

  2. На основании найденной регрессионной зависимости дать прогноз показателя чистой прибыли в 4-ом квартале 2010 года.






1кв. 09г

2кв. 09г

3кв. 09г

4кв. 09г

1кв. 10г

2кв. 10г

3кв. 10г



20

24

29

35

39

43

48


РЕШЕНИЕ:

Параметры уравнения тренда


y = 4.71 t + 15.14
Линейное уравнение тренда имеет вид y = at + b

1. Находим параметры уравнения методом наименьших квадратов.

Система уравнений
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а0 и подставим во второе уравнение

Получаем a0 = 4.71, a1 = 15.14

Уравнение тренда

y = 4.71 t + 15.14

Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.

Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве тренда

Средние значения


Дисперсия

Среднеквадратическое отклонение

Коэффициент эластичности

Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.

Коэффициент детерминации

т.е. в 99.73 % случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда - высокая

t


y


t 2


y 2


t•y


y(t)


(y-y cp) 2


(y-y(t))2


(t-t p) 2


(y-y(t)) : y


1


20


1


400


20


19.86


196


0.02


9


0.01


2


24


4


576


48


24.57


100


0.33


4


0.02


3


29


9


841


87


29.29


25


0.08


1


0.01


4


35


16


1225


140


34


1


1


0


0.03


5


39


25


1521


195


38.71


25


0.08


1


0.01


6


43


36


1849


258


43.43


81


0.18


4


0.01


7


48


49


2304


336


48.14


196


0.02


9


0


28


238


140


8716


1084


238


624


1.71


28


0.09


2. Анализ точности определения оценок параметров уравнения тренда.
Анализ точности определения оценок параметров уравнения тренда

S a = 0.101

Доверительные интервалы для зависимой переменной
По таблице Стьюдента находим Tтабл

Tтабл (n-m-1;a) = (5;0.05) = 2.015

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 4

15.14 + 4.71*4 - 2.015*1.15 ; 15.14 + 4.71*4 - 2.015*1.15

(32.85;35.15)

Интервальный прогноз.

Определим среднеквадратическую ошибку прогнозируемого показателя.


где L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n — 2.

Точечный прогноз, t = 8: y(8) = 4.71*8 + 15.14 = 52.86

K1 = 1.4

52.86 - 1.4 = 51.46 ; 52.86 + 1.4 = 54.26

Интервальный прогноз:

t = 8: (51.46;54.26)

Точечный прогноз, t = 9: y(9) = 4.71*9 + 15.14 = 57.57

K2 = 1.52

57.57 - 1.52 = 56.05 ; 57.57 + 1.52 = 59.09

Интервальный прогноз:

t = 9: (56.05;59.09)

Точечный прогноз, t = 10: y(10) = 4.71*10 + 15.14 = 62.29

K3 = 1.66

62.29 - 1.66 = 60.63 ; 62.29 + 1.66 = 63.95

Интервальный прогноз:

t = 10: (60.63;63.95)

Точечный прогноз, t = 11: y(11) = 4.71*11 + 15.14 = 67

K4 = 1.82

67 - 1.82 = 65.18 ; 67 + 1.82 = 68.82

Интервальный прогноз:

t = 11: (65.18;68.82)

3. Проверка гипотез относительно коэффициентов линейного уравнения тренда.

1) t-статистика. Критерий Стьюдента.


Статистическая значимость коэффициента уравнения подтверждается


Статистическая значимость коэффициента тренда подтверждается

Доверительный интервал для коэффициентов уравнения тренда

Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими:

(a - tнабл Sa; a + tнабл Sa)

(4.7143 - 2.015•0.101; 4.7143 + 2.015•0.101)

(4.5108;4.9178)

(b - t набл S b; b + t набл S b)

(15.1429 - 2.015•0.4517; 15.1429 + 2.015•0.4517)

(14.2326;16.0531)

2) F-статистика. Критерий Фишера.


Fkp = 5.99

Поскольку F > Fkp, то коэффициент детерминации статистически значим

4. Тест Дарбина-Уотсона на наличие автокорреляции остатков для временного ряда.

y


y(x)


ei = y-y(x)


e2


(ei - ei-1)2


20


19.86


0.14


0.02


0


24


24.57


-0.57


0.33


0.51


29


29.29


-0.29


0.08


0.08


35


34


1


1


1.65


39


38.71


0.29


0.08


0.51


43


43.43


-0.43


0.18


0.51


48


48.14


-0.14


0.02


0.08


0


0


0


1.71


3.35




Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости a, числа наблюдений n и количества объясняющих переменных m.

Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.

d1 < DW и d2 < DW < 4 - d2.

Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации