Контрольная работа - уравнение парной нелинейной регрессии - файл n1.doc

Контрольная работа - уравнение парной нелинейной регрессии
скачать (70 kb.)
Доступные файлы (1):
n1.doc572kb.09.03.2011 16:36скачать

n1.doc



контрольная работа №3

вариант 4

.

часть 1.


Исследуется зависимость динамики фондового индекса США (, % за месяц) от российского биржевого индекса (,% за месяц) по данным за последние 15 месяцев (- порядковый номер месяца). Статистические данные приведены в таблице.
Требуется:


  1. Построить диаграмму рассеяния и нанести прямую регрессии. Убедиться, что между исследуемыми финансовыми показателями существует нелинейная взаимосвязь.




  1. Считая, что регрессия по представляется многочленом второй степени, найти оценки коэффициентов параболической регрессии и составить соответствующее уравнение.



  1. Построить кривую регрессии и нанести ее на диаграмму рассеяния.




1

2

3

4

5

6

7

8

9

10

11

12

13

14

15



10

9

9

9

8

7

7

6

5

17

16

15

13

12

11



7

6

7

8

8

9

10

13

11

5

4

4

5

5

8


задание 1.

построим диаграмму рассеяния и нанесем прямую регрессии

убедимся, что между исследуемыми финансовыми показателями существует нелинейная взаимосвязь.
1 Прямолинейная зависимость
Уравнение прямой y = a+bx, таким образом, используя метод наименьших квадратов, минимизируем функцию . Для нахождения коэффициентов a и b, продифференцируем по каждому параметру a и b приравняем, 0 и получим систему уравнений.



Для вычисления параметров a и b прямой заполняем расчетную таблицу:



10

7

70

100

49

9

6

54

81

36

9

7

63

81

49

9

8

72

81

64

8

8

64

64

64

7

9

63

49

81

7

10

70

49

100

6

13

78

36

169

5

11

55

25

121

17

5

85

289

25

16

4

64

256

16

15

4

60

225

16

13

5

65

169

25

12

5

60

144

25

11

8

88

121

64

154

110

1011

1770

904

10,26667

7,333333

67,4

118

60,26667


Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + ?, где ei – наблюдаемые значения (оценки) ошибок ?i, а и b соответственно оценки параметров ? и ? регрессионной модели, которые следует найти.

Для оценки параметров ? и ? - используют МНК (метод наименьших квадратов).

Система нормальных уравнений.
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а и подставим во второе уравнение

Получаем b = -0.63, a = 13.76

Уравнение регрессии:

y = -0.63 x + 13.76

Параметры уравнения регрессии.

Выборочные средние.


Выборочные дисперсии.

Среднеквадратическое отклонение

Коэффициент корреляции

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = -0.63 x + 13.76

Коэффициент эластичности.

Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.
Индекс корреляции (эмпирическое корреляционное отношение).
где

Sy0 = 97.33 + 23.22 = 120.55

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
Коэффициент детерминации.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= -0.872 = 0.7615

x


y


x 2


y 2


x • y


y(x)


(yi-ycp) 2


(y-y(x))2


(xi-xcp)2


|y - yx|:y


10


7


100


49


70


7.5


0.1111


0.2504


0.0711


0.0715


9


6


81


36


54


8.13


1.78


4.52


1.6


0.3544


9


7


81


49


63


8.13


0.1111


1.27


1.6


0.161


9


8


81


64


72


8.13


0.4444


0.016


1.6


0.0158


8


8


64


64


64


8.75


0.4444


0.567


5.14


0.0941


7


9


49


81


63


9.38


2.78


0.1439


10.67


0.0421


7


10


49


100


70


9.38


7.11


0.3852


10.67


0.0621


6


13


36


169


78


10.01


32.11


8.97


18.2


0.2303


5


11


25


121


55


10.63


13.44


0.1354


27.74


0.0335


17


5


289


25


85


3.12


5.44


3.55


45.34


0.3768


16


4


256


16


64


3.74


11.11


0.0664


32.87


0.0644


15


4


225


16


60


4.37


11.11


0.136


22.4


0.0922


13


5


169


25


65


5.62


5.44


0.3861


7.47


0.1243


12


5


144


25


60


6.25


5.44


1.56


3


0.2495


11


8


121


64


88


6.87


0.4444


1.27


0.5378


0.1407


154


110


1770


904


1011


110


97.33


23.22


188.93


2.11




2.Параболическая зависимость

Уравнение параболы y = a + bx + cx2. Сделаем замену x=x1, x2=x2, перейдем к уравнению: y = a + bx1 + cx2. Продифференцируем по каждому параметру a, b и с, приравняем к 0, получим систему уравнений:



Для вычисления параметров a, b и с заполняем расчетную таблицу:






х

у

ху

Х*х

У*у

Х*х*х

Х*х*х*х

Х*х*у

1

10

7

70

100

49

1000

10000

700

2

9

6

54

81

36

729

6561

486

3

9

7

63

81

49

729

6561

567

4

9

8

72

81

64

729

6561

648

5

8

8

64

64

64

512

4096

512

6

7

9

63

49

81

343

2401

441

7

7

10

70

49

100

343

2401

490

8

6

13

78

36

169

216

1296

468

9

5

11

55

25

121

125

625

275

10

17

5

85

289

25

4913

83521

1445

11

16

4

64

256

16

4096

65536

1024

12

15

4

60

225

16

3375

50625

900

13

13

5

65

169

25

2197

28561

845

14

12

5

60

144

25

1728

20736

720

15

11

8

88

121

64

1331

14641

968

сумма

154

110

1011

1770

904

22366

304122

10489

среднее

10,26667

7,333333

67,4

118

60,26667

1491,067

20274,8

699,2667

из таблицы получаем суммы:

=10+9+9+9+8+…+11=154

 =110

=100+81+81+…+121=1770

=22366

=304122

=2*8+3*10+…=1011

=10489
Получим систему уравнений:

304122а+22366в+1770с=10489

22366а+1770в+154с=1011

1770а+154в+15с=110

прорешаем систему методом Крамера:
Запишем систему в виде:
BT = (10489,1011,110)

Главный определитель:

∆ = 304122∙(1770∙15-154∙154)-22366∙(22366∙15-154∙1770)+1770∙(22366∙154-1770∙1770) = 6127968 = 6127968

Заменим 1-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

1 = 10489∙(1770∙15-154∙154)-1011∙(22366∙15-154∙1770)+110∙(22366∙154-1770∙1770) = 384856
Заменим 2-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

2 = 304122∙(1011∙15-110∙154)-22366∙(10489∙15-110∙1770)+1770∙(10489∙154-1011∙1770) = -12381240
Заменим 3-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

3 = 304122∙(1770∙110-154∙1011)-22366∙(22366∙110-154∙10489)+1770∙(22366∙1011-1770∙10489) = 126639488
Выпишем отдельно найденные переменные Х


Проверка.

304122•0.0628+22366•-2.0204+1770•20.6658 = 10489

22366•0.0628+1770•-2.0204+154•20.6658 = 1011

1770•0.0628+154•-2.0204+15•20.6658 = 110

зная коэффициенты уравнения, запишем уравнение параболической регрессии

у(х)=0,0628хІ-2,0204х+20,6658

далее найдем коэффициент корреляции

ӯ = 1/15*110= 7,3

=14,6897

=97,35


0,921468

1

х

у

У(хᵢ)

(у(хᵢ)-уᵢ)І

(уᵢ-уˉ)І

2

10

7

6,7418

0,066667

0,09

3

9

6

7,569

2,461761

1,69

4

9

7

7,569

0,323761

0,09

5

9

8

7,569

0,185761

0,49

6

8

8

8,5218

0,272275

0,49

7

7

9

9,6002

0,36024

2,89

8

7

10

9,6002

0,15984

7,29

9

6

13

10,8042

4,821538

32,49

10

5

11

12,1338

1,285502

13,69

11

17

5

4,4682

0,282811

5,29

12

16

4

4,4162

0,173222

10,89

13

15

4

4,4898

0,239904

10,89

14

13

5

5,0138

0,00019

5,29

15

12

5

5,4642

0,215482

5,29

Сумма

11

8

6,0402

3,840816

0,49

среднее

154

110

110,0014

14,68977

97,35

1

10,26667

7,333333

7,333427

0,979318

6,49


найдем коэффициент эластичности и индекс корреляции

= - 1,659%
= 0.8491

Поскольку >r, то кривая лучше аппроксимирует зависимость
3Логарифмическая зависимость
Оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = b ln(x) + a + ?, где ei – наблюдаемые значения (оценки) ошибок ?i, а и b соответственно оценки параметров ? и ? регрессионной модели, которые следует найти.

Для оценки параметров ? и ? - используют МНК (метод наименьших квадратов).

Система нормальных уравнений.
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а и подставим во второе уравнение

Получаем b = -6.61, a = 22.32

Уравнение регрессии:

y = -6.61 ln(x) + 22.32

Параметры уравнения регрессии.

Выборочные средние.


Выборочные дисперсии.

Среднеквадратическое отклонение
Коэффициент корреляции

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от –1 до +1.

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:

0.1 < rxy < 0.3: слабая;

0.3 < rxy < 0.5: умеренная;

0.5 < rxy < 0.7: заметная;

0.7 < rxy < 0.9: высокая;

0.9 < rxy < 1: весьма высокая;

Уравнение регрессии (оценка уравнения регрессии).
Логарифмическое уравнение регрессии имеет вид y = -6.61 ln(x) + 22.32

Коэффициент эластичности.

Ошибка аппроксимации.

Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации.

Индекс корреляции (эмпирическое корреляционное отношение).
где

Sy0 = 97.33 + 17.01 = 114.34

Теоретическое корреляционное отношение для линейной связи равно коэффициенту корреляции rxy.

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
Коэффициент детерминации.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= -0.912 = 0.8252

ln(x)


y


x 2


y 2


x • y


y(x)


(yi-ycp) 2


(y-y(x))2


(xi-xcp)2


|y - yx|:y


2.3


7


5.3


49


16.12


7.11


0.1111


0.0118


0.0012


0.0155


2.2


6


4.83


36


13.18


7.8


1.78


3.26


0.0051


0.3008


2.2


7


4.83


49


15.38


7.8


0.1111


0.6475


0.0051


0.115


2.2


8


4.83


64


17.58


7.8


0.4444


0.0382


0.0051


0.0244


2.08


8


4.32


64


16.64


8.58


0.4444


0.3398


0.0358


0.0729


1.95


9


3.79


81


17.51


9.47


2.78


0.2165


0.1041


0.0517


1.95


10


3.79


100


19.46


9.47


7.11


0.2859


0.1041


0.0535


1.79


13


3.21


169


23.29


10.48


32.11


6.33


0.2273


0.1935


1.61


11


2.59


121


17.7


11.69


13.44


0.4742


0.4344


0.0626


2.83


5


8.03


25


14.17


3.6


5.44


1.95


0.3188


0.2796


2.77


4


7.69


16


11.09


4


11.11


0


0.2541


0.0007


2.71


4


7.33


16


10.83


4.43


11.11


0.1842


0.1932


0.1073


2.56


5


6.58


25


12.82


5.37


5.44


0.1405


0.0878


0.075


2.48


5


6.17


25


12.42


5.9


5.44


0.8167


0.0468


0.1807


2.4


8


5.75


64


19.18


6.48


0.4444


2.31


0.0167


0.1902


34.03


110


79.03


904


237.39


110


97.33


17.01


1.84


1.72


Для аппроксимации было использовано 3 вида зависимостей: прямолинейная, параболическая, логарифмическая

в прямолинейной и логарифмической зависимостях связь обратная. точнее всего аппроксимирует парабола, её связь прямая и тесная, >r, минимальна

Вывод: наилучшая модель для прогнозирования – параболическая, наихудшая – прямолинейная. Это объясняется тем, что выпуклость данных кривых различна
2 задание

Считая, что регрессия по представляется многочленом второй степени, найдем оценки коэффициентов параболической регрессии и составим соответствующее уравнение.

Уравнение параболы y = a + bx + cx2. Сделаем замену x=x1, x2=x2, перейдем к уравнению: y = a + bx1 + cx2. Продифференцируем по каждому параметру a, b и с, приравняем к 0, получим систему уравнений:



Для вычисления параметров a, b и с заполняем расчетную таблицу:






х

у

ху

Х*х

У*у

Х*х*х

Х*х*х*х

Х*х*у

1

10

7

70

100

49

1000

10000

700

2

9

6

54

81

36

729

6561

486

3

9

7

63

81

49

729

6561

567

4

9

8

72

81

64

729

6561

648

5

8

8

64

64

64

512

4096

512

6

7

9

63

49

81

343

2401

441

7

7

10

70

49

100

343

2401

490

8

6

13

78

36

169

216

1296

468

9

5

11

55

25

121

125

625

275

10

17

5

85

289

25

4913

83521

1445

11

16

4

64

256

16

4096

65536

1024

12

15

4

60

225

16

3375

50625

900

13

13

5

65

169

25

2197

28561

845

14

12

5

60

144

25

1728

20736

720

15

11

8

88

121

64

1331

14641

968

сумма

154

110

1011

1770

904

22366

304122

10489

среднее

10,26667

7,333333

67,4

118

60,26667

1491,067

20274,8

699,2667

из таблицы получаем суммы:

=10+9+9+9+8+…+11=154

 =110

=100+81+81+…+121=1770

=22366

=304122

=2*8+3*10+…=1011

=10489
Получим систему уравнений:

304122а+22366в+1770с=10489

22366а+1770в+154с=1011

1770а+154в+15с=110

прорешаем систему методом Крамера:
Запишем систему в виде:
BT = (10489,1011,110)

Главный определитель:

∆ = 304122∙(1770∙15-154∙154)-22366∙(22366∙15-154∙1770)+1770∙(22366∙154-1770∙1770) = 6127968 = 6127968

Заменим 1-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

1 = 10489∙(1770∙15-154∙154)-1011∙(22366∙15-154∙1770)+110∙(22366∙154-1770∙1770) = 384856
Заменим 2-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

2 = 304122∙(1011∙15-110∙154)-22366∙(10489∙15-110∙1770)+1770∙(10489∙154-1011∙1770) = -12381240
Заменим 3-ый столбец матрицы А на вектор результата В.
Найдем определитель полученной матрицы.

3 = 304122∙(1770∙110-154∙1011)-22366∙(22366∙110-154∙10489)+1770∙(22366∙1011-1770∙10489) = 126639488
Выпишем отдельно найденные переменные Х


Проверка.

304122•0.0628+22366•-2.0204+1770•20.6658 = 10489

22366•0.0628+1770•-2.0204+154•20.6658 = 1011

1770•0.0628+154•-2.0204+15•20.6658 = 110

зная коэффициенты уравнения, запишем уравнение параболической регрессии

у(х)=0,0628хІ-2,0204х+20,6658

далее найдем коэффициент корреляции

ӯ = 1/15*110= 7,3

=14,6897

=97,35


0,921468

1

х

у

У(хᵢ)

(у(хᵢ)-уᵢ)І

(уᵢ-уˉ)І

2

10

7

6,7418

0,066667

0,09

3

9

6

7,569

2,461761

1,69

4

9

7

7,569

0,323761

0,09

5

9

8

7,569

0,185761

0,49

6

8

8

8,5218

0,272275

0,49

7

7

9

9,6002

0,36024

2,89

8

7

10

9,6002

0,15984

7,29

9

6

13

10,8042

4,821538

32,49

10

5

11

12,1338

1,285502

13,69

11

17

5

4,4682

0,282811

5,29

12

16

4

4,4162

0,173222

10,89

13

15

4

4,4898

0,239904

10,89

14

13

5

5,0138

0,00019

5,29

15

12

5

5,4642

0,215482

5,29

Сумма

11

8

6,0402

3,840816

0,49

среднее

154

110

110,0014

14,68977

97,35

1

10,26667

7,333333

7,333427

0,979318

6,49


найдем коэффициент эластичности и индекс корреляции

= - 1,659%
= 0.8491

Поскольку >r, то кривая лучше аппроксимирует зависимость

задание3.
Построим кривую регрессии и нанесем ее на диаграмму рассеяния.

уравнение регрессии имеет вид

у(х)=0,0628хІ-2,0204х+20,6658


1

х

у

У(хᵢ)

2

10

7

6,7418

3

9

6

7,569

4

9

7

7,569

5

9

8

7,569

6

8

8

8,5218

7

7

9

9,6002

8

7

10

9,6002

9

6

13

10,8042

10

5

11

12,1338

11

17

5

4,4682

12

16

4

4,4162

13

15

4

4,4898

14

13

5

5,0138

15

12

5

5,4642

Сумма

11

8

6,0402

среднее

154

110

110,0014

1

10,26667

7,333333

7,333427




Часть 2.

Поквартальная динамика чистой прибыли компании (, млн.руб.) представлена в таблице.

Требуется:

  1. Оценить параметры линейного тренда методом наименьших квадратов (МНК).

  2. На основании найденной регрессионной зависимости дать прогноз показателя чистой прибыли в 4-ом квартале 2010 года.



1кв. 09г

2кв. 09г

3кв. 09г

4кв. 09г

1кв. 10г

2кв. 10г

3кв. 10г



30

34

39

45

49

53

58

Решение:
Линейное уравнение тренда имеет вид y = at + b

1. Находим параметры уравнения методом наименьших квадратов.
Система уравнений
Для наших данных система уравнений имеет вид
Из первого уравнения выражаем а0 и подставим во второе уравнение

Получаем a0 = 4.71, a1 = 25.14

Уравнение тренда

y = 4.71 t + 25.14

Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.
Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве тренда

Средние значения


Дисперсия

Среднеквадратическое отклонение

Коэффициент эластичности

Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х на Y не существенно.

Коэффициент детерминации

т.е. в 99.73 % случаев влияет на изменение данных. Другими словами - точность подбора уравнения тренда – высокая


t


y


t 2


y 2


t•y


y(t)


(y-y cp) 2


(y-y(t))2


(t-t p) 2


(y-y(t)) : y


1


30


1


900


30


29.86


196


0.02


9


0


2


34


4


1156


68


34.57


100


0.33


4


0.02


3


39


9


1521


117


39.29


25


0.08


1


0.01


4


45


16


2025


180


44


1


1


0


0.02


5


49


25


2401


245


48.71


25


0.08


1


0.01


6


53


36


2809


318


53.43


81


0.18


4


0.01


7


58


49


3364


406


58.14


196


0.02


9


0


28


308


140


14176


1364


308


624


1.71


28


0.07




2. Анализ точности определения оценок параметров уравнения тренда.
Анализ точности определения оценок параметров уравнения тренда

S a = 0.101

Доверительные интервалы для зависимой переменной
По таблице Стьюдента находим Tтабл

Tтабл (n-m-1;a) = (5;0.05) = 2.015

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 4

25.14 + 4.71*4 - 2.015*1.15 ; 25.14 + 4.71*4 - 2.015*1.15

(42.85;45.15)

Интервальный прогноз.

Определим среднеквадратическую ошибку прогнозируемого показателя.

где L - период упреждения; уn+L - точечный прогноз по модели на (n + L)-й момент времени; n - количество наблюдений во временном ряду; Sy - стандартная ошибка прогнозируемого показателя; Tтабл - табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n — 2.

Точечный прогноз, t = 8: y(8) = 4.71*8 + 25.14 = 62.86

K1 = 1.4

62.86 - 1.4 = 61.46 ; 62.86 + 1.4 = 64.26

Интервальный прогноз:

t = 8: (61.46;64.26)

Точечный прогноз, t = 9: y(9) = 4.71*9 + 25.14 = 67.57

K2 = 1.52

67.57 - 1.52 = 66.05 ; 67.57 + 1.52 = 69.09

Интервальный прогноз:

t = 9: (66.05;69.09)

Точечный прогноз, t = 10: y(10) = 4.71*10 + 25.14 = 72.29

K3 = 1.66

72.29 - 1.66 = 70.63 ; 72.29 + 1.66 = 73.95

Интервальный прогноз:

t = 10: (70.63;73.95)

Точечный прогноз, t = 11: y(11) = 4.71*11 + 25.14 = 77

K4 = 1.82

77 - 1.82 = 75.18 ; 77 + 1.82 = 78.82

Интервальный прогноз:

t = 11: (75.18;78.82)

3. Проверка гипотез относительно коэффициентов линейного уравнения тренда.

1) t-статистика. Критерий Стьюдента.

Статистическая значимость коэффициента уравнения подтверждается

Статистическая значимость коэффициента тренда подтверждается

Доверительный интервал для коэффициентов уравнения тренда

Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими:

(a - tнабл Sa; a + tнабл Sa)

(4.7143 - 2.015•0.101; 4.7143 + 2.015•0.101)

(4.5108;4.9178)

(b - t набл S b; b + t набл S b)

(25.1429 - 2.015•0.4517; 25.1429 + 2.015•0.4517)

(24.2326;26.0531)

2) F-статистика. Критерий Фишера.

Fkp = 5.99

Поскольку F > Fkp, то коэффициент детерминации статистически значим


4. Тест Дарбина-Уотсона на наличие автокорреляции остатков для временного ряда.

y


y(x)


ei = y-y(x)


e2


(ei - ei-1)2


30


29.86


0.14


0.02


0


34


34.57


-0.57


0.33


0.51


39


39.29


-0.29


0.08


0.08


45


44


1


1


1.65


49


48.71


0.29


0.08


0.51


53


53.43


-0.43


0.18


0.51


58


58.14


-0.14


0.02


0.08


0


0


0


1.71


3.35




Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости a, числа наблюдений n и количества объясняющих переменных m.

Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 < DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.

d1 < DW и d2 < DW < 4 - d2.

Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации