Контрольная работа - Поле корреляции - файл n1.doc

Контрольная работа - Поле корреляции
скачать (351 kb.)
Доступные файлы (1):
n1.doc351kb.20.11.2012 03:57скачать

n1.doc

Имеются данные о потребительских расходах на душу населения Y (руб.) и средней заработной плате и социальных выплатах X (руб.) по 12 районам регионов

Район

Задача 8

y

x

1

445

1310

2

537

1490

3

463

1255

4

251

1287

5

553

1720

6

453

1500

7

478

1320

8

448

918

9

453

794

10

627

1012

11

364

1058

12

419

1213

Для исходных данных, приведенных в таблице 1, требуется:

  1. Построить поле корреляции (на отдельном листе), сформулировать гипотезу о форме связи и построить эмпирическую линию регрессии (линию тренда).

  2. Найти оценки b0 и b1 параметров модели парной линейной регрессии .

  3. С надежностью 0,95 проверить значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделать соответствующие выводы о значимости этих оценок.

  4. С надежностью 0,95 определить интервальные оценки теоретических коэффициентов регрессии и сделать соответствующие выводы о значимости этих оценок.

  5. Определить коэффициент детерминации R2 и коэффициент корреляции rxy сделать соответствующие выводы о качестве уравнения регрессии.

  6. Проверить при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделать соответствующие выводы о значимости уравнения регрессии.

  7. Оцените с помощью средней ошибки аппроксимации качество уравнения.

  8. Рассчитайте прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 10% от его среднего уровня.

  9. С уровнем значимости 0,05 определить интервальную оценку условного математического ожидания Уp для вычисленного Хp .

  10. С надежностью 0,95 определить доверительный интервал значения Уp для вычисленного значения Хp.

  11. Найдите основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установить 95%. Запомните (или подпишите) основные характеристики регрессии.

Решение
(Порядок вычислений с использованием MS Exel: Вычисляем параметры, которые приведены в таблице 2. В таблице 2 первые три столбца включают исходные данные. В четвертом, пятом и шестом столбцах выполняются операции умножения столбцов XY, возведения значений столбца X и Y в квадрат. Для каждого из столбцов с номерами 2, 3, 4, 5 и 6 подсчитывается их суммы и средние значения. Результаты расчетов величин приведены в столбце 7. Величина остаточной (необъяснимой) ошибки вычисляется по формуле и приведена в столбце 8. В столбцах 10 и 11, 12 и 13, 14 и 15 приведены значения центрированных величин, квадраты центрированных величин:
.
Столбец 16 используется для вычисления средней ошибки аппроксимации А.
Суммы и средние значения записываются в строки 13 и 14.)

  1. Построим поле корреляции (на отдельном листе) и сформулируем гипотезу о форме связи, предполагая, что генеральное уравнение регрессии – линейное:





2. Найдем оценки b0 и b1 параметров модели парной линейной регрессии y=b0 +b1x: по следующим формулам:




Тогда уравнение эмпирической линии регрессии (линии тренда) имеет вид:

y = 0,0527x + 392,2956

3. С надежностью 0,95 проверим значимость оценок b0 и b1 теоретических коэффициентов регрессии с помощью t-статистики Стьюдента и сделаем соответствующие выводы о значимости этих оценок.

Для уровня значимости ? = 0,05 и числа степеней свободы v = n – 2 = 12 – 2 = 10 критерий Стьюдента (см. таблица распределения Стьюдента) равен .

Дисперсии коэффициентов и уравнения регрессии определим из равенств с использованием результатов таблицы 2.









Для определения математической значимости коэффициентов b0 и b1 найдем t – статистика





Для уровня значимости =0,05 и числа степеней свободы к=n-2=12-2=10 критерий Стьюдента (см таблица распределения Стьюдента) равен

2,2281.

Сравнение расчетных и табличных величин критерия Стьюдента показывает, что

или и или 0,4702 < 2,2281

Что означает: коэффициент b0 – статистически значим, b1 – статистически незначим.

4. С надежностью 0,95 определим интервальные оценки теоретических коэффициентов регрессии и сделаем соответствующие выводы о значимости этих оценок.
Доверительные интервалы для коэффициентов b0 и b1 равны:



Подставив числовые значения, значения коэффициентов b0 и b1, их средние квадратичные отклонения и значение для t имеем:



Так как точка 0 (ноль) не лежит внутри доверительного интервала, то интервальная оценка коэффициента 0 статистически значима.


Так как точка 0 (ноль) лежит внутри доверительного интервала, то интервальная оценка коэффициента 1 статистически незначима.

5. Определим коэффициент детерминации R2 и коэффициент корреляции rxy и сделаем соответствующие выводы о качестве уравнения регрессии.

Определяем дисперсии и средние квадратичные отклонения независимого X и результативного Y факторов:









Тесноту связи между переменными X и Y определяем через ковариацию и коэффициент корреляции.





Величина r(x,y)=0,1471 близка к 0, что характеризует слабую линейную связь между независимым и результативным признаками.
Для определения коэффициента детерминации воспользуемся результатами расчетов таблицы 2.

По таблице 2 найдем:

общую ошибку (столбец 13):

97774,9

ошибку объясняемую регрессией (столбец 15)

2115,1

остаточную ошибку (столбец 9)

95659,8

причем

TSS=RSS+ESS

Тогда коэффициент детерминации равен

.

Полученная величина коэффициента детерминации свидетельствует о том, что необъясненная ошибка составляет более 92 процентов от общей ошибки.
6. Проверим при уровне значимости 0,05 значимость уравнения регрессии с помощью F статистики Фишера и сделаем соответствующие выводы о значимости уравнения регрессии.

Статистика Фишера вычисляется по формуле: .

Имеем F = (2115,1/95659,8)·10=0,2211.

Найдем для заданной доверительной вероятности 0,05 критическое значение статистики Фишера:

По таблице .

Имеем F < Fкр, поэтому уравнение незначимо с надежностью 0,95.

7. Оценим с помощью средней ошибки аппроксимации качество уравнения регрессии.

Средняя ошибка аппроксимации эмпирических данных теоретическим уровнем регрессии равна (столбец 17).

А = = 0,1559·100 = 15,59%.

Судя по величине средней ошибки, качество уравнения регрессии хорошее.

8. Рассчитаем прогнозное значение результата Yp, если прогнозное значение фактора Xр увеличится на 10% от его среднего уровня.

Хр = 1,10*Хср = 1,1*1239,75 = 1363,73.

Прогнозируемую величину yp определяем из равенства:



9. С уровнем значимости 0,05 определим интервальную оценку условного математического ожидания Уp для вычисленного значения Хp.

Дисперсия математического ожидания прогнозируемой величины yp равна



Среднее квадратичное отклонение математического ожидания прогнозируемой величины равно



С уровнем значимости =0,05 доверительный интервал для условного математического ожидания yp при данном xp равен:




или
.

10. С надежностью 0,95 определим доверительный интервал значения Уp для вычисленного значения Хp

Имеем



Дисперсия конкретного значения прогнозируемой величины yp равна



Среднее квадратичное отклонение ожидаемой прогнозируемой величины yp равно



Тогда получим,



или
235,1926  yp  693,0316.
11. Найдем основные регрессионные характеристики используя функцию Регрессия (У,Х) из надстройки "Анализ данных". Уровень надежности установим 95%.

Регрессионный анализ с использованием процедуры «Регрессия»

Для реализации процедуры «Регрессия» необходимо;

  1. Ввести исходные данные Х и У, расположив , например, их в столбцах А и В, начиная с ячеек А2 и В2, соответственно.

  2. Выполнить команду Сервис/Анализ данных.

  3. В появившимся диалоговом окне Анализ данных в списке Инструментов анализа выбрать строку Регрессия, указав курсором мыши и левой кнопкой мыши, затем нажать кнопку ОК.

  4. В появившемся диалоговом окне Регрессия задать Входной интервал У, то есть ввести ссылку на диапазон анализируемых зависимых данных, содержащих один столбец данных. Для этого следует навести указатель мыши на верхнюю ячейку столбца зависимых данных, нажав левую кнопку мыши и, не отпуская ее, протянуть указатель мыши к нижней ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.

  5. Указать Входной интервал X, то есть ввести ссылку на диапазон независимых данных, содержащий столбец анализируемых независимых данных. Для этого следует навести указатель мыши на поле ввода Входной интервал X и щелкнуть левой кнопкой мыши. Затем навести указатель мыши на верхнюю левую ячейку диапазона независимых данных, нажать левую кнопку мыши и, не отпуская ее протянуть указатель мыши к нижней правой ячейке, содержащей анализируемые данные, затем отпустить левую кнопку мыши.

  6. Установить флажок уровень надежности.

  7. Установить флажок Остатки

  8. Указать в Параметры вывода в Выходном интервале, например, ячейку D2.

  9. Если необходимо визуально проверить отличие экспериментальных точек от предсказанных по регрессионной модели, следует установить флажок в поле График подбора.(не установлен)

  1. Нажать кнопку ОК.

Интерпретируем полученные результаты.

В шаблоне Дисперсионный анализ оценивает общее качество полученной модели; её достоверность по уровню значимости критерия Фишера и коэффициент детерминации.

Коэффициенты модели определяются в столбце Коэффициенты: в строке Y- коэффициент b0, в строке X- коэффициент при независимой переменной b1.


Таблица 2

i

х

у

х∙ у



у















()





1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

1

1310

445

582950

1716100

198025

461,2828

-16,3

265,13

70,25

4935,06

-12,58

158,34

3,70

13,69

0,0366

2

1490

537

800130

2220100

288369

470,7620

66,2

4387,47

250,25

62625,06

79,42

6307,01

13,18

173,68

0,1233

3

1255

463

581065

1575025

214369

458,3864

4,6

21,29

15,25

232,56

5,42

29,34

0,80

0,64

0,0100

4

1287

251

323037

1656369

63001

460,0716

-209,1

43710,94

47,25

2232,56

-206,58

42676,67

2,49

6,19

0,8330

5

1720

553

951160

2958400

305809

482,8743

70,1

4917,62

480,25

230640,06

95,42

9104,34

25,29

639,63

0,1268

6

1500

453

679500

2250000

205209

471,2886

-18,3

334,47

260,25

67730,06

-4,58

21,01

13,71

187,83

0,0404

7

1320

478

630960

1742400

228484

461,8095

16,2

262,13

80,25

6440,06

20,42

416,84

4,23

17,86

0,0339

8

918

448

411264

842724

200704

440,6393

7,4

54,18

-321,75

103523,06

-9,58

91,84

-16,94

287,10

0,0164

9

794

453

359682

630436

205209

434,1092

18,9

356,86

-445,75

198693,06

-4,58

21,01

-23,47

551,03

0,0417

10

1012

627

634524

1024144

393129

445,5896

181,4

32909,75

-227,75

51870,06

169,42

28702,01

-11,99

143,85

0,2893

11

1058

364

385112

1119364

132496

448,0120

-84,0

7058,02

-181,75

33033,06

-93,58

8757,84

-9,57

91,61

0,2308

12

1213

419

508247

1471369

175561

456,1746

-37,2

1381,95

-26,75

715,56

-38,58

1488,67

-1,41

1,98

0,0887

?

14877

5491

6847631

19206431

2610365

5491

0,0

95659,8

0,0

762670,3

0,0

97774,9

0,0

2115,1

1,8709

среднее

1239,75

457,58

570635,92

1600535,92

217530,42

457,58

0,00

7971,65

0,00

63555,85

0,00

8147,91

0,00

176,26

0,1559



ВЫВОД ИТОГОВ








































Регрессионная статистика
















Множественный R

0,147079493
















R-квадрат

0,021632377
















Нормированный R-квадрат

-0,076204385
















Стандартная ошибка

97,80583458
















Наблюдения

12





































Дисперсионный анализ



















 

df

SS

MS

F

Значимость F




Регрессия

1

2115,103892

2115,103892

0,22110684

0,648285273




Остаток

10

95659,81277

9565,981277










Итого

11

97774,91667

 

 

 

























 

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

392,2956037

141,6866958

2,768753986

0,019829654

76,59797334

707,9932341

Переменная X 1

0,052662012

0,111994414

0,470219991

0,648285273

-0,196877091

0,302201115






















ВЫВОД ОСТАТКА








































Наблюдение

Предсказанное Y

Остатки













1

461,2828397

-16,28283969













2

470,7620019

66,23799812













3

458,386429

4,613570981













4

460,0716134

-209,0716134













5

482,8742647

70,12573531













6

471,288622

-18,288622













7

461,8094598

16,19054019













8

440,6393309

7,360669088













9

434,1092414

18,8907586













10

445,5895601

181,4104399













11

448,0120126

-84,01201262













12

456,1746245

-37,17462451
















Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации