Лекция - Трендовые модели. Временые ряды - файл n1.doc

Лекция - Трендовые модели. Временые ряды
скачать (549.5 kb.)
Доступные файлы (1):
n1.doc550kb.06.11.2012 17:03скачать

n1.doc

Тема 2. Временные ряды.
2.1. Понятие временного ряда.

Определение 1. Одномерным временным рядом экономических данных назовем хронологическую последовательность значений какого-либо показателя Yt, характеризующего изучаемое свойство экономического объекта (процесса), где переменная t - временной параметр, фиксируемый либо через равные промежутки (дискретный временной ряд), либо непрерывно (непрерывный временной ряд). Каждое конкретное значение Yt назовем уровнем временного ряда.

Замечание 1. Иногда удобнее обозначать уровни ряда в виде Y(t).

Замечание 2. В общем случае в определении временного ряда речь может идти о наблюдениях Y(t1), Y(t2),, Y(tn) анализируемого показателя Y(t) в последовательные, не обязательно равноотстоящие моменты времени t1, t2, ……. tn. Для равноотстоящих моментов наблюдения, т.е. в случае t = t2 – t1 = t3 – t2 = … = tn – tn-1 = const, дискретный одномерный ряд может быть представлен в виде Y(1), Y(2), …, Y(n) или в виде вектора-строки Y = {у12, …, yn}.

Процесс развития во времени социально-экономических явлений в статистике принято называть динамикой.

Временные ряды качественно отличаются от простых статистических выборок:

  1. Последовательные во времени уровни временных рядов являются взаимозависимыми. Особенно для близко расположенных наблюдений.

  2. В зависимости от момента наблюдения уровни временного рядов обладают разной информативностью: по мере их удаления от текущего момента времени информационная ценность пропадает;

  3. С увеличением количества уровней временного ряда точность статистических характеристик не будет увеличиваться пропорционально числу наблюдений, при появлении новых закономерностей развития она может даже уменьшаться;

  4. Изменение условий развития явления ведет к ослаблению действия одних факторов и уменьшения других, в конечном счете, к варьированию изучаемого признака во времени.

Анализ временных рядов, отражающих развитие экономических процессов, начинается с оценки данных. Они должны удовлетворять следующим условиям:

  1. Сопоставимость предполагает формирование всех уровней по одной и той же методике, использование одинаковых единиц измерения и шага наблюдений.

  2. Требование однородности данных предполагает отсутствие сильных изломов тенденций. А также нетипичных, аномальных наблюдений. При поиске тенденций бывает целесообразно отбросить часть прошлых данных, утративших закономерность прошлого развития. Аномальные (резко выделяющиеся) наблюдения формально проявляются как сильный скачок (спад) с последующим приблизительным восстановлением предыдущего уровня.

  3. Устойчивость характеризуется преобладанием закономерности над случайностью в изменении уровня ряда. На графиках устойчивых временных рядов визуально просматривается закономерность.


2.2. Факторы, под воздействием которых формируются уровни временного ряда.

В настоящее время уровень динамического ряда традиционно рассматривается как сумма по крайней мере 4-х составляющих, которые непосредственно не могут быть изменены, соответственно этому целесообразно выделить 4 типа факторов под воздействием которых и формируется уровень yn.

I тип. Долговременные факторы. Формирующие общую с длительной перспективой) тенденцию в изменении анализируемого показателя Yt. Обычно эта тенденция описывается с помощью той или иной случайной функции Tr(t), как правило, монотонной. Эту функцию называют функцией тренда (тренд).

II тип. Сезонные. Формирующие периодические повторяющиеся в определенное время года колебания анализируемого показателя. Условимся обозначать не случайной функции S(t). Поскольку эта функция должна быть периодической, в ее аналитическом выражении участвуют тригонометрические функции. Их периодичность обусловлена сущностью задач.

III тип. Циклические. Формирующий такие изменения, как обусловленные действием долговременных циклов экономической, демографической или даже космической периоды. (Волны Кондратьева, демографическое ямы, циклы солнечной активности и т.д.) Они приводят к тому, что значение изучаемого показателя в течение какого-либо времени возрастает, достигает определенного максимума, затем понижается и достигает определенного минимума и вновь возрастает до прежнего значения и т.д. Результат будет обозначен неслучайной функцией C(t).

IV тип. Случайные (нерегулярные). Не поддающиеся учету и регистрации факторы. Их воздействие на формирование значений ряда как раз и обуславливает стахостическую природу элемента y(t), а следовательно и необходимость интерпретации (y(t1), y(t2),…, y(tn)) как наблюдений, произведенных над величинами не являющимися строго детерминированными (определенными). Будем обозначать с помощью случайных величин (t).
Если динамический ряд разбить на различные компоненты, то он может быть представлен в виде:

Y(t) = Y(Tr(t), S(t), C(t), (t)) (2.1)
Выбирая ту или иную структурную схему влияния факторов на формирование значений Y(t) мы принимаем некоторую конкретную структурную модель временного ряда. В зависимости от взаимосвязи факторов (I – IV) может быть построена аддитивная или мультипликативная модель ряда динамики. Подчеркнем, что случайная составляющая IV является обязательной для любого ряда, так как случайные отклонения неизбежно сопутствуют любому экономическому процессу.
Если принять аддитивную структурную модель ряда динамики, то в общем случае мы представим соотношение (1) в виде разложения:

Y(t) = (1)Tr(t) + (2)S(t) + (3)C(t) + (t),

где (i) =
i = 1, 2, 3

Выводы о том, участвуют или нет факторы данного типа в формировании значений Y(t) могут базироваться как на анализе содержательной сущности задачи, так и на специальном статистическом анализе исследуемого временного ряда.

Аддитивная модель ряда динамики характеризуется главным образом тем, что характер циклических и сезонных колебаний остается постоянным.

Пример 1. Представленные в таблице 2.1. данные – это количество продукции, проданной компанией «Lewplan pic» в течении последних 13 кварталов.

Таблица 2.1

Квартал

Количество проданной продукции, тыс. шт.

Январь – март 2003

239

Апрель – июнь

201

Июль – сентябрь

182

Октябрь – декабрь

297

Январь – март 2004

324

Апрель – июнь

278

Июль – сентябрь

257

Октябрь – декабрь

384

Январь – март 2005

401

Апрель – июнь

360

Июль – сентябрь

335

Октябрь – декабрь

462

Январь – март 2006

481


К
ак следует из построенного по этим данным графика (рис. 2.1), возможен возрастающий тренд, содержащий сезонные колебания. Объемы продаж в зимний период (1 и 4 – й квартал) значительно выше, чем в летний (2 – и 3 –й ). Сезонная компонента в течении трех лет практически не меняется. Действительно, хотя в целом объем продаж возрос примерно с 230 тыс. шт. в 2003 г. до 380 тыс. шт. 2005 г., однако, увеличения амплитуды сезонных колебаний не произошло. Этот факт свидетельствует в пользу модели с аддитивной компонентой.

Рис. 2.1.

Если принять мультипликативную структурную модель ряд динамики, то соотношение (2.1) записывается в виде произведения компонент 1, 2, 3:

Y(t) = Tr(t) S(t)  C(t) + (t)

В этой модели характер циклических и сезонных колебаний остается построенным только по отношению к тренду.

Сезонные и циклические колебания присутствуют в значительной части финасово-экономических процессов. Для того чтобы их учитывать при проведении практических расчетов, необходимо уметь их измерять, предвидеть развитие процессов, подверженных сезонности и цикличности.

Решение поставленных задач сводится к выполнению следующих этапов:

- определение наличия во временном ряду тренда и степени его гладкости

- выявления наличия во временном ряду сезонных и циклических колебаний

- фильтрация компонент ряда

- анализ динамики сезонных и циклических колебаний

- исследование факторов, определяющих сезонные и циклические колебания.

- прогнозирование процессов с учетом сезонных и циклических колебаний.
2.3. Общая теория прогнозов.

После того, как предварительный анализ информации убедил нас в том, что данные сопоставимы, однородны, аномальных наблюдений нет, число наблюдений достаточно для проявления тенденции, исследуемый процесс устойчивый, а тенденция прослеживается отчетливо, можно приступить к подбору трендовых моделей и разработке прогноза.

Идея социально-экономического прогноза базируется по предположении, что закономерность развития, действительно в прошлом, сохраниться в прогнозируемом будущем. В этом смысле прогноз основан на экстраполяции.

Экстраполяция, проводимая в будущее, называется перспективная экстраполяция, а в прошлое – ретроспективная. Обычно, говоря об экстраполяции рядов динамики, подразумевают перспективную экстраполяцию.

Прогноз методом экстраполяции базируется на следующих предпосылках:

- развитие исследуемого явления в целом следует описывать плановой прямой.

- общая тенденция развития явления в прошлом и настоящем не должна претерпевать серьезных изменений в будущем.

- учет случайности позволит оценить вероятность отклонения от закономерного развития.

Поэтому надежность и точность прогноза зависит от того, насколько близкими к действительности окажутся эти предположения, а также как точно удалось охарактеризовать выявленную в прошлом закономерность.

Определение 2. Плавную кривую (гладкую функцию), аппроксимирующую (описывающую) временной ряд, принято называть кривой роста.

Собственно подбор такой кривой является аналитическим выравниванием. Чаще всего используются полиномиальные, экспоненциальные и S – образные кривые роста.

Экстраполяцию кривой роста на будущее в общем виде можно представить формулой.

(2.2)

Где – прогнозируемый уровень, n – номер последнего фактического уровня ряда динамики, k – период упреждения (на сколько шагов делаем прогноз).

Экстраполяция (2.2) дает возможность получить точечное значение прогноза. Точное совпадение фактических данных и прогностических точечных оценок, полученных путем экстраполяции кривых, характеризующих тенденцию, имеет малую вероятность. Возникновение соответствующих отклонений объясняется следующими причинами:

  1. Выбранная для прогнозирования кривая не является единственно возможной для описания тенденции. Можно подобрать такую кривую, которая дает более точные результаты.

  2. прогноз осуществляется на основании ограниченного числа исходных данных. Кроме того, каждый исходный уровень обладает еще и случайной компонентой. Потому и кривая, по которой осуществляется экстраполяция, будет содержать случайную компоненту.

  3. Тенденция характеризует лишь движение среднего уровня ряда динамики, потому отдельные наблюдения от него отклоняются. Если такие отклонения наблюдались в прошлом, то они будут наблюдаться и в будущем.

Практически экстраполированное прогнозирование экономических процессов, представленных одномерными временными рядами наблюдений, сводится к выполнению следующих этапов:

  1. Предварительный анализ данных. Проверить являются ли данные сопоставимыми, однородными, устойчивыми;

  2. Формирование набора аппроксимирующих функций (кривых роста). Выбрать какие модели могли бы описывать наши данные (линейная, параболическая, степенная и др.);

  3. Численное оценивание параметров моделей кандидатов. Вычислить коэффициенты моделей по одному из методов оценивания;

  4. Проверка адекватности моделей;

  5. Оценка точности адекватных моделей;

  6. Выбор лучшей модели;

  7. Расчет точечного и интервального прогнозов;

  8. Верификация прогноза. Посмотреть, реальны ли полученные по прогнозу результаты.


Остановимся подробнее на этапах 3, 4, 5 и 7.
2.4. Выявление тренда.

Метод проверки разностей средних уровней. Реализация этого метода состоит из четырех этапов.

На первом этапе исходный временной ряд y1, y2, y3, …, yn разбивается на две примерно равные по числу уровней части: в первой части n1 первых уровней исходного ряда, во второй — n2 остальных уровней (n1 + n2 = n).

На втором этапе для каждой из этих частей вычисляются средние значения и дисперсии:

; ;

; .

Третий этап заключается в проверке равенства (однородности) дисперсий обеих частей ряда с помощью F-критерия Фишера, которая основана на сравнении расчетного значения этого критерия:



с табличным (критическим) значением критерия Фишера F с заданным уровнем значимости (уровнем ошибки) . В качестве , чаще всего берут значения 0,1 (10%-ная ошибка), 0,05 (5%-ная ошибка), 0,01 (1%-ная ошибка). Величина (1–) называется доверительной вероятностью.

Если расчетное значение Fрасч меньше критического F, то гипотеза о равенстве дисперсий принимается и переходят к четвертому этапу. Если Fрасч больше или равно F, гипотеза о равенстве дисперсий отклоняется и делается вывод, что данный метод для определения наличия тренда ответа не дает. Для получения критического значения воспользуйтесь функцией FРАСПОБР(; n1; n2).

На четвертом этапе проверяется гипотеза об отсутствии тренда с использованием t-критерия Стыодента. Для этого определяется расчетное значение критерия Стыодента по формуле:

. (2.3)

где  — среднеквадратическое отклонение разности средних:

.

Если расчетное значение t меньше критического значения статистики Стьюдента t с заданным уровнем значимости , гипотеза принимается, т.е. тренда нет, в противном случае тренд есть. Для получения критического значения воспользуйтесь функцией CTЬЮДРАСПРОБР(; n1 + n2 -2). Заметим, что данный метод применим только для рядов с монотонной тенденцией.

2.5. Построение трендовой модели.

Формирование набора моделей, одна из которых будет использована для получения прогноза, происходит на основе интуитивных приемов (таких, например, как анализ графика ряда динамики), формализованных статистических процедур (исследование приростов уровней), а также содержательного анализа процесса. Предпочтение, как правило, отдается простым моделям, допускающим содержательную интерпретацию. К числу наиболее простых относятся линейные модели роста:

(2.4)
где a0 и a1 параметры модели, а t = 1, 2, …, n.

Рассмотрим оценку параметров модели по методу, сводящемуся к поиску таких значений a0 и a1, при которых сумма квадратов отклонений эмпирических (опытных) данных от рассчитанных по модели (2.4) является наименьшей – метод наименьших квадратов (МНК). Математически критерий такой оценки параметров записывается в виде


Для нахождения минимума функции двух переменных следует взять частные производные по a0 и a1, а затем приравнять их к нулю.







Упрощая, получаем



В результате получаем систему нормальных уравнений



Решая эту систему двух линейных уравнений с двумя неизвестными, получим:



где , , ,

Из второго уравнения получаем: ,

,



Найдя а1, подставим в первое уравнение и получим .

Таким образом, формулы для нахождения параметров а0 и а1:

(2.5)
2.6. Проверка адекватности моделей.

Важным этапом прогнозирования социально-экономических процессов является проверка адекватности (соответствия) модели реальному явлению. Для ее осуществления исследуют ряд остатков , то есть отклонений расчетных значений от фактических. Если модель выбрана правильно, то для остатков характерны:

  1. случайный характер значений. Проверяется с помощью критерия поворотных точек;

  2. отсутствие автокорреляции (самозависимости). Остатки должны быть независимыми друг от друга. Проверяется с помощью критерия Дарбина – Уотсона;

  3. нормальный закон распределения. Проверяется с помощью R/S – критерия;

  4. математическое ожидание остатков должно быть равно нулю и дисперсия остатков должна быть неизменна во времени. Проверяется с помощью t– критерия Стьюдента


Рассмотрим перечисленные требования подробнее.

  1. Для проверки условия случайности возникновения отдельных отклонений от модели часто используется критерий, основанный на поворотных точках. Уровень последовательности Ei считается максимумом, если он больше двух рядом стоящих уровней, т.е. Ei -1 < Ei > Ei +1 и минимумом, если он меньше обоих соседних уровней, т.е. Ei -1 > Ei < Ei +1. В обоих случаях Ei считается поворотной точкой; общее число поворотных точек для остаточной последовательности Ei обозначим через p.

В случайной выборке математическое ожидание числа точек поворота p и дисперсия 2p выражаются формулами:



Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства , где квадратные скобки означают целую часть числа. Если неравенство выполняется, то с вероятностью 95% делаем вывод о случайном характере ряда остатков. Если это неравенство не выполняется, модель считается неадекватной.

  1. Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является d-критерий Дарбина—Уотсона. Необходимо вычислить расчетное значение , где Еii- тый уровень остаточной последовательности (i=1..9). Теоретическое обоснование применения этого критерия обусловлено тем, что в динамических рядах как сами наблюдения, так и отклонения от них расположены в хронологическом порядке.

Значение d может располагаться в пределах от 0 до 4. При отсутствии автокорреляции значение d примерно равно 2. При полной автокорреляции – 0 или 4. Следовательно, оценки, получаемые по этому критерию, являются не точечными, а интервальными. Верхние (d2) и нижние (d1) критические значения, позволяющие принять или опровергнуть гипотезу об отсутствия автокорреляции, зависят от количества уровней динамического ряда и числа независимых переменных модели. Значения для этих границ при 5% уровне значимости приведены в Приложении 2. При сравнении расчетного значения d с табличным могут возникнуть следующие ситуации:

1)

2)

3)

4)

-

?

+

d'=4-d

не выполняется

неопределенность

выполняется

отрицательная

0

 

d1

 

d2

 

2

4







применить другой критерий






































r1│<0,36


















































Установив наличие автокорреляции остатков, надо улучшать модель.

Если же ситуация оказалась неопределенной (d1<d<d2), применяют другие критерии. В частности, можно воспользоваться первым коэффициентом автокорреляции: . Для суждения о наличии или отсутствии автокорреляции в исследуемом ряду расчетное значение коэффициента r1 сравнивают с критическим для 5%-го уровня значимости (в нашем случае можно взять в качестве rкрит = 0,36). Если │r1│ меньше критического значения, то делается вывод об отсутствии автокорреляции в ряду остатков. Если │r1│ больше

  1. Проверка гипотезы о нормальном распределении остаточной последовательности по R/SE – критерию. В нашем случае R = Emax   Emin, где Emax и Emin соответственно максимальный и минимальный уровни ряда остатков; . Вычисленное значение R/SE-критерия сравнивается с критическими нижней и верхней границами данного отношения. Критические границы приведены в Приложении 3. Если значение R/SE попадает в интервал между критическими границами, то с заданным уровнем значимости гипотеза о том, что остаточная последовательность распределена по нормальному закону, принимается; в противном случае эта гипотеза отвергается.

  2. Проверка гипотезы о равенстве математического ожидания случайной компоненты нулю на основе t   критерия Стьюдента. Расчетное значение этого критерия задается формулой где — среднее арифметическое значение уровней остаточной последовательности Et; SE — стандартное (среднеквадратическое) отклонение для этой последовательности. Если расчетное значение t меньше критического значения t,v статистики Стьюдента с заданным уровнем значимости  и числом степеней свободы v=n-1, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается; в противном случае эта гипотеза отвергается и модель считается неадекватной. Для получения критического значения t,v воспользуйтесь статистической функцией Excel CTЬЮДРАСПРОБР(;v);

Если ВСЕ четыре вышеперечисленные критерии дают положительный ответ, делается вывод о том, что выбранная модель является адекватной реальному ряду экономической динамики. Только в этом случае ее можно использовать для построения прогнозных оценок. В противном случае модель надо улучшать.
2.7. Оценка качества, значимости и точности модели.

Если модель оказалась статистически адекватной эмпирическим данным, то предстоит оценить ее качество, значимость и точность.

Проверка качества модели проводится с помощью коэффициента детерминации . Он показывает, какую долю вариации исследуемого признака Y описывает наша модель под воздействием изучаемого фактора. Чем ближе к единице R2, тем лучше качество модели.

Проверка значимости модели проводится с помощью F – теста. Если расчетное значение Fрасч больше критического F,1,2 при заданном уровне значимости  и со степенями свободы v1=m и v2=n-m (где m число факторов, включенных в модель), то модель считается значимой.



Для получения критического значения воспользуйтесь функцией FРАСПОБР(; v1,; v2).

Для оценки точности модели используйте стандартную ошибку оценки прогнозируемого показателя (или среднеквадратическое отклонение от линии тренда)

, (2.6)

где n- число опытов, m - число факторов, включенных в модель, и среднюю относительную ошибку аппроксимации Если ошибка Еотн не превышает 15%, то точность модели считается приемлемой. В общем случае допустимый уровень точности, а, значит, и надежности прогноза, устанавливает пользователь модели, который в результате содержательного анализа проблемы выясняет, насколько она чувствительна к точности решения и насколько велики потери из-за неточного решения.
2.8. Построение прогнозов.

Если в ходе проверки разрабатываемая модель признана значимой, достаточно точной, и ее качество нас устраивает, то на ее основе разрабатывается точечный прогноз. Он получается путем подстановки в модель значений времени t, соответствующих периоду упреждения k (количество шагов прогноза): t=n+k. Так в случае трендовой модели в виде полинома первой степени – линейной модели роста (4) – экстраполяция на k шагов вперед имеет вид:

(2.7)

Для учета случайных колебаний при прогнозировании рассчитываются доверительные интервалы, зависящие от стандартной ошибки (2.6), периода упреждения k, длины временного интервала n и уровня значимости прогноза ?. В частности, для прогноза (2.7) будущие значения с вероятностью (1–?) попадут в интервал:

где . (2.8)

В качестве примера рассмотрим разработку трендовой модели и получение прогнозных оценок динамики ВВП России на основе реального временного ряда, представленного в таблице 2.2.

Таблица 2.2

Динамика ВВП России



Дата

ВВП (млр. руб.)

1

1.99

238

2

2.99

249

3

3.99

287

4

4.99

340

5

5.99

342

6

6.99

373

7

7.99

360

8

8.99

380

9

9.99

403

10

10.99

419.08

11

11.99

451

12

12.99

460

13

1.00

379.8

14

2.00

410.7


Требуется:

I

  1. Определить наличие тренда



  1. Построить диаграмму зависимости Y от t, добавить линию тренда (нажать правую кнопку мыши, выделив любую из точек графика), вывести уравнение тренда на диаграмму (в пункте «Параметры тренда» поставить галочку на позиции «Показывать уравнение на диаграмме»);

  2. Построить линейную модель Y=a0+a1 t, параметры которой оценить по МНК. Сравнить их со значениями, полученными на диаграмме;

  3. Рассчитать модельные (предсказанные) значения и остатки .

  4. Оценить адекватность построенной модели на основе исследования:

Сделайте вывод об адекватности модели. Модель адекватна, если ВСЕ вышеперечисленные критерии дают положительный ответ.

  1. Провести проверку качества модели с помощью коэффициента детерминации . Он показывает, какую долю вариации исследуемого признака Y описывает наша модель под воздействием изучаемого фактора. Чем ближе к единице R2, тем лучше качество модели.

  2. Для оценки точности модели используйте стандартную ошибку оценки прогнозируемого показателя (или среднеквадратическое отклонение от линии тренда) , где n- число опытов, m- число параметров модели (если y=a01t – модель, то a0 и а1 – параметры), и среднюю относительную ошибку аппроксимации Если ошибка Еотн не превышает 15%, то точность модели считается приемлемой.

  3. Провести проверку значимости модели с помощью F – теста. Если расчетное значение Fрасч больше критического F,1,2 при заданном уровне значимости  и со степенями свободы v1=m и v2=n-m (где mчисло параметров модели), то модель считается значимой.



Для получения критического значения воспользуйтесь функцией FРАСПОБР(; v1,; v2).

  1. Построить точечный прогноз на два периода вперед. Он получается путем подстановки в модель значений времени t, соответствующих времени упреждения k: t=n+k. В случае линейной модели экстраполяция на k шагов вперед имеет вид: n+k=a0+a1*(n+k).

  2. Построить доверительный интервал для прогноза, полученного в предыдущем пункте, с вероятностью P=1-=1-0,3=0,7=70% и t=СТЬЮДРАСПРОБР(;n-1):

где .

  1. Отобразить на графиках фактические данные, результаты расчетов и прогнозирования.


Решение.

1. Определить наличие тренда Y(t).

1.1. С помощью критерия Фишера при ?=5% уровне значимости.

Разобьем исходный временной ряд y1, y2, y3, …, yn на две примерно равные по числу уровней части: в первой части n1=7 первых уровней исходного ряда, во второй — n2=6 остальных уровней (n1 + n2 = n).

Для каждой из этих частей вычисляются средние значения и дисперсии:

;

;

;



Проверим равенство (однородность) дисперсий обеих частей ряда с помощью F-критерия Фишера расчетное значение этого критерия:



Так как , то .

Сравним расчетное значение с критическим, полученным с помощью статистической функции Excel Fкрит = FРАСПОБР(; n1; n2) = FРАСПОБР(0.05;7;6)=4.2. Так как расчетное значение Fрасч меньше критического Fкрит (3.256< 4.2), то гипотеза о равенстве дисперсий принимается. Делается вывод о наличии тренда.

1.2. С помощью критерия Стьюдента при ?=5% уровне значимости.

проверяется гипотеза об отсутствии тренда с использованием t-критерия Стыодента. Для этого определяется расчетное значение критерия Стыодента по формуле:



где  — среднеквадратическое отклонение разности средних:

.

Для получения критического значения воспользуемся статистической функцией Excel tкрит=CTЬЮДРАСПРОБР(; n1 + n2 -2)= CTЬЮДРАСПРОБР(0.05; 11)=2.2. Расчетное значение t больше критического значения статистики Стьюдента tкрит (45.05>2.2), значит с вероятностью р=1-=0,95, гипотеза отвергается, т.е. тренд есть.

В противном случае, если бы t было бы меньше критического, то с заданным уровнем значимости =0,05 сделали бы вывод о том, что тренда нет.

2. Построить диаграмму зависимости Y от t, добавить линию тренда (нажать правую кнопку мыши, выделив любую из точек графика), вывести уравнение тренда на диаграмму (в пункте «Параметры тренда» поставить галочку на позиции «Показывать уравнение на диаграмме»).

Исходные данные и построенная модель нанесены на график (рис. 2.3)


Рис. 2.3. Исходные данные и линия тренда
3. Построить линейную модель Y(t) = а0 + а1t, параметры которой оценить МНК.

Для того чтобы воспользоваться формулами метода наименьших квадратов (2.5), необходимо произвести промежуточные вычисления, которые расположены в таблице 2.3.

Таблица 2.3.




t

Y

Y*t

t2




1

238

238

1




2

249

498

4




3

287

861

9




4

340

1360

16




5

342

1710

25




6

373

2238

36




7

360

2520

49




8

380

3040

64




9

403

3627

81




10

419,08

4190,8

100




11

451

4961

121




12

460

5520

144




13

410

5330

169

Сумма

91

4712,08

36093,8

819

Среднее

7

362,47

2776,45

63




Таким образом, искомая модель принимает вид: .

4. Рассчитать модельные (предсказанные) значения и остатки .

Расчеты приведены в табл. 2.4. В графе 3 приведены расчетные (предсказанные) значения результативного признака (ВВП России), полученные при подстановке фактора t его значений от 1 до 13 в модель . В графе 4 получены остатки вычитанием соответствующих значений элементов графы 3 из графы 2.

5. Оценить адекватность построенной модели. Важным этапом прогнозирования социально-экономических процессов является проверка адекватности (соответствия) модели реальному явлению. Для ее осуществления исследуют ряд остатков , то есть отклонений расчетных значений от фактических.

5.1. Для проверки условия случайности возникновения отдельных отклонений от модели часто используется критерий, основанный на поворотных точках. Уровень последовательности Ei считается максимумом, если он больше двух рядом стоящих уровней, т.е. Ei -1 < Ei > Ei +1 и минимумом, если он меньше обоих соседних уровней, т.е. Ei -1 > Ei < Ei +1. В обоих случаях Ei считается поворотной точкой (в графе 5 они обозначены 1, иначе 0); общее число поворотных точек для остаточной последовательности Ei обозначим через p=8 (сумма графы 5).

В случайной выборке математическое ожидание числа точек поворота p и дисперсия 2p выражаются формулами:



Критерием случайности с 5%-ным уровнем значимости, т.е. с доверительной вероятностью 95%, является выполнение неравенства , где квадратные скобки означают целую часть числа. Если неравенство выполняется, то с вероятностью 95% делаем вывод о случайном характере ряда остатков. Если это неравенство не выполняется, модель считается неадекватной. Проверим выполнение неравенства:



Так как р=8>4, то с вероятностью 95% делаем вывод о случайном характере ряда остатков.
Таблица 2.4.




t

yi



Ei=yi-

пово-

ротные

точки

(Ei-Ei-1)2

Ei2

Ei*Ei-1




1

2

3

4

5

6

7

8




1

238

259,964

-21,964

-

-

482,417

-




2

249

277,048

-28,048

1

37,015

786,690

616,046




3

287

294,132

-7,132

0

437,479

50,865

200,038




4

340

311,216

28,784

1

1289,959

828,519

-205,287




5

342

328,3

13,7

1

227,527

187,69

394,341




6

373

345,384

27,616

1

193,655

762,644

378,339




7

360

362,468

-2,468

1

905,047

6,091

-68,156




8

380

379,552

0,448

0

8,503

0,201

-1,106




9

403

396,636

6,364

1

34,999

40,500

2,851




10

419,08

413,72

5,36

1

1,008

28,730

34,111




11

451

430,804

20,196

1

220,107

407,878

108,251




12

460

447,888

12,112

0

65,351

146,7005

244,614




13

410

464,972

-54,972

-

4500,263

3021,921

-665,821

Сумма

91

4712,08

4712,08

-0,004

8

7920,913

6750,847

1038,221

Среднее

7

362,47

362,47

-0,0003














5.2. Проверка независимости значений уровней случайной компоненты, т.е. проверка отсутствия существенной автокорреляции в остаточной последовательности может осуществляться по ряду критериев, наиболее распространенным из которых является d-критерий Дарбина—Уотсона. Необходимо вычислить расчетное значение , где Еii- тый уровень остаточной последовательности (i=1..13) (расчеты приведены в графах 6 и 7 таблицы 2.4).

Критические границы d1=1,08 и d2 =1,36. Так как значение попадает в интервал d1<d<d2 (1.08<1.17<1.36) область неопределенности, значит нет оснований ни принять, ни отвергнуть гипотезу о существовании автокорреляции. Необходимо применять другой критерий. Воспользуемся первым коэффициентом автокорреляции:

. Сопоставляя это число с табличным значением первого коэффициента автокорреляции 0,485, взятым для уровня значимости ?=0,01 и n = 13, увидим, что расчетное значение меньше табличного (0,154<0,485). Это означает, что с ошибкой в 1% ряд остатков можно считать некоррелированным, т. е. свойство взаимной независимости уровней остаточной последовательности подтверждается.

5.3. Проверка гипотезы о нормальном распределении остаточной последовательности по R/SE – критерию. В нашем случае R = Emax   Emin= 28,784 – ( –54,972)=83,756, где Emax и Emin соответственно максимальный и минимальный уровни ряда остатков;

. Получаем расчетное значение критерия . Для n=13 и ?=0,05 найдем критический интервал: [2.92; 4.09]. Так как значение R/SE попадает в интервал между критическими границами, то с уровнем значимости 5% гипотеза о том, что остаточная последовательность распределена по нормальному закону, принимается.

5.4. Проверка гипотезы о равенстве математического ожидания случайной компоненты нулю на основе t   критерия Стьюдента. Расчетное значение этого критерия задается формулой где — среднее арифметическое значение уровней остаточной последовательности Ei (рассчитано в графе 4); SE — стандартное (средне-квадратическое) отклонение для этой последовательности. Для получения критического значения t,v воспользуемся статистической функцией Excel t,v = CTЬЮДРАСПРОБР(0,05; 12) = 2,16. Так как расчетное значение t меньше критического значения t,v статистики Стьюдента с заданным уровнем значимости =0,05 и числом степеней свободы v=n-1, то гипотеза о равенстве нулю математического ожидания случайной последовательности принимается.

Так как ВСЕ четыре вышеперечисленные критерии дают положительный ответ, делается вывод о том, что выбранная модель является адекватной реальному ряду экономической динамики.

6. Провести проверку качества модели с помощью коэффициента детерминации

.

Расчеты приведены в таблице 2.5. R2 показывает, какую долю вариации исследуемого признака Y описывает наша модель под воздействием изучаемого фактора. Следовательно, 88,7% данных описано нашей моделью.

7. Для оценки точности модели используем стандартную ошибку оценки прогнозируемого показателя (или среднеквадратическое отклонение от линии тренда) , где n=13 - число опытов, m=1 - число факторов, включенных в модель (это время t), и среднюю относительную ошибку аппроксимации . Так как ошибка Еотн<15%, точность модели считается приемлемой.

Таблица 2.5.




t

yi



Ei=yi-

Ei2










1

2

3

4

5

6

7

8




1

238

259,964

-21,964

482,417

15492,206

0,0923

36




2

249

277,048

-28,048

786,690

12874,917

0,1126

25




3

287

294,132

-7,132

50,865

5695,373

0,0249

16




4

340

311,216

28,784

828,519

504,797

0,0847

9




5

342

328,3

13,7

187,690

418,926

0,0401

4




6

373

345,384

27,616

762,643

110,930

0,0740

1




7

360

362,468

-2,468

6,091

6,090

0,0069

0




8

380

379,552

0,448

0,201

307,382

0,0012

1




9

403

396,636

6,364

40,500

1642,868

0,0158

4




10

419,08

413,72

5,36

28,730

3204,953

0,0128

9




11

451

430,804

20,196

407,878

7837,970

0,0448

16




12

460

447,888

12,112

146,701

9512,551

0,0263

25




13

410

464,972

-54,972

3021,921

2259,320

0,1341

36

Сумма

91

4712,08

4712,08

-0,004

6750,847

59868,283

0,6703

182

Среднее

7

362,47

362,47

-0,00031

 

 

0,0516

 



8. Провести проверку значимости модели с помощью F – теста. Необходимо сравнить расчетное значение



и критическое Fкрит при заданном уровне значимости =0,05 и со степенями свободы v1=m и v2=n-m-1 (где mчисло факторов, включенных в модель). Для получения критического значения воспользуемся статистической функцией Fкрит=FРАСПОБР(; v1; v2) = FРАСПОБР(0,05; 1; 11) =4,84.

Так как расчетное значение Fрасч =86,345 больше критического Fкрит=4,84, то модель считается значимой.

9. Построим точечный прогноз на два периода вперед (k=2). Он получается путем подстановки в модель значений времени t, соответствующих времени упреждения k=2: t=n+k=13+2=15. В случае линейной модели экстраполяция на k шагов вперед имеет вид: n+k=a0+a1*(n+k)=242.88+17.084*15=499.14 (млн. руб.). То есть экстраполяция модели на 2 шага вперед дает прогнозное значение ВВП на март 2000 года, равное 499,14 млн. руб.

10. Построим доверительный интервал для прогноза, полученного в предыдущем пункте, с вероятностью P=1-=1-0,3=0,7=70% и t=СТЬЮДРАСПРОБР(;n-1). В этом случае t=СТЬЮДРАСПРОБР(0,3;12)=1,083.

Получим интервальный прогноз:





где .

Таким образом, построенная нами модель является полностью адекватной динамике ВВП и достаточно надежной для краткосрочных прогнозов. Поэтому с вероятностью 70% можно утверждать, что при сохранении сложившихся закономерностей развития значение ВВП, прогнозируемое на март 2000 года с помощью линейной модели роста, попадет в промежуток образованный нижней и верхней границами доверительного интервала .

11. Отобразим на графиках фактические данные, результаты расчетов и прогнозирования (рис. 2.4).



Рис. 2.4. Исходные данные, линейная модель и доверительный интервал для прогноза

Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации