Лекции по эконометрике - файл n1.doc

Лекции по эконометрике
скачать (121 kb.)
Доступные файлы (1):
n1.doc121kb.02.11.2012 22:18скачать

n1.doc

Предмет и задачи эконометрики.

  1. Основные понятия.

1926 году Фреши ввел понятия эконометрика. В настоящее время используют понятие Айвозяна. Эконометрика – самостоятельная научная дисциплина, объединяющая совокупность теоретических результатов, приемов, методов и моделей, предназначенная чтобы на базе экономической теории, экономики, статистики и математического инструментария придавать конкретное, количественное выражение общим качественным закономерностям, обусловленных экономической теорий.

Эконометрика – наука, исследующая количественные закономерности и взаимозависимости в эконометрике при помощи методов математической статистики.

Основная цель эконометрики – модельное описание конкретных, количественных взаимосвязей, обусловленных общими качественными закономерностями.

Основная задача эконометрики – проверка экономической теории на фактическом материале при помощи методов математической статистики.

  1. Основные эконометрические модели, виды элементов.

Эконометрическая модель это формальное описание экономических явлений с помощью методов математической статистики.

Виды переменных:

- экзогенные переменные задаваемые из вне, существующие автономно, заранее планируемые (факторы) Х1,Х2,Х3…Хn.

- эндогенные переменные существуют внутри анализируемой системы, формирующиеся под взаимодействием экзогенных переменных и друг друга (результат) У1,У2,У3…

- лаговые эндогенные – измеряются в прошлые моменты времени.

- предопределенные (экзогенные, эндогенные, лаговые)

Экономическая модель служит для объяснения поведения эндогенных переменных в зависимости от значений экзогенных и лаговых эндогенных.

Этапы построения эконометрической модели:

  1. Определение, цели, исследования.

  2. Построение системы показателей и логический отбор факторов, наиболее влияющий на каждый показатель.

  3. Выбор формы связи, изучаемых показателей, между собой и отобранными факторами. Форма связи (функция) – линейная, нелинейная.

  4. Сбор исходных данных, их преобразование и анализ.

  5. Построение эконометрической модели и определение ее параметров.

  6. Проверка качества построения модели (Ф-тест Фишера, Т-тест Стьюдента)

  7. Использование модели для прогнозирования и эконометрического анализа.

Основные требования к факторам, включаемым в модель:

  1. Каждый из факторов должен быть описан теоретически (знание экон. теории)

  2. Необходимо включать только важнейшие факторы, показывающие существенное воздействие на изучаемый показатель.

  1. Факторы не должны быть линейно зависимыми (проверяется мультиколлиниарность)

  2. В модель рекомендуется включать факторы, которые могут быть численно измерены, т.е. соответствовать количественному признаку.

  3. В одну модель нельзя включать совокупный фактор.

  1. Основные типы моделей.

  1. Регрессионные модели с одним уравнением

    • Парная регрессия y=f(x;?)+? , у-результат, f-функция, х-фактор, ?-параметр(коэфф-т), ?-случайная ошибка (случ. компонент)

    • Множественная регрессия у= f(x1,x2,…,xn;?1, ?2,…, ?3) +?

Y^= f(x;?) уi-yi^= ? стремится к мин (0)

Используется обычный метод МНК.

  1. Временные ряды.

Yt=Tt+St+Et (аддитивная) Yt-уровень ряда, Tt-тренд, St-сезонная компонента, Et-случайная компонента.

Трендом временного ряда называется плавно изменяющаяся нециклическая компонента, описывающая чистое влияние долговременных факторов, эффект которых сказывается постепенно.

  1. Изменение демографического характера популяции

  2. Технологическое и экономическое развитие

  3. Рост потребителя и изменение его структуры

Сезонная компонента описывает поведение, изменяющееся регулярно, в течение некоторого периода. Циклические компоненты описывают длительные периоды относительного подъема и спада.

Yt=Tt*St*Et (мультиплекс)

Модели временных рядов могут применяться для изучения и прогнозирования объема продаж тур. путевок, спроса на ж/д и авиа билеты, при краткосрочном прогнозировании процентных ставок.

  1. Системы эконометрических уравнений(множественная регрессия тождества)

  1. Система линейных уравнений (СЛУ)

  2. Система рекурсивных уравнений (СРУ)

  3. Система одновременных уравнений, когда переменные у1,у2… играют роль результата, а в других фактора.

  4. Косвенный метод наименьших квадратов (КМНК)

Qt^s=a1+a2pt+a3pt-1+ ?1 (предложение)

Qt^д=в1+в2pt+в3pt-1+ ? 2(спрос)

Qt^s= Qt^д

Yt –доход в t

pt – цена в t

pt-1 –цена в предл. в t

ai,bi - переменные

экзогенные (фактор) – Yt

Эндогенные (результат) – pt

Лаговые эндогенные - pt-1, p1

Вывод: Эконометрика:

-метод регрессионного анализа

-анализ временных рядов

-анализ системных эконометрических уравнений

-методы классификации и снижения размерности

-макроуровень

-мезоуровень

-микроуровень



Парный регрессионный анализ.

Регрессия – функция, позволяющая по величине одного кореллируемого признака определить среднюю величину другого признака.

М(У(х))=f(x)

Этапы регрессионного анализа:

  1. Предположение – на этом этапе происходит выбор формы связи между переменными

  2. Параметризация – происходит оценка значений параметра в выбранной формуле статистической связи

  3. Проверка надежности полученных оценок. Ф-тест – правильность выбора формулы самой модели. Т-тест – позволяет проверить статистическую значимость найденных числовых значений параметра.

1 этап. ПРЕДПОЛОЖЕНИЕ.

Строится диаграмма. Поле корреляции – множество точек плоскости. Добавляется линия тренда.

2 этап. СПЕЦИФИКАЦИЯ.

Осуществляется поиск числовых значений параметра а, b или c. С помощью условия Гаусса-Маркова:

1). Мат. ожидание для любых значений случайной ошибки должно быть равно 0. Это условия выполняется, благодаря тому, что в модель вводят либо постоянное слагаемое, либо постоянный множитель.

2). Дисперсия значений случайной ошибки в любом наблюдении должна быть равна Д(ei)=Д(ej). Если не выполняется условие - не выполняется Т-тест.

Если это условие выполняется, то модель гомоскедастична (применяется ВМНК), если не выпоняется – гетероскедастична (МНК)

3).Отсутствие систематической связи между любыми значениями случайной ошибки

COV(Ei, Ej)=0 COV-ковариация (мера связи). Отвечает на вопрос, есть ли связь?

Если =0 – нет связи, если не = - связь есть

COV=1/n*sum(xi-xср)(yi-yср).

Если это условие не выполняется, то модель содержит автокорреляцию остатков.

4). Предполагает – в слабой форме предполагает отсутствие сист. связи между случайными составляющими фактора (самих факторов) и значениями случайной ошибки.

Требования, предлагаемые к числовым значениями параметра:

  1. Несмещенность – мат. ожидание оценки (числовые значения каждого параметра) должны быть равны его истинному значению.

  2. Состоятельность – при увеличении числа опытов числовые значения параметров должны сходятся по вероятности к искомому параметру.

  3. Эффективность – выбранная несмещенная оценка значений параметра должна обладать минимальной дисперсией.

Если условие 3-4 Гауса-Маркова нарушены, то свойство несмещенности и несостоятельности сохраняются, а вот свойство эффективности не выполняется.

ТЕОРЕМА ГАУСА - МАРКОВА

Для выполнения всех условий, числовые коэффициенты регрессии построены обычным МНК будут наилучшими линейными несмещенными оценками.

МНК: 1. с помощи линии тренда. 2 . с помощью стат. функции.

F=sum(Ei)^2=sum(yi-yi^)^2 стремится к 0. СУТЬ МНК.

МНК- метод оценивания параметров регрессии минимизирующей сумму квадратических отклонений наблюдений зависимой переменной(у) от искомой функции(у^)

Система описывает МНК и позволяет находить коэффициенты линейной модели.

Система:

Sum yi=n*a+b*sum xi

Sum yi*xi=a sum ai +b*sum xi^2

Метод линеаризации.

Сведение нелинейной модели к линейному виду.

Линейная модель: y^=a+bx.

Степенная модель: y^=a+x^b=ln y^=ln a+b*ln x

/сервис/анализ данных/регрессия.

Экспоненциальная модель: ln y^=a+bx, y^экс=ехр(а+bx), ln y^=ln(exp(a+bx)

Показательная модель: у^=a*b^x, ln y^=ln a+x*ln b

Гиперболическая модель: y^=a*b*1/n , y^=a+b*z, z=1/x1

Выбирается пустая ячейка, растягивается на 5 строчек и 2 строк.

В

a

Cигма(б)

Сигма(а)

R^2

Сигма(У)

F-тест

ЧСС

ESS

RSS

ESS-фактическая сумма квадратов

RSS-остаточная сумма квадратов

3 этап. ПРОВЕРКА НАДЕЖНОСТИ МОДЕЛИ.

Дисперсионный анализ: TSS=ESS+RSS, TSS-общая сумма квадратов

Sum(y-ycp)^2= Sum(y^-ycp)^2+Sum(y-y^)^2

Сумма

Сумма

ЧСС

Дисперсия на 1 Степень Свободы

Ф-факт

Ф-табличное

Общая ТСС

Sum(y-yср)^2

n

Добщ=sum(y-ycp)^2/n

Ф-факт=Дфак/Дост=R^2/(1-R^2)=(n-1)/1

Фтабл=(альфа, СС1,СС2

Fx/стат/ФРАСПОБР

Фактор ESS

Sum(y^-yср)^2

1

Дфакт= Sum(y^-yср)^2/(n-1)

Остаточн RSS

Sum(y-y^)^2

n-1

Дост= sum(y-ycp)^2/(n-1)

В парной регрессии всегда 1 фактор. Альфа-уровень значимости. Гипотеза -предположение чего-либо. Н0-об отсутствии различий, Н1(конкурирующая, альтернативная)-о значимости различий.

Ошибка 1го рода – когда отвергнута правильная гипотеза. Вероятность совершить эту ошибку называется уровнем значимости(альфа(бета)) 0,05;0,01;0,10

Ошибка 2го рода – принятие неправильной гипотезы.

Не совершить ошибку 1го рода – надежность (Р)

Не совершить ошибку 2го рода – мощность стат. критерия.

Стат. критерий – правило(метод), обеспечивающие надежность принятия истинной и отклонения ложной гипотезы с определенной вероятностью.

Множество значений стат.критерия образуют следующее области

  1. Область принятия гипотезы (ОДЗ) – совокупность значений критериев, при которых принимается нулевая гипотеза.

  2. Критическая область – совокупность значений стат. критерия при которых принимается Н1 (принимается Н0)

Этапы проверки стат. критериев:

  1. Формируется гипотеза Н0, Н1

  2. Уровень значимости альфа

  3. Кфакт, Кэкспер

  4. Ктабл, Кфакт

  5. Кфакт ? Ктабл

Правила вывода для стат. критерия:

  1. Правосторонний критерий – критерий принимающий только положительные значения.

Рис. из тетр.
Кфакт < Ктабл – прин Н0

Кфакт >= Ктабл – приним Н1, на уровне значимости альфа

  1. Левосторонний критерий


Кфакт < Ктабл – прин Н0

Кфакт <= Ктабл – приним Н1, на уровне значимости альфа

  1. Двусторонний критерий



|Кфакт| < |Ктабл| – прин Н0

Кфакт| >= |Ктабл| – приним Н1, на уровне значимости альфа

Ф-тест, Ф-критерий

1. Н0 - уравнение регрессии статистически не значимо

Н1 – уравнение регрессии статистически значимо.

2.Альфа

3. Ф факт=R^2/(1-R^2)*(n-2)/1

4. Fx/стат/ФРАСПОБР

5. Используем правило вывода правостороннего критерия

Т-тест – позволяет найти стат. значимость числовых значений коэффициентов модели (уравнение регрессии) с помощью Т-критерия Стьюдента.

1). Н0: В=0 (в стат. не значим), случайно отличается от 0.

Н1: В не равно 0 (в стат. знач), не случайно отличается от 0

2). Альфа (такой же, что Ф-тест)

3). Tфакт=КОРЕНЬ(Ф-факт)- двусторонний критерий

4). Ттабл=(Альфа, альфа=n-2), Fx/стат/СТЬЮДРАСПОБР

1. малый объем выборки

2. гетероскедастичность (ВМНК)

3. автокорреляция остатков

Коэффициент - корреляции.

Rxy=cos(x,y)/сигма(х)*Сигма(у) – мера связи

1.r xy=0– x,y- не связаны

2. r xу не равны 0, х.у-связаны

3. r xy=1, х,у-линейная связь, прямая связь.

4. r xy=-1, х,у-линейная связь, обратная связь.

5. 0
6. 0,4
7. 0,7
8. r xy>0 Прямая связь

9. r xy<0 Обратная связь

Множественный регрессионный анализ.

Множественная регрессия – уравнение связи с несколькими независимыми переменными.

Линейная модель: у^=a+b1x+bnxn

Степенная модель: y^= a*x1^b1…x2^b2

Показательная модель: y^=c ^a+b1x+bnxn

Экспоненциальная: y^=e^ a+b1x+bnxn

Гиперболическая: у^=1/ a+b1x+bnxn

Далее применяется метод линеаризации

  1. Сервис/анализ данных/ регрессия

  2. функция/статистические/линейн

Степенная модель:


Показательная:


Экспоненциальная


Гиперболическая

Стандартизованные переменные (коэффициенты)

Ветта i=bi* Сигма(хi)/Сигма(у)

Показывает на сколько сигм изменится результат от своего среднего значения, если фактор х увеличится на 1 сигму от своего среднего значения при неизменных остальных факторах.

Стандартизованные коэффициенты можно между собой сравнивать и фактор, имеющий наименьший коэффициент можно отбросить из модели.
Мультикаллиниарность.

Тесная линейная связь между факторами. В случае мультикаллиниарности наиболее значимый фактор оставляют, а остальное отбрасывают. (большее или равное 0,75)

Той переменной, которой соответствует наибольший коэффициент в результате и наибольший межфакторный, ту переменную оставляем.

  1. Выбрать строку или столбец, соответствующую у и выделяем другим цветом.

  2. Из не выделенных коэффициентов ищем значение большее по модулю 0,75 и определяем, каким переменным они соответствуют.

  3. Если стремится к 0 – то факторы имеют тесную линейную связанность, т.е. мультиколлиниарность.

Если стремится к 1 – то факторы линейно несвязанны, т.е. мультиколлиниарность отсутствует.

Множественный коэффициент корреляции.

Множественный коэффициент корреляции (R), показывает тесноту связи факторов и результатов совокупности.

R=КОРЕНЬ(SUM(вета i*r xy)

Множественный коэффициент детерминации.

R^2=(Ryx1x2…xn)

R^2=1-Dост/Dобщ

Dост=RSS/(n-k-1)

Dобщ=TSS/(n-1)

Коэффициент детерминации свидетельствует о качестве регрессионной модели и отражает долю общей вибрации результирующего признака (у), объясненную изменением функции регрессии. Между тем использование коэффициента детерминации в случае множественной регрессии является вполне корректным. Это происходит, потому что остаточная дисперсия уменьшится при ведении дополнительных переменных и если число факторов приближается к числу наблюдений (объему выборки), то остаточная дисперсия будет равна 0.

А коэффициенты множественной корреляции и детерминации приближается к 1.

Для того чтобы получить адекватную оценку, того на сколько хороша вариация результатов объясняется вариацией факторов переменной – скоррелированный коэффициент детерминации.

R^2=1-(1-R^2)*(n-1)/(n-k-1)

Частный критерий Фишера.

Этот критерий позволяет проверить на целесообразность включения той или иной переменной. Н0-целесообразно вкл. в модель, Н10- нецелесообразно вкл. в модель

Средний частный коэффициент эластичности.

Показывает силу влияния конкретного фактора на результат, помогает ранжировать факторы

Ф-тест как обычно.

Т-тест- не выполнился:

1. Малый объем выборки

2. Мультиколлиниарность

3.Гетероскедастичность

4. Автокорреляция остатков

5. Наличие незначимых факторов

Гетероскедастичность.

Не выполнение третьего условия Гаусса-Маркова, не выполнимость Т-теста.

Тест Уайта, Спирмена, Барлетта, Голдфилда-Квандта(Куандта)

Тест Голуфелда-Куалда – тест не выполнился – наличие гетероскедастичности.

Н0- гетероскедастичнсти нет, Н1-гетероскедастичность есть.

1.Ранжируем по х.

2азбивают все наблюдения на 3 группы. В середине выбирают m-ое количество выборок и их мысленно отбрасывают. m=1/4*n

  1. Для первых n1 значений находят остаточную сумму; то же делаем со второй группой

  2. если ранжировали по возрастанию: Кфакт=RSS2/RSS1

если ранжировали по возрастанию: Кфакт=RSS1/RSS2

  1. Ктабл(х, СС1, СС2) – (0,05; z,z) z=((n-m)/2)-2

К табл=ФРАСПОБР

7. Правосторонний

Kтабл>=Ктабл – Н0 не принимаем - есть гетероскедастичность – ВМНК

Кфакт<Ктабл – Н1 не принимаем – есть гомоскедастичность – обычный МНК

Тест Спирмена.

Но-есть, Н1-нет

  1. Вычисляем коэффициент корреляции (свойство коэффициента корреляции)

R xy = 1= 6*Sum(Dicp^2)/n(n^2-1)

Dicp=rapg x1-rapg Ei

Kфакт=R xe*КОРЕНЬ(х-1)<>0 – двусторонний

Ктабл=t

|Кфакт| >= |Ктабл|- H0 не принимаем

|Кфакт| < |Ктабл|- H1 не принимаем.

Далее аналогично 1му тесту.

Автокорреляция остатков.

3 условие Гаусса-Маркова, Т-тест не выполнился

Тест Дарбина – Уотсона

Но-автокорреляции остатков нет, Н1-автокорреляция есть.

D=2*(1-r)

  • R=0 – автокорреляции нет (связи между значениями случайных компонентов нет) выполняется 3 условие Гаусса-Маркова d=2

  • R=1 – автокорреляция есть (связь прямая) 3 условие Гаусса-Маркова не выполняется d=0

  • R=-1 – автокорреляция есть (связь обратная) 3 условие гаусса-Маркова не выполняется d=4.

Рисунок из тетради

Фиктивные переменные

Описывают атрибутивные признаки, при этом вводят переменных на 1 меньше. Чем число градации.

Примеры использования фиктивных переменных:

  1. Исследуется зависимость между продолжительностью полученного образования и заработком и в выборке представлены лица, как женского, так и мужского пола. Необходимо выяснить обуславливает ли пол респондента различия в результатах.

  2. Исследуется зависимость между доходом и потреблением в Бельгии. Выборка включает франкоговорящие семьи и семьи, говорящие по фиамандски. Необходимо выяснить имеет ли существенное значение это этническое различие.

  3. Имеются данные о темпах прироста среднедушевого ВВП и о зарубежной экономической помощи на душу населения по группе развивающихся стран, из которых некоторые являются демографическими. Необходимо проверить зависит ли от формы правления влияние оказываемое внеш. на экономический рост.

Критерий Чоу.

  1. Позволяет проверить целесообразность включения в модель фиктивной переменной.

  2. Позволяет определить однородность двух выборок (целесообразно объединить 2 выборки в 1 или нет)

Н0-1. фиктивную переменную нецелесообразно включать в модель

2 выборки однородны, можем рассматривать объединенную выборку.

Н1-1. фиктивную переменную целесообразно включать в модель

2. выборки неоднородны (разнородные)

Системы эконометрических уравнений.

1 тип. СИСТЕМЫ НЕЗАВИСИМЫХ УРАВНЕНИЙ. Это системы, в которых каждая зависимая переменная рассматривается как функция одного и того же набора факторов.

2 тип. СИСТЕМА РЕКУРСИВНЫХ УРАВНЕНИЙ. Зависимая переменная первого уравнения выступает в качестве факторов другого уравнения (т.е. каждый последний зависит от предыдущего). Пошагово каждое уравнение системы преобразуют в обычную множественную регрессию. Затем к каждому уравнению применяют МНК.

3 тип. СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ. Первая система называется структурной модели. От структурной модели переходят к приведенной форме модели. При обратном переходе может возникнуть проблема идентификации.

Проблема идентификации.

Идентификация – это единственность соответствия между приведенной и структурной форме модели. В связи с этой проблемой выделяют виды:

  1. Точно идентифицируемая

  2. Не идентифицируемая

  3. Сверхидентифицируемая

Модель идентифицируемая – если все структурные коэффициенты определены однозначно, единственным образом по коэффициентам приведенной формой модели (обычно число структурных совпадает с числом приведенных коэффициентв)

Модель неидентифицируемая - если число приведенных коэффициентов меньше числа структурных коэффициентов.

Сверхидентифицируемая – если число приведенных коэффициентов больше числа структурных.

Структурная модель называется точно идентифицируемой, если каждое уравнение этой системы точно идентифицируемо. Система неидентифицируема, если хотя бы 1 из уравнений неидентифицируемо. Система сверхидентифицируема, если содержит хотя бы 1 сверхидентифицируемое, а все остальные точно идентифицируемы.

Необходимое условие идетификации

Н: определить число эндогенных переменных, присутствующих в уравнении.

Д: Определить экзогенные переменные, которые есть в системе, но не в уравнении:

Д+1=Н, Д+1>Н, Д+1<Н

Достаточное условие.

1). Составляется матрица из коэффициентов, стоящие при переменных (экзо, эндо), которые в свою очередь отсутствуют в самом уравнении, но есть в системе.

2). Находят определитель матрицы (не равный 0)

3). Находят ранг матрицы (r>=H-1), Н-число всех эндогенных переменных,

Выполняемость 2 и3 условия говорит о том, что условие выполнилось.

Замечание: в экономических моделях часто наряду с уравнением, параметры которых должны быть статистически оценены используя., балансовые тождества переменных, коэффициенты при которых должны быть +1, -1. В том случае тождество не требует проверки на идентификацию, но при проверке самих уравнений на идентификацию, коэффициенты тождества участвуют.

КМНК

Применяется для решения систем точно идентифицируемых. Этот метод состоит из следующих этапов:

  1. Структурная модель преобразуется в приведенную.

  2. Для каждого уравнения приведенной формы модели с помощью обычного МНК оцениваются приведенные коэффициенты.

  3. Коэффициенты приведенной формы модели трансформируются в параметры (коэффициенты) структурной модели.

Двухшаговый МНК

Применяется для оценивания сверхидентифицируемой системы.

Основная идея: на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значений эндогенных переменных, содержащихся в правой части уравнения, далее подставив их вместо фактических значений, можно применит обычный МНК в структурной форме сверхидентифицированных уравнений. Двухшаговый МНК-т.к. МНК применяется дважды, на первом шаге при приведенной форме модели и нахождения на ее основе теоретических значений эндогенных переменных. На втором шаге применяется к структурному сверхидентифицируемому уравнению, при определении структурных коэффициентов модели по данным теоретическим значениям эндогенных переменных.


Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации