Лекции по статистике - файл n1.doc

Лекции по статистике
скачать (489.5 kb.)
Доступные файлы (1):
n1.doc490kb.02.11.2012 09:38скачать

n1.doc

Раздел 1
Выборочное наблюдение
Методические указания
Выборочное наблюдение представляет собой одно из наиболее широко применяемых видов несплошного наблюдения. При проведении данного метода обследуются не вся совокупность, а лишь её специально отобранные единицы. К ним предъявляются требование репрезентативности. Это значит, что при изучении отдельных единиц совокупности полученные выводы можно распространить на всю совокупность. Суть выборочного наблюдения заключается в получении первичных данных с последующим обобщением, анализом и их распространением на всю совокупность. Основная цель – получение достоверной информации об исследуемом явлении.

Репрезентативность обеспечивается соблюдением принципа случайности отбора объектов совокупности в выборку. Если совокупность является качественно однородной, то принцип случайности реализуется простым случайным отбором объектов выборки.

Между признаками выборочной совокупности и признаками генеральной совокупности существует расхождение, называемое ошибкой. Величина возможной ошибки выборочного признака слагается из ошибок регистрации и ошибок репрезентативности:

- ошибки регистрации (или технические ошибки) связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т.д.;

- ошибки репрезентативности бывают случайными и систематическими.

Систематические ошибки связаны с нарушением установленных правил отбора. Случайные – объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности. Величина случайной ошибки репрезентативности зависит от способа отбора единиц, объема выборки, степени изменчивости изучаемого признака в генеральной совокупности. Чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик.

Эти два вида ошибок связаны следующим соотношением: , где

- предельная ошибка выборки;

- средняя ошибка выборки;

t – коэффициент доверия, определяемый в зависимости от уровня вероятности.

Существуют специальные условия, требующие проведения выборочного исследования:

По данным выборки мы не можем найти точное значение характеристики или параметра генеральной совокупности, однако мы можем получить его приближенное значение или дать оценку.

При решении задач по данной теме необходимо принять следующие обозначения:

N – объем генеральной совокупности (число входящих в нее единиц);

n – объем выборки (число обследованных единиц);

- генеральная средняя (среднее значение признака в генеральной совокупности);

- выборочная средняя;

p – генеральная доля;

w – выборочная доля;

- генеральная дисперсия (дисперсия признака в генеральной совокупности);

S2 – выборочная дисперсия того же признака;

- среднее квадратическое отклонение в генеральной совокупности;

S – среднее квадратическое отклонение в выборке.
Раздел 2
Сводка и группировка статистических данных
Методические указания
Получаемая в результате статистического наблюдения информация об отдельных единицах совокупности характеризует их с различных сторон. Обобщающую характеристику в целом по совокупности можно получить, систематизируя и обобщая данную информацию. Анализ единичных факторов, позволяющий придти к обобщающим показателям, которые отражают сущность социально-экономических явлений, а также устанавливают статистические закономерности, представляет собой статистическую сводку. Вся работа по сводке подразделяется на следующие этапы:

Проведение сводки необходимо осуществлять по следующим этапам:

Статистическая сводка осуществляется по программе, составляемой одновременно с планом.

По глубине и точности обработки материала различают сводку простую и сложную.

Простая сводка – это операция по подсчету общих итогов по совокупности единиц наблюдения.

Сложная сводка – это комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по всему объекту и представление результатов группировки и сводки в виде статистических таблиц.

По форме обработки материала сводка бывает централизованной, когда весь первичный материал поступает в одну организацию, подвергается в ней обработке от начала до конца; децентрализованной, когда отчеты предприятий сводятся статистическими органами субъектов РФ, а полученные итоги поступают в Госкомстат РФ и там определяются итоговые показатели в целом по народному хозяйству страны.

По технике выполнения статистическая сводка бывает механизированной (с использованием электронно-вычислительной техники) и ручной. Ручная сводка применяется для небольших массивов данных и начинается с шифровки статистических формуляров (карточек). Затем они группируются с подсчетом их числа и других показателей.

Группировкой называется расчленение единиц изучаемой совокупности на однородные группы по определенным, существенным для них признакам. Данный статистический метод является важнейшим для обобщения статистических данных.

С помощью метода группировок решаются следующие задачи:

  1. Выделение социально-экономических типов явлений;

  2. Изучение структуры явления и структурных сдвигов, происходящих в нем;

  3. Выявление связи и зависимости между явлениями.

Что же необходимо знать для применения аналитической группировки?

  1. Определить какой признак является факторным, какой результативным. Такое деление признаков зависит от задачи исследования и характера данных. Факторный признак – это тот признак, который влияет на результативный.

  2. Определить число групп с помощью формулы:


n = 1+3,322 lg N, где

n – число групп,

N – число единиц в совокупности.

Практика показывает, что если число единиц в совокупности составляет до 20 единиц, то формируют 3 группы; 20-30 единиц – 4 группы; 30-40 единиц – 5 групп и т.д.

  1. Определить размер интервала:


где

d – размер интервала;

n – число групп;

X – значение факторного признака.
4. Определить границы групп.
Устойчивое разграничение объектов статистического наблюдения выражается классификацией или стандартом, в котором каждая запись может быть отнесена только к одной группе (например, классификация отраслей народного хозяйства, основных фондов и т.п.).

Группировки основаны на двух категориях – признаке и интервале. По группировочному признаку происходит объединение отдельных единиц совокупности в однородные группы, причем единичные и групповые признаки сначала могут быть неодинаковыми, но в конечном счете все сводится к количеству. Такова, например, группировка промышленных предприятий по отраслям. Поскольку одно предприятие выпускает продукцию разных видов, статистика решает этот вопрос по количественному преобладанию того или иного вида.

Интервал, представляя собой промежуток между наибольшим и наименьшим значениями в группе, очерчивает количественные границы групп. Интервалы могут быть равные и неравные, закрытые и открытые. В последнем случае имеется только одна – верхняя или нижняя граница.

В соответствии с задачами группировки различают следующие ее виды: типологическая, структурная, аналитическая (факторная).

Типологическая группировка – это расчленение разнородной совокупности на отдельные качественно однородные группы и выявление на этой основе экономических типов явлений. Она решает задачу выявления и характеристики типов социально-экономических явлений.

При построении группировки этого вида основное внимание должно быть уделено идентификации типов социально-экономических явлений и выбору группировочного признака. Решение вопроса об основании группировки должно осуществляться на основе анализа сущности изучаемого явления.

Структурной называется группировка, которая предназначена для изучения состава однородной совокупности по какому-либо варьирующему признаку. Она дает возможность описать составляющие части совокупности или строение типов социально-экономических явлений, а также анализировать структурные сдвиги.

Группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками, называется аналитической группировкой. Она позволяет оценить взаимосвязи между признаками статистических величин.

Раздел 3
Абсолютные, относительные и средние величины. Показатели вариации.
Методические указания.
Результаты статистических наблюдений собираются и регистрируются сначала в виде абсолютных величин, отражающих уровень развития явления или процесса. В статистике все абсолютные величины именованные, обладают конкретной размерностью. Они могут быть положительными и отрицательными.

Единицы измерения абсолютных величин являются простыми, отражая одно свойство (например, масса груза), или сложными, если они отражают несколько свойств в их взаимосвязи (например, товарооборот в тыс. руб.). Помимо этого, единицы измерения могут быть натуральными, условно-натуральными и стоимостными. Первые применяются для исчисления величин с однородными свойствами (например, штуки, тонны и т.д.). Недостаток их в том, что они не позволяют суммировать разнородные величины.

Условно-натуральные единицы измерения применяются для суммирования абсолютных величин с однородными свойствами, но проявляющимися по-разному.

Стоимостные единицы измерения выражаются в рублях или в иной валюте, представляя собой меру стоимости каждой абсолютной величины. Они позволяют суммировать даже разнородные величины, но недостаток их в том, что при этом часто не учитывается изменение экономических условий в виде инфляции.

При анализе информации статистика не может ограничиваться исчислением только абсолютных величин. В анализе важное место занимают производственные статистические показатели, относительные и средние величины.

Относительные величины – величины, полученные как результат отношения абсолютных или относительных величин. При этом величина, с которой сравнивают, называется основанием, базой сравнения или базисной величиной; а сравниваемая величина – текущей или отчетной.

При расчете относительных величин следует иметь в виду, что в числителе всегда находится показатель изучаемого явления. А в знаменателе показатель, с которым производится сравнение.

Проценты используются в тех случаях, когда сравниваемый абсолютный показатель превосходит базисный не более чем в 2-3 раза (или базисный превосходит сравниваемый не более чем в 100 раз). Проценты свыше 200-300 обычно заменяются коэффициентом; так 560% - 5,6 раза;

В зависимости от того, какое числовое значение имеет база сравнения, результат вычисления относительных величин может быть выражен в коэффициентах или процентах, либо в форме промилле () или децимилле ().

Для измерения абсолютных величин применяют прямой или косвенный методы измерений. При прямом методе измерения искомая величина находится с помощью наблюдения или опросом лиц. При косвенном методе величина рассчитывается опосредованно, через другие величины, связанные с искомой определенной зависимостью.

Относительные величины измеряются только косвенным методом.

По своему познавательному значению относительные величины подразделяются:

  1. Относительная величина выполнения договорных обязательств (выполнение плана).

  2. Относительная величина структуры.

  3. Относительная величина динамики.

  4. Относительная величина координации.

  5. Относительная величина сравнения.

  6. Относительная величина интенсивности.


ОВ выполнения договорных обязательств = ; где

О – отчетные данные,

П – данные, предусмотренные договором (плановые).
ОВ структуры представляет собой отношение изучаемой части совокупности ко всей совокупности.
ОВ динамики характеризует развитие изучаемого явления за определенные периоды. Определяется в процентах.
ОВ координации характеризует соотношение между отдельными частями одной совокупности.
ОВ сравнения характеризует соотношение между одноименными показателями, относящихся к различным объектам.
ОВ интенсивности показывает насколько широко распространено изучаемое явление в той или иной среде. Показатели, которые определяются в и , а также именованные показатели относятся к показателям интенсивности.
Средней величиной называется обобщающая количественная характеристика признака в статистической совокупности, отражающая типичный уровень этого признака в расчете на единицу совокупности. Данная величина является показателем, характеризующим значение признака, связи признаков, их динамику и структуру в совокупности массовых явлений.

Существуют различные виды средних величин:

- средняя геометрическая;

- средняя гармоническая;

- средняя арифметическая;

- средняя квадратическая;

- средняя кубическая.

Вопрос о том, какой вид средних применяется в том или ином случае зависит от задачи исследования и характера данных.

Введем следующие обозначения:

  1. Признак, по которому находится средняя, называется усредняемым признаком и обозначается .

  2. Значения усредняемого признака у отдельных единиц совокупности называется вариантом и обозначается х1,х2,…,хn.

  3. Повторяемость (численность отдельных вариантов) называется частотой и обозначается f.


Средняя арифметическая является самым распространенным видом средних величин. Под ней понимают такое среднее значение признака, при замене которым индивидуальных значений признака суммарный объем этого признака по совокупности в целом сохраняется неизменным, т.е. средняя арифметическая есть среднее слагаемое. Она применяется для усреднения абсолютных и относительных величин. Ее можно получить с помощью формулы:

где n – число вариантов.

Средняя арифметическая простая определяется, когда ряд одиночный или же варианты имеют одинаковую численность.

Помимо этого, средняя арифметическая используется в тех случаях, когда расчет осуществляется по группировочным данным или вариационным рядам. При этом применяется средняя арифметическая взвешенная:


Часто приходится вычислять среднюю величину в интервальных рядах. Тогда в качестве х выступают середины интервалов.

  1. В закрытом интервале, середина интервала определяется как полусумма значений нижней и верхней границ, т.е. середина интервала равна:


(нижняя граница + верхняя граница)/2


  1. В открытом интервале допускается, что расстояние между границами такое же, как и в соседнем интервале. Исходя из этого, сначала определяется значение недостающей границы и после этого вышеназванным способом определяется середина интервала.


Средняя гармоническая определяется, когда информация не содержит частот по отдельным вариантам (отсутствует информация по f), а представлена как их произведение (есть информация по xf).

В зависимости от характера данных применяется:

- средняя гармоническая простая



- средняя гармоническая взвешенная



Когда одиночный ряд представлен средними или относительными величинами применяется средняя гармоническая простая.

Для характеристики структуры совокупности применяются особые средние. Их мы называем структурными средними. К их числу относятся мода и медиана.

Мода часто применяется в коммерческой практике при регистрации цен; изучении покупательского спроса и т.д. В дискретном ряду модой является вариант с наибольшей частотой.

В интервальном ряду модой примерно считают центральный вариант модального интервала, т.е. интервала, который имеет наибольшую численность. Такое решение будет правильным при полной симметричности распределения, или же когда интервалы, соседние с модальным, не значительно отличаются друг от друга по числу случаев.

В интервальном ряду мода определяется по формуле:
, где
Хмонижняя граница модального интервала;

iморазмер модального интервала;

fмочастота модального интервала;

fмо-1частота, предшествующая модальному интервалу;

fмо+1частота, последующая за модальным интервалом.
Медиана делит численность упорядоченного ранжированного ряда на 2 равные части. Одна равная часть имеет значения варьирующего признака больше, чем медиана. Другая равная часть меньше, чем медиана.

Для одиночного ранжированного ряда с нечетным числом медианой является центральный вариант.

В интервальном ряду порядок нахождения медианы следующий:

1. Индивидуальные значения варьирующего признака располагаются по ранжиру.

2. Для ранжированного ряда определяются накопленные частоты.

3. По данным о накопленных частотах определяется медианный интервал. Медианным является тот интервал, где накопленная частота составляет половину или больше половины всей суммы частот, а предыдущая накопленная частота должна быть меньше половины всей суммы частот.

После определения медианного интервала находится медиана с помощью следующей формулы:

, где
Хменижняя граница медианного интервала;

iме - размер медианного интервала;

?fсумма частот;

Sме-1 - накопленная частота, предшествующая медианному интервалу;

fмечастота (численность) медианного интервала.
Показатели вариации.

Различие индивидуальных значений признака внутри изучаемой совокупности называется вариацией признака. Она возникает в результате того, что его индивидуальные значения складываются под совокупным влиянием разнообразных факторов, которые по-разному сочетаются в каждом отдельном случае. Как известно, средняя величина дает обобщающую характеристику изучаемых совокупностей. Однако средняя не показывает строения совокупности, которое является весьма существенным фактором.

Дело в том, что отдельные значения признака могут близко примыкать к средней или значительно отклоняться от неё. Если отдельные значения признака близко примыкают к ней, то она объективно отражает изучаемую совокупность, а когда отдельные значения признака далеко отстают от средней, то она не точно отражает совокупность.

Колеблемость отдельных значений признака характеризуют показатели вариации.

В статистике исчисляются абсолютные средние и относительные показатели вариации.

Абсолютные и средние показатели вариации. Средний показатель вариации находится по формуле:


Самый простой способ изучения этого явления – определение размаха вариации:

(разность между наибольшим и наименьшим значениями изучаемого признака).

Средниее линейные отклонения определяются как средняя арифметическая из отклонений индивидуальных значений от средней без учета знака этих отклонений.

В дискретном ряду .

В интервальном вариационном ряду:

Среднее линейное отклонение как меру вариации признака в статистической практике применяют редко. Во многих случаях оно не устанавливает степень рассеивания. На практике меру вариации признака более объективно отражают показатели дисперсии и среднее квадратическое отклонение.

В дискретном ряду дисперсия () находится по формуле:


В интервальном вариационном ряду:


Соответственно среднее квадратическое отклонение:


Относительные показатели вариации.

При расчете относительных показателей вариации базой для сравнения служит средняя арифметическая. Эти показатели дают характеристику однородности совокупности. К ним относят:
1.Коэффициент осцилляции


2.Линейный коэффициент вариации


  1. Коэффициент вариации




Если значение коэффициента вариации ниже 38%, то это означает, что средняя более или менее отражает изучаемую совокупность объективно.

Изучая дисперсию интерпретирующего нас признака в пределах исследуемой совокупности, мы не можем определить влияние факторов, характеризующих колеблемость изучающего признака. Это можно сделать с помощью аналитической группировки, подразделив изучаемую совокупность на группы по факторному признаку. При этом можно определить 3 показателя колеблемости.

    1. Общая дисперсия ()

    2. Межгрупповая дисперсия ()

    3. Средняя из внутригрупповых дисперсий ()


Общая дисперсия характеризует вариацию признака, который зависит от всех условий.


Y – значение результативного признака;

- среднее значение результативного признака


Межгрупповая дисперсия характеризует вариацию признака, которая возникает под влиянием факторного признака.
, где

- групповые средние результативного признака.
Средняя из внутригрупповых дисперсий характеризует вариацию признака, которая возникает под влиянием всех других условий за исключением факторного признака.

Получается, что общая дисперсия равна:


Это так называемый закон сложения дисперсий. Он имеет огромное значение для определения взаимосвязей между отдельными показателями. Для этого определяется:

  1. Коэффициент детерминации.




  1. Эмпирическое корреляционное отношение.




Считается, что если принадлежит интервалу от 0,1 до 0,3, то связь почти отсутствует. Если принадлежит интервалу от 0,3 до 0,5 – связь умеренная; от 0,5 до 0,7 – связь сильная; свыше 0,7 – весьма высокая.


Раздел 4
Изучение динамики общественных явлений. Ряды динамики.
Методические указания.
Общественно-экономические явления развиваются во времени. Изучение происходящих при этом изменений является одним из необходимых условий познания их динамики. Динамизм социально-экономических явлений является результатом взаимодействия разнообразных причин. Поскольку их совокупное действие происходит во времени, то именно оно выступает в качестве собирательного фактора развития. Основная цель изучения динамики общественно-экономических явлений состоит в определении и измерении закономерностей их развития во времени. Такая задача решается путем построения и анализа статистических рядов динамики. Рядами динамики называется статистические данные, характеризующие развитие изучаемого явления во времени. В каждом ряду динамики выступают или присутствуют два основных элемента:

tпоказатель времени;

y – соответствующие им уровни развития.

В зависимости от показаний времени ряд динамики подразделяется на моментный и интервальный. Моментный ряд характеризует состояние изучаемого явления на определенные даты (числа). Особенностью такого ряда является то, что в его уровни могут входить одни и те же единицы совокупности. Поэтому при суммировании моментного ряда, мы получаем повторный счет.

Интервальный ряд характеризует развитие изучаемого явления за определенные периоды времени. Особенностью является то, что каждый его уровень складывается из данных за более короткие промежутки времени.

В зависимости от способа сопоставлений, показатели динамики исчисляются на постоянной и переменной базах сравнения.

Для определения показателей динамики на постоянной базе каждый уровень ряда динамики сравнивается с одним и тем же базовым уровнем. Такие показатели называются базисными.

Для определения показателей динамики на переменной базе каждый уровень ряда сравнивается с предыдущим. Такие показатели называются цепными показателями.

Показатели динамики.

Для изучения динамики социально-экономических явлений в статистике исчисляются особые показатели. К числу показателей динамики относятся:

А) Абсолютный прирост (АП);

Б) Темп роста (ТР);

В) Темп прироста (ТП);

Г) Абсолютное значение одного процента прироста (А).
Абсолютный прирост определяется как разность двух уровней и исчисляется в единицах измерения изучаемой информации.




Уi – отдельные уровни ряда динамики;

У0 – базовый уровень;

Уi-1 – предыдущие уровни.

Между этими показателями есть взаимосвязь: ?АПц = ?АПб последнего периода.
Темп роста характеризует соотношение двух уровней и обычно определяется в процентах, иногда в коэффициентах.





Между этими показателями существует взаимосвязь: произведение ТРц = ТРб последнего периода.
Темп прироста характеризует абсолютное изменение в относительных величинах. Определяется в процентах, иногда в коэффициентах.





Между темпами роста и прироста существует взаимосвязь:
ТП = ТР – 100 (1)
Абсолютное значение одного процента прироста определяется по следующей формуле:

.

Средние показатели в рядах динамики. Для получения обобщающих показателей в рядах динамики используются средние показатели. С их помощью выявляется тенденция развития исследуемых явлений.

  1. Средний уровень ряда динамики ()

Если ряд динамики моментный с равностоящими датами, то
, где п – число периодов.

Если ряд динамики моментный с не равностоящими датами, то
, где t – продолжительность периодов.

Если ряд динамики интервальный, то



  1. Средний абсолютный прирост () определяется тремя способами:

а) Через цепные абсолютные приросты:



б) Через базисные абсолютные приросты:


в) Через абсолютные уровни:



  1. Средний темп роста () также можно найти несколькими способами:

а) Через цепные темпы роста:


б) Через базисные темпы роста:



  1. Средний темп прироста () равен:




Раздел 5
Выравнивание вариационных рядов (построение теоретических распределений).
Методические указания.
Наиболее часто используются законы распределения нормальный и Пуассона.

График нормального распределения имеет форму колоколообразной кривой, симметричной относительно , концы которой асимптотически приближаются к оси абсцисс. Она имеет точки перегиба, абсциссы которых находятся на расстоянии от центра симметрии. Эта кривая выражается уравнением:
где

y – ордината кривой нормального распределения;
- нормированные отклонения.

При выравнивании вариационного ряда по кривой нормального распределения теоретические частоты ряда определяются по формуле
где

N = ?fсумма всех частот вариационного ряда;

h – величина интервала в группах (классах);

- среднее квадратическое отклонение;

t – нормированное отклонение вариантов от средней арифметической.

Значение ординат кривой нормального распределения будет соответствовать величине , которая будет табулирована и определяется по таблицам значений данной функции.

Распределение Пуассона. В целом ряде случаев, если вариационный ряд представляет собой распределение по дискретному признаку, где по мере увеличения значений признака x частоты резко уменьшаются и где средняя арифметическая ряда равна или близка по значению к дисперсии, т.е. , то такой ряд можно выровнять по кривой Пуассона, аналитическое выражение которой
где

Pxвероятность наступления отдельных значений x;

a=- средняя арифметическая ряда.

Теоретические частоты при выравнивании эмпирических данных определяются по формуле:
где

f – теоретические частоты;

N – общее число единиц ряда.

После выравнивания ряда, т.е. нахождения теоретических частот, возникает необходимость проверить, случайны или существенны расхождения между эмпирическими и теоретическими частотами, и тем самым проверить правильность выдвинутой при выравнивании ряда гипотезы о наличии того или иного характера распределения в эмпирическом ряду.

Для оценки близости эмпирических (f) и теоретических () частот можно применить один из критериев согласия: критерий Пирсона (), критерий Романовского, критерий Колмогорова ().

Критерий Пирсона () представляет собой сумму отношений квадратов расхождений между f и к теоретическим частотам:


Фактическое значение X2 сравнивают с критическим, определяемым по специальным таблицам в зависимости от принимаемого уровня значимости и числа степеней свободы.

Уровень значимости () – вероятность допуска ошибки в утверждении гипотетического закона (характера) распределения – обычно принимается равным 5% (=0,05).

Число степеней свободы () рассчитывается: где

m – число групп в ряду распределения; b – число параметров эмпирического распределения, использованных для нахождения теоретических частот. Так, при выравнивании по кривой нормального распределения число степеней свободы , поскольку при расчете теоретических частот используется два параметра эмпирического распределения.

Если фактическое оказывается меньше табличного (критического), то расхождения между эмпирическими и теоретическими частотами можно считать случайными.

Критерий Романовского:


Если указанное отношений меньше 3, то расхождения считают случайными, если больше 3, то они существенны.

Критерий Колмогорова () основан на определении максимального расхождений между накопленными частотами эмпирического и теоретического распределений:
где

D – максимальная разность между накопленными частотами ;

N – сумма всех частот.

Далее по таблицам находится P(). Чем вероятность ближе к 1, тем увереннее мы можем утверждать, что расхождения между частотами случайны.

На основании полученных значений критериев согласия делаются выводы о близости эмпирических и теоретических частот, таким образом, подтверждается или опровергается гипотеза о наличии того или иного характера распределения в эмпирическом ряду.

Раздел 6
Экономические индексы.
Методические указания.
Индексный метод имеет важное значение при анализе статистической информации. Они широко применяются в экономических разработках государственной и ведомственной статистики.

В зависимости от характера данных вычисляются индексы объемных и качественных показателей. По средствам индексов объемных показателей изучаются изменения физического объема (количества), объема основных фондов, оборотных средств, численности работников и т.д.

С помощью индексов качественных показателей изучаются изменения цен, себестоимости, рентабельности, фондоотдачи, производительности труда и т.д.

Статистический индекс – это относительная величина сравнения сложных совокупностей и отдельных их единиц. При этом под сложной понимается такая совокупность, отдельные элементы которой непосредственно не подлежат суммированию. Поэтому для получения обобщающих величин сложных статистических совокупностях прибегают к индексному методу.

Основой индексного метода является переход от натуральной формы выражения товаров и услуг к денежным измерителям.

Индивидуальные и общие индексы. В зависимости от степени охвата единиц в изучаемой совокупности индексы подразделяются на индивидуальные и общие.

Индивидуальные индексы характеризуют изменения отдельных единиц статистической совокупности.

Общие индексы выражают совместные результаты изменения всех единиц, формирующих статистическую совокупность. Они обладают синтетическими и аналитическими свойствами. Синтетические свойства общих индексов состоят в том, что с их помощью производится соединение в целое разнородных единиц статистической совокупности. Аналитические свойства общих индексов заключаются в том, что по средствам индексов изучаются влияния различных факторов на изучаемые явления.

Основным элементом индексного отношения является индексируемая величина. Под ней понимают значение признака, изменение которого является объектом изучения.

Для получения индекса необходимо произвести сопоставление не менее 2-х величин. При изучении динамики социально-экономических явлений сравниваемая величина (числитель индексного отношения) принимается за текущий период и обозначается через «1», а величина, с которой производится сравнение – за базовый период и обозначается через «0».

Введем следующие обозначения:

Индивидуальный индекс (i)

Общий индекс (y)

Цена (p)

Физический объем (q)

Себестоимость (z)

Производительность труда (w)

Фондоотдача (f)

Средне-балансовый объем основных фондов ()

Средне-списочная численность () и т.д.

Агрегатные индексы. Они являются основной формой общих индексов. В числителе и знаменателе агрегатных индексов содержаться соединительные наборы элементов изучаемых совокупностей.

Для достижения сложных статистических совокупных однородностей в индивидуальные отношения вводятся специальные соизмерители.

В качестве соизмерителей выступают тесно связанные с индексными величинами показатели. Произведение соизмерителей на индексируемые величины формирует в индексном отношении определенную экономическую категорию.

В числителе и знаменателе агрегатных индексов изменяется значение только индексируемой величины. А соизмеритель является постоянной величиной и фиксируется на уровне одного и того же периода: базисного или отчетного.

Если в качестве соизмерителей выступают количественные показатели (физический объем, объем основных фондов, оборотных средств, и т.д.), берутся данные отчетного периода, а когда в качестве соизмерителей выступают качественные показатели (цена, себестоимость, фондоотдача и т.д.) берутся данные базового периода.

Построим общий индекс индексируемой величины:




Построим общий индекс цен:



Данный индекс показывает, насколько процентов изменился товарооборот под влияние цен. В разности мы получаем абсолютное изменение товарооборота.


Вторым взаимосвязанным индексом выступает общий индекс физического объема:


Данный индекс показывает, насколько процентов изменился объем товарооборота под влиянием физического объема.


В разности мы получаем абсолютное изменение товарооборота под влиянием физического объема.

Третьим взаимосвязанным индексом выступает общий индекс товарооборота.


Данный индекс показывает, насколько процентов изменился товарооборот под совокупным влиянием цены и физического объема.


Между этими индексами существует взаимосвязь: или же .

Средние индексы. Часто бывает так, что не вся информация становится доступной. Поэтому при определении индексов применяется среднегармоническая и среднеарифметическая форма.

Среднегармоническая форма общего индекса цен определяется следующим образом:


Среднеарифметическая форма общего индекса цен:


Среднеарифметическая форма общего индекса физического объема:


Индексы применяются также при изучении изменений средних величин. Как известно, на среднюю цену товаров и услуг влияют индивидуальные цены и структурные сдвиги. Для определения совокупного влияния цен и структурных сдвигов на изменение средней цены применяется индекс цен переменного состава (Ypпер/с):


Индекс цен переменного состава означает, насколько процентов изменилась средняя цена изучаемого товара под совокупным влиянием индивидуальных цен и структурных сдвигов.

В разности мы получаем абсолютное изменение средней цены изучаемого товара под совокупным влиянием p и q.


Для определения влияния индивидуальных цен на изменение средней цены применяется индекс цен постоянного состава (Ypпос/с):


Индекс цен постоянного состава показывает, насколько процентов изменилась средняя цена изучаемого товара под влиянием индивидуальных цен. В разности мы получаем абсолютное изменение средней цены под влиянием индивидуальных цен.


Для определения влияния структурных сдвигов на изменение средней цены применяется формула индекса структурных сдвигов.
показывает

насколько процентов изменилась средняя цена изучаемого товара под влиянием структурных сдвигов. В разности мы получаем абсолютное изменение средней цены под влиянием структурных сдвигов.


Между этими индексами существует взаимосвязь:
или


Раздел 7
Корреляционно-регрессионный анализ.
Методические указания.
Формы проявления взаимосвязей явлений и процессов весьма разнообразны. Среди них выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае факторной величине строго соответствует одно из нескольких значений функции. Достаточно часто функциональная связь проявляется в физике, а в экономике ее примером может служить прямая зависимость между натуральной производительностью труда и выпуском продукции.

Корреляционная связь проявляется в среднем, для массовых наблюдений, когда каждому значению соответствует некоторый интервал вероятных значений функции. Это объясняется сложностью взаимосвязей между анализируемыми факторами, на взаимодействие которых оказывают влияние случайные обстоятельства. При этом увеличение аргумента влечет за собой лишь среднее увеличение или снижение функции, тогда как конкретные значения ее величин будут отличаться от среднего.

По направления связи бывают прямыми (положительными), когда зависимая переменная растет с увеличением факторного признака, и обратными (отрицательными), когда рост последнего вызывает снижение функции.

По аналитической форме связи бывают линейными и нелинейными, выражаясь соответствующими формулами.

По количеству взаимодействующих факторов различают связи парные (два фактора) и множественные (больше двух).

По силе различаются слабые и сильные связи, теснота которых определяется специальными критериями.

Данные классификационные признаки связей наиболее часто встречаются в статистическом анализе. Кроме этого, различают также связи непосредственные, косвенные и ложные. Что же они собой представляют? В первом случае два фактора взаимодействуют между собой непосредственно. Для косвенной связи характерно участие какой-то третьей переменной, опосредующей связь между изучаемыми факторами. Ложная связь бессмысленна, так как устанавливается лишь количественно, не имея в себе смысловой основы.

Для изучения статистических взаимосвязей применяются два метода анализа – корреляционный и регрессионный. Основные задачи корреляционного анализа сводятся к измерению тесноты связи между факторами, выявлению неизвестных причин связей и оценке факторов, оказывающих максимальное влияние на результат.

Задачи регрессионного анализа лежат в сфере установления формы зависимости, определения регрессии и его использования для оценки неизвестных значений зависимой переменной.

Для расчета параметров уравнения регрессии и (в основном используется линейное уравнение регрессии - для парной регрессии и - для множественной регрессии с двумя факторными признаками) применяется метод наименьших квадратов, решая систему нормальных уравнений для парной регрессии:


для множественной регрессии:

В уравнениях регрессии параметр показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр показывает, насколько изменяется в среднем значение результативного признака при изменении i-ого факторного на единицу его собственного измерения.

Проверка адекватности моделей, построенных на основе уравнений регрессии, начинается с проверки значимости каждого коэффициента регрессии. Значимость коэффициента регрессии осуществляется с помощью средней ошибки каждого параметра .


где - остаточная дисперсия

Сопоставляя значение параметра с его средней ошибкой, по значению судят о значимости данного параметра. Если число наблюдений n20, то параметр считается значимым при . Если n меньше 20, то обращаются к специальным таблицам значений t- критерия Стьюдента.

Адекватность полученной модели можно оценить с помощью средней ошибки аппроксимации:
.

Ее значение не должно превышать 12-15%, в противном случае модель считается неадекватной.

Оценка тесноты связи измеряется различными способами:




где С – количество совпадений; Н – количество несовпадений.


или

Линейный коэффициент корреляции изменяется в пределах от -1 до 1: -1< r <1.


где
- дисперсия результативного признака;
- факторная дисперсия.



где
- парные коэффициенты корреляции (тождественны линейному коэффициенту корреляции).

Наличие мультиколлинеарности признается, если парный коэффициент корреляции между факторными признаками > 0,8.
Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп, применяются коэффициенты ассоциации и контингенции. Для их вычисления строится таблица, которая показывает связь между двумя явлениями, каждое из которых должно быть альтернативным.


a

b

a + b

c

d

c + d

a + c

b + d

a + b + c + d

Коэффициенты вычисляются по формулам:
ассоциации: ;
контингенции:
Коэффициент контингенции всегда меньше коэффициента ассоциации. Связь считается подтвержденной, если Ka>0,5 или Kk>0,3.

Когда каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи возможно применение коэффициентов взаимной сопряженности Пирсона и Чупрова, которые вычисляются по следующим формулам:
; где
- показатель взаимной сопряженности.
определяется как сумма отношений квадратов частот каждой клетки таблицы к произведению итоговых частот соответствующего столбца и строки минус 1:
, где

- число значений (групп) первого признака;

- число значений (групп) второго признака;

- итоги по строкам и столбцам соответственно;

- значения признаков в ячейках таблицы.
Также коэффициенты Пирсона и Чупрова могут рассчитываться с использованием величины

, где п – число наблюдений.
; ,
Чем ближе величины и к 1, тем связь теснее.

Ранговые коэффициенты корреляции.

Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается по формуле (для случая, когда нет связных рангов):
, где

- квадраты разности рангов;

п – число наблюдений (число пар рангов).

При наличии связанных рангов расчеты производятся по следующим формулам:
, где
, - количество связных рангов.

Ранговый коэффициент корреляции Кендалла рассчитывается по формуле
, где

п – число наблюдений;

S – сумма разностей между числом последовательностей и числом инверсий по второму признаку.

Расчет данного коэффициента выполняется в следующей последовательности:

  1. значения x ранжируются в порядке возрастания или убывания, переставляются в том же порядке;

  2. значения y располагаются в порядке, соответствующем значениям x;

  3. для каждого ранга y определяется число следующих за ним значений рангов, превышающих его величину. Суммируя таким образом числа, определяют величину P как меру соответствия последовательностей рангов по x и y. Она учитывается со знаком «плюс»;

  4. для каждого ранга y определяется число следующих за ним рангов, меньших его величины. Суммарная величина обозначается через Q и фиксируется со знаком «минус»;

  5. определяется сумма баллов по всем членам ряда.

Если в изучаемой совокупности есть связанные ранги, то расчеты необходимо проводить по следующей формуле:
, где

.

Для определения тесноты связи между произвольным числом ранжированных признаков применяется множественный коэффициент ранговой корреляции (коэффициент конкордации) W, который вычисляется по формуле:
, где

m – количество факторов;

n – число наблюдений;

S – отклонение суммы квадратов рангов от средней квадратов рангов.

В случае наличия связанных рангов коэффициент конкордации определяется по формуле:
, где

.

В большинстве случаев теснота связи может быть оценена по шкале тесноты связи:


Значение коэффициентов корреляции

Характер связи



Связь практически отсутствует



Слабая связь



Умеренная связь



Сильная связь


Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации