Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Сбор данных и проверка их на достоверность




 

Для решения задач экономического анализа и прогнозирования очень часто используются статистические, отчетные или наблюдаемые данные. Основной базой для эконометрических исследований служат данные официальной статистики или бухг. учета. Сбором статистических данных называется процесс получения исходных данных об элементах исследуемой совокупности и их свойствах, которые в дальнейшем становятся предметом статистической обработки и анализа.

В связи с многообразием статистических наблюдений, их принято классифицировать по следующим признаками: 1) по форме организации; 2) по времени регистрации фактов; 3) по признаку полноты охвата элементов изучаемой совокупности.

По форме организации выделяют отчётность и специально организованные статистические наблюдения. В эконометрических моделях в основном используются данные трёх типов: 1) пространственные данные (cross-sectional data); 2) временные ряды (time-series data); 3) панельные данные (panel data).

Пространственными данными называется совокупность экономической информации, которая характеризует различные объекты, полученной за один и тот же период или момент времени. Примером пространственных данных может служить комплекс экономической информации по какому-либо предприятию (численность работников, объём производства), объёмах потребления продукции определённого вида, данные о ВВП различных стран в каком-либо конкретном году и т. д.

Временными данными называется совокупность экономической информации, которая характеризует один и тот же объект, но за разные периоды времени. Отдельно взятый временной ряд можно рассматривать как выборку из бесконечного ряда значений показателей во времени. Примером временных данных могут служить данные о динамике индекса потребительских цен, ежедневные обменные курсы валют.

Панельными данными называются данные, содержащие сведения об одном и том же множестве объектов за ряд последовательных периодов времени. Панельные данные являются обобщением или комбинацией пространственных и временных данных. Примером панельных данных могут служить показатели хозяйственной деятельности совокупности предприятий, которые собираются каждый год.

При исследовании взаимосвязей между экономическими показателями на основе статистических данных, часто между ними наблюдается стохастическая зависимость. Она проявляется в том, что изменение закона распределения одной случайной величины происходит под влиянием изменения другой. Взаимосвязь между величинами может быть полной (функциональной) и неполной (искаженной другими факторами). Пример функциональной зависимости - выпуск продукции и ее потребление в условиях дефицита.

Неполная зависимость наблюдается, например, между стажем рабочих и их производительностью труда. Обычно рабочие с большим стажем работы работают лучше молодых, но под влиянием дополнительных факторов - образование, здоровье и т.д. эта зависимость может быть искажена. Факторные показатели, учитываемые в модели, должны быть сформированы при одних и тех же или близких экономических условиях, чтобы они отвечали закону нормального распределения (закону Гаусса). Закон Гаусса: если показатель сформирован в близких экономических условиях, то вероятность появления значения показателя возрастает по мере приближения его величины к средней арифметической.

Если значения факторных показателей получены при разных условиях, то они будут сильно отличаться друг от друга. Простейший способ обоснования соответствия данных закону нормального распределения – закон трех сигм или (если данные проверяемого вектор-столбца отвечают закону норм. распределения, то отклонение проверяемого значения от средней арифметической не превышает утроенное среднеквадратическое отклонение ). После этой проверки исключаем резко выделяющиеся значения факторных показателей и объекты.


7. Основные характеристики соответствия данных требованиям закона нормального рас пределения (Гаусса)

 

Факторные показатели, учитываемые в модели, должны быть сформированы при одних и тех же или близких экономических условиях, чтобы они отвечали закону нормального распределения (закону Гаусса). Закон Гаусса: если показатель сформирован в близких экономических условиях, то вероятность появления значения показателя возрастает по мере приближения его величины к средней арифметической (иксу с черточкой сверху). Максимальная ордината (значение по вертикальной оси) рассчитывается по формуле .

1. средние значения переменных - среднее значение результативного признака; n –число факторов

2. отклонения от средних значений

В практических исследованиях, как правило, имеет место некоторое рассеяние точек относительно линии регрессии. Оно обусловлено влиянием прочих, не учитываемых в уравнении регрессии, факторов. Иными словами, имеют место отклонения фактических данных от теоретических. Величина этих отклонений и лежит в основе расчета остаточной дисперсии. Чем меньше величина остаточной дисперсии, тем меньше влияние не учитываемых в уравнении регрессии факторов и тем лучше уравнение регрессии подходит к исходным данным.

3. дисперсии D и средние квадратические отклонения σ:

Функция нормального распределения σ2 – дисперсия.

Нормальный закон распределения (закон Гаусса)– наиболее часто встречающийся на практике закон распределения. Главная особенность состоит в том, что он является предельным законом, к которому приближаются другие законы распределения при весьма часто встречающихся типичных условиях. Нормальный закон, как и другие теоретические распределения, не является фиксированным уравнением зависимости одной переменной от другой. Фиксируется только характер этой зависимости. А вот конкретная форма распределения задается специальными параметрами в этом уравнении. Например, всем понятно выражение типа у = аx + b – это уравнение прямой. Однако где конкретно она проходит и под каким наклоном, определяется параметрами а и b. Без заданных параметров невозможно четко представить эту линию. Также и с нормальным распределением. Ясно, что это функция, которая описывает тенденцию высокой концентрации значений около центра, но ее точная форма задается специальными параметрами, которые «подгоняют» модель под реальные данные. Кривая Гаусса по форме несколько напоминает колокол, поэтому график нормального закона часто еще называют колоколообразной кривой. Если вдруг увидите термин «колоколообразная кривая», знайте, что речь идет о нормальном распределении.

Как видно, у графика имеется «горб» в середине и резкое снижение плотности по краям. В этом заключается суть нормального распределения. Другими словами, вероятность того, что случайная величина окажется около центра гораздо выше, чем то, что она сильно отклонится от середины.

Как правило, резко выделяющиеся значения, т. е. минимумы и максимумы, вследствие проверки по закону нормального распределения приходится исключать до 25% объектов. Поэтому при сборе данных число объектов, по которым берутся данные для построения моделей, берем на 20-25% больше, чем n ≥ 20 или n ≥ 2,5 k, где k – число факторов, включая результативный. Максимальные и минимальные значения, которые отбрасываются, сформированы при других экономических условиях, а не 100% являются неверными.


8. Сущность закона «трех сигм» и его экономическое содержание

 

Простейший способ обоснования соответствия данных требованиям закона нормального распределения является закон трех сигм.

1. средние арифметические значения переменных - среднее значение результативного признака; n –число факторов

2. отклонения от средних значений

3 дисперсии D и средние квадратические отклонения σ:

Факторные показатели, учитываемые в модели, должны быть сформированы при одних и тех же или близких экономических условиях, чтобы они отвечали закону нормального распределения (закону Гаусса). Закон Гаусса: если показатель сформирован в близких экономических условиях, то вероятность появления значения показателя возрастает по мере приближения его величины к средней арифметической. Большее значение среднеквадратического отклонения показывает больший разброс значений в представленном множестве со средней величиной множества; меньшее значение, соответственно, показывает, что значения в множестве сгруппированы вокруг среднего значения

Как правило, резко выделяющиеся значения, т. е. минимумы и максимумы, вследствие проверки по закону нормального распределения приходится исключать до 25% объектов. Поэтому при сборе данных число объектов, по которым берутся данные для построения моделей, берем на 20-25% больше, чем n ≥ 20 или n ≥ 2,5 k, где k – число факторов, включая результативный. Максимальные и минимальные значения, которые отбрасываются, сформированы при других экономических условиях, а не 100% являются неверными.

Если значения факторных показателей получены при разных условиях, то они будут сильно отличаться друг от друга. Простейший способ обоснования соответствия данных закону нормального распределения – закон трех сигм или (если данные проверяемого вектор-столбца отвечают закону норм. распределения, то отклонение проверяемого значения от средней арифметической не превышает утроенное среднеквадратическое отклонение ).

Если проверяемое значение больше 3σ, то объект со всеми его значениями исключаем из дальнейших расчетов. Правило трёх сигм () — практически все значения нормально распределённой случайной величины лежат в интервале . Более строго — приблизительно с вероятностью 0,9973 значение нормально распределённой случайной величины лежит в указанном интервале (при условии, что величина истинная, а не полученная в результате обработки выборки).

На практике правило трех сигм применяют так: если распределение изучаемой случайной величины неизвестно, но условие, указанное в приведенном правиле, выполняется, то есть основание предполагать, что изучаемая величина распределена нормально; в противном случае она не распределена нормально. Среднее квадратическое отклонение доходности портфеля отождествляется с риском портфеля.


Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...