Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Из рисунка 7 видно, чтоэмпирические коэффициенты регрессии соответственно равны




b0= 1,11,

b1 = -0, 0006,

b2 = 0, 064.

 

Тогда уравнение множественной линейной регрессии, связывающая величину чистого дохода у с оборотом капитала х1 и использованным капиталом х2 имеет видимеет вид

 

. (3.5)

 

На следующем этапе, в соответствии с заданием необходимо определить степень связи объясняющих переменных х1 и х2 с зависимой переменной у, используя коэффициенты эластичности. Коэффициенты эластичности для модели множественной линейной регрессии определяется в виде

 

. (3.6)

Тогда

.

Следовательно, при изменении оборота капитала на 1% величина чистого дохода компании изменяется на 0,0008%.

.

При изменении использованного капитала на 1% величина чистого дохода компании изменяется на 0,56%.

На третьем этапе исследования необходимо оценить статистическую значимость коэффициентов регрессии с помощью t-критерия и нулевую гипотезу о значимости уравнения с помощью F-критерия.

Технология оценки статистической значимости коэффициентов регрессии также основывается на проверке нулевой гипотезы о не значимости коэффициентов регрессии. При этом проверяется выполнение условия:

если tрасч. > tкрит, то нулевая гипотеза отвергается, и коэффициент регрессии принимается значимым. Из рисунка 7 видно, что tрасч. для первого коэффициента регрессии равен -0,061, а для второго 5,5. Критическое значение tкрит при уровне значимости a = 0,05 определяем с использованием статистической функции СТЬЮДРАСПОБР (рисунок 8). Входными параметрами функции является уровень значимости (вероятность) и число степеней свободы. Для рассматриваемого примера число степеней свободы соответственно равно n-3 (так как, для двухфакторной модели множественной регрессии оценивается три параметра b0,b1, b2). Тогда число степеней свободы равно10-3=7.

 

 
 

Рисунок 8. Окно статистической функции СТЬЮДРАСПОБР.

 

Из рисунка 8 видно, что критическое значение tкрит = 2,36.

Так как tрсч.< tкрит для первого коэффициента регрессии (0,061< 2,36) то нулевая гипотеза не отвергается и объясняющая переменная х1 является статистически незначимой и ее можно исключить из уравнения регрессии. И наоборот, для второго коэффициента регрессии tрасч > tкрит (5,5 >2,36), и объясняющая переменная х2 является статистически значимой.

Проверка значимости уравнения множественной регрессии в целом с использованием F-критерия аналогична проверке уравнения парной регрессии.

Из рисунка 7 следует, что Fрасч =15,23. Критическое значение F-критерия определяем с помощью использования статистической функции FРАСПОБР. Для модели множественной регрессии с двумя переменными число степеней свободы соответственно равно 2 (две объясняющие переменные х1 и х2) и n-k–1 (где k=2 - число объясняющих переменных). И второе число степеней свободы равно10-3=7. Критическое значение Fкрит,= 4,74. Следовательно:

Fт> Fкрит, (15,23 > 4,74), и уравнение регрессии в целом является значимым.

На последнем этапе исследования необходимо оценить качество уравнения посредством определения средней ошибки аппроксимации.

 

Таблица 3.4. Расчет средней ошибки аппроксимации.

 

Чистый доход, мл. долл. США, у Оборот капитала, мл. долл. США, х1 Использованный капитал, мл. долл. США, х2
6,6 6,9 83,6 6,5 0,022
2,7 93,6 25,4 2,7 0,008
1,6 10,0 6,4 1,5 0,054
2,4 31,5 12,5 1,9 0,212
3,3 36,7 14,3 2,0 0,393
1,8 13,8 6,5 1,5 0,157
2,4 64,8 22,7 2,5 0,052
1,6 30,4 15,8 2,1 0,314
1,4 12,1 9,3 1,7 0,213
0,9 31,3 18,9 2,3 1,556
        S=2,98

 

 

.

 

Значительная ошибка объясняется последним предпоследним значением колонки . Исключая последнее значение из анализа, можно показать, чтосредняя ошибка аппроксимации в данном случае не превысит 15%, что также является свидетельством достоверностии адекватности полученной эконометрической моделиреальному процессу.

 

Таким образом:

1. Сформирована эконометрическая модель в виде линейного уравнения парной регрессии, связывающая величину ежемесячной пенсии у с величиной прожиточного минимума х:

.

2. На основании анализа численного значения коэффициента корреляции = 0,038 установлено отсутствие статистической связи между величиной прожиточного минимума х и величиной ежемесячной пенсии у. Показано, что доля всех неучтенных в полученной эконометрической модели объясняющих переменных приблизительно составляет 99,8%.

3. Путем расчета коэффициента эластичности показано, что при изменении прожиточного минимума на 1% величина ежемесячной пенсии изменяется несущественно, всего на 0,000758%.

4. Рассчитана средняя ошибка аппроксимации статистических данных линейным уравнением парной регрессии, которая составила 2,6%, что является вполне допустимой величиной.

С использованием F- критерия установлено, что полученное уравнение парной регрессии в целом является статистически незначимым, и неадекватно описывает изучаемое явление связи величины ежемесячной пенсии у с величиной прожиточного минимума х.

6. Сформирована эконометрическая модель множественной линейной регрессии, связывающая величину чистого дохода условной фирмы у с оборотом капитала х1 и использованным капиталом х2

.

7. Путем расчета коэффициентов эластичности показано, что при изменении оборота капитала на 1% величина чистого дохода копании изменяется на 0,0008%, а при изменении использованного капитала на 1% величина чистого дохода компании изменяется на 0,56%.

8. С использованием t-критерия выполнена оценка статистической значимости коэффициентов регрессии Установлено, что объясняющая переменная х1 является статистически незначимой и ее можно исключить из уравнения регрессии, в тоже время объясняющая переменная х2 является статистически значимой.

9. С использованием F-критерия установлено, что полученное уравнение парной регрессии в целом является статистически значимым, и адекватно описывает изучаемое явление связи величины чистого дохода условной фирмы у с оборотом капитала х1 и использованным капиталом х2.

10. Рассчитана средняя ошибка аппроксимации статистических данных линейным уравнением множественной регрессии, которая составила 29,8%. Показано, за счет какого наблюдения в статистической базе величина данной ошибки превышает допустимое значение.

 

14. Построение модели парной регрессии без использования EXCEL.

Используя статистический материал, приведенный в таблице 3.5 необходимо:

1.Рассчитать параметры уравнения линейной парной регрессии.

2.Оценить тесноту связи с помощью показателей корреляции и детерминации.

3.Используя коэффициент эластичности, определить степень связи факторного признака с результативным.

4.Определить среднюю ошибку аппроксимации.

5.Оценить с помощью F-критерия Фишера статистическую надежность моделирования.

Таблица 3.5. Исходные данные.

 

Область   Доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и на покупку валюты, в общей сумме среднедушевого денежного дохода, %   Среднемесячная начисленная заработная плата, у.д.е.  
  yi xi
Калужская 8,4  
Костромская 6,1  
Орловская 9,4  
Рязанская 11,0  
Смоленская 6,4  
ИТОГО: 41,3  

 

Для определения неизвестных параметров b0, b1 уравнения парной линейной регрессии используем стандартную систему нормальных уравнений, которая имеет вид

 
 


(3.7)

 

Для решения этой системы вначале необходимо определить значения величин Sх2 и Sху. Эти значения определяем из таблицы исходных данных, дополняя ее соответствующими колонками (таблица 3.6).

 

Таблица 3.6. К расчету коэффициентов регрессии.

 

№ п/п yi xi xi2 yi* xi
  8,4     2881,2
  6,1     2171,6
  9,4     2716,6
  11,0     3751,0
  6,4     2092,8
Итого 41,3     13613,2

 

Тогда система (3.7) приобретает вид

 
 


 

Выражая из первого уравнения b0 и подставляя полученное выражение во второе уравнение получим:

Производя почленное умножение и раскрывая скобки, получим:

Откуда

Тогда

 

Окончательно уравнение парной линейной регрессии, связывающее величину доли денежных доходов населения, направленных на прирост сбережений у с величиной среднемесячной начисленной заработной платы х имеет вид:

 

(3.8)

 

Далее, в соответствии с заданием необходимо оценить тесноту статистической связи зависимой переменной у с объясняющей переменной х с помощью показателей корреляции и детерминации.

Так, как построено уравнение парной линейной регрессии, то определяем линейный коэффициент корреляции по зависимости:

,(3.9)

где - значения среднеквадратических отклонений соответствующих параметров.

Для расчета линейного коэффициента корреляции по зависимости (3.9) выполним промежуточные расчеты.

 

 

Подставляя значения найденных параметров в выражение (3.9) получим

 

.

Полученное значение линейного коэффициента корреляции свидетельствует о наличии слабой обратной статистической связи между величиной доли денежных доходов населения, направленных на прирост сбережений у и величины среднемесячной начисленной заработной платы х.

Коэффициент детерминации равен , что означает, что только 9,6% объясняется регрессией объясняющей переменной х на величину у. Соответственно величина 1- равная 90,4 % характеризует долю дисперсии переменной у, вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных.

Коэффициент эластичности равен

Следовательно, при изменении величины среднемесячной начисленной заработной платы на 1% величина доли денежных доходов населения, направленных на прирост сбережений также снижается на 1%, причем при увеличении заработной платы наблюдается снижение величины доли денежных доходов населения, направленных на прирост сбережений. Данный вывод противоречит здравому смыслу и может быть объяснен только некорректностью сформированной математической модели.

Рассчитаем среднюю ошибку аппроксимации.

 

Таблица 3.7. К расчету средней ошибки аппроксимации.

№ п/п yi xi
  8,4   8,0 0,048
  6,1   7,6 0,246
  9,4   9,3 0,011
  11,0   8,0 0,273
  6,4   8,4 0,313
Итого 41,3   41,3 0,89

 

Тогда средняя ошибка аппроксимации равна

 

Полученное значение превышает (12…15)%, что свидетельствует о существенности среднего отклонения расчетных данных от фактических, по которым построена эконометрическая модель.

Надежность статистического моделирования выполним на основе F-критерия Фишера. Теоретичное значение критерия Фишера Fрасч определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы по формуле

 

;(3.10)

 

где n -число наблюдений;

m-число объясняющих переменных (для рассматриваемого примераm m =1).

Тогда

Критическое значение Fкрит определяется по статистическим таблицам и для уровня значимости a = 0, 05 равняется 10,13. Так как Fрасч<Fкрит, то нулевая гипотеза не отвергается, и полученное уравнение регрессии принимается статистически незначимым.

15. Построение модели множественной регрессии без использования EXCEL.

Используя статистический материал, приведенный в таблице 3.8 необходимо:

1. Построить линейное уравнение множественной регрессии, пояснить экономический смысл его параметров.

2. Дать сравнительную оценку тесноты связи факторов с результативным признаком с помощью средних (общих) коэффициентов эластичности.

3. Оценить статистическую значимость коэффициентов регрессии с помощью t-критерия и нулевую гипотезу о не значимости уравнения с помощью F-критерия.

4. Оценить качество уравнения посредством определения средней ошибки аппроксимации.

 

Таблица 3.8. Исходные данные.

Чистый доход, млн. долл. США Оборот капитала млн. долл. США Использованный капитал,млн. долл. США
yi   x1i   x2i  
1,50 5,90 5,90
5,50 53,10 27,10
2,40 18,80 11,20
3,00 35,30 16,40
4,20 71,90 32,50
2,70 93,60 25,40
1,60 10,00 6,40
2,40 31,50 12,50
3,30 36,70 14,30
1,80 13,80 6,50

 

Для определения неизвестных параметров b0, b1, b2 уравнения множественной линейной регрессии используем стандартную систему нормальных уравнений, которая имеет вид

(3.11)

 

Для решения этой системы вначале необходимо определить значения величин Sх12, Sх22, Sх1у, Sх2у, Sх1х2. Эти значения определяем из таблицы исходных данных, дополняя ее соответствующими колонками (таблица 3.9).

 

Таблица 3.9. К расчету коэффициентов регрессии.

№п/п     yi   x1i   x2i   x1iyi x2iyi x1ix2i
  1,50 5,90 5,90 8,85 8,85 34,81 34,81 34,81
  5,50 53,10 27,10 292,05 149,05 1439,01 2819,61 734,41
  2,40 18,80 11,20 45,12 26,88 210,56 353,44 125,44
  3,00 35,30 16,40 105,90 49,20 578,92 1246,09 268,96
  4,20 71,90 32,50 301,98 136,50 2336,75 5169,61 1056,25
  2,70 93,60 25,40 252,72 68,58 2377,44 8760,96 645,16
  1,60 10,00 6,40 16,00 10,24 64,00 100,00 40,96
  2,40 31,50 12,50 75,60 30,00 393,75 992,25 156,25
  3,30 36,70 14,30 121,11 47,19 524,81 1346,89 204,49
  1,80 13,80 6,50 24,84 11,70 89,70 190,44 42,25
Итого 28,40 370,60 158,20 1244,17 538,19 8049,75 21014,10 3308,98

 

Тогда система (3.11) приобретает вид

 
 


 

Для решения данной системы воспользуемся методом Гаусса, который заключается в последовательном исключении неизвестных: делим первое уравнение системы на 10, затем умножаем полученное уравнение на 370,6 и вычитаем его из второго уравнения системы, далее умножаем полученное уравнение на 158,20 и вычитаем его из третьего уравнения системы. Повторяя указанный алгоритм для преобразованных второго и третьего уравнений системы получим:

 

Þ Þ

 

Þ .

 

После преобразования имеем:

 
 


 

Откуда

 

.

.

 

Тогда окончательно зависимость чистого дохода от оборота капитала и использованного капитала в виде линейного уравнения множественной регрессии имеет вид:

 

.(3.12)

 

Из полученного эконометрического уравнения видно, что с увеличением используемого капитала чистый доход увеличивается и наоборот с увеличением оборота капитала, чистый доход уменьшается. Кроме того, чем больше величина коэффициента регрессии, тем значительнее влияние объясняющей переменной на зависимую переменную. В рассматриваемом примере величина коэффициента регрессии больше чем величина коэффициента следовательно, используемый капитал оказывает значительно большее влияние на чистый доход, чем оборот капитала. Для количественной оценки указанного вывода определим частные коэффициенты эластичности.

 

Анализ полученных результатов так же показывает, что большее влияние на чистый доход оказывает используемый капитал. Так в частности, при увеличении используемого капитала на 1% чистый доход увеличиваетсяна 1,17%. В то же время с ростом оборота капитала на 1%, чистый доход снижается на 0,5%.

Теоретическое значение критерия Фишера Fрасч

где

 

Величина критического значения Fкрит, определяется по статистическим таблицам и для уровня значимости a = 0,05 равняется 4,74. Так как Fрасч > Fкрит, то нулевая гипотеза отвергается, и полученное уравнение регрессии принимается статистически значимым.

Оценка статистической значимости коэффициентов регрессии и по t-критерию сводится к сопоставлению численного значения этих коэффициентов с величиной их случайных ошибок и по зависимости:

.

Рабочая формула для расчета теоретического значения t-статистики имеет вид:

 

, (3.13)

где парные коэффициенты корреляции и коэффициент множественной корреляции рассчитываются по зависимостям:

 

;

;

 

;

 

.

Тогда теоретические (расчетные) значения t-статистик соответственно равны:

 

 

Поскольку критическое значение t-статистики, определенное по статистическим таблицам для уровня значимости a=0,05 равное tкрит =2,36 больше по абсолютной величине чем = - 1,798, то нулевая гипотеза не отвергается и объясняющая переменная х1 является статистически незначимой и ее можно исключить из уравнения регрессии. И наоборот, для второго коэффициента регрессии > tкрит (3,3 >2,36),и объясняющая переменная х2 является статистически значимой.

Рассчитаем средней ошибки аппроксимации.

 

Таблица 3.10. К расчету средней ошибки аппроксимации.

 

№ п/п yi   x1i   x2i  
  1,50 5,90 5,90 1,93 0,286
  5,50 53,10 27,10 4,59 0,165
  2,40 18,80 11,20 2,55 0,0625
  3,00 35,30 16,40 3,02 0,0006
  4,20 71,90 32,50 5,01 0,193
  2,70 93,60 25,40 2,69 0,0037
  1,60 10,00 6,40 1,88 0,175
  2,40 31,50 12,50 2,34 0,025
  3,30 36,70 14,30 2,55 0,227
  1,80 13,80 6,50 1,76 0,022
Итого 28,40 370,60 158,20 28,30 1,16

 

Тогда средняя ошибка аппроксимации равна

 

Полученное значение не превышает допустимого предела равного (12…15)%.

16. История развития теории измерений

Сначала ТИ развивалась как теория психофизических измерений. В послевоенных публикациях американский психолог С.С. Стивене основное внимание уделял шкалам измерения. Во второй половине XX в. сфера применения ТИ стремительно расширяется. Один из томов выпущенной в США в 50-х годах «Энциклопедии психологических наук» назывался «Психологические измерения». Составители этой публикации расширили сферу применения ТИ с психофизики на психологию в целом. В статье этого сборника «Основы теории измерений» [1], изложение шло на абстрактно-математическом уровне, без привязки к какой-либо конкретной области применения. В ней упор был сделан на «гомоморфизмах эмпирических систем с отношениями в числовые» (в эти математические термины здесь вдаваться нет необходимости), и математическая сложность изложения возросла по сравнению с работами С.С. Стивенса.

В одной из первых отечественных статей по ТИ (конец 60-х годов) было установлено, что баллы, присваиваемые экспертами при оценке объектов экспертизы, как правило, измерены в порядковой шкале. Работы, появившиеся в начале 70-х годов, привели к существенному расширению области использования ТИ. Ее применяли к педагогической квалиметрии (измерению качества знаний учащихся), в системных исследованиях, в различных задачах теории экспертных оценок, для агрегирования показателей качества продукции, в социологических исследованиях, и др.

В качестве двух основных проблем ТИ наряду с установлением типа шкалы измерения конкретных данных был выдвинут поиск алгоритмов анализа данных, результат работы которых не меняется при любом допустимом преобразовании шкалы (т.е. является инвариантным относительно этого преобразования).Порядковыми шкалами в географии являются бофортова шкала ветров («штиль», «слабый ветер», «умеренный ветер» и т.д.), шкала силы землетрясений. Очевидно, нельзя утверждать, что землетрясение в 2 балла (лампа качнулась под потолком) ровно в 5 раз слабее, чем землетрясение в 10 баллов (полное разрушение всего на поверхности земли).

В медицине порядковыми шкалами являются шкала стадий гипертонической болезни (по Мясникову), шкала степеней сердечной недостаточности (по Стражеско-Василенко-Лангу), шкала степени выраженности коронарной недостаточности (по Фогельсону), и т.д. Все эти шкалы построены по схеме: заболевание не обнаружено; первая стадия заболевания; вторая стадия; третья стадия... Иногда выделяют стадии 1а, 16 и др. Каждая стадия имеет свойственную только ей медицинскую характеристику. При описании групп инвалидности числа используют в противоположном порядке: самая тяжелая - первая группа инвалидности, затем - вторая, самая легкая - третья.

Номера домов также измерены в порядковой шкале - они показывают, в каком порядке стоят дома вдоль улицы. Номера томов в собрании сочинений писателя или номера дел в архиве предприятия обычно связаны с хронологическим порядком их создания.

При оценке качества продукции и услуг, в так называемой квалиметрии (буквальный перевод - измерение качества) популярны порядковые шкалы. А именно, единица продукции оценивается как годная или не годная. При более тщательном анализе используется шкала с тремя градациями: есть значительные дефекты - присутствуют только незначительные дефекты - нет дефектов. Иногда применяют четыре градации: имеются критические дефекты (делающие невозможным использование) - есть значительные дефекты - присутствуют только незначительные дефекты - нет дефектов. Аналогичный смысл имеет сортность продукции - высший сорт, первый сорт, второй сорт,...

При оценке экологических воздействий первая, наиболее обобщенная оценка - обычно порядковая, например: природная среда стабильна - природная среда угнетена (деградирует). Аналогична эколого-медицинская шкала: нет выраженного воздействия на здоровье людей - отмечается отрицательное воздействие на здоровье.

Порядковая шкала используется и в других областях. В эконометрике это прежде всего различные методы экспертных оценок.

Все шкалы измерения делят на две группы - шкалы качественных признаков и шкалы количественных признаков. Порядковая шкала и шкала наименований - основные шкалы качественных признаков, поэтому во многих конкретных областях результаты качественного анализа можно рассматривать как измерения по этим шкалам. Шкалы количественных признаков - это шкалы интервалов, отношений, разностей, абсолютная. По шкале интервалов измеряют величину потенциальной энергии или координату точки на прямой. В этих случаях на шкале нельзя отметить ни естественное начало отсчета, ни естественную единицу измерения. Исследователь должен сам задать точку отсчета и сам выбрать единицу измерения. Допустимыми преобразованиями в шкале интервалов являются линейные возрастающие преобразования, т.е. линейные функции. Температурные шкалы Цельсия и Фаренгейта связаны именно такой зависимостью: °С = 5/9 (°F - 32), где °С - температура (в градусах) по шкале Цельсия, a °F - температура по шкале Фаренгейта.

Из количественных шкал наиболее распространенными в науке и практике являются шкалы отношений. В них есть естественное начало отсчета - нуль, т.е. отсутствие величины, но нет естественной единицы измерения. По шкале отношений измерены большинство физических единиц: масса тела, длина, заряд, а также цены в экономике. Допустимыми преобразованиями в шкале отношений являются подобные (изменяющие только масштаб). Другими словами, линейные возрастающие преобразования без свободного члена, например, пересчет цен из одной валюты в другую по фиксированному курсу. Предположим, мы сравниваем экономическую эффективность двух инвестиционных проектов, используя цены в рублях. Пусть первый проект оказался лучше второго. Теперь перейдем на валюту Китая - юани, используя фиксированный курс пересчета. Очевидно, первый проект должен опять оказаться более выгодным, чем второй. Однако алгоритмы расчета не обеспечивают автоматически выполнения этого условия, и надо проверять, что оно выполнено. Результаты подобной проверки для средних величин описаны ниже.

В шкале разностей есть естественная единица измерения, но нет естественного начала отсчета. Время измеряется по шкале разностей, если год (или сутки - от полудня до полудня) принимаем естественной единицей измерения, и по шкале интервалов в общем случае. На современном уровне знаний естественного начала отсчета указать нельзя. Дату сотворения мира различные авторы рассчитывают по-разному, равно как и момент Рождества Христова.

Только для абсолютной шкалы результаты измерений - числа в обычном смысле слова, например, число людей в комнате. Для абсолютной шкалы допустимым является только тождественное преобразование.

В процессе развития соответствующей области знания тип шкалы может меняться. Так, сначала температура измерялась по порядковой шкале (холоднее - теплее). Затем - по интервальной (шкалы Цельсия, Фаренгейта, Реомюра). Наконец, после открытия абсолютного нуля температуру можно считать измеренной по шкале отношений (шкала Кельвина). Надо отметить, что среди специалистов иногда имеются разногласия по поводу того, по каким шкалам следует считать измеренными те или иные реальные величины. Другими словами, процесс измерения включает в себя и определение типа шкалы (вместе с обоснованием выбора определенного типа шкалы). Кроме перечисленных шести основных типов шкал, иногда используют и иные шкалы.

17. Инвариантные алгоритмы и средние величины.

Сформулируем основное требование к алгоритмам анализа данных в ТИ: выводы, сделанные на основе данных, измеренных в шкале определенного типа, не должны меняться при допустимом преобразовании шкалы измерения этих данных. Другими словами, выводы должны быть инвариантны по отношению к допустимым преобразованиям шкалы.

Таким образом, одна из основных целей теории измерений - борьба с субъективизмом исследователя при приписывании численных значений реальным объектам. Так, расстояния можно измерять в аршинах, метрах, микронах, милях, парсеках и других единицах измерения. Массу (вес) - в пудах, килограммах, фунтах и др. Цены на товары и услуги можно указывать в юанях, рублях, тенге, гривнах, латах, кронах, марках, долларах США и других валютах (при условии заданных курсов пересчета). Подчеркнем очень важное, хотя и вполне очевидное обстоятельство: выбор единиц измерения зависит от исследователя, т.е. субъективен. Статистические выводы могут быть адекватны реальности только тогда, когда они не зависят от того, какую единицу измерения предпочтет исследователь, когда они инвариантны относительно допустимого преобразования шкалы. Из многих алгоритмов эконометрического анализа данных этому условию удовлетворяют лишь некоторые. Покажем это на примере сравнения средних величин.

Пусть Х1, Х2,.., Хn - выборка объема n. Часто используют среднее арифметическое. Использование среднего арифметического настолько привычно, что второе слово в термине часто опускают и говорят о средней зарплате, среднем доходе и других средних для конкретных экономических данных, подразумевая под «средним» среднее арифметическое. Такая традиция может приводить к ошибочным выводам. Покажем это на примере расчета средней заработной платы (среднего дохода) работников условного предприятия. Из 100 работников лишь 5 имеют заработную плату, ее превышающую, а зарплата остальных 95 существенно меньше средней арифметической. Причина очевидна - заработная плата одного человека - генерального директора - превышает заработную плату 95 работников - низкоквалифицированных и высококвалифицированных рабочих, инженеров и служащих. Ситуация напоминает описанную в известном рассказе о больнице, в которой 10 больных, из них у 9 температура 40°С, а один уже отмучился, лежит в морге с температурой 0°С. Между тем средняя температура по больнице равна 36°С - лучше не бывает!

Таким образом, среднее арифметическое можно использовать лишь для достаточно однородных совокупностей (без больших выбросов в ту или иную сторону). А какие средние использовать для описания заработной платы? Вполне естественно использовать медиану - среднее арифметическое 50-го и 51-го работника, если их заработные платы расположены в порядке неубывания. Сначала идут зарплаты 40 низкоквалифицированных рабочих, а затем - с 41-го до 70-го работника - заработные платы высококвалифицированных рабочих. Следовательно, медиана попадает именно на них и равна 200. У 50-ти работников заработная плата не превосходит 200, и у 50-ти - не менее 200, поэтому медиана показывает «центр», около которого группируется основная масса исследуемых величин. Еще одна средняя величина - мода, наиболее часто встречающееся значение. В рассматриваемом случае это заработная плата низкоквалифицируемых рабочих, т.е. 100. Таким образом, для описания зарплаты имеем три средние величины - моду (10

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...