Дисперсия альтернативного признака.
1. Основоположником развития теории средних величин является Адольф Кетле, который считал их важнейшими статистическими показателями. Он первым четко сформулировал тот факт, что на массовые явления (статистические совокупности) влияет два вида причин: - общие для каждой единицы совокупности, эти причины формируют тип явления и связаны с его сущностью; - индивидуальные, специфические для каждой единицы совокупности, не связанные с типом явления, то есть случайные для него. При расчете средней величины в совокупности влияние случайных причин взаимопогашается, и средняя величина, абстрагируясь от индивидуальных особенностей отдельных единиц совокупности, выражает общие свойства, присущие всей совокупности. Кетле считал среднюю величину не просто статистическим показателем, имеющим определенный способ расчета, а категорией объективной реальности. В настоящее время средняя величина признается также центральным показателем, характеризующим совокупность. И определяют ее как обобщающий показатель, характеризующий типический уровень варьирующего признака. Он выражает величину признака, отнесенную к единице совокупности. Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.
Вычисление среднего – один из распространенных приемов обобщения; средний показатель выделяет то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. Таким образом, в способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей. Следует отметить, что средняя величина будет объективной характеристикой, если она вычислена по качественно однородной совокупности. Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние и структурные средние. К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая. В качестве структурных средних рассматриваются мода и медиана.
Выбор конкретного вида средней величины зависит от цели исследования и логической сущности усредняемого признака. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по несгруппированным данным и имеет следующий общий вид:
где X – варианта (значение) осредняемого признака; В зависимости от степени m получают различные виды средних величин. Если же данные сгруппированы, то используется формулы средних взвешенных, где весами выступают частоты f (повторяемость варианты). Взвешенная средня я считается по сгруппированным данным и имеет общий вид где X – варианта (значение) усредняемого признака или серединноезначение интервала, в котором измеряется варианта; Таблица 7. Виды степенных средних
Формулы средневзвешенные могут использоваться для расчета общей по совокупности средней на основе групповых средних. Пример. Рассчитать среднюю заработную плату по двум бригадам.
Таблица 8. Оплата труда по бригадам
Таблица 9. Оплата труда по бригадам
В обеих задачах определяющей функцией является ФЗП. Прежде, чем выбрать формулу для расчетов средней величины,нужно словами записать логическую сущность усредняемого признака. Средняя заработная плата = Фонд заработной платы / численность работников Средняя урожайность = Валовой сбор / Посевная площадь Средняя производительность труда = Объем продукции / Численность (Время) Правило: Если в представленной информации есть данные о числителе логической формулы, то есть об определяющей функции, то для расчета средней величины используется средняя гармоническая. Если представлены данные о знаменателе логической формулы, то для расчета средней величины используется средняя арифметическая.
Пример. В течение 8-часового рабочего дня пять рабочих производили одинаковые детали. Их затраты времени на одну деталь, мин.: 20, 16, 20, 15, 24. Определить средние затраты времени на одну деталь. Средние затраты времени на одну деталь определяются путем деления суммарного времени на число деталей. 480 +480+480+480+480 480:20+480:16+480:20+480:15+480:24 (2400:130=18,46 мин.) Это - правильный расчет, а неправильно, если сложить все затраты времени на одну деталь и разделить на пять (19 мин.). При таком расчете искажается объем производства деталей (2400:19=126, а не 130, как фактически).
2. 1. Средняя арифметическая постоянной величины равна этой постоянной: 2. Алгебраическая сумма линейных отклонений варианты от средней арифметической равна 0 (нулевое свойство):
3. Сумма квадратов отклонений варианты от средней арифметической есть число минимальное:
Эти три свойства определяют сущность средней арифметической. Следующие свойства – расчетные. 4. Если каждую варианту Х уменьшить или увеличить на определенное число, то средняя величина уменьшается или увеличивается на это число. 5. Если каждую варианту Х уменьшить или увеличить в одно и то же число раз, то средняя величина уменьшается или увеличивается в это число раз. 6. Если каждую частоту f уменьшить или увеличить в одно и то же число раз, то средняя величина не изменится. Доля каждой варианты (d) определяется путем деления каждой частоты на сумму всех частот. Таким образом средняя величина зависит от варианты Х и от структуры совокупности, которая характеризуется долями d. 7. Средняя суммы равна сумме средних:
3. Ряд распределения имеет 3 центра: 1) средняя арифметическая; 2) мода; 3) медиана.
Рассчитаем среднюю арифметическую для дискретного ряда распределения, представленного в таблице 1: При расчете средней величины по интервальному ряду распределения в качестве варианты Х берется середина интервала. Если интервал открытый, то при расчете средней величины его условно закрывают, принимая равным соседнему закрытому интервалу. Рассчитаем среднюю величину основных средств по таблице 3:
В таблице 5 была рассчитана эта же величина, и она получилась равной 3,3 млрд. руб. (Объяснить различия) Мода – наиболее часто встречающаяся варианта. Определим моду тарифного разряда по таблице 1: Для интервальных рядов распределения сначала находится модальный интервал, то есть интервал с наибольшей частотой внутри этого интервала, затем мода находится по формуле:
i - величина модального интервала;
Медиана - варианта, стоящая в середине ряда распределения.
Номер медианы: № Ме= № Ме= Найдем медиану тарифного разряда по таблице 1: № Ме= Ме=3 Следовательно, половина рабочих цеха имеет разряд не выше 3-го.
Прежде чем найти медиану для интервального ряда распределения, ищут интервал, в который входит срединная варианта, затем внутри этого интервала определяют медиану по формуле:
где i- величина медианного интервала; n- число единиц совокупности;
Найдем медиану основных средств по таблице 3: № Ме=
То есть половина предприятий имеет основные средства не выше, чем 3,45 млрд. руб.
4. Ряды распределения, имеющие одинаковую среднюю величину, могут существенно отличаться по степени колеблемости изучаемого признака. (Пример. Средний возраст студентов в группе и бабушки с детьми). Для характеристики совокупности, особенно, в том случае, если значение признака существенно колеблется, дополнительно к расчету средней величины определяют ряд показателей вариации. Для измерения вариации используют абсолютные и относительные показатели. 1. Размах вариации: R = X max – X min – диапазон изменения признака. 2. Среднее линейное отклонение – показывает среднее отклонение варианты от средней величины:
3. Среднее квадратическое отклонение - показывает среднее отклонение вариант от средней величины:
Все 3 показателя имеют те же единицы измерения, что и признак.
4. Дисперсия – квадрат среднего квадратического отклонения: или Не имеет единиц измерения. Свойства дисперсии: 1) D(const)=0, то есть дисперсия постоянной величины равна 0. 2) Если каждую варианту Х уменьшить или увеличить на одно и то же число раз, то дисперсия не изменится; 3) Если каждую варианту Х уменьшить или увеличить в одно и то же число раз i, то дисперсия уменьшится или увеличится в i 2 раз.
Способы расчета дисперсии: 1) исходя из определения: 2) исходя из средней из квадратов вариант:
Эта формула получена преобразованием основной формулы. 3) по способу моментов:
Рассчитаем дисперсию тарифного разряда по данным таблицы 1 двумя способами:
1)
2)
Показатели относительного рассеивания (вариации). Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер вариации в различных распределениях (колеблемость одного и того же признака в двух совокупностях или колеблемость различных признаков в одной совокупности). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической. 1. Коэффициент осцилляции показывает относительную колеблемость крайних значений признака относительно средней. 2. Относительное линейное отклонение характеризует относительное усредненное значение абсолютных отклонений от средней величины. 3. Коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.
Для более глубокого анализа колеблемости признаков также используют показатели дифференциации. 1. По несгруппированным первичным данным можно рассчитать коэффициент фондовой дифференциации:
где
2. Если данные сгруппированы, то рассчитывают коэффициент децильной дифференциации:
Дециль - значение признака, которому в ряду распределения соответствует 10-я доля совокупности, то есть децили делят совокупность на 10 равных частей.. Процедура нахождения децилей аналогична процедуре нахождения медианы для интервального ряда распределения: 1) определяют № децили: для 1-й децили: № для 9-й децили: № 2) находят интервалы, в которые входят эти децили и внутри этих интервалов находят децили по формулам:
где i - величины интервалов, в которые входят 1 и 9 децили;
Таблица 10. Распределение населения района По среднедушевому доходу
№ №
5. На колеблемость результативного признака оказывает влияние множество факторных признаков (пример с успеваемостью студентов в группе). Одной из задач статистики является определение влияния какого-либо факторного признака на колеблемость результативного признака. Всю колеблемость результативного признака измеряют т.н. общей дисперсией результативного признака.
Х – варианта результативного признака;
n – число единиц совокупности. Для того чтобы установить влияние какого-то одного факторного признака на колеблемость результативного признака проводят аналитическую группировку по этому факторному признаку. Результативный признак колеблется внутри каждой выделенной группы под влиянием других факторных признаков, которые не положены в основу аналитической группировки. Эту колеблемость измеряют с помощью внутригрупповой дисперсии:
i -номер группы;
fi - число единиц в группе.
Для того чтобы определить колеблемость результативного признака под влиянием колеблемости других признаков по всей совокупности рассчитывают среднюю из этих внутригрупповых дисперсий.
Групповые средние колеблются вокруг общей средней. Эту колеблемость измеряют с помощью межгрупповой дисперсии:
Межгрупповая дисперсия показывает колеблемость результативного признака под влиянием колеблемости факторного признака, по которому проводили аналитическую группировку. Т.о., всю колеблемость результативного признака разделили на 2 части: 1) колеблемость результативного признака под влиянием изучаемого факторного признака (меряется межгрупповой дисперсией); 2) колеблемость результативного признака под влиянием всех других факторных признаков (меряется средней из внутригрупповых дисперсий):
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|