Анализ многомерных рядов распределения.
Анализ одномерных рядов распределения. ЗАДАЧА № 10
а) Строим интервальный ряд, количество интервалов – 10. Размах вариации равен: Величина интервала равна: , и, для удобства расчетов округляяем до целого значения = 940. Получаем следующий интервальный вариационный ряд (Таблица 1)
Таблица 1
б) Строим графики:
в) Вычисляем необходимые показатели распределения: 1.Ряд распределения является вариационным, поэтому расчет среднего значения будет произведен по формуле: , где xi – середина интервала; fi – частота. Получаем Мода рассчитывается по формуле: , где x0 – нижняя граница модального интервала (интервала с максимальной частотой); i – величина интервала; fMo – частота модального интервала; fMo-1 – частота интервала предшествующего модальному; fMo+1 – частота интервала следующего за модальным. Получаем Медиана рассчитывается по формуле: , где x0 - нижняя граница медианного интервала (интервал, где f’>åf/2); f’Me – 1 – накопленная частота интервала, предшествующего интервальному; fMе – частота медианного интервала; i – величина интервала. Получаем Мы видим, что , следовательно, ряд не соответствует нормальному распределению. Из полигона и гистограммы видно, что распределение асимметричное.
Мы видим, что , следовательно, ряд имеет высокую асимметрию. 2.Находим показатели вариации: Дисперсия будет находиться, используя данные таблицы 1 по формуле: Получаем Среднее квадратичное отклонение находится по формуле: Получаем Коэффициент вариации находится по формуле:
Коэффициент вариации показывает, что вариация очень высокая и ряд нельзя считать однородным.
3. Рассчитываем F- критерий Фишера. Для этого разобьем исходный ряд на две выборки: n1 =63, n2 = 37 и по этим выборкам определим дисперсию: Таблица 2 Определяем расчетное значение F- критерия Фишера:
Для степеней свободы V1 = n1 – k – 1 = 63 – 2 –1 = 60 и V2 = n2 – k –1 = 37 – 2 – 1=34 находим по таблице значений F, что Fтабл = 1,76. , следовательно, ряд нельзя считать однородным.
Рассчитаем Т – критерий Грабса для каждого значения по формуле: Получаем следующую таблицу значений: Таблица 3
Максимально допустимое значение T-критерия Грабса Тн = 2,52. Следовательно, можно выделить следующие аномальные явления: 3,50; 4,52; 4,30. 4.Рассчитаем показатели асимметрии и эксцесса. Для этого заполним таблицу 4: Таблица 4
Коэффициент асимметрии определяем по формуле: Аs>1, следовательно, асимметрия левосторонняя высокая Коэффициент эксцесса определяем по формуле: Es>3, следовательно эксцесс высокий, островершинный. Рассчитываем критерий Колмогорова: - Среднее квадратичное отклонение равно - определяем нормированные отклонения: - находим ft по таблице: - рассчитываем теоретические значения частот: - рассчитываем накопленные частоты. Таблица 5
- на основе фактических и теоретических накопленных частот рассчитываем разницу:
- рассчитываем критерий Колмогорова для определения соответствия эмпирического распределения нормальному. Для 5% уровня значимости находим , тогда . Как мы видим , следовательно, распределение не следует закону нормального распределения.
д) При исследовании распределения мы имеющиеся данные привели к виду групповой таблицы. Проведя исследование, мы нашли среднее значение исследуемой величины и медиану, которая показывает середину совокупности. Также мы нашли среднее квадратичное отклонение, которое показывает, на сколько, в среднем, отклоняются данные от средней величины, и коэффициент вариации который переводит это значение в проценты. Для более наглядного представления распределения мы построили графики ряда (типа полигон и гистограмму).
Все значения вычислялись с учетом того, что ряд распределения вариационный. Для того, чтобы определить насколько распределение соответствует нормальному, мы провели его оценку на основе критерия Колмогорова.
Анализ многомерных рядов распределения. ЗАДАЧА № 10 Исходные данные: у – индекс снижения себестоимости продукции; х1 – удельный вес рабочих в составе ППП; х2 – непроизводственные расходы. Таблица 6
Строим групповую таблицу. Группировочный признак – у (индекс снижения себестоимости продукции). Величина интервала равна: Количество групп найдем по формуле: , и округляя вверх, получаем n = 6. Величина интервала равна: . Округляя вверх, получаем i = 40 Получаем следующую групповую таблицу: Таблица 7
б) Графическое изображение зависимости можно дать в виде корреляционных полей.
Коэффициент корреляции можно найти по формуле: Для его нахождения заполняем таблицу: Таблица 8
Вычисляем коэффициенты корреляции:
Между величинами х1 и y:
Коэффициент корреляции близок к нулю, следовательно связь между величиной y и величиной х1 отсутствует.
Между величинами х2 и y: Коэффициент корреляции близок к нулю, следовательно связь между величиной y и величиной х2 отсутствует.
Оценим существенность коэффициентов корреляции при помощи t-критерия Стьюдента. Для факторов y и x1: Для факторов y и x2: Сравниваем с табличным значением t-критерия Стьюдента, которое для доверительной вероятности 0,95 и количества степеней свободы 24 равно tтабл = 2,064. Так как tтабл < tрас, то коэффициент корреляции rx1y считается несущественным. Так как tтабл > tрас, то коэффициент корреляции rx2y считаются несущественным.
Для нахождения линейных уравнений связи заполним следующую таблицу: Таблица 9
Находим простую линейную регрессию между х1 и у: = а + bx1, где а и b – параметры, которые находятся из системы уравнений: Решая систему, получаем: а = 39,45; b = 83,98, следовательно:
= 39,45 – 83,98x1
Находим простую линейную регрессию между х2 и у: = а + bx2, где а и b – параметры, которые находятся из системы уравнений: Решая систему, получаем: а = 77,83; b = 1,2, следовательно:
= 77,83 + 1,2x2
Находим множественную линейную регрессию между х1, х2 и у: = а + bx1 + сх2, где а, b и с – параметры, которые находятся из системы уравнений: Решая систему, получаем: а = -497,7; b = 620,6; с = 7,26, следовательно:
= -214,8 + 46x1 + 410,7х2
г) Для того, чтобы оценить существенность параметров уравнения воспользуемся формулами: , , , где - остаточная дисперсия Для 5% уровня значимости tтабл = 2,069. Заполним следующую таблицу:
Таблица 10
Оцениваем существенность параметров уравнения для регрессии у(х1): tрасч > tтабл, следовательно параметр существенен. tрасч < tтабл, следовательно параметр несущественен. Оцениваем существенность параметров уравнения для регрессии у(х2): tрасч > tтабл, следовательно параметр существенен.
tрасч < tтабл, следовательно параметр несущественен.
Оцениваем существенность параметров уравнения для регрессии у(х1,х2): tрасч > tтабл, следовательно параметр существенен.
tрасч < tтабл, следовательно параметр несущественен.
tрасч < tтабл, следовательно параметр несущественен.
д) Ошибка аппроксимации находится по формуле: Для нахождения ошибки аппроксимации заполним таблицу:
Таблица 11
Находим ошибку аппроксимации уравнения для регрессии у(х1): Находим ошибку аппроксимации уравнения для регрессии у(х2): Находим ошибку аппроксимации уравнения для регрессии у(х1,х2): е) На первой стадии нашего анализа (построение групповой таблицы) мы пришли к выводу, что заметной зависимости между величиной у и величинами х1 и х2 нет. При увеличении у величина х2 принимает совершенно различные значения, между которыми невозможно выявить какой-либо тенденции. А величина х2 хаотично изменяется в пределах от 0,6 до 0,8. Из групповой таблицы также можно сделать вывод, что индекс снижения себестоимости почти у половины предприятий находится в интервале 45 – 85. Построив корреляционные поля, мы наглядно увидели, что какой либо заметной зависимости нет. Мы нашли линейные уравнения связи (простую и множественную регрессии). Однако, оценив существенность параметров, мы пришли к выводу, что только один из параметров в каждом уравнении является существенным. А большое значение ошибки аппроксимации говорит о том, что эти уравнения нельзя применять в дальнейшем анализе.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|