Элементы теории корреляции
Теоретические сведения и примеры решения задач
Выборочный коэффициент корреляции: , где , - выборочные средние Х и Y; - среднее значение величины ХY; , - выборочные Выборочное уравнение регрессии Y на X: Выборочное уравнение регрессии X на Y: Для оценки достоверности коэффициента корреляции проверяется гипотеза Н0 об отсутствии линейной корреляционной связи между переменными в генеральной совокупности, т.е. Н0: , по следующей схеме: а) вычисляется статистика отклонения выборочного коэффициента корреляции от генерального коэффициента корреляции , где n – число наблюдений; б) по таблице критических точек (двусторонней критической области) распределения Стьюдента (таблица А3 Приложения А) на уровне значимости и при числе степеней свободы находится значение ; в) если не выполняется неравенство , гипотеза Н0 отличается от нуля, что свидетельствует о достоверности коэффициента корреляции.
Задача. Для исследования зависимости объема производства (Y) от основных фондов (Х) получены статистические данные по 70 предприятиям за год.
Предполагая, что между Х и Y существует линейная корреляционная зависимость, необходимо: а) определить коэффициент корреляции и сделать вывод о тесноте и направлении связи; б) оценить достоверность коэффициента корреляции на 5 %-ном уровне значимости; в) найти уравнения прямых регрессии.
Решение. Вычислим средние выборочные и :
Найдем среднее значение величины ХY: Вычислим дисперсии, а затем средние квадратические отклонения Х и Y:
. Вычислим выборочный коэффициент корреляции: Полученное значение выборочного коэффициента корреляции показывает, что между переменными Х и Y существует достаточно тесная связь, близкая к линейной. Поскольку , то эта связь возрастающая, т.е. по мере увеличения основных фондов увеличивается объем производства. Оценим достоверность коэффициента корреляции на 5%-ном уровне значимости. Для этого найдем статистику критерия по формуле : Для уровня значимости и числа степеней свободы по таблице А3 Приложения А находим критическое значение статистики . Поскольку , то коэффициент корреляции достоверен на 5%-ном уровне значимости. Выборочное уравнение прямой регрессии Y на Х имеет вид: Подставляя все найденные значения в последнее уравнение, получаем: Аналогично найдем выборочное уравнение прямой регрессии Х на Y:
Варианты задачи № 9
Для исследования зависимости величины Y от величины Х получено распределение, статистические данные сведены в таблицу. Предполагая, что между Х и Y существует линейная корреляционная зависимость, необходимо: а) определить коэффициент корреляции и сделать вывод о тесноте и направлении связи; б) оценить достоверность коэффициента корреляции на 5%-ном уровне значимости; в) найти уравнения прямых регрессии и построить их на одном чертеже, г) используя соответствующее уравнение регрессии, получить среднюю величину Y, если Х = х 0, или среднюю величину Х, если
1. Х – расходы фирмы на рекламу (ден. ед.), Y – еженедельные продажи фирмы (ден. ед), ден. ед.
2. Распределение 100 деревьев, Х – диаметр дерева (м), Y – высота дерева (м), м.
3. Распределение 100 шоферов-любителей, Х – возраст шофера (лет), Y – число водителей, использующих ремень безопасности, лет.
4. Распределение 116 телевизоров, Х – чувствительность видеоканала (мкВ), Y – чувствительность звукового канала (мкВ), мкВ.
5. Распределение 100 предприятий, Х – производительность
6. Распределение 100 предприятий, Х – затраты на электроэнергию (тыс. руб./ед. продукции), Y – прибыль от реализации изделия (тыс. руб.), тыс. руб.
7. Распределение 50 школьников, Х – мышечная сила правой кисти рук (кг), Y – мышечная сила левой кисти рук (кг), кг.
8. Распределение 100 фабрик, Х – число изделий, изготавливаемых рабочим за смену (шт.), Y – размер заработной платы (тыс. руб.), тыс. руб.
9. Распределение 50 однотипных предприятий, Х – себестои-мость выпуска единицы продукции (тыс. руб.), Y – основные фонды (млн руб.), тыс. руб.
10. Распределение 200 драгоценных изделий, Х – стоимость изделия (тыс. руб.), Y – количество примесей (%), тыс. руб.
11. Распределение 140 предприятий, Х – производственные затраты (млн руб.), Y – степень компьютеризации производства (%), млн руб.
12. Распределение 100 модернизированных приборов, Х – степень модернизации (%), Y – количество сбоев за месяц работы (шт), %.
13. Распределение 70 предприятий, Х – объем выпуска про-дукции (тыс. шт.), Y – себестоимость единицы изделия (тыс. руб.), тыс. руб.
14. Распределение 100 работников компании, Х – показатели работы (баллы), Y – результаты тестирования (баллы), баллов.
15. Распределение 50 компаний, занимающихся грузовыми перевозками, Х – среднемесячный доход (млн руб.), Y – количество машин (ед.), машин.
16. Распределение 60 образцов сырья по процентному содержанию минерала Х (%) и процентному содержанию минерала Y (%), %.
17. Распределение50 компаний, Х – ежемесячные расходы компании на рекламу (тыс. руб.), Y – объем выручки от продаж (млн руб.), тыс. руб.
18. Распределение120 служащих, Х – потери рабочего времени (%), Y – сумма начислений на заработную плату, вызванная ростом производительности труда (у.е.), у.е.
19. Распределение 50 предприятий, Х – основные фонды
20. Распределение 55 предприятий, Х – основные фонды
21. Распределение 100 предприятий, Х – основные фонды
22. Распределение 100 предприятий, Х – основные фонды
23. Распределение 60 предприятий, Х – основные фонды
24. Распределение 54 предприятий, Х – основные фонды
25. Распределение 65 предприятий, Х – основные фонды
26. Распределение 60 предприятий, Х – основные фонды
27. Распределение 55 предприятий, Х – основные фонды
28. Распределение 65 предприятий, Х – основные фонды
29. Распределение80 служащих, Х – потери рабочего времени (%), Y – сумма начислений на заработную плату, вызванная ростом производительности труда (у.е.), у.е.
30. Распределение 100 фабрик, Х – число изделий, изготавливаемых рабочим за смену (шт), Y – размер заработной платы (тыс. руб.), тыс. руб.
9.3 Теоретические вопросы к защите расчетного задания № 9
1. Как определяется зависимость между признаками: а) функциональная; б) вероятностная; в) корреляционная? 2. В чем заключается задача: а) корреляционного анализа; б) регрессионного анализа? 3. Что называется диаграммой рассеяния или корреляционным полем? 4. В чем состоит разница в понятиях «теоретический коэффициент корреляции» и «выборочный коэффициент корреляции»? 5. Как определяется выборочный коэффициент корреляции? 6. Сформулируйте свойства выборочного коэффициента корреляции. 7. Какой вид имеет уравнение регрессии переменной Y на Х в случае линейной регрессионной модели? 8. Как оценивается теоретическая прямая регрессии переменной Y на Х? 9. Как определяется точечный прогноз среднего значения зависимой переменной Y при заданном значении независимой переменной Х? 10. Что можно сказать о характере зависимости между случайными величинами Х и Y при: а) r = 0; б) r = 1; в) r = -1?
СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|