Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Корреляция между качественными и количественными признаками, а также между двумя качественными признаками




Корреляция между качественными и количественными признаками, а также между двумя качественными признаками

Предложено много разных методов и показателей, в том числе:

1) Коэффициент ассоциации или тетрахорический показатель связи (качественные признаки, группируемые в четырехпольную корреляционную таблицу).

Пример – оценка сцепления генов

2) Коэффициент взаимной сопряженности или полихорический показатель связи (Пирсона-Чупрова) (качественные признаки, группируемые в многопольную корреляционную таблицу).

Имеется и возможность оценить корреляционную связь между качественным и количественным признаками.

 

Частная и множественная корреляция

Частная корреляция

Зная парные коэффициенты корреляции rxy, rxzи ryz, можно определить т. н. частные или парциальные коэффициенты корреляции, показывающие корреляционную зависимость между двумя варьирующими признаками при постоянной величине третьего признака (т. е. при исключенном влиянии третьего признака).

Для определения частного коэффициента корреляции между признаками Х и Y при постоянной величине признака Z применяют формулу:

.

Заключение знака в скобки означает, что влияние признака Z на корреляцию между Х и Y исключено.

Аналогичные формулы получены для rxy(z)и ryz(x).

Пример.

В предыдущей лекции отмечалось, что установлены следующие коэффициенты парной корреляции:

1) урожайность (Y) – температура в июне (Х) rxy=-0. 38;

2) урожайность (Y) – сумма осадков за июнь (Z) ryz=0. 37;

3) температура в июне (Х) – сумма осадков за июнь (Z) rxz=-0. 43.

Тогда

Сравнение частного коэффициента корреляции =-0. 26 с парным rxy=-0. 38 позволяет утверждать, что при одинаковом уровне осадков в июне связь урожайность – температура июня меньше, чем при изменчивом.

Частные корреляции используются редко.

 Анализ множественных нелинейных связей сложен, он описан в специальной литературе.

Множественная корреляция

Простейшим случаем множественной корреляции является корреляция трех признаков: Х, Y и Z. Тесноту связи одного из них Y (зависимая переменная) от двух других Х и Z (независимых переменных) характеризует коэффициент множественной корреляции:

,

 

где rxy, rxzи ryz– коэффициенты линейной корреляции между парами признаков Х и Y, Х и Z, Y и Z.

В последнее время чаще зависимую переменную обозначают буквой y, тогда как независимые х1, х2 и т. д.

Уравнение для вычисления коэффициента множественной линейной корреляции (R) легко обобщается на любое число переменных.

Коэффициент множественной корреляции принимает значения от 0 до 1 (0< =R< =1). Значимость этого совокупного коэффициента корреляции оценивают разными способами, в том числе и по F-критерию (Доспехов, 1985):

F= ,

где n – объем выборки,

k – число признаков (число всех, зависимой и независимых переменных).

Fst определяют по табл. для n1=k-1 и n2=n-k.

Нулевая гипотеза принимается, если F< Fst.

R указывает, насколько сильно зависит одна (зависимая) переменная от всех других, учтенных при подсчете R независимых переменных.

Пример вычисления множественной корреляции.

Тот же, что и при вычислении парных корреляций.

Анализ множественной корреляции позволяет оценить суммарное влияние 48 учитывавшихся независимых переменных (температура воздуха и сумм осадков за каждые из 24 месяцев) на урожайность пшеницы.

Коэффициент множественной линейной корреляции очень большой (вычисляли в пакете программ STATISTICA) R=0. 967 и значимый (р=0. 018). Можно говорить об очень тесной связи урожайности с независимыми переменными.

Коэффициент множественной линейной детерминации, являющийся квадратом коэффициента множественной линейной корреляции R2, тоже очень велик (R2=0. 9352).

Иначе говоря, почти 94% (точнее 93. 52%) изменчивости по годам урожайности озимой пшеницы в Луганской области определяется погодными условиями, а именно температурой и осадками. Температура и осадки – главные лимитирующие факторы, детерминирующие урожайность озимой пшеницы.

Все другие, не учтенные в данном исследовании факторы вместе детерминируют 100-93. 52=6. 48% изменчивости урожайности озимой пшеницы по годам. Среди этих факторов такие природные экологические факторы как скорость ветра, снеговой покров, минимальные температуры зимой и максимальные летом, ледяная корка, град, запасы влаги в почве и другие. Отсутствие снегового покрова и ледяная корка увеличивают вероятность повреждения, а то и гибели посевов озимой пшеницы при перезимовке, и поэтому могут снижать ее урожайность. Сильный ветер и град приводят подчас к полеганию пшеницы и недобору урожая. Однако добавление в математическую модель этих факторов не может значительно увеличить R и R2, которые и так уже очень велики (R и R2 в принципе не могут быть равны или больше 1). Неучтенные нами природные экологические факторы в той или иной мере коррелируют с организованными в настоящем исследовании независимыми переменными, и поэтому отчасти уже «учтены». Значительное увеличение R и R2 при добавлении независимых переменных произойти не может, но небольшое увеличение ожидается. По изложенным соображением наши оценки степени влияния независимых переменных (температуры и осадков) на урожайность озимой пшеницы можно принимать за минимальные оценки степени или силы влияния всех погодных факторов.

В эти же 6. 48% укладывается влияние ряда антропогенных факторов (фондо- и энергообеспеченность, объемы использования удобрений и пестицидов, сорта, изменения в организации производства, структуре посевных площадей, площадей под орошением и др. ). Анализ относительной роли этих факторов выходит за рамки настоящей лекции.

До этого исследования считалось, что все факторы внешней среды (погодные флуктуации, «капризы природы») обусловливают лишь 60-80% изменчивости урожайности. В действительности это число больше.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...