Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Лекция №7.. Теоретические распределения. Дисперсионный анализ. Корреляционный и регрессионный анализ.




Лекция №7.

Теоретические распределения. Дисперсионный анализ. Корреляционный и регрессионный анализ.

    В основе эмпирических распределений (распределение результатов измерений, полученных при изучении выборки) лежат определенные математические закономерности, которые в генеральной совокупности (при n→ ∞ ) характеризуются некоторыми теоретическими закономерностями. На основе теоретических распределений построены статистические критерии, которые используются для проверки некоторых гипотез. Чаще всего в НИР опираются на нормальное распределение или специальные распределения, полученные из нормального, для конкретно поставленной задачи и при ограниченном числе степеней свободы (критерий t, F, χ 2, Пуассона).

    Для нормального (гауссового) распределения характерно:

в области µ ± ϭ лежит 68, 26% (2/3) всех значений всех наблюдений;

внутри пределов µ ± 2ϭ – 95, 46% всех значений случайной величины;

интервал µ ± 3ϭ охватывает 99, 73% => практически все значения, где

µ - генеральная средняя, которая находится в центре распределения;

ϭ – стандартное отклонение, измеряет вариацию отдельных наблюдений около средней генеральной совокупности.

В практике агрономических исследований можно пользоваться вероятностями 0, 95 – 95% и 0, 99-99%, которые соответствуют 0, 05-5%-ному и 0, 01-1%-ному уровням значимости.

Чем стандартное отклонениеϭ больше, => больше варьирует изучаемый материал, и => более пологой становится вариационная кривая, а при малых значениях ϭ она приобретает иглообразную форму.

Рис. 1. Нормальныекривые (1, 2, 3) при разныхзначениях параметра s (Лакин Г. Ф., 1990).

t-распределение Стьюдента. Закон нормального распределения проявляется при n> 20-30. Однако часто экспериментатор проводит ограниченное число измерений, основывает свои выводы на малых выборках. В 1908г. английский химик В. Госсет открыл закон t-распределения для выборочных средних, определяемый по формуле:

х - µ        х - µ

t =      =        ,

      S           Sx

                   √ n

где в числителе отклонение выборочной средней от средней генеральной совокупности, а в знаменателе – стандартная ошибка всей генеральной совокупности.

При увеличении n> 30распределение t приближается к нормальному и переходит в него при n→ ∞.

Распределение t-Стьюдента очень важно в работе с малыми выборками: позволяет определить доверительный интервал, накрывающий среднюю арифметическую всей совокупности µ, и проверить ту или иную гипотезу относительно генеральной совокупности.

F-распределение Фишера. Если у нормально распределенной совокупности взять 2 независимые выборки объемом n1 и n2 и подсчитать дисперсии S12и S22 со степенями свободы ν 1 = n1 - 1и ν 2 = n2 – 1, то можно определить отношение дисперсий: F = S12/ S22. Отношение дисперсий берут таким, чтобы в числителе была большая дисперсия, и => F≥ 1.

В дисперсионном анализе соотношение дисперсии вариантов SV2 / SZ2, является основным критерием, дающим общую оценку достоверности разниц между средними арифметическими или общую оценку достоверности опыта. F = SV2: SZ2. Вычисленный критерий F05 (фактический) сравнивают с теоретическимFтабл. . ЕслиFфакт. ≥ Fтеор. , в опыте доказана достоверность различий между средними арифметическими, т. е. в опыте одна или несколько пар вариантов, между средними х которых есть достоверная разница, а если Fфакт. < Fтеор, то она отсутствует.

Дисперсионный анализ – основной и наиболее распространённый метод математической обработки результатов исследований. Он позволяет оценить методику исследований по величине относительной ошибки (точности) – S %, и достоверность разницы между вариантами.

Если Sx% менее 2%, точность отличная, нарушений методики нет.

Если 2 < Sx% < 4% - хорошая точность;

если 4 < Sx% < 5% - удовлетворительная точность;         

если Sx% более 5% - точность опыта низкая.

Если разница между вариантами больше (с плюсом или минусом) НСР – она существенна, меньше НСР – несущественна.

1. Пример статистической обработки урожайных данных исследований методом дисперсионного анализа в однофакторном полевом опыте: ”Влияние боронования на урожай подсолнечника”

Условные (статистические) обозначения:

l – число вариантов в опыте;

n – количество повторений;

Х – поделяночный урожай;

Х – средний урожай по вариантам;

Хp - средний урожай по повторениям;

Х0 – средний урожай по опыту;

d – разница между вариантами и контролем;

А – произвольное начало (округленное до целого числа значение 0 );

V – сумма по вариантам;

Р – сумма по повторениям;

VA – cумма отклонений от А по вариантам;

РА – сумма отклонений от А по повторениям;

С – корректирующий фактор;

СУ – общее варьирование (общая дисперсия);

СV - варьирование вариантов (дисперсия вариантов);

СР – варьирование повторений (дисперсия повторений);

СZ – случайное варьирование (остаточная дисперсия);

n - число степеней свободы;

Sx – ошибка опыта;

Sx % - точность опыта (относительная ошибка);

НСР05 – наименьшая существенная разность (для 5%-го уровня

          значимости);

å - сигма, знак суммирования;

F05 критерий Фишера F;

t05 - критерий Стьюдента t;

Н0 – нулевая гипотеза.

Исходные данные и расчетные показатели оформляются в таблицу.

№ вар.

Варианты

Х

V

X

d

X-A

VA

(X-A)2

V2A

І ІІ ІІІ IV І ІІ ІІІ IV І ІІ ІІІ IV
              å (X-A)2 å V2A
    P XP             å p2A [å (X-A]2

Порядок проведения расчетов по дисперсионному анализу.

І. Средний урожай по опыту = 0=Σ Х/n∙ l = 263, 1 / 4. 3=21, 9 (табл. 5).

ІІ. Произвольное начало = А = 22 (округлённое до целого числа 0).

ІІІ. Общая сумма квадратов отклонений от А = å (Х-А)2 =    

=2, 25+2, 25+0, 36+0, 01+0, 01+1, 00+0, 16+0, 09+0, 36+0, 64+0, 64 = 7, 77.

IV. Сумма квадратов отклонений от А по вариантам = VA2 =

=13. 64+2. 25+1. 69 = 17, 63.

V. Сумма квадратов отклонений от А по повторениям = РА2 =

=1, 44+4, 00+1, 44+1, 21 = 8, 09.

VI. Квадрат суммы отклонений от А = [å (X-A)]2 = 0, 92 = 0, 81.

VII. Корректирующий фактор = С = [å (X-A)]2/l× n = 0, 81/12 = 0, 07.

VIII. Общая дисперсия = СУ = Σ (Х-А)2-С = 7, 77-0, 07 = 7, 70 =100%.

IX. Дисперсия повторений = СР = Σ Р2А/l – C = 8, 09: 3 – 0, 07 = 2, 63=34%.

Х. Дисперсия вариантов = СV  = Σ V2A/n – C = 17, 63: 4 – 0, 07 = 4, 34=56%.

ХІ. Остаточная дисперсия = СZ = CУ – (СР + СV) = 7, 70 – 6, 97 = 0, 73=10%.

Результаты дисперсионного анализа

Дисперсия

Сумма квадратов

Число степеней свободы

Средний квадрат S2

F05

факт. табл.
Общая – СУ Повторений-СР Вариантов - СV 7, 70 2, 63 4, 34 (ln-1) = 11 (n-1) = 3 (l-1) = 2 - - СV: (L-1)=2, 17 18, 08 5, 14
Остаточная-СZ 0, 73 (l-1)(n-1)=6 СZ/(n-1)(L-1)= =0, 12 - -

 


 

Таблица 5. Статистическая обработка урожайных данных методом дисперсионного анализа

 

Варианты

опыта

Х

V

d

X – A

VА

(X – A)2

VА2

I II III IV I II III IV I II III IV
Без боронования 20, 5 20, 5 21, 4 21, 9 84, 3 21, 1 - -1, 5 -1, 5 -0, 6 -0, 1 -3, 7 2, 25 2, 25 0, 36 0, 01 13, 69
Боронование до всходов 22, 0 22, 1 23, 0 22, 4 89, 5 22, 4 +1, 3 0, 0 +0, 1 +1, 0 +0, 4 +1, 5 0, 00 0, 01 1, 00 0, 16 2, 25
Боронование по всходам 22, 3 21, 4 22, 8 22, 8 89, 3 22, 3 +1, 2 +0, 3 -0, 6 +0, 8 +0, 8 +1, 3 0, 09 0, 36 0, 64 0, 64 1, 69
Р 64, 8 64, 0 67, 2 67, 1 263, 1 21, 9 РА -1, 2 -2, 0 +1, 2 +1, 1 -0, 9 1, 44 4, 00 1, 44 1, 21 0, 81
р 21, 6 21, 3 22, 4 22, 4 0 21, 9                      

 


Вывод 1-й. Если Fфакт> Fтабл, то нулевая гипотеза отвергается, между

               вариантами есть существенные различия, а если Fфакт< Fтабл,

               то нулевая гипотеза подтверждается и между вариантами нет

               существенных различий. В нашем опыте Fфактзначительно

               больше Fтабл, следовательно, нулевая гипотеза отвергается и

               между вариантами имеются существенные различия.

Расчеты. S  = = = ±0, 17 ц/га (ошибка опыта).

           S % = S / 0× 100 = 0, 17/21, 9× 100 = 0, 8 % (точность опыта).

НСР05 = S × × t05 = 0, 17× 1, 4× 2, 45 = 0, 6ц/га.

n = (n-1)(l-1) = 3× 2 = 6 t05 = 2, 45.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...