Лекция №7.. Теоретические распределения. Дисперсионный анализ. Корреляционный и регрессионный анализ.
Лекция №7. Теоретические распределения. Дисперсионный анализ. Корреляционный и регрессионный анализ. В основе эмпирических распределений (распределение результатов измерений, полученных при изучении выборки) лежат определенные математические закономерности, которые в генеральной совокупности (при n→ ∞ ) характеризуются некоторыми теоретическими закономерностями. На основе теоретических распределений построены статистические критерии, которые используются для проверки некоторых гипотез. Чаще всего в НИР опираются на нормальное распределение или специальные распределения, полученные из нормального, для конкретно поставленной задачи и при ограниченном числе степеней свободы (критерий t, F, χ 2, Пуассона). Для нормального (гауссового) распределения характерно: в области µ ± ϭ лежит 68, 26% (2/3) всех значений всех наблюдений; внутри пределов µ ± 2ϭ – 95, 46% всех значений случайной величины; интервал µ ± 3ϭ охватывает 99, 73% => практически все значения, где µ - генеральная средняя, которая находится в центре распределения; ϭ – стандартное отклонение, измеряет вариацию отдельных наблюдений около средней генеральной совокупности. В практике агрономических исследований можно пользоваться вероятностями 0, 95 – 95% и 0, 99-99%, которые соответствуют 0, 05-5%-ному и 0, 01-1%-ному уровням значимости. Чем стандартное отклонениеϭ больше, => больше варьирует изучаемый материал, и => более пологой становится вариационная кривая, а при малых значениях ϭ она приобретает иглообразную форму. Рис. 1. Нормальныекривые (1, 2, 3) при разныхзначениях параметра s (Лакин Г. Ф., 1990). t-распределение Стьюдента. Закон нормального распределения проявляется при n> 20-30. Однако часто экспериментатор проводит ограниченное число измерений, основывает свои выводы на малых выборках. В 1908г. английский химик В. Госсет открыл закон t-распределения для выборочных средних, определяемый по формуле:
х - µ х - µ t = = , S Sx √ n где в числителе отклонение выборочной средней от средней генеральной совокупности, а в знаменателе – стандартная ошибка всей генеральной совокупности. При увеличении n> 30распределение t приближается к нормальному и переходит в него при n→ ∞. Распределение t-Стьюдента очень важно в работе с малыми выборками: позволяет определить доверительный интервал, накрывающий среднюю арифметическую всей совокупности µ, и проверить ту или иную гипотезу относительно генеральной совокупности. F-распределение Фишера. Если у нормально распределенной совокупности взять 2 независимые выборки объемом n1 и n2 и подсчитать дисперсии S12и S22 со степенями свободы ν 1 = n1 - 1и ν 2 = n2 – 1, то можно определить отношение дисперсий: F = S12/ S22. Отношение дисперсий берут таким, чтобы в числителе была большая дисперсия, и => F≥ 1. В дисперсионном анализе соотношение дисперсии вариантов SV2 / SZ2, является основным критерием, дающим общую оценку достоверности разниц между средними арифметическими или общую оценку достоверности опыта. F = SV2: SZ2. Вычисленный критерий F05 (фактический) сравнивают с теоретическимFтабл. . ЕслиFфакт. ≥ Fтеор. , в опыте доказана достоверность различий между средними арифметическими, т. е. в опыте одна или несколько пар вариантов, между средними х которых есть достоверная разница, а если Fфакт. < Fтеор, то она отсутствует. Дисперсионный анализ – основной и наиболее распространённый метод математической обработки результатов исследований. Он позволяет оценить методику исследований по величине относительной ошибки (точности) – S %, и достоверность разницы между вариантами.
Если Sx% менее 2%, точность отличная, нарушений методики нет. Если 2 < Sx% < 4% - хорошая точность; если 4 < Sx% < 5% - удовлетворительная точность; если Sx% более 5% - точность опыта низкая. Если разница между вариантами больше (с плюсом или минусом) НСР – она существенна, меньше НСР – несущественна. 1. Пример статистической обработки урожайных данных исследований методом дисперсионного анализа в однофакторном полевом опыте: ”Влияние боронования на урожай подсолнечника” Условные (статистические) обозначения: l – число вариантов в опыте; n – количество повторений; Х – поделяночный урожай; Х – средний урожай по вариантам; Хp - средний урожай по повторениям; Х0 – средний урожай по опыту; d – разница между вариантами и контролем; А – произвольное начало (округленное до целого числа значение 0 ); V – сумма по вариантам; Р – сумма по повторениям; VA – cумма отклонений от А по вариантам; РА – сумма отклонений от А по повторениям; С – корректирующий фактор; СУ – общее варьирование (общая дисперсия); СV - варьирование вариантов (дисперсия вариантов); СР – варьирование повторений (дисперсия повторений); СZ – случайное варьирование (остаточная дисперсия); n - число степеней свободы; Sx – ошибка опыта; Sx % - точность опыта (относительная ошибка); НСР05 – наименьшая существенная разность (для 5%-го уровня значимости); å - сигма, знак суммирования; F05 – критерий Фишера F; t05 - критерий Стьюдента t; Н0 – нулевая гипотеза. Исходные данные и расчетные показатели оформляются в таблицу.
Порядок проведения расчетов по дисперсионному анализу. І. Средний урожай по опыту = 0=Σ Х/n∙ l = 263, 1 / 4. 3=21, 9 (табл. 5). ІІ. Произвольное начало = А = 22 (округлённое до целого числа 0). ІІІ. Общая сумма квадратов отклонений от А = å (Х-А)2 =
=2, 25+2, 25+0, 36+0, 01+0, 01+1, 00+0, 16+0, 09+0, 36+0, 64+0, 64 = 7, 77. IV. Сумма квадратов отклонений от А по вариантам = VA2 = =13. 64+2. 25+1. 69 = 17, 63. V. Сумма квадратов отклонений от А по повторениям = РА2 = =1, 44+4, 00+1, 44+1, 21 = 8, 09. VI. Квадрат суммы отклонений от А = [å (X-A)]2 = 0, 92 = 0, 81. VII. Корректирующий фактор = С = [å (X-A)]2/l× n = 0, 81/12 = 0, 07. VIII. Общая дисперсия = СУ = Σ (Х-А)2-С = 7, 77-0, 07 = 7, 70 =100%. IX. Дисперсия повторений = СР = Σ Р2А/l – C = 8, 09: 3 – 0, 07 = 2, 63=34%. Х. Дисперсия вариантов = СV = Σ V2A/n – C = 17, 63: 4 – 0, 07 = 4, 34=56%. ХІ. Остаточная дисперсия = СZ = CУ – (СР + СV) = 7, 70 – 6, 97 = 0, 73=10%. Результаты дисперсионного анализа
Таблица 5. Статистическая обработка урожайных данных методом дисперсионного анализа
Вывод 1-й. Если Fфакт> Fтабл, то нулевая гипотеза отвергается, между вариантами есть существенные различия, а если Fфакт< Fтабл, то нулевая гипотеза подтверждается и между вариантами нет существенных различий. В нашем опыте Fфактзначительно больше Fтабл, следовательно, нулевая гипотеза отвергается и
между вариантами имеются существенные различия. Расчеты. S = = = ±0, 17 ц/га (ошибка опыта). S % = S / 0× 100 = 0, 17/21, 9× 100 = 0, 8 % (точность опыта). НСР05 = S × × t05 = 0, 17× 1, 4× 2, 45 = 0, 6ц/га. n = (n-1)(l-1) = 3× 2 = 6 t05 = 2, 45.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|