Задание 1. Сравнение нескольких выборок по величине одного признака (однофакторный дисперсионный анализ).
Лабораторная работа № 6 Дисперсионный анализ Немного теории Биологическим содержанием операции сравнения двух выборок, в конце концов, выступает поиск факторов, ответственных за смещение средних арифметических или усиление изменчивости признаков. При этом каждому уровню фактора будет соответствовать отдельная выборка. В терминах факториальной биометрии вопрос о влиянии фактора на признак звучит так: сказывается ли отличие условий получения разных выборок на значениях вариант? В терминах статистики вопрос звучит несколько иначе: из одной ли генеральной совокупности отобраны все выборки, оценивают ли выборочные средние арифметические одну и ту же генеральную среднюю? Вариантов ответа может быть только два: 1. Все выборки отобраны из одной генеральной совокупности, условия возникновения вариант одни и те же. 2. Выборки отобраны из разных генеральных совокупностей, условия возникновения вариант выборок различаются. Условия формирования выборок могут отличаться, но они могут никак и не сказаться на величине изучаемого признака, не отразиться на значениях вариант. Задача дисперсионного анализа состоит в том, чтобы охарактеризовать силу и достоверность влияния фактора на величину (средний уровень) признака. Поэтому дисперсионный анализ есть метод сравнения нескольких средних арифметических с использованием критерия Фишера: F = Sфакт./ Sслуч.. Как видно, в качестве обобщенной меры отличия нескольких выборочных средних выступает дисперсия, рассеяние выборочных средних (Mj) вокруг общей средней (Mобщ.): S2факт.=∑(Mj-Mобщ)2/dfфакт, где dfфакт=k-1 j=1,2,3,…, k k – число сравниваемых редних В качестве обобщенной меры случайного варьирования служит дисперсия вариант (xi) вокруг средней в каждой градации (Mj):
S2случ=∑∑(хi - Mj)2/dfслуч где dfслуч=n-1, i=1,2,3,…,n, n – число вариант всех выборок
В основе однофакторного дисперсионного анализа лежит модель варианты (xi), которая выражает ее отклонение от общей средней (M) за счет действия контролируемого фактора (xфакт.) и действия случайных причин (xслуч.): xi = M ±xфакт. ±xслуч. Иными словами, отклонение варианты от общей средней связано с отклонением за счет действия изучаемого фактора и за счет действия прочих неучтенных факторов. Каждой дозе изучаемого фактора соответствует одна выборка (градация). Поэтому каждая групповая (выборочная) средняя будет характеризовать реакцию объектов на соответствующую дозу изучаемого фактора и эффект изучаемого фактора можно выразить как отклонение групповой средней от общей средней: xфакт. = Mj – M. В свою очередь, от групповой средней каждая варианта будет отличаться в силу случайных неучтенных причин, эффект действия случайных факторов можно выразить как отклонение отдельной варианты от данной групповой средней: xслуч. = xi – Mj. Получается, что отклонение варианты от общей средней будет равно отклонению групповой средней от общей средней (эффект учтенного фактора) и отклонению варианты от своей групповой средней (эффект неучтенных факторов). Отсюда: (xi – M) = (Mj – M) + (xi – Mj). Обобщая эту запись для всех вариант выборки (возведя в квадрат и суммировав), получаем правило разложения общей вариации признака на составные части, отражающие влияние всех названных причин: Собщ. = Сфакт. + Сслуч. Общая сумма квадратов признака рассчитывается как сумма квадратов отклонений всех вариант (xi) от общей средней (M): Собщ. = Σ (xi – M)2. Факториальная сумма квадратов рассчитывается как сумма квадратов отклонений частных средних (Mi) для каждой выборки (всего k выборок) от общей средней:
Сфакт. = Σ (Mj – M)2. Остаточная (случайная) сумма квадратов есть сумма квадратов отклонений вариант каждой выборки (xi) от своей средней (Mj): Сслуч. = Σ (xi – Mj)2. Двухфакторный дисперсионный анализ исследует влияние на результативный признак двух факторов как порознь, так и совместно. Учет эффекта влияния каждого фактора по отдельности теоретически ничем не отличается от описанных выше схем. И там и тут оценивается изменчивость средних по градациям на фоне случайной изменчивости вариант внутри градаций, с помощью критерия Фишера устанавливается достоверность отличий межгрупповых дисперсий от внутригрупповых. Важным преимуществом двухфакторного дисперсионного анализа перед однофакторным служит то, что с его помощью в рамках факториальной изменчивости удается определить варьирование по сочетанию градаций Ссочет., позволяющее получить ценный в биологическом отношении показатель – оценку влияния сочетанного действия (взаимодействия) факторов. Модель двухфакторного дисперсионного анализа становится сложнее и выражает отклонение варианты (xi) от общей средней (M) за счет действия двух контролируемых факторов порознь (xфактA., xфактB.) и совместно (xсочетAB.), а также за счет действия случайных причин (xслуч.): xi = M ± xфактA. ± xфактB. ± xсочетAB. ± xслуч.. Правило разложения вариаций предстает как: Собщ. = СA + СB + СAB + Сслуч., Сфакт. = Собщ. – Сслуч. = СA + СB + СAB, где Собщ. = Σ(xi – M)2, СA. = Σ(MAj – M)2, j – число градаций фактора А, СB = Σ(MBk – M)2, k – число градаций фактора В, Сслуч. = Σ(xi – Mxi)2, СAB = Собщ. – (СA + СB + Сслуч.).
Задание 1. Сравнение нескольких выборок по величине одного признака (однофакторный дисперсионный анализ). Оцените влияние растворенного в воде вещества на плодовитость дафний, используемых в качестве тест-объектов в водно-токсикологических экспериментах. В ходе предварительного исследования были получены четыре выборки, четыре группы значений плодовитости животных за неделю, выращенных в средах с разным содержанием химической добавки: чистая вода (контроль): 6, 5, 5, 7 слабая концентрация вещества (5 мг/л): 8, 7, 6, 6 средняя (15 мг/л): 8, 8, 7 сильная (30 мг/л): 8, 7, 9. 1) сгруппируйте выборочный материал в комбинативную таблицу (дисперсионный комплекс). Для этого варианты каждой выборки записываются в отдельные графы (градации): чистая вода - А1, слабая концентрация вещества - А2, средняя - А3, сильная - А4. Предлагаемые расчёты занесите в таблицу 1.
Таблица 1
2) Выполните расчёты, предложенные в таблице 1. 3) Используя полученные значения, вычислите дисперсии, определите силу влияния фактора и критерий достоверности Фишера. 4) Заполните таблицу 2. Таблица 2
η2 факт.= Сфакт./ Собщ. η2 случ.= Сслуч./ Собщ.
5) Сравните полученный критерий Фишера со стандартным значением по таблице. Сделайте статистический вывод. 6) Выполните дисперсионный анализ по представленному алгоритму в среде Excel. Для этого введите подписанные метками (А1, А2…) данные в четыре столбца, отдельно для каждой градации. Вызовите программу обработки командой ДанныеАнализ данныхОднофакторный дисперсионный анализ. Заполните окно макроса, выделив блок данных с метками и поставив галочку в поле «Метки в первой строке». На листе появятся результаты расчетов, идентичные рассчитанным в таблицах 1 и 2. Отношение сумм квадратов (SS, sum of squares) к соответствующему числу степеней свободы дает оценку величины дисперсии, или средний квадрат (MS, mean square). Влияние изучаемого фактора отражает факториальная, или межгрупповая, дисперсия S2факт., а влияние случайных неорганизованных в данном исследовании причин – случайная, или внутригрупповая, остаточная дисперсия S2случ., или S2остат. Нулевая гипотеза гласит: «влияние фактора на признак отсутствует». Проверяют гипотезу по критерию Фишера:
F = S2факт./ S2случ. ≥ F(a,df1,df2), где df1 = k–1, df2 = n–k, k – число градаций результативного признака, n – общий объем всех выборок по всем градациям. Влияние считается достоверным, если величина расчетного критерия равна или превышает свое табличное значение с принятым уровнем значимости (обычно α = 0.05).
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|