Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Задание 1. Сравнение нескольких выборок по величине одного признака (однофакторный дисперсионный анализ).

Лабораторная работа № 6

Дисперсионный анализ

Немного теории

Биологическим содержанием операции сравнения двух выборок, в конце концов, выступает поиск факторов, ответственных за смещение средних арифметических или усиление изменчивости признаков. При этом каждому уровню фактора будет соответствовать отдельная выборка. В терминах факториальной биометрии вопрос о влиянии фактора на признак звучит так: сказывается ли отличие условий получения разных выборок на значениях вариант? В терминах статистики вопрос звучит несколько иначе: из одной ли генеральной совокупности отобраны все выборки, оценивают ли выборочные средние арифметические одну и ту же генеральную среднюю? Вариантов ответа может быть только два:

1. Все выборки отобраны из одной генеральной совокупности, условия возникновения вариант одни и те же.

2. Выборки отобраны из разных генеральных совокупностей, условия возникновения вариант выборок различаются.

Условия формирования выборок могут отличаться, но они могут никак и не сказаться на величине изучаемого признака, не отразиться на значениях вариант. Задача дисперсионного анализа состоит в том, чтобы охарактеризовать силу и достоверность влияния фактора на величину (средний уровень) признака. Поэтому дисперсионный анализ есть метод сравнения нескольких средних арифметических с использованием критерия Фишера:

F = Sфакт./ Sслуч..

Как видно, в качестве обобщенной меры отличия нескольких выборочных средних выступает дисперсия, рассеяние выборочных средних (Mj) вокруг общей средней (Mобщ.):

S2факт.=∑(Mj-Mобщ)2/dfфакт,

где dfфакт=k-1

j=1,2,3,…, k

k – число сравниваемых редних

В качестве обобщенной меры случайного варьирования служит дисперсия вариант (xi) вокруг средней в каждой градации (Mj):

S2случ=∑∑(хi - Mj)2/dfслуч

где dfслуч=n-1,

i=1,2,3,…,n,

n – число вариант всех выборок

 

В основе однофакторного дисперсионного анализа лежит модель варианты (xi), которая выражает ее отклонение от общей средней (M) за счет действия контролируемого фактора (xфакт.) и действия случайных причин (xслуч.):

xi = M ±xфакт. ±xслуч.

Иными словами, отклонение варианты от общей средней связано с отклонением за счет действия изучаемого фактора и за счет действия прочих неучтенных факторов. Каждой дозе изучаемого фактора соответствует одна выборка (градация). Поэтому каждая групповая (выборочная) средняя будет характеризовать реакцию объектов на соответствующую дозу изучаемого фактора и эффект изучаемого фактора можно выразить как отклонение групповой средней от общей средней:

xфакт. = Mj – M.

В свою очередь, от групповой средней каждая варианта будет отличаться в силу случайных неучтенных причин, эффект действия случайных факторов можно выразить как отклонение отдельной варианты от данной групповой средней:

xслуч. = xi – Mj.

Получается, что отклонение варианты от общей средней будет равно отклонению групповой средней от общей средней (эффект учтенного фактора) и отклонению варианты от своей групповой средней (эффект неучтенных факторов). Отсюда:

(xi – M) = (Mj – M) + (xi – Mj).

Обобщая эту запись для всех вариант выборки (возведя в квадрат и суммировав), получаем правило разложения общей вариации признака на составные части, отражающие влияние всех названных причин:

Собщ. = Сфакт. + Сслуч.

Общая сумма квадратов признака рассчитывается как сумма квадратов отклонений всех вариант (xi) от общей средней (M):

Собщ. = Σ (xi – M)2.

Факториальная сумма квадратов рассчитывается как сумма квадратов отклонений частных средних (Mi) для каждой выборки (всего k выборок) от общей средней:

Сфакт. = Σ (Mj – M)2.

Остаточная (случайная) сумма квадратов есть сумма квадратов отклонений вариант каждой выборки (xi) от своей средней (Mj):

Сслуч. = Σ (xi – Mj)2.

Двухфакторный дисперсионный анализ исследует влияние на результативный признак двух факторов как порознь, так и совместно. Учет эффекта влияния каждого фактора по отдельности теоретически ничем не отличается от описанных выше схем. И там и тут оценивается изменчивость средних по градациям на фоне случайной изменчивости вариант внутри градаций, с помощью критерия Фишера устанавливается достоверность отличий межгрупповых дисперсий от внутригрупповых. Важным преимуществом двухфакторного дисперсионного анализа перед однофакторным служит то, что с его помощью в рамках факториальной изменчивости удается определить варьирование по сочетанию градаций Ссочет., позволяющее получить ценный в биологическом отношении показатель – оценку влияния сочетанного действия (взаимодействия) факторов.

Модель двухфакторного дисперсионного анализа становится сложнее и выражает отклонение варианты (xi) от общей средней (M) за счет действия двух контролируемых факторов порознь (xфактA., xфактB.) и совместно (xсочетAB.), а также за счет действия случайных причин (xслуч.):

xi = M ± xфактA. ± xфактB. ± xсочетAB. ± xслуч..

Правило разложения вариаций предстает как:

Собщ. = СA + СB + СAB + Сслуч.,

Сфакт. = Собщ. – Сслуч. = СA + СB + СAB,

где Собщ. = Σ(xi – M)2,

СA. = Σ(MAj – M)2, j – число градаций фактора А,

СB = Σ(MBk – M)2, k – число градаций фактора В,

Сслуч. = Σ(xi – Mxi)2,

СAB = Собщ. – (СA + СB + Сслуч.).

 

Задание 1. Сравнение нескольких выборок по величине одного признака (однофакторный дисперсионный анализ).

Оцените влияние растворенного в воде вещества на плодовитость дафний, используемых в качестве тест-объектов в водно-токсикологических экспериментах. В ходе предварительного исследования были получены четыре выборки, четыре группы значений плодовитости животных за неделю, выращенных в средах с разным содержанием химической добавки:

чистая вода (контроль): 6, 5, 5, 7

слабая концентрация вещества (5 мг/л): 8, 7, 6, 6

средняя (15 мг/л): 8, 8, 7

сильная (30 мг/л): 8, 7, 9.

1) сгруппируйте выборочный материал в комбинативную таблицу (дисперсионный комплекс). Для этого варианты каждой выборки записываются в отдельные графы (градации): чистая вода - А1, слабая концентрация вещества - А2, средняя - А3, сильная - А4. Предлагаемые расчёты занесите в таблицу 1.

 

 

Таблица 1

  Градации фактора  
А1 А2 А3 А4
х х2 х х2 х х2 х х2
               
                вспомогательные значения
∑х2                   Н1=∑(∑х2 )=
∑х                   Н2=(∑∑х)2/n)=
n                  
(∑x)2/n                   H3=∑(∑х)2/n=
M                    
Сфакт.=Н3-Н2=
Сслуч.=Н1-Н2=
Собщ.=Н1-Н3=

2) Выполните расчёты, предложенные в таблице 1.

3) Используя полученные значения, вычислите дисперсии, определите силу влияния фактора и критерий достоверности Фишера.

4) Заполните таблицу 2.

Таблица 2

Составляющие дисперсии Суммы квадратов, С Сила влияния, η2 Степени свободы, df Дисперсии, S2 Критерий Фишера, F
Факториальная          
Случайная        
Общая        

 

η2 факт.= Сфакт./ Собщ.

η2 случ.= Сслуч./ Собщ.

 

5) Сравните полученный критерий Фишера со стандартным значением по таблице. Сделайте статистический вывод.

6) Выполните дисперсионный анализ по представленному алгоритму в среде Excel. Для этого введите подписанные метками (А1, А2…) данные в четыре столбца, отдельно для каждой градации.

Вызовите программу обработки командой ДанныеАнализ данныхОднофакторный дисперсионный анализ. Заполните окно макроса, выделив блок данных с метками и поставив галочку в поле «Метки в первой строке». На листе появятся результаты расчетов, идентичные рассчитанным в таблицах 1 и 2.

Отношение сумм квадратов (SS, sum of squares) к соответствующему числу степеней свободы дает оценку величины дисперсии, или средний квадрат (MS, mean square). Влияние изучаемого фактора отражает факториальная, или межгрупповая, дисперсия S2факт., а влияние случайных неорганизованных в данном исследовании причин – случайная, или внутригрупповая, остаточная дисперсия S2случ., или S2остат. Нулевая гипотеза гласит: «влияние фактора на признак отсутствует». Проверяют гипотезу по критерию Фишера:

F = S2факт./ S2случ. ≥ F(a,df1,df2),

где df1 = k–1, df2 = n–k,

k – число градаций результативного признака,

n – общий объем всех выборок по всем градациям.

Влияние считается достоверным, если величина расчетного критерия равна или превышает свое табличное значение с принятым уровнем значимости (обычно α = 0.05).

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...