Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Однофакторный дисперсионный анализ




 

Простейшим случаем дисперсионного анализа является од­нофакторный анализ. В этой главе мы дадим его определение и будем использовать этот случай для иллюстрации некоторых положений общей теории оценок и критериев, изложенной далее. Кроме того, будут введены также некоторые новые понятия и методы, относящиеся к задачам множественного сравнения (построение некоторых видов совместных довери­тельных интервалов и соответствующих им критериев). Сна­чала эти понятия и методы вводятся в связи с классификацией по одному признаку, а затем будут перенесены на общий слу­чай. После этого мы сможем рассматривать эти методы как дополнение общего F -критерия гл. 2 в следующем смысле. Мы видели, что нулевая гипотеза Н равносильна утверждению, что все параметрические функции некоторого класса имеют нулевые значения. Каждый раз, когда по F -кри­терию Н отвергается, мы можем одним из методов множе­ственного сравнения решить, какая параметрическая функция рассматриваемого класса отличается от нуля и как велико это отличие. Мы увидим также, что F -критерий можно рассматривать как предварительный метод решения вопроса о целесообразности продолжения обра­ботки наблюдений другими более сложными методами, или F -критерий можно применить к исследованию оценки функции из рассматриваемого класса, которая в некотором смысле сильно отличается от нуля, и решить, значимо ли отли­чается от нуля эта оценка.

Термин однофакторный анализ (или классификация по од­ному признаку) относится к сравнению средних нескольких (одномерных) популяций. Обозначим их средние через . Допустим, что популяции нормально распределены с равными дисперсиями . Пусть мы имеем независимые вы­борки объемов  из соответствующих популяций. Обозначим выборку из i-й популяции через  - Тогда наши основные предположения равносильны сле­дующим:

Используя общую теорию для проверки гипотезы

Н: ,

мы построим F -критерий в предположениях . Обозначение вектора наблюдений  используемое в общей теории, нужно заменить обозначением с двойными индексами координат, а именно . Из равенств  заключаем, что (n I)-матрица  теперь имеет следующий вид: каждая из первых J 1строк равна , каждая из следующих J 2 строк равна ,..., каждая из последних JI строк равна , где  является i -й строкой единичной матрицы. Таким образом, ранг r (число линейно независимых строк) мат­рицы  равен I (числу столбцов обозначенному в общей теории гл. 1 через р). Отсюда следует, что любая параметри­ческая функция допускает оценку.

Сумма квадратов , которую мы должны минимизи­ровать при  и , вычисляется по формуле

.

Нормальные уравнения в предположениях  можно получить,

приравнивая к нулю производные

при . Уравнения дают мнк -оценки . В даль­нейшем мы будем часто использовать следующее удобное обо­значение. Так мнк -оценки  можно записать в виде

.

Замена индекса звездочкой показывает, что вычислено ариф­метическое среднее величин, в которых заменяется индекс, по всем возможным значениям этого индекса. В этих предположениях функцию                              можно записать как

,

где через обозначено общее (неизвестное) значение величин . В этом случае имеется только одно нормальное уравнение 

.

Из этого уравнения находим (крышка над   указывает, что это оценка неизвестного )

Далее , где  является мнк -оценкой  при .

Для вычисления SS удобно использовать -обозначения. Будем через  обозначать , а через   и  — мнк -оценки  при  и , равные проекциям у на пространства Vr и Vr-q, которым  принадлежит соответственно при условиях  и . Координаты векторов ,  и  можно теперь занумеро­вать двойными индексами по аналогии с координатами у.  Тогда «(i, j)-координата» (координата с индексом ij) вектора   рав­на , следовательно,  и  при .

Можно получить (i, j)-координату , заменив  на их мнк -оценки при ; эта замена дает .

Произведя аналогичную замену при , найдем, что (i, j)-ко­ордината вектора  равна .

Суммы квадратов в чис­лителе и знаменателе статистики   мы получаем из общих тождеств

, ,

которые преобразуются в

 

,

.

Эти формулы подсказывают простое наглядное объяснение: SSH представляет собой взвешенную меру разброса выбороч­ного среднего в I популяциях, a SSe является составной мерой разброса наблюдений в пределах каждой из I выборок. По этим соображениям SSH  можно назвать SS между группами, a SSe можно назвать SS внутри групп. Для численного вычисления этих SS используются формулы, которые также следуют из общих тождеств. Тождество   в на­шем случае имеет вид

,

.

Общее тождество  или  запишется в виде

.

Сумму квадратов в левой части можно назвать полным SS от­носительно общего среднего. Обозначать эту сумму будем через SSП в отличие от . В этих обозначениях можно записать так:

Окончательно общее тождество  принимает вид

.

Гипотезу Н  можно задать, приравнивая к нулю I -1 раз­личных линейно независимых функций; например,

Н: .

Отсюда число ст. св. SSH  равно q = I -1. Мы уже видели, что г= I, так что число ст. св. SSe равно п - r = п -  I. Таким

образом, статистикой  является отношение , где

, .

По F -критерию гипотеза Н отвергается с заданным уровнем значимости   тогда и только тогда, когда . При   статистика   имеет нецентральное F -pacпределение, а именно  является величиной ,

Если мы положим  , так что 

Некоторые из этих результатов собраны в таблицу.

Таблица1

Однофакторный анализ

 

Источник дисперсии Сте­пень сво­боды
Между группами     Внутри групп     I-1   n-1          
«Полная» сумма квадратов n-1

Методы вычислений, предложенные в этой книге, облегчаются применением ЭВМ. Весьма часто требуется сохранять большое число верных знаков до конца вычислений из-за возможной потери их при вычислении SS вычитанием из другого SS. Понятно, что в промежуточных вычислениях лучше иметь больше знаков, так как если после вычитания их оста­нется слишком мало, то придется повторить полностью все вы­числения. С другой стороны, окончательный результат должен содержать разумное число знаков, обычно такое, чтобы еди­ница последнего сохраненного знака имела порядок пяти оце­нок стандартного отклонения результата. Статистик, работаю­щий с химиками или инженерами, может дискредитировать себя необдуманным предложением доверительного интервала такого вида 7,32179 ± 0,05248 вместо 7,32 ±0,05 или использованием углового коэффициента прямой с семью знаками, когда сама прямая была подобрана по данным с тремя знаками. При вычисле­ниях с машинами, или без них (особенно если у чисел совпа­дают знаки старших разрядов), полезно преобразовать данные вычитанием подходящей постоянной; например, если данные заключены в пределах от 151,2 до 158,7, то удобно вычесть 150; результат, вычисленный по преобразованным данным, оче­видно, будет такой же, как по исходным.

 

2.2.2. Многофакторный  анализ

В этом параграфе мы применяем общую теорию к про­стейшим планам эксперимента для исследования эффектов двух факторов. Эти простейшие планы мы будем называть полным анализом. В конце главы будет рассмотрена общая задача разбиения суммы квадратов.

Предположим, что два фактора A и В изменяются в экспе­рименте или в рассматриваемой совокупности условий, напри­мер в эксперименте типа, где различные растения (А) были посажены на различных участках (В) с оди­наковым химическим составом смесей, или, например в исследованиях нескольких видов технологий (А), наблю­даемых на различных строительных объектах (В). Если в первом примере рассмат­ривается I растений и J местностей, то эти I и J называют соответственно I уровнями фактора A и J уровнями фактора В. Уровни могут описывать качественную классификацию, как, на­пример, виды растений, или же количественную, как, например, затраты на применение технологии.

В таких двухфакторных экспериментах наблюдения могут быть расположены по этим двум факторам в виде таблицы с двумя входами (двухфакторной таблицы), I строк которой соответствуют уров­ням фактора A, а J столбцов — уровням В. В «(i, j) -ячейку», расположенную на пересечении i -й строки и j -го столбца, запи­сываются наблюдения, полученные при одновременном иссле­довании факторов А и В соответственно в i-м и j -м уровнях. Если в каждой ячейке есть по крайней мере одно наблюдение, то возможен полный анализ. Если мы допустим, что наблюдения в (i, j)-ячейке являются случай­ной выборкой из популяции, соответствующей этой ячейке, то можно говорить о среднем и дисперсии этой популяции как об «истинном» среднем ячейки и «истинной» дисперсии ячейки. Все понятия этого параграфа будут определены в терминах «истинных» средних ячейки, которые также называют «истин­ными» результатами в рассматриваемой совокупности условий. Мы будем обозначать «истинное» среднее (i, j)-ячейки через  если нет дополнительных предположений относительно { }, то мнк -оценкой, как будет показано позднее, является среднее наблюдение в (i, j)-ячейке. Это среднее называют наблюденным средним ячейки или наблюденным результатом. Для краткости мы будем опускать слово «истинный», но везде в этом пара­графе будут иметься в виду «истинные» значения.

Предположим, что веса  выбраны в соответствии с уров­нями фактора В. Например, если в J местностях Калифорнии I сортов хлопка проверяется в эксперименте, на основании ко­торого для всей Калифорнии будет отобран единственный сорт, то естественно взвесить J местностей с весами , пропор­циональными площадям хлопка в областях, типичными пред­ставителями которых являются эти J местностей. Средним i-го уровня А называют взвешенное среднее от средних ячейки { } i -й строки, причем веса  зависят от столбцов и не зависят от строк; таким образом, это среднее является средним резуль­татом i-го уровня A, осредненным по уровням В. Предпола­гается, что веса  неотрицательны и не все равны нулю, поэтому, не нарушая общности, можно допустить, что .

Таким образом,  рассматриваются как произвольные, но фиксированные числа. Теперь среднее i-го уровня А запишется в виде ; это среднее называют также средним i -й строки. Аналогично если  является произвольным множеством чисел со всеми  и , то среднее j-го уровня B, или среднее j-го cтолбца, определяется формулой

,

Генеральным средним будем называть взвешенное среднее средних столбца {В j } с весами , или взвешенное среднее средних строки {Ai} с весами . Обозначая генеральное сред­нее через , получим

.

Главный эффект i-го уровня А определяется как превышение среднего i -го уровня над генеральным средним

.

Отметим, что { } удовлетворяют условию .       

 

Аналогично главный эффект j -го уровня В определяется как

,

откуда

.

Главные эффекты  и  называют также эффектом i-й строки и эффектом j-го столбца. Мы придаем особое значение тому, что главные эффекты одного фактора являются средними по уровням других факторов и, таким образом, обычно зависят от того, каковы уровни других факторов, присутствующих в экс­перименте (когда используется модель с фиксированными фак­торами, рассматриваемая в первой части книги).

Если мы будем определять главный эффект i -го уровня А специально по отношению к j -му уровню В, то естественно определить его как превышение  над средним j -го столбца, т. е. .

Главный эффект i -го уровня A, определенный выше, является фактически взвешенным средним от по столбцам: . Превышение над своим средним называется взаимодействием i-го уровня А с j-м уров­нем В .

Мы могли бы прийти к тому же результату, если бы начали с главного эффекта j -го уровня В специально по отно­шению к i -му уровню А; взаимодействие симметрично, поэтому мы можем назвать  взаимодействием i -го уровня А и j -го уровня В. Отметим, что IJ взаимодействий удовлетворяют условиям

; при всех j;

; при всех i.

Подставляя   и  получим .

Предположим, что .Вычисляя , ,  и  по их определениям через  и допуская, что перво­начальные величины удовлетворяют дополнительным условиям, мы получим .

Теорема. Если при некоторой системе весов  и  все взаимодействия  равны нулю, то все они равны нулю при любой другой системе весов. В этом случае каждое срав­нение главных эффектов или  имеет значение, не зави­сящее от системы весов  и ; такое же утверждение верно для сравнений средних {Ai} и { В j } уровней А и В соот­ветственно.

Доказательство. При некоторой частной системе ве­сов  и  определенные выше величины  обозначим через . Предположим, что все .

.

Пусть теперь  и —любая другая система весов, так что  , , , .Тогда  получим

,

и аналогично

,

.

Подставляя эти три выражения мы найдем, что . Это доказывает теорему.

Мы говорим о случае отсутствия взаимодействий, если все . Из доказанной выше теоремы следует, что при другой системе весов мы тоже получим случай отсутствие взаимодействий. Из этой же теоремы следует, что значения всх сравнений главных эффектов  и  не изменятся, если даже вычислять и  с различными весами. Случай отсутствия взаимодействий называют также случаем аддитивности эффектов. Формально его можно определить как существования постоянных {ai}, {bj} таких, что  при всех (i, j); тогда так же, как в доказательстве приведенной выше теоремы, отсюда легко следует, что все .

Интерпретация дисперсионного анализа является очень простой, когда мы решаем (на основании статистических или других соображений), что взаимодействия отсутствуют. Тогда нашими заключениями о главных эффектах (и, возможно, о генеральном среднем) обычно достаточно суммировать весь анализ. Так, например, если мы сравниваем первую разновидность растений со второй (в примере с растениями и участками) и заключаем, что сравнение (главный эффект первой разновидности) — (главный эффект второй разновидности) положительно, то из этого вытекает, что первая разновидность лучше второй в одном и том же смысле для всех местностей; но если мы не сделали предположения об аддитивности эффектов, то наше заключение может быть таким: среднее по J местностям первой разновидности лучше среднего второй. Однако может слу­читься, что в некоторой местности вторая разновидность будет лучше первой. Пусть некоторая интерпретация дисперсионного анализа была дана в предположении аддитивности. Если это предположение было принято только потому, что гипотеза от­сутствия взаимодействий не была отвергнута некоторым F -критерием, то нужно посмотреть, имеет ли этот критерий разумную мощность отбрасывания гипотезы, если на самом деле взаимо­действия достаточно велики, чтобы сделать неправильной интерполяцию, основанную на этой гипотезе.

Иногда случается, что гипотеза отсутствия взаимодействий отбрасывается статистическим критерием, а гипотеза нулевых главных эффектов обоих факторов принимается. В этом случае правильный вывод заключается в том, что не доказано отсут­ствие эффектов. Если есть ненулевые взаимодействия, то должны быть ненулевые разности средних ячейки. Заключение состоит в том, что разности есть, но когда эффекты уровней одного фактора усредняются по уровням другого, то доказы­вается отсутствие разности для этих усредненных эффектов.

Легко проверить, что свойство аддитивности эффектов сохраняется при линейных преобразованиях наблюдений и их средних , но при нелинейных преобразованиях это свой­ство обычно нарушается. Представляет интерес решение сле­дующей задачи: существует ли, если есть взаимодействие, под­ходящее преобразование шкалы измерений такое, что в новой шкале эффекты складываются. Эта практическая задача крайне сложна, так как нам неизвестны взаимодействия, и мы рас­полагаем только оценками, которые имеют ошибку. В конце этого параграфа рассматривается более теоретическая задача преобразования в случае, когда взаимодействия известны. Все это представляет некоторый математический интерес и может обогатить наши представления о взаимодействиях.

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...