8.Однофакторный дисперсионный анализ.
8. Однофакторный дисперсионный анализ. Основной задачей дисперсионного анализа является выявление фактора влияния одного или нескольких факторов на показатель У. Пусть изучается влияние фатора х на показатель у. Для этого фиксируются рез-ты измерений показателя у в различных группах. Пусть для каждого фактора х выделяют m уровней и для каждого уровня проведено n измер. В качестве нулевой гипотезы выдвигается предположение о том, что показатель у не зависит от фактора х. В этом случае необходимо сравнить разброс значений результатов измерений у относительно средних значений в каждой группе, а также относительно общего среднего. Если эти отклонения не существенны, то нулевая гипотеза о равенстве мат ожиданий принимается: . Это означает, что результаты измерений не отличаются друг от друга и поэтому их можно объединить в одну однородную группу. Это означает, что фактор х не влияет на показатель у. Результаты измерения показателя у можно занести в след таблицу:
Среднее значение в каждой группе определяется по формуле: общее среднее: Разброс средних значений по группе результатов измерений и общего среднего можно оценить с помощью следующей формулы: Q=Q1+Q2, где Q- сумма квадратов отклонений результатов измерений от общего среднего, т. е. Q=
Q1= Q2= На самом деле, Q=Q1+Q2+Q3, но Q3=0. поэтому Q=Q1+Q2 где Q1 называется межгрупповой разброс средних значений. Q2 харктеризует разброс средних результатов значений У относительно среднего значения и называется внутригрупповым рассеиванием. Число степеней свободы: Q1: Для оценки дисперсии обозначим: -Межгрупповая дисперсия: -Внутригрупповая дисперсия: Для проверки нулевой гипотезы Но можно использовать отношение 2-х дисперсий: F параметр- Критерий Фишера. Обозначим все возможные значения F через f. Закон распределения Фишера: Вся область всевозможных параметров f делится на 2-е части: РИСУНОК РАСПРЕДЕЛЕНИЯ ФИШЕРА!!!! 1) Область допустимых значений, куда значения параметра f попадают с большей вероятностью > 90% 2) Область критических значений: p+q=1 p-попадающие в 90% q-не попадающие. Вероятность попадания расчётного значения в критическую область назыв. уравнением значимости критерия фишера. Если Fрасч< Fкрит, то расчётное значение попадает в первую область допустимых значений, т. е. принимается нулевая гипотеза о равенстве математических ожиданий, и считается, что фактор х не влияет на у. Если наоборот, то для уровня значимости q расчетные значения критерия Фишера F попадают во II область и поэтому Н0 отвергается и принимается решение о том, что фактор х влияет на показатель у. 9. Двухфакторный дисперсионный анализ. Дисперсионный анализ позволяет определить факторное влияние одного или нескольких факторов (переменных) на результативный признак. Рассмотрим случай, когда на пок-ль У влияют(или нет) 2 фактора. Предположим, что для каждого фактора производится только одно измерение. Тогда рез-ты измерений можно занести в след таблицу:
Особенностью многофакторного анализа явл то, что взаимное влияние факторов может искажать рез-т показателей системы У. Общее отклонение любого рез-та измерения У от общего среднего склад-ся их 3-ех слагаемых Q=Q1+Q2+Q3, где Q1 хар-ет разброс рез-тов измерений(среднее по строке относительно общего среднего) Q1=k*
(m-1)(k-1). Тогда дисперсии можно оценивать по след. формулам:
При двухфакторном дисперс. анализе требуется определить является ли существенным влияние 1-ого и 2-ого факторов на соответств. мат. ожидания У на фоне остаточного разброса, характеризуемого дисперсией H01 заключается в том, что проверяется постоянство мат. ожиданий по строке при изменении 1-ого фактора. H02 о постоянстве мат ожиданий при изменении 2-ого фактора. Эти гепотезы проверяются с помощью критерия Фишера. F1ФАКТ= Если F1ФАКТ Если F1ФАКТ Если F2ФАКТ Если F2ФАКТ Для определения степени линейной связи рассчитывается коэфф-т корреляции.
Для определения нелинейной связи определяется индекс корреляции
Коэффициент детерминации: R2= Показывает на сколько % изменения показателя у от своего среднего значения зависит от изменения фактора х от своего среднего значения. Чем ближе значение R² к 1, тем точнее модель.
Из всех полученных уровнений регрессии, лучшей является та, у которой коэф-т детерминации больший. Если исследуется несколько факторов (больше2) то в этом случае рассчитывается множественный коэфф-т корреляции. RY, X1, X2.. XN-множественный коэфф-т корреляции. При анализе влияния нескольких факторов друг на друга определяется корреляционная матрица, которая состоит из всех возможных парных линейных коэфф-тов корреляции. Корреляционная матрица:
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|