Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Алгоритм факторного анализа.




1. Формулировка проблемы.

Формулировка проблемы включает несколько задач. Необходимо четкое определение целей факторного анализа. Переменные, подвергаемые факторному анализу, задаются исходя из прошлых исследований, теоретических выкладок и по усмотрению исследователя. Важно, что­бы переменные измерялись в интервальной или относительной шкале. Выборка должна быть подходящего размера. Опыт подсказывает, что рекомендуется брать выборку, по крайней мере, в четыре или пять раз больше, чем число переменных.

2. Построение корреляционной матрицы.

В основе факторного анализа лежит матрица корреляций между переменными. Ее анализ дает маркетологам ценную информацию. Целесообразность выполнения факторного анализа опре­деляется наличием корреляций между переменными. На практике так обычно и бывает. Если же корреляции между всеми переменными небольшие, то факторный анализ бесполезен. Сле­дует также ожидать, что переменные, тесно взаимосвязанные между собой, должны также тесно коррелировать с одним и тем же фактором или факторами.

Для проверки целесообразности использования факторной модели для анализа зависимости переменных существует несколько статистик. С помощью критерия сферичности Бартлетта про­веряется нулевая гипотеза об отсутствии корреляций между переменными в генеральной сово­купности: другими словами, рассматривается утверждение о том, что корреляционная матрица совокупности — это единичная матрица, в которой все диагональные элементы равны 1, а все остальные равны 0. Проверка с помощью критерия сферичности основана на преобразовании детерминанта корреляционной матрицы в статистику хи-квадрат. При большом значении ста­тистики нулевую гипотезу отклоняют. Если же нулевую гипотезу не отклоняют, то целесооб­разность выполнения факторного анализа вызывает сомнения. Другая полезная статистика — критерий адекватности выборки Кайзера—Мейера—Олкина (КМО). Данный коэффициент сравнивает значения наблюдаемых коэффициентов корреляции со значениями частных коэф­фициентов корреляции. Небольшие значения КМО-статистики указывают на то, что корреля­ции между парами переменных нельзя объяснить другими переменными и что использование факторного анализа нецелесообразно.

3. Определение метода факторного анализа.

Различные методы факторного анализа раз­личают в зависимости от подходов, используемых для выделения коэффициентов значения факторов. Существует два основных метода — анализ главных компонент и анализ общих факторов.

При анализе главных компонентучитывают всю дисперсию данных. Диагональ корреляционной матрицы состоит из единиц, и вся дисперсия.введена в матри­цу факторных нагрузок. Анализ главных компонент рекомендуется выполнять, если основная задача исследователя — определение минимального числа факторов, которые вносят макси­мальный вклад в дисперсию данных, чтобы в последующем использовать их в многомерном анализе. Эти факторы называют главными компонентами.

В анализе общих факторовфакторы определяют только на основа­нии общей дисперсии. Общности располагаются на диагонали корреляционной матрицы. Этот метод подходит, если основной задачей является определение латентных переменных и общей дисперсии. Этот метод также известен как разложение матрицы.

Существуют и другие методы оценки общих факторов. Они включают: метод невзвешенных наименьших квадратов, обобщенный метод наименьших квадратов, метод максимального правдоподобия, альфа-факторный метод, метод распознавания образов. Эти методы сложнее, и их не рекомендуется использовать неопытным аналитикам.

4. Определение числа факторов.

Для определения числа факторов могут быть использованы следующие процедуры.

Определение, основанное на предварительной информации. Иногда, руководствуясь предва­рительной информацией, исследователь знает, сколько факторов можно ожидать, и таким об­разом, может заранее определить число выделяемых факторов. После извлечения желаемого числа факторов их выделение прекращают.

 

Определение, основанное на собственных значениях факторов. Вэтом методе учитывают только факторы, собственные значения которых выше 1,0; остальные факторы в модель не включают. Собственное значение представляет значение дисперсии, обусловленной действием этого фактора.

Определение, основанное на критерии «каменистой осыпи». Графическое изображение кри­терия «каменистой осыпи» представляет собой график зависимости собственных значений факторов от их номеров в порядке выделения. Для определения числа факторов используют форму графика. Обычно график имеет четкий разрыв между крутой частью кривой, где факто­рам свойственны большие собственные значения.

Определение на основе процента объясненной дисперсии. Вэтом методе число выделяемых факторов определяют так, чтобы кумулятивный процент дисперсии, выделяемой факторами, достиг удовлетворительного уровня.

Определение, основанное на оценке надежности, выполняемой расщеплением. Вэтом методе выборку расщепляют напополам и факторный анализ выполняют для каждой половины. При этом оставляют только факторы с высокой степенью соответствия факторных нагрузок в двух подвыборках.

Определение, основанное на критериях значимости. Можно определить статистическую зна­чимость отдельных собственных значений и оставить только статистически значимые факто­ры. Недостаток этого метода в том, что при больших размерах выборок факторы, вероятно, статистически значимые, хотя с практической точки зрения, многие из них объясняют небольшую долю полной дисперсии.

5. Вращение факторов.

Важный результат факторного анализа — матрица факторных нагрузок, также называемая матрицей факторного отображения. Она содержит коэффициенты, ис­пользуемые для выражения нормированных переменных через факторы. Эти коэффициенты, называемые факторными нагрузками, представляют корреляции между факторами и перемен­ными.

При вращении факторов желательно, чтобы каждый фактор имел ненулевые или значи­мые нагрузки (коэффициенты) только для небольшого числа переменных. Аналогично, же­лательно, чтобы каждая переменная имела ненулевые или значимые нагрузки с небольшим числом факторов.

При осуществлении факторного анализа могут использоваться как ортогональные, так и неортогональные варианты вращения.

Ортогональное вращение – это вращение факторов, при котором со­храняется прямоугольная система координат. В результате ортогонального вращения получают некоррелированные факторы.

Метод варимакс (или вращение, максимизирующее дисперсию) –это ортогональный метод вращения факторов, который минимизирует число переменных с вы­сокими значениями нагрузок, усиливая тем самым интерпретируемость факторов.

Неортогональное (косо­угольное) вращение – это вращение факторов, при котором не сохраняется прямоугольная система координат и в результате вращения получают коррелированные факторы.

6. Интерпретация факторов.

Обычная процедура содержательной интерпретации матрицы факторных нагрузок заключается в следующем. Нагрузки, относящиеся к одному фактору, располагаются в порядке убывания абсолютных значений. Рассматриваются признаки, имеющие максимальные абсолютные значения факторных нагрузок. Далее анализируется семантика этой группы признаков, их «экономический смысл». Выявляется общее содержание этой группы признаков, то общее свойство, которое, по мнению исследователя, объединяет признаки в одну группу. Это свойство (группа свойств) затем получает название и фигурирует в качестве фактора.

Для достижения этой цели придерживаются следующей процедуры.

А) Начинают с первой переменной и первого фактора в подвергнутой вращению матрице факторных нагрузок и двигаются в горизонтальном направлении слева направо в поисках наибольшего коэффициента корреляции. Обводят этот коэффициент. По очереди повторяют эту процедуру для каждой из остальных переменных.

Б) Исследуют каждый из обведенных коэффициентов и оцените его значимость. Значимость коэффициента нагрузки может проверяться с помощью либо статистического, либо практического критерия. Смысл соответствия статистическому критерию состо­ит в том, что коэффициент нагрузки должен обладать статистической значимостью при заданном значении альфа, обычно равном 0,05. Другими словами, для выборок, состоящих менее чем из 100 элементов, коэффициент нагрузки должен быть более 0,30, для того чтобы считаться статистически значимым.

В) Находят другие значимые коэффициенты нагрузки, используя критерий, выбранный на предыдущем этапе.

Г) Исследуют матрицу нагрузок и идентифицируют все те переменные, которые не имеют значимых нагрузок ни для одного из факторов.

Д) Концентрируют внимание на значимых коэффициентах нагрузки и пытаются назвать факторы на той общей основе, которую имеют переменные, обеспечивающие значимые нагрузки.

7. Определение степени соответствия модели.

Основное допущение, лежа­щее в основе факторного анализа, состоит в том, что наблюдаемая корреляция между перемен­ными может быть свойственна общим факторам. Следовательно, корреляции между перемен­ными можно вывести или воспроизвести из определенных корреляций между переменными и факторами. Изучив разности между наблюдаемыми корреляциями (данными в исходной кор­реляционной матрице) и вычисленными корреляциями (определенными из матрицы фактор­ных нагрузок), можно определить соответствие модели исходным данным. Эти разности назы­вают остатками. Если много остатков с большими значениями, то факторная модель не обеспечивает хорошее соответствие данным и требует пересмотра.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...