Анализ сдвигов в значении признака.
При проведении исследования лонгитюдного характера или использовании формирующего эксперимента мы имеем дело с зависимыми выборками, т.е. объединёнными некоторой связью, общим свойством. Результаты одних и тех же испытуемых анализируются с использованием специальных статистических критериев. Критерий знаков очень прост в использовании: сопоставляемые ряды значений признака записываются один под другим (или один рядом с другим) и определяется знак разности (или отличия) между сопоставляемыми величинами («больше - меньше" для порядковых и интервальных шкал или «плюс – минус» для номинальных). Затем подсчитывается число тех знаков (однонаправленных эффектов), которые встречаются реже других и это число (z) сравнивается с табличным (Приложение 1, Таблица). Равные члены (нулевые разности) могут быть либо исключены из рассмотрения, либо отнесены к одному из направлений («плюс» или «минус») с помощью подбрасывания монеты. Парный критерий Вилкоксона (Т – критерий) для зависимых выборок направлен, как и предшествующий критерий знаков, на сравнение величин двух попарно сопряжённых совокупностей, но является критерием более мощным, поскольку учитывает не только направление (знак) разности между сравниваемыми рядами, но и абсолютную величину этих разностей Т (Таблица Приложения 1). Для расчёта Т всем разностям (независимо от знака) приписывается ранг в порядке возрастания абсолютной величины разности. Одинаковым разностям приписывается усреднённый ранг (принудительное ранжирование), поэтому число рангов соответствует числу сравниваемых пар (объёму выборки). Далее подсчитывается сумма рангов всех положительных и отрицательных разностей (отдельно). Наименьшая из сумм сравнивается с табличным значением. Нулевая гипотеза отвергается, если эмпирическое значение Т меньше критического для 5%-ного уровня значимости.
Критерий Стьюдента для оценки значимости отличий от нуля средней разности в парах применяется в случае нормального распределения значений признака, измеренного в интервальной шкале, и рассчитывается по формуле: где Δ – среднее арифметическое разностей; σΔ – их среднеквадратическое отклонение; n – объём выборки. Корреляционный анализ. Если признак измерен в шкале интервалов, вычисление коэффициентов корреляции целесообразно предварять регрессионным анализом, устанавливающим форму зависимости между случайной величиной Y и значениями переменной (или нескольких переменных) величины X. Здесь достаточно ограничиться наглядной формой регрессионной модели, представленной диаграммой рассеивания. Диаграмма рассеивания или корреляционное поле представляет собой совокупность точек на графике, где оси абсцисс и ординат представляют собой значения двух сопоставляемых статистических признаков. Форма распределения точек на таком графике выступает наглядным показателем тесноты связи между двумя сопоставляемыми признаками. Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде. Прежде всего, надо выделить коэффициенты корреляции величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности 0,05 и 0,01. Критические значения коэффициентов линейной корреляции Пирсона и ранговой корреляции Спирмена приведены в Приложении 1 (Таблицы №__ и №__ соответственно). Целесообразно выделить среди прочих коэффициенты корреляции, превышающие эти уровни достоверности. Можно подчеркнуть коэффициенты с достоверностью 0,05 одной чертой или отметить одной звездочкой, а с достоверностью 0,01 – двумя. Удобно использовать и цветное кодирование.
Если после этого выделения обнаружилось, что значимых коэффициентов корреляции, (превышающих уровень 0,05 или 0,01) довольно много, то для дальнейшего анализа более удобна полная матрица интеркорреляций. Поэтому, если в принтерной распечатке содержится только половина матрицы, отделенная от другой половины главной диагональю, то её надо восстановить до полного вида. Матрица интеркорреляций – это матрица типа «признак х признак», поэтому она оцифрована только номерами признаков и содержит коэффициенты корреляции каждого признака с каждым. Испытуемые и их порядковые номера в таблице исходных данных в ней не представлены. Поскольку матрица интеркорреляций симметрична относительно своей главной диагонали (проходящей из левого верхнего угла в правый нижний), то ее при восстановлении надо «опрокинуть», повернуть относительно этой оси симметрии. Обычно в распечатке каждая строчка начинается с номера признака, затем написана 1.0 – это коэффициент корреляции данного признака с самим собой. Затем напечатан коэффициент корреляции данного признака со следующим по порядковому номеру и далее коэффициенты корреляции с остальными признаками. Если матрица большая, то даже выделение значимых коэффициентов не создаст достаточной наглядности. Тогда к нижней части матрицы можно добавить еще несколько строк и записать в соответствующих клетках число значимых коэффициентов в данном столбце: значимых на уровне 0.05, значимых на уровне 0.01, суммарное число значимых коэффициентов. Это лучше позволит увидеть иерархию признаков по числу значимых корреляционных связей. Факторный анализ. Данные факторного анализа, как и корреляционного, помогают обнаружить взаимосвязи между переменными, но не могут дать достаточных оснований для выводов о причинно-следственных зависимостях, об иерархии причинных связей. Выделение факторов более высокого порядка и другие усложнения и модификации сути метода не меняют. Неслучайно в различных факторных структурах личностных свойств устойчиво присутствуют именно стержневые психические качества (тревожность, активность, нейротизм и т.д.)
В факторном анализе предполагается, что наблюдаемые переменные являются линейной комбинацией некоторых латентных (гипотетических или наблюдаемых) факторов. Факторная модель основывается на том, что все наблюдаемые переменные являются функциями скрытых факторов. Т.е. не предполагается включение в состав переменных таких, которые являются причинными для других. Но не обязательно, чтобы все переменные были на одном уровне причинности. При достаточном опыте и наличии дополнительной информации о структуре исследуемого явления результаты факторного анализа можно достаточно корректно интерпретировать. Факторный анализ является сложной процедурой. Как правило, хорошее факторное решение (достаточно простое и содержательно интерпретируемое) удаётся получить, по меньшей мере, после нескольких циклов её проведения – от отбора признаков до попытки интерпретации после вращения факторов. Для того, чтобы прийти к нему, надо соблюдать немало требований, назовём основные. 1). Переменные должны быть измерены, по крайней мере, на уровне шкалы интервалов (по классификации Стивенса). Многие переменные, такие, как меры отношений и мнений в социологии, различные переменные при обработке результатов тестирования, не имеют точно определённой метрической основы. Тем не менее, предполагается что порядковым переменным можно давать числовые значения, не нарушая их внутренних свойств. 2). Не следует включать дихотомические переменные. Но если цель исследования состоит в нахождении кластерной структуры, использование факторного анализа к данным, содержащим дихотомические переменные, оправданно. 3). Отбирая переменные для факторного анализа, следует учесть, что на один фактор должно приходиться по крайней мере три переменные. 4). Для обоснованного окончательного решения необходимо, чтобы число испытуемых было в три или более раз больше, чем число переменных, в пространстве которых определяется окончательное факторное решение. Поскольку количество испытуемых увеличить труднее по ходу обработки, значит следует отобрать столько переменных, чтобы их число не превышало одной трети от числа испытуемых. Для разведочного компонентного или факторного анализа это требование соблюдать не обязательно, но надо исходить из того, что чем сильнее оно нарушено, тем менее точны результаты.
5). Не имеет смысла включать в факторный анализ переменные, которые имеют очень слабые связи с остальными переменными. С большой вероятностью они будут иметь малую общность и не войдут ни в один фактор. Если перед вами не стоит задача сформировать шкалу вопросника на основе факторного анализа или какая-либо аналогичная, то не следует также включать все переменные, имеющие друг с другом очень тесные связи. Скорее всего, они образуют один фактор. Чем больше таких переменных вы включаете в факторный анализ, тем больше вероятность того, что они образуют первый фактор или один из первых. 6). Важнейшим моментом поиска хорошего факторного решения является определение числа факторов перед их вращением. В окончательном решении лучше всего основываться на содержательных предположениях о структуре изучаемого явления. На пути к нему можно использовать критерий Кеттела. Легче принять решение, если будет построен полигон, в котором отображены доли суммарной дисперсии факторов в порядке их убывания. Обычно на графическом изображении видно, что доля дисперсии у первых факторов при переходе от предыдущего к последующему быстро снижается, но затем линия имеет перелом и у остальных факторов доли суммарной дисперсии отличаются мало. Согласно данному критерию следует остановиться на том факторе, как на последнем, за которым линия становится более пологой. При отборе переменных и сокращении их количества для следующего цикла факторного анализа быстрее можно отобрать переменные, если селектировать их по факторным общностям, а не просматривая их нагрузки по всем факторам. При интерпретации факторов можно начать работу с того, что выделить наибольшие факторные нагрузки в данном факторе. Для выделения можно использовать приемы аналогичные выделению значимых коэффициентов корреляции. Если вы затрудняетесь подобрать название фактору – для этой процедуры нет формализованных приемов, то используйте, как предварительный вариант, имя переменной, которая вошла в фактор с наибольшей нагрузкой. Использование прикладных статистических программ. Использование статистических программ в компьютерной обработке на несколько порядков ускоряет обработку материала и представляет в распоряжение исследователя такие методы анализа, которые в ручной обработке не могут быть реализованы.
Существуют стандартные пакеты программ для математической обработки данных. Наиболее известные доступные: “Statistika”, “Stadia”, “Statgraphics”, “SyStat”, SPSS, SAS, BMDP. Все пакеты делятся на виды: 1) специализированные пакеты; 2) пакеты общего назначения; 3) неполные пакеты общего назначения. Для исследователей рекомендуются пакеты общего назначения. По мнению экспертов, наилучший вариант документации у пакета SPSS. Литература по математической статистике 1. Аскеров, П. Ф., Пахунова, Р. Н., Пахунов, А. В. Общая и прикладная статистика. Учебник. – М.: Инфра-М, 2014. – 272 с. 2. Афифи, А. статистический анализ. Подход с использование ЭВМ. – М.: Книга по требованию, 2012. – 488 с. 3. Брандт, З. Статистические методы анализа наблюдений. – М.: Книга по требованию, 2012. – 312 с. 4. Волкова, П. А., Шипунов, А. Б. Статистическая обработка данных в учебно-исследовательских работах. – М.: Форум, 2012. – 96 с. 5. Вуколов, Э. А. Основы статистического анализа. Практикум по статистическим методам и исследованию операций с использованием пакетов STATISTICA и EXCEL. – М.: Форум, 2010. – 464 с. 6. Горяинова, Е. Р., Панков, А. Р., Платонов, Е. Н. Прикладные методы анализа статистических данных. Учебное пособие. – М.: НИУ ВШЭ, 2012. – 312 с. 7. Ермолаев-Томин, О. Ю. Математические методы в психологии. Учебник. – 5-е изд. исправ. и доп. – М.: Юрайт, 2014. – 512 с. 8. Дюран, Б., Оделл, П., Демиденко, Е. З. Кластерный анализ. – М.: Книга по требованию, 2012. – 128 с. 9. Илышев, А. М., Шубат, О. М. Общая теория статистики. Учебное пособие. – М.: КноРус, 2013. – 432 с. 10. Карманов, Ф. И., Острейковский, В. А. Статистические методы обработки экспериментальных данных. Лабораторный практикум с использованием пакета MathCAD. – М.: Абрис, 2012. – 208 с. 11. Ким, Дж. О. Факторный, дискриминантный и кластерный анализ. – М.: Книга по требованию, 2012. – 216 с. 12. Кобздарь, А. И. Прикладная математика и статистика. – М.: ФИЗМАТЛИТ, 2012. – 816 с. 13. Кричевец, А. Н, Корнеев, А А., Рассказова, Е. И. Математическая статистика для психологов. Учебник. – М.: Academia, 2012. – 400 с. 14. Кричевец, А. Н., Шикин, Е. В., Дьячков, А. Г. Математика для психологов. Учебник. – М.: Флинта, 2015. – 376 с. 15. Лоули, Д., Максвелл, А. Факторный анализ как статистический метод.– М.: Книга по требованию, 2012. – 72 с. 16. Мхитарян, В. С., Агапова, Т. Н., Ильенкова, С. Д., Суринова, А. Е., Луппов, А. Б., Миронкина, Ю. Н. Статистика. Учебник для бакалавров. / под ред. В. С. Мхитаряна. – М.: Юрайт, 2013. – 592 с. 17. Наследов, А. SPSS 19. Профессиональный статистический анализ данных. – СПб.: Питер, 2011. – 400 с. 18. Овсянников, Г. Н. Факторный анализ в доступном изложении: изучение многопараметрических систем и процессов. – М.: Либрикон, 2013. – 176 с. 19. Сдвижков, О. А. Непараметрическая статистика в MS Excel и VBA. – М.: ДМК Пресс, 2014. – 172 с. 20. Сидняев, Н. И. Теория планирования эксперимента и анализ статистических данных. Учебное пособие. – 2-е изд. перераб. и доп. – М.: Юрайт, 2015. – 496 с. 21. Соболь, Б. В., Борисова, Л. В., Иваночкина, Т. А., Пешхоев, И. М. Практикум по статистике в Excel. – СПб.: Феникс, 2010. – 384 с. 22. Статистика. Практикум Учебное пособие. / под ред. И. И. Елисеевой. – М.: Юрайт, 2013. – 528 с. 23. Статистика. Прикладной курс. Учебник для бакалавров. – 2-е изд. перераб. и доп. / под ред. И. И. Елисеевой. – М.: Юрайт, 2014. – 446 с. 24. Сухорученков, Б. И. Анализ малой выборки. Прикладные статистические методы. – М.: Вузовская книга, 2010. – 384 с. 25. Филатов, Е. Методы детерминированного (функционального) факторного анализа. – М.: LAP Lambert Academic Publishing, 2012. – 112 с. 26. Шипилина, Л. А. Методология психолого-педагогических исследований. Учебное пособие. – М.: Флинта, 2011.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|