Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Многомерные методы и их применение в психологических исследованиях.




Многомерные статистические методы анализа данных занимают в психолого-педагогичеких исследованиях особое положение, определяемое их назначением и воз-можностями. В прикладной статистике разработано множество многомерных методов анализа данных. У Наследова А.Д. предлагается следующая классификация методов.

Классификация методов по назначению:

1. методы предсказания: множественный регрессионный анализ и дискриминантный анализ;

2. методы классификации: варианты кластерного анализа и дискриминантный анализ;

3. структурные методы: факторный анализ и многомерное шкалирование.

Классификация методов по исходным предположениям о структуре данных:

1. методы, исходящие из предположения о согласованной изменчивости признаков, измеренных у множества объектов: факторный анализ, множественный регрессионный анализ, отчасти – дискриминантный анализ;

2. методы, исходящие из предположения о том, что различия между объектами можно описать как расстояние между ними: кластерный анализ, многомерное шкалирование и частично - дискриминантный анализ.

Классификация методов по виду исходных данных:

1. методы, использующие в качестве исходных данных только признаки, измеренные у группы объектов: множественный регрессионный анализ, дискриминантный анализ и факторный анализ;

2. методы, исходными данными для которых могут быть попарные сходства (различия) между объектами: кластерный анализ и многомерное шкалирование.

Представленные классификации свидетельствуют о необходимости знаний многомерных методов, их возможностей и ограничений не только в процессе обработки эмпирического материала, но уже и на стадии общего замысла исследования.

Множественный регрессионный анализ – это метод установления зависимости одной переменной от двух или более независимых переменных. В то время как зависимая переменная (та переменная, которую Вы хотите предсказать) должна быть непрерывной (за исключением логистической регрессии), независимые переменные могут быть как прерывными, так и категориальными, такими как «пол» или «тип применяемого препарата». В случае категориальных независимых переменных необходимо будет создавать переменные «пустышки», а не использовать соответствующие значения (подробнее это будет обсуждено позднее). Если все независимые переменные являются категориальными (или большинство из них являются категориальными), то в этом случае лучше использовать дисперсионный анализ.

Имеются две причины для использования множественной регрессии:

Первая – это использование множественной регрессии в тех исследованиях, когда значения независимых переменных находились под экспериментальным контролем (например, когда изменялось количество применяемого препарата, или количество дней между приемами препарата). Обычно подобный подход называется «запланированная регрессия».

Второй вариант включают ситуации, когда анализируется группа пациентов, у которых измерили некоторые количество естественно возникающих переменных (возраст, доход, уровень тревоги и т.д.), и эти переменные связываются с некой переменной, которая нас интересует. Обычно подобный подход называется «не экспериментальная регрессия».

Пример множественного регрессионного анализа: Представьте себе исследователя, который заинтересован в оценке эффекта постоянных физических нагрузок при использовании стимулянтов, на потерю веса. Исследователь проводит эксперимент, привлекая 24 студента университета, и при этом этот эксперимент имеет 4 уровня стимулянтов и 3 уровня физических нагрузок. Имеется 24 человека, вошедших в этот эксперимент, и каждый случайным образом относится к определенному сочетанию уровней физической нагрузки и дозы стимулянта таким образом, что на каждую возможную комбинацию нагрузок и стимулянтов приходится по два студента, 12(3х4).

Факторный анализ — В современной статистике под факторным анализом понимают совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволяют выявлять латентные обобщающие характеристики организационной структуры и механизма развития изучаемых явлений и процессов.
Понятие латентности в определении ключевое. Оно означает неявность характеристик, раскрываемых при помощи методов факторного анализа. Вначале мы имеем дело с набором элементарных признаков Xj, их взаимодействие предполагает наличие определенных причин, особенных условий, т.е. существование некоторых скрытых факторов. Последние устанавливаются в результате обобщения элементарных признаков и выступают как интегрированные характеристики, или признаки, но более высокого уровня. Естественно, что коррелировать могут не только тривиальные признаки Xj, но и сами наблюдаемые объекты Ni поэтому поиск латентных факторов теоретически возможен как по признаковым, так и по объектным данным. Факторный анализ в его классическом варианте разработан для данных, полученных при измерениях по интервальным шкалам.

Созданный в начале века для нужд психологии (предпринимались попытки выделить основной фактор, определяющий интеллект, Ч. Спирмен), факторный анализ впоследствии получил большое распространение в экономике, медицине, социологии и других науках, располагающих огромным количеством переменных, из которых обычно необходимо выделить ведущие. С помощью факторного анализа не просто устанавливается связь изменения одной переменной с изменением другой переменной, а определяется мера этой связи и обнаруживаются основные факторы, лежащие в основе указанных изменений. Факторный анализ особенно продуктивен на начальных этапах научных исследований, когда необходимо выделить какие-либо предварительные закономерности в исследуемой области. Это позволяет последующий эксперимент сделать более совершенным по сравнению с экспериментом на переменных, выбранных произвольно или случайно. Как метод факторный анализ имеет определенные слабые стороны, в частности отсутствует однозначное математическое решение проблемы факторных нагрузок, то есть влияния отдельных факторов на изменения различных переменных.

ФАКТОРЫ – это причины, формирующие результаты того или иного поведения или деятельности.

Фактор - Скрытая переменная, получаемая при обработке данных при помощи факторного анализа.

Фактор (Г.Оллпорт) – переменная, достаточно полно характеризующая всю совокупность данных.

Дискриминантный анализ — раздел вычислительной математики, представляющий основное средство решения задач Распознавания образов, инструмент статистики, который используется для принятия решения о том, какие переменные разделяют (т.е. «дискриминируют») возникающие наборы данных (так называемые «группы»). Является основным алгоритмом решения задач построения Искусственного интеллекта. Нейронные сети являются частным случаем дискриминантного анализа (в среде специалистов нейронные сети часто шутливо называют "распознаванием для ленивых").

Если критериальный показатель z измерен в номинальной шкале или связь этого показателя с исходными признаками является нелинейной и носит неизвестный характер, для определения параметров диагностической модели используются методы дискриминантного анализа

Примеры

Например, некий исследователь в области образования может захотеть исследовать, какие переменные относят выпускника средней школы к одной из трех категорий: поступающий в колледж, поступающий в профессиональную школу, отказывающийся от дальнейшего образования.

Медик может регистрировать различные переменные, относящиеся к состоянию больного, чтобы выяснить, какие переменные лучше показывают, что пациент, вероятно, выздоровел полностью, частично или совсем не выздоровел.

Кластерный анализ (англ. Data clustering) — задача разбиения заданной выборки объектов (ситуаций) на непересекающиеся подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.

В результате кластерного анализа при помощи предварительно заданных переменных формируются группы наблюдений. Под наблюдениями здесь понимаются отдельные личности (респонденты) или любые другие объекты. Члены одной группы (одного кластера) должны обладать схожими проявлениями переменных, а члены разных групп различными.

Кластерный анализ — математическая процедура, позволяющая на основе схожести количественных значений нескольких признаков, свойственных каждому объекту (например, испытуемому) какого–либо множества, сгруппировать эти объекты в определенные классы, или кластеры.

ДЕНДРОГРАММА - графическое изображение в двухмерной проекции степени подобия объектов.

Дендрограмма показывает степень близости отдельных объектов и кластеров, а также наглядно представляет в графическом виде последовательность их объединения или разделения. Количество уровней дендрограммы соответствует числу шагов слияния или разделения кластеров. В нижней части рисунка расположена шкала на которой откладывается расстояние между объектами в пространстве признаков.

В дендрограмме, представленной на рисунке, на первом шаге, группируются объекты x2 и x3, образуя кластер (x2, x3) с минимальным расстоянием (например, Евклидовым) между объектами, примерно равным 1. Затем, объекты x4 и x5 и группируются в другой кластер (x4, x4) с расстоянием между объектами, равным 1,5. Расстояние между кластерами (x2, x3) и (x1) также оказывается равным 1,5, что позволяет сгруппировать эти кластеры на том же уровне, что и (x4, x4). И, наконец, два кластера (x1, x2, x3) и (x4, x4) группируются на самом высоком уровне иерархии кластеров с расстоянием 2.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...