Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Кривая нормального распределения




 

Большинство процедур статистического анализа, часто используемых в исследованиях, основаны на предположении о том, что наблюдаемые переменные распределяются среди всей популяции по нормальному закону. Если переменная имеет нормальное распределение, то при графическом представлении данных большого числа измерений этой переменной получится кривая характерной колоколообразной формы, которая называется кривой нормального распределения (ее часто называют просто нормальной кривой). Если, например, измерить рост (переменная) большого числа мужчин и женщин, случайно выбранных однажды утром из толпы прохожих на углу живленной улицы, то в этой выборке окажется относительно небольшая процентная доля очень высоких и очень низкорослых людей. Большинство людей из выборки будут иметь средний рост. В графической форме эту серию наблюдений можно представить в виде кривой нормального распределения, изображенной на рис. 2.2.

 

 

Рис. 2.2. Кривая нормального распределения

 

Естественно происходящие события, такие как забастовки, дают индустриально-организационным психологам возможность проведения полезных полевых и обсервационных исследований.

Любую нормальную кривую можно описать с помощью двух чисел. Одно из них — это усредненное по всем измерениям значение переменной, выраженное в единицах используемой шкалы, то есть среднее значение (m) распределения. Как показано на рис. 2.2, точка с абсциссой m лежит на оси симметрии кривой. Второе число, описывающее нормальную кривую, характеризует вариабельность, или разброс точек кривой относительно среднего значения. С помощью математических преобразований вариабельность всех кривых такого вида можно выразить через стандартную единицу, которая называется стандартным отклонением (s).

Если известны среднее значение и стандартное отклонение нормальной кривой, то любой человек может точно воспроизвести эту кривую, поскольку при нормальном распределении переменной в каждый интервал длиной в одно стандартное отклонение влево или вправо от среднего значения попадает строго определенная процентная доля всех наблюдавшихся значений переменной. Эти процентные доли указаны на рис. 2.2: например, 68,26 % всех значений переменной отличаются от среднего значения не более чем на одно стандартное отклонение (по 34,13 % в меньшую и в большую стороны).

Кривая нормального распределения не только служит основой формального статистического анализа, но и используется в некоторых других целях. Одна из наиболее важных целей — объяснить людям, что означают баллы, полученные ими при прохождении тестов. Если среднее значение результатов стандартизованного теста математических способностей равно 50 баллам, а стандартное отклонение — 10, то человек, получивший, например, 70 баллов, справился с тестом лучше, чем примерно 95 % людей, которые проходили этот тест. Результат 70 баллов на два стандартных отклонения превышает средний (50 + 10 + 10 = 70).

Большинство статистических процедур основаны на предположении о нормальности кривой распределения, но некоторые важные для исследования переменные не подчиняются нормальному закону распределения. Такая переменная, как пол, имеет бимодальное распределение, то есть при измерении она может принимать только два значения — мужской и женский. Другие переменные имеют так называемое асимметричное распределение, когда большинство значений переменной группируется вокруг точки измерительной шкалы, которая не является средним значением. Асимметричное распределение имеет вес тела американцев; для людей любого роста и пола (то есть при условии контроля над ростом и полом) доля людей с весом выше среднего больше, чем доля людей с весом ниже среднего.

Для анализа переменных, имеющих бимодальное, асимметричное и другие отличные от нормального распределения, необходимы специальные статистические процедуры, но за немногими исключениями (например, пол) эти переменные редко встречается в индустриально-организационной психологии. Однако распределение данных наблюдений для конкретной выборки может отличаться от не нормального из-за особенностей плана эксперимента или ошибок при формировании выборки.

Корреляция и корреляты

 

Корреляцией называется такая связь между переменными, когда по изменениям одной из этих переменных можно предсказывать изменения другой. В литературе по индустриально-организационной психологии распространенным примером такой связи является соотношение между возрастом и выраженной удовлетворенностью работой. За годы исследований во многих работах была обнаружена тенденция к положительной корреляции между этими переменными; это означает, что возрастание одной из них происходит вместе с возрастанием другой. С увеличением возраста в целом увеличивается и выраженная удовлетворенность работой. С другой стороны, между удовлетворенностью работой и отсутствием на работе часто обнаруживают отрицательную корреляцию; это значит, что с возрастанием одной из этих переменных другая убывает. С увеличением выраженной удовлетворенности работой уровень отсутствия на работе обычно падает.

Разработаны различные процедуры, с помощью которых можно определить, существует ли между двумя переменными, такими как возраст и удовлетворенность работой, корреляционная связь, а если существует, то положительная или отрицательная. Все эти процедуры основаны на одной и той же методике. Производится измерение обеих переменных у каждого испытуемого, и результаты измерений обрабатываются: помощью определенной вычислительной процедуры. Эта процедура позволяет получить коэффициент корреляции r, который уже упоминался выше.

В некоторых исследованиях одно из двух измерений, которые при корреляционном анализе проводят у каждого испытуемого, фактически является группой измерений. Индустриально-организационного психолога может, например, заинтересовать связь между результатами пяти отборочных тестов при приеме на работу и показателями учебы по программе профессиональной подготовки. Для исследования этой связи он может использовать процедуру множественной корреляции. Первое измерение — это измерение показателей подготовки каждого испытуемого. Второе измерение — это комбинированный результат тестирования (одно число), который математически выводится из результатов пяти различных отборочных тестов. Когда коэффициент корреляции для этих двух переменных рассчитан, результат обозначают через R (читается как «множественный R»), чтобы было ясно, что речь идет о большем числе переменных, чем обычные две.

Все коэффициенты корреляции, независимо от метода их расчета, лежат в диапазоне от -1,00 до +1,00. (В дальнейшем мы будем опускать знак «плюс» для положительных коэффициентов корреляции.) Значение коэффициента корреляции указывает на силу связи между переменными; чем оно ближе к 1,00 со знаком «плюс» или «минус», тем сильнее эта связь.

Коэффициент корреляции рассчитывается математически, но часто его представляют графически, в виде так называемого точечного графика. Вводится система координат с двумя осями, вдоль каждой из которых откладываются значения одной из переменных, и строятся точки, соответствующие результатам каждого испытуемого. На рис. 2.3 показан точечный график, отражающий относительные позиции 18 испытуемых по результатам грамматического теста и словарного теста. Один испытуемый (Испытуемый 5) получил по 60 баллов за оба теста. Большинство остальных испытуемых получили разные результаты за разные тесты, но явно существует сильная тенденция к тому, чтобы при высоком результате одного теста результат второго теста тоже был высоким.

 

 

Рисунок 2.3. Точечный график, показывающий результаты (в баллах) грамматического теста и словарного теста

 

Рассчитанный по данным рис. 2.3 коэффициент корреляции r = 0,94. Из паттерна расположения точек, которые поднимаются из нижнего левого угла графика в верхний правый угол, видно, что это положительная корреляция. Если бы корреляция была отрицательной, то точки опускались бы из верхнего левого угла в нижний правый.

Корреляционные связи

 

Связь между переменными на рис. 2.3 является линейной; это значит, что точки лучше всего ложатся на прямую линию. Однако не все корреляционные связи являются линейными. Некоторые исследователи, например, предполагают, что связь между окончательным уровнем образования и удовлетворенностью работой, по сообщениям испытуемых, является нелинейной связью. Это означает, что более высокая удовлетворенность работой связана как с высокими, так и с низкими уровнями образования. Более низкая удовлетворенность работой связана со средними уровнями образования. Этот паттерн представлен графически на рис. 2.4.

 

 

Рис. 2.4. Графическое изображение нелинейной корреляционной связи

 

Если исследователь использует стандартные процедуры для расчета коэффициента корреляции между переменными, которые на самом деле связаны нелинейной 1ависимостью, то у него вполне может получиться, что между этими переменными вообще не существует связи. В таком случае он сделает неправильный вывод, что связь между удовлетворенностью работой и уровнем образования отсутствует. Чтобы включить такую возможность, исследователи перед тем, как сделать вывод об отсутствии связи между переменными, проводят стандартную процедуру тестирования на наличие нелинейной связи.

Возможность существования нелинейной связи между переменными не является единственным фактором, затрудняющим выявление истинного характера корреляционной зависимости. Присутствие сильной опосредующей переменной также может вешать обнаружению связи между двумя переменными и приводить к неправильным выводам, если оно останется незамеченным. Опосредующая переменная — это переменная, оказывающая предсказуемое влияние на характер связи между двумя другими переменными. Например, Хэкман и Олдхэм (Hackman & Oldham, 1976) выдвинули гипотезу о том, что характер связи между: а) обогащением содержания работы и 5) улучшением выполнения работы и/или удовлетворенностью работой зависит от в) индивидуальных потребностей в личном росте и достижениях. При низком уровне этих потребностей между переменными а и б нет связи или есть очень слабая связь; при высоком уровне потребностей между а и б может существовать сильная положительная корреляция.

В ситуациях, где действуют значимые опосредующие переменные, сила связи между независимой и зависимой переменными определяется уровнем опосредующей переменной. Если гипотеза Хэкмана и Олдхэма верна, то исследователь, который не учел различия в уровнях индивидуальных потребностей в личном росте, вероятнее всего, не обнаружит корреляции между своими измерениями показателей обогащения содержания работы и выполнения работы/удовлетворенности. Учет нелинейной связи и опосредующих переменных является шагом вперед по сравнению с рассмотрением простых корреляционных зависимостей и позволяет изучать более сложные формы человеческого поведения.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...