Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Выявление различий в распределении признака




 

Распределения могут различаться по средним, дисперсиям, асим­метрии, эксцессу и по сочетаниям этих параметров. Рассмотрим не­сколько примеров.

На Рис. 4.1 представлены два распределения признака. Распреде­ление 1 характеризуется меньшим диапазоном вариативности и меньшей дисперсией, чем распределение 2. В распределении 1 чаще встречаются значения признака, близкие к средней, а в распределении 2 чаще встре­чаются более высокие и более низкие, чем средняя, значения признака.

Рис. 4.1. Кривые распределения признака с меньшим диапазоном вариативности при­знака (1) и большим диапазоном распределения признака (2); х - значения признака;

f - относительная частота их встречаемости

Именно такое соотношение может наблюдаться в распределении фенотипических признаков у мужчин (кривая 2) и женщин (кривая 1). Фенотипическая дисперсия мужского пола должна быть больше, чем женского (Геодакян В.А., 1974; 1993). Мужчины - это авангардная часть популяции, ответственная за поиск новых форм приспособления, поэтому у них чаще встречаются редкие крайние значения различных фенотипических признаков. Эти отклонения, по мнению В.А. Геодакяна, носят "футуристический" характер, это "пробы", включающие как будущие возможные пути эволюции, так и ошибки (Геодакян В.А., 1974, с. 381). В то же время женская часть популяции ответственна за сохранение уже накопленных изменений, поэтому у них чаще встреча­ются средние значения фенотипических признаков.

Анализ реально получаемых в исследованиях распределений мо­жет позволить нам подтвердить или опровергнуть данные теоретические предположения.

На Рис. 4.2 представлены два распределения, различающиеся по знаку асимметрии: распределение 1 характеризуется положительной асимметрией (левосторонней), а распределение 2 — отрицательной (правосторонней).

Рис. 4.2. Кривые распределения признака с положительной (левосторонней) асимметри­ей (1) и отрицательной (правосторонней) асимметрией (2); х - значения признака; (-относительная частота их встречаемости

Данные кривые могут отражать распределение времени решения простой задачи (кривая 1) и трудной задачи (кривая 2). Простую за­дачу большинство испытуемых решают быстро, поэтому большая часть значений группируется слева. В то же время сама простота задачи мо­жет привести к тому, что некоторые испытуемые будут думать над нею очень, очень долго, дольше даже, чем над сложной. Трудную задачу большинство испытуемых решают в тенденции дольше, чем простую, но в то же время почти всегда находятся люди, которые решают ее мгно­венно.

Если мы докажем, что распределения статистически достоверно различаются, это может стать основой для построения классификаций задач и типологий испытуемых. Например, мы можем выявлять испы­туемых со стандартным соотношением признаков: простую задачу они решают быстро, а трудную - медленно, — и испытуемых с нестандарт­ным соотношением: простую задачу решают медленно, а трудную - быстро и т.п. Далее мы можем сравнить выявленные группы испытуемых по показателям мотивации достижения, так как известно, что лица с преобладанием стремления к успеху предпочитают задачи средней труд­ности, где вероятность успеха примерно 0.5, а лица с преобладанием стремления избегать неудачи предпочитают либо очень легкие, либо, наоборот, очень трудные задачи (МсСlelland D.С, Winter D.G., 1969). Таким образом, и здесь сопоставление форм распределения мо­жет дать начало научному поиску.

Часто нам бывает полезно также сопоставить полученное эмпи­рическое распределение с теоретическим распределением. Например, для того, чтобы доказать, что оно подчиняется или, наоборот, не под­чиняется нормальному закону распределения. Это лучше делать с по­мощью машинных программ обработки данных, особенно при больших объемах выборок. Подробные программы машинной обработки можно найти, например, в руководстве Э.В. Ивантер и А.В. Коросова (1992).

В практических целях эмпирические распределения должны про­веряться на "нормальность" в тех случаях, когда мы намерены исполь­зовать параметрические методы и критерии. В данном руководстве это относится лишь к методам дисперсионного анализа, поэтому способы проверки совпадения эмпирического распределения с нормальным опи­саны в Главе 7, посвященной однофакторному дисперсионному анализу.

Традиционные для отечественной математической статистики кри­терии определения расхождения или согласия распределений - это метод χ2К. Пирсона и критерий X Колмогорова-Смирнова.

Оба эти метода требуют тщательной группировки данных и до­вольно сложных вычислений. Кроме того, возможности этих критериев в полной мере проявляются на больших выборках (n > 30). Тем не ме­нее они могут оказаться столь незаменимыми, что исследователю при­дется пренебречь экономией времени и усилий. Например, они незаме­нимы в следующих двух случаях:

в задачах, требующих доказательства неслучайности предпочтений в выборе из нескольких альтернатив;

в задачах, требующих обнаружения точки максимального расхожде­ния между двумя распределениями, которая затем используется для перегруппировки данных с целью применения критерия φ* (углового преобразования Фишера).

Рассмотрим вначале традиционные методы определения расхож­дения распределений, а затем возможности использования критерия φ* Фишера.

 

Критерии согласия - это критерии проверки гипотез о соответствии эмпирического распределения теоретическому распределению вероятностей. Такие критерии подразделяются на два класса:

  1. Общие критерии согласия применимы к самой общей формулировке гипотезы, а именно к гипотезе о согласии наблюдаемых результатов с любым априорно предполагаемым распределением вероятностей.
  2. Специальные критерии согласия предполагают специальные нулевые гипотезы, формулирующие согласие с определенной формой распределения вероятностей.

Общие критерии согласия

Нулевая гипотеза , где - эмпирическая функция распределения вероятностей; - гипотетическая функция распределения вероятностей.

Группы общих критериев согласия:

  • критерии, основанные на изучении разницы между теоретической плотностью распределения и эмпирической гистограммой;
  • критерии, основанные на расстоянии между теоретической и эмпирической функциями распределения вероятностей;

Критерии, основанные на сравнении теоретической плотности распределения и эмпирической гистограммы

  • Критерий согласия хи-квадрат [1]
  • Критерий числа пустых интервалов [1]
  • Квартильный критерий Барнетта-Эйсена [1]

Критерии, основанные на сравнении теоретической и эмпирической функций распределения вероятностей

Расстояние между эмпирической и теоретической функциями распределения вероятностей является весьма эффективной статистикой для проверки гипотез о виде закона распределения вероятностей случайной величины.

Критерии согласия, использующие различные варианты анализа расстояния между теоретической и эмпирической функциями распределения:

  • Критерий Джини
  • Критерий Крамера-фон Мизеса-Смирнова
  • Критерий Колмогорова-Смирнова [1] [1]
  • Критерий Реньи (R-критерий) [1]
  • Критерий Смирнова-Крамера-фон Мизеса (Критерий омега-квадрат) [1] [1]
  • Критерий Андерсона-Дарлинга [1]
  • Критерий Купера [1]
  • Критерий Ватсона [1]
  • Критерии Жанга [1]
  • Критерий Фроцини [1]

Другие критерии:

  • Критерии согласия Дарбина [1] [1]

Специальные критерии согласия

Нормальное распределение

Нормальный закон распределения вероятностей получил наибольшее распространение в практических задачах обработки экспериментальных данных. Большинство прикладных методов математической статистики исходит из предположения нормальности распределения вероятностей изучаемых случайных величин. Широкое распространения этого распределения вызвало необходимость разработки специальных критериев согласия эмпирических распределений с нормальным. Существуют как модификации общих критериев согласия, так и критерии, созданные специально для проверки нормальности.

 

 

  1. 14.Критерий Пирсона и особенности его использования при сравнении теоретического и эмпирического распределение и 2 эмпирических.

χ2 критерий Пирсона

Назначения критерия

Критерий χ2 применяется в двух целях;

1) для сопоставления эмпирического распределения признака с теоре­тическим - равномерным, нормальным или каким-то иным;

2) для сопоставления двух, трех или более эмпирических распределе­ний одного и того же признака[4].

Описание критерия

Критерий χ2отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях.

Преимущество метода состоит в том, что он позволяет сопостав­лять распределения признаков, представленных в любой шкале, начиная от шкалы наименований (см. п. 1.2). В самом простом случае альтерна­тивного распределения "да - нет", "допустил брак - не допустил бра­ка", "решил задачу - не решил задачу" и т. п. мы уже можем приме­нить критерий χ2.

Допустим, некий наблюдатель фиксирует количество пешеходов, выбравших правую или левую из двух симметричных дорожек на пути из точки А в точку Б (см. Рис. 4.3).

Допустим, в результате 70 наблюдений установлено, что Э\ чело­век выбрали правую дорожку, и лишь 19 - левую. С помощью критерия χ2мы можем определить, отличается ли данное распределение выборов от равномерного распределения, при котором обе дорожки выбирались бы с одинаковой частотой. Это вариант сопоставления полученного эм­пирического распределения с теоретическим. Такая задача может сто­ять, например, в прикладных психологических исследованиях, связанных с проектированием в архитектуре, системах сообщения и др.

Но представим себе, что наблюдатель решает совершенно другую задачу: он занят проблемами билатерального регулирования. Совпадение полученного распределения с равномерным его интересует гораздо в меньшей степени, чем совпадение или несовпадение его данных с дан­ными других исследователей. Ему известно, что люди с преобладанием правой ноги склонны делать круг против часовой стрелки, а люди с преобладанием левой ноги - круг по ходу часовой стрелки, и что в ис­следовании коллег[5] преобладание левой ноги было обнаружено у 26 человек из 100 обследованных.

С помощью метода χ2 он может сопоставить два эмпирических распределения: соотношение 51:19 в собственной выборке и соотноше­ние 74:26 в выборке других исследователей.

Это вариант сопоставления двух эмпирических распределений по простейшему альтернативному признаку (конечно, простейшему с математической точки зрения, а отнюдь не психологической).

Аналогичным образом мы можем сопоставлять распределения выборов из трех и более альтернатив. Например, если в выборке из 50 человек 30 выбрали ответ (а), 15 человек - ответ (б) и 5 человек -ответ (в), то мы можем с помощью метода χ2 проверить, отличается ли это распределение от равномерного распределения или от распределения ответов в другой выборке, где ответ (а) выбрали 10 человек, ответ (б) -25 человек, ответ (в) - 15 человек.

В тех случаях, если признак измеряется количественно, скажем, в баллах, секундах или миллиметрах, нам, быть может, придется объединить все обилие значений признака в несколько разрядов. Например, если время решения задачи варьирует от 10 до 300 секунд, то мы можем ввести 10 или 5 разрядов, в зависимости от объема выборки. На­пример, это будут разряды: 0-50 секунд; 51-100 секунд; 101-150 секунд, и т. д. Затем мы с помощью метода χ2будет сопоставлять частоты встречаемости разных разрядов признака, но в остальном принципиаль­ная схема не меняется.

При сопоставлении эмпирического распределения с теоретическим мы определяем степень расхождения между эмпирическими и теорети­ческими частотами.

При сопоставлении двух эмпирических распределений мы опреде­ляем степень расхождения между эмпирическими частотами и теорети­ческими частотами, которые наблюдались бы в случае совпадения двух этих эмпирических распределений. Формулы расчета теоретических час­тот будут специально даны для каждого варианта сопоставлений.

Чем больше расхождение между двумя сопоставляемыми распре­делениями, тем больше эмпирическое значение у}.

Гипотезы

Возможны несколько вариантов гипотез, в зависимости от задач,

которые мы перед собой ставим.

Первый вариант:

Н0: Полученное эмпирическое распределение признака не отличается от теоретического (например, равномерного) распределения.

Н1: Полученное эмпирическое распределение признака отличается от теоретического распределения.

Второй вариант:

Н0: Эмпирическое распределение 1 не отличается от эмпирического распределения 2.

Н1: Эмпирическое распределение 1 отличается от эмпирического рас­пределения 2.

Третий вариант:

Н0: Эмпирические распределения 1, 2, 3,... не различаются между собой.

Н1: Эмпирические распределения 1, 2, 3,... различаются между собой.

Критерий χ2 позволяет проверить все три варианта гипотез.

Ограничения критерия

1.Объем выборки должен быть достаточно большим: п 30. При п <30 критерий χ2 дает весьма приближенные значения. Точность крите­рия повышается при больших п.

2. Теоретическая частота для каждой ячейки таблицы не должна быть меньше 5: f > 5. Это означает, что если число разрядов задано зара­нее и не может быть изменено, то мы не можем применять метод χ2, не накопив определенного минимального числа наблюдений. Ес­ли, например, мы хотим проверить наши предположения о том, что частота обращений в телефонную службу Доверия неравномерно распределяются по 7 дням недели, то нам потребуется 5*7=35 обращений. Таким образом, если количество разрядов (k) задано заранее, как в данном случае, минимальное число наблюдений (nmin) определяется по формуле: nmin= k *5.

3. Выбранные разряды должны "вычерпывать" все распределение, то есть охватывать весь диапазон вариативности признаков. При этом группировка на разряды должна быть одинаковой во всех сопостав­ляемых распределениях.

4. Необходимо вносить "поправку на непрерывность" при сопоставле­нии распределений признаков, которые принимают всего 2 значения. При внесении поправки значение χ2 уменьшается (см. Пример с по­ правкой на непрерывность).

5. Разряды должны быть неперекрещивающимися: если наблюдение отнесено к одному разряду, то оно уже не может быть отнесено ни к какому другому разряду.

Сумма наблюдений по разрядам всегда должна быть равна общему количеству наблюдений.

Правомерен вопрос о том, что считать числом наблюдений - количество выбо­ров, реакций, действий или количество испытуемых, которые совершают выбор, проявляют реакции или производят действия. Если испытуемый проявляет не­сколько реакций, и все они регистрируются, то количество испытуемых не будет совпадать с количеством реакций. Мы можем просуммировать реакции каждого испытуемого, как, например, это делается в методике Хекхаузена для исследования мотивации достижения или в Тесте фрустрационной толерантности С. Розенцвейга, и сравнивать распределения индивидуальных сумм реакций в нескольких выборках.

В этом случае числом наблюдений будет количество испытуемых. Если же мы подсчитываем частоту реакций определенного типа в целом по выборке, то получа­ем распределение реакций разного типа, и в этом случае количеством наблюдений будет общее количество зарегистрированных реакций, а не количество испытуемых.

С математической точки зрения правило независимости разрядов соблюдается в обоих случаях: одно наблюдение относится к одному и только одному разряду распределения.

- Можно представить себе и такой вариант исследования, где мы изучаем рас­пределение выборов одного испытуемого. В когнитивно-бихевиоральной терапии, например, клиенту предлагается всякий раз фиксировать точной время появления нежелательной реакции, например, приступов страха, депрессии, вспышек гнева, самоуничижающих мыслей и т. п. В дальнейшем психотерапевт анализирует полу­ченные данные, выявляя часы, в которые неблагоприятные симптомы проявляются чаще, и помогает клиенту строить индивидуальную программу предупреждения неблагоприятных реакций.

Можно ли с помощью критерия χ2доказать, что некоторые часы являются в этом индивидуальном распределении более часто встречающимися, а другие - ме­нее часто встречающимися? Все наблюдения - зависимы, так как они относятся к одному и тому же испытуемому; в то же время все разряды - неперекрещивающиеся, так как один и тот же приступ относится к одному и только одному разря­ду (в данном случае - часу дня). По-видимому, применение метода χ2 будет в данном случае некоторым упрощением. Приступы страха, гнева или депрессии могут наступать неоднократно в течение дня, и может оказаться так, что, скажем, ранний утренний, 6-часовой, и поздний вечерний, 12-часовой, приступы обычно появляются вместе, в один и тот же день: в то же время дневной 3-часовой при­ступ появляется не ранее как через сутки после предыдущего приступа и не менее чем за двое суток до следующего и т. п. По-видимому, речь здесь может идти о сложной математической модели или вообще о чем-то таком, чего нельзя "поверить алгеброй". И тем не менее в практических целях может оказаться полезным ис­пользовать критерий для того, чтобы выявить систематическую неравномерность наступления каких-либо значимых событий, выбора, предпочтений и т. п. у одного и того же человека.

Итак, одно и то же наблюдение должно относиться только к одному разряду. Но считать ли наблюдением каждого испытуемого или каждую исследуемую реак­цию испытуемого - вопрос, решение которого зависит от целей исследования (см.. напр., Ганзен В.А., Балин В.Д., 1991, с.10).

Главное же "ограничение" критерия χ2 - то, что он кажется большинству исследователей пугающе сложным.

Попытаемся преодолеть миф о непостижимой трудности критерия χ2. Чтобы оживить изложение, рассмотрим шутливый литературный пример.

 

Шутливый пример

В гениальной комедии Н. В. Гоголя "Женитьба" у купеческой дочери Агафьи Тихоновны было пятеро женихов. Одного она сразу исключила из рассмотрения, потому что он был купеческого звания, как и она сама. А из остальных она не знала, кого выбрать: "Уж как труд­но решиться, так просто рассказать нельзя, как трудно. Если бы губы Никанора Ивановича да приставить к носу Ивана Кузьмича, да взять сколько-нибудь развязности, какая у Балтазара Балтазарыча, да, пожа­луй, прибавить к этому еще дородности Ивана Павловича, я бы тогда тотчас решилась. А теперь поди подумай! просто голова даже стала болеть. Я думаю, лучше всего кинуть жребий" (Гоголь Н.В., 1959, с. 487). И вот Агафья Тихоновна положила бумажки с четырьмя имена­ми в ридикюль, пошарила рукою в ридикюле и вынула вместо одного — всех!

Ей хотелось, чтобы жених совмещал в себе достоинства всех чет­верых, и, вынимая все бумажки вместо одной, она бессознательно со­вершала процедуру выведения средней величины. Но вывести среднюю величину из четверых людей невозможно, и Агафья Тихоновна в смя­тении. Она влюблена, но не знает, в кого. "Такое несчастное положе­ние девицы, особливо еще влюбленной" (там же, с. 487).

Вся беда в том, что ни Агафья Тихоновна, ни ее тетушка, ни сваха Фекла Ивановна не были знакомы с критерием χ2! Именно он мог бы им помочь в решении их проблемы. С его помощью можно бы­ло бы попробовать установить, в кого больше влюблена Агафья Тихо­новна. Но для этого нам не нужно измерять губы Никанора Ивановича или нос Ивана Кузьмича, или объем талии дородного экзекутора Ива­на Павловича; не нужно нам и пускаться на какие-нибудь опасные экс­перименты, чтобы определить, насколько далеко простирается развяз­ность Балтазара Балтазарыча. Мы эти их достоинства принимаем как данность потому лишь, что они нравятся Агафье Тихоновне. Мы при­нимаем их за разряды одного и того же признака, например, направ­ленности взгляда Агафьи Тихоновны: сколько раз она взглянула на губы Никанора Ивановича? На нос Ивана Кузьмича? Благосклонно взирала на дородного Ивана Павловича или развязного Балтазара Бал-тазаровича? Внимательная сваха или тетушка вполне могла бы этот признак наблюдать. Допустим, за полчаса смотрин ею зафиксированы следующие наблюдения.

Агафья Тихоновна:

сидела с опущенными глазами 25 минут;

благосклонно смотрела на Никанора Ивановича 14 раз;

благосклонно смотрела на Ивана Кузьмича 5 раз;

благосклонно смотрела на Ивана Павловича 8 раз;

благосклонно смотрела на Балтазара Балтазарыча 5 раз.[6]

Представим это в виде таблицы.

Таблица 4.1

Распределение взгляда Агафьи Тихоновны между 4 женихами

женихи Никанор Иванович Иван Кузьмич Иван Павлович Балтазар Балтазарыч Всего взглядов
Количество взглядов          

 

Теперь нам нужно сопоставить полученные эмпирические частоты с теоретическими. Если Агафья Тихоновна никому не отдает предпоч­тения, то данное распределение показателя направленности ее взгляда не будет отличаться от равномерного распределения: она на всех смот­рит примерно с одинаковой частотой. Но если достоинства одного из женихов чаще притягивают ее взор, то это может быть основанием для матримониального решения.

Гипотезы

Н0: Распределение взглядов Агафьи Тихоновны между женихами не отличается от равномерного распределения.

Н1: Распределение взглядов Агафьи Тихоновны между женихами отли­чается от равномерного распределения.

Теперь нам нужно определить теоретическую частоту взгляда при равномерном распределении. Если бы все взгляды невесты распределя­лась равномерно между 4-мя женихами, то, по-видимому, каждый из них получил бы по 1/4 всех ее взглядов.

Переведем эти рассуждения на более формализованный язык. Теоретическая частота при сопоставлении эмпирического распределения с равномерным определяется по формуле:

где п - количество наблюдений;

к - количество разрядов признака.

В нашем случае признак - взгляд невесты, направленный на ко­го-либо из женихов; количество разрядов признака - 4 направления взгляда, по количеству женихов; количество наблюдений - 32.

 

Однако для того, чтобы доказать неравномерность полученного эмпирического распределения, нам необходимо произвести точные рас­четы. В методе χ2они производятся с точностью до сотых, а иногда и до тысячных долей единицы.

Расчеты будем производить в таблице по алгоритму.

АЛГОРИТМ 13

Расчет критерия χ2

Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).

Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец).

Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать их в третий столбец.

4. Определить число степеней свободы по формуле:

ν=κ-1

где κ - количество разрядов признака.

Если ν = 1, внести поправку на "непрерывность".

5. Возвести в квадрат полученные разности и занести их в четвертый столбец.

6. Разделить полученные квадраты разностей на теоретическую частоту и записать результаты в пятый столбец.

7. Просуммировать значения пятого столбца. Полученную сумму обозначить как χ2ЭМП.

8. Определить по Табл. IX Приложения 1 критические значения для данного числа степеней свободы V.

Если χ2эмп меньше критического значения, расхождения между распределениями статистически недостоверны.

Если χ2эмп равно критическому значению или превышает его, расхождения между распределениями статистически достоверны.

Все вычисления для данного случая отражены в Табл. 4.2.

Таблица 4.2

Расчет критерия χ2 при сопоставлении эмпирического распределения взгляда Агафьи Тихоновны между женихами с равномерным распределением

Разряды - женихи Эмпирическая частота взгляда (fэj) Теоретическая частота (fт) (fэj-fт) (fэj-fт)2 (fэj-fт)2/ fт
      Никанор Иванович Иван Кузьмич Иван Павлович Балтазар Балтазарыч             +6   -3     -3       4.500   1.125     1.125
Суммы         6.750
             

Может показаться, что удобнее суммировать все возведенные в квадрат разности между эмпирическими и теоретическими частотами, а затем уже эту сумму разделить на f т. В данном случае это возможно, так как f т для всех разрядов одинакова. Однако позже мы увидим, что так бывает далеко не всегда. Нужно быть внимательными или, экономя свое внимание, просто взять за правило всякий раз вычислять (f э if т)2/ f т до суммирования.

Необходимо также всякий раз убеждаться в том, что сумма раз­ностей между эмпирическими и теоретической частотами (сумма по третьему столбцу) равна 0. Если это равенство не соблюдается, это означает, что в подсчете частот или разностей допущена ошибка. Необ­ходимо найти и устранить ее прежде чем переходить к дальнейшим расчетам.

Алгоритм вычислений, таким образом, выражается формулой:

где fэj - эмпирическая частота по j-тому разряду признака; f т - теоретическая частота; j - порядковый номер разряда; k - количество разрядов признака. В данном случае:

Для того, чтобы установить критические значения %, нам нужно определить число степеней свободы V по формуле: ν= k -l

где k - количество разрядов. В нашем случае ν=4—1=3. По Табл. IX Приложения 1 определяем:

Построим "ось значимости". Ясно, что чем больше отклонения эмпирических частот от теоретической, тем больше будет величина χ2. Поэтому зона значимости располагается справа, а зона незначимости -слева.

К сожалению, на основании этих данных тетушка не сможет дать Агафье Тихоновне обоснованного ответа:

χ2 эмп2 кр.

Ответ: Н0 принимается. Распределение взгляда Агафьи Тихо­новны между женихами не отличается от равномерного распределения.

Но, допустим, тетушка на этом не успокоилась. Она стала вни­мательно следить за тем, сколько раз племянница упомянет в разговоре каждого из женихов. Допустим, ею получено следующее распределение упоминаний Агафьей Тихоновной женихов и их достоинств:

Никанор Иванович - 15 раз,

Иван Кузьмич - 6 раз,

Иван Павлович - 9 раз,

Балтазар Балтазарыч - 6 раз.

Тетушка уже видит, что похоже, Никанор Иванович ("уж такой великатный, а губы, мать моя, - малина, совсем малина") пользуется большей благосклонностью Агафьи Тихоновны, чем все остальные же­нихи. У нее есть два пути, чтобы это доказать статистически.

1) Суммировать все проявления благосклонности со стороны невесты: взгляды + упоминания в разговоре, - и сопоставить полученное рас­пределение с равномерным. Поскольку количество наблюдений воз­росло, есть шанс, что различия окажутся достоверными.

2) Сопоставить два эмпирических распределения - взгляда и упомина­ний в разговоре, - с тем, чтобы показать, что они совпадают между собой, то есть и во взглядах, и в словах Агафья Тихоновна придер­живается одинаковой системы предпочтений. Проанализируем оба варианта сопоставлений. В первом случае мы будем решать уже известную нам задачу со­поставления эмпирического распределения с теоретическим. Во втором случае мы будем сопоставлять два эмпирических распределения. Первый вариант развития шутливого примера: увеличение количества наблюдений

Вначале создадим таблицу эмпирических частот, в которой будут суммированы все замеченные проявления благосклонности невесты.

Таблица 4.3

Распределение проявлений благосклонности невесты между женихами

Женихи Никанор Иванович Иван Кузьмич Иван Павлович Балтазар Балтазарыч Всего
Количество проявлений          

Теперь сформулируем гипотезы.

Н0: Распределение проявлений благосклонности невесты (взгляды и упо­минания в разговоре) не отличается от равномерного распределения. H1: Распределение проявлений благосклонности невесты отличается от равномерного распределения.. Все расчеты произведем в таблице по алгоритму.

Таблица 4.4

Расчет критерия χ2 при сопоставлении проявлений благосклонности Агафьи Тихоновны с равномерным распределением

Разряды - женихи Эмпирические частоты Теоретическая частота суммарных проявлений (fэj-fт) (fэj-fт)2 (fэj-fт)2/ fт
  Ник. Ив. Ив. Куз. Ив. Пав. Бал. Бал.     -6 -6   8,47 2,12 2,12
Суммы         12,71
             

χ2эмп=12,71

χ2эмп> χ2кр.

Ответ: H0 отклоняется, принимается Н1. Распределение прояв­лений благосклонности невесты между женихами отличается от равно­мерного распределения (р<0,01).

На этом примере мы убедились, что увеличение числа наблюде­ний повышает достоверность результата, если, конечно, в новых наблю­дениях воспроизводится прежняя тенденция различий.

Второй вариант развития шутливого примера: сопоставление двух эмпирических распределений

Теперь мы должны ответить на вопрос, одинаковая ли система предпочтений проявляется во взгляде Агафьи Тихоновны и ее словах?

Сформулируем гипотезы. Н0: Распределения невербально и вербально выражаемых предпочтений не различаются между собой.

H1: Распределения невербально и вербально выражаемых предпочтений различаются между собой.

Для подсчета теоретических частот нам теперь придется соста­вить специальную таблицу (Табл. 4.5). Ячейки в двух столбцах слева обозначим буквами. Для каждой из них теперь будет подсчитана особая, только к данной ячейке относящаяся, теоретическая частота. Это обу­словлено тем, что количества взглядов и словесных отзывов невесты о женихах неравны; взглядов 32, а словесных отзывов - 36. Мы должны всякий раз учитывать эту пропорцию.

Таблица 4.5

Эмпирические и теоретические частоты взглядов и упоминаний о жениха

Разряды - женихи Эмпирические частоты Суммы Теоретические частоты
взгляда Упоминаний в разговоре взгляда Упоминаний в разговоре
  Ник. Ив. Ив. Куз. Ив. Пав. Бал. Бал. 14 А 5 В 8 Д 5 Ж 15 Б 6 Г 9 Е 6 З   13,63 А 5,17 В 7,99 Д 5,17 Ж 15,37 Б 5,83 Г 9,01 Е 5,83 З
Суммы          
             

Рассчитаем эту пропорцию. Всего проявлений благосклонности отмечено 68, из них 32 - взгляды и 36 - словесные высказывания. До­ля взглядов составит 32/68=0,47; доля упоминаний - 36/68=0,53.

Итак, во всех строках взгляды должны были бы составлять 0,47 всех проявлений по данной строке, а упоминания в разговоре - 0,53 всех проявлений. Теперь, зная суммы проявлений по каждой строке, мы можем рассчитать теоретические частоты для каждой ячейки Табл. 4.5.

f Атеор=29*0,47=13,63

f Бтеор=29*0,53=15,37

f Втеор=11*0,47=5,17

f Гтеор=11*0,53=5,83

f дтеор=17*0,47=7,99

f Eтеор=17*0,53=9,01

f Жтеор=110,47=5,17

f Зтеор=11*0,53=5,83

Ясно, что сумма теоретических частот по строкам будет равнять­ся сумме всех проявлений по данной строке. Например,

f Атеор+ f Бтеор=13.63+15,37=29

f Втеор+ f Гтеор=5,17+5,83=11

f Дтеор+ f Етеор=7,99+9,01=17 и т.д.

При такого рода подсчетах лучше всякий раз себя проверить. Теперь мы можем вывести общую формулу подсчета f теордля сопостав­ления двух или более эмпирических распределений:

Соответствующими строкой и столбцом будут та строка и тот столбец, на пересечении которых находится данная ячейка таблицы. Теперь нам лучше всего сделать развертку Табл. 4.5, представив все ячейки от А до Ж в виде первого столбца - это будет столбец эмпири­ческих частот. Вторым столбцом будут записаны теоретические часто­ты. Далее будем действовать по уже известному алгоритму. В третьем столбце будет представлены разности эмпирических и теоретических частот, в четвертом - квадраты этих разностей, а в пятом - результаты деления этих квадратов разностей на соответствующие каждой строке теоретические частоты. Сумма в нижнем правом углу таблицы и будет представлять собой эмпирическую величину % (Табл. 4.6).

Таблица 4.6

Расчет критерия χ2 при сопоставлении распределений невербальных и вербальных признаков благосклонности невесты

Ячейки таблицы частот Эмпирическая частота взгляда (fэj) Теоретическая частота (fт) (fэj-fт) (fэj-fт)2 (fэj-fт)2/ fт
  А Б В Г Д Е Ж З   13,63 15,37 5,17 5,83 7,99 9,01 5,17 5,83 +0,37 -0,37 -0,17 +0,17 +0,01 -0,01 -0,17 +0,17 0,14 0,14 0,03 0,02 0,00 0,00 0,03 0,02 0,01 0,01 0,01 0,00 0,00 0,00 0,01 0,00
Суммы         0,04
             

 

Число степеней свободы при сопоставлении двух эмпирических распределений определяется по формуле:

v =(k -1)·(c -1)

где k - количество разрядов признака (строк в таблице эмпири­ческих частот);

с - количество сравниваемых распределений (столбцов в таб­лице эмпирических частот).

В данном случае таблицей эмпирических частот является левая, эмпирическая часть таблицы 4.5, а не на ее развертка (Табл. 4.6). Количество разрядов - это количество женихов, поэтому k=4. Количество сопоставляемых распределений с=2. Итак, для данного случая,

v=(4-l)(2-t)=3

Определяем по Табл. IX Приложения 1 критические значения для ν=З:

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...