4.2. Другие меры связей между переменными, измеренными на номинальной шкале.
Построение теоретико-информационных мер может осуществляться не только на основе энтропии. Примером может служить коэффициент Валлиса. Коэффициент Валлиса интересен тем, что он прямо отвечает принципу построения мер связи как характеристик относительного уменьшения вероятности ошибки предсказания переменной Y, зная переменную X, в сравнении с вероятностью ошибки предсказания Y, не зная X. Этот показатель вычисляется по формуле:
где Свойства коэффициента Валлиса подобны свойствам 1) 2) 3) 4) Коэффициент Валлиса показывает пропорциональную редукцию ошибок предсказания. Другими словами, если, например, Рассмотрим семейства мер связи l-Гутмана и t-Гудмена и Краскала. Это меры связи, включающие асимметричные меры и симметричную меру связи: lb, la, l и tb, t, a t. Теоретико-вероятностную интерпретацию имеют коэффициенты Гутмана. Эти показатели основаны на том, что если рассматриваемые переменные зависимы, то информация о том, какое значение принял первый из них, должна улучшать точность предсказания значения второго признака.
Коэффициент Где
Коэффициент В первом случае для того, чтобы максимизировать вероятность угадать категорию признака Y, мы должны выбрать градацию с максимальной маргинальной частотой n*j, т. е. выбрать maxj n*j. Если известна категория признака X, то необходимо выбирать максимальное число в этой строке. Очевидно, что если признаки взаимосвязаны, то знание категории X позволяет достигать лучшего предсказания. Коэффициент Коэффициент
Где Коэффициент Если при анализе таблиц сопряженности не имеет значения последовательность расположения классов по признакам, т. е. неважно, зависит X от Y или наоборот, то используется коэффициент
где Коэффициент
min ( При построении коэффициентов Гутмана возникают трудности, связанные с неравномерным расположением условных сумм (обращение коэффициентов Этот недостаток устраняется в Коэффициент При прогнозировании категорий признака X в зависимости от Y, то есть строк таблицы сопряженности в зависимости от столбцов, применяется коэффициент Данная мера, умноженная на 100%, показывает, на сколько процентов уменьшится неправильный прогноз категории признака X для случайно взятого объекта при условном пропорциональном прогнозировании по сравнению с безусловным пропорциональным прогнозом. Для получения симметричной меры
Коэффициенты Меры связи t ближе по своей конструкции к статистике χ 2 и являются более надежными мерами, нежели l. Пример 4. 2. В результате проведенного опроса выпускников вузов относительно их планов о дальнейшем продолжении обучения в вузе и фактической их реализации получена следующая комбинационная таблица: Таблица 4. 2. Таблица сопряженности между переменными « планы выпускников вузов о дальнейшем образовании» и «фактическая реализация планов»
Решение: Рассчитаем точечные оценки коэффициентов
Аналогично находим коэффициент Для расчетов точечных оценок мер Таблица 4. 3. Вспомогательная таблица для расчета показателей
В последнем столбце содержатся максимальные элементы по каждой строке комбинационной таблицы, в последней строке – максимальные элементы по каждому из столбцов. Определим значения
Вывод: Зафиксировав планы выпускников вузов о продолжении образования, возможно на 22% точнее предсказать форму их послевузовского образования. Отклонение реализации планов составляет 35%, а симметричная мера связи составила 29%, т. е. знание обеих переменных на 29% повышает вероятность предсказания принадлежности респондентов к той или иной категории.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||