Статистический анализ нечисловой информации
Стр 1 из 9Следующая ⇒ Министерство образования и науки Российской федерации
ГОУ ВПО
«Ростовский государственный экономический университет (РИНХ)»
СТАТИСТИЧЕСКИЙ АНАЛИЗ НЕЧИСЛОВОЙ ИНФОРМАЦИИ методические рекомендации по изучению курса Ростов - на - Дону Печатается по решению кафедры математической статистики, эконометрики и актуарных расчетов РГЭУ «РИНХ» (протокол № 9 от 31. 05. 2010 г. )
Автор-составитель: доц., к. э. н. Герасимова И. А. Рецензенты: проф., д. э. н. Ниворожкина Л. И. проф., д. э. н. Маслова Н. П. Методические рекомендации по изучению дисциплины «Статистический анализ нечисловой информации» разработаны в соответствии с требованиями Государственного образовательного стандарта высшего образования по специальности 08060165 «Статистика». Пособие содержит как основные теоретические положения дисциплины, так и практические примеры, что способствует закреплению теоретического материала и приобретению практических навыков в решении задач. Контрольные вопросы к каждой теме и обширный список рекомендуемой литературы предполагают активную самостоятельную работу студентов. Методические рекомендации ориентированы на студентов дневной и заочной форм обучения, а также могут быть полезны аспирантам и преподавателям. Ростовский государственный экономический университет « Ринх», 2010 ОГЛАВЛЕНИЕ ТЕМА 1. «Предмет, объект и задачи статистического анализа нечисловой информации»……………………………………………………………………….. 4
1. 1. Статистика объектов нечисловой природы как часть прикладной статистики……………………………………………………………………………4 1. 2. Объекты нечисловой природы как результат статистической обработки данных………………………………………………………………………………5 ТЕМА 2. « Основы теории измерений»…………………………………………7 2. 1. Понятие измерения и измерительной шкалы………………………………7 2. 2. Номинальная шкала………………………………………………………….. 7 2. 3. Порядковая шкала…………………………………………………………… 8 2. 4. Интервальная шкала………………………………………………………….. 9 2. 5. Шкала отношений……………………………………………………………. 9 ТЕМА 3. «Измерение связи между переменными, измеренными на различных шкалах»……………………………………………………………………………10 3. 1. Номинальная шкала. Измерение связи между дихотомическими переменными (таблица сопряженности 2x2)………………………………….. 10 3. 2. Измерение связи между политомичными переменными (таблица сопряженности m x p )……………………………………………………………12 3. 3. Измерение тесноты связи между дихотомическими переменными и переменными, измеренными на интервальной шкале…………………………15 3. 4. Порядковая шкала. Измерение связи между порядковыми переменными………………………………………………………………………17 ТЕМА 4. « Теоретико-информационный подход к построению мер связи для номинального уровня измерения»…………………………………………. 23 4. 1. Меры связи, основанные на величине количества информации…………23 4. 2. Другие меры связей между переменными, измеренными на номинальной шкале……………………………………………………………27 Библиографический список………………………………………………………32 Приложение………………………………………………………………………. 34
ТЕМА 1. «Предмет, объект и задачи статистического анализа нечисловой информации»
1. 1. Статистика объектов нечисловой природы как часть прикладной статистики. С начала 70-х годов XX века под влиянием прикладных исследований в технических, медицинских и социальных науках в России активно развивается статистика объектов нечисловой природы, которая называется статистикой нечисловых данных или нечисловой статистикой. В создании нечисловой статистики приоритет принадлежит российским ученым. Согласно классификации существующих методов прикладная статистика делится на 4 области: статистика случайных величин (числовых величин); многомерный статистический анализ; статистика временных рядов и случайных процессов; статистика объектов нечисловой природы. Первые три являются классическими, а четвертая является достаточно новой областью прикладной статистики. Статистика нечисловых данных – это раздел прикладной статистики, в котором в качестве исходных статистических данных (результатов наблюдений ) рассматриваются объекты нечисловой природы. Объекты нечисловой природы - это объекты, которые нецелесообразно описывать числами. Известно, что исходным объектом математической статистики является выборка. В классической математической статистике элементы выборки – это числа. В многомерном статистическом анализе – это вектора. В нечисловой статистике элементы выборки - это объекты нечисловой природы, которые нельзя складывать и умножать на числа. Примерами объектов нечисловой природы являются: 1. Значения качественных признаков, представляющие собой результаты кодировки объектов с помощью заданного перечня категорий (градаций); 2. Упорядочения (ранжировки). Например, эксперты могут ранжировать предприятия с точки зрения их инвестиционной привлекательности, образцы продукции при оценке ее конкурентноспособности или могут ранжироваться заявки на проведение научных работ при проведении конкурсов на выделение грантов; 3. Классификации, т. е. разбиения объектов на группы, сходных между собой (кластеры). 4. Толерантности, т. е. бинарные отношения, описывающие сходство объектов между собой. Например, сходство тематики научных работ, оцениваемое экспертами с целью формирования экспертных советов внутри определенной области науки.
5. Результаты парных сравнений. Например, при контроле качества продукции по альтернативному признаку (годная или бракованная продукция). 6. Множества (четкие и нечеткие). 7. Cлова, предложения, тексты. 8. Векторы, координаты которых - это совокупность значений разнотипных признаков. Например, компьютеризированная история болезни, где часть признаков носит качественный характер, а часть – количественный. 9. Ответы на вопросы анкет (экспертных, маркетинговых, социальных), часть из которых носит количественный характер, часть сводится к выбору одного из нескольких ответов, а часть представляет собой тексты. В процессе развития нечисловой статистики появилась необходимость использования новых видов объектов нечисловой природы. Например, в связи с развитием статистических методов обработки текстовой информации, стал рассматриваться еще один вид объектов нечисловой природы - это объекты произвольной природы. Таким образом, цель статистики объектов нечисловой природы состоит в том, чтобы применять методы статистической обработки данных как произвольной природы, так и данных, представляющих собой конкретные виды объектов нечисловой природы, т. е. методы описания данных, методы оценивания, методы проверки статистических гипотез. Итак, в рамках нечисловой статистики решаются классические задачи описания данных, задачи оценивания, проверки гипотез. Однако эти задачи решаются для неклассических данных, и поэтому неклассическими методами. Принципиальная новизна нечисловой статистики состоит в том, что методы обработки нечисловых данных основаны на математическом аппарате, использующем различные расстояния в пространствах объектов нечисловой природы. Так, для анализа нечисловых данных очень важны различные методы классификации (например, методы дискриминационного и кластерного анализа). В целом, статистические методы анализа нечисловых данных особенно хорошо приспособлены для применения в экономике, социологии и экспертных оценках т. к. в этих областях от 50% до 90% данных являются нечисловыми.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|