Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Статистика в пространствах общей природы




 

        Пусть  -элементы пространства , не являющегося линейным. Как определить среднее значение для ? Поскольку нельзя складывать элементы , сравнивать их по величине, то необходимы подходы, принципиально новые по сравнению с классическими. В работе [37] предложено использовать показатель различия  (содержательный смысл: чем больше , тем больше различаются  и ) и определять среднее как решение экстремальной задачи

.  (1)

Таким образом - это совокупность всех тех , для которых функция

достигает минимума на .

       Для классического случая  при  имеем: , а при  среднее  совпадает с выборочной медианой (при нечетном объеме выборки; а при четном -  является отрезком с концами в двух средних элементах вариационного ряда).

       Для ряда конкретных объектов среднее как решение экстремальной задачи вводилось рядом авторов. В 1929 г. Джини и Гальвани [38] применили такой подход для усреднения точек на плоскости и в пространстве (см. также [39]). Кемени [40-42] решение задачи (1) называл медианой или средним для выборки, состоящей из ранжировок. При моделировании лесных пожаров, согласно выражению (1), было введено "среднеуклоняемое множество" [43]. Общее определение среднего (1) рассмотрено нами в работах [2, 37].

       Основной результат, связанный со средними (1) - аналог закона больших чисел. Пусть.  - независимые одинаково распределенные случайные элементы со значениями в пространстве общей природы  (определения здесь и далее - согласно Математической Энциклопедии [44]). Теоретическим средним, или математическим ожиданием, назовем [37]

.             (3)

Закон больших чисел состоит в сходимости.  к . при . Поскольку и эмпирическое, и теоретическое средние - множества, то понятие сходимости требует уточнения.

       Одно из возможных уточнений таково [46]: для функции

               (4)

введем понятие " -пятки" ( >0)

. (5)

Очевидно, -пятка  - это окрестность  (если он достигается), заданная в терминах минимизируемой функции. Тем самым снимается вопрос о выборе метрики в пространстве  (позже подобная идея была использована в работе [45]). Тогда при некоторых условиях регулярности для любого >0 вероятность события

                        (6)

стремится к 1 при. , т. е. справедлив закон больших чисел [46].

       Естественное обобщение рассматриваемой задачи позволяет построить общую теорию оптимизационного подхода в статистике. Как известно [47], большинство задач прикладной статистики может быть представлено в качестве оптимизационных. Как себя ведут решения экстремальных задач? Частные случаи этой постановки: как ведут себя при росте объема выборки оценки максимального правдоподобия, минимального контраста (в том числе робастные в смысле Тьюки-Хьюбера [1, 48-50]), оценки нагрузок в факторном анализе и методе главных компонент при отсутствии нормальности, оценки метода наименьших модулей в регрессии [51] и т. д.

       Обычно легко устанавливается, что для некоторых пространств  и последовательности случайных функций. при.  найдется функция  такая, что

                  (7)

для любого  (сходимость по вероятности). Требуется вывести отсюда, что

,                 (8)

т. е. решения экстремальных задач также сходятся. Понятие сходимости в соотношении (8) уточняется с помощью -пяток, как это сделано выше для закона больших чисел. Условия регулярности, при которых справедливо предельное соотношение (8), приведены в исследовании [46]; применения, в частности, к методу главных компонент, рассмотрены в работе [4]. Отметим, что закон больших чисел позволил установить устойчивость медианы Кемени и изучить ее поведение при увеличении объема выборки [1]. Начиная с классической статьи Вальда [52], различные постановки, связанные с решениями экстремальных статистических задач, изучались многими авторами (см., например, [53-55]). Одна из наиболее общих постановок рассмотрена в работе [46]. Применения к теории классификации рассмотрел К. А. Пярна [119].

       Как оценить распределение случайного элемента в пространстве общей природы? Поскольку понятие функции распределения неприменимо, естественно использовать непараметрические оценки плотности, т. е. функции. . такой, что для любого измеримого множества

,             (9)

где. - некоторая мера в . Ряд непараметрических оценок плотности был предложен и изучен в работе [56]. Например, аналогом ядерных оценок Парзена-Розенблатта [57, 58] является оценка

,                (10)

где  - показатель различия;  - ядерная функция;  - последовательность положительных чисел;  - нормирующий множитель. Оказалось, что статистики типа (10) обладают такими же свойствами, по крайней мере при фиксированном , что и их классические аналоги при . Некоторые изменения необходимы при рассмотрении дискретных , каковыми являются многие пространства конкретных объектов нечисловой природы (см. об этом п. 2. 6).

       С помощью непараметрических оценок плотности можно развивать регрессионный анализ, дискриминантный анализ и другие направления в пространствах общей природы ([1-5], [59]).

       Для проверки гипотез согласия, однородности, независимости в пространствах общей природы могут быть использованы статистики интегрального типа

,             (11)

где -последовательность случайных функций на ;  - последовательность случайных распределений (или зарядов). Обычно  при  сходится по распределению к некоторой случайной функции , а  - к распределению . Тогда распределение статистики интегрального типа (11) сходится к распределению случайного элемента

.          (12)

       Условия, при которых это справедливо, даны в работе [60]. (Хотя они сформулированы для конечномерного случая, переход в пространства общей природы не представляет принципиальных трудностей.) Пример применения - вывод предельного распределения статистики типа омега-квадрат для проверки симметрии распределения [61] (см. также [1, гл. 2]).

       Перейдем к статистике конкретных видов объектов нечисловой природы.

 

Теория измерений

 

       Цель теории измерений - борьба с субъективизмом исследователя при приписывании численных значений реальным объектам. Так, расстояния можно измерять в метрах, микронах, милях, парсеках и других единицах измерения. Выбор единиц измерения зависит от исследователя, т. е. субъективен. Статистические выводы могут быть адекватны реальности только тогда, когда они не зависят от того, какую именно единицу измерения предпочтет исследователь, т. е. когда они инвариантны относительно допустимого преобразования шкалы.

       Теория измерений известна в СССР уже около 30 лет по переводам [62, 63]. С семидесятых годов активно работают отечественные исследователи (см. обзор в [1, гл. 3]). В настоящее время изложение основ теории измерений включают в справочные издания [47], помещают в научно-популярные журналы [64] и книги для детей [65]. Однако она еще не стала общеизвестной среди специалистов, в частности, среди метрологов. Поэтому опишем одну из задач теории измерений.

       Согласно [1, 62, 63], шкала задается группой допустимых преобразований (прямой в себя). Номинальная шкала (шкала наименований) задается группой всех взаимнооднозначных преобразований, шкала порядка - группой всех строго возрастающих преобразований. Это - шкалы качественных признаков [27]. Группа линейных возрастающих преобразований , задает шкалу интервалов. Группа , определяет шкалу отношений. Наконец, группа, состоящая из одного тождественного преобразования, описывает абсолютную шкалу. Это - шкалы количественных признаков. Используют и некоторые другие шкалы.

       Рассмотрим задачу сравнения средних значений для двух совокупностей одинакового объема  и . Пусть среднее вычисляется с помощью функции  Если

,                (13)

то необходимо, чтобы

для любого допустимого преобразования  из задающей шкалу группы Ф. (В противном случае результат сравнения будет зависеть от того, какое из эквивалентных представлений шкалы выбрал исследователь.)

       Требование равносильности (13) и (14) вместе с некоторыми условиями регулярности приводят к тому, что в порядковой шкале в качестве средних можно использовать только члены вариационного ряда, в частности, медиану, но нельзя использовать среднее геометрическое, среднее арифметическое, и т. д. [66]. В количественных шкалах это требование выделяет из всех обобщенных средних по А. Н. Колмогорову [67]:

       в шкале интервалов - только среднее арифметическое, в шкале отношений - степенные средние [68].

       Кроме средних, аналогичные задачи рассмотрены для расстояний [69, 70] и мер связи случайных признаков [71, 1].

       Приведенные результаты о средних величинах [1, 68] Я. Э. Камень применил в АСУ ТП доменных печей ]120]. Л. Д. Мешалкин выступил с критикой требования равносильности условий (13) и (14) и предложил собственную постановку [72].

       Велико прикладное значение теории измерений в задачах стандартизации и управления качеством [9], в частности, в квалиметрии [73]. Так, В. В. Подиновский показал, что любое изменение коэффициентов весомости единичных показателей качества продукции приводит к изменению упорядочения изделий по средневзвешенному показателю [74]. Н. В. Хованов развил одну из возможных теорий шкал измерения качества [75].

       Теория измерений полезна и в других прикладных областях [76, 77].

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...