Пример выявления аномальных значений
Вначале найдем среднее и дисперсию из всех 26 значений: = 0,502; s2 = 0,06478; s = 0,2545. Далее вычислим среднее и дисперсию из 24 значений, исключив максимальные значения. Получим смещенные оценки = 0,451; = 0,03577; s = 0,1891. Вычислим нормированные значения исключенных значений: t 25 = (1,14 – 0,451)/0,1891 = 3,64; t 26 = (1,19 – 0,451)/0,1891 = 3,91. Поскольку нормированные значения t 25 > 3 и t 26 > 3, по правилу «трех сигм» оба исключенных значения являются аномальными. Однако полученный вывод является некорректным, так как он построен на смещенных оценках. Оценим размер смещения, обусловленный исключением двух максимальных значений. Имеем p = 1 – n / N = 0,923. Вероятности p соответствует квантиль t = F –1(p) = 1,426. По формуле (2.25) найдем f (t) = 0,1443, по формуле (2.51) определим нормированное смещение у = 26/24×0,1443 = 0,1563. Из формулы (2.50) следует (1 – ty – t 2) = 0,03577/(1 – 1,426×0,1563 – 0,15632) = = 0,04752; s = 0,218. Из формулы (2.49) получаем = х смещ + + s у = 0,451 + 0,218×0,1563 = 0,485. Полученные оценки приведены в табл.2.16.
Таблица 2.16 Результат вычисления истинных характеристик
По формуле (2.52) найдем смещенный критерий: t смещ = (3 + 0,1563)/ . Отсюда следует, что, вместо t = 3 для проверки аномальности значений нужно пользоваться t смещ = 3,638, что довольно существенно. Но и с учетом смещенного критерия исключенные значения являются аномальными.7
Поскольку смещение критерия t смещ зависит только от отношения n / N, на основе формул (2.51) и (2.52) могут быть составлены таблицы t смещ для различных значений t. Для примера приведена табл.2.17, соответствующая t = 3, т.е. правилу «трех сигм». Аномальные значения можно выявить и на графике пробит-функции (рис.2.15), построенном по данным табл.2.15 по методике, описанной в подразделе 2.3.2. Большинство точек укладывается в одну линию, но две точки заметно отклоняются от нее, что свидетельствует об аномальности соответствующих им значений.
Таблица 2.17 Значения смещенного критерия tс мещ при заданном t = 3
Еще один способ выявления аномальных значений основан на применении критерия Титьена – Мура [14]. Если из нормально распределенной совокупности, содержащей N значений, исключить n максимальных или минимальных значений, то дисперсия уменьшится, и по степени ее уменьшения можно судить об аномальности исключенных значений. Вначале вычисляется величина (2.53) где – дисперсия исходной совокупности; – дисперсия после исключения n предполагаемых аномальных значений. Если значение L окажется меньше критерия L доп при заданной вероятности a, то исключенные значения являются аномальными. Для примера приведена табл.2.18 с вероятностью a = 0,05 [14].
Таблица 2.18 Критерий Титьена – Мура при a = 0,05
Примерим критерий Титьена – Мура к данным табл.2.15. Дисперсия исходной совокупности = 0,06478; дисперсия после исключения двух значений = 0,03577. Следовательно,
Из табл.2.18 интерполяцией находим критерий L доп = 0,560. Так как L < L доп, то исключенные значения являются аномальными. На графике пробит-функции при большом количестве данных можно выявить и другие особенности поведения случайной величины. На рис.2.16 показаны фактические данные по содержанию меди на колчеданном месторождении. Стрелками выделены две точки – нижняя и верхняя. В верхней точке проходит граница аномальных проб (более 16 %), в нижней точке – естественная природная граница кондиционных руд (около 0,5 %). Средняя часть графика близка к прямой линии, что соответствует нормальному закону распределения. 2.3.4. Выделение однородных совокупностей
Одна из сложных проблем при обработке статистических данных – это разделение неоднородной совокупности на однородные. Заключение о неоднородности совокупности лучше всего делать по гистограмме частот. Например, на рис.2.17 явно выделяются два максимума частот, соответствующие двум однородным совокупностям. Одна совокупность имеет моду при 27 % содержания железа, другая – при 55 %. Геологическая причина появления двух совокупностей заключается в том, что бедные руды возникли путем замещения алюмосиликатных пород, а богатые – карбонатных пород. Для статистического исследования рекомендуется разделить данные опробования на две однородные совокупности. Это можно сделать двумя способами: 1) раздельным изучением руд, образованных по алюмосиликатным и карбонатным породам (геологический способ изучения); 2) аналитическим способом, что требует применения сложных расчетов при условии, что задан или известен закон распределения каждой совокупности Возможна и обратная ситуация: наличие неоднородной совокупности на гистограмме позволяет сделать определенные геологические выводы. Так, на рис.2.18 показано распределение стронция в апатите в логарифмическом масштабе. На гистограмме выделяются три однородные совокупности. Первая совокупность соответствует содержанию SrO 0,01-0,05 %, вторая 0,05-1 %, третья 1-13 %. Следовательно, имеется три разновидности апатита с различным содержанием стронция. Анализ адресов проб показывает, что они относятся к различным типам месторождений и горных пород. Наиболее чистыми по содержанию стронция являются апатиты из гранитоидов, ультрабазитов и метаморфических пород. Средние по содержанию стронция – это апатиты скарновых месторождений и некоторых массивов щелочных пород. Наиболее высокие содержания стронция наблюдаются в апатитах Хибинской группы месторождений.
Однородные совокупности, входящие в смешанную совокупность, различаются средними значениями и дисперсиями Важным показателем, определяющим возможность аналитического разделения смешанных совокупностей при условии нормального их распределения, является раздвиг распределений: (2.54) который по смыслу близок к критерию t. Чем больше раздвиг, тем легче разделить неоднородную совокупность на однородные и определить их характеристики. Можно выделить несколько вариантов разделения: 1. Раздвиг очень большой (d > 4), гистограмма распадается на две самостоятельные гистограммы, не перекрывающие друг друга (рис.2.19, а). 2. Раздвиг большой (d = 2¸4), гистограмма является бимодальной, совокупности частично перекрываются (рис.2.19, б и рис.2.17). Однородные совокупности можно разделить либо аналитическим путем, либо используя геологическую информацию. 3. Раздвиг малый (d = 0,7¸2), гистограмма одномодальная, но имеет искаженную асимметричную форму (рис.2.19, в). Аналитическое разделение ее на однородные совокупности все же возможно. 4. Раздвиг незначительный (d < 0,7), гистограмма одномодальная (рис.2.19, г), разделить ее на однородные совокупности практически невозможно. Таким образом, перед статистической обработкой данных необходимо стараться разделить неоднородную совокупность на однородные и удалить из расчетов аномальные значения.
ДВУХМЕРНАЯ СТАТИСТИЧЕСКАЯ МОДЕЛЬ И ЕЕ ПРИМЕНЕНИЕ В ГЕОЛОГИИ Глава
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|