Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Статистические характеристики




В большинстве статистических расчетов Вы имеете дело либо со случайными данными, полученными в ходе какого-либо эксперимента (которые выводятся из файла или печатаются непосредственно в документе), либо с результатами генерации случайных чисел, рассмотренными в предыдущих разделах встроенными функциями, моделирующими то или иное явление методом Монте-Карло. Рассмотрим возможности Mathcad по оценке функций распределения и расчету числовых характеристик случайных данных.

 

Построение гистограмм

Гистограммой называется график, аппроксимирующий по случайным данным плотность их распределения. При построении гистограммы область значений случайной величины (а,b) разбивается на некоторое количество bin сегментов, а затем подсчитывается процент попадания данных в каждый сегмент. Для построения гистограмм в Mathcad имеется несколько встроенных функций. Рассмотрим их, начиная с самой сложной по применению, чтобы лучше разобраться в возможностях каждой из функций.

Гистограмма с произвольными сегментами разбиения

· hist(intvis,x) — вектор частоты попадания данных в интервалы гистограммы;

      • intvis — вектор, элементы которого задают сегменты построения гистограммы в порядке возрастания a<intvisi<b;
      • х — вектор случайных данных.

Если вектор intvis имеет bin элементов, то и результат hist имеет столько же элементов. Построение гистограммы иллюстрируется листингом 14.8 и рис. 14.9.

Листинг 14.8. Построение гистограммы

Для анализа взято N=1000 данных с нормальным законом распределения, созданных генератором случайных чисел (третья строка листинга). Далее определяются границы интервала (upper, lower), содержащего внутри себя все случайные значения, и осуществляется его разбиение на количество (bin) одинаковых сегментов, начальные точки которых записываются в вектор int (предпоследняя строка листинга).

В векторе int можно задать произвольные границы сегментов разбиения так, чтобы они имели разную ширину.

Рис. 14.9. Построение гистограммы (листинг 14.8)

 

Обратите внимание, что в последней строке листинга осуществлена нормировка значений гистограммы, с тем чтобы она правильно аппроксимировала плотность вероятности, также показанную на графике. Очень важно переопределение вектора int в самом верху рис. 14.9, которое необходимо для перехода от левой границы каждого элементарного сегмента к его центру.

Гистограмма с разбиением на равные сегменты

Если нет необходимости задавать сегменты гистограммы разной ширины, то удобнее воспользоваться упрощенным вариантом функции hist.

· hist (bin, х) — вектор частоты попадания данных в интервалы гистограммы;

o bin — количество сегментов построения гистограммы;

o х — вектор случайных данных.

Для того чтобы использовать этот вариант функции hist вместо предыдущего, достаточно заменить первый из ее аргументов в листинге 14.8 следующим образом:

Недостаток упрощенной формы функции hist в том, что по-прежнему необходимо дополнительно определять вектор сегментов построения гистограммы. От этого недостатка свободна появившаяся в Mathcad 2001 функция histogram.

· histogram (bin, х) — матрица гистограммы размера binx2, состоящая из столбца сегментов разбиения и столбца частоты попадания в них данных;

o bin — количество сегментов построения гистограммы;

o х — вектор случайных данных.

Примеры использования функции histogram приведены в листинге 14.9 и рис. 14.10. Сравнение с предыдущим листингом подчеркивает простоту построения гистограммы этим способом (стоит отметить, что в листинге 14.9, в отличие от предыдущего, мы не нормировали гистограмму).

 

Рис. 14.10. График и матрица гистограммы (листинг 14.9)

 

Создание графика гистограммы

Для того чтобы создать график в виде гистограммы:

· Постройте двумерный график, задайте переменные по осям и пределы оси х (в примере из листинга 14.9 это числа lower и upper).

· Войдите в диалоговое окно Formatting Currently Selected Graph (Форматирование) выбранного графика (например, двойным щелчком мыши) и перейдите на вкладку Traces (Графики).

 

Рис. 14.11. Установка типа графика для построения гистограммы

 

· Установите для серии данных гистограммы в поле Туре (Тип) элемент списка bar (столбцы) или solidbar (гистограмма) (рис. 14.11).

· Нажмите кнопку ОК.

На рис. 14.9 и 14.10 были применены установки графика bar (столбцы). В Mathcad 2001 появилась новая возможность построения гистограммы в более привычном виде — закрашенными столбиками (solidbar). Такой тип графика иллюстрируется рис. 14.11.

 

14.2.2. Среднее значение и дисперсия

В Mathcad имеется ряд встроенных функций для расчетов числовых статистических характеристик рядов случайных данных.

· mean(x) —выборочное среднее значение;

· median (х) — выборочная медиана (median) — значение аргумента, которое делит гистограмму плотности вероятностей на две равные части;

· var(x) — выборочная дисперсия (variance);

· stdev(x) — среднеквадратичное (или "стандартное") отклонение (standard deviation);

· max(x), mm (x) — максимальное и минимальное значения выборки;

· mode(x) — наиболее часто встречающееся значение выборки;

· var (x),stdev(x) — выборочная дисперсия и среднеквадратичное отклонение в другой нормировке;

      • х — вектор (или матрица) с выборкой случайных данных.

Пример использования первых четырех функций приведен в листинге 14.10.

 

Листинг 14.10. Расчет числовых характеристик случайного вектора

 

На рис.14.12 приведена гистограмма выборки случайных чисел, распределенных согласно закону Вейбулла. Пунктирные вертикальные прямые, показанные на графике, рассчитаны в последней строке листинга и обозначают стандартное отклонение от среднего значения. Гистограмма получена с помощью листинга 14.8, рассмотренного в предыдущем разделе. Обратите внимание, что поскольку распределение Вейбулла, в отличие, например, от Гауссова, несимметричное, то медиана не совпадает со средним значением.

Рис. 14.12. Гистограмма распределения Вейбулла (листинг 14.10)

 

Определение статистических характеристик случайных величин приведено в листинге 14.11 на еще одном примере обработки выборки малого объема (по пяти данным). В том же листинге иллюстрируется применение еще двух функций, которые имеют смысл дисперсии и стандартного отклонения в несколько другой нормировке. Сравнивая различные выражения, Вы без труда освоите связь между встроенными функциями.

Осторожно относитесь к написанию первой литеры в этих функциях, особенно при обработке малых выборок (листинг 14.11).

Листинг 14.11. К определению статических характеристик

 

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...