Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Изучение законов распределения случайных величин

Содержание

 

Задание на курсовое проектирование

Введение

Исходные данные

1. Исследование вероятностной структуры сигналов

1.1 Построение гистограмм выборочных плотностей вероятности амплитуд сигналов, как случайных величин

1.2 Изучение законов распределения случайных величин

1.3 Оценка параметров распределения случайных величин для четырех законов

1.4 Построение на одном графике теоретического и практического распределения для формулировки гипотезы

1.5 Проверка гипотезы по критерию Колмогорова – Смирнова

1.6 Проверка гипотезы по критерию согласия Пирсона

1.7 Построение корреляционной функции для фрагмента сигнала длительностью 2000 отсчетов

2. Формирование обучающих и контрольных множеств данных

2.1 Признаки по оценке плотности распределения вероятности в пяти интервалах положительной области

3. Исследование признаков

3.1 Оценка параметров распределения признаков. Определение информативного признака с максимальным расстоянием, построение функций плотности распределения вероятностей и вычисление порога принятия решения, формулирование решающего правила

4. Обучение двухслойной нейронной сети

4.1 Общие сведения о нейронных сетях

4.2 Обучение нейронной сети

Заключение

Список использованных источников


Исходные данные

 

Задача обнаружения гусеничной техники, проезжающей на расстоянии 200 м от сейсмоприемника. Сигналы fon и tr_t200 предназначены для обучения и контроля нейронной сети. Сигнал test_t50 – для тестирования работы нейронной сети. Признаки: распределение мощности в десяти равномерных интервалах (по 25 гармоник).

 

Рисунок 1 – Исходный фоновый сигнал

 

Рисунок 2 – Исходный сигнал гусеничной техники

 


Введение

 

За последние 10…20 лет существенно расширилась область использования технических средств охранной сигнализации (ТСОС): они используются для охраны, как военных объектов, атомных станций, государственной границы, так и дачных и фермерских хозяйств. Возрастают и требования к ТСОС по энергопотреблению и габаритным размерам, быстродействию и эффективности, кругу решаемых задач.

Ранее в основном решалась задача обнаружения нарушителя с вероятностью 0.9, в настоящее время требуется повысить вероятность до 0.95 и более при снижении времени наработки до ложной тревоги с 1000 до 2000 часов (вероятности ложной тревоги). Все чаще ставятся задачи распознавания нарушителя по классам человек-группа людей, колесная-гусеничная техника с вероятностью 0.8…0.9 и определения места и направления пересечения охраняемого рубежа или зоны.

Для решения поставленных задач недостаточно простых схемотехнических решений и алгоритмов, основанных на амплитудно-временной селекции сигналов.

Анализ отечественных и зарубежных ТСОС показал, что основным направлением их развития является разработка более сложных алгоритмов обработки сигналов, основанных на исследовании «тонкой» внутренней структуры сигналов, генерируемых нарушителем, и выявлении наиболее отличительных характеристик (признаков).

 

 


Исследование вероятностной структуры сигналов

 

Построение гистограммы

 

Различные законы распределения различаются видом графиков F (x) и f (x). Из математического анализа известно, что при интегрировании функции сглаживаются, а при дифференцировании, их особенности проявляются сильнее. Поэтому функция плотности распределения вероятности f (x) содержит больше информации, чем функция распределения F (x).

По определению плотность распределения f (x) – это предел отношения вероятности попадания в малый интервал к ширине этого интервала, когда ширина стремится к нулю. Для выборки выборочная вероятность попадания в некоторый интервал – это отношение числа попаданий в интервал nj к общему числу попаданий n. Если ее разделить на ширину интервала h, то при малых h мы и получим выборочную плотность распределения:

 

                                          (1)

 

Здесь мы не сможем использовать xj поодиночке, их придется группировать по участкам. Поэтому вначале весь интервал изменения данных  нужно разбить на участки одинаковой длины. Сколько участков взять? Есть несколько подходов к определению числа участков разбиения k. Один из них – это использование формулы Стэрджесса:

 

,                               (2)

 

где n – объем выборки, а  – операция округления до ближайшего целого. Другой подход состоит в следующем. С одной стороны, число участков разбиения должно быть как можно больше, с другой стороны, в каждый из этих участков должно попадать как можно больше значений xi. Компромисс между этими требованиями приводит к тому, что обычно выбирают число участков k для построения гистограммы как ближайшее целое к корню квадратному из n:

 

.                                              (3)

 

После разбиения  на k участков подсчитываем число попаданий в каждый из них nj.

Из (1) следует, что гистограмма с точностью до множителя nh совпадает с графиком выборочной плотности распределения . Разделив ординаты гистограммы на nh, мы получим график .

Для построения гистограммы в MATLAB имеется функция hist. Она автоматически разбивает интервал изменения выборки на нужное количество участков, подсчитывает nj и строит график.

Продолжим выполнение задания «Обработка массива данных». В нижеприведенной области ввода первая строка – это определение числа участков k. Сейчас здесь стоит . Если вы хотите использовать формулу Стэрджесса, измените эту строку. Определим ширину каждого интервала h (идентификатор d в программе). Построим гистограмму распределения (1).

Практическая часть.

clear all% очистили рабочую область

x=tr_t200; % вводим ИД

x=sort (x(:));% переформатировали столбец и рассортировали

n=length(x);% длина массива t_tr200

xmin=x(1);% находим минимальное значение

xmax=x(n);% находим максимальное значение

Mx=mean(x);% математическое ожидание

f=n-1;% число степеней свободы

Dx=var(x);% дисперсия

Sx=std(x);% среднеквадратичное отклонение

Ax=skewness(x);% асимметрия

Ex=kurtosis(x) – 3;% эксцесс

k=round (n^0.5);% число интервалов для построения гистограммы

d=(xmax-xmin)/k;% ширина каждого интервала

del=(xmax-xmin)/20;% добавки влево и вправо

xl=xmin-del;% левая граница интервала для построения гистограммы

xr=xmax+del;% правая граница интервала для построения гистограммы

fprintf ('Число интервалов k=%d\n', k)

fprintf ('Ширина интервала h=%14.7f\n', d)

figure% создаем новую фигуру

hist (x, k)% построили гистограмму

set (get(gcf, 'CurrentAxes'),…

'FontName', 'Times New Roman Cyr', 'FontSize', 12)% установка типа и номера шрифта

title ('\bfГистограмма')% заголовок

xlim([xl xr])% границы по оси OX

xlabel ('\itx_{j}')% метка оси x

ylabel ('\itn_{j}')% метка оси y

grid

 


Рисунок 3 – гистограмма распределения амплитуды сигнала гусеничной техники

 

Рисунок 4 – гистограмма распределения амплитуды фонового сигнала

Вывод: по виду полученных гистограмм можно сделать предположение о том, что распределение амплитуд сигнала подчиняется нормальному закону.

Изучение законов распределения случайных величин

 

Примеры распределений: нормальное, показательное (экспоненциальное), равномерное, рэлеевское

По виду гистограммы подбирается теоретический закон распределения. Для этого смотрим, на какую плотность распределения похожа гистограмма и выбираем соответствующий закон. В этом задании выбор небольшой. Мы рассматриваем только 4 наиболее часто встречающихся а приложениях законов распределения:

1. Нормальное.

2. Показательное (экспоненциальное).

3. Равномерное.

4. Рэлеевское.

Нарисуем с помощью MATLAB графики соответствующих плотностей распределения. Они показаны на рисунках 5 – 8. Здесь для вычисления f (x) используется функция pdf, которая находит плотность любого из имеющихся в MATLAB видов распределений. Можно использовать и другой вариант: вычислять каждую плотность распределения с помощью своей функции: normpdf, exppdf и т.д.

Плотность нормального распределения – колоколообразная кривая, симметричная относительно некоторой вертикальной оси, но она может быть смещена по горизонтали относительно оси Оу. Значения х могут быть разного знака. Выражение для плотности нормального распределения имеет вид:

 

,                                          (4)

 

а функция распределения:

 

,                  (5)


где Ф(u) – интеграл Лапласа, для которого есть таблицы. Если считать функцию нормального распределения вручную, то удобно пользоваться таблицами интеграла Лапласа, которые есть в любом учебнике по теории вероятностей. При использовании MATLAB в этом нет необходимости: там есть функции normpdf и normcdf, а также функции pdf и cdf, в которых первый параметр (название распределения) должен иметь значение ‘ norm ’. В выражение для плотности и функции нормального распределения входят 2 параметра: m и s, поэтому нормальное распределение является двухпараметрическим. По нормальному закону обычно распределена ошибка наблюдений.

Плотность показательного распределения отлична от нуля только для неотрицательных значений х. В нуле она принимает максимальное значение, равное a. С ростом х она убывает, оставаясь вогнутой и асимптотически приближаясь к 0. Выражение для плотности показательного распределения:

 

                                   (6)

 

а для функции распределения:

 

                                (7)

 

Показательно распределение является однопараметрическим: функция и плотность его зависят от одного параметра a.

Обратите внимание: в MATLAB параметр показательного распределения – это величина, обратная a в формулах (6 – 7).

Плотность равномерного распределения отлична от нуля только в заданном интервале [ a, b ], и принимает в этом интервале постоянное значение:

 

                            (8)

 

Функция равномерного распределения левее точки а равна нулю, правее b – единице, а в интервале [ a, b ] изменяется по линейному закону:

 

                       (9)

 

Равномерное распределение – двухпараметрическое, т. к. в выражения для F (x) и f (x) входят 2 параметра: а и b. По равномерному закону распределены ошибка округления и фаза случайных колебаний. В MATLAB плотность и функция равномерного распределения могут быть посчитаны с помощью функций unifpdf и unifcdf, а также с помощью функций pdf и cdf с первым параметром ‘ unif ’.

Плотность рэлеевского распределения отлична от нуля только для неотрицательных значений х. От нуля она выпуклая и возрастает дол некоторого максимального значения. Далее с ростом х она убывает, оставаясь выпуклой. Затем становится вогнутой, продолжая убывать, и асимптотически приближается к 0. Выражение для плотности рэлеевского распределения имеет вид:


                             (10)

 

Функция рэлеевского распределения:

 

                              (11)

 

Это распределение однопараметрическое: оно зависит от одного параметра s. По рэлеевскому закону распределено расстояние от точки попадания в мишень до ее центра. Вычисление плотности и функции рэлеевского распределения в MATLAB реализовано с помощью функций raylpdf, raylcdf или функций pdf, cdf с превым параметром ‘ rayl ‘.

 

Практическая часть.

tdistr={'norm', 'exp', 'unif', 'rayl'};% названия

pardistr=[[2 1]; [2,0]; [0 4]; [1 0]];% параметры

ndistr=length(tdistr);% количество распределений

xpl=[-1:0.01:5]';% абсциссы для графиков

for idistr=1:ndistr, % заполняем и строим графики

ypdf=pdf (tdistr{idistr}, xpl,…

pardistr (idistr, 1), pardistr (idistr, 2));% ординаты

figure% новая фигура

plot (xpl, ypdf);% рисуем

set (get(gcf, 'CurrentAxes'),…

'FontName', 'Times New Roman Cyr', 'FontSize', 12)

title(['\bfПлотность распределения ' tdistr{idistr}])

end;

 

Рисунок 5 – плотность распределения амплитуды сигнала по нормальному закону

 

Рисунок 6 – плотность распределения амплитуды сигнала по экспоненциальному закону

 

Рисунок 7 – равномерная плотность распределения амплитуды сигнала


Рисунок 8 – плотность распределения амплитуды сигнала по Релеевскому закону

 

На практике могут встретиться и другие виды распределений (b, c2, логнормальное, Вейбулла и т.д.). Многие из них реализованы в MATLAB, но иногда приходится писать свои функции.

Графики некоторых плотностей распределения похожи между собой, поэтому иногда вид гистограммы позволяет выбрать сразу несколько законов. Если есть какие-либо теоретические соображения предпочесть одно распределение другому, можно их использовать. Если нет – нужно проверить все подходящие законы, а затем выбрать тот, для которого критерии согласия дают лучшие результаты.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...