Оценка точности прогнозирования случайной величины.
Наиболее простой способ охарактеризовать точность прогноза это указать размах колебаний значений случайной величины в выборке. Размах колебаний – это разность между максимальным и минимальными значениями, чем он больше, тем меньше точность прогноза. Но у этой характеристики есть существенный недостаток – при наличии выбросов (аномально больших и аномально малых значений), размах колебаний занижает оценку точности, так как реагирует только на них. Более объективной характеристикой колеблемости случайной величины должна была бы являться или сумма отклонений случайной величины от своего среднего значения или, что еще лучше, среднее значение этого отклонения. Но в силу того, что отклонения случайной величины от среднего значения могут быть как положительные, так и отрицательные их сумма имеет тенденцию стремиться к нулю. Для устранения этого недостатка необходимо использовать или абсолютные значения этих отклонений или квадраты отклонений. Абсолютные значения представляют меньшие возможности для теоретических построений, по этому исторически сложилось так, что в качестве основного измерителя колеблемости случайной величины используется дисперсия. Дисперсия это средний квадрат отклонения случайной величины от своего среднего значения. Для генеральной совокупности дисперсия определяется по формуле: где:
Еще один вариант формулы для расчета дисперсии, удобный при ручном счете или в случае, когда появляются новые значения случайной величины, имеет вид:
В случае, когда генеральная совокупность не известна, а известна лишь только выборка из нее, то оценка дисперсии генеральной совокупности по данным выборки должна производится по несколько модифицированным формулам:
Дисперсия является универсальным показателем степени колеблемости случайной величины, а значит и точности прогноза, но у нее имеется существенный недостаток – это величина по своей сути не имеет единиц измерения (прибыль измеряется в рублях, дисперсия прибыли это рубли в квадрате). По этому наряду с дисперсией для характеристики колеблемости исходных данных используется производная от дисперсии величина – стандартное отклонение (второе название – среднеквадратическое отклонение)
В отличии от дисперсии стандартное отклонение имеет туже размерность, что и характеризуемая им случайная величина. Для полной характеристики точности полученного прогноза одной лишь дисперсии или стандартного отклонения недостаточно, необходимо еще указать тип распределения случайной величины. Если взять гистограмму случайной величины и начать увеличивать число интервалов по которым она построена (уменьшать их величину) то гистограмма начнет уменьшаться по высоте и становиться все более гладкой (рис 7). При бесконечно большом числе значений случайной величины и бесконечно малой величине интервалов гистограмма превратится в плавную кривую. Полученная таким образом кривая называется кривой плотности распределения или второе название – функция плотности распределения.
Рис 7. Схема получения кривой плотности распределения.
Высота кривой плотности распределения показывает вероятность появления заданного значения случайной величины. Площадь под кривой плотности распределения принимается равной единице. Это вероятность появления любого значения случайной величины в диапазоне от
В пределе Помимо функции плотности распределения для характеристики типа распределения может использоваться функция, показывающая вероятность появления очередного значения случайной величины меньшего или равного заданному значению. Это кумулятивная (накопленная) функция распределения. Точки на кривой распределения представляют собой значения площади под кривой плотности распределения в диапазоне от где:
Рис 8. Использование кривой плотности распределения для определения вероятности появления очередного значения случайной величины в заданном диапазоне. По графику кумулятивной кривой распределения помимо вероятности появления значения случайной величины в заданных пределах, можно определить ее ожидаемое значение (такое Рис 9. Использования функции распределения для нахождения ожидаемого дохода и убытка.
Математически ожидаемый убыток равен а ожидаемый доход Типов распределения случайной величины существует очень много, но наиболее часто встречается на практике нормальное распределение. Его наибольшая распространенность доказана математически. Согласно одному из вариантов предельной теоремы теории вероятности, если исследуемая случайная величина зависит от многих других случайных величин и среди этих влияющих величин нет превалирующих по силе влияния, то исследуемая случайная величина будет иметь распределение близкое к нормальному вне зависимости от того какие распределения имеют влияющие величины.
Нормальное распределение имеет форму колоколо-образной симметричной кривой, наивысшая точка которой соответствует На рис.10 показаны кривые плотности нормального распределения трех случайных величин, иллюстрирующие влияние параметров случайной величины на кривую плотности нормального распределения. Как следует из этих графиков положение кривой на числовой оси определяется средним значением случайной величины - средина кривой плотности нормального распределения соответствует, а форма кривой – ее высота и ширина - определяются стандартным отклонением Рис 10. Влияние параметров случайной величины на положение и форму кривой плотности нормального распределения.
В зависимости от конкретных значений Если вычесть из значений случайной величины ее среднее значение, т.е. осуществить замену координаты
На горизонтальной оси в этом случае откладываются не значения случайной величины, а их безразмерные аналоги, измеренные в стандартных отклонениях. Рис 11. Преобразование нормального распределения к стандартизованному виду.
Кривая плотности стандартизованного нормального распределения детально изучена. Ее значения, а также значения кумулятивной функции, приводятся практически во всех учебниках по теории вероятности и статистике. Это позволяет легко осуществлять расчеты вероятности появления того или иного события для любой случайной величины имеющей нормальное распределение. Так, например, для определения вероятности появления очередного значения случайной величины, равного Вероятность того, что очередное значение случайной величины окажется не менее
вероятность того, что очередное значение случайной величины окажется в диапазоне от
вне этого диапазона: Для экспрессных оценок вероятности появления того или иного события полезно знать некоторые базовые соотношения для нормального распределения: вероятность попадания очередного значения случайной величины в интервал
Или иной вариант, более удобный для практики: существует 10% вероятность того, что очередное значение окажется вне пределов 5% вероятность выхода за пределы 1% вероятность выхода за пределы При работе с выборками всегда возникает вопрос о том насколько обосновано избранное для расчетов то или иное распределение и каковы ошибки при неверно выбранном типе распределения. Русским математиком Чебышевым была доказана теорема о том, что в случае любого распределения вероятность выхода очередного значения за пределы В заключение отметим, что задача прогнозирования случайной величины по выборке ее предыдущих значений или по значениям, характерным для объектов того же класса сводится: к нахождению медианы, среднего значения или моды служащих в качестве прогнозного значения; указанию пределов и вероятности попадания прогноза в эти пределы в качестве характеристики точности прогноза. В качестве альтернативного способа характеристики точности прогноза можно указать вероятность получения и ожидаемую величину отрицательного значения прогнозируемой величины и вероятность и ожидаемую величину положительного значения.
Контрольные вопросы 1. Дайте определение случайной величины. 2. Дайте определение непрерывной случайной величины и приведите ее примеры. 3. Дайте определение дискретной случайной величины и приведите ее примеры. 4. Что такое генеральная совокупность и выборка? 5. Опишите процесс построения гистограммы. 6. Какие дефекты исходных данных можно выявить с помощью предварительного анализа данных? 7. Какую из характеристик случайной величины и в каких случаях необходимо применять для прогнозирования по выборке? 8. Какая характеристика случайной величины чаще всего используется для оценки изменчивости случайной величины? 9. Как определить моду непрерывной случайной величины 10. Приведите схему определения вероятности появления очередного значения случайной величины не превышающего заданное значение. 11. Приведите схему определения вероятности появления очередного значения случайной величины не менее заданного значения. 12. Приведите схему определения вероятности появления очередного значения случайной величины в заданном диапазоне. 13. Приведите схему определения вероятности появления очередного значения случайной величины вне заданного диапазона. 14. Как определить вероятность появления отрицательного значения случайной величины и его ожидаемое значение? 15. Какой тип распределения является самым распространенным и почему? 16. С какой целью осуществляется преобразование нормального распределения к стандартизованному виду? 17. Как сказываются ошибки в выборе типа распределения на точности определения вероятности наступления события? 18. Какими параметрами случайной величины задается положение и форма кривой нормального распределения? 19. Опишите схему прогнозирования по выборке. 20. Как можно охарактеризовать точность прогноза? 21. Опишите, в каких случаях применяется прогнозирование по выборке, приведите примеры задач.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|