Задания для практической работы
Стр 1 из 2Следующая ⇒ Математическая статистика Методические указания для практических и лабораторных работ по дисциплинам «Математика», «Теория вероятностей», «Теория вероятностей и математическая статистика» для студентов всех форм обучения всех направлений бакалавриата
Тюмень ТюмГНГУ Утверждено редакционно-издательским советом Тюменского государственного нефтегазового университета
Составители: Овчинникова С.В., к.с.н., доцент Сартакова А.В., ст. преподаватель
ã Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Тюменский государственный нефтегазовый университет», 2011 г. Введение Получение высшего образования по всем направлениям бакалавриата требует высокой математической культуры, достаточного глубокого владения рядом специальных математических методов и умения непосредственного их применения в профессиональной деятельности. Методические указания рассчитаны на проведения практических и лабораторных занятий по данному разделу математики. Основной целью МУ является овладение методами математического аппарата для решения прикладных математических задач. В помощь студенту предлагается подробное решение практической работы «Расчет числовых характеристик выборки. Определения закона распределения случайной величины» и лабораторной работы «Построение теоретической линии регрессии в случае линейной корреляционной зависимости». Также во время проведения практических и лабораторных занятий происходит формирование следующих общекультурных и профессиональных компетенций: способен к обобщению, анализу, восприятию информации, постановке цели и выбору путей её достижения, владеет культурой мышления, способен логически верно, аргументировано и ясно строить устную и письменную речь, способен собрать и проанализировать исходные данные, необходимые для расчета экономических и социально-экономических показателей, характеризующих деятельность хозяйствующих субъектов, способен осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач, способен использовать для решения коммуникативных задач современные технические средства и информационные технологии.
Практическая работа «Расчет числовых характеристик выборки. Определения закона распределения случайной величины»
Рейтинговая оценка работы: 1) выполнение – 10 баллов; 2) защита – 5 баллов.
Цель работы: ознакомление со способами построения рядов распределения и методом расчёта их числовых характеристик, применение критериев согласия. Содержание работы: 1. Построить интервальный вариационный ряд. Гистограмму. 2. Перейти от интервального вариационного ряда к дискретному, заменив частичные интервалы их серединами. Построить полигон, кумуляту частот, частостей. 3. Найти эмпирическую функцию распределения. 4. Найти числовые характеристики выборки: моду, медиану, выборочное среднее, выборочное среднее квадратическое отклонение, коэффициент вариации, асимметрию, эксцесс. 5. Сделать предварительный выбор закона распределения случайной величины. 6. Проверить согласованность эмпирической и теоретической функций распределения выбранного закона распределения с помощью критериев согласия χ2-Пирсона, Колмогорова при уровне значимости α=0,05. 7. Определить интервальные оценки для генеральной средней, генерального среднего квадратического отклонения нормального закона распределения с надёжностью γ =0,95.
Методика выполнения практической работы. В течение пятидесяти дней фиксировались цены акций компании “Фауна”. Отклонения от номинальной стоимости даны в таблице:
1. Для построения интервального ряда определим интервальный шаг выборки, воспользовавшись формулой Стерджеса h= (xmax-xmin) / (1+3,322lgn), где n – объём выборки (в нашем случае 50), xmax, xmin – соответственно наибольшее и наименьшее значения признака. h =(30,1-27,1)/(1+3,322 lg 50)=0,45 За начало первого интервала примем х1 = xmin - h /2=26,9. В результате получим интервальный ряд.
Частота – это количество значений признака, встречающееся в данном интервале. Например, в интервал (27,9;28,4] попадает 7 значений отклонений цены от номинальной стоимости. Гистограмма – это ступенчатая фигура, состоящая из прямоугольников. Их основаниями служат частичные интервалы, а высоты равны частотам (частостям). Ее график изображен на рис.1.
2. Построим дискретный вариационный ряд. Для этого интервалы заменяем их серединами, причем частоты остаются прежними.
Полигон частот (многоугольник распределения) – ломаная, соединяющая точки с координатами (xi, ni) или (xi, wi). Его график отражен ниже на рис.2.
Кумулята – это кривая накопленных частот (частостей). Для её построения найдём
![]()
3. Эмпирической функцией распределения F* (x) называется относительная частота того, что признак примет значение, меньшее заданного x, т.е. F* (x) =w (X<x) =
Запишем эмпирическую функцию:
4. Модой Мо вариационного ряда называется варианта, которая имеет наибольшую частоту. Мо =28,65. Медианой Ме вариационного ряда называется значение признака приходящееся на середину ранжированного ряда наблюдений. Если n=2k+1 (нечётное число), то Ме=хк+1; если n=2k (чётное число), то Ме= (хк+1+хк)/2. Ме =28,65. Выборочной средней
Выборочная дисперсия
Найдём коэффициент вариации Определим коэффициент асимметрии, которая характеризует асимметрию полигона вариационного ряда Вычислим эксцесс, показывающий степень “крутости” выборочного распределения относительно нормального распределения:
Равенство выборочного среднего и выборочной дисперсии может служить основанием выбора пуассоновского распределения. Для теоретического показательного закона распределения характерно равенство выборочного среднего и выборочного среднего квадратического отклонения. В случае нормального закона распределения асимметрия и эксцесс близки к нулю. Гипотеза о нормальности закона распределения может быть принята, если выполняются неравенства: Вычислим Основываясь на значениях коэффициентов вариации (находится в интервале [0,01; 0,40]), асимметрии (близок к нулю), эксцесса (близок к нулю) можно предположить, что признак подчинён нормальному закону распределения. Плотность вероятности Тогда функция распределения имеет вид Здесь 6. Для строгой проверки гипотезы о нормальном распределении признака применим критерии согласия. Они позволяют ответить на вопрос являются ли неизбежные расхождения между эмпирическим и теоретическим распределениями случайными или теоретический закон подобран неудачно.
а) χ2-Пирсона. При его использовании сравниваются эмпирические ni и теоретические (предполагаемые) ni′ частоты. Для расчёта вероятностей рi попадания случайной величины Х в интервал [ xi, хi+1 ] используем функцию Лапласа (см. приложение 1) в соответствии со свойством нормального распределения: Например,
Учитывая, что в рассматриваемом эмпирическом распределении частоты первого, второго и последнего интервалов (n1=2; n2=0 и n7=1) меньше пяти, при использовании критерия χ2 Пирсона целесообразно объединить указанные интервалы с соседними. Итак, фактически наблюдаемое значение статистики Так как новое число интервалов (с учётом объединения крайних) m =4, а нормальный закон имеет два параметра a и σ (r=2), то число степеней свободы k=m-r -1=4-2-1=1. Соответствующее критическое значение статистики при уровне значимости α=0,05 б) Воспользуемся критерием Колмогорова. При его использовании сравниваются эмпирическая F* (x)и теоретическая (предполагаемая) F(x) функции распределения. Для построения теоретической функции распределения для нормального закона распределения воспользуемся ее выражением через функцию Лапласа:
Например, Составим вспомогательную таблицу
Вычислим значения D=max |F*(x)-F(x)|= 0,169; λнабл= При уровне значимости α=0,05 табличное значение λα=1,36 (см. приложение 4). Так как λнабл< λα, то нет оснований отвергать гипотезу о распределении случайной величины по нормальному закону. 7. Для нахождения интервальных оценок параметров нормального распределения воспользуемся формулами
S(1-q)<σГ<S(1+q), где
t(γ; n) = t (0,95; 50)=2,009, q(γ; n) = q (0,95; 50)=0,21.
0,482< σГ< 0,738. Первое неравенство означает, что математическое ожидание отклонения цены акции от номинальной с вероятностью 95% попадёт в интервал (28,68; 29,02). Лабораторная работа «Построение теоретической линии регрессии в случае линейной корреляционной зависимости» Рейтинговая оценка работы: 1) выполнение – 10 баллов; 2) защита – 5 баллов. Цель работы: ознакомиться с методикой построения линий регрессии с последующим анализом достоверности полученных параметров.
Содержание работы: 1. Построить корреляционное поле. 2. Найти частоты признаков. 3. Вычислить выборочный коэффициент корреляции. 4. Записать выборочные уравнения прямой и обратной линий регрессии. 5. Построить их на корреляционном поле. 6. Оценить коэффициент корреляции генеральной совокупности. 7. Проверить значимость выборочного коэффициента корреляции по критерию Стьюдента при уровне значимости α=0,05. 8. Найти корреляционное отношение. 9. Проверить значимость корреляционного отношения по критерию Стьюдента при уровне значимости α=0,05. 10. Проверить значимость уравнения прямой линии регрессии по критерию Фишера при уровне значимости α=0,05.
Методика выполнения лабораторной работы. Для исследования зависимости объема производства (Y) от основных фондов (Х) получены статистические данные по 25 предприятиям за год.
Необходимо установить вид зависимости между объемом производства и основными фондами. Число 4 в таблице означает, что пара чисел (12, 10) встретилась в выборке 4 раза. Это число называется частотой и обозначается в дальнейшем nij. Значения признаков обозначаются хi, yj, i=1,…, l; j=1,…, m.
1. Для предварительного установления вида зависимости Y и X построим корреляционное поле (рис. 4). Нетрудно видеть, что оно располагается вдоль прямой. Это свидетельствует о линейности связи.
![]() 2. Найдем частоты признаков ni=
3. Выборочный коэффициент корреляции вычисляется по формуле
Для вычисления а) находят произведение частоты nij на варианту y j, которое записывают в правом верхнем углу клетки, содержащее значение частоты. Например, в правых верхних углах третьей строки записаны произведения 2·30=60, 3·40=120. б) Складывают все числа, помещенные в правых верхних углах одной строки, и их сумму заносят в клетку этой же строки столбца в) Умножают варианту хi на полученные значения и заносят в клетку столбца г) Сложив все числа найденного столбца, получают сумму Для контроля аналогичные вычисления производят по столбцам. Найдем искомый выборочный коэффициент корреляции: Коэффициент детерминации 4. Выборочное уравнение прямой линии регрессии Y на Х имеет вид:
Запишем уравнение обратной линии регрессии Х на Y. 5. Построим эти прямые на корреляционном поле по двум точкам соответствующим наибольшему и наименьшему значениям вариант (рис.1). 6. Построим доверительный интервал коэффициента корреляции генеральной совокупности. rв- Δ <rГ<rв+ Δ, где 0,47 <rГ< 1,01. 7. Проверим значимость выборочного коэффициента корреляции по критерию Стьюдента. t кр(23;0,05)=2,07. (см. приложение 7) | t набл|> t кр нет основания отвергать гипотезу о коррелированности 8. Общей мерой тесноты связи линейной и нелинейной корреляционной зависимости между признаками является корреляционное отношение.
Чем ближе значение корреляционного отношения к 1, тем сильнее связь между признаками. Вычислим условные средние
Равенство 9. Проверим значимость корреляционного отношения по критерию Стьюдента. t кр(k-2;α)= t кр(23;0,05)=2,07. (см. приложение 7) | t набл|> t кр нет основания отвергать гипотезу о коррелированности 10. Проверим значимость уравнения прямой линии регрессии по критерию Фишера. где k – число оцениваемых параметров;
Вычислим
Уравнение линейной регрессии содержит два параметра, следовательно k =2.
Fкр = F (α, k1, k2) F (α, k-1, n-k)= F (0,05; 1; 23)=4,28 (см. приложение 6). Fнабл>Fкр, следовательно, уравнение значимо описывает зависимость между признаками. Задания для практической работы
|