Между характеристиками выборочной совокупности и искомыми параметрами генеральной совокупности, как правило, существует некоторое расхождение, которое называют ошибкой.
Общая величина возможной ошибки выборки слагается из ошибок двоякого рода: - ошибки регистрации; - ошибки репрезентативности. Ошибки регистрации свойственны всякому статистическому наблюдению и их появление может быть вызвано несовершенством измерительных приборов, недостаточной квалификацией наблюдателя, недостаточной точностью подсчетов и т.п. Можно полагать, что по сравнению со силошными наблюдениями опасность возникновения ошибок регистрации при выборочном наблюдении должна быть меньше, так как они проводятся более квалифицированными работниками. Значительно уменьшается при выборочном наблюдении и опасность преднамеренных искажений данных, так как специально подобранные и обученные наблюдатели в них не заинтересованы. Ошибками репрезентативности называют расхождения между средними величинами или долями признака выборочной и генеральной совокупности. Они присущи только несилошным наблюдениям. Ошибки репрезентативности могут быть: - систематическими; - случайными. Систематическими называются ошибки, которые возникают из-за нарушения научного принципа отбора единиц в выборочную совокупность. Они возникают в тех случаях, когда в результате непрпавильного отбора в выборочную совокупность попали наилучшие или наихудшие единицы. В результате такого отбора средние и относительные показатели, полученные по выборочной совокупности, будут искаженно характеризовать генеральную совокупность. Случайные ошибки репрезентативности – это неточности, которые возникают из-за того, что выборочная совокупность не совсем правильно отражает средние величины и величины доли признака генеральной совокупности. Такие ошибки возникают даже при самом строгом соблюдении принципов и правил отбора единиц в выборочную совокупность.
Ошибки репрезентативности свойственны только выборочному наблюдению. Они не могут быть полностью устранены, но они могут быть доведены до незначительных размеров, если соответствующим образом организовать отбор единиц в выборочную совокупность. Пределы ошибок репрезентативности можно определить с достаточной степенью точности на основании ряда теорем в теории вероятности и математической статистике. Исключительно важную роль для обоснования и применения выборочного наблюдения играет закон больших чисел. Использование законы больших чисел состоит в том, что при определенных условиях и при достаточно большом объеме наблюдений сводные характеристики, полученные на основе выборочного наблюдения, будут мало отличаться от соответствующих характеристик генеральной доверенности. Основываясь на этом, можно, увеличивая объем выборочной совокупности, уменьшить пределы возможных ошибок репрезентативности, довести их до наименьших размеров. С другой стороны, зная пределы ошибок репрезентативности, можно определить необходимую численность выборочной совокупности.
Измерение ошибки выборки
Величина ошибки выборки зависит от численности выборочной совокупности и от степени колеблемости изучаемого признака. Зависимость величины ошибки выборки: одна формула применяется при выборочном определении средней величины признака, а другая – при выборочном определении доли признака. Доказательства и вывод этих формул даются в курсах математической статистики. Формула средней ошибки выборки при определении средней величины признака имеет следующий вид:
где m - средняя ошибка выборки; s2 - дисперсия признака в генеральной совокупности; n – число единиц в выборочной совокупности.
Следовательно, средняя ошибка выборки равна корню квадратному из дисперсии признака, деленной на численность выборочной совокупности. Это значит, что ошибка выборки уменьшается при уменьшении колеблемости признака, а также при увеличении выборочной совокупности. Это означает также, что при уменьшении колеблемости признака можно уменьшить объем выборки. Формула средней ошибки выборки при определении доли признака такова:
где m - средняя ошибка выборки; p –доля признака в генеральной совокупности; n – число единиц в выборочной совокупности. Вышеприведенные формулы ошибки выборки применяются, когда отбор единиц в выборочную совокупность производится в порядке случайной повторной выборки. Повторная выборка называется потому, что каждая из единиц, отобранная из генеральной совокупности, после регистрации ее признаков возвращается обратно и может при каждом последующем отборе попасть в выборку еще раз, т.е. повторно. Практически случайная повторная выборка встречается сравнительно редко. Большей частью имеют дело со случайной бесповторной выборкой. Бесповторная выборка называется потому, что каждая из единиц после регистрации ее признаков обратно не возвращается и в дальнейшем уже в отборе не существует. При бесповторной выборке сокращается численность единиц генеральной совокупности. Поэтому при определении ошибки выборочной средней и доли признака при бесповторном отборе должна быть учтена численность генеральной совокупности и доля выборки. Генеральную совокупность обозначим через N, тогда доля выборочной совокупности n, будет равна . Поэтому в формулу ошибки выборки при повторном отборе должен быть введен дополнительный множитель . Тогда формулы ошибок выборки бесповторного отбора примут следующий вид: для определения ошибки выборочной средней:
для определения ошибки выборочной доли:
Дополнительный множитель всегда будет меньше 1. Например, при 20%-ой выборке доля выборочной совокупности =0,2, а дополнительный множитель =1,0-0,2=0,8. Покажем расчет ошибки выборочной средней и доли признака по данным, приведенным в табл.1. Отбор участков в примере производится по схеме бесповторной выборки. Из 300 участков было отобрано 30, т.е. доля участков, попавших в выборочную совокупность составляла = =0,1 или 10%. Дополнительный множитель =1,0-0,1=0,9.
Определим ошибку средней урожайности по участкам, попавшим в выборку:
Полученная величина ошибки выборки показывает, что средняя урожайность на участках, попавших в 10% выборку, может на ±0,12 ц с 1 га отличаться от генеральной средней, или, иначе говоря, можно ожидать, что средняя урожайность в генеральной совокупности будет находится между 15,12 (15+0,12) и 14,88 (15-0,12) ц с 1 га. Ошибка выборочной доли – доли участков с урожайностью 15 и более центнеров с 1 га:
Полученная величина ошибки выборки показывает, что доля участков с урожайностью 15 ц с 1 га в общем числе участков может отклоняться на ±0,07 от доли участков с подобной урожайностью во всей генеральной совокупности. Можно ожидать, что доля участков с урожайностью 15 и более ц с 1 га будет находится в генеральной совокупности между 0,80 (0,73+0,07) и 0,66 (0,73-0,07). При этом возникает вопрос: обязательно ли или лишь с определенной степенью вероятности средняя или доля в генеральной совокупности расположатся в диапазонах, определяемых средней ошибкой выборки, с вероятностью 0,683. Это нас подводит к еще одному показателю ошибки выборки – предельной ошибки выборки. Предельная ошибка выборки – показатель, характеризующий диапазон, в котором по обе стороны от выборочной средней или выборочной доли расположатся значения генеральной средней или генеральной доли, гарантируемые с определенной степенью вероятности. Формула предельной ошибки выборки: D=tm, где D (дельта) - величина пред. ошибки выборки с заданной вероятностью; t – коэффициент доверия, которорму соответствуют вероятности предельной ошибки выборки; m - средняя ошибка выборки. Величины вероятности, соответствующие коэффициентам доверия, устанавливаются математической статистикой. Так, например, t = 1 соответствует вероятность 0,683; t = 2 соответствует вероятность 0,954; t = 3 – вероятность 0,997 и т.д.
Если нам надо диапазон, в котором расположатся генеральная средняя и генеральная доля, определить с большой степенью вероятности, то этот диапазон должен быть расширен. Так, например, если мы должны вероятность определения этого диапазона в условиях нашего примера довести до 0,997, то среднюю ошибку выборки надо умножить на t = 3, D = tm = ± 0,12 ц с 1 га ´ 3 = ± 0,36 ц с 1 га. Это означает, что с вероятностью, равной 0,997, можно гарантировать, что средняя урожайность генеральной совокупности расположится между 15,36 ц (15,0+0,36) и 14,64 ц с 1 га (15,0 - 0,36). Формулы предельных ошибок выборки: при повторном отборе:
а) для средней D = tm = t , б) для доли D = tm = t ;
при бесповторном отборе: а) для средней D = tm = t , б) для доли D = tm = t .
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|