Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Приложение Б Статистика и обработка данных




Введение

Слово «статистика» часто ассоциируется со словом «математика», и это пугает студентов, связывающих это понятие со сложными формула­ми, требующими высокого уровня абстрагирования.

Однако, как говорит Мак-Коннелл, статистика - это прежде всего способ мышления, и для ее применения нужно лишь иметь немного здравого смысла и знать основы математики. В нашей повседневной жизни мы, сами о том не догадываясь, постоянно занимаемся статисти­кой. Хотим ли мы спланировать бюджет, рассчитать потребление бензина автомашиной, оценить усилия, которые потребуются для усвое­ния какого-то курса, с учетом полученных до сих пор отметок, преду­смотреть вероятность хорошей и плохой погоды по метеорологической сводке или вообще оценить, как повлияет то или иное событие на наше личное или совместное будущее,-нам постоянно приходится отбирать, классифицировать и упорядочивать информацию, связывать ее с други­ми данными так, чтобы можно было сделать выводы, позволяющие принять верное решение.

Все эти виды деятельности мало отличаются от тех операций, которые лежат в основе научного исследования и состоят в синтезе данных, полученных на различных группах объектов в том или ином эксперименте, в их сравнении с целью выяснить черты различия между ними, в их сопоставлении с целью выявить показатели, изменяющиеся в одном направлении, и, наконец, в предсказании определенных фактов на основании тех выводов, к которым приводят полученные результаты. Именно в этом заключается цель статистики в науках вообще, особенно в гуманитарных. В последних нет ничего абсолютно достоверного, и без статистики выводы в большинстве случаев были бы чисто интуитивны­ми и не могли бы составлять солидную основу для интерпретации данных, полученных в других исследованиях.

Для того чтобы оценить огромные преимущества, которые может дать статистика, мы попробуем проследить за ходом расшифровки и обработки данных, полученных в эксперименте. Тем самым, исходя из конкретных результатов и тех вопросов, которые они ставят перед исследователем, мы сможем разобраться в различных методиках и не­сложных способах их применения. Однако, перед тем как приступить к этой работе, нам будет полезно рассмотреть в самых общих чертах три главных раздела статистики.

1. Описательная статистика, как. следует из названия, позволяет описывать, подытоживать и воспроизводить в виде таблиц или графиков

 

278 Приложение Б

данные того или иного распределения, вычислять среднее для данного распределения и его размах и дисперсию.

1. Задача индуктивной статистики-прочерка того, можно ли рас­пространить результаты, полученные на данной выборке, на всю популя­цию, из которой взята эта выборка. Иными словами, правила этого раздела статистики позволяют выяснить, до какой степени можно путем индукции обобщить на большее число объектов ту или иную закономер­ность, обнаруженную при изучении их ограниченной группы в ходе какого-либо наблюдения или эксперимента. Таким образом, при помо­щи индуктивной статистики делают как1 s-то выводы и обобщения. исходя из данных, полученных при изучении выборки.

3. Наконец, измерение корреляции позволяет узнать, насколько связа­ны между собой две переменные, с тем чтобы можно было предсказы­вать возможные значения одной из них, если мы знаем другую.

Существуют две разновидности статистических методов или тестов. позволяющих делать обобщение или вычислять степень корреляции. Первая разновидность-это наиболее широко применяемые параметри­ческие методы, в которых используются такие параметры, как среднее значение или дисперсия данных. Вторая разновидность - это непарамет­рические методы, оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми выборками или с качествен­ными данными (см. документ Б.1); эти методы очень просты с точки зрения как расчетов, так и применения. Когда мы познакомимся с раз­личными способами описания данных и перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.

Как уже говорилось, для того чтобы попытаться разобраться в этих различных областях статистики, мы попробуем ответить на те вопросы, которые возникают в связи с результатами того или иного исследования. В качестве примера мы возьмем тот эксперимент, который приведен в главе 3, а именно - изучение влияния потребления марихуаны на глазодвигательную координацию и на время реакции. Методика, ис­пользуемая в этом гипотетическом эксперименте, а также результаты, которые мы могли бы в нем получить, представлены в дополнении Б.21.

При желании вы можете заменить какие-то конкретные детали этого эксперимента на другие - например, потребление марихуаны на потреб­ление алкоголя или лишение сна,—или, что еще лучше, подставить вместо этих гипотетических данных те, которые вы действительно получили в вашем собственном исследовании. В любом случае вам

' Важное примечание. В разделах, посвященных описательной и индукижной статистике, мы будем рассматривать только те данные эксперимента, коюрыс имеют отношение к зависимой переменной «поражаемые мишени». Что касается такого показателя, как время реакции, то мы обратимся к нему только в разделе о вычислении корреляции. Однако само собой разумеется, что уже с самого начала значения этого показателя надо обрабатывать так же, как и переменную «поражаемые мишени». Мы предоставляем читателю заняться этим самостоя­тельно с помощью карандаша и бумаги.

придется принять «правила нашей игры» и выполнять те расчеты, которые здесь от вас потребуются; только при этом условии до вас «дойдет» существо предмета, если это уже не случилось с вами раньшеl.

Дополнение Б.1. Некоторые основные понятия Популяция и выборка2

Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части популяции, с целью сделать выводы относительно популяции в целом. Популяция в статистике не обязательно означает какую-либо группу людей или естественное сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую совокуп­ность, будь то атомы или студенты, посещающие то или иное кафе. Выборка - это небольшое количество элементов, отобранных с по­мощью научных методов так, чтобы она была репрезентативной, т. е. отражала популяцию в целом.

Данные и их разновидности

Данные в статистике-это основные элементы, подлежащие анализу. Данными могут быть какие-то количественные результаты, свойства, присущие определенным членам популяции, место в той или иной последовательности - в общем любая информация, которая может быть классифицирована или разбита на категории с целью обработки3.

Построение распределения - это разделение первичных данных, полу­ченных на выборке, на классы или категории с целью получить обобщен­ную упорядоченную картину, позволяющую их анализировать.

Существуют три типа данных:

1. Количественные данные, получаемые при измерениях (например, данные о весе, размерах, температуре, времени, результатах тестирова­ния и т.п.). Их можно распределить по шкале с равными интервалами.

2. Порядковые данные, соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастаю­щем порядке (1-й,.... 7-й,.... 100-й,...; А, Б, В....).

1 Для того чтобы облегчить задачу, мы советуем вам снять фотокопии таблиц Б.1 и Б.2: тогда на всех этапах рассуждений и расчетов данные будут у вас перед глазами.

2 В отечественной литературе приняты термины соответственно «генераль­ная совокупность» и «выборочная совокупность».-Прим. перев.

3 Не следует смешивать «данные» с теми «значениями», которые эти данные могут принимать. Для того чтобы всегда различать их, Шатийон (Chatillon, 1977) рекомендует запомнить следующую фразу: «Данные часто принимают одни и те же значения» (так, если мы возьмем, например, шесть данных -8, 13, 10, 8, 10 и 5. то они принимают лишь четыре разных значения-5, 8, 10 и 13).

3. Качественные данные, представляющие собой какие-то свойства элементов выборки или популяции. Их нельзя измерить, и единственной их количественной оценкой служит частота встречаемости (число лиц с голубыми или с зелеными глазами, курильщиков и не курильщиков утомленных и отдохнувших, сильных и слабых и т. п.).

Из всех этих типов данных только количественные данные можно анализировать с помощью методов, в основе которых лежат пара метры (такие, например, как средняя арифметическая). Но даже к количествен­ным данным такие методы можно применить лишь в том случае, если число этих данных достаточно, чтобы проявилось нормальное распреде­ление. Итак, для использования параметрических методов в принципе необходимы три условия: данные должны быть количественными, их число должно быть достаточным, а их распределение-нормальным^ Во всех остальных случаях всегда рекомендуется использовать непара­метрические методы.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...