Главная | Обратная связь | Поможем написать вашу работу!

Надежность. Виды надежности.

Надежность – согласованность результатов тестирования испытуемых в разные моменты времени, при первичном и вторичном тестировании и с использованием разных по эквивалентности, по содержанию заданий.

Измерение считаются надежным, если его результат повторяется при повторных измерениях. Хороший пример надежного измерения – измерение времени реакции: человек при первой попытке реагирующий на сигнал через 0,18 с, в следующих попытках обычно дает результаты, близкие к этому, и условно истинным мы считаем среднее из получившихся близких значений.

Надежность – это функция от количества ошибок измерения.

Ошибки есть всегда, и зависят они, в частности, от качества измерительного инструмента: чем более изменчивы результаты от измерения к измерению, тем менее надежен инструмент. Например, резиновая линейка будет явно менее надежной, чем стальная, поскольку по понятным причинам измерения с ее помощью будут давать большой разброс.

Уверенность в надежности измерений в большинстве случаев вырабатывается со временем в результате их повторения, формальное же вычисление надежности обычно применяется к тестам на стадии их стандартизации.

Средства повышения надежности: единообразие процедуры обследования, его строгая регламентация: одинаковые для обследуемой выборки испытуемых обстановка, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с испытуемыми, порядок предъявления заданий.

Основной математико-статистический прием, с помощью которого устанавливается надежность методики – это корреляции (по Пирсону или Спирмену). Надежность тем выше, чем ближе полученный коэффициент корреляции подходит к единице.

Виды надежности. Надежность как

· Устойчивость;

· надёжность как внутреннюю согласованность.

Надёжность как устойчивость

Устойчивость результатов теста или ретестовая надежность — возможность получения одинаковых результатов у испытуемых в различных случаях. Устойчивость определяется с помощью повторного тестирования (ретеста):

В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0.76. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Ещё один недостаток повторного тестирования — это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.

В связи с выше сказанным применяется исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. При этом испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.

Надёжность как внутренняя согласованность

Внутренняя согласованность определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.

Для проверки внутренней согласованности применяются:

1. Метод расщепления или метод автономных частей

2. Метод эквивалентных бланков

3. Альфа Кронбаха

Метод расщепления (Split-half reliability)

Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.

Метод эквивалентных бланков

МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине) Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.

Метод альфа Кронбаха

В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же общего основания. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.

Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 131415 Следующая

Воспользуйтесь поиском по сайту: