Главная | Обратная связь | Поможем написать вашу работу!

Внутренняя согласованность.

В.2. В руководстве должны быть представлены данные о внутренней согласованности (гомогенности, консистентности тест). (Очень желательно.)

Комментарий. Внутренняя согласованность важна, если задания рассматриваются как выборка из относительно однородного общего множества (например, тест сложения целых чисел, словарный тест для средней школы, тест, предположительно измеряющий интро-версию и т. п.). Меры внутренней согласованности не заменяют иных мер.

B.2.1. Оценки внутренней согласованности определяются соответствующими методами расщепления пополам, при помощи коэффициента альфа или других процедур, которые должны быть адекватны анализируемым данным. Любая другая мера внутренней согласованности, которую автор дополнительно сообщает, в руководстве к тесту должна быть подробно объяснена. (Очень желательно.)

Комментарий. Коэффициенты парного расщепления отражают суждения экспертов и обнаруживают тенденцию быть выше, чем коэффициенты случайного расщепления. Дисперсионный анализ обычно дает более низкие оценки по сравнению с приемами парного расщепления. Могут быть полезными специальные коэффициенты: они должны быть описаны так, чтобы читатель мог понять их соотношение с общепризнанными оценками.

B.2.2. Оценки внутренней согласованности не следует вычислять для скоростных тестов. (Существенно.)

B.2.3. Если тест состоит из отдельно оцениваемых частей или разделов, в руководстве к тесту следует сообщить корреляцию между частями или разделами вместе с соответствующими оценками надежности, а также с соответствующими средними и стандартными отклонениями. (Очень желательно.)

В.2.3.1. Если в руководстве сообщается корреляция между баллом по отдельному субтесту и общим тестовым баллом, необходимо подчеркнуть, что коэффициент неоправданно высок, так как он основан на совпадении ошибок измерения субтестом и общим тестовым баллом. (Существенно.)

В.2.4. Если несколько вопросов внутри теста экспериментально связаны так, что ответ на один вопрос влияет на другой вопрос, предпочтительно относить целую группу вопросов к одной из двух половин теста, когда применяются методы случайного или парного распределения пополам. Тот факт, что число заданий в этих половинах не равно, не вызывает затруднений при соответствующей процедуре анализа. (Очень желательно.)

Ретестирование.

В.З. В руководстве к тесту должны быть представлены результаты ретестирования, т. е. пользователь должен знать, насколько оценки стабильны. (Существенно.)

Комментарий. Ретестовая надежность показывает, в какой степени результаты теста можно распространить на различные случаи его применения. Приводя в руководстве ретестовую надежность, всегда необходимо указывать, в каком интервале времени она измерялась и какие влияния на испытуемых имели место в этот период. На практике ретестовая надежность в ряде случаев бывает важнее, чем надежность по однородности. Если нет ретестовой надежности, тест не может быть валидным. Исключение составляют тесты, для которых ретестирование не применяется (тесты оценки состояний, эмоций).

Считается обоснованным требовать оценивания стабильности для проективных техник и других средств оценки личности, даже если в некоторых случаях известно, что низкая стабильность ретестирования за существенный период отражает только истинное изменение свойства. Клиническая практика редко допускает, что выводы из проективных тестов приложимы к дню исследования. Реально считается, что на основе тестовых данных принимаются прагматические решения, имеющие смысл в течение как минимум нескольких дней, а обычно — недель или месяцев терапии. Если обнаруживается, что результаты некоторого теста очень нестабильны при интервале в несколько дней, это свидетельство вызывает сомнения в пригодности теста для большинства целей, даже если эта изменчивость может быть объяснена гипотезой об изменчивости свойства. Исследователь может столкнуться с психологической характеристикой или результатом обучения, который за короткое время изменяется. В этом случае важно не смешивать неустойчивость свойства с нестабильностью измерения.

B.2.1. При определении стабильности баллов повторным тестированием целесообразно использовать параллельные формы теста, чтобы свести к минимуму припоминание отдельных ответов, особенно при небольшом интервале между тестированиями. (Очень желательно.)

B.3.2. При описании исследования согласованности баллов во времени в руководстве к тесту необходимо указать, какой промежуток времени прошел между тестированиями, и привести средние стандартные отклонения баллов для каждого тестирования, а также коэффициент корреляции. (Существенно.)

B.3.3. Если есть основание ожидать, что тестовые баллы за некоторый период существенно изменяются в соответствии с образовательными или развивающими воздействиями, в руководстве следует предупредить пользователей об этой возможности. (Очень желательно.)

В.3.4. При сообщении о стабильности тестовых баллов в руководстве к тесту необходимо описать накопление соответствующего опыта, обучение или лечение испытуемого за период между тестированиями. (Существенно.)

Сравнимость форм.

В.4. Если опубликованы две формы теста, предназначенные для возможного применения к тем же испытуемым, в руководстве к тесту должны быть сообщены средние и дисперсии двух форм вместе с коэффициентами корреляции двух совокупностей баллов. Если в руководстве не представлены необходимые данные, пользователь должен быть об этом предупрежден. (Существенно.)

Комментарий. Для каждой формы следует представить обзор таких характеристик заданий, как частотные распределения показателей трудности и дискриминативности заданий. Следует представить также содержательный анализ каждой формы. Следовательно, необходимо отразить как частотные распределения статистических характеристик заданий, так и таблицы заданий по группам их содержания, характеристик поведения и учебных целей.

Формы должны включать различные выборки заданий из каждой категории содержания. Искусственно близкое сходство между формами может быть вызвано совпадением заданий или разработкой второй формы простой перефразировкой заданий первой формы. Коэффициент надежности будет чрезмерно высоким, т. к. не учитывается ошибка выборки из общего множества заданий.

⇐ Предыдущая 24 25 26 27 282930 31 32 33 Следующая ⇒

Воспользуйтесь поиском по сайту: