Главная | Обратная связь | Поможем написать вашу работу!
МегаЛекции

Внутренняя согласованность.




В.2. В руководстве должны быть пред­ставлены данные о внутренней согласо­ванности (гомогенности, консистентности тест). (Очень желательно.)

Комментарий. Внутренняя со­гласованность важна, если задания рас­сматриваются как выборка из относи­тельно однородного общего множества (например, тест сложения целых чисел, словарный тест для средней школы, тест, предположительно измеряющий интро-версию и т. п.). Меры внутренней согла­сованности не заменяют иных мер.

B.2.1. Оценки внутренней согласован­ности определяются соответствующими методами расщепления пополам, при по­мощи коэффициента альфа или других процедур, которые должны быть адекват­ны анализируемым данным. Любая другая мера внутренней согласованности, кото­рую автор дополнительно сообщает, в ру­ководстве к тесту должна быть подробно объяснена. (Очень желательно.)

Комментарий. Коэффициенты парного расщепления отражают суждения экспертов и обнаруживают тенденцию быть выше, чем коэффициенты случайно­го расщепления. Дисперсионный анализ обычно дает более низкие оценки по срав­нению с приемами парного расщепления. Могут быть полезными специальные ко­эффициенты: они должны быть описаны так, чтобы читатель мог понять их соотно­шение с общепризнанными оценками.

B.2.2. Оценки внутренней согласован­ности не следует вычислять для скорост­ных тестов. (Существенно.)

B.2.3. Если тест состоит из отдельно оцениваемых частей или разделов, в ру­ководстве к тесту следует сообщить кор­реляцию между частями или разделами вместе с соответствующими оценками надежности, а также с соответствующими средними и стандартными отклонениями. (Очень желательно.)

В.2.3.1. Если в руководстве сообщает­ся корреляция между баллом по отдельно­му субтесту и общим тестовым баллом, необходимо подчеркнуть, что коэффици­ент неоправданно высок, так как он ос­нован на совпадении ошибок измерения субтестом и общим тестовым баллом. (Существенно.)

В.2.4. Если несколько вопросов внут­ри теста экспериментально связаны так, что ответ на один вопрос влияет на другой вопрос, предпочтительно относить целую группу вопросов к одной из двух половин теста, когда применяются методы случай­ного или парного распределения пополам. Тот факт, что число заданий в этих поло­винах не равно, не вызывает затруднений при соответствующей процедуре анализа. (Очень желательно.)

Ретестирование.

В.З. В руководстве к тесту должны быть представлены результаты ретестирования, т. е. пользователь должен знать, насколько оценки стабильны. (Сущест­венно.)

Комментарий. Ретестовая на­дежность показывает, в какой степени ре­зультаты теста можно распространить на различные случаи его применения. Приво­дя в руководстве ретестовую надежность, всегда необходимо указывать, в каком ин­тервале времени она измерялась и какие влияния на испытуемых имели место в этот период. На практике ретестовая на­дежность в ряде случаев бывает важнее, чем надежность по однородности. Если нет ретестовой надежности, тест не может быть валидным. Исключение составляют тесты, для которых ретестирование не применяется (тесты оценки состояний, эмоций).

Считается обоснованным требовать оценивания стабильности для проектив­ных техник и других средств оценки лич­ности, даже если в некоторых случаях известно, что низкая стабильность ретестирования за существенный период отражает только истинное изменение свойства. Клиническая практика редко до­пускает, что выводы из проективных тес­тов приложимы к дню исследования. Ре­ально считается, что на основе тестовых данных принимаются прагматические ре­шения, имеющие смысл в течение как минимум нескольких дней, а обычно — недель или месяцев терапии. Если обнару­живается, что результаты некоторого те­ста очень нестабильны при интервале в не­сколько дней, это свидетельство вызывает сомнения в пригодности теста для боль­шинства целей, даже если эта изменчи­вость может быть объяснена гипотезой об изменчивости свойства. Исследователь может столкнуться с психологической ха­рактеристикой или результатом обучения, который за короткое время изменяется. В этом случае важно не смешивать неус­тойчивость свойства с нестабильностью измерения.

B.2.1. При определении стабильности баллов повторным тестированием целесо­образно использовать параллельные фор­мы теста, чтобы свести к минимуму при­поминание отдельных ответов, особенно при небольшом интервале между тестиро­ваниями. (Очень желательно.)

B.3.2. При описании исследования согласованности баллов во времени в ру­ководстве к тесту необходимо указать, ка­кой промежуток времени прошел между тестированиями, и привести средние стан­дартные отклонения баллов для каждого тестирования, а также коэффициент кор­реляции. (Существенно.)

B.3.3. Если есть основание ожидать, что тестовые баллы за некоторый период существенно изменяются в соответствии с образовательными или развивающими воздействиями, в руководстве следует предупредить пользователей об этой воз­можности. (Очень желательно.)

В.3.4. При сообщении о стабильности тестовых баллов в руководстве к тесту необходимо описать накопление соответ­ствующего опыта, обучение или лечение испытуемого за период между тестированиями. (Существенно.)

Сравнимость форм.

В.4. Если опубликованы две формы те­ста, предназначенные для возможного применения к тем же испытуемым, в ру­ководстве к тесту должны быть сообщены средние и дисперсии двух форм вместе с коэффициентами корреляции двух сово­купностей баллов. Если в руководстве не представлены необходимые данные, пользователь должен быть об этом предуп­режден. (Существенно.)

Комментарий. Для каждой фор­мы следует представить обзор таких ха­рактеристик заданий, как частотные рас­пределения показателей трудности и дискриминативности заданий. Следует пред­ставить также содержательный анализ каждой формы. Следовательно, необходи­мо отразить как частотные распределения статистических характеристик заданий, так и таблицы заданий по группам их содержания, характеристик поведения и учебных целей.

Формы должны включать различные выборки заданий из каждой категории со­держания. Искусственно близкое сход­ство между формами может быть вызва­но совпадением заданий или разработкой второй формы простой перефразировкой заданий первой формы. Коэффициент на­дежности будет чрезмерно высоким, т. к. не учитывается ошибка выборки из обще­го множества заданий.

Поделиться:





Воспользуйтесь поиском по сайту:



©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...