Распределение частот первичных оценок по тесту
А. Вычислить - для каждой первичной оценки. Если частоты крайних оценок слишком малы, то можно их объединить, в дальнейшем совершая расчеты для объединенных оценок. Б. Вычислить ( - )2. В. Вычислить . Г. Проверить тип распределения, рассчитав критерий c2: c2 = ∑ . 5. Оценить тип распределения, сравнив критическое (табличное) и эмпирическое значения c2. А. Определить число степеней свободы исходя из свойств нормального распределения df = k – 3. (В результате объединения частот в крайних классах число классов может сократиться). Б. По таблице критических значений c2 (см. приложение 3) найти c2крит для α = 0,05 и соответствующей степени свободы.
Анализ результатов и выводы
Сравнить эмпирическое и критическое значения c2 и сделать выводы о соответствии эмпирического распределения теоретическому. Если c2 > c2крит, то эмпирическое распределение отличается от нормального, так как расхождения между ним и теоретическим статистически значимы. Если c2 < c2крит, то распределение тестовых оценок идет по нормальному закону, расхождения между теоретическим и эмпирическим распределениями случайны и несущественны.
НАДЕЖНОСТЬ ТЕСТА
В традиционной тестологии термин «надежность» представляет собой характеристику теста, заключающуюся в способности ее частей согласованно дифференцировать испытуемых, а также в способности теста дифференцировать испытуемых устойчиво во времени. От надежности методики зависит точность производимых с ее помощью измерений.
Надежность методик зависит от многих причин, снижающих согласованность отдельных частей теста и способность теста противостоять изменяющимся во времени факторам, влияющим на результаты измерения. Поэтому важной проблемой практической диагностики является выяснение факторов, снижающих точность измерений. Многие авторы пытались составить классификацию таких факторов. Среди них наиболее часто называются следующие: 1) нестабильность диагностируемого свойства; 2) несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечетко сформулированы указания, как методику предъявлять испытуемым и т. д.); 3) меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т. п.); 4) различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т. д.); 5) колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом – утомление и т. д.); 6) элементы субъективности в способах оценки и интерпретации результатов (когда ведется протоколирование ответов испытуемых, оцениваются ответы по степени полноты, оригинальности и т. п.). Если все эти факторы иметь в виду и постараться в каждом из них устранить условия, снижающие точность измерений, то можно добиться приемлемого уровня надежности теста. Одним из важнейших средств повышения надежности психодиагностической методики является единообразие процедуры обследования, его строгая регламентация: одинаковые для обследуемой выборки испытуемых обстановка и условия работы, однотипный характер инструкций, одинаковые для всех временные ограничения, способы и особенности контакта с испытуемыми, порядок предъявления заданий и т. д.
В психометрике принято выделять три вида надежности. 1. Надежность-согласованность (одномоментная или синхронная надежность). Точность и объективность любого психологического измерения зависит, прежде всего, от того, насколько правильно подобраны задания с точки зрения их взаимосогласованности, насколько она однородна. Внутренняя однородность методики показывает, что ее задания актуализируют одно и то же свойство, один и тот же признак. Для проверки надежности измерительного инструмента (она еще называется одномоментной или синхронной надежностью) используется так называемый метод «расщепления». Обычно тест делится на две части путем отнесения четных пунктов к одной части и нечетных пунктов к другой части. По каждой половине теста производится обработка ответов испытуемых и для каждого испытуемого подсчитываются два суммарных балла – по четной и нечетной половине теста. Затем результаты двух полученных рядов коррелируются между собой. Для применения этого способа нужно поставить испытуемых в такие условия, чтобы они смогли успеть решить (или попытаться решить) все задания. Если задания теста однородны, то большой разницы в успешности решения по таким половинкам не будет и коэффициент корреляции будет достаточно высоким. Расщепление теста на две части может осуществляться и другими способами. Тогда каждый раз будут получаться несколько отличающиеся друг от друга коэффициенты корреляции. В связи с этим используется расщепление теста на столько частей, сколько в нем пунктов. При оценке одномоментной надежности теста следует учесть, что она также зависит от социально-психологической однородности той выборки, на которой осуществляется ее проверка. В заданиях могут содержаться понятия, малоизвестные одной части испытуемых, но хорошо известные другой части. Задания с такими понятиями могут неравномерно распределиться по четной и нечетной половинам теста, в результате чего и может быть искажена величина коэффициента надежности.
2. Надежность-устойчивость или диахронная, ретестовая надежность. Надежность-устойчивостьхарактеризует способность теста противостоять искажающему действию факторов, изменяющихся во времени. Для проверки надежности-устойчивости используется прием, известный под названием тест-ретест. Он заключается в повторном обследовании испытуемых с помощью той же методики. О ретестовой надежности судят по коэффициенту корреляции между результатами первого и повторного обследований. Он будет свидетельствовать о сохранении или не сохранении каждым испытуемым своего порядкового места в выборке. Показатель ретестовой надежности во многом зависит от устойчивости, стабильности измеряемого признака. Было бы методологической ошибкой рассчитывать на абсолютную стабильность психологических признаков. В том, что измеряемый признак со временем меняется, нет ничего опасного для надежности. Все дело в том, в каких пределах варьируются результаты от опыта к опыту у одного и того же испытуемого, не приводят ли эти колебания к тому, что испытуемый по непонятным причинам оказывается то в начале, то в середине, то в конце выборки. Тогда сделать какие-то конкретные выводы об уровне представленности измеряемого признака у такого испытуемого нельзя. При определении ретестовой надежности важна длительность промежутка времени между первым и вторым обследованиями, так как результаты второго обследования также зависят и от изменчивости во времени самого измеряемого свойства. Чем короче срок от первого до второго испытания, тем больше шансов, что диагностируемый признак сохранит уровень первого испытания. Следовательно, повторное тестирование целесообразно проводить через короткий срок после первого. Однако если срок между первым и вторым обследованием небольшой, то некоторые испытуемые могут просто воспроизвести свои прежние ответы по памяти, не выполняя задания теста. В этом случае результаты двух предъявлений методики уже нельзя рассматривать как независимые.
Оптимальный срок для повторного обследования определяется исходя из психологической сущности методики, условий, в которых она проводится, особенности выборки испытуемых. В литературе рекомендуется проводить второе обследование через две недели после первого. Также часто называются временные интервалы в несколько месяцев, но не более полугода. При обследовании детей младшего возраста, когда возрастные изменения происходят очень быстро, эти интервалы могут быть равны нескольким неделям[13]. 3. Константность. К. М. Гуревич, проведя тщательный анализ зарубежной литературы по проблеме надежности, предложил толковать надежность в трех смыслах: 1) надежность самого измерительного инструмента; 2) стабильность изучаемого признака; 3) константность, т. е. относительная независимость результатов от личности экспериментатора[14]. Одним из факторов, влияющих на результаты психологического измерения, является сам психодиагност. Поэтому важно знать, в какой мере результаты теста поддаются влиянию личности экспериментатора. Диагностическая методика всегда снабжается подробными инструкциями по ее применению, правилами и примерами, указывающими, как проводить измерение, но регламентировать манеру поведения экспериментатора, скорость его речи, тон голоса, паузы, выражение лица и т. п. очень трудно. К тому же психодиагност может допускать небрежность или действовать точно в соответствии с требованиями процедуры, проявлять требовательность или бесконтрольность и т. п., что находит отражение в соответствующем отношении испытуемого к обследованию. Личность психодиагноста особенно существенную роль играет при проведении так называемых нестандартизированных (например, проективных) тестов. Коэффициент константности определяется путем вычисления коэффициента корреляции как меры тесноты связи между результатами двух обследований, проведенных в относительно одинаковых условиях на одной и той же выборке испытуемых, но разными диагностами.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|