Распределение частот первичных оценок по тесту 9 глава
ОПРОСНИКИ УСТАНОВОК — группа опросников, предназначенных для измерения относительной ориентировки индивидуума в одномерном континууме установок. О. у. в зависимости от определенных установок могут быть представлены как опросники личностные или отнесены к опросникам-анкетам (напр., измерение установки к другим людям или установки на хранение денег в банке). Начало разработки О. у. было положено работой Л. Терстоуна и Е. Чейва «Измерение установок», опубликованной в 1929 г. (см. Терстоуна шкалы, Лайкерта шкалы.) Большинство О. у. разработано по типу терстоуновских или лайкертовских. Данные о надежности и валидности О. у. весьма скудны. В советской психологии О. у. использовались преимущественно в социально-психологических и социологических исследованиях (В. А. Ядов, 1972). ОПРОСНИКИ ФАКТОРНЫЕ — опросники личностные, основой конструирования которых является факторно-аналитический принцип. В отличие от опросников эмпирических,, в них содержатся задания, которые наиболее тесно связаны с некоторым указанным фактором (факторами). Возможен и другой вариант: в ходе разработки опросника очерчивается круг заданий, объединенных некоторым общим фактором или факторами, содержание которых может быть определено позднее. В окончательный вариант опросника входят только те задания, которые непосредственно связаны с общим фактором. Для О. ф. особое значение имеют показатели внутренней согласованности, надежности факторно-дисперсионной. Примером О. ф. являются «Шестнадцать личностных факторов» опросник, Айзенка личностные опросники. ОПРОСНИКИ ЦЕННОСТЕЙ — группа опросников личностных, предназначенных для измерения ценностных ориентации личности. Ценности формируются в процессе усвоения социального опыта и обнаруживаются в интересах, установках и других проявлениях личности. Поэтому О. ц. близки опросникам интересов, опросникам установок и опросникам мотивов.
К наиболее известным зарубежным О. ц. относятся опросник Олпорта—Вернона—Линдсея, разработанный на основе теории Э. Шпрангера, и опросник ценности специальностей Д. Супера, позволяющий получить сведения о том, насколько важна для обследуемого каждая из 45 таких ценностей специальностей, как, напр., помощь другим — для психолога, возможность продвижения по службе — для администратора и т. д. (А. Анастази, 1982). В литературе сообщается о достаточно высокой надежности и валидности этих опросников. Ценностные ориентации личности неоднократно являлись объектом исследования психологов СНГ, разработаны оригинальные методики их измерения, однако сведений об использовании зарубежных О. ц. не обнаружено. ОПРОСНИКИ ЧЕРТ ЛИЧНОСТИ — группа опросников личностных, разработанная на основе выделения черт личности. Непосредственно наблюдаемые черты личности в этом случае выступают как исходный материал для построения опросников. В отличие от конструирования опросников типологических, такой подход требует группировки личностных признаков обследуемых (В. М. Мельников, Л. Т. Ямпольский, 1985). В О. ч. л. диагностика осуществляется по степени выраженности черт. Примером О. ч. л. является «Шестнадцать личностных факторов» опросник. ОПРОСНИКИ ЭМПИРИЧЕСКИЕ — опросники личностные, основой конструирования которых является критериально-ключевой принцип. В отличие от опросников факторных, создание О. э. осуществляется путем поиска заданий, дискриминирующих контрольные группы испытуемых, подобранные на основе критерия, имеющего отношение к тестируемому поведению или свойству личности (см. Дискриминативность заданий теста). Примером О. э. является Миннесотский многоаспектный личностный опросник.
ОПРОСНИКИ-АНКЕТЫ — группа опросников, предназначенных для получения какой-либо информации, не имеющей непосредственного отношения к личностным особенностям обследуемого. Примером О.-а. является Мичиганский алкоголизма скрининг-тест, для которого характерна слабая связь полученных результатов с личностными характеристиками обследуемых (см. также Опросники биографические). О.-а. широко используются в клинической психодиагностике в качестве инструментов, определяющих наличие (отсутствие) той или иной клинической симптоматики. ОТСЕИВАНИЕ (скрининг) — психодиагностическая процедура предварительного, ориентировочного отбора испытуемых по критерию принадлежности к той или иной диагностируемой группе. Для О. могут выбираться различные критерии, напр, распределение испытуемых на группы по диагностическому признаку нормального интеллектуального развития или же отставания от нормы либо вероятного психического заболевания, наличия или отсутствия тех или иных личностных проявлений (напр., выявление лиц с повышенной конфликтностью, тревожностью и т. д.). Место О. в установлении диагноза психологического может быть показано на примере решения одной из задач анализа индивидуально-психологических характеристик познавательных функций учащихся с целью осуществления индивидуального подхода к обучению. Так, при оценке функций внимания целесообразно проведение скринингового исследования с помощью таблиц Шульте (см. Психодиагностика внимания) или корректурной пробы в сокращенной форме для предварительного разделения обследуемого контингента на две группы: с нормальной и относительно сниженной продуктивностью внимания. Затем группа лиц с низкими результатами подвергается более подробному специальному обследованию с целью выявления особенностей внимания (сосредоточения), уровня отдельных компонентов и основных причин их снижения у конкретного контингента испытуемых. Таким образом, О. чаще всего выступает как начальный, предварительный этап отбора испытуемых, нуждающихся в уточнении и конкретизации психологического диагноза.
Одной из важнейших целей О. является повышение эффективности работы психодиагностической службы за счет предварительного отбора контингентов испытуемых. Результативность О. существенно связана с методиками, применяемыми в качестве скрининговых. Основными требованиями к ним являются относительная краткость и простота применения, высокая валидность текущая (диагностическая), обеспечивающая достаточно надежную дифференциацию испытуемых по выбранному критерию. Ценным качеством скрининговых методик является возможность группового обследования (см. Тесты групповые). Требование компактности методики для О. сопряжено с необходимостью высокой дискриминативности заданий теста, однородности заданий методики. В принципе в качестве отсеивающей может быть выбрана любая психодиагностическая методика, удовлетворяющая указанным выше требованиям, однако необходимы специальная проверка (установление валидности текущей по отношению к критерию О., эмпирическое определение вероятности совпадения результатов скрининговой методики и углубленного обследования), оценка экономичности по времени и трудоемкости обследования по сравнению с другими родственными методиками, конвергентная и дискриминантная характеристики валидности конструктной по отношению к тестам, включенным в программу основного обследования. В качестве примера типичных методик, применяемых преимущественно для О., можно привести опросники скрининга невроза, используемые в целях предварительной доврачебной диагностики, а также те, которые используются для эпидемиологических обследований массового характера. К их числу относятся опросник Хёка—Хесс (К. Höck, H. Hess, 1975) или шкала жалоб (BFB). Методика включает перечень 63 соматических и психических симптомов (нарушения зрения, речи, дрожание рук, жалобы на работу сердца и органов дыхания, затрудненность контактов, различные страхи и т. д.). Ответы испытуемых интерпретируются по количественным показателям с учетом пола и возраста. Методика стандартизирована для лиц в возрасте от 16 до 60 лет. Длительность обследования 5-10 мин. Имеются три интерпретационных градации результатов: «норма», «предположительный невроз», «невроз».
Опросник для скрининга неврозов А. Кокошкаровой (1976) включает 83 вопроса, распределенных по 8 шкалам (лжи, негативных расстройств, неврастении, истерии, ипохондрии, депрессии, деперсонализации, дереализации. По суммарной оценке выделяют три категории испытуемых: «норма, «нерезко выраженные невротические или неврозоподобные тенденции», «выраженные неврозы или неврозоподобные состояния». По данным автора, совпадение клинического диагноза с соответствующим заключением на основании результатов опросника наблюдается в 88,2% случаев. В зарубежной клинической психодиагностике для скрининговых обследований лиц с депрессивными состояниями широко применяются такие методики, как шкала Гамильтона, шкала Beck— Rafaelson, шкала Montgomery—Asbesg. Наряду со стандартизированными шкалами находят распространение и разнообразные анкетные методики. В качестве примера можно привести анкету-шкалу депрессии (Inventarz-skala depressji (ISD) С. Пужински, И. Парновски, 1985). Анкета охватывает перечень из симптомов, разделенных на 8 групп: «депрессия», «заторможенность», «изменение активности», «страх», «психотизм», «нарушение жизненных ритмов», «соматизация», «невротические признаки». При разработке анкеты авторы исходили из концепции наличия в эндогенном депрессивном синдроме расстройств первичных, связанных с патогенетическими механизмами, и вторичных (неспецифических), являющихся реакцией личности на появление первичных. Имеются сведения об удовлетворительной валидности методики (по корреляции с результатами обследования больных эндогенной депрессией и данными шкалы Гамильтона). ОЦЕНКА ПОВЕДЕНИЯ ВОДИТЕЛЕЙ — проективная методика исследования личности. Предназначена для измерения детерминант в манере вождения автомобиля и разнообразных реакций водителей на различные дорожные ситуации. Разработана Ж. Аупетит в 1988 г. Испытуемым предъявляют 50 фотографий возможных городских дорожных ситуаций и просят описать свои реакции. Приводятся данные о стандартизации теста на выборке французских водителей-профессионалов в возрасте 26-62 года. Гетероагрессивные, защитные и пассивные реакции коррелировали с соответствующими личностными чертами испытуемых, сходство было достаточно сильным, чтобы сделать вывод о валидности О. п. в. Сведений об использовании в СНГ нет.
ОЦЕНКА ТИПА РАСПРЕДЕЛЕНИЯ — аналитико-статистическая процедура исследования основных характеристик эмпирического распределения (мер центральной тенденции, мер изменчивости, асимметрии, эксцесса кривой и некоторых других показателей). На практике О. т. р. предпринимают с целью проверки предположения о том, что анализируемое распределение соответствует теоретическому (подтверждение нуль-гипотезы о том, что расхождение между характеристиками эмпирического и теоретического распределений близки нулю). Вопрос такого рода нередко решается в ходе стандартизации методики и разработки шкалы (см. Оценки шкальные). Обычно в качестве теоретического распределения при сравнении с эмпирическим используется нормальное распределение, О. т. р. выступает в данном случае в форме проверки нормальности эмпирического распределения. Чтобы установить, подчиняется ли эмпирическое распределение изучаемой случайной величины нормальному закону, необходимо сопоставить известные исследователю сведения о свойствах этой величины и условиях ее изучения со свойствами функций нормального распределения (см. Нормальное распределение). Сперва проводят качественное сопоставление, а затем — с помощью специальных методов — количественное. Основой качественного сопоставления служит главное «физическое» условие появления нормального распределения, а именно, действие на изучаемую случайную величину большого числа преимущественно независимых и примерно одинаковых случайных факторов. Если это условие, по мнению исследователя, выполняется, можно ожидать, что исследуемая величина распределена нормально. Количественное сопоставление может включать ряд этапов. Первый — сравнение отдельных свойств эмпирического распределения со свойствами теоретического нормального распределения. Это касается прежде всего мер симметрии (мода, медиана и среднее арифметическое (см. Меры центральной тенденции) и эксцесса. Асимметрия (As) кривой эмпирического распределения определяется по формуле:
где —среднее арифметическое, Sx — стандартное отклонение, — среднее кубическое (), С — среднее квадратическое (). Эксцесс кривой (Ех) определяется по формуле: где Q — среднее значение четвертой степени (). Асимметрия и эксцесс нормального распределения равны нулю. Если хотя бы один из этих двух показателей проверяемого эмпирического распределения существенно отклоняется от данного значения, это означает аномальность оцениваемого распределения. Проверку статистической значимости вычисляемого показателя асимметрии можно провести на основании общего неравенства Чебышева:
где Sa — дисперсия эмпирической оценки асимметрии: ;Р- уровень значимости или вероятность (Р) ошибки первого рода — ошибочного вывода о незначимости асимметрии при наличии значимой асимметрии (Р = 0,05 или Р = 0,01). Аналогично оценивается значение эксцесса (Ех):
где Se — эмпирическая дисперсия оценки эксцесса:
Второй этап проверки эмпирического распределения состоит в построении теоретической функции распределения по эмпирическому ряду в предположении, что он подчиняется нормальному закону. Именно это предположение и обосновывается при качественном и количественном (на первом этапе) сопоставлении свойств. Вычисление теоретических значений вероятностей, соответствующих эмпирическим частотам, в общем случае осуществляется по таблицам функций распределения. В предположении нормального закона обычно пользуются таблицами функций f (z) или F (z). Вычисление вероятностей при такой процедуре производится следующим образом. Значение случайной величины хi преобразовывается в значение стандартного показателя (см. Стандартизация):
Затем по табл. 1 Приложения III для каждого zi эмпирического ряда определяются значения стандартной плотности f (z), которые затем умножаются на для перехода от стандартного к истинному эмпирическому масштабу функций распределения или значению функции распределения F (z):
Сопоставление заканчивается сравнением фактических (полученных в опыте) и теоретических (вычисленных) вероятностей. Если различия малы или отсутствуют, можно считать, что изучаемая случайная величина распределяется нормально. Для проверки нуль-гипотезы о нормальности распределения можно воспользоваться критерием 2 и другими методами (универсальный критерий Колмогорова и др.). Подтверждение нормального закона данного распределения будет означать, что полученная эмпирическая кривая не требует нормализации; распределение можно рассматривать как репрезентативное по отношению к генеральной совокупности и на его основе определить репрезентативные оценочные нормы. Если гипотеза не подтвердилась, то либо выборка мала или нерепрезентативна, либо данный тест не дает нормального распределения результатов. ОЦЕНКИ ПЕРВИЧНЫЕ («сырые» баллы) — оценки, полученные испытуемым на начальном этапе обработки результатов тестовой методики. Обычно это сведения о количестве правильно решенных задач, числе попыток при их решении, реже — о времени выполнения заданий. О. п. в большинстве опросников личностных содержат результат подсчета ответов, совпадающих с кодом («ключом») исследуемого количества или свойства. В проективных методиках «сырые» оценки могут быть получены на основании измерения объема ответа испытуемого, подсчета частоты обращения к отдельным «темам» (см. Тематический апперцепции тест), классификации ответов с подсчетом каждого из выделяемых типов (см. Розенцвейга рисуночной фрустрации методика) и т. д. В определенной группе методик (функциональные пробы, методики с качественным анализом и интерпретацией результата) О. п. являются окончательными результатами, на основании которых осуществляют интерпретацию данных и формулируют заключение. В большинстве психодиагностических тестов (психометрические методики, шкалированные личностные опросники) О. п. на основании норм и данных стандартизации теста переводятся в оценки шкальные, отражающие в той или иной форме отношение полученного результата к показателям выборки стандартизации. Получение О. п. — обычно формализованная процедура с четкой регламентацией правил оценки результатов выполнения заданий. При этом легче всего задача формализации О. п. решается в случае применения задач закрытого типа. Чем больше число возможных вариантов (или их комбинаций) допускается условиями задания, тем сложнее регламентация оценки. Особенно сильно эта закономерность проявляется при оценке задач открытого типа. Даже в типичных психометрических процедурах часто возникают определенные сложности выставления О. п. Так, напр., в субтесте KL Амтхауэра интеллекта структуры теста требуется объединить два предложенных объекта общим понятием. Результат каждого задания оценивают одним, двумя или нулем баллов в зависимости от уровня обобщения признаков в понятии. Задача такой оценки сложна и требует от экспериментатора определенного опыта. Составитель методики предлагает таблицу приблизительных ответов с соответствующими оценками.
Таблица 18 Приблизительное оценивание результата выполнения субтеста KL методики Р. Амтхауэра в зависимости от степени обобщения признаков
Как видно из табл. 18, критерии разделения на «сильные» и «слабые» понятия условны и недостаточно конкретизированы. Наглядно проступает необходимость тщательной проработки системы оценивания для задач такого типа. При подсчете количества правильных решений или совпадений с ключом повсеместно используются шаблоны. Технические ошибки в «ключе», возникающие при дублировании и размножении методик, являются одной из распространенных причин появления ошибочных результатов. Точность подсчета О. п. в значительной мере обеспечивается рациональным оформлением и организацией бланка обследования. ОЦЕНКИ ПРОФИЛЬНЫЕ — способ представления количественных результатов психодиагностической методики. При таком способе оценки по отдельным группам заданий, субтестам тестовой батареи с помощью специальных приемов приводятся к соизмеримым единицам (единой шкале оценок) (см. Стандартизация, Оценки шкальные) и отображаются на общем графике. Соизмеримость оценок тестов, результаты которых выносятся на «профиль», достигается с помощью выравнивающих коэффициентов (см. Шмишека опросник), унификации оценок первичных, преобразования стандартизированных оценок в шкалу с едиными значениями М и s. Наряду с наглядностью представления количественных данных с помощью «профиля» обеспечивается также возможность качественного анализа и интерпретации результатов тестовой батареи, изучения структуры суммарного тестового результата (см. IQ-показатель стандартный). Впервые О. п. были применены в Россолимо психологических профилях. Объединение количественных результатов различных субтестов в этой методике основывалось на том, что оценка каждого теста соответствовала числу удач или неудач при его десятикратном повторении. О. п. наиболее распространены в тестах интеллекта, состоящих из комплекса субтестов (см. Амтхауэра интеллекта структуры тест (см. рис. 4), Векслера интеллекта измерения шкалы (рис. 14) и др.). Особое значение О. п. имеют и в многошкальных опросниках личностных. Представление результатов в виде О. п. часто объединяется с процедурой кодирования оценок тестовых. Примеры О. п. приведены на рис. 49, рис. 41, 42 к статье Миннесотский многоаспектный личностный опросник, рис. 40 к статье Мейли интеллекта аналитический тест. Рис. 49. Образец «профиля» оценок Мейли интеллекта аналитического теста ОЦЕНКИ ШКАЛЬНЫЕ — способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (оценки первичные испытуемых) сравниваются с данными в сопоставимой нормативной группе (напр., результат, достигнутый учеником, сравнивается с показателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопоставляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах). О. ш. в этом смысле имеют четко определенное количественное содержание и могут быть использованы при статистическом анализе. Одной из распространенных в психологической диагностике форм оценки результата теста путем соотнесения с групповыми данными является расчет процентилей. Процентиль -процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. Корреляция ранговая) при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль (P50) соответствует медиане (см. Меры центральной тенденции) распределения результатов, Р>50 и Р<50 соответственно представляют ранги результатов выше и ниже среднего уровня результата. Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. Оценки первичные). Ранги Р1 и Р100 получают соответственно самый низкий и самый высокий результаты из наблюдавшихся в выборке, однако этим рангам могут соответствовать и далеко не нулевой (ни одного правильного решения) или абсолютный (все решения правильны) показатели (например, при общем количестве 120 заданий минимальный результат, соответствующий первому рангу, может составить 6 правильных решений, в то время как максимальный результат, соответствующий рангу Р100, будет составлять 95 правильно решенных заданий). Такая ситуация наблюдается, напр., при оценке тестов скорости. Основной недостаток процентильных шкал состоит в неравномерности единиц измерения. При нормальном распределении отдельные переменные тесно группируются в центре распределения и по мере удаления к краям рассеиваются. Поэтому равным частотам случаев вблизи центра соответствуют более короткие интервалы по оси абсцисс, расположенные по краям распределения оценок. Процентили показывают относительное положение каждого испытуемого в нормальной выборке, но не величину различий между результатами. Это создает некоторые неудобства в интерпретации индивидуальных результатов. Так, разница в первичных показателях, соответствующая интервалу Р70 - P80, может составить 10 баллов, а различие в количестве правильных решений в интервале рангов P50 – P60 — лишь 1-3 балла. Вместе с тем процентильные оценки обладают и рядом достоинств. Они легко доступны пониманию пользователей психодиагностической информацией, универсальны по отношению к различным типам методик и легко рассчитываются. Процентильные оценки не относятся к типичным шкальным показателям. Более широкое распространение в психодиагностике получили стандартные показатели, рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится z-преобразование оценок (см. Стандартизация, Нормальное распределение). Чтобы определить z-стандартный показатель, определяют разность между индивидуальным первичным результатом и средним значением для нормальной группы, а затем делят эту разность на σ нормативной выборки. Полученная таким образом шкала z (рис. 50) имеет среднюю точку М = 0, отрицательные значения обозначают результаты ниже среднего и убывают по мере удаления от нулевой точки; положительные значения обозначают соответственно результаты выше среднего. Единица измерения (масштаб) в шкале z равна 1σ стандартного (единичного) нормального распределения.
Рис. 50. Нормальная кривая, процентные и стандартные оценки Для преобразования полученного при стандартизации распределения первичных нормативных результатов в стандартную z-шкалу необходимо исследовать вопрос о характере эмпирического распределения и степени его согласованности с нормальным (см. Оценка типа распределения). Поскольку для большинства случаев значения показателей в распределении умещаются в пределах , единицы измерения простой z-шкалы слишком велики. Для удобства оценивания применяется еще одно преобразование типа . Примером такой шкалы могут а быть оценки тестовой батареи SAT (СЕЕВ) методики для оценки способности к обучению (см. Тесты достижений). Эта z-шкала пересчитана таким образом, что средней точке соответствует значение 500, а = 100 (рис. 50). Другим аналогичным примером является шкала Векслера для отдельных субтестов (см. Векслера интеллекта измерения шкала, где М= 10, = 3. Наряду с определением места индивидуального результата в стандартном распределении групповых данных введение О. ш. направлено и на достижение другой важнейшей цели — обеспечение сопоставимости количественных результатов различных тестов, выраженных в стандартных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе. В случае, если оба распределения оценок в сравниваемых методиках близки к нормальному, вопрос о сопоставимости оценок решается довольно просто (в любом нормальном распределении интервалам М ± n σ соответствует одинаковая частота случаев). Для обеспечения сопоставимости результатов, принадлежащих к распределениям другой формы, применяются нелинейные преобразования, позволяющие придать распределению форму заданной теоретической кривой. В качестве такой кривой обычно используется нормальное распределение. Как и в простом 2-преобразовании, нормализованным стандартным показателям можно придать любую желаемую форму. К примеру, умножив такой нормализованный стандартный показатель на 10 и прибавив константу 50, получаем Т-показатель (см. Стандартизация, Миннесотский многоаспектный личностный опросник). Примером нелинейно преобразованной в стандартную шкалу является и шкала станайнов (англ, standart nine — стандартная девятка), где оценки принимают значения от 1 до 9, М = 5, ≈2. Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показателей и простоту процентилей. Первичные показатели легко преобразуются в станайны. Для этого испытуемых ранжируют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным частотам оценок в нормальном распределении тестовых результатов (табл. 19). При трансформации оценок в шкалу стэнов (от англ, standart ten — стандартная десятка) проводится аналогичная процедура с той лишь разницей, что в основании этой шкалы лежат десять стандартных интервалов.
Таблица 19
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|