Психометрические основы психодиагностики.
Диагностические методики обычно называют измерительными инструментами, а психологическую диагностику – психометрией. Психометрия – область психологической диагностики, связанная с теорией и практикой измерений в психологии. В основе измерения лежит операция сравнения. Особенности психологического измерения позволяют выделить три его вида и четыре уровня. Виды измерения 1. Нормативное измерение определяется сравнением тестового показателя развития свойства испытуемого со среднегрупповым уровнем. 2. Критериальное измерение основано на прямой оценке качества выполнения теста испытуемым без сравнения с другими испытуемыми в соответствии с определенным объективным уровнем (критерием) развития качества (объективный критерий: выполнение функции). 3. Ипсативное измерение нацелено на оценку внутрииндивидуальных соотношений и не связано с изучением межиндивидуальных различий (сравнение показателя теста в различных ситуациях с показателем в нормальном состоянии: пульс после нагрузки — пульс в покое для данного субъекта). Уровни изменения будут показаны в курсе математической статистики для психологов. Прежде чем психодиагностические методики могут быть использованы для практических целей, они должны пройти проверку по ряду формальных критериев, доказывающих их высокое качество и эффективность.
К числу основных критериев оценки психодиагностических методов относятся надежность и валидность. Под «надежностью» понимается относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Но степень надежности зависит от многих причин.
Какие же факторы снижают точность измерений? К ним относятся: 1. Нестабильность диагностируемого свойства. 2. Несовершенство диагностических методик. 3. Меняющаяся ситуация обследования. 4. Различия в манере поведения экспериментатора. 5. Колебания в функциональном состоянии испытуемого. 6. Элементы субъективности в способах оценки и интерпретации результатов. К. М. Гуревич предложил толковать надежность в трех смыслах: 1. Надежность самого измерительного инструмента. 2. Стабильность изучаемого признака. 3. Константность, т. е. относительная независимость результатов от личности экспериментатора. На практике наиболее широко применяются 6 типов надежности: a. Ретестовая надежность (тест-ретест надежность); b. Надежность параллельных форм; c. Надежность частей теста (надежность как гомогенность тестов); d. Надежность по Кудеру-Ричардсону; e. Надежность интерпретатора («оценщика»); f. Стандартная ошибка измерений. Определение коэффициентов надежности в первых двух случаях вычисляется по формулам расчетов коэффициентов корреляции (в зависимости от шкалы, в которой измерены данные) между первым и последующими измерениями или между параллельными формами теста. Расчет коэффициента надежности при исследовании гомогенности теста осуществляется путем разбиения теста на равные субтесты и расчета корреляции между этими частями. Надежность частей теста может также рассчитываться по формуле Кудера-Ричардсона. При работе с клиническими опросниками, тестами креативности и проективными технологиями надежность методик определяется путем сравнения интерпретаций результатов двумя или более экспертами-психологами. Высокие корреляции между ними показывают надежность тестовой оценки. Вторым после надежности ключевым критерием качества методики является валидность. Но вопрос о валидности методики решается лишь после того, как установлена ее надежность.
Валидность теста - понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает» (А. Анастази) Зарубежные специалисты выделяют четыре типа показателей валидности: 1. Критерий исполнения (в т.ч.: количество выполненных работ, успеваемость, время, затраченное на обучение, темп роста квалификации и т.п.). 2. Субъективные критерии (они включают различные виды ответов, которые отражают отношение человека к чему-либо или к кому-либо, его мнения, взгляды, предпочтения, субъективные критерии получают с помощью интервью, вопросников, анкет). 3. Физиологические критерии (они используются при изучении влияния окружающей среды и других ситуационных переменных на организм и психику человека). 4. Критерий случайностей (применяется, когда цель исследования касается, например, проблемы отбора для работы таких лиц, которые менее подвержены несчастным случаям).
Валидность по своей сути — это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность. По этой причине не существует какого-то единого универсального подхода к определению валидности. В зависимости от того, какую сторону валидности хочет рассмотреть исследователь, используются и разные способы доказательства. Другими словами, понятие валидности включает в себя разные ее виды, имеющие свой особый смысл. Проверка валидности методики называется валидизацией. Валидность в первом ее понимании имеет отношение к самой методике, т. е. это валидность измерительного инструмента. Такая проверка называется теоретической валидизацией. Валидность во втором понимании уже относится не столько к методике, сколько к цели ее использования. Это прагматическая валидизация. Обобщая, можно сказать следующее: o при теоретической валидизации исследователя интересует само свойство, измеряемое методикой. Это, по существу, означает, что проводится собственно психологическая валидизация; o при прагматической валидизации суть предмета измерения (психологического свойства) оказывается вне поля зрения. Главный акцент сделан на то, чтобы доказать, что «нечто», измеряемое методикой, имеет связь с определенными областями практики.
Таким образом, провести теоретическую валидизацию методики — это доказать, что методика измеряет именно то свойство, качество, которое она по замыслу исследователя должна измерять. Так, например, если какой-то тест разрабатывался для того, чтобы диагностировать умственное развитие детей, надо проанализировать, действительно ли он измеряет именно это развитие, а не какие-то другие особенности (например, личность, характер и т. п.). Следовательно, для теоретической валидизации кардинальной проблемой является отношение между психологическими явлениями и их показателями, посредством которых эти психологические явления пытаются познать. Такая проверка показывает, насколько замысел автора и результаты методики совпадают. Не столь сложно провести теоретическую валидизацию новой методики, если для измерения данного свойства уже имеется методика с доказанной валидностью. Наличие корреляции между новой и аналогичной, уже проверенной методикой указывает на то, что разработанная методика измеряет то же психологическое качество, что и эталонная. И если новый метод одновременно оказывается более компактным и экономичным в проведении и обработке результатов, то психодиагносты получают возможность использовать новый инструмент вместо старого. Такой прием особенно часто применяется в дифференциальной психофизиологии при создании методик диагностики основных свойств нервной системы человека. Что касается прагматической валидизации, то она подразумевает проверку методики с точки зрения ее практической эффективности, значимости, полезности, поскольку диагностической методикой имеет смысл пользоваться только тогда, когда доказано, что измеряемое свойство проявляется в определенных жизненных ситуациях, в определенных видах деятельности. Ей придают большое значение особенно там, где встает вопрос отбора.
Если обратиться к истории развития тестологии, то можно выделить такой период (20-30-е гг.), когда научное содержание тестов и их теоретический «багаж» интересовали в меньшей степени. Важно было, чтобы тест работал, помогал быстро отбирать наиболее подготовленных людей. Эмпирический критерий оценки тестовых заданий считался единственно верным ориентиром в решении научных и прикладных задач. Использование диагностических методик с чисто эмпирическим обоснованием, без отчетливой теоретической базы нередко приводило к псевдонаучным выводам, к неоправданным практическим рекомендациям. Нельзя было точно назвать те особенности, качества, которые тесты выявляли. Б. М. Теплов, анализируя тесты того периода, назвал их «слепыми пробами». Остановимся в общих чертах на том, как проверяется прагматическая валидность: выбирается какой-нибудь независимый от методики внешний критерий, определяющий успех в той или иной деятельности (учебной, профессиональной и т.п.), и с ним сравниваются результаты диагностической методики. Если связь между ними признается удовлетворительной, то делается вывод о практической значимости, эффективности, действенности диагностической методики.
Для проведения прагматической валидизации методики, т. е. для оценки ее эффективности, действенности, практической значимости, обычно используется независимый внешний критерий — показатель проявления изучаемого свойства в повседневной жизни.
Такими критериями могут быть: 1. успеваемость (для тестов способностей к обучению, тестов достижений, тестов интеллекта); 2. производственные достижения (для методик профессиональной направленности); 3. эффективность реальной деятельности — рисование, моделирование и т. д. (для тестов специальных способностей); 4. субъективные оценки (для тестов личности).
Существует несколько видов валидности, обусловленных особенностями диагностических методик, а также временным статусом внешнего критерия. Однако чаще всего называются следующие. 1. Валидность «по содержанию». Этот прием используется, например, в тестах достижений. Обычно в тесты достижений включается не весь материал, который прошли учащиеся, а какая-то его небольшая часть (3-4 вопроса). Можно ли быть уверенным в том, что правильные ответы на эти немногие вопросы свидетельствуют об усвоении всего материала? На это и должна ответить проверка валидности по содержанию. Для этого проводится сопоставление успешности по тесту с экспертными оценками учителей (по данному материалу). Валидность «по содержанию» также подходит к критериально-ориентированным тестам. Иногда этот прием называют логической валидностью.
2. Валидность «по одновременности », или текущая валидность, определяется с помощью внешнего критерия, по которому информация собирается одновременно с экспериментами по проверяемой методике. Другими словами, собираются данные, относящиеся к настоящему времени: успеваемость в период испытания, производительность в этот же период и т. д. С ними сопоставляют результаты успешности по тесту. 3. «Предсказывающая» валидность (другое название — «прогностическая» валидность ). Определяется также по внешнему критерию, но информация по нему собирается некоторое время спустя после испытания. Внешним критерием обычно бывает выраженная в каких-либо оценках способность человека к тому виду деятельности, для которой он оценивался по результатам диагностических испытаний. Хотя этот прием наиболее соответствует задаче диагностических методик — предсказанию будущей успешности, — применять его очень трудно. Точность диагноза находится в обратной зависимости от времени, заданного для такого прогнозирования. Чем больше проходит времени после измерения, тем большее количество факторов требуется учитывать при оценке прогностической значимости методики. Однако учесть все факторы, влияющие на предсказание, практически невозможно. 4. «Ретроспективная» валидность. Она определяется на основе критерия, отражающего события или состояние качества в прошлом. Может быть использована для быстрого получения сведений о предсказательных возможностях методики. Так, для проверки того, в какой мере хорошие результаты теста способностей соответствуют быстрому обучению, можно сопоставить прошлые оценки успеваемости, прошлые экспертные заключения и т. д. у лиц с высокими и низкими на данный момент диагностическими показателями. При приведении данных о валидности разработанной методики важно точно указать, какой вид валидности имеется в виду (по содержанию, по одновременности и т. д.). Желательно также сообщать сведения о численности и особенностях индивидов, на которых проводилась валидизация. Такая информация позволяет пользующемуся методикой исследователю решить, насколько валиден этот прием для той группы, к которой он собирается его применять. Как и в случае с надежностью, необходимо помнить, что в одной выборке методика может обладать высокой валидностью, а в другой — низкой. Поэтому, если исследователь планирует использовать методику на выборке испытуемых, существенно отличающейся от той, на которой проводилась проверка валидности, ему необходимо заново провести такую проверку. Приводимый в руководстве коэффициент валидности применим только к группам испытуемых, подобных тем, на которых он определялся.
Валидность разделяют на внутреннюю и внешнюю. Внутренняя валидность – это мера соответствия тестовых оценок уровню развития измеряемого свойства (концептуальная, содержательная, конструктная, операционная, эмпирическая). Внешняя – мера возможности распространения результатов тестирования выборки на генеральную совокупность. Репрезентативность выборки – это представительность экспериментальной выборки, которая отражает основные свойства генеральной совокупности. Дискриминативность – способность методики (теста) дифференцировать испытуемых по степени проявления у них измеряемого качества.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|