Типы образовательных тестов
В годовом отчете Службы тестирования в образовании за 1990 г. попечительский совет этой организации предсказал, что образовательное тестирование изменится в последующее десятилетие больше, чем оно изменилось за пять предыдущих (ETS, 1990). Похоже, что это предсказание оказалось точным и, пожалуй, могло бы быть повторено в отношении грядущего десятилетия. В настоящее время тесты всех видов подвергаются значительной переработке, и одновременно быстрыми темпами идет разработка новых оценочных инструментов. Поэтому представленный ниже обзор сосредоточен на типах инструментов, традиционно используемых в сфере образования, а не на подробной характеристике отдельных тестов. Разумеется, рассматриваются также некоторые непрерывные линии, по которым идет совершенствование этих инструментов внутри каждого типа. Батареи общих достижений. Есть несколько батарей для измерения общих академических достижений в областях, чаще всего охватываемых учебными планами. Этот тип теста может использоваться и в первых классах, и при обследовании взрослых, хотя свое основное применение он нашел в начальной школе.1 В типичных случаях эти батареи дают профили показателей по отдельным субтестам или в основных областях обучения. Преимущество таких батарей по сравнению с независимо разработанными тестами достижений состоит в том, что они позволяют проводить горизонтальные либо вертикальные сравнения или оба этих типа сравнений одновременно. Таким образом, относительное положение индивидуума в разных областях знаний или учебных навыков можно оценивать исходя из результатов единой нормативной выборки, а прогресс ученика от класса к классу может отображаться в единицах одной шкалы
1 Речь идет об американской начальной школе, включающей первые 6-8 классов. — Примеч. науч. рей- Глава 17. Основные области применения тестов в наше время 525 показателей. Пользователю теста следует выяснить, была ли выбранная им конкретная батарея стандартизована таким образом, чтобы обеспечить один из двух или оба вида сравнений. Хотя некоторые батареи общих достижений предназначены исключительно для начальных классов, а некоторые — для средней школы, все же большинство имеют широкий диапазон, охватывающий оба уровня образования, а иногда и первый год обучения в колледже. Лишь немногие из них представлены единой для всех классов батареей, тогда как большинство состоит из нескольких частично перекрывающихся батарей, которые оформлены в виде отдельных тестовых буклетов, используемых на разных уровнях обучения. Некоторые из батарей действительно образуют согласованную серию тестов, обеспечивающую сопоставимые измерения в диапазоне от приготовительных классов (Grades К) до 12-го класса. Один такой набор составляют Тесты основных навыков штата Айова (Iowa Tests of Basic Skills), Тесты достижений и умений (Tests of Achievement and Proficiency) и Тесты развития в обучении штата Айова (Iowa Tests of Educational Development); другой — комплект Стэнфордского теста достижений (Stanford Achievement Test Series). Заслуживающей внимания особенностью некоторых батарей достижений является их совместное нормирование с тестами академического интеллекта или академических способностей. Среди наиболее важных примеров — батареи достижений, со-четанные с тремя многоуровневыми тестами, разговор о которых шел в главе 10, а именно: серия Стэнфордских тестов достижений в связке с Тестом школьных способностей Отиса—Леннона; серия Тестов штата Айова и Тесты достижений и умений в связке с Тестом когнитивных способностей; Калифорнийские тесты достижений и Комплексные тесты основных навыков в связке с Тестом когнитивных навыков (см. табл. 10-1). Использование в этих случаях одной и той же выборки стандартизации дает возможность проводить прямые сравнения показателей любого ученика, полученных им по двум типам тестов. Обычно тесты каждой пары высоко коррелируют, и испытуемые получают по ним очень близкие показатели. Когда у кого-то из учеников один из показателей (либо по тестам способностей и навыков, либо по тестам достижений) значительно выше другого, желательно выяснить возможные причины такого расхождения. Батарея достижений измеряет преимущественно то, что ученик усвоил из основных школьных курсов, тогда как тест когнитивных навыков оценивает более широкий спектр умений и знаний, приобретенных учеником как в школе, так и за ее пределами. Любое значимое расхождение в выполнении этих двух типов тестов может отражать влияние специальных способностей (или, наоборот, неспособности к чему-то конкретному), либо воздействие таких некогнитивных факторов, как мотивация, интересы и аттитюды. Происхождение и жизненный опыт индивидуума часто дают подсказку к пониманию обстоятельств, вызвавших необычное расхождение в выполнении тестов.
Батареи достижений явно различаются по техническому уровню процедур, используемых для конструирования входящих в них тестов. Тем не менее как группа, эти батареи отвечают высоким стандартам разработки тестов, особенно в том, что касается объема и репрезентативности нормативных выборок, надежности и валиди-зации содержания. После составления заданий на основе подробной спецификации теста проводится их всесторонний анализ, включая применение методов IRT. Чтобы избежать смещения результатов, вызываемого половыми и этническими различиями, обычно используют специальные процедуры. Все батареи включают оценку базо- 526 Часть 5. Области применения тестирована вых навыков в таких областях, как чтение, язык и математика, и варьирующего объема предметных знаний в сфере естественных и социальных наук. Некоторые к тому же содержат ряд субтестов, предназначенных для измерения учебных навыков или умения использовать различные источники информации. Наконец, отвечая на запросы пользователей, издатели основных стандартизованных батарей достижений предлагают в настоящее время большее разнообразие заданий и опций. Теперь в них используются задания со свободным ответом и более широкий набор заданий с выбором ответа, назначение которых — измерять мыслительные навыки высшего порядка в более значимых контекстах. Издатели обеспечивают повышенную гибкость приспособления оценочных пакетов к требованиям учебных планов конкретных образовательных учреждений за счет предоставления пользователям возможности составлять разнообразные «смеси» из различных по содержанию и формату заданий и к тому же выбирать подходящую систему количественных показателей. Они также предлагают больше согласующих элементов (linkages) между тестами и учебными материалами.1
Тесты на минимум базовых навыков. Два последних десятилетия свидетельствовали о растущей озабоченности низким уровнем компетентности выпускников средней школы в таких областях, как чтение, письмо и арифметические навыки. Эта обеспокоенность привела к повышенному спросу на тесты для оценки уровня базовых навыков как средства подтверждения образовательного минимума и как основы для выдачи аттестата об окончании средней школы. Предложение сделать такое тестирование обязательным вызвало бурю споров, в которых большинство аргументов противной стороны указывало на высокую вероятность неправильного использования и истолкования тестов минимальной компетентности, а также на возможное снижение гибкости обучения и усиление бюрократических средств управления в сфере образования.2 Хотя в большинстве штатов установлена политика в отношении тестирования минимума компетентности, определяемые ею стратегии и процедуры широко различаются в разных штатах относительно сроков проведения тестов и ступени обучения, на Которой они должны проводиться; конкретного использования результатов тестирования, а также сущности и степени местной автономии в разработке или выборе тестов. Кроме того, тесты, используемые для принятия решений о выдаче или отказе в выдаче аттестата, должны отражать специфику учебного плана в разных типах школ. В силу всех этих причин такие тесты в настоящее время разрабатываются обычно самими школами, местными комитетами по образованию или соответствующими органами штата при помощи издателей тестов, которые могут предоставить технически подготовленный персонал, предложить большой банк заданий и услуги по составлению зак-
1 Примером этой тенденции может служить комплект TerraNova, недавно изданный CTB/McGraw-HilL В качестве составных частей в него входят: новые Комплексные тесты основных навыков (CTBS); вариант Множественных оценок (Multiple Assessment edition), который сочетает задания с выбором и задания с составлением ответа; вариант Оценок выполнения заданий (Performance Assessment edition), обеспечивающий более объемные задачи со свободным ответом, оценка которых может производиться либо на месте, либо издателем батареи, и, наконец, Заказной компонент {Custom Component), включающий дополнительные задания, предназначенные для оценки достижения целей специализированного учебного плана. 2 Всестороннее обсуждение движения за введение тестирования минимума компетентности и порождаемых такими тестами технических психометрических проблем можно найти в Berk (1986). Еше один исчерпывающий обзор спорных вопросов и проблем, связанных с использованием тестов для удостоверения компетентности учащихся дан в Jaeger (1989). Глава 17. Основные области применения тестов в наше время 527 лючений с учетом специфики местных образовательных целей. Подобные тесты могут включать некоторые компоненты обсуждавшихся выше стандартизованных батарей достижений или создаваться по индивидуальному заказу для жителей конкретного населенного пункта. В последние годы сфера интересов, связанных с определением уровня овладения базовыми навыками, распространилась на взрослое население.1 Совокупные последствия того, что в структуре населения значительно повысилась доля лиц с незаконченным средним образованием, а уровень компетентности выпускников средней школы снизился, вызвали озабоченность по поводу конкурентоспособности рабочей силы США на мировом рынке труда. Результаты Национального обследования грамотности взрослых (National Adult Literacy Suivey), проведенного в 1992 г. Службой тестирования в образовании (ETS) под покровительством министерства просвещения США, только усилило эту озабоченность. Это обследование показало, что почти половина американцев находится на двух самых низких из пяти возможных уровней грамотности (Kirsch, Jungeblut, Jenkins, & Kolstad, 1993).
Тесты на минимум базовых навыков, специально предназначенные для взрослых, обычно разрабатываются в связи с организацией классов для обучения взрослых, реализацией образовательных программ в тюрьмах и обеспечением эффективности программ профессиональной подготовки. Замечательным примером тестов этого типа служат Тесты базового образования взрослых (Tests of Adult Basic Education [ ТАВЕ, Forms 7 & 8, 1994]). Батарея ТАВЕ содержит пять ступенчатых уровней трудности для пяти предметных областей, включая чтение, язык и прикладную математику. Результаты тестирования сообщаются в виде статистически нормированных показателей, а также в виде основанной на квалификационных требованиях информации, которую можно использовать в диагностических целях. В добавление к стандартным формам ТАВЕ имеется в наличии специальная версия этой батареи, пригодная для использования в рабочей среде и изданная на испанском языке (ТАВЕ Espacol), что позволяет измерять базовые навыки испаноговорящих взрослых на их родном языке. Тесты, создаваемые учителем для проведения в своем классе. Несомненно, что подавляющее большинство тестов на усвоение содержания конкретных учебных предметов или их разделов готовят сами учителя и используют их только в своих классах. Огромное разнообразие программ изучения одного и того же предмета, особенно в старших классах средней школы и выше, известно всем. В этих условиях никакие внешние стандартизованные тесты не могут удовлетворить потребности учителей. Однако подготовку локальных тестов для проведения в классе можно существенно улучшить, воспользовавшись методиками и опытом профессиональных разработчиков тестов. Процесс создания таких тестов можно разбить на три основных этапа: 1) проектирование теста, 2) написание заданий и 3) анализ заданий. Некоторые простые методы анализа заданий, пригодные для работы с малыми группами, описаны в 1 В основе обсуждения этого вопроса лежит понятие «функциональной грамотности» (Sticht, 1975), объем которого был расширен до минимальных требований к владению языком в устной и письменной речи, пониманию и использованию различной документации и арифметическим вычислениям. Функциональная компетентность определяется исходя из требований практических ситуаций, например исходя из уровня трудности и объема материала, который должен быть прочитан для выполнения определенной работы, или, более широко, с точки зрения базовых учебных навыков, необходимых каждому человеку для налаживания собственной жизни в современном обществе. 528 Часть 5. Области применения тестировани главе 7, а краткий обзор возможных путей реализации двух других этапов дается ниже.1 Разработчик теста, начинающий прямо с написания заданий, скорее всего создаст односторонний тест. Без наличия технического проекта будущего теста некоторые темы изучаемого предмета могут оказаться излишне представленными в нем, в то время как другие останутся незатронутыми. Обычно по одним темам объективные задания подготовить легче, а по другим труднее. Также легче подготовить задания которые требуют запоминания простых фактов, и труднее придумать задания на критическую оценку, обобщение различных фактов или на применение изученных принципов к новым ситуациям. Поэтому конструируемый без наличия проекта тест может оказаться перегруженным относительно недолговечным и менее важным материалом. Большинство расхожих критических замечаний в адрес тестов с выбором готовых ответов проистекает из неоправданно большого значения, которое в плохо сконструированных тестах придается механической памяти и малозначительным деталям. Во избежание этих случайных диспропорций в охвате предметной области тестовыми заданиями, прежде чем приступать к подготовке заданий, следует составить спецификацию теста (test specifications) или, иначе говоря, техническое задание на разработку теста. При подготовке проверочных тестов для своего класса составление спецификации следует начинать с описания целей изучения конкретного предмета и содержания тем, подлежащих непосредственной проверке; желательно также отразить относительную важность каждого из этих аспектов в виде количества заданий, предназначающихся для проверки каждой темы и цели.2 Разработчик теста должен также выбрать наиболее подходящую для данного материала форму заданий (item form). Относительные достоинства объективных и свободных заданий, обсуждавшиеся ранее в этой главе в связи с их использованием в масштабных программах стандартизованного тестирования, нужно принимать в расчет и при конструировании тестов для класса. Наконец, что касается собственно составления заданий, то на основе многолетней практики их подготовки и эмпирической оценки ответов по ним было сформулировано немало практических правил эффективного написания заданий. Тот, кто планирует подготовить тест для своего класса, поступит правильно, если обратится к одному из литературных источников, в которых дана сводка этих советов и указаний (например, Ebel, 1979, chaps. 4-9; Haladyna, 1994, chaps. 4-6; Linn & Gronlund, 1995, chaps. 6-9; Millman, & Green, 1989). Тесты для университетского уровня образования. Ряд тестов и программ тестирования был разработан для использования при проведении приема, распределения по группам и консультирования студентов колледжей. Наиболее известный пример — Программа тестов академической оценки Совета колледжей (Scholastic Assessment Tests [SAT] Program of the College Board), состоящая теперь из двух частей, а именно, Теста рассуждений (SATI: Reasoning Test), заменившего вербальный и математический разделы Теста академических способностей (Scholastic Aptitude Test), и Предметных тес- 1 Более подробные указания по подготовке тестов и других методик оценки, рассчитанных на применение в рамках одного класса, см. в Linn, & Gronlund (1995, chap. 5.-13). 2 Примеры спецификации теста в табличной форме приведены в Anastasi (1988b, p. 431) и в Linn, & Gronlund (1996, p. 122). (См. также Анастази А. Психологическое тестирование: Пер. с англ. — М.: Педагогика, 1982. - — Кн. 2. - С. 50-51. - Примеч. науч. ред. Глава 17. Основные области применения тестов в наше время 529 тов (SATII: Subject Tests), заменивших Тесты достижений прежнего SAT (SAT Achievement Tests).1 SAT I состоит, главным образом, из вопросов с множественным выбором, измеряющим вербальные и математические способности (abilities). Он предназначен для использования — в качестве дополнения к школьным отметкам и другой информации — при оценке готовности студента к выполнению учебной работы на уровне требований колледжа. Тесты SATII, с другой стороны, предназначены для оценки знаний по конкретным предметам (например, литература, химия и всемирная история) и могут быть использованы как при распределении студентов по группам, так и при приеме. Тесты программы SAT в процессе ее развития изменились по содержанию и формату заданий, а также сменили название. Например, в вербальном разделе 5Л Г/усилен акцент на критическом чтении и рассуждении. Аналогично этому, некоторые задания математического раздела 5Л 7Yтребуют теперь от студентов создавать, а не просто выбирать готовые ответы, и использование калькуляторов, согласно новым стандартам, допускается на всем протяжении работы над заданиями этого раздела теста. Тесты SATII также изменились и в настоящее время включают более прямую оценку навыков по результатам опроса (listening components) и пробам письма (writing samples). С апреля 1995 г. тестовые показатели программы SAT больше не выражаются в пересчете на результаты фиксированной эталонной группы, датируемые 1941 г. (см. главу 3). Вместо этого шкала показателей SA Гбыла заново «центрирована» по результатам новой эталонной группы 1990-х гг., так чтобы средний уровень выполнения теста был по-прежнему представлен показателем примерно в 500 единиц.2 Эта новая центрация сделала показатели SA Гболее точными и надежными, особенно на краях шкалы. Вдобавок ко всему, стало легче интерпретировать показатели; например, показатели по вербальному и математическому разделам теста можно теперь сравнивать друг с другом напрямую, без перевода в процентили, потому что оба они были центрированы относительно одной точки. Более того, поскольку 500 является средней точкой диапазона оценок от 300 до 800 единиц, «интуитивное» (или, иначе говоря, смысловое) и фактическое среднее будут всегда совпадать. Совет колледжей распространил специальные таблицы и другие средства, упрощающие перевод показателей оригинальной шкалы SATb показатели его «перецентрированной» шкалы, чтобы сохранить преемственность между этими шкалами. Текущую информацию о надежности, уровнях трудности и процентах успешно справившихся с экзаменами по пересмотренной программе SA Гможно найти в руководствах, специально подготавливаемых для консультантов и должностных лиц, занимающихся приемом в университеты, а также в научных отчетах и других публикациях Службы тестирования в образовании (EST) и Совета колледжей (College Board, 1995a, 1995b).3 Предварительное исследование, целью которого было сравнить традиционную программу SAT с опытным образцом 1 Что касается более подробной истории программы SAT, см. Anastasi (1988b, p. 328-331) и Donlon (1984). 2 В начале 1990-х гг. средние показатели SA T отклонялись от 500 в обеих областях, а именно, до 424 в вербальной и до 478 в математической области. 3 Вследствие той функции, которую экзамены по программе SAT выполняют при отборе студентов колледжей, сама эта программа часто становится объектом критического анализа. Недавно, например, сообщалось, что тестируемые могут правильно ответить на многие вопросы SAT, относящиеся к классу заданий с множественным выбором, даже не читая сопровождающих текстов к этим вопросам. Такой вывод вновь разжег угасшие было споры по поводу того, в какой степени посторонние, фоновые знания влияют на показатели 5ЛГ(см„ например, S. Katz, & Lautenschlager, 1995). 530 Часть 5. Области применения тестирования SAT, обнаружило, что новая версия теста является несколько лучшим предиктором среднего балла (grade point average или, сокращенно, GPA) первокурсников, чем традиционная (Hale, Bridgeman, Lewis, Pollack, & Wang, 1992). Дополнительные данные о валидности экзаменов по пересмотренной программе SA Т будут включены в техническое приложение, которое должно появиться в конце 1990-х гг. Еще одной общенациональной программой, начатой в 1959 г., является Программа тестирования американских колледжей (American College Testing Program [ACT, 1995— 1996]. Вначале ее применение ограничивалось главным образом системой университетов отдельных штатов, но программа А СГбыстро переросла административные границы и теперь используется многими колледжами по всей стране. Современная А СТ- оценка (ACTAssessment) включает четыре теста: Английский язык, Математика, Чтение (Reading) и Научное рассуждение (Science Reasoning). Отражая точку зрения ее создателя, Э. Ф. Линдквиста (Е. F. Lindquist), эта экзаменационная программа предлагает тестируемому выполнить выборку основных видов работ, осуществляемых во время обучения в колледже. А СГ-оценка частично совпадает с традиционными тестами способностей и достижений, концентрируясь на основных интеллектуальных навыках, необходимых для удовлетворительного освоения учебных программ колледжа. Некогнитивные компоненты А СГ-оценки включают: Вопросник для сбора информации о пройденных в средней школе предметах и уровне их изучения (High School Course/Grade Information questionnaire), АСТ-ииветарь интересов (ACTInterestInven-toiy) и Профиль студента (Student Profile Section), предназначенный для сбора сведений о стремлениях, планах и достижениях студентов, а также другой исходной информации. За всю историю своего существования ACT так и не достиг технических стандартов, заданных SAT. Однако сравнение АСТс другими инструментами по показателям валидности, полученным в сходных условиях, оказывается в пользу этой программы тестирования. Следует заметить, что тесты наподобие SA Тп А СГникогда не предназначались на роль заменителей школьных отметок при прогнозировании достижений во время обучения в колледже. Высокие оценки в средней школе могут предсказывать оценки в колледже не хуже или даже чуть лучше, чем большинство тестов. Однако при объединении тестовых показателей с оценками за среднюю школу, предсказание будущих успехов в освоении учебных программ колледжа улучшается. Отчасти повышение точности предсказания происходит за счет того, что единый, объективный тест выполняет функцию нейтрализации непостоянства стандартов оценивания в разных школах. Кроме того, такие тесты не подвержены воздействию возможных личных пристрастий или других случайных (связанных с произволом) факторов, которые могут влиять на выставление оценок по изучаемым в средней школе предметам. Постепенно возрастает использование специализированных тестов достижений в качестве равносильной замены вступительных экзаменов в колледжи. Учащиеся средних школ с дополнительной подготовкой в определенных областях могут пройти тестирование по принятой Советом колледжей Программе опережающего отбора (College Board's Advanced Placement Program \APP\) для того, чтобы попробовать поступить в колледж на основании особых успехов в изучении одного или нескольких предметов. Проявление близкой тенденции можно обнаружить в Программе экзаменов университетского уровня (College Level Examination Program [CLEP]), также проводимой Советом колледжей. Главное назначение этой программы — облегчить получение Глава 17. Основные области применения тестов в наше время 531 «кредитов» колледжа по набору преподаваемых в нем курсов на основе результатов тестирования1 и обеспечить национальную систему оценивания образования университетского уровня, которое было получено путем самообразования или другими нетрадиционными методами. Аналогичная серия тестов — Квалификационные экзамены ACT {ACT Prof iciency Examination Program) — проводится колледжами, признающими А СГ-программу. Хотя эта серия тестов включает вопросы по некоторым академическим дисциплинам, таким как анатомия, физиология и патопсихология {abnormalpsychology), она охватывает главным образом профессиональные области, такие как сестринское или бухгалтерское дело. Прием в аспирантуру. Практика тестирования желающих поступить в колледж постепенно была распространена на аспирантуру и профессиональные школы. Большая часть созданных для этой цели тестов представляет собой комбинацию тестов общего интеллекта и тестов достижений. Широко известный пример — Письменные экзамены для аспирантов {Graduate Record Examinations [GRE]). Эта серия тестов была создана в 1936 г. в рамках совместного проекта фонда Карнеги для развития преподавания (Carnegie Foundation for the Advancement of Teaching) и аспирантур четырех университетов. Значительно расширившаяся с того времени, программа GRE проводятся теперь Службой тестирования в образовании {ETS) под общим руководством Совета GRE. Тестирование студентов проводится в специально предназначенных для этого центрах, созданных более чем в 100 странах мира, до зачисления в аспирантуру. Результаты теста используются университетами как вспомогательное средство при принятии решений о приеме и распределении по кафедрам, отборе кандидатов на получение стипендий и грантов, выделении научного оборудования и т. д. GRE включают Общий тест {General Test) и Предметные тесты {Subject Tests) в разных областях специализации.2 В настоящее время Общий тест дает отдельные показатели вербальных, количественных и аналитических способностей. Предметные тесты имеются теперь в 16 областях специализации, включая биологию, вычислительную технику, французский язык, математику, музыку, политологию и психологию. Психометрические характеристики GRE приведены в самом свежем издании руководства по их проведению {GRE 1995-96 Guide). В общем, показатели Предметного теста являются более надежными предикторами среднего балла (GPA) аспирантов первого года обучения по сравнению с комбинированными показателями Общего теста или средним баллом студентов-выпускников {undergraduate GPA), однако комбинация всех трех мер дает наивысшие показатели прогностической валидности. Величина коэффициентов множественной корреляции, используемых в качестве таких показателей, варьирует в пределах примерно от 0,45 до 0,60 с небольшим для различных областей специализации. В октябре 1992 г. программа GRE начала проводить компьютеризованную версию традиционной формы Общего теста, а в ноябре 1993 г. был введен компьютеризованный адаптивный вариант этого теста. Несмотря на первоначальные трудности, связанные с потенциальным риском получения доступа к закрытой информации при таком 1 Речь идет о конкретной форме экстерната. — Примеч. науч. ред. г До 1982 г. Общий тест назывался Тестом пригодности (Aptitude Test), а Предметные тесты — Углубленными тестами (Advanced Tests). Как и в случае с SAT, названия поменялись с целью избежать неправильного понимания назначения данных тестов. 532 Часть 5. Области применения тестирования проведении Общего теста GRE, преимущества компьютеризации оказались настолько очевидными, что Совет GRE может полностью отказаться от тестирования с применением бланковых форм уже к 1999 г. Кроме того, в настоящее время Общий тест GRE перерабатывается с целью включения в него Теста письма (Writing Test) и Теста математического рассуждения (Mathematical Reasoning Test), а также ряда вопросов с составлением ответа («Update on the New GRE», 1995). Диагностическое и прогностическое тестирование. В отличие от рассмотренных выше батарей общих достижений и тестов достижений в конкретных областях, обсуждаемые в этом разделе тесты предназначены для анализа сильных и слабых сторон конкретного человека в освоении какой-либо предметной области и выявления возможных причин его затруднений. Большинство этих диагностических инструментов применяется при индивидуальном обследовании, и потому их чаще всего относят к разряду клинических. Тем не менее некоторые из них представляют собой отдельные части обсуждавшихся ранее основных батарей достижений и рассчитаны на групповое проведение. Большая часть опубликованных диагностических групповых тестов оценивают навыки чтения, владения языком и выполнения математических операций и предоставляют информацию как относительно статистических групповых норм, так и относительно содержательных критериев в каждой конкретной области. Примеры этого подхода нам дают Стэнфордский диагностический математический тест (Stanford Diagnostic Mathematics Test) и Стэнфордский диагностический тест чтения (Stanford Diagnostic Reading Test), а также Калифорнийские диагностические тесты по математике (California Diagnostic Mathematics Tests) и Калифорнийские диагностические тесты чтения (California Diagnostic Reading Tests). Издатели этих двух серий выпустили также отдельные инструменты для оценки и диагностики навыков письма. Как Стэн-фордская программа оценки письма (Stanford Writing Assessment Program), так и Система оценки письма СТВ (СТВ Writing Assessment System) используют прямые выборки письма разного стиля (например, описательного или повествовательного) и предлагают несколько вариантов определения показателей. В связи с использованием всех диагностических тестов один момент следует подчеркнуть особо. Диагностика трудностей в обучении (learning disabilities) и последующее проведение программы коррекционного обучения входят в обязанности соответствующим образом подготовленного специалиста. И никакая батарея диагностических тестов не может заменить его полностью в решении этих задач. Диагностика и коррекция серьезных трудностей в обучении требуют тщательного клинического обследования индивидуума, предпочтительно междисциплинарного, включая получение дополнительных сведений о состоянии органов чувств (sensory capacities) и моторном развитии, состоянии здоровья и болезнях, а также подробных данных об учебе, материальных условиях жизни, семейной обстановке и возможных эмоциональных проблемах. Хотя опросы и групповые диагностические тесты могут помочь в выявлении учеников, требующих повышенного внимания, диагностика и коррекция трудностей в обучении требуют специализированных методик. Некоторые из таких методик обсуждались в главе 9, а сам этот вопрос еще будет рассмотрен в этой главе в связи с клиническим тестированием. Глава 17. Основные области применения тестов в наше время 533 Некоторые типы тестов, предназначенных для использования в образовательной среде, являются по существу прогностическими инструментами. Как таковые они выполняют скорее функции тестов способностей, чем тестов достижений. В то же время они часто имеют сходство с тестами достижений по содержанию, поскольку с их помощью обычно предсказывается уровень освоения того или иного учебного предмета. Типичным образцом данного подхода служит Прогностический алгебраический тест Орлеане—Ханна (Orleans-Hanna Algebra Prognosis Test — Hanna, Sonnenschein, & Lenke, 1983). В этом тесте учащимся дают серию коротких, простых.«уроков» (lessons) по алгебре и сразу же проверяют, что они усвоили. Таким образом, тест состоит из выборок работы (work samples) и предсказывает ход последующего научения тестируемых по результатам выполнения ими выборочных образцов обучающих задач. Более необычный, пока еще экспериментальный образец прогностического тестирования — тесты искусственного языка, разработанные Службой управления кадрами (U. S. Office of Personnel Management) и Министерством обороны США для предсказания способности к обучению новым языкам (Diane, Brogan, & McCauley, 1991). Другой метод оценки, несмотря на его сугубо индивидуальную ориентацию, привлекает все большее внимание, начиная с 1980-х гг. По существу, этот подход следует процедуре «тест-обучение-тест», обычно называемой динамической или направляемой (guided) оценкой, и связывается с коррекционным обучением. Потенциал научения индивидуума оценивается посредством наблюдения за тем, насколько хорошо он обучается индивидуально под руководством специалиста, который выполняет функции тройной роли: экзаменатора, учителя и клинициста. Главным представителем этого подхода является Фейерстейн (Feuerstein, 1979); несколько родственных подходов рассматриваются в работах A. L. Brown, Campione, Webber, & McGilly (1992) и Lidz (1987,1997). Вследствие ее выраженного клинического характера, динамическая оценка рассматривается более полно в соответствующем разделе данной главы. Проведение замеров в соответствии с учебным планом (curriculum-based measurement) являет собой пример еще одного подхода, в рамках которого была разработана группа методик, связывающих оценивание с программами вмешательства (Deno, 1992; Fuchs, 1993; Fuchs, & Deno, 1991; Shinn, 1989). Хотя одни подходы к оценке на основе учебного плана могут быть совершенно неформальными, другие предполагают использование стандартизованных средств измерения выполнения программы учеником в том, что касается таких базовых навыков, как чтение, правописание и арифметические вычисления (сравнение разных моделей см. в работе Shinn, Rosenfield, & Knut-son, 1989). Общим знаменателем всех этих методик является их выраженная поведенческая ориентация и прямая связь с задачами, составляющими типичный учебный план начального образования, в отличие от предполагающих логический вывод и ориентированных на статистические нормы традиционных психометрических инструментов. Оценка на основе учебных планов использовалась первоначально в условиях специального обучения. Оценка обучения в раннем детстве. За последние три десятилетия было опубликовано множество новых методик для измерения результатов дошкольного воспитания и подготовки маленьких детей к обучению в школе. Ряд факторов повлиял на масштабы и характер этой деятельности (см. главы 9 и 12). Исследование когнитивного развития в раннем возрасте, быстрое распространение программ для обучения до- 534 Часть 5. Области применения тестирования школьников и широкая озабоченность влиянием культурных барьеров на способность ребенка извлекать пользу из школьного обучения1 — все это сыграло важную роль в разработке соответствующего инструментария. Некоторые из этих тестов предназначались главным образом для измерения результатов обучения в раннем детстве и потому выполняют функцию тестов достижений. Другие представляются как прогностические инструменты для оценки готовности ребенка к обучению в 1-м классе школы. Однако эти два типа инструментов незаметно переходят друг в друга, и каждый из них обычно может выполнять обе задачи. Школьная готовность (school readiness) указывает, по существу, на приобретение необходимых умений и навыков, знаний, аттитюдов, мотиваций и других целесообразных черт поведения, которые дают возможность ученику извлекать максимальную пользу из обучения в школе. Эти предпосылки составляют то, что Хант и Кирк (J. McV. Hunt & Kirk, 1974) называли «навыками вхождения» (entry skills), необходимыми ребенку для того, чтобы справиться с ситуацией обучения-учения, когда он поступает в 1-й класс. Готовность связана с минимальными уровнями физического и сенсомоторного развития, достигаемыми вследствие созревания и дошкольного воспитания. Все большее значение придается иерархическому развитию знаний и умений, в силу чего овладение простыми понятиями подготавливает ребенка к усвоению более сложных понятий в последующем. Тесты готовности обычно проводятся при поступлении в школу. Хотя они похожи на тесты интеллекта для начальных классов, в них больше внимания уделено способностям, считающимся необходимыми для того, чтобы научиться читать. Кроме того
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|