А. Бине и появление тестов интеллекта
Бине и его сотрудники много лет посвятили активным и оригинальным исследованиям способов измерения интеллекта. Были испробованы многие подходы, включая даже измерение формы черепа, лица, рук и анализ почерка. Результаты, однако, все более убеждали, что непосредственное, хотя бы и грубое, измерение сложных интеллектуальных функций наиболее перспективно. И наконец, одна неожиданная ситуация привела Бине к желанной цели. В 1904 г. министр общественного образования назначил Бине в уже упоминавшуюся Комиссию по изучению методов обучения умственно отсталых детей. Именно в связи с целями, стоящими перед этой комиссией, Бине в сотрудничестве с Симоном создал первую шкалу Бине—Симона (Binet, & Simon, 1905). Эта шкала, известная нам как шкала 1905 г., состояла из 30 заданий, или тестов, расположенных по возрастающей трудности. Уровень трудности определялся эмпирически, путем проведения этих тестов на 50 нормальных детях в возрасте от 3 до 11 лет, а также на нескольких умственно отсталых детях и взрослых. Тесты предназначались для измерения широкого круга функций, с особым акцентом на способностях к суждению, пониманию и рассуждению, которые Бине считал основными компонентами интеллекта. Хотя сенсорные и перцептивные тесты также входили в эту шкалу, в ней, по сравнению с большинством серий тестов того времени, существенно возросла доля вербального материала. Шкалу 1905 г. ее создатели представили как предварительный, пробный образец измерительного инструмента, и пока им не удалось найти строгий объективный метод получения совокупного, общего показателя из множества результатов по отдельным тестам. Во втором варианте шкалы, редакция 1908 г., общее число тестов было увеличено, некоторые неудачные тесты более ранней шкалы изъяты, и все тесты были сгруппированы по возрастным уровням на основе их выполнения примерно 300 нормальными детьми в возрасте от 3 до 13 лет. Так, к уровню 3 лет были отнесены все тесты, с которыми справлялось от 80 до 90 % нормальных трехлетних детей; к уровню 4 лет — все тесты, с которыми справлялось столько же нормальных четырехлетних детей, и т. д. до 13 лет. Показатель ребенка по всем тестам можно было в этом случае выразить в виде умственного уровня, соответствующего возрасту нормальных детей, результатов которых он достигал. В разных переводах и переработках шкал Бине термин «ум-
54 Часть 1. Функции и истоки психологического тестирования ственный уровень» обычно заменялся термином «умственный возраст», поскольку умственный возраст — понятие простое и доступное, и его введение несомненно способствовало популяризации интеллектуального тестирования.1 Сам А. Бине, однако, избегал термина «умственный возраст» из-за вытекающих из него, но, увы, необоснованных следствий о нормах возрастного развития и предпочитал более нейтральный термин «умственный уровень» (Т. Н. Wolf, 1973). Третий вариант шкалы Бине—Симона появился в 1911 г., отмеченном преждевременной смертью Альфреда Бине. Шкала эта по сравнению с предыдущей претерпела незначительные изменения, которые свелись к перестановке отдельных тестов, добавлению новых тестов для некоторых возрастных уровней и расширению верхней границы шкалы до уровня взрослого человека. Еще до пересмотра 1908 г. тесты Бине—Симона привлекли широкое внимание психологов всего мира. Их переводы и адаптации появились во многих странах, включая США, где было опубликовано несколько вариантов этой шкалы. Первый вариант был подготовлен Г. Г. Годдардом (Н. Н. Goddard), работавшим в то время психологом-исследователем в Вайнлендской исправительной школе (для умственно отсталых детей). Шкала Бине—Симона в редакции Годдарда оказала решающее влияние на принятие тестирования интеллекта медицинскими работниками (Zenderland, 1987). Она появилась в благоприятный момент, удовлетворив настоятельную потребность специалистов в стандартизованной мерке для постановки диагноза и классификации лиц с задержкой умственного развития. Однако в качестве инструмента тестирования эта шкала вскоре была вытеснена более широкой и совершенной в психометрическом отношении шкалой умственного развития Стэнфорд—Бине, разработанный под руководством Л. М. Тёрмена в Стэнфордском университете (Terman, 1916). Именно в этом варианте шкалы был впервые использован коэффициент интеллекта (IQ), или отношение умственного возраста к хронологическому. Последующие редакции этой шкалы получили широкое применение и будут более основательно рассмотрены в главе 8. Особый интерес представляет также первая редакция шкалы Бине—Симона, произведенная Ф. Кюльманом, в которой нижняя возрастная граница была снижена до 3 мес. (Kuhlmann, 1912). Шкала Кюльмана—Бине представляет собой одну из самых ранних попыток разработать тесты интеллекта для младенцев и дошкольников.
Групповое тестирование Тесты Бине, как и все их редакции, являются индивидуальными шкалами в том смысле, что они могут проводиться только с одним человеком за раз. Большинство тестов в этих шкалах требуют от испытуемого устного ответа или манипулирования 1 Ф. Л. Гудинаф (F. L. Goodenough, 1949, р. 50-51) отмечает, что в 1887 г., за 21 год до появления шкалы Бине—Симона 1908 г., С. Э. Шайе (S. E. Chaille) опубликовал в Нью-Орлеанском медицинском журнале (New Orleans Medical and Surgical Journal) серии тестов для младенцев, распределив их в соответствии с возрастом, в котором малыши обычно справляются с этими тестами. Частично вследствие малой доступности журнала, частично же из-за того, что ученый мир еще не был к этому готов, идея возрастной шкалы в то время осталась незамеченной. На создание подобной шкалы самим А. Бине повлияли работы некоторых его современников, особенно Блин (Blin) и Даме (Da-maye), 'составивших серию устных вопросов, из ответов на которые они выводили единый суммарный показатель для каждого ребенка (Т. Н. Wolf, 1973).
Глава 2. Исторические предпосылки современного тестирования 55 стимульным материалом, причем в некоторых из них нужно учитывать индивидуальное время выполнения задания. По этим и другим причинам такие тесты не приспособлены для группового использования. Для тестов типа шкалы Бине характерно и то, что проводить их может только квалифицированный специалист. Такие тесты по существу являются клиническими инструментами, приспособленными для интенсивного изучения индивидуальных случаев. Групповое тестирование, так же как и первая шкала Бине, было создано в ответ на настоятельную потребность практики. Когда Соединенные Штаты вступили в Первую мировую войну в 1917 г., Американская психологическая ассоциация учредила комитет для рассмотрения тех средств, которыми психология могла бы помочь ведению войны. Этот комитет под руководством Роберта М. Йеркса выявил потребность в быстрой классификации полутора миллионов новобранцев по их уровню общего интеллекта. Такая информация имела значение для многих административных решений, включая признание негодными к военной службе, распределение по родам войск, прием в лагеря обучения офицеров и т. п. Для решения этой задачи военные психологи привлекли все имеющиеся тестовые материалы, в частности неопубликованный тест для группового тестирования интеллекта, подготовленный Артуром С. Отисом и специально переделанный им для потребностей армии. Основным достоинством теста Отиса, который он составил еще во время обучения в аспирантуре у Л. М. Тёрмена, было введение задач с множественным выбором ответов и других типов «объективных» заданий. Тесты, которые в конце концов создали военные психологи, стали называться армейский альфа (Army Alpha) и армейский бета (Army Beta). Первый предназначался для общего обычного тестирования; второй представлял собой невербальную шкалу, рассчитанную на неграмотных и новобранцев иностранного происхождения, которые не могли пройти тестирование на английском языке. Оба теста пригодны для проведения в больших группах людей.
Вскоре после окончания Первой мировой войны было получено разрешение использовать военные тесты в гражданских целях. Армейские альфа и бета тесты не только сами неоднократно перерабатывались, но и послужили образцом для многих групповых тестов интеллекта. Тестирование как самостоятельное направление сделало гигантский скачок в своем развитии. Вскоре были разработаны групповые тесты интеллекта для лиц всех возрастов и категорий — от дошкольников до аспирантов. Еще совсем недавно невыполнимые, массовые программы тестирования затевались с завидным оптимизмом. Поскольку групповые тесты создавались как средства массового тестирования, их инструкции и процедура проведения были достаточно просты и потому предъявляли минимум требований к подготовке лиц, работающих с такими тестами. Школьные учителя начали проводить тесты интеллекта в своих классах. Студенты колледжей перед зачислением проходили стандартную проверку. Предпринималось широкое обследование особых групп взрослого населения, таких как заключенные. И скоро широкая публика превратилась в «/Q-сознающую». Применение таких групповых тестов интеллекта значительно обогнало ход их технического усовершенствования. В стремлении собрать как можно больше «объективных» данных о людях и извлечь из этих данных практические выгоды часто забывалось, что тесты все еще были технически несовершенными инструментами. Когда же подобные тесты не оправдывали необоснованных ожиданий, это приводило к скепти- 56 Часть 1. Функции и истоки психологического тестирования цизму и неприязни в отношении тестирования вообще. Таким образом, тестовый бум 1920-х гг., основанный на неразборчивом использовании тестов, по-видимому, столько же мешал, сколько и способствовал прогрессу психологического тестирования. Тестирование способностей Хотя тесты интеллекта изначально задумывались как инструменты, позволяющие брать пробы широкого множества функций для того, чтобы оценить общий интеллектуальный уровень индивидуума, вскоре стало очевидным, что они обладают весьма ограниченной зоной охвата, в которую не попал ряд важных функций. Фактически, большинство тестов интеллекта в основном измеряло вербальную способность и, в несколько меньшей степени, способность оперировать числовыми и другими абстрактными и символическими отношениями. Постепенно психологи пришли к признанию того, что термин «тест интеллекта» искажает истинное положение вещей, поскольку такие тесты измеряли только некоторые аспекты интеллекта.
Несомненно, эти тесты охватывали способности, имеющие первостепенное значение в той культуре, для которой их разрабатывали. Но стало ясно, что было бы предпочтительнее подыскать для них более точные названия, исходя из типа той информации, которую они могут давать. Например, ряд тестов, называвшихся в 1920-х гг. тестами интеллекта, позднее стали называть тестами академических способностей. Такая смена терминологии была вызвана осознанием того, что многие так называемые тесты интеллекта на самом деле измеряют комбинацию способностей, востребуемых и развиваемых учебной деятельностью. Еще до Первой мировой войны психологи пришли к пониманию необходимости дополнить тесты общего интеллекта тестами специальных способностей. Тесты специальных способностей разрабатывались преимущественно для использования в профориентации, а также при отборе и распределении промышленного и военного персонала. Самыми распространенными среди них были тесты технических, конторских, музыкальных и художественных способностей. Критическая оценка тестов интеллекта, последовавшая за их необычно широким распространением и неразборчивым использованием, выявила еще один заслуживающий внимания факт: выполнение конкретным человеком разных частей такого теста обнаружило заметную вариацию. Это особенно ясно проявилось в групповых тестах, в которых задания обычно подразделяются на субтесты относительно однородного содержания. Так, человек мог иметь относительно высокий показатель по вербальному и низкий по числовому субтесту, или наоборот. В какой-то степени такая внутренняя вариабельность наблюдается и в тестах типа Стэнфорд—Бине, в которых для конкретного человека могут оказаться трудными, например, задания, содержащие слова, а выигрышными задания, использующие картинки или геометрические фигуры. Пользователи тестов, и особенно клиницисты, часто прибегали к сравнению выполнения обследуемым разных частей теста для того, чтобы глубже проникнуть в его психологическую конституцию. Таким образом не только /Q или какой-то другой общий показатель, но и результаты выполнения группы заданий или субтестов учитывались при анализе индивидуальных случаев. Однако такая практика пригодна не всегда, поскольку тесты интеллекта не рассчитаны на дифференциальный анализ способностей. Часто сравниваемые субтесты содержат слишком мало заданий, чтобы дать Глава 2. Исторические предпосылки современного тестирования 57 устойчивую или надежную оценку той или иной специальной способности. В результате, различия между показателями по отдельным субтестам у конкретного человека нередко изменяются на противоположные при его повторном обследовании в другой день с помощью того же теста (или параллельной формы такого теста). Чтобы осуществлять такие внутрииндивидные сравнения, необходимы тесты, специально предназначенные для выявления различий в работе анализируемых функций. В то время как практическое применение тестов способствовало осознанию потребности в комплексных тестах способностей, одновременное развитие исследований структуры черт индивидуума постепенно снабжало ученых средствами для конструирования таких тестов. В статистических исследованиях природы интеллекта выявлялись взаимосвязи показателей по широкому кругу тестов, которые проводились на больших выборках испытуемых. Такие исследования были начаты английским психологом Чарльзом Спирменом (1904, 1927) в первом десятилетии XX в. В результате последующей разработки и усовершенствования методов этого направления в трудах английских и таких американских психологов, как Т. Л. Келли (Т. L. Kelly, 1928) и Л. Л. Терстоун (L. L. Thurstone, 1938,1947b), сложилась группа методов, получивших название факторного анализа. Вклад методов факторного анализа в конструирование тестов будет более полно рассмотрен в главе 11. Сейчас достаточно отметить, что данные, полученные с его помощью, показали наличие ряда относительно независимых факторов, или черт. Некоторые из этих черт были в той или иной мере представлены в традиционных тестах интеллекта. Примерами такого вида черт могут служить вербальное понимание и числовое рассуждение. Черты другого вида, такие как пространственные, перцептивные и механические способности, чаще выявлялись не тестами интеллекта, а тестами специальных способностей. Один из главных практических результатов применения факторного анализа — разработка комплексных батарей способностей, предназначенных для измерения степени выраженности у индивида каждой из входящих в установленный набор черт. Вместо общего показателя, или IQ в этом случае получают отдельные оценки таких черт, как вербальное понимание, способность к счету в уме, пространственное воображение, арифметическое рассуждение и скорость восприятия. Такие батареи оказались подходящим инструментом для внутрииндивидного анализа, или дифференциальной диагностики, — желанной цели, которую пользователи тестов в течении многих лет пытались реализовать на основе приблизительных и часто ошибочных результатов тестов интеллекта. Кроме того, эти батареи в составе полной программы тестирования дают значительный объем информации, получаемой ранее только с помощью тестов специальных способностей, поскольку в зону охвата комплексных батарей способностей попадают некоторые черты, обычно не оцениваемые тестами интеллекта. Комплексные батареи способностей представляют собой относительно позднее достижение в области тестирования. Почти все они появились после 1945 г. В этой связи следует отметить труд военных психологов во время Второй мировой войны. Большинство тестовых исследований, проводившихся в вооруженных силах, основывалось на применении факторного анализа и было нацелено на создание комплексных батарей способностей. В военно-воздушных силах, например, специальные батареи конструировались для пилотов, бомбардиров, радистов, штурманов и многих других военных специалистов. Отчет об одних только тестовых батареях, подготовленных в ВВС, занимает по меньшей мере 9 из 19 томов, посвященных программе авиационной 58 Часть 1. Функции и истоки психологического тестирования психологии во время Второй мировой войны { Army Air Forces, 1947—1948). Аналогичным образом был разработан ряд комплексных батарей способностей для использования в гражданской сфере, и они широко применяются в образовательном и профессиональном консультировании, а также при отборе и распределении персонала. Примеры таких батарей будут рассмотрены в главе 10 и 17. Более современная тенденция развития, обнаружившаяся в конце 1980-х — начале 1990-х гг., обеспечивает принципиальную интеграцию двух ранее противостоящих подходов к психическому измерению, представленным традиционными тестами интеллекта и комплексными батареями способностей (Anastasi, 1994). Наступает понимание того, что способность человека можно адекватно оценивать на разных уровнях широты, от узко определяемых специальными тестами (или даже отдельными заданиями) способностей через все более широкие уровни черт до полной оценки, такой как традиционный IQ, Различным целям тестирования лучше всего соответствуют разные уровни широты. Поэтому недавно разработанные тесты интеллекта, такие как Дифференциальные шкалы способностей { Differential Ability Scales), или современные версии более ранних тестов, такие как четвертая редакция шкалы Стэнфорд— Бине, сочетают широкий охват разнообразных способностей с гибкой многоуровневой системой подсчета показателей соответственно конкретным целям тестирования. Хотя оба этих примера относятся к индивидуальным тестам интеллекта, тот же комплексный и гибкий подход к конструированию и проведению тестов реализуется при создании групповых тестовых батарей, таких как рассматриваемые в главе 10. Теоретическая основа и практические следствия такого слияния программ тестирования способностей обсуждаются в главе 11, в связи с современными достижениями в области изучения природы интеллекта.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|