Работа устройства без противодействия человека
Модель, имитирующая работу устройства. Работа устройства без противодействия имитировалась на ЦВМ. На модели имитировалась игра устройства с противником, в которой оно работает по вышеприведенному алгоритму, а выбор указания противником равновероятен для каждого соседнего узла на каждом шаге. Эту модель можно интерпретировать как блуждание без противодействия, когда действия путника таковы: в каждом узле он бросает жребий и, в зависимости от номера хода, либо следует выпавшему указанию, либо выбирает противоположный узел. Поскольку отношение противоположности не является взаимно однозначным, то употребление подобной стратегии в принципе должно изменить среднюю длину блуждания по сравнению с «обычным» блужданием, когда путник не пользуется отношением противоположности. В нашем случае отношение противоположности не в пользу путника. Руководствуясь подобным алгоритмом обработки жребия, путник увеличивает среднюю длительность своего пребывания в лабиринте по сравнению со случайным блужданием. Среднее число ходов оказалось равным 27, а при случайном блуждании — 25. Для доказательства факта оптимизации мы должны сопоставлять работу системы при противодействии (т.е. указания дает человек) с работой без противодействия, когда система сама бросает жребий, но руководствуется тем же алгоритмом, что и в игре с человеком. В принципе мы не можем сопоставлять работу системы при противодействии человека, когда система использует отношение противоположности, с работой системы при случайном блуждании, ибо нельзя исключить возможность, что оптимизация при игре с человеком достигается именно за счет особенностей таблицы противоположных узлов, которая перераспределяет вероятности, а не за счет противодействия. Но поскольку в нашем случае, пользуясь отношением противоположности, система блуждает дольше, мы будем сопоставлять работу системы при противодействии с работой системы при
случайном блуждании. Это вызвано тем, что для случайного блуждания легко построить интересующую нас функцию распределения. Построение функции распределения при случайном блуждании. Пусть Ро(т) — вероятность того, что партия окончится за число ходов, не превышающее т' В нашем случае Ро(т) можно определить исходя из того, что.процесс 'блуждания представим в виде цепи Маркова (рис. 41). Первому элементу этой цепи соответствует центральный узел— 13 (см. рис. 40); второму элементу — уровень, состоящий из узлов 7, 12, 14, 16, 17; третьему элементу соответствует уровень, состоящий из узлов 6, 8, 22, 15, 18; четвертому — уровень из узлов 3, 10, 11, 21, 23; пятому — уровень из узлов 2, 4, 19, 20, 25 и шестому — точки поглощения /, 5, 9, 24, 26. Данной цепи Маркова соответствует матрица А. В силу соотношений, известных из теории цепей Маркова, вероятность того, что точка будет поглощена за число ходов, не превышающее 30, равна элементу а16 матрицы Am (т — показатель степени, в которую следует возводить матрицу). Сопоставление работы устройства в условиях противодействия и при отсутствии противодействия. Обсуждение результатов Pис. 42.
В качестве среднего числа ходов путника при отсутствии противодействия нами взято число 25, которое является средней длиной блуждания. В условиях противодействия по первым партиям среднее число ходов оказалось равным 15, по вторым партиям—18. Эти данные позволяют сделать вывод, что система оптимизирует свою работу в результате противодействия человека. Общую картину работы системы хорошо иллюстрируют функции распределения (.рис. 42): I—при случайном блуждании, II—по первым партиям, III—по вторым партиям. В качестве дополнительного критерия оптимизации может быть выбрана разность медиан. Медиана при случайном блуждания равна 19; медиана по первым партиям—11; медиана по вторым партиям — 10. Сдвиг медиан влево (см. рис. 42) при противодействии может рассматриваться как признак оптимизации.
Графическое изображение партии. Ниже приведен протокол, фиксирующий партию.
В крайних столбцах записываются номера уровней, соответствующих данным узлам. Этот протокол может быть представлен особым графиком (рис. 43). Горизонтальные линии соответствуют различным уровням. Связи между ними задаются в соответствии с рис. 41. Каждая вертикальная линия соответствует очередному ходу. Жирная стрелка указывает движение путника по уровням на очередном ходе. В результате на рисунке изображается траектория его движения по уровням. Пунктирные стрелки изображают указания, которые дает испытуемый. Причины оптимизации. Оптимизация достигается в результате того, что программа проводит рефлексивное управление испытуемым Это управление осуществляется следующим образом: первые пять ходов программа совершает со знаком «+» (пунктирные стрелки совпадают с жирными стрелками). Испытуемый интерпретирует эти ходы, как послушание путника. В течение этих первых пяти ходов система формирует у испытуемого убеждение в том, что она послушна, т.е. что ее «доктрина» — слушаться.
Рис. 43. После того, как такое убеждение произведено, путник начинает его эксплуатировать, выбирая узлы, противоположные указываемым. Путнику «известна» цель испытуемого, кроме того, путник обладает картиной своей «доктрины» с точки зрения испытуемого. Этих данных ему достаточно, чтобы ориентировать свой «планшет», так как с его точки зрения испытуемый дает ему указания, отдаляющие его от выходов. Следовательно, если он будет выбирать узлы, противоположные указываемым, он будет приближаться к воротам. Разумеется, машина не проводит этих рассуждений. Их проводил программист, выбирая последовательность чисел.
На рис. 43 видно, что испытуемый после первых шести хода пытался выводить путника к центру и, тем самым, ориентировал его фактически сам человек «выбрасывает» путника из лабиринта. Некоторые испытуемые, после того как путник перестал слушаться, проимитировали его действительную доктрину — выбирать хода, противоположные указанным, и стали указывать ему на периферийные узлы, с целью отбросить его к центру лабиринта. Рассмотри следующую характерную партию (рис. 44). Поверив в послушание путника, испытуемый своим шестым ходом хотел вывести его на четвертый уровень, но путник перестал слушаться и ушел на второй уровень. После подобной реакции у человека произошло изменение представления о доктрине, которой руководствуется путник. Теперь испытуемый убежден, что путник не слушается, и следовательно, ему нужно указывать на периферию.: Заметим, что само осознание того, что путник непослушен, еще не дает автоматически способа работы. Испытуемый должен решить проблему—какие указания в этом случае давать (большинство испытуемых эту проблему не решило). Начиная с двенадцатого хода, путник вновь слушается, а человек, используя хорошо отработанный способ действия, указывает на периферию. Но поскольку путник слушается (на осознание этого человек истратил два хода), человек начинает ему указывать на узлы, ведущие к центру. Начиная с четырнадцатого хода путник снова перестает слушаться и, поскольку он убедил противника в своем послушании, получает возможность выбраться из лабиринта *). Победа путника объясняется тем, что он формирует вполне определенное поведение человека, использует его, затем формирует новое поведение, начинает им пользоваться и т.д. в среднем обгоняя человека.
Рис. 44
Мы сознательно не употребляем понятие обучения для характеристики формирования поведения человека, так как человек непрерывно рефлексирует, и тот факт, что его учат, может быть им осознан. Он может начать строить свое поведение исходя из того, что его учат. Нам представляется, что понятие рефлексивного управления более точно схватывает суть дела. Путник только дает основания для принятия решения. Подобное устройство является своеобразным «выпрямителем» информации.
Программа была подобрана экспериментально, поскольку никакой информации о скоростях осознания априорно получить невозможно. По-видимому, в рамках подобных экспериментов скорости осознания достаточно стандартны. Обратим внимание на одно очень важное обстоятельство. Система играет с человеком, не имея обратной связи между алгоритмом. который управляет действиями путника, и испытуемым **). Путник не получает информации о том, успешно или неуспешно он противостоит человеку. Последовательность чисел, которая им управляет, есть особое представление «априорной модели» испытуемого, производящего акты осознания. Автомат, если его «антропоморфировать, имеет модель испытуемого, включающую «акты осознания», которые влекут за собой изменение его действий; поэтому автомат может их прогнозировать, не имея никакой реальной информации, т.е. не имея контура обрат- *) Заметим, что отношение противоположности позволяет путнику при некоторых указаниях оставаться на втором уровне. Поэтому на седьмом и восьмом ходах путник не перешел на первый уровень. На десятом ходу путник «не слушается» но поскольку он находится на первом уровне, он должен с него сойти. Факт «непослушания» фиксируется несовпадением сплошной и пунктирной стрелок. **) Читателю имеет смысл снова вернуться к рассмотрению схемы на рис. 18 (гл. III). -ной связи. Конечно, следует учесть, что такой контур был, когда экспериментально отыскивались чередования скоростей осознания, т.е. когда создавалась «априорная модель». Однако в каждом отдельном эксперименте автомат может работать, не имея обратной связи с испытуемым; другими словами, человек своими действиями не влияет на жесткий алгоритм, управляющий послушаниями и непослушаниями. Заметим еще следующее. Испытуемый играл с алгоритмом. Путник — это особый элемент его внутреннего мира, сформированный инструкцией. Задача экспериментатора как раз и заключалась в том, чтобы инструкцией (которая сама по себе является особой формой рефлексивного управления) создать требуемый «игровой» внутренний мир испытуемого. Огонек должен превратиться в «путника», а граф нарисованный на табло, — в «город». В этом эксперименте экспериментатор должен быть выключен из картины, лежащей перед испытуемым.
Но возможен другой эксперимент, в котором испытуемый осознает, что является участником искусственной ситуации (точнее, осознание этого делается доминирующим), и более того, что он играет с жесткой программой, которая заложена экспериментатором. В этом случае строение внутреннего мира испытуемого — принципиально иное. Сам экспериментатор делается особым персонажем этого внутреннего мира. Начинается игра не с путником, а с экспериментатором. Это — принципиально иной эксперимент. Мы проделали несколько экспериментов подобного рода. Испытуемый (им был один из экспериментаторов) знал, что другой экспериментатор будет составлять специальную программу именно для него. Рефлексивная игра делается совершенно иной. Различие между первым и вторым экспериментами можно проиллюстрировать схемами, изображенными на рис. 45 (схема первого эксперимента) и рис. 46 (схема второго эксперимента). Таким образом, во втором случае реальная экспериментальная.ситуация осознается испытуемым. Экспериментаторы имеют возможность проводить своеобразные соревнования: кто из них более точно проимитирует программу, составленную другим. Подобное соревнование может явиться фрагментом методики, позволяющей определять, кто из двоих эффективнее имитирует внутренний мир другого. Подобный эксперимент можно проводить следующим образом. Оба испытуемых должны одновременно написать программы друг для друга. Каждый из них не должен наблюдать за реализацией взаимодействия своего алгоритма с другим партнером, поскольку, проанализировав «манеру», в которой играет его противник, он может (в силу незнания механизма, мы скажем: «интуитивно») воссоздать тот алгоритм, который написан для него. Соревнование подобного типа, проведенное для группы испытуемых, позволит построить граф превосходства в имитирующих способностях членов группы, попарно друг над другом.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|