Цель оправдыва-Ю-т средства.
В этой «Ю» вся разница: ошибочная цель — почти мгновенный эпизод в длительном процессе применения безошибочных средств, в отличие от разрушения, где заведомо дурные средства пятнают благую цель. Упреждающее вписывание порождает иерархию структур с минимальным в сопоставлении с разрушением для интеграции обломков количеством дефектов во всём её множестве векторов целей. Упреждающему вписыванию сопутствует и тенденция к формированию соборного интеллекта. В процессе упреждающего вписывания образуется многорегиональный блок, обладающий колоссальным запасом устойчивости по глубине идентичности во всём его множестве объективных и потенциальных векторов целей в сопоставлении с конгломератом, управляемым межрегиональным центром. Кроме многорегиональных блоков в суперсистеме могут оказаться регионы, длительное время развивающиеся в информационной изоляции от остальной суперсистемы. Изолированное самостоятельное развитие в таких условиях роднит изолированный регион и блок: они (совместно и порознь) обладают более высоким запасом устойчивости управления по глубине идентичности векторов целей. Концентрация управления может идти в суперсистеме двумя путями одновременно на каких-то этапах освоения ею потенциала развития, но какие-то центры управления объективно в ней больше склонны к упреждающему вписыванию, а другие — к разрушению управления конкурентов и интеграции обломков. Поэтому на каком-то этапе процесса концентрации управления суперсистемой, объемлющей регионы, вероятно столкновение межрегионального конгломерата и многорегионального блока. Результат такого столкновения определяется не совокупной мощностью ресурсов каждой из конфликтующих сторон, а субъективным фактором, связанным главным образом с блоком.
Блок имеет объективное преимущество перед конгломератом по запасу устойчивости процессов в блоке, обусловленному большей глубиной идентичности объективных и субъективных векторов целей. Но субъективный вектор целей центра управления блоком (центра обособившегося в блоке) может стать даже антагонистичным к его же объективному и потенциальному векторам целей, прежде всего, — в результате информационно-алгоритмической агрессии межрегионального центра через не контролируемые центром блока контуры управления. По этой причине блок не застрахован от разрушения его центра управления, общеблочных структур и инфраструктуры в ходе информационной агрессии межрегионального центра. Но от последствий такой агрессии не застрахован и межрегиональный центр, поскольку вместе с элементными ресурсами блока и его обломками он интегрирует в себя и всю совокупность процессов, объективно протекающих в блоке, подчинённых объективному вектору целей блока. Поскольку объективные вектора целей блока обладают крайне низкой дефективностью, то интеграция блока в конгломерат требует в достаточно короткие сроки внедрить в объективные вектора целей блока дефекты. Для этого необходимо: остановить действие внутриблочных факторов устранения дефектов в векторах целей; и выявить господствующие в блоке вектора целей, поскольку внесение дефектов необходимо проводить в кратчайшее время и прицельно. Но восприятие объективного вектора целей блока в его соотнесении с вектором целей иерархически высшего объемлющего управления вплоть до иерархически наивысшего — дело субъективное и не простое даже для центра управления блоком, а не то что для центра управления конгломератом. То есть при восприятии возможны ошибки, самой тяжелой из которых является восприятие блока в качестве конгломерата, подобного собственному. Другими словами, труднее всего оценить вектор ошибки управления по отношению к иерархически Наивысшему, т.е. потенциальный вектор целей блока. Неидентифицированность (невыявленность) вектора ошибки управления поглощаемой системы — основа непредсказуемости последствий поглощения, т.е. вероятностная предопределённость катастрофического разрешения неопределённостей в собственном управлении конгломерата.
Вторая сторона идентификации векторов целей связана с цейтнотом, в котором оказывается межрегиональный центр в процессе интеграции достаточно обширного блока в конгломерат. Дело в том, что, пока блок управлялся своим центром управления, можно было довольно точно распознать объективный общеблочный вектор целей и субъективный вектор целей блока, но труднее всего оценить потенциальный вектор целей блока, содержащий реальные возможности, не используемые его центром управления по субъективным причинам. Цели в векторах всегда связаны с объективными процессами широкого частотного диапазона. Низкочастотные колебательные процессы в природе обычно более энергоёмки, чем высокочастотные однокачественные с ними процессы и поглощают энергию и алгоритмику высокочастотных с течением времени. Кроме того, с высокочастотным процессом может быть информационно-алгоритмически связан низкочастотный процесс, огибающий плавной кривой максимумы или минимумы высокочастотного, примером чего является амплитудная модуляция в звуковом радиовещании[54]. Реакция блока на попытку его интеграции в конгломерат протекает во всех частотных диапазонах взаимодействия. Идентификация низкочастотных процессов (несущих большую энергию) и процессов-огибающих требует длительного времени, чего нет в цейтноте; либо же требует обращения к структурам внешнего управления, которые длительное время вели наблюдение за блоком и возможно также принимали участие в управлении им и имеют свои виды на будущее в отношении и блока, и конгломерата. При этом дело усложняется и тем, что активизируются процессы, связанные с потенциальным вектором целей блока, интенсивность которых была ничтожна до начала интеграции блока в конгломерат (собственно вследствие этого попытка поглощения блока конгломератом и становится возможной).
Об этих процессах имеет представление не просто внешнее, а только иерархически Наивысшее по отношению к суперсистеме управление, которому межрегиональный центр пока противится. Но глубина идентичности вектора целей иерархически высшего управления и объективного вектора целей блока в силу построения блока методом упреждающего вписывания вероятно глубже, чем у межрегионального центра, поскольку, в отличие от блока, построение конгломерата предполагает и антагонизацию фундаментальной и адаптационной частей информационного обеспечения. Поэтому поддержка блока Свыше более вероятна, чем поддержка Свыше конгломерата. Обширность векторов целей блока; многократное дублирование без инверсий и антагонизмов одних и тех же целей в разных частных векторах целей в разных фрагментах блока, складывающиеся в течение всего времени существования блока, соизмеримого со временем возникновения автономных регионов и межрегионального центра в суперсистеме; субъективизм восприятия вектора целей со стороны межрегионального центра; действие факторов восстановления автономного центра управления блоком по полной функции (или нескольких центров, осуществляющих параллельное управление в нём и достигающих тождественности управления, проистекающего от каждого из них); вероятностная предопределённость разрешения бескомпромиссного конфликта межрегионального центра с иерархически высшим (объемлющим) управлением — не гарантирует межрегиональный центр от вероятного восстановления управления в блоке по полной функции, причем с более высоким качеством и запасом устойчивости управления, чем прежде. За этим может последовать эффективное вписание конгломерата в блок благодаря низкому запасу устойчивости периферии конгломерата по глубине идентичности векторов целей, поскольку восстановление управления блоком вероятно сопровождается выявлением (идентификацией) причин потери управления в нём, т.е. агрессия межрегионального центра перестаёт быть тайной для блока. Это тем более правильно, если соборный интеллект блока уже разбужен агрессией конгломерата и его деятельность реально проявляется хотя бы как вспышки, если не как непрерывный устойчивый процесс.
Если же ко времени начала поглощения блока конгломератом в блоке устойчиво функционирует соборный интеллект, ставший новым звеном в иерархически высшем по отношению к элементам суперсистемы управлении, то конгломерат просто обречён: · во-первых, соборному интеллекту блока гарантирована иерархически высшая поддержка; · во-вторых, любой соборный интеллект сам по себе мощнее, чем сопряженный интеллект конгломерата, пытающийся подменить собой его соборный интеллект. Соотношение производительности и ресурсных запасов блока и конгломерата в этой ситуации роли играть не будет, поскольку потеря управления в конгломерате вероятностно предопределённо носит характер срыва управления, а регион, отколотый от конгломерата, объективно нуждается в осуществлении полной функции управления общесуперсистемной значимости, к осуществлению которой он сам в момент откола не способен, а блок её может дать. Поскольку дефективность векторов целей в регионах конгломерата поддерживается искусственно, то для повышения запаса устойчивости управления вписываемым в блок регионам блочному центру управления как минимум достаточно не тормозить общесуперсистемных факторов устранения дефектов в их векторах целей, а как максимум — целенаправленно устранять выявленные в регионах дефекты. Действия блока по отношению к регионам конгломерата являются теми же действиями, которые межрегиональный центр управления вынужден будет предпринять и сам для сохранения себя в конфликте с иерархически высшим (объемлющим) управлением, предполагающим освоение потенциала развития суперсистемы. Поэтому в своих действиях, проводя упреждающее вписывание, блок не противоречит тенденциям освоения потенциала развития; действия же межрегионального центра в прошлом и в перспективе противоречат этой тенденции. Это и проявляется в упреждающем вписывании высокочастотных процессов в низкочастотные; если этого не делать, то высокочастотные, не вписанные процессы, порождают модулирующие их (объемлющие) не управляемые низкочастотные процессы, что выливается в неорганизованный выброс энергии с разрушением структур суперсистемы, её элементной базы, потерей ею информации. Выглядит это как срыв управления и по своему существу является разновидностью катастрофического разрешения неопределённостей вследствие ошибочности в решении задачи о предсказуемости поведения (или отказа от решения такой задачи).
Во избежание этого процесс управления должен идти в согласии с иерархически Наивысшим управлением, которое необходимо уметь выделить во множестве информационных потоков просто внешнего управления в отношении суперсистемы и не отвергать его предупреждений, целесообразность которых может быть даже непонятной на уровне информированности суперсистемы. * * * По отношению к обществу, рассматриваемому как суперсистема, это означает, что алгоритмика упреждающего вписывания должна развёртываться, ориентируясь на переход к человечному типу строя психики как к единственно нормальному для людей. В этом случае — она наиболее эффективна в смысле достижения целей и необратимости результатов, поскольку развёртывается в русле Промысла и при прямой и опосредованной поддержке иерархически Наивысшего всеобъемлющего управления. Тем не менее, и носители демонического типа строя психики могут в своём развитии выйти на осуществление ими концентрации управления методом упреждающего вписывания. Однако в этом случае у них будут неизбежны конфликты с иерархически Наивысшим всеобъемлющим управлением как при осуществлении управления в пределах их автономного региона суперсистемы, так и за его пределами в границах суперсистемы в целом. При развёртывании алгоритмики упреждающего вписывания на основе демонического типа строя психики, при её неоспоримо более высокой эффективности, чем у алгоритмики разрушения и поглощения обломков, она неизбежно будет приводить к срывам управления, ввергающим её приверженцев в катастрофу, из которой нет выхода, либо ставящим их на грань такой катастрофы. Дело в том, что разрушение автономных регионов и формирование конгломерата — более очевидное и более слабое зло, нежели формирование блока методом упреждающего вписывания на основе демонического типа строя психики: Благодаря низкому качеству управления в конгломерате, низкому запасу устойчивости управления в нём перейти от конгломерата к блоку и целостной суперсистеме, в которых господствует человечный тип строя психики, проще, нежели от блока, в котором господствует демонический тип строя психики.[55] * * При этом процесс поглощения блока конгломератом может сопровождаться попыткой навязать блоку конгломератные стереотипы распознавания иерархически высшего по отношению к суперсистеме в целом управления. Успешность этой попытки зависит от вектора целей и устойчивости процесса иерархически высшего управления, общего по отношению к блоку и конгломерату, а именно — что оно предпочтёт на данном этапе: · ускоренную концентрацию управления со стороны конгломерата, дабы потом низвергнуть структуры управления им; · формирование соборного интеллекта в блоке с поглощением конгломерата в блок до завершения концентрации управления по конгломератно-межрегиональному способу; · обучение соборного интеллекта блока добру на примере агрессии конгломерата. В целом же в ходе освоения потенциала развития суперсистемы протекает процесс вытеснения примитивных схем управления более развитыми, обеспечивающими более высокое качество управления в смысле высвобождения ресурсов. При этом структурное и бесструктурное управление становятся неразличимыми. Ранее было показано, что текущие элементные запасы устойчивости суперсистемы, а следовательно и её производительность, тем выше, чем меньше информационное состояние памяти элементов в процессе их функционирования отличается от опыта памяти суперсистемы в целом, накопленного за всё время её пребывания в среде. К этому можно добавить: и чем быстрее доступны каждому из элементов в процессе его деятельности свободные интеллектуальные ресурсы суперсистемы. Это предполагает высокое быстродействие и пропускную способность каналов информационного обмена между элементами по отношению ко времени, необходимому для обслуживания элементами частной цели, стоящей перед каждым их них. Пользование внешней информацией, выходящей за пределы возможностей собственного информационного обеспечения элемента, должно вероятностно предопределять более высокое качество его деятельности, чем игнорирование её. Именно по этой причине замусоривание информационной среды суперсистемы ложной информацией соответствует разрушению целостного управления суперсистемой и является средством концентрации управления методом разрушения с последующим поглощением обломков. Распространение ложной информации, однако, позволяет иногда быстро устранять некие текущие ошибки управления, но дальнейшее развитие процесса сопровождается возникновением ошибок управления, вызванных именно этой ложной информацией, которая никуда из суперсистемы не исчезает и на каком-то этапе становится основой ошибочного управления при извлечении ложной информации из памяти. Именно по этой причине в обществе нет разницы между ложью из своекорыстия и “благодетельной” ложью “во спасение”, хотя общество этого и не понимает и лжёт безбожно. Кроме того, “благодетельная” бескорыстная ложь одного “во спасение” может оказаться “водой” на мельницу чьего-то своекорыстия. Поэтому, когда заведомо ложная информация распространяется в суперсистеме, то процесс освоения её потенциала сдерживается ею, становление соборного интеллекта тормозится, качество управления падает. И это приводит к вопросу об устойчивости управления в условиях, когда в замкнутую систему возможно поступление недостоверной информации, а также когда недостоверная информация действительно попадает в систему. Всё разнообразие процессов управления можно соотнести с тремя типами алгоритмов выработки поведения замкнутой системы. Во всех ниже рассматриваемых случаях речь идёт об управлении по полной функции в ранее определённом смысле этого термина. ПЕРВЫЙ тип алгоритмов выработки управляющего решения (поведения) показан на рис. 1
Входной поток информации (внешние и внутренние обратные связи) поступает в преобразователь, где на основе сиюминутно текущей информации вырабатывается текущее управленческое решение, которое передаётся к исполнительным органам. Возможны такие варианты сочетания входного потока информации и характеристик преобразователя информации, вырабатывающего управленческое решение, в результате которых «самоуправляющаяся» таким образом система в действительности оказывается управляемой извне, если кто-то подает на её вход соответствующий поток информации, предвидя реакцию преобразователя на каждый из её вариантов. Но даже если такого управления извне и нет, то, непрестанно реагируя на сиюминутность и подчиняя текущей сиюминутности почти все свои ресурсы, система оказывается не в состоянии устойчиво ориентироваться на долгосрочную перспективу и, как следствие, — работать на её осуществление. Для того чтобы устойчиво ориентироваться на длительную перспективу и устойчиво работать на её достижение, эту определённую перспективу необходимо помнить в каждый миг обработки сиюминутно поступающей информации в процессе выработки и осуществления управленческого решения. Если это достигнуто, то управление протекает по алгоритмам второго и третьего типов. ВТОРОЙ тип алгоритмов управления показан на рис. 2. Входной поток информации, попадая в систему, прежде всего загружается в её память. Преобразователь информации, вырабатывающий управленческое решение, осуществляет выборку информации из памяти, соотнося накопленную памятью информацию с непрерывно поступающей информацией. Управленческое решение вырабатывается по существу на основе всей информации памяти, вследствие чего система сохраняет в управлении устойчивую ориентацию на цели долгосрочной перспективы. Она оказывается способной их достичь потому, что не теряет долгосрочных целей в процессе выработки и осуществления управленческих решений в потоке текущей информации. Отфильтровывая на основе информации памяти дестабилизирующую стратегическое управление высокочастотную составляющую всевозможной «суеты», подчиняясь которой в алгоритмах первого типа, система теряет цели долгосрочной перспективы и уклоняется от них в процессе управления, управляясь в русле алгоритмов третьего типа, система сохраняет устойчивость работы.
Тем не менее, при непосредственной загрузке в память поступающей текущей информации возможны поражения содержимого памяти и её структурной организации, аналогичные по своему характеру поражениям компьютерными вирусами файловой системы жёсткого диска и информации файлов, в ней хранящихся. Они могут затрагивать как базы данных, так и алгоритмы, на основе которых преобразователь информации вырабатывает управленческое решение. Иными словами, необходима защита памяти, — из которой преобразователь черпает необходимую информацию в процессе выработки управленческого решения. Это приводит к алгоритму третьего типа. ТРЕТИЙ тип алгоритмов управления показан на рис. 3.
В нём всё происходит, как и во втором типе, но перед загрузкой в память входного потока информации он пропускается через алгоритм-сторож, которые выявляет недостоверную и сомнительную информацию, в том числе и попытки прямого и косвенного (опосредованного) управления извне, для того, чтобы выработка управленческого решения исходила бы только на информации, признанной достоверной. В тех случаях, когда возникают затруднения с определением качества информации, алгоритм — сторож памяти — помещает её в специализированную область памяти, показанную на рис. 3 блоком, названным «Карантин», для последующего выяснения её достоверности. Алгоритм, показанный на рис. 3, предполагает, что блок под названием «Преобразователь информации» обладает в системе наивысшими полномочиями. Потому он может перемещать информацию из «Карантина» в область нормальной «Памяти» и изменять «Алгоритм — сторож памяти» по мере накопления системой опыта взаимодействия со средой, что требует в процессе управления переоценки содержимого памяти по категориям «достоверно», «ложно», «сомнительно», «не определённо». Бросающаяся в глаза разница в поведении систем, управляющихся на основе алгоритмов первого типа и алгоритмов второго и третьего типов, состоит в том, что изменение входного информационного потока в алгоритмах первого типа вызывает немедленное (по отношению к быстродействию «Преобразователя информации») изменение управления; в алгоритмах второго и третьего типа изменение входного потока информации может вообще не вызвать никакого видимого изменения в управлении либо может вызвать изменения в управлении спустя какое-то, подчас весьма продолжительное, время. Если же в алгоритм выработки управленческого решения включается прогноз поведения системы (используется схема «предиктор-корректор»), то изменение управления может упреждать изменение потока входной информации. Однако, несмотря на такое извне видимое безразличие в поведении системы по отношению ко входному потоку информации, в алгоритмах второго и третьего типов входная информация не игнорируется. В сопоставлении их с алгоритмами первого типа в них она обрабатывается иначе: так, чтобы она была подчинённой достижению целей долгосрочной перспективы или, чтобы на её основе выявилась невозможность достижения системой ранее определённой для управления ею перспективы[56]. Алгоритмы третьего типа из числа описанных обладают наивысшей помехоустойчивостью как по отношению высокочастотным шумам среды и собственным шумам системы, так и по отношению к попыткам управления системой извне, направленным на то, чтобы подчинить себе управление на основе деятельности её собственного преобразователя информации или исключить его из процесса управления. Вынужденность перехода в управлении от алгоритма третьего типа к алгоритму первого типа под давлением обстоятельств должна рассматриваться как чрезвычайная ситуация, аварийный режим управления, в котором первоприоритетной задачей управления является выявление внутренних резервов системы и резервов внешних обстоятельств, использование которых позволяет восстановить нормальное управление по алгоритму третьего типа. Только это позволяет реализовать запас устойчивости системы, поддерживая в течение некоторого времени управление по алгоритмам первого типа. При принципиальном отказе перейти от алгоритмов управления первого типа к алгоритмам управления третьего типа, запас устойчивости системы необратимо исчерпывается. По существу такая стратегия управления является гарантированным переносом необратимой катастрофы в будущее. Эта стратегия достаточно часто находит своё выражение в общеизвестной фразе: «Некогда тут думать и обсуждать? — работать надо: сами видите, какие обстоятельства сложились». Но приверженность этой стратегии приводит к тому, что катастрофа неизбежно наступает, если обстоятельства не изменяются сами собой. Этого, как известно, не бывает, поскольку обстоятельства изменяются под воздействием того или иного управления. Когда заведомо недостоверная информация в суперсистеме отсутствует либо в ней господствуют алгоритмы управления третьего типа, эффективность которых достаточна, то (в случае освоения потенциала быстродействия и пропускной способности каналов информационного обмена) все структуры в иерархической лестнице — от элемента до суперсистемы — становятся субъективно неустойчивыми. Субъективная неустойчивость понимается в том смысле, что, если структура, несущая какую-то информацию и алгоритмику, сталкивается с непомерным для неё давлением среды, то исходя из повышения качества управления суперсистемой в целом, может оказаться выгоднее перераспределить информационно-алгоритмическую нагрузку элементов суперсистемы. Это под силу только для соборного интеллекта, мощного внешнего управления и иерархически Наивысшего управления. Поскольку неопределённое внешнее управление может быть и агрессивным по отношению к суперсистеме и её элементам, то вопрос о различении источников внешних информационных потоков в процессе самоуправления суперсистемы — вопрос № 1 всегда. 13.8. Взаимно вложенные суперсистемы Когда суперсистема выходит в режим устойчивого самоуправления ею со стороны соборного интеллекта, различающего иерархически Наивысшее управление от внешних информационных вторжений и обеспечивающего эту способность и на уровне организации составляющих его интеллектов, она осваивает потенциал развития в кратчайшее время. Изнутри суперсистемы это состояние воспринимается как отсутствие конфликтов самоуправления элементов суперсистемы и их объединений и максимальный уровень защищенности от давления среды, через которую протекает иерархически высшее объемлющее управление. Общность в процессе самоуправления элементов информационно-алгоритмической и интеллектуальной базы[57] суперсистемы, в сочетании с господством интеллектуальных схем управления предиктор-корректор на уровне суперсистемы в целом и вложенных в неё иерархических уровнях, делают несущественной мгновенную её структурно-иерархическую упорядоченность, стирают различие между структурным и бесструктурным управлением и процесс видится как взаимная вложенность гибких (виртуальных) структур в общесуперсистемной схеме предиктор-корректор соборного интеллекта. Повторное обращение к вероятностной памяти с одним и тем же вопросом на этом этапе будет давать в одинаковой обстановке всё меньше разбросов ответов. Но это будет не шаблонность автомата, соответствующего уровню фундаментальной части информационного обеспечения, а оптимальное в некотором смысле решение в данных условиях при данном уровне развития суперсистемы. И то, что воспринимается как “шаблонность решений”, может быть целевым отказом от решений, уступающих оптимальному в данных условиях внешней обстановки и при достигнутом внутреннем уровне развития. По завершении освоения потенциала развития суперсистема может служить одной из основ для следующего шага эволюции. После введения понятия взаимная вложенность суперсистем изложение достаточно общей теории управления вряд ли может быть чем-либо иным, кроме как своего рода «описанием устройства и принципов работы оргáна». Для того, чтобы быть органистом, знать устройство данного инструмента необходимо, но нужна ещё техника игры, репертуар, вкус, в основе чего лежит потенциал развития музыканта, чей организм в свою очередь является взаимным вложением суперсистем, построенных на клетках, физических полях, информационных и энергетических потоках. Если же не знать «устройства оргáна» и не играть на нём, то кто-то на “рояле в кустах” будет играть препротивные “пьесы”, от которых некуда будет деться. Это означает, что необходимо не только воспринимать поток событий жизни своими чувствами и вниманием, но и выработать систему образно-логических представлений о процессах управления как таковых. Мы живём в такое время, когда это проще всего сделать на основе инструмента, получившего название «метод динамического программирования». 14. Метод динамического программирования В изложении существа метода динамического программирования мы опираемся на книгу “Курс теории автоматического управления” (автор Палю де Ла Барьер: французское издание 1966 г., русское издание — “Машиностроение”, 1973 г.), хотя и не повторяем его изложения. Отдельные положения взяты из курса “Исследование операций” Ю.П.Зайченко (Киев, “Вища школа”, 1979 г.). Метод динамического программирования работоспособен, если формальная интерпретация реальной задачи позволяет выполнить следующие условия: 1. Рассматриваемая задача может быть представлена как N ‑шаговый процесс, описываемый соотношением: Xn + 1 = f(Xn, Un, n), где n — номер одного из множества возможных состояний системы, в которое она переходит по завершении n -ного шага; Xn — вектор состояния системы, принадлежащий упомянутому n -ному множеству; Un — управление, выработанное на шаге n (шаговое управление), переводящее систему из возможного её состояния в n -ном множестве в одно из состояний (n + 1)‑го множества. Чтобы это представить наглядно, следует обратиться к рис. 4, о котором речь пойдет далее. 2. Структура задачи не должна изменяться при изменении расчетного количества шагов N. 3. Размерность пространства параметров, которыми описывается состояние системы, не должна изменяться в зависимости от количества шагов N. 4. Выбор управления на любом из шагов не должен отрицать выбора управления на предыдущих шагах. Иными словами, оптимальный выбор управления в любом из возможных состояний должен определяться параметрами рассматриваемого состояния, а не параметрами процесса, в ходе которого система пришла в рассматриваемое состояние. Чисто формально, если одному состоянию соответствуют разные предыстории его возникновения, влияющие на последующий выбор оптимального управления, то метод позволяет включить описания предысторий в вектор состояния, что ведёт к увеличению размерности вектора состояния системы. После этой операции то, что до неё описывалось как одно состояние, становится множеством состояний, отличающихся одно от других компонентами вектора состояния, описывающими предысторию процесса. 5. Критерий оптимального выбора последовательности шаговых управлений Un и соответствующей траектории в пространстве формальных параметров имеет вид: V = V0(X0, U0) + V1(X1, U1) + … + VN - 1(XN- 1, UN - 1) + VN(XN). Критерий V принято называть полным выигрышем, а входящие в него слагаемые — шаговыми выигрышами. В задаче требуется найти последовательность шаговых управлений Un и траекторию, которым соответствует максимальный из возможных полных выигрышей. По своему существу полный “выигрыш” V — мера качества управления процессом в целом. Шаговые выигрыши, хотя и входят в меру качества управления процессом в целом, но в общем случае не являются мерами качества управления на соответствующих им шагах, поскольку метод предназначен для оптимизации управления процессом в целом, а эффектные шаговые управления с большим шаговым выигрышем, но лежащие вне оптимальной траектории, интереса не представляют. Структура метода не запрещает при необходимости на каждом шаге употреблять критерий определения шагового выигрыша Vn, отличный от критериев, принятых на других шагах. С индексом n — указателем-определителем множеств возможных векторов состояния — в реальных задачах может быть связан некий изменяющийся параметр, например: время, пройденный путь, уровень мощности, мера расходования некоего ресурса и т.п. То есть метод применим не только для оптимизации управления процессами, длящимися во времени, но и к задачам оптимизации многовариантного одномоментного или нечувствительного ко времени решения, если такого рода “безвременные”, “непроцессные” задачи допускают их многошаговую интерпретацию. Теперь обратимся к рис. 4 — рис. 6, повторяющим взаимно связанные рис. 40, 41, 42 из курса теории автоматического управления П. де Ла Барьера.
На рис. 4 показаны начальное состояние системы — «0» и множества её возможных последующих состояний — «1», «2», «3», а также возможные переходы из каждого возможного состояния в другие возможные состояния. Всё это вместе похоже на карту настольной детской игры, по которой перемещаются фишки: каждому переходу-шагу соответствует свой шаговый выигрыш, а в завершающем процесс третьем множестве — каждому из состояний системы придана его оценка, помещенная в прямоугольнике. Принципиальное отличие от игры в том, что гадание о выборе пути, употребляемое в детской игре, на основе бросания костей или вращения волчка и т.п., в реальном управлении недопустимо, поскольку это — передача целесообразного управления тем силам, которые способны управлять выпадением костей, вращением волчка и т.п., т.е. тем, для кого избранный в игре «генератор случайностей» — достаточно (по отношению к их целям) управляемое устройство. Если выбирать оптимальное управление на первом шаге, то необходимо предвидеть все его последствия на последующих шагах. Поэтому описание алгоритма метода динамического программирования часто начинают с описания выбора управления на последнем шаге, ведущем в одно из завершающих процесс состояний. При этом ссылаются на «педагогическую практику», которая свидетельствует, что аргументация при описании алгоритма от завершающего состояния к начальному состоянию легче воспринимается, поскольку опирается на как бы уже сложившиеся к началу рассматриваемого шага условия, в то время как возможные завершения процесса также определены.
В соответствии с этим на рис. 5 анализируются возможные переходы в завершающее множество состояний «3» из каждого возможного состояния в ему предшествующем множестве состояний «2», будто бы весь предшествующий путь уже пройден и осталось последним выбором оптимального шагового управления завершить весь процесс. При этом для каждого из состояний во множестве «2» определяются все полные выигрыши как сумма = «оценка перехода» + «оценка завершающего состояния». Во множестве «2» из полученных для каждого из состояний, в нём возможных полных выигрышей, определяется и запоминается максимальный полный выигрыш и соответствующий ему переход (фрагмент траектории). Максимальный полный выигрыш для каждого из состояний во множестве «2» взят в прямоугольную рамку, а соответствующий ему переход отмечен стрелкой. Таких оптимальных переходов из одного состояния в другие, которым соответствует одно и то же значение полного выигрыша, в принципе может оказаться и несколько. В этом случае все они в методе неразличимы и эквивалентны один другому в смысле построенного критерия оптимальности выбора траектории в пространстве параметров, которыми описывается система. После этого множество «2», предшествовавшее завершающему процесс множеству «3», можно рассматривать в качестве завершающего, поскольку известны оценки каждого из его возможных состояний (максимальные полные выигрыши) и дальнейшая оптимизация последовательности шаговых управлен
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|