Метод прогнозирования взаимодействия.
Альтернативный подход к оптимальному управлению иерархическими системами, который имеет как открытый, так и закрытый контур управления, - это метод прогнозирования взаимодействия, который основывается на работе Takahara (1965), который избегает упоминания о градиентных итерациях второго уровня. Рассмотрим большую линейную взаимосвязанную систему, которая декомпозирована на N подсистем, каждая из которых может быть описана
Где вектор взаимодействия zi:
Задача оптимального управления на первом уровне – найти управление ui(t), которое удовлетворяет (4.3.36)-(4.3.37), минимизируя обычную квадратичную функцию оценки:
Эту задачу можно решить введением множества множителей Лагранжа ai(t), и векторов косостояния pi(t), чтобы увеличить ограничение уравнения взаимодействия (4.3.37) и подсистем динамического ограничения (4.3.36) до подынтегральной функции оценки, т.е. Гамильтониан i-й подсистемы будет определен как:
Затем должно быть написано несколько необходимых условий:
где векторы ai(t) и zi(t) – уже не считаются неизвестными на первом уровне, и фактически ai(t) увеличивает zi(t), чтобы образовать широкоразмерный вектор согласования, который мы рассмотрим ниже. Для решения задачи первого уровня, надо принять
и подставить в (4.3.40)-(4.3.42), получив:
который образует линейную двухточечную краевую (ДТК) задачу, и, как в (4.3.33)
где gi(t) – это разомкнутый сопряженный или компенсирующий вектор, размерностью ni. Если обе части уравнения (4.3.47) продифференцированы и
где конечные условия Ki(tf) и gi(tf) вытекают из (4.3.41) и (4.3.47).
В результате данного уравнения оптимальное уравнение первого уровня становится
который имеет частичную закрытую обратную связь и прямую (открытую) обратную связь. Можно сделать два вывода. Первый, решение дифференциального, симметричного матричного уравнения Риккати, в которое включены ni(ni+1)/2 нелинейных скалярных уравнений не зависит от первоначального состояния xi(0). Второй, в отличие от Ki(t), gi(t) в (4.3.49) посредством zi(t) зависит от xi(0). Это свойство будет использовано в разделе 4.4, чтобы получить абсолютно закрытое управление в иерархической структуре. Задача второго уровня сильно изменяет новый вектор согласования
Значение ai(t) и zi(t) можно получить из:
т.е.:
Процедура согласования второго уровня на итерации (l+1) имеет вид:
Метод прогнозирования взаимодействия формулируется следующим алгоритмом: Алгоритм 4.2 Метод прогнозирования взаимодействия для непрерывных систем: Шаг 1. Решить N независимых дифференциальных матричных уравнений Риккати (4.3.48) с конечным условием (4.3.50) и сохраните Ki(t), i=1,2…,N. Инициализируйте ai(t) случайными числами и найдите соответствующее значение для zi(t). Шаг 2. На l-й итерации используйте значения Шаг 3. Решите уравнение состояния
И сохраните xi(t), i=1,2,…,N. Шаг 4. На втором уровне используйте результаты шагов 2 и 3 и (4.3.56) чтобы изменить согласующий вектор: Шаг 5. Проверьте сходимость на втором уровне, оценив общую ошибку взаимодействия:
Шаг 6. Если необходимая сходимость достигнута – остановитесь. Иначе, установите l=l+1 и перейдите к шагу 2. Важно отметить, что в зависимости от типа цифрового компьютера, и его операционной системы, расчеты подсистем могут осуществляться параллельно, а также N-матричное уравнение Риккати на шаге 1 не зависит от xi(0), и значит их необходимо вычислить один раз, не зависимо от числа итераций второго уровня в алгоритме прогнозирования взаимодействия (4.3.56). В отличие от методов согласования цели, zi(t) не нужен в функции оценки, который был необходим, чтобы избежать однородности, о чем будет написано в следующем разделе. Метод прогнозирования взаимодействия, введенный Tokahara (1965), был рассмотрен многими исследователями, которые внесли в него существенный вклад. Среди них Titli (1972) который назвал этот метод смешанным (Singh, 1980) и Cohen и др. (1974), который предоставил более убедительные доказательства сходимости чем предложенные ранее. Smith и Sage (1973) рассмотрели эту схему для нелинейных систем, которая будет рассмотрена в Главе 6. Сравнение методов прогнозирования взаимодействия, согласования цели и подходов без интеграции, рассмотренных в разделе 4.4, дано в разделе 4.5. Следующие два примера, а потом пример в САПР иллюстрирует метод прогнозирования взаимодействий. Пример 4.3.3. Рассмотрим систему четвертого порядка
Где x(0)=(-1,0.1,1.0,-0.5)T, квадратичная функция оценки Q=daig(2,1,1,2), R=diag(1,2) и нет граничного штрафа. Надо использовать метод прогнозирования взаимодействия и найти оптимальное управление для tf =1. Решение: Систему разделили на две подсистемы второго порядка и применили методы, описанные в алгоритме 4.2. На первом шаге решили два независимых дифференциальных матричных уравнения Риккати используя как дублирующий алгоритм Davison и Maki (1973), так и стандартный метод Рунге-Кутта. Элементы матрицы Риккати были представлены в виде квадратичного полинома в ряде Чебышева (Newhouse,1962), для удобства вычислений:
На первом уровне были решены два сопряженных уравнения второго порядка в виде (4.3.49) и два уравнения состояния подсистем, как показано в алгоритме 4.2 в шаге 3, используя метод четвертого порядка Рунге-Кутта и первоначальные значения
На втором уровне векторы взаимодействия [a11(t),a12(t),z11(t),z12(t)] и [a21(t),a22(t),z21(t),z22(t)]T были спрогнозированы с использованием рекурсивных отношений (4.3.56), и на каждой итерации производился обмен информацией с подсчетом общей ошибки взаимодействия (4.3.58) для Теперь рассмотрим второй пример. Пример 4.3.4. Рассмотрим систему восьмого порядка Необходимо использовать метод прогнозирования взаимодействия для нахождения u*.
Решение: Система была разложена на две подсистемы четвертого порядка и были выбраны tf=2, САПР пример 4.3.1. Рассмотрим систему четвертого порядка в примере 4.3.1 в (4.3.59): Где x(0)=(-1,0.1,1.0,-0.5)T, квадратичная функция оценки Q =diag(2,1,1,2), R=diag(1,2) и нет граничного штрафа. Необходимо использовать LSSPAK или подобное программное обеспечение и метод прогнозирования взаимодействия и найти оптимальное управление для tf=2. Решение: Как и раньше, система делится на две подсистемы второго порядка, и уравнения Риккати для подсистем решаются с использованием RICRKUT от LSSPAK/PC, а их решения представлены в виде полинома четвертого порядка для удобства вычислений. Используя программу INTRPRD от LSSPAK/PC реализуют алгоритм прогнозирования взаимодействия и схождение достигается за пять итераций. Точные выборки из выполнения этого САПр примера приведены ниже. Инструкции для вычерчивания программы прогнозирования взаимодействия появляются, когда на экране появится чертеж; нажмите Enter, чтобы вернуться к меню. Если вы хотите вывести чертежи через принтер откройте DOS файл GRAPHICS до запуска программы, когда вы захотите вывести чертеж, нажмите shift-PrtScr.
Optimization via the interaction prediction method. Initial time (to): 0 Final time (tf): 2 Step size (Dt):.1 Total no. of 2nd level iterations = 6 Error tolerance for multi-level iterations -.00001 Order of overall large scale system = 4 Order of overall control vector (r) = 2 Number of subsystems in large scale system = 2 Matrix Subsystem state orders-n sub i 0.200D+01 0.200D+01 Matrix Subsystem input orders-r sub i 0.100D+01 0.100D+01 Polynomial approximation for the Ricatti matrices to be used. Matrix Ricatti coefficients for SS# 1
Matrix Ricatti coefficients for SS# 2
System Matrix A
Matrix Input Matrix B
Matrix Input Cost Function R
Matrix Lagrange Multiplier Initial Values
Matrix Initial conditions vector xO
Subsystem no. 1 at 2nd level iteration no. 1 Subsystem no. 2 at 2nd level iteration no. 1 At second level iteration no. 1 interaction error = 0.347D+00 Subsystem no. 1 at 2nd level iteration no. 2 Subsystem no. 2 at 2nd level iteration no. 2 At second level iteration no. 2 interaction error = 0.771D - 03 Subsystem no. 1 at 2nd level iteration no. 3 Subsystem no. 2 at 2nd level iteration no. 3
At second level iteration no. 3 interaction error = 0.507D - 03 Subsystem no. 1 at 2nd level iteration no. 4 Subsystem no. 2 at 2nd level iteration no. 4 At second level iteration no. 4 interaction error = 0.323D - 04 Subsystem no. 1 at 2nd level iteration no. 5 Subsystem no. 2 at 2nd level iteration no. 5 At second level iteration no. 5 interaction error = 0.310D - 05
Оптимальные отклики показаны на рисунке 4.14, а схождение на рисунке 4.15. Другие применения метода прогнозирования взаимодействия представлены в разделе задач.
Воспользуйтесь поиском по сайту: ![]() ©2015 - 2025 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|