Метод прогнозирования взаимодействия.
Альтернативный подход к оптимальному управлению иерархическими системами, который имеет как открытый, так и закрытый контур управления, - это метод прогнозирования взаимодействия, который основывается на работе Takahara (1965), который избегает упоминания о градиентных итерациях второго уровня. Рассмотрим большую линейную взаимосвязанную систему, которая декомпозирована на N подсистем, каждая из которых может быть описана (4.3.36) Где вектор взаимодействия zi: (4.3.37) Задача оптимального управления на первом уровне – найти управление ui(t), которое удовлетворяет (4.3.36)-(4.3.37), минимизируя обычную квадратичную функцию оценки: (4.3.38) Эту задачу можно решить введением множества множителей Лагранжа ai(t), и векторов косостояния pi(t), чтобы увеличить ограничение уравнения взаимодействия (4.3.37) и подсистем динамического ограничения (4.3.36) до подынтегральной функции оценки, т.е. Гамильтониан i-й подсистемы будет определен как: (4.3.39) Затем должно быть написано несколько необходимых условий: (4.3.40) (4.3.41) (4.3.42) (4.3.43) где векторы ai(t) и zi(t) – уже не считаются неизвестными на первом уровне, и фактически ai(t) увеличивает zi(t), чтобы образовать широкоразмерный вектор согласования, который мы рассмотрим ниже. Для решения задачи первого уровня, надо принять как известную. Замете, что ui(t) можно выделить из (4.3.43): (4.3.44)
и подставить в (4.3.40)-(4.3.42), получив: (4.3.45) (4.3.46) который образует линейную двухточечную краевую (ДТК) задачу, и, как в (4.3.33) . Можно увидеть, что ДТК задача может быть разложена введением матрицы Риккати. Это выглядит как: (4.3.47) где gi(t) – это разомкнутый сопряженный или компенсирующий вектор, размерностью ni. Если обе части уравнения (4.3.47) продифференцированы и и из (4.3.46) и (4.3.45) подставлены в него, можно вновь использовать (4.3.47) и уравнительные коэффициенты для первого и нулевого порядка xi(t), получив следующие матричные и векторные дифференциальные уравнения: (4.3.48) (4.3.49) где конечные условия Ki(tf) и gi(tf) вытекают из (4.3.41) и (4.3.47). (4.3.50) В результате данного уравнения оптимальное уравнение первого уровня становится (4.3.51) который имеет частичную закрытую обратную связь и прямую (открытую) обратную связь. Можно сделать два вывода. Первый, решение дифференциального, симметричного матричного уравнения Риккати, в которое включены ni(ni+1)/2 нелинейных скалярных уравнений не зависит от первоначального состояния xi(0). Второй, в отличие от Ki(t), gi(t) в (4.3.49) посредством zi(t) зависит от xi(0). Это свойство будет использовано в разделе 4.4, чтобы получить абсолютно закрытое управление в иерархической структуре. Задача второго уровня сильно изменяет новый вектор согласования . Для этой цели определите аддитивно отделяемый Лагранжиан: (4.3.52) Значение ai(t) и zi(t) можно получить из: (4.3.53) (4.3.54) т.е.: (4.3.55) Процедура согласования второго уровня на итерации (l+1) имеет вид:
(4.3.56) Метод прогнозирования взаимодействия формулируется следующим алгоритмом: Алгоритм 4.2 Метод прогнозирования взаимодействия для непрерывных систем: Шаг 1. Решить N независимых дифференциальных матричных уравнений Риккати (4.3.48) с конечным условием (4.3.50) и сохраните Ki(t), i=1,2…,N. Инициализируйте ai(t) случайными числами и найдите соответствующее значение для zi(t). Шаг 2. На l-й итерации используйте значения чтобы решить сопряженное уравнение (4.3.49), с конечным условием (4.3.50). Сохраните gi(t), i=1,2,…,N. Шаг 3. Решите уравнение состояния (4.3.57) И сохраните xi(t), i=1,2,…,N. Шаг 4. На втором уровне используйте результаты шагов 2 и 3 и (4.3.56) чтобы изменить согласующий вектор: Шаг 5. Проверьте сходимость на втором уровне, оценив общую ошибку взаимодействия: (4.3.58) Шаг 6. Если необходимая сходимость достигнута – остановитесь. Иначе, установите l=l+1 и перейдите к шагу 2. Важно отметить, что в зависимости от типа цифрового компьютера, и его операционной системы, расчеты подсистем могут осуществляться параллельно, а также N-матричное уравнение Риккати на шаге 1 не зависит от xi(0), и значит их необходимо вычислить один раз, не зависимо от числа итераций второго уровня в алгоритме прогнозирования взаимодействия (4.3.56). В отличие от методов согласования цели, zi(t) не нужен в функции оценки, который был необходим, чтобы избежать однородности, о чем будет написано в следующем разделе. Метод прогнозирования взаимодействия, введенный Tokahara (1965), был рассмотрен многими исследователями, которые внесли в него существенный вклад. Среди них Titli (1972) который назвал этот метод смешанным (Singh, 1980) и Cohen и др. (1974), который предоставил более убедительные доказательства сходимости чем предложенные ранее. Smith и Sage (1973) рассмотрели эту схему для нелинейных систем, которая будет рассмотрена в Главе 6. Сравнение методов прогнозирования взаимодействия, согласования цели и подходов без интеграции, рассмотренных в разделе 4.4, дано в разделе 4.5. Следующие два примера, а потом пример в САПР иллюстрирует метод прогнозирования взаимодействий. Пример 4.3.3. Рассмотрим систему четвертого порядка
(4.3.59) Где x(0)=(-1,0.1,1.0,-0.5)T, квадратичная функция оценки Q=daig(2,1,1,2), R=diag(1,2) и нет граничного штрафа. Надо использовать метод прогнозирования взаимодействия и найти оптимальное управление для tf =1. Решение: Систему разделили на две подсистемы второго порядка и применили методы, описанные в алгоритме 4.2. На первом шаге решили два независимых дифференциальных матричных уравнения Риккати используя как дублирующий алгоритм Davison и Maki (1973), так и стандартный метод Рунге-Кутта. Элементы матрицы Риккати были представлены в виде квадратичного полинома в ряде Чебышева (Newhouse,1962), для удобства вычислений: (4.3.60) На первом уровне были решены два сопряженных уравнения второго порядка в виде (4.3.49) и два уравнения состояния подсистем, как показано в алгоритме 4.2 в шаге 3, используя метод четвертого порядка Рунге-Кутта и первоначальные значения (4.3.61) На втором уровне векторы взаимодействия [a11(t),a12(t),z11(t),z12(t)] и [a21(t),a22(t),z21(t),z22(t)]T были спрогнозированы с использованием рекурсивных отношений (4.3.56), и на каждой итерации производился обмен информацией с подсчетом общей ошибки взаимодействия (4.3.58) для и программы кубической сплайн интерполяции. Ошибку взаимодействия снизили до за шесть итераций, как показано на рисунке 4.11. Были получены оптимальные значения выхода для Ci =(1 1) и сигнала управления. Затем для сравнения первоначальную систему (4.3.59) оптимизировали, решив нестационарное матричное уравнение Риккати четвертого порядка обратным интегрированием, и для хi(t), i=1,2,3,4; yj(t) и uj(t), j=1,2. Значения выхода и сигналы управления как для случая иерархического управления, так и для централизованного, показаны на рисунке 4.12. Отметьте относительно точное соответствие между значениями выхода для первоначальной соединенной и иерархической разъединенной систем. Но как и ожидалось, эти два уравнения различны. Теперь рассмотрим второй пример. Пример 4.3.4. Рассмотрим систему восьмого порядка Необходимо использовать метод прогнозирования взаимодействия для нахождения u*.
Решение: Система была разложена на две подсистемы четвертого порядка и были выбраны tf=2, =0.1, Q1=Q2=I4, R1=R2=1. Первоначальные значения , i=1,2 и состояние х0 были приняты за , и . Сходимость была очень быстрой, как видно на рисунке 4.13. Всего за четыре итерации второго уровня ошибка взаимодействия была снижена до . Фактически была быстрая сходимость для различных x0 и . САПР пример 4.3.1. Рассмотрим систему четвертого порядка в примере 4.3.1 в (4.3.59): Где x(0)=(-1,0.1,1.0,-0.5)T, квадратичная функция оценки Q =diag(2,1,1,2), R=diag(1,2) и нет граничного штрафа. Необходимо использовать LSSPAK или подобное программное обеспечение и метод прогнозирования взаимодействия и найти оптимальное управление для tf=2. Решение: Как и раньше, система делится на две подсистемы второго порядка, и уравнения Риккати для подсистем решаются с использованием RICRKUT от LSSPAK/PC, а их решения представлены в виде полинома четвертого порядка для удобства вычислений. Используя программу INTRPRD от LSSPAK/PC реализуют алгоритм прогнозирования взаимодействия и схождение достигается за пять итераций. Точные выборки из выполнения этого САПр примера приведены ниже. Инструкции для вычерчивания программы прогнозирования взаимодействия появляются, когда на экране появится чертеж; нажмите Enter, чтобы вернуться к меню. Если вы хотите вывести чертежи через принтер откройте DOS файл GRAPHICS до запуска программы, когда вы захотите вывести чертеж, нажмите shift-PrtScr.
Optimization via the interaction prediction method. Initial time (to): 0 Final time (tf): 2 Step size (Dt):.1 Total no. of 2nd level iterations = 6 Error tolerance for multi-level iterations -.00001 Order of overall large scale system = 4 Order of overall control vector (r) = 2 Number of subsystems in large scale system = 2 Matrix Subsystem state orders-n sub i 0.200D+01 0.200D+01 Matrix Subsystem input orders-r sub i 0.100D+01 0.100D+01 Polynomial approximation for the Ricatti matrices to be used. Matrix Ricatti coefficients for SS# 1
Matrix Ricatti coefficients for SS# 2
System Matrix A
Matrix Input Matrix B
Matrix Input Cost Function R
Matrix Lagrange Multiplier Initial Values
Matrix Initial conditions vector xO
Subsystem no. 1 at 2nd level iteration no. 1 Subsystem no. 2 at 2nd level iteration no. 1 At second level iteration no. 1 interaction error = 0.347D+00 Subsystem no. 1 at 2nd level iteration no. 2 Subsystem no. 2 at 2nd level iteration no. 2 At second level iteration no. 2 interaction error = 0.771D - 03 Subsystem no. 1 at 2nd level iteration no. 3 Subsystem no. 2 at 2nd level iteration no. 3
At second level iteration no. 3 interaction error = 0.507D - 03 Subsystem no. 1 at 2nd level iteration no. 4 Subsystem no. 2 at 2nd level iteration no. 4 At second level iteration no. 4 interaction error = 0.323D - 04 Subsystem no. 1 at 2nd level iteration no. 5 Subsystem no. 2 at 2nd level iteration no. 5 At second level iteration no. 5 interaction error = 0.310D - 05
Оптимальные отклики показаны на рисунке 4.14, а схождение на рисунке 4.15. Другие применения метода прогнозирования взаимодействия представлены в разделе задач.
Воспользуйтесь поиском по сайту: ©2015 - 2024 megalektsii.ru Все авторские права принадлежат авторам лекционных материалов. Обратная связь с нами...
|