בקרה אופטימלית

בקרה אופטימלית היא ענף בתורת הבקרה, המבקש למצוא חוקי בקרה, שביצועיהם מביאים למקסימום או מינימום אינדקס ביצועים כלשהו.

הגדרת הבעיה

נתונה מערכת דינמית מאחד מהסוגים הבאים:

$\dot{x} = f (x, u), x (t_{0}) = x_{0}$ או:
$\dot{x} = A x + B u, x (t_{0}) = x_{0}$

כאשר במערכת הזאת:

x - וקטור המצב של המערכת.
u - וקטור הבקרה, המנסה להביא את אינדקס הביצועים למקסימום או מינימום. וקטור הבקרה מקיים $u \in U$

וקטור המצב של המערכת תחום במרחב המצב, המושפע מתנאי ההתחלה של המערכת ומהמרחב המותר למאמץ הבקרה u.
אינדקס הביצועים הוא פונקציונל, כלומר מיפוי של פונקציות אל הציר הממשי:
$J : (U, X (U)) \to R^{1}$

הבעיה הבסיסית, לפיכך, היא למצוא את חוק הבקרה האופטימלי: $u^{*} [t_{0}, t_{f}] \in U, u * = a r g m i n (J)$
הצמד $u^{*} [t_{0}, t_{f}], x^{*} [t_{0}, t_{f}]$ נקרא מסלול אופטימלי.

ברוב המקרים, לבעיה יש סט של אילוצים, היכולים להיות מהסוגים הבאים:

מצב סופי קבוע נדרש: $x (t_{f}) = x_{f}$
מניפה סופית: $x (t_{f})^{T} x (t_{f}) = r_{f}^{2}$
אילוצים קשיחים על המצב. למשל, חסימה של וקטור המצב שלא יברח מחוץ לגבול מסוים.
מצב התחלתי חופשי.
מניפה התחלתית: $x (t_{0})^{T} x (t_{0}) = r_{0}^{2}$
זמן סופי חופשי.

פתרון בעיות אופטימיזציה

תנאי לנקודת קיצון

שינוי אינפיניטסימלי ב-x, שיסומן ב- $δ x$ יגרום לשינוי קטן בערך הפונקציה f, שיסומן ב- $δ f$ . כדי להגיע לנקודת קיצון, אנחנו רוצים ש- $δ f = 0$ . תנאי זה מתקיים, במקרים בהם מוגדר אילוץ מהסוג $g (x) = 0$ אם ורק אם:

g(x)=0 בנקודה כלשהי x₀.
$f_{x} = - λ g_{x}$ בנקודה x₀. תנאי זה מחייב קולינריות של הגרדיאנט של f והקו המשיק לאילוץ בנקודה x₀.

דרך אחרת להשתמש בכלל זה הוא השימוש בכופלי לגראנז', כלומר להגדיר לגראנז'יאן: $L (x, λ) = f (x) + λ g (x)$ ואז לדרוש שהוא יהיה סטציונרי בנקודה x₀ ביחס ל-x וביחס לכופלי הלגראנז'. אם יש מספר אילוצים, משתמשים בווקטור של כופלי לגראנז'.

תנאי הניצבות

משתמשים בחשבון וריאציות בשביל לבחון את הבעיה הבאה: $\min_{x \in X} = \int_{t_{0}}^{t_{f}} Φ (x, \dot{x}, t) d t$
ניתן להוכיח שישנם שני תנאים המבטיחים את השגת המינימום:

תנאי אוילר-לגראנז': $Φ_{x} = \frac{d}{d t} Φ_{\dot{x}}^{T}$
תנאי הניצבות: $[Φ_{\dot{x}}^{T} δ x]_{t_{0}}^{t_{f}} = 0$

ניסוח ההמילטוניאן

נגדיר את הבעיה הבאה: מעוניינים למזער את הערך של אינדקס הביצועים הבא: $m i n J = \int_{t_{0}}^{t_{f}} ϕ (x, u, t) d t + Θ [x (t_{f}), t_{f}]$ תחת האילוצים של משוואת המצב: $\dot{x} = f (x, u, t)$
מגדירים לגראנז'יאן כזה: $L = J + \int_{t_{0}}^{t_{f}} λ^{T} (t) (f - \dot{x}) d t$
כמו כן מגדירים המילטוניאן כך: $H = Φ + λ^{T} f$
וניתן להוכיח שהמשוואות הבאות פותרות את בעיית האופטימיזציה שתוארה קודם לכן:
$H_{x} = - \dot{λ}$
$H_{λ} = \dot{x}$
$H_{u} = 0$ יחד עם תנאי הקצה:

$λ^{T} (t_{0}) δ x (t_{0})$ - תנאי התחלה.
$[Θ_{x} - λ (t_{f})]^{T} δ x (t_{f})$ - תנאי הסיום.
$[H + Θ_{t_{f}}]_{t_{f}} δ t_{f}$ - במקרים בהם יש זמן חופשי.

שימושים בבקרה אופטימלית

בקרה אופטימלית משמשת במגוון רחב של יישומים. להלן כמה יישומים אפשריים:

בקרת מסלול של חלליות.
הנחיה של טילים.
אמידה של פרמטרים ומשתני מצב של גופים.
פתרון בעיית הצריכה של פרט מייצג על פני זמן בכלכלה.

חסרונות בקרה אופטימלית ובעיות LQR

המגבלות העיקריות של בקרה אופטימלית הן בעיקר העובדה שרוב הפתרונות מגדירים חוק בקרה התלוי בזמן ולא במשתני המצב של המערכת המבוקרת, כלומר בדרך כלל הפתרונות הם חוקי בקרה בחוג פתוח ולא בקרה בחוג סגור.

לעיתים ניתן לקבל פתרונות שהם כן פתרונות בחוג סגור, בעיקר בבעיות ייחודיות המוגדרות כבעיות רגולטור ליניארי ריבועי (Linear Quadratic Regulator, LQR). בבעיות אלה ההגדרה היא כזו: $J = \frac{1}{2} \int_{t_{0}}^{t_{f}} (x^{T} Q x + u^{T} R u) d t + \frac{1}{2} x^{T} (t_{f}) S x (t_{f})$
$\dot{x} = A x + B u$
$x (t_{0}) = x_{0}$

$S \geq 0$
$Q \geq 0$
$R > 0$
הפתרון לבעיה זו נתון על ידי חוק הבקרה הבא: $u^{*} = - R^{- 1} B^{T} P x$
כאשר: P הוא פתרון משוואת ריקאטי הדיפרנציאלית:
$- \dot{P} = P A + A^{T} P - P B R^{- 1} B^{T} P + Q$
$P (t_{f}) = S$

שיטות חישוביות

בבעיות שונות לא ניתן או קשה מאוד לבצע אופטימיזציה בשיטות אנליטיות. בבעיות אלה משתמשים במספר שיטות חישוביות כדי לבצע אופטימיזציה באמצעים חישוביים, תוך הסתמכות על כוחו של המחשב. סעיף זה יפרט את השיטות המקובלות בעולם:

שיטת Steepest Descent

אפשר לתאר את אינדקס הביצועים כמשטח רב-ממדי, בו מטרת הבקרה האופטימלית היא למצוא את הערך הנמוך ביותר של אינדקס זה. כלומר, תאורטית, אם מתקדמים "כלפי מטה", כמו מים במורד הזרימה, מגיעים למקום או לערך הנמוך ביותר של משטח זה. שיטת Steepest Descent פועלת בכיוון של הגרדיאנט המרבי ובכך מקרבת אותנו בכל פעם לפתרון. האלגוריתם לפיכך הוא:

בחר נקודה x₀.
חשב את הגרדיאנט של פונקציית המחיר f בנקודה זו.
חשב את הנקודה הבאה $x_{n + 1} = x_{n} - f_{x} (x_{n}) * s$ , כאשר s הוא גודל הצעד, שאותו בוחרים.
תנאי העצירה: כאשר ההפרש בין הערכים של הפונקציה בעקבות הצעד קטנים התכנסנו לנקודת המינימום.

תכנות דינמי דיסקרטי

העיקרון בתכנות דינמי דיסקרטי הוא הליכה מתנאי הסיום של הבעיה אל תנאי ההתחלה, תוך התחשבות באילוצי הבעיה. אלגוריתם הפתרון הוא כזה:

חלק את מרחב הבעיה הרציף בדרך כלל לנקודות דיסקרטיות במרחקים קטנים כרצונך (כמובן שככל שהרזולוציה משתפרת גדל העומס החישובי של הבעיה).
צא מתנאי הסיום ועבור אל הנקודות שניתן להגיע אליהן לפי האילוצים וחשב את המחיר להגיע לנקודות אלה (דרך להגדיר אילוץ היא מחיר אינסופי) על פי המחיר לנקודה הקודמת + המחיר מהנקודה הקודמת לנקודה הנוכחית.
בחר את הערך הנמוך ביותר להגיע אל כל נקודה ושמור את המסלול הזה כמסלול האופטימלי.
חזור על הפעולות הקודמות עד שתגיע לתנאי ההתחלה של הבעיה.

כתוצאה מהאלגוריתם מתקבל באופן מיידי הערך המינימלי של המסלול והמסלול עצמו. המסלול מגדיר את מאמצי הבקרה הנדרשים לביצוע המסלול.

קישורים חיצוניים

הערך באדיבות ויקיפדיה העברית, קרדיט,
רשימת התורמים
רישיון cc-by-sa 3.0

בקרה אופטימלית40810836Q1971426

	יש לפשט ערך זה: הערך מנוסח באופן טכני מדי, וקשה להבנה לקהל הרחב.
	יש להוסיף מבוא אינטואיטיבי שיסביר את הרעיונות והמושגים בצורה פשוטה יותר, רצוי בליווי דוגמאות. אם אתם סבורים כי הערך אינו ברור דיו או שיש נקודה שאינכם מבינים בו, ציינו זאת בדף השיחה שלו. יש לציין כי ערכים מדעיים רבים מצריכים רקע מוקדם.	עריכה