查看“可控制性”的源代码
←
可控制性
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
'''可控制性'''(Controllability)是[[控制系統]]中的重要特性,在許多控制問題中都很重要,例如是否可以透過[[回授]]穩定一個本身不穩定的系統,或是[[最佳控制]]的相關問題。 可控制性及[[可觀測性]]是同一個問題上的[[对偶 (数学)|对偶]]概念。 簡單來說,可控制性是指是否可以透過一些允許的程序讓系統調整到其組態空間內的任何一個組態。隨著其系統模型或是框架的不同,定義也會略有改變。 以下是一些在系統或是控制文獻中出現過的可控制性定義: * 狀態可控制性(State controllability) * 輸出可控制性(Output controllability) * 行為框架中的可控制性(Controllability in the behavioural framework) == 狀態可控制性 == 狀態可控制性是指在[[确定性模型|确定性系統]]的[[状态空间]]內,也就是系統所有狀態變數數值組成的集合,可以完全描述系統在任一時間以下的狀態。特別是不需要有關系統以往的資訊,只要知道目前的狀態,以後所有的狀態都是已知的。 完全狀態可控制性(有時也稱為狀態可控制性)是指外在輸入(由控制變數組成的向量)可以在有限時間內將系統由任意狀態改變為另一個狀態<ref name="Ogata97">{{cite book|author=Katsuhiko Ogata|title=Modern Control Engineering|edition=3rd|year=1997|publisher=Prentice-Hall|location=Upper Saddle River, NJ|isbn=0-13-227307-1}}</ref>{{rp|737}}。 可控制性表示可以使系統到達任意狀態,但不表示系統可以維持在該狀態,有可能系統只是在該狀態停留短暫間而已。 == 連續時間線性系統 == 考慮連續時間下的[[線性系統]]<ref group="note">[[线性时不变系统理论|线性时不变系统]]其行為也相同,不過係數不會隨時間而變化。</ref> : <math>\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t)</math> : <math>\mathbf{y}(t) = C(t) \mathbf{x}(t) + D(t) \mathbf{u}(t).</math> 存在一個控制<math>u</math>使系統在時間<math>t_0</math>至時間<math>t_1</math>,由狀態<math>x_0</math>改變為狀態<math>x_1</math>,若且唯若<math>x_1 - \phi(t_0,t_1)x_0</math>是以下的[[行空间与列空间|列空间]]中 : <math>W(t_0,t_1) = \int_{t_0}^{t_1} \phi(t_0,t)B(t)B(t)^{T}\phi(t_0,t)^{T} dt</math> 其中<math>\phi</math>是[[狀態轉移矩陣]],而<math>W(t_0,t_1)</math>是[[可控制性格拉姆矩陣]]。 其實上,若<math>\eta_0</math>是<math>W(t_0,t_1)\eta = x_1 - \phi(t_0,t_1)x_0</math>的解,則控制<math>u(t) = -B(t)^{T}\phi(t_0,t)^{T}\eta_0</math>即為所需的控制輸入。 注意上述定義的<math>W</math>有以下的特質: * <math>W(t_0,t_1)</math>是[[對稱矩陣]] * <math>W(t_0,t_1)</math>是[[正定矩阵]],<math>t_1 \geq t_0</math> * <math>W(t_0,t_1)</math>滿足以下的線性{{link-en|矩陣微分方程|matrix differential equation}} :: <math>\frac{d}{dt}W(t,t_1) = A(t)W(t,t_1)+W(t,t_1)A(t)^{T}-B(t)B(t)^{T}, \; W(t_1,t_1) = 0</math> * <math>W(t_0,t_1)</math>滿足以下方程 :: <math>W(t_0,t_1) = W(t_0,t) + \phi(t_0,t)W(t,t_1)\phi(t_0,t)^{T}</math><ref>{{cite book|first=Roger W.|last=Brockett|title=Finite Dimensional Linear Systems|publisher=John Wiley & Sons|year=1970|isbn=978-0-471-10585-5}}</ref> == 可控制性的秩條件== 可控制性格拉姆矩陣和狀態轉移矩陣的積分有關。另外有一個較簡單,類似在非時變系統下的可控制性判斷方式。 考慮連續時間的線性系統<math>\Sigma</math>,在時間區間<math>[t_0,t]</math>內光滑變化: : <math>\dot{\mathbf{x}}(t) = A(t) \mathbf{x}(t) + B(t) \mathbf{u}(t)</math> : <math>\mathbf{y}(t) = C(t) \mathbf{x}(t) + D(t) \mathbf{u}(t).</math> 其狀態轉移矩陣也是光滑的,引入n x m的矩陣函數<math>M_0(t) = \phi(t_0,t)B(t)</math>,並且定義 : <math>M_k(t)</math> = <math>\frac{\mathrm{d^k} M_0}{\mathrm{d} t^k}(t), k\geqslant 1</math>. 考慮一個由<math>M_i</math>, <math>i = 0,1, \ldots, k</math>組成的矩陣: <math>M^{(k)}(t) := \left[M_0(t), \ldots, M_k(t)\right] </math>. 若存在<math>\bar{t} \in [t_0,t]</math>以及非負整數k使得<math>\operatorname{rank}M^{(k)}(\bar{t})=n</math>,則<math>\Sigma</math>為可控制系統<ref name=":0">Eduardo D. Sontag, Mathematical Control Theory: Deterministic Finite Dimensional Systems.</ref>。 若<math>\Sigma</math>在區間<math>[t_0,t]</math>內也是解析變化,則<math>\Sigma</math>在<math>[t_0,t]</math>中的每個非平凡子區間內可控制,若且唯若存在<math>\bar{t} \in [t_0,t]</math>及非負變數使得<math>rank</math><math>M^{(k)}(t_i)=n</math><ref name=":0" />。 上述方式仍然很不容易確認,因為包括了狀態轉移矩陣<math>\phi</math>的計算。另一個等效的條件如下:令<math>B_0(t) = B(t)</math>,對於每一個<math>i</math> <math>\geq</math> 0,定義 : <math>B_{i+1}(t) </math>= <math>A(t)B(t) - \frac{\mathrm{d}}{\mathrm{d} t}B_i(t). </math> 此例中,每一個<math>B_i</math>是直接由<math> (A(t),B(t))</math>求得。此系統有穩定性的充份必要條件是存在<math>\bar{t} \in [t_0,t]</math>及非負整數<math>k</math>使得下式成立: :<math>\textrm{rank}( \left[ B_0(\bar{t}), B_1(\bar{t}), \ldots, B_k(\bar{t}) \right]) = n </math><ref name=":0" /> === 例子 === 考慮一個在<math> (-\infty,\infty) </math>內解析變化的系統及矩陣 <math>A(t) = \begin{bmatrix} t & 1 & 0\\ 0 & t^{3} & 0\\ 0 & 0 & t^{2} \end{bmatrix}</math>, <math>B(t) = \begin{bmatrix} 0 \\ 1 \\ 1 \end{bmatrix}.</math> 則 <math> [B_0(0),B_1(0),B_2(0),B_3(0)] = \begin{bmatrix} 0 & 1 & 0 &-1\\ 1 & 0 & 0&0\\ 1 & 0 & 0&2 \end{bmatrix}</math>,其矩陣秩為3,因此在<math>\mathbb{R}</math>之內的每一個非平凡區間都是可控制的。 === 連續線性時不變(LTI)系統 === 考慮以下的連續線性[[时不变系统]] : <math>\dot{\mathbf{x}}(t) = A \mathbf{x}(t) + B \mathbf{u}(t)</math> : <math>\mathbf{y}(t) = C \mathbf{x}(t) + D \mathbf{u}(t)</math> 其中 : <math>\mathbf{x}</math>為<math>n \times 1</math>狀態向量 : <math>\mathbf{y}</math>為<math>m \times 1</math>輸出向量 : <math>\mathbf{u}</math>為<math>r \times 1</math>輸入(或控制)向量 : <math>A</math>為<math>n \times n</math>狀態矩陣 : <math>B</math>為<math>n \times r</math>輸入矩陣 : <math>C</math>為<math>m \times n</math>輸出矩陣 : <math>D</math>為<math>m \times r</math>前饋矩陣 <math>n \times nr</math>可控制矩陣為 :<math>R = \begin{bmatrix}B & AB & A^{2}B & ...& A^{n-1}B\end{bmatrix}</math> 系統可控制的充份必要條件是其可控制矩陣為滿[[秩 (線性代數)|秩]](也就是<math>\operatorname{rank}(R)=n</math>)。 == 離散線性時不變(LTI)系統 == 針對離散時間,狀態方程如下的線性狀態空間系統(也就是時間變數<math>k\in\mathbb{Z}</math>): :<math>\textbf{x}(k+1) = A\textbf{x}(k) + B\textbf{u}(k)</math> 其中<math>A</math>是<math>n \times n</math>的矩陣,<math>B</math>是<math>n \times r</math>的矩陣,(也就是<math>\mathbf{u}</math>是<math>r</math>個輸入,整理成<math>r \times 1</math>的向量)。測試其可控制性的方式為以下<math>n \times nr</math>矩陣 :<math>\mathcal{C} = \begin{bmatrix}B & AB & A^{2}B & \cdots & A^{n-1}B\end{bmatrix}</math> 有全秩(也就是<math>\operatorname{rank}(\mathcal C) = n</math>)。因此,若此系統可控制,<math>\mathcal C</math>會有<math>n</math>個[[線性獨立]]的-{zh-hans:列; zh-hant:行;}-;若<math>\mathcal C</math>中有<math>n</math>個-{zh-hans:列; zh-hant:行;}-是線性獨立的,<math>n</math>個狀態中的每一個都可以用適當的輸入變數<math>u(k)</math>來達到。 ===推導=== 假設在初始時間(表示為''k''=0)狀態<math>\textbf{x}(0)</math>,狀態方程可以得到<math>\textbf{x}(1) = A\textbf{x}(0) + B\textbf{u}(0)</math>,則<math>\textbf{x}(2) = A\textbf{x}(1) + B\textbf{u}(1)= A^2\textbf{x}(0)+AB\textbf{u}(0)+B\textbf{u}(1)</math>,以此類推,利用反覆將狀態變數反向代回,可以得到 :<math>\textbf{x}(n)=B\textbf{u}(n-1) + AB\textbf{u}(n-2) + \cdots + A^{n-1}B\textbf{u}(0) + A^n\textbf{x}(0)</math> 或者等效的 :<math>\textbf{x}(n)-A^n\textbf{x}(0)= [B \, \, AB \, \, \cdots \, \, A^{n-1}B] [\textbf{u}^T(n-1) \, \, \textbf{u}^T(n-2) \, \, \cdots \, \, \textbf{u}^T(0)]^T.</math> 將狀態向量<math>\textbf{x}(n)</math>想要的值放在左側時,可解出一連串控制向量的條件是若且唯若等號右側的第一個矩陣有全秩。 ===範例=== 例如,考慮<math>n=2</math>和<math>r=1</math>的例子(只有一個控制輸入)。因此,<math>B</math>和<math>A B</math>是<math>2 \times 1</math>的向量。若<math>\begin{bmatrix}B & AB\end{bmatrix}</math>為秩2(滿秩),因此<math>B</math>和<math>AB</math>為[[線性獨立]],可以生成整個平面。若秩為1,則<math>B</math>和<math>AB</math>平行,無法生成整個平面。 假設初始狀態為0。 在時間<math>k=0</math>時:<math>x(1) = A\textbf{x}(0) + B\textbf{u}(0) = B\textbf{u}(0)</math> 在時間<math>k=1</math>時:<math>x(2) = A\textbf{x}(1) + B\textbf{u}(1) = AB\textbf{u}(0) + B\textbf{u}(1)</math> 在時間<math>k=0</math>時,所有可到達的狀態是在由向量<math>B</math>組成的直線上。 在時間<math>k=1</math>時,所有可到達的狀態是在由向量<math>AB</math>和<math>B</math>組成的線性組合上。 若系統可控制,這二個向量可以生成整個平面,在時間<math>k=2</math>時即可完成。 前面有假設初始狀態為0,此一假設只是為了推導方便,若可以從原點到達所有的狀態,就可以由任意的初始狀態到所有的狀態(只要進行坐標平移) 上述例子對於所有正整數的<math>n</math>都成立,不過<math>n=2</math>的例子比較容易視覺化。 ===類似''n'' = 2的範例=== 以下是一個用{{le|汽車類比|Car analogy}}上述範例的例子。 一個人坐在車上,車在一個無窮大的平面上,車頭朝向北方。 目的是透過駕駛(直線前進或是直線倒車)一段距離、停車、轉彎、再駕駛(直線前進或是直線倒車)一段距離的方式到平面上的任何一點。 假如車上沒有方向盤,因此車只能直線前進或後退,車所能到的方向只有車的正南方或正北方的位置上。 沒有方向盤類似<math>C</math>的秩為1(二次所走的位移均平行)的情形。 假如車有方向盤,可以任意的旋轉,自然可以到平面上的任何一點,這類似<math>C</math>的秩為2的例子。 若將此範圍延伸到<math>n=3</math>,則例子會變成讓[[飛機]]到三維空間中的任何一點(不考慮飛機本身的[[定向 (幾何)|機頭面對方向]]。 可做的事為: *以直線航行 *左轉或是右轉任意角度({{le|飛機主軸|Aircraft principal axes|偏擺}},yaw) *飛機朝上或是朝下任意角度(俯仰,pitch) 雖然三維的例子比較不容易視覺化,不過原理類似。 == 非線性系統 == 以下控制仿射形式的非線性系統 : <math>\dot{\mathbf{x}} = \mathbf{f(x)} + \sum_{i=1}^m \mathbf{g}_i(\mathbf{x})u_i</math> 其在<math>x_0</math>附近局部可到達(accessible)的條件是可到達分佈<math>R</math>可以生成 <math>n</math>個空間,其中<math>n</math>等於<math>x</math>的秩,而且R可以由下式表示<ref>Isidori, Alberto (1989). ''Nonlinear Control Systems'', p. 92–3. Springer-Verlag, London. {{ISBN|3-540-19916-0}}.</ref>: :<math>R = \begin{bmatrix} \mathbf{g}_1 & \cdots & \mathbf{g}_m & [\mathrm{ad}^k_{\mathbf{g}_i}\mathbf{\mathbf{g}_j}] & \cdots & [\mathrm{ad}^k_{\mathbf{f}}\mathbf{\mathbf{g}_i}] \end{bmatrix}.</math> 此處<math>[\mathrm{ad}^k_{\mathbf{f}}\mathbf{\mathbf{g}}]</math>是重複的{{le|向量場中的李括號|Lie bracket of vector fields|李括號}}運算,定義如下 : <math>[\mathrm{ad}^k_{\mathbf{f}}\mathbf{\mathbf{g}}] = \begin{bmatrix} \mathbf{f} & \cdots & j & \cdots & \mathbf{[\mathbf{f}, \mathbf{g}]} \end{bmatrix}. </math> 線性系統的可控制性矩陣可以由此式推導而得。 == 零可控制性== 若離散控制系統具有零可控制性(null-controllable),表示針對某一初始狀態<math>x(0) = x_0</math>,存在可控制的<math>u(k)</math>使得<math>x(k_0) = 0</math>。此條件和存在矩陣<math>F</math>使得<math>A+BF</math>為冪零矩陣的條件等價。 此條件可以由可控制-不可控制分離推導而得。 == 輸出可控制性 == 輸出可控制性(Output controllability)是有關系統輸出(以上表示為''y'')的特性,輸出可控制性描述外在輸入是否可以在有限時間內,將輸出從任意初始狀態控制到特定輸出。輸出可控制性和狀態可控制性不一定會有相關性。尤其: * 狀態可控制性的系統不一定會是輸出可控制性的系統。例如矩陣''D'' = 0,且矩陣''C''沒有全秩,因為輸出矩陣的結構限制,有些輸出是無法達到的。即使系統的所有狀態都可以在有限時間內達到,但仍然有些特定的輸出是無法產生的。一個明顯的例子是''D''=0,且矩陣''C''至少有一行為零,因此此系統無法讓該輸出有不為零的輸出。 * 輸出可控制性的系統也不一定會是狀態可控制性的系統。例如,假如狀態空間的維度大於輸出的維度,針對每一個輸出,都有一組可能的對應狀態組態。也就是說,系統可能會有零動態(zero dynamics),也就是系統狀態有變化,但是在輸出上完全看不出來。因此,可以在有限時間將輸出控制到特定輸出,和狀態的可控制性完全沒有關係。 針對線性連續時間系統,例如由矩陣<math>A</math>、<math>B</math>、<math>C</math>及<math>D</math>描述的系統,其<math>m \times (n+1)r</math>輸出可控制性矩陣 :<math>\begin{bmatrix} CB & CAB & CA^2B & \cdots & CA^{n-1}B & D\end{bmatrix}</math> 有滿行秩(rank <math>m</math>)若且唯若此系統為輸出可控制系統<ref name="Ogata97" />{{rp|742}},此結果也是[[鲁道夫·卡尔曼|卡尔曼]]的可控制性準則{{Citation needed|date=February 2012}}。 == 在有輸入限制下的可控制性 == 在一些沒有完全控制權的系統,常常無法在可控制子空間內將系統從任意初始位置移到從任意結束位置。會出現此一現象的原因可能是因為系統本身就有的輸入信號限制(例如致動器的飽和)或是因為其他原因而給系統的限制(例如因為安全相關的考量)。在輸入及狀態有限制時的系統可控制性,是[[可到達性]](reachability)<ref>{{cite journal |author1=Claire J. Tomlin |author2=Ian Mitchell |author3=Alexandre M. Bayen |author4=Meeko Oishi | title = Computational Techniques for the Verification of Hybrid Systems | journal = Proceedings of the IEEE | version = | doi = 10.1109/jproc.2003.814621 | year = 2003 | url = http://www.cs.ubc.ca/~mitchell/Papers/publishedIEEEproc03.pdf | accessdate = 2012-03-04 }}</ref>及{{le|生存理论|viability theory}}<ref>{{cite book|author=Jean-Pierre Aubin |title= Viability Theory |edition= |year=1991 |publisher=Birkhauser |location= |isbn=0-8176-3571-8 }}</ref>探討的內容。 == 行為框架中的可控制性 == 在所謂的[[行為系統理論方法]](behavioral system theoretic approach)中,不會直接定義模型輸入-輸出的結構。在此框架內,系統由是由變數集合的允許軌跡來表示,其中有些可能是輸入或是輸出。 在此框架中,可控制的系統是指,系統過去的行為(外在變數的軌跡)可以和任何未來的行為連接,而其連接方式都在可允允許的系統行為內<ref name="Polderman98">{{cite book|author1=Jan Polderman |author2=Jan Willems |title=Introduction to Mathematical Systems Theory: A Behavioral Approach|edition=1st|year=1998|publisher=Springer Verlag|location=New York|isbn=0-387-98266-3}}</ref>{{rp|151}}。 == 可穩定性 == 可穩定性(stabilizability)是比可控制性要弱的一個條件。系統具有可穩定性若所有不可控的狀態都有穩定的動態特性。因此雖然系統中有一些狀態是不可控的,在系統動作時,所有的狀態都還是維持在一定的範圍內(有界)<ref name="Anderson+Moore/book:1989">{{cite book|author1=Brian D.O. Anderson|author2=John B. Moore|title=Optimal Control: Linear Quadratic Methods|year=1990|publisher=Prentice Hall|location=Englewood Cliffs, NJ|isbn=978-0-13-638560-8}}</ref>。[[Hautus引理]]有針對可穩定性的判斷 == 可達到集合 == 令T ∈ '''''Т''''',且x ∈ ''X''(其中X是所有可能狀態的集合,'''''Т'''''是一段時間區間)。在時間T內從x開始的可達到集合(reachable set)定義為<ref name="Sontag">{{cite book|author1=Eduardo D. Sontag|title= Mathematical control theory: deterministic finite dimensional systems|year=2013|publisher=Springer Science & Business Media}}</ref>: <math>R^T{(x)} = \left\{ z \in X : x \overset{T}{\rightarrow} z \right\}</math>,其中 x{{overset|T|→}}z表示存在一個在時間T內從x到z的狀態轉換。 針對自主系統,其可達到集合為: :<math>Im(R)=Im(B)+Im(AB)+....+Im(A^{n-1}B)</math>, 其中R為可控制性矩陣。 若以可達到集合來表示,系統有可控制性若且唯若<math>Im(R)=\R^{n}</math>。 '''證明''' 根據以下的等式: :<math>R=[B\ AB ....A^{n-1}B]</math> :<math>Im(R)=Im([B\ AB ....A^{n-1}B])</math> :<math>dim(Im(R))=rank(R)</math> 考慮系統可控制,因此R的-{zh-hans:列; zh-hant:行;}-需為[[線性獨立]],因此 :<math>dim(Im(R))=n</math> :<math>rank(R)=n</math> :<math>Im(R)=\R^{n}\quad \blacksquare</math> 另一個和可達到集合有關的集合為可控制集合(controllable set),定義如下: :<math>C^T{(x)} = \left\{ z \in X : z \overset{T}{\rightarrow} x \right\}</math>. Sontag提出了可達到性(reachability)和可控制性的關係<ref name="Sontag">{{cite book|author1=Eduardo D. Sontag|title= Mathematical control theory: deterministic finite dimensional systems|year=2013|publisher=Springer Science & Business Media}}</ref>: (a) n維離散線性系統可控制,若且唯若: :: <math>R(0)=R^k{(0)=X}</math>(其中X為x的所有可能值或是狀態,且k為時間) (b) 連結時間線性系統可控制,若且唯若: :: <math>R(0)=R^e{(0)=X}</math>針對所有e>0。 若且唯若<math>C(0)=C^e{(0)=X}</math>針對所有e>0。 == 相關條目 == * [[可觀測性]] * [[狀態觀測器]] * [[平坦性]] ==腳註== {{Reflist|group=note}} ==參考資料== {{reflist}} ==外部連結== *{{planetmath reference|id=6073|title=Controllability}} * [http://www.mathworks.com/help/toolbox/control/ref/ctrb.html MATLAB function for checking controllability of a system] * [http://reference.wolfram.com/mathematica/ref/ControllableModelQ.html Mathematica function for checking controllability of a system] [[Category:控制理论]]
本页使用的模板:
Template:Citation needed
(
查看源代码
)
Template:Cite book
(
查看源代码
)
Template:Cite journal
(
查看源代码
)
Template:ISBN
(
查看源代码
)
Template:Le
(
查看源代码
)
Template:Link-en
(
查看源代码
)
Template:Overset
(
查看源代码
)
Template:Planetmath reference
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Rp
(
查看源代码
)
返回
可控制性
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息