查看“跡”的源代码
←
跡
跳转到导航
跳转到搜索
因为以下原因,您没有权限编辑本页:
您请求的操作仅限属于该用户组的用户执行:
用户
您可以查看和复制此页面的源代码。
{{NoteTA |G1 = Math }} {{线性代数}} 在[[线性代数]]中,一個<math>n \times n</math>的[[矩陣]]<math>\mathbf{A}</math>的'''跡'''(或'''跡數'''),是指<math>\mathbf{A}</math>的[[主對角線]](從左上方至右下方的對角線)上各個元素的總和,一般記作<math>\operatorname{tr}(\mathbf{A})</math>或<math>\operatorname{Sp}(\mathbf{A})</math>: :<math>\operatorname{tr}(\mathbf{A}) = \mathbf{A}_{1, 1} + \mathbf{A}_{2, 2} + \cdots + \mathbf{A}_{n, n} </math> 其中<math>\mathbf{A}_{i, j}</math>代表矩陣的第'''i'''行'''j'''列上的元素的值<ref>张贤达,《矩阵分析与应用》,第54页</ref>。一個矩陣的跡是其[[特征向量|特徵值]]的總和(按代數重數計算)。 跡的[[英文]]為{{lang|en|trace}},是來自[[德文]]中的{{lang|de|Spur}}這個單字(與英文中的{{lang|en|Spoor}}是同源詞),在數學中,通常簡寫為「Sp」或「tr」。 ==例子== 設有矩陣: <math>\mathbf{A} = \begin{bmatrix} 3 & 5 & 1\\0 & 9 & 2\\7 & 6 & 4 \end{bmatrix}</math> 它的跡是: <math>\operatorname{tr}(\mathbf{A}) = \operatorname{tr} \begin{bmatrix} 3 & 5 & 1\\0 & 9 & 2\\7 & 6 & 4 \end{bmatrix}</math> = 3 + 9 + 4 = 16 ==性質== ===线性函数=== 給定一個[[環]]<math>\mathbb{R}</math>,跡是一個從係數在環中的<math>n \times n</math>矩陣的空間<math>\mathcal{M}_n(\mathbb{R})</math>射到環<math>\mathbb{R}</math>之上的[[線性算子]]。也就是說,對於任兩個<math>n \times n</math>的矩陣<math>\mathbf{A}</math>、<math>\mathbf{B}</math>和[[純量]]<math>r</math>,都有: :<math>\mathrm{tr}(\mathbf{A} + \mathbf{B}) = \mathrm{tr}(\mathbf{A}) + \mathrm{tr}(\mathbf{B})</math> :<math> \mathrm{tr}(r \cdot \mathbf{A} ) = r \cdot \mathrm{tr}(\mathbf{A})</math><ref name="zxd">张贤达,《矩阵分析与应用》,第55页</ref> 更進一步來說,當<math>\mathbb{R}</math>是一個[[域]]時,跡數函數<math>\mathrm{tr}</math>是<math>n \times n</math>矩陣的空間<math>\mathcal{M}_n(\mathbb{R})</math>上的一個[[線性泛函]]。 由於一個矩陣<math>\mathbf{A}</math>的[[轉置矩陣]]<math>\mathbf{A}^T</math>的主對角線元素和原來矩陣的主對角線元素是一樣的,所以任意一個矩陣和其轉置矩陣都會有相同的跡<ref name="zxd"/>: :<math> \mathrm{tr}(\mathbf{A} ) = \mathrm{tr}\left(\mathbf{A}^T \right)</math> ===矩阵乘积的迹数=== 設''A''是一個<math>n \times m</math>矩陣,''B''是個<math>m \times n</math>矩陣,則: :<math> \mathrm{tr}(\mathbf{AB} ) = \mathrm{tr}(\mathbf{BA})</math><ref name="zxd"/> 其中<math>\mathbf{AB}</math>是一個<math>n \times n</math>矩陣,而<math>\mathbf{BA}</math>是一個<math>m \times m</math>矩陣。 上述的性質可以由[[矩陣乘法]]的定義證明: :<math>\mathrm{tr}(\mathbf{AB}) = \sum_{i=1}^n (\mathbf{AB})_{ii} = \sum_{i=1}^n \sum_{j=1}^m \mathbf{A}_{ij} \mathbf{B}_{ji} = \sum_{j=1}^m \sum_{i=1}^n \mathbf{B}_{ji} \mathbf{A}_{ij} = \sum_{j=1}^m (\mathbf{BA})_{jj} = \mathrm{tr}(\mathbf{BA})</math> 如果<math>\mathbf{A}</math>和<math>\mathbf{B}</math>都是<math>n \times n</math>的[[方形矩陣]],那麼它們的乘積<math>\mathbf{AB}</math>和<math>\mathbf{BA}</math>也會是方形矩陣。因此,利用這個結果,可以推導出:計算若干個同樣大小的方形矩陣的乘積的跡數時,可以'''循環'''改變乘積中方形矩陣相乘的順序,而最終的結果不變<ref name="zxd"/>。例如,有三個方形矩陣<math>\mathbf{A}</math>、<math>\mathbf{B}</math>和<math>\mathbf{C}</math>,則: :<math> \mathrm{tr}(\mathbf{ABC} ) = \mathrm{tr}(\mathbf{BCA}) = \mathrm{tr}(\mathbf{CAB})</math><ref name="cdm">Carl Dean Meyer, ''Matrix Analysis and Applied Linear Algebra'',第110页</ref> 但是要注意: :<math> \mathrm{tr}(\mathbf{ABC} ) \neq \mathrm{tr}(\mathbf{ACB}) </math><ref name="cdm"/> 更一般地,乘積中的矩陣不一定要是方形矩陣,只要某一個循環改變後的乘積依然存在,那麼得到的跡數依然會和原來的跡數相同<ref name="zxd"/>。 另外,如果<math>\mathbf{A}</math>、<math>\mathbf{B}</math>和<math>\mathbf{C}</math>是同樣大小的[[方形矩陣|方陣]]而且還是'''[[對稱矩陣]]'''的話,那麼其乘積的跡数不只在循環置換下不會改變,而且在所有的[[置換]]下都不會改變: :<math> \mathrm{tr}(\mathbf{ABC} ) = \mathrm{tr}(\mathbf{BCA}) = \mathrm{tr}(\mathbf{CAB}) = \mathrm{tr}(\mathbf{ACB} ) = \mathrm{tr}(\mathbf{CBA}) = \mathrm{tr}(\mathbf{BAC})</math> ===迹数的相似不变性=== 跡數擁有相似不變性。如果矩陣<math>\mathbf{A}</math>和<math>\mathbf{B}</math>[[相似矩陣|相似]]的話,它們會有相同的跡。這一性質可使上面講過的循環性質來證明: :矩陣<math>\mathbf{A}</math>和<math>\mathbf{B}</math>[[相似矩陣|相似]]也就是說存在[[可逆矩陣]]<math>\mathbf{P}</math>,使得<math> \mathbf{B} =\mathbf{P}\mathbf{A} \mathbf{P}^{-1}</math> :因此<math> \mathrm{tr}(\mathbf{B} ) = \mathrm{tr}(\mathbf{P}\mathbf{A} \mathbf{P}^{-1}) = \mathrm{tr}(\mathbf{P}^{-1} \mathbf{P}\mathbf{A}) = \mathrm{tr}(\mathbf{A})</math> ===矩阵迹数和特征多项式=== 一个<math>n \times n</math>的方形矩阵<math>\mathbf{A}</math>的[[特征多项式]]<math>P_{A}(\lambda)</math>定义为<math>\mathbf{A}</math>减去<math>\lambda</math>倍的[[单位矩阵]]后所得到的矩阵的[[行列式]]: <center><math>P_{A}(\lambda) = \det(\mathbf{A} - \lambda \mathbf{I})</math></center> 特征多项式是一个关于<math>\lambda</math>的'''n'''次[[多项式]],它的常数项是<math>\mathbf{A}</math>的行列式的值,最高次项是<math>(-1)^n \lambda^n</math>,而接下来的'''n-1'''次项就是<math>(-1)^{n-1} \mathrm{tr}( \mathbf{A}) \lambda^{n-1}</math>,也就是说: <center><math>P_{A}(\lambda) = (-1)^n \lambda^n + (-1)^{n-1} \mathrm{tr}( \mathbf{A}) \lambda^{n-1} + \cdots + \det(\mathbf{A})</math></center> ===矩阵迹数与特征值=== 当系数域是[[代数闭域]]时(否则可以将系数域扩展到其代数闭包上来看),[[特征多项式]]<math>P_{A}(\lambda)</math>有'''n'''个[[根]],它可以表达成: <center><math>P_{A}(\lambda) = (-1)^n(\lambda - r_1)^{\alpha_1}(\lambda - r_2)^{\alpha_2} \cdots (\lambda - r_k)^{\alpha_k}</math></center> 其中的<math>r_1,r_2 \cdots r_k</math>是特征多项式的不同的根,而<math>\alpha_1,\alpha_2 \cdots \alpha_k</math>是这些根在特征多项式裡的重数,称为代数重数。显然,所有代数重数加起来等于'''n'''。一方面,特征多项式的根就是矩阵的[[特征值]],而另一方面,借由根与多项式系数的关系可以知道:特征多项式的所有的根加起来等于矩阵的迹数。所以矩阵的迹数是矩阵的所有特征值(按照代数重数计算)的和<ref>Karim M. Abadir,Jan R. Magnus, ''Matrix algebra'',第168页</ref>。 <center><math>\mathrm{tr}( \mathbf{A}) = \alpha_1 r_1 + \alpha_2 r_2 + \cdots + \alpha_k r_k</math></center> 如果将矩阵写成它的[[若尔当标准型]]的话,也可以看出这一点,因为[[若尔当标准型]]的特征多项式的所有的根(包括重根)就是对角线上的所有元素。 如果不区分相同或不同的特征值的话,上述关系也可以写成: <center><math>\mathrm{tr}( \mathbf{A}) = \lambda_1 + \lambda_2 + \cdots + \lambda_n</math></center> 其中的<math>\lambda_1,\lambda_2 \cdots \lambda_n</math>是矩阵的特征值。 而且有: <center><math>\forall m \in \mathbb{N}, \mathrm{tr}( \mathbf{A}^m) = \lambda_1^m + \lambda_2^m + \cdots + \lambda_n^m</math></center> ==線性映射的跡數== 設系数域为<math>\mathbb{K}</math>的<math>\mathbb{V}</math>是一個有限[[維度|維]]的[[向量空間]],維數是'''n'''。給定任一[[線性映射]]<math>f : \mathbb{V}\rightarrow \mathbb{V}</math>,可以定義此一映射的跡數為其[[变换矩阵]]的跡,即選定<math>\mathbb{V}</math>的一個[[基 (線性代數)|基底]]並用對應於此基底的一個方形矩陣描述<math>f</math>,再定義這個方形矩陣的跡數為<math>f</math>的跡數。這個定義下<math>f</math>的跡數和所選取的基無關:只需要注意到不同的基底的選取實際上等價於對變換矩陣做一次相似變換,而兩個相似的矩陣的跡數是一樣的。因此這樣的定義是自洽的。 另外一种定义涉及到行列式的性质。考虑<math>\mathbb{V}</math>的一个基底<math>\mathcal{B} = (e_1, e_2, \cdots , e_n)</math>,以及函数: <center><math>Sp : \; \; \; \quad \mathbb{V}^n \qquad \; \quad \longrightarrow \quad \qquad \qquad \qquad \mathbb{K} \qquad \qquad \qquad, </math></center> <center><math>Sp :(x_1, x_2, \cdots , x_n) \longmapsto \sum_{i=1}^n \det(x_1, x_2, \cdots , f(x_i),\cdots ,x_n)</math></center> 根据行列式理论,这个函数也是一个行列式型的函数,也就是说存在一个只取决于<math>f</math>的量<math>\mathrm{Sp} (f)</math>,使得 <center><math>Sp(x_1, x_2, \cdots , x_n) = \mathrm{Sp} (f) \cdot \det(x_1, x_2,\cdots ,x_n)</math><ref>Werner, ''Linear Algebra'',第126页</ref></center> 可以证明,这个纯量<math>\mathrm{Sp} (f)</math>就等于之前定义的<math>f</math>的跡數<ref>Werner, ''Linear Algebra'',第127-128页</ref>。 == 迹的梯度 == 由迹的定义可知迹可以看作是矩阵的实标量函数,所以我们可以通过求实标量函数的梯度来求迹的[[梯度]]。 === 单个矩阵 === *'''A'''是m×m矩阵时,有<math>\frac { \partial \mathrm{tr}(\mathbf{A}) }{ \partial \mathbf{A} } ={ \mathbf{I} }_{ m }</math> *m×m矩阵'''A'''可逆时,有<math>\frac { \partial \mathrm{tr}(\mathbf{A}^{-1}) }{ \partial \mathbf{A} } =-( \mathbf{A}^{-2} )^T</math> *对于两个向量'''x'''和'''y'''的外积,有<math>\frac { \partial \mathrm{tr}(\boldsymbol{xy}^T) }{ \partial \boldsymbol{x} }=\frac { \partial \mathrm{tr}(\boldsymbol{yx}^T) }{ \partial \boldsymbol{x} } =\boldsymbol{y}</math> === 两个矩阵 === *若'''A'''为m×n矩阵,有<math>\frac { \partial \mathrm{tr}(\mathbf{A}\mathbf{A}^T) }{ \partial \mathbf{A} }=\frac { \partial \mathrm{tr}(\mathbf{A}^T\mathbf{A}) }{ \partial \mathbf{A} } =2\mathbf{A}</math> *若'''A'''为m×m矩阵,有<math>\frac { \partial \mathrm{tr}(\mathbf{A}^2) }{ \partial \mathbf{A} }=\frac { \partial \mathrm{tr}(\mathbf{A}\mathbf{A}) }{ \partial \mathbf{A} } =2\mathbf{A}^T</math> *若'''A'''为m×n矩阵,'''B'''是m×n矩阵,有<math>\frac { \partial \mathrm{tr}(\mathbf{A}^T\mathbf{B}) }{ \partial \mathbf{A} }=\frac { \partial \mathrm{tr}(\mathbf{B}\mathbf{A}^T) }{ \partial \mathbf{A} } =\mathbf{B}</math> *若'''A'''为m×n矩阵,'''B'''是n×m矩阵,有<math>\frac { \partial \mathrm{tr}(\mathbf{A}\mathbf{B}) }{ \partial \mathbf{A} }=\frac { \partial \mathrm{tr}(\mathbf{B}\mathbf{A}) }{ \partial \mathbf{A} } =\mathbf{B}^T</math> *当'''A'''和'''B'''均为对称矩阵时,有<math>\frac { \partial \mathrm{tr}(\mathbf{A}\mathbf{B}) }{ \partial \mathbf{A} }=\frac { \partial \mathrm{tr}(\mathbf{B}\mathbf{A}) }{ \partial \mathbf{A} } =\mathbf{B}+\mathbf{B}^T-diag(\mathbf{B})</math> *若'''A'''和'''B'''都是m×m矩阵,并且'''B'''是非奇异矩阵,有<math>\frac { \partial \mathrm{tr}(\mathbf{B}\mathbf{A}^{-1}) }{ \partial \mathbf{A} }=-(\mathbf{A}^{-1}\mathbf{B}^T\mathbf{A}^{-1})^T</math> ==參見== *[[行列式]] *[[若尔当标准型]] *[[对角矩阵]] *[[三角矩阵]] *[[特征多项式]] ==参考来源== {{reflist}} ==参考书籍== *{{zh}}{{cite book|author=张贤达|title=矩阵分析与应用|publisher=清华大学出版社|year=2008|isbn=9787302092711}} * {{en}}{{cite book | author = Strang Gilbert | title=Linear algebra and its applications | publisher=Thomson, Brooks/Cole, Belmont, CA | year=2006 | isbn=9780534422004 }} *{{zh}}{{cite book|author=居余马、林翠琴|title=线性代数|publisher=清华大学出版社|year=2002|isbn=978-7-302-06507-4}} * {{en}}{{cite book|title=''linear algebra'' |author=Werner Hildbert Greub |publisher=Springer Verlag|year= 1975 |isbn=978-0-387-90110-7}} * {{en}}{{cite book | title = ''Advanced Linear Algebra'' | author = Steven Roman | publisher = Springer | year = 2005 | isbn = 0-387-24766-1}} * {{en}}{{cite book|author=Carl Dean Meyer |title=''Matrix Analysis and Applied Linear Algebra Book and Solutions Manual''|publisher=Society for Industrial and Applied Mathematics |year=2001|isbn=978-0898714548}} * {{en}}{{cite book|author=Karim M. Abadir,Jan R. Magnus |title= ''Matrix algebra'' |publisher=Cambridge University Press |year=2005|isbn=978-0521537469}} [[Category:線性代數|J跡]] [[Category:矩陣論|J跡]]
本页使用的模板:
Template:Cite book
(
查看源代码
)
Template:En
(
查看源代码
)
Template:Lang
(
查看源代码
)
Template:NoteTA
(
查看源代码
)
Template:Reflist
(
查看源代码
)
Template:Zh
(
查看源代码
)
Template:线性代数
(
查看源代码
)
返回
跡
。
导航菜单
个人工具
登录
命名空间
页面
讨论
不转换
查看
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息