线性代数
A
=
[
1
2
3
4
]
{\displaystyle \mathbf {A} ={\begin{bmatrix}1&2\\3&4\end{bmatrix))}
向量 ·
向量空间 ·
基底 ·
行列式 ·
矩阵
向量
标量 ·
向量 ·
向量空间 ·
向量投影 ·
外积(
向量积 ·
七维向量积) ·
内积(
数量积) ·
二重向量
矩阵与行列式
矩阵 ·
行列式 ·
线性方程组 ·
秩 ·
核 ·
迹 ·
单位矩阵 ·
初等矩阵 ·
方块矩阵 ·
分块矩阵 ·
三角矩阵 ·
非奇异方阵 ·
转置矩阵 ·
逆矩阵 ·
对角矩阵 ·
可对角化矩阵 ·
对称矩阵 ·
反对称矩阵 ·
正交矩阵 ·
幺正矩阵 ·
埃尔米特矩阵 ·
反埃尔米特矩阵 ·
正规矩阵 ·
伴随矩阵 ·
余因子矩阵 ·
共轭转置 ·
正定矩阵 ·
幂零矩阵 ·
矩阵分解 (
LU分解 ·
奇异值分解 ·
QR分解 ·
极分解 ·
特征分解) ·
子式和余子式 ·
拉普拉斯展开 ·
克罗内克积
线性空间与线性变换
线性空间 · 线性变换 ·
线性子空间 ·
线性生成空间 ·
基 · 线性映射 ·
线性投影 ·
线性无关 ·
线性组合 ·
线性泛函 ·
行空间与列空间 ·
对偶空间 ·
正交 ·
特征向量 ·
最小二乘法 ·
格拉姆-施密特正交化
.mw-parser-output .hlist ul,.mw-parser-output .hlist ol{padding-left:0}.mw-parser-output .hlist li,.mw-parser-output .hlist dd,.mw-parser-output .hlist dt{margin:0;display:inline}.mw-parser-output .hlist dt:after,.mw-parser-output .hlist dd:after,.mw-parser-output .hlist li:after{white-space:normal}.mw-parser-output .hlist dt:after{content:" :"}.mw-parser-output .hlist dd:after,.mw-parser-output .hlist li:after{content:" · ";font-weight:bold}.mw-parser-output .hlist-pipe dd:after,.mw-parser-output .hlist-pipe li:after{content:" | ";font-weight:normal}.mw-parser-output .hlist-hyphen dd:after,.mw-parser-output .hlist-hyphen li:after{content:" - ";font-weight:normal}.mw-parser-output .hlist-comma dd:after,.mw-parser-output .hlist-comma li:after{content:"、";font-weight:normal}.mw-parser-output .hlist dd:last-child:after,.mw-parser-output .hlist dt:last-child:after,.mw-parser-output .hlist li:last-child:after{content:none}.mw-parser-output .hlist ol{counter-reset:listitem}.mw-parser-output .hlist ol>li{counter-increment:listitem}.mw-parser-output .hlist ol>li:before{content:" "counter(listitem)" ";white-space:nowrap}.mw-parser-output .hlist dd ol>li:first-child:before,.mw-parser-output .hlist dt ol>li:first-child:before,.mw-parser-output .hlist li ol>li:first-child:before{content:" ("counter(listitem)" "}.mw-parser-output .hlist ol{counter-reset:listitem}.mw-parser-output .hlist ol>li{counter-increment:listitem}.mw-parser-output .hlist ol>li:before{content:" "counter(listitem)"\a0 "}.mw-parser-output .hlist dd ol>li:first-child:before,.mw-parser-output .hlist dt ol>li:first-child:before,.mw-parser-output .hlist li ol>li:first-child:before{content:" ("counter(listitem)"\a0 "}.mw-parser-output ul.cslist,.mw-parser-output ul.sslist{margin:0;padding:0;display:inline-block;list-style:none}.mw-parser-output .cslist li,.mw-parser-output .sslist li{margin:0;display:inline-block}.mw-parser-output .cslist li:after{content:","}.mw-parser-output .sslist li:after{content:";"}.mw-parser-output .cslist li:last-child:after,.mw-parser-output .sslist li:last-child:after{content:none}.mw-parser-output .navbar{display:inline;font-weight:normal;font-size:88%}.mw-parser-output .navbar-collapse{float:left;text-align:left}.mw-parser-output .navbar-boxtext{word-spacing:0}.mw-parser-output .navbar ul{display:inline-block;white-space:nowrap;line-height:inherit}.mw-parser-output .navbar-brackets::before{margin-right:-0.125em;content:"[ "}.mw-parser-output .navbar-brackets::after{margin-left:-0.125em;content:" ]"}.mw-parser-output .navbar li{word-spacing:-0.125em}.mw-parser-output .navbar a>span,.mw-parser-output .navbar a>abbr{text-decoration:inherit}.mw-parser-output .navbar-mini abbr{font-variant:small-caps;border-bottom:none;text-decoration:none;cursor:inherit;color:inherit!important}.mw-parser-output .navbar-ct-full{font-size:114%;margin:0 7em}.mw-parser-output .navbar-ct-mini{font-size:114%;margin:0 4em}
查论编
线性映射(英语:linear map)是向量空间之间,保持向量加法和标量乘法的函数。线性映射也是向量空间作为模的同态[1]。
线性算子(英语:linear operator)与线性变换(英语:linear transformation)是与线性映射相关的惯用名词,但其实际意义存在许多分歧,详见相关名词一节。
正式定义
设
和
都是系数体为
的向量空间,
是一个从
送到
的一个映射。如果
具有以下两个性质:
- 维持向量加法——对于任意两个
中的向量
和
:![{\displaystyle f(x+y)=f(x)+f(y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/11e072f8427aa606b95bad4d8fba9cb3da2c0b09)
- 维持标量乘法——对于任何
中的向量
和任何标量
:![{\displaystyle f(a\cdot x)=a\cdot f(x)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2eeea715d963c53b5db41eeadb16f2b1ef61087d)
则称
是一个
-线性映射。在系数体不致混淆的情况下也经常简称线性映射。
这等价于要求
对任意向量
和任意标量
:
线性泛函
任何的体
本身就是一维的(系数为自身的)向量空间,所以可以考虑任何从系数体同样为
的向量空间
送往
的线性映射,这类线性映射被称为线性泛函。研究线性泛函的学科是线性泛函分析,是泛函分析最成熟的分支。
注意事项
- 线性映射中的“线性”与“函数图形是直线”没有任何关联。
- 定义域和到达域相同的线性映射可以进行函数合成,合成的结果依然会是线性映射。但是如果改变合成的顺序,那合成出来的结果通常不会相同。例如“把函数乘上
”和“对函数进行微分”都是线性算子,但是对一个函数“先乘上
再进行微分”和“先进行微分再乘上
”是不同的线性映射。[2]
- 维持向量加法的映射可能不维持标量乘法;同样地,维持标量乘法的映射也可能不维持向量加法。[3]
相关名词
线性变换和线性算子这两个名词,与本条目的线性映射密切相关,但不同作者有不同的定义。而这种定义分歧的根源在于,如
这样,定义域和值域落在同个向量空间的特殊线性映射,有些人为了凸显而予之不同的称呼。
比如Axler和龚昇就称这种特殊线性映射为线性算子[4][5],但另一方面将线性映射和线性变换视为同义词;李尚志则将这种特殊线性映射称为线性变换[6];而泛函分析的书籍一般将三者都视为本条目所定义的“线性映射”,其他细节以函数的符号传达[7][8]。
本条目采用泛函分析的习惯。
例子
- 对于实数,映射
不是线性的。
- 如果
是
实矩阵,则
定义了一个从
到
的线性映射,这个映射将列向量
映射到列向量
。反过来说,在有限维向量空间之间的任何线性映射都可以用这种方式表示;参见后面章节。
- 积分生成从在某个区间上所有可积分实函数的空间到
的线性映射。这只是把积分的基本性质(“积分的可加性”和“可从积分号内提出常数倍数”)用另一种说法表述出来。[9]
- 微分是从所有可微分函数的空间到所有函数的空间的线性映射。[9]
- “给函数乘上
”是一种线性映射。[9]设
是由全体连续函数所组成的函数空间,则此运算也是空间
中的算子。
- 后向移位(backward shift)运算是一种线性映射。即把无穷维向量
的第一个坐标划去:
。[9]
- 如果
和
为在体
上的有限维向量空间,则从线性映射
到在后面所描述的
矩阵的函数也是线性映射。[9]
- 一次函数
仅在
时才是一种线性变换。容易验证一次函数仅在
时,线性变换的基本性质
才能成立。(尽管
时其图像也是一条直线,但这里所说的线性不是指函数图像为直线。)同理,平移变换一般也不是线性变换(平移距离为零时才是线性变换)。[10][11]
矩阵
若
和
是有限维的、有相同的系数体
的向量空间,则从
到
的线性映射可以用矩阵表示。
以矩阵表示线性映射
假设
是个线性映射,且
![{\displaystyle {\mathfrak {B))_{V}=\left\{\alpha _{1},\alpha _{2},\,\ldots ,\alpha _{n}\right\))](https://wikimedia.org/api/rest_v1/media/math/render/svg/e418eccfde9170a40179e242a475a761c9d3a99c)
![{\displaystyle {\mathfrak {B))_{W}=\left\{\beta _{1},\beta _{2},\,\ldots ,\beta _{m}\right\))](https://wikimedia.org/api/rest_v1/media/math/render/svg/bb4684e60e96524e0708ac4844a0ca978f615bd7)
分别是
和
的基底。
根据基底
的基本定义,对于每个基向量
,存在唯一一组标量
使得
![{\displaystyle T(\alpha _{i})=\sum _{j=1}^{m}t_{ji}\cdot \beta _{j}=t_{1i}\cdot \beta _{1}+t_{2i}\cdot \beta _{2}+\cdots +t_{mi}\cdot \beta _{m))](https://wikimedia.org/api/rest_v1/media/math/render/svg/07574a1ca5bcd29d412c73766aa8a5ba446bbced)
直观上,标量
就是对基向量
的作用结果
,在基底
下的诸分量。
现在任取一个
里的向量
,因为基底
的基本定义,存在唯一一组标量
使得
![{\displaystyle v=\sum _{i=1}^{n}v_{i}\cdot \alpha _{i))](https://wikimedia.org/api/rest_v1/media/math/render/svg/f5efcd6ce621dbd0af7f6bead102004005a0a94c)
这样根据求和符号的性质,可以得到
![{\displaystyle T(v)=\sum _{i=1}^{n}v_{i}\cdot \left(\sum _{j=1}^{m}t_{ji}\cdot \beta _{j}\right)=\sum _{i=1}^{n}\sum _{j=1}^{m}(t_{ji}v_{i})\cdot \beta _{j}=\sum _{j=1}^{m}\sum _{i=1}^{n}(t_{ji}v_{i})\cdot \beta _{j}=\sum _{j=1}^{m}\left(\sum _{i=1}^{n}t_{ji}v_{i}\right)\cdot \beta _{j))](https://wikimedia.org/api/rest_v1/media/math/render/svg/d805608945923b09c719654b827a957467c2925f)
然后考虑到
,所以根据基底
的基本定义,存在唯一一组标量
使得
![{\displaystyle T(v)=\sum _{j=1}^{m}\lambda _{j}\cdot \beta _{j))](https://wikimedia.org/api/rest_v1/media/math/render/svg/12036283aabce9de5d9487c747b1f42812b4bc98)
因为这样的标量
是唯一存在的,所以对
有
![{\displaystyle \lambda _{j}=\sum _{i=1}^{n}t_{ji}v_{i))](https://wikimedia.org/api/rest_v1/media/math/render/svg/1ba8ea912895064970088211bfe5e132241d167d)
考虑到矩阵乘法的定义,上式可以改写为
![{\displaystyle {\begin{bmatrix}\lambda _{1}\\\lambda _{2}\\\vdots \\\lambda _{m}\end{bmatrix))={\begin{bmatrix}t_{11}&t_{12}&\dots &t_{1n}\\t_{21}&t_{22}&\dots &t_{2n}\\\vdots &\vdots &\ddots &\vdots \\t_{m1}&t_{m2}&\dots &t_{mn}\end{bmatrix)){\begin{bmatrix}v_{1}\\v_{2}\\\vdots \\v_{n}\end{bmatrix))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fade7eaf717a1a8a4f55c8e989db8a48284fb7fe)
也就是说,只要知道
在
下的诸分量
,任意向量
的作用结果
,都可以表示为矩阵
与行向量
的乘积。更直观的来说,矩阵
就是把
的诸分量沿行(column)摆放所构成的。
由上面的推导可以知道,不同的基底
和
下,矩阵
也不同,为了强调这点,也会将矩阵
记为
![{\displaystyle \mathbf {T} ={[T]}_((\mathfrak {B))_{W))^((\mathfrak {B))_{V))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b4c2e3cbab9350c132edfd924ac5eb747bc39b82)
来强调这种关联性。
若
,在同个向量空间
通常没有取不同基底的必要,那上面的推导可以在
的前提下进行。这时上式可以进一步简写为
![{\displaystyle \mathbf {T} ={[T]}_((\mathfrak {B))_{V))}](https://wikimedia.org/api/rest_v1/media/math/render/svg/41b8abb0e9d73aff454eb142eae020602b3aad57)
以线性映射表示矩阵
若有由
个标量构成的矩阵
,如果取
为
![{\displaystyle f(\mathbf {x} )=\mathbf {A} \mathbf {x} }](https://wikimedia.org/api/rest_v1/media/math/render/svg/0543db67428197d32999f8df7569eb892cb6ba4c)
其中
![{\displaystyle \mathbf {x} ={\begin{bmatrix}x_{1}\\x_{2}\\\vdots \\x_{n}\end{bmatrix))\in K^{n\times 1))](https://wikimedia.org/api/rest_v1/media/math/render/svg/ff98fdb5261049c3aed4410afe8d6192823cfb2a)
因为矩阵乘法只有唯一的结果,上面的定义的确符合函数定义的基本要求。然后考虑
和
都可以视为定义在同个标量体
上的向量空间,而且矩阵乘法是线性的,所以上述定义的函数
的确符合线性映射的基本定义。
用矩阵表示线性映射的原因和好处
- 把线性映射写成具体而简明的2维数阵形式后,就成了一种矩阵。进而由线性映射的加法规则和覆合规则来分别定义矩阵的加法规则和乘法规则是很自然的想法。[12]当空间的基变化(坐标系变换)时,线性映射的矩阵也会有规律地变化。在特定的基上研究线性映射,就转化为对矩阵的研究。利用矩阵的乘法,可以把一些线性系统的方程表达得更紧凑(比如把线性方程组用矩阵表达和研究),也使几何意义更明显。矩阵可以分块计算,可以通过适当的变换以“解耦”(把覆杂的变换分解为一些简单变换的组合)。要求出一个线性变换的秩,先写出其矩阵形式几乎是不可避免的一个步骤。
- 遇到
这样的加上了1个常量的非线性映射可以通过增加1个维度的方法,把变换映射写成2×2维的方形矩阵形式,从而在形式上把这一类特殊的非线性映射转化为线性映射。这个办法也适用于处理在高维线性变换上多加了一个常向量的情形。这在计算机图形学和刚体理论(及其相关机械制造和机器人学)中都有大量应用。
- 对角化的矩阵具有诸多优点。线性映射在写成矩阵后可以进行对角化(不能对角化的矩阵可以化简成接近对角矩阵的准对角矩阵),从而可以获得对角化矩阵拥有的独特优势(极大地简化乘法运算,易于分块,容易看出与基的选取无关的不变量)。比如,对于作用于同一个空间的可对角化的方形矩阵
,要求出
自乘
次后的结果
,一个一个慢慢地乘是很麻烦的事情。而知道对角化技巧的人会发现,在将这矩阵对角化后,其乘法运算会变得格外简单。实际应用中有很多有意思的问题或解题方法都会涉及到矩阵自乘n次的计算,如1阶非齐次线性递推数列通项公式的线性代数求解法和马尔可夫链的极限状态(极限分布)的求解。线性代数及矩阵论的一个主要问题就是寻找可使矩阵对角化的条件或者可使矩阵化简到含很多个0的条件[13],以便简化计算(这是主要原因之一)。
推广
多重线性映射是线性映射最重要的推广,它也是格拉斯曼代数和张量分析的数学基础。其特例为双线性映射。