Chap5 张量空间
Chap5 张量空间
什么事张量
向量空间和其对偶
详细的关于向量空间的介绍可以参考 从线性映射理解线性代数 和 抽象代数基础教程抽象代数基础教程,这里给出一些简单的介绍
域
field/域
一个 (algebraic) field 事一个三元组 ,其中 K 是一个集合, 是双目运算: 且满足下面性质:
- 是一个阿贝尔群,即:
- ,其中 ,是一个阿贝尔群,即:
- 映射 和 满足分配律: 9.
^def-group-field
remark
一个阿贝尔群是一个比较好的数学结构,与之相似的但是更弱的是环 (ring),其虽然也是一个三元组,不需要性质 2.2,2.3,2.4。如果一个环满足性质 2.2,那么称其为 unital ring(单位环),如果其满足性质 2.4,那么称其为 commutative ring(交换环),我们一般考虑的是 unital ring,而且一般就称为 ring
- 一个三元组 是一个交换的单位环,然而其不是一个域 (field),因为其中仅有 可以做逆运算 (性质 2.3)
- 集合 装备常规的 就是一个域
- 实 矩阵 是一个非交换的环
向量空间
K-vector space
假定 是一个域,在 K 上的一个 K-vector space 被定义为一个三元组:,其中 V 是一个集合,且:
满足:
- 是一个阿贝尔群
- 映射 是一个在 上的对 K 的 action:
^def-k-vector-space
vector space 也被称为 linear space,其中的元素被称为向量,域 K 中的元素被称为标量,映射 被称为标量乘法 (scalar multiplication)
上面的定义和我们之前对线性代数的操作是兼容的,因此可以预见到一些剩余的定义:
线性子空间
假定 是一个 K 上的线性空间,集合 是非空的,那么我们可以构造线性子空间 :
也可以写为:
^def-vector-subspace
和研究拓扑空间的思路一样,除了向内探求,扩充子空间的方式来增加空间种类,还可以向外探求,通过笛卡尔积来 product 空间
在基本的空间构造完了后,现在来研究映射保证空间上结构不变
线性映射
线性映射
如果 是在域 K 上的向量空间,映射 ,我们说 f 是一个线性映射,如果 :
^def-linear-map
为了方便,我们将不再使用类似 之类的特殊符号,直接使用 来表示标量乘法和向量加法,其作用域隐含在 context 中
线性同构
我们称一个线性双射是一个线性空间上的线性同构 (linear isomorphism),2 个线性空间被称为isomorphic,记为
^def-linear-isomorphic
note
可以直接证明,一个线性映射 ,如果是双射,那么其逆映射 也是线性的
根据我们之前学习线性代数的思路,在完善了线性映射的定义后,下面可以来研究线性映射构成的新空间,之前的结论告诉我们,这也是一个线性空间
对偶空间
线性映射的空间
是 K 上的线性空间,集合:
其中记号 代表 f 是 V 到 W 的线性映射
^def-linear-map-space
容易构造出一个新的线性空间,其上的 分别定义为:
其中:
其中:
remark
注意到,在我们证明向量空间的性质时,实际上并没有使用到全部的域的性质,事实上只需要K是一个(unital) ring 就足够了。在ring上的向量空间被称为 modules (模)
尽管在域上,Hom(V,W) 可以被很好的构造出来,但是如果是在环上定义的模,Hom 就不一定是向量空间了,因为证明其为向量空间利用到了乘法的交换性,但在环上不一定成立
介绍了 Hom 的构造,熟悉线性代数思路的 boy 应该会想到将其“特殊化”,考虑特殊的线性映射,这会诱导我们构造出所谓的对偶空间!
endomorphism
V 是一个线性空间,称 V 上的一个 endomorphism 是一个线性映射集合 ,记为:
^def-endomorphism
automorphism
如果 V 是一个线性空间,称 V 上的一个 automorphism 是一个线性同构集合,记为:
^def-automorphism
remark
并不是一个线性空间,而是一个线性空间;但是是一个group,在线性映射复合的运算下
终于我们可以给出对偶空间的定义:
对偶空间
V 是 K 上的一个线性空间,称其对偶空间 为:
此时 K 作为一个线性空间来考虑,可以证明域 K 就是一个线性空间
^def-dual-space
对偶空间中的元素是那些将 V 映射到 K 上的线性映射,一般也可以被称为线性算子 (linear functionals, covectors, or one-forms on V)
我们在线性空间的基础上导出了其对偶空间,接下来将介绍,通过研究向量空间和其对偶空间,我们可以构造出更抽象的张量空间和张量积
张量和张量空间
为了研究张量,我们首先给出所谓的 双线性 的定义,可以参考 [1]
双线性
假定 是在 K 上的向量空间,映射 被称为双线性的 (bilinear),如果:
即对映射 和 对任意固定的 w 和 v 都是线性的
remark
如果将 看成一个整体,考虑线性映射 :
如果展开来看,,有:
对比我们定义的双线性:
显然和线性映射不同,这意味着双线性其实是一种特殊的非线性
example
映射 ,定义为 ,可以验证这是一个线性映射:
而对定义为 ,其不是一个线性映射,但是是一个双线性映射:
根据双线性的思想 (对单个 index 线性),我们可以拓展到多重线性映射 (通过笛卡尔积),从而可以给出张量的定义了:
多重线性映射/张量
V 是一个 K 上的向量空间,一个 -tensor T 在 V 上是一个多重线性映射:
我们可以记为:
^def-tensor
我们称 张量是协变张量 (covariant p-tensor), 是逆变张量 (contravariant q-tensor)
remark
传统上来说, 张量就是 K 上的一个元素,因此记为
remark
注意,为了定义 是一个集合,回顾我们集合的定义,我们需要写出一个形式化的,反映集合元素特征的定义。注意到,我们目前讲的映射实际上是一个 relation,即: 是一个 relation 的子集,因此满足某个特征 的映射 可以表示为:
因此,对 的集合表示,实际上指的是:
^remark-tensor-linear-space
为了从现有的线性空间 tensor space 中构造新的 tensor,正如我们一贯的思路:
- 向内找子空间
- 向外找 product
这次向内似乎不好找,或者说目前看来意义不大 (张量空间上目前也没有什么结构可以继承到子空间上?),我们向外探索 product,因此:张量积,堂堂登场!
张量积
取张量 ,定义 T 和 S 的张量积 :
其中
^def-tensor-product
example
- ,我们可以证明其和 是一样的。具体来说,取 ,我们可以构造一个 :
其中 ,这表明构造成立;反过来也是类似的构造,且构造的映射的线性可以直接从双线性性得到。从而我们构造了一个双射,从而有
- ,一般来说这是不成立的,有限维的时候成立
- ,当 V 有限维时成立,所谓的自然同构
在线性空间中,为了确定坐标,我们需要给出一组基底,而唯一的不依赖任何额外的结构的基底是 Hamel basis
Hamel basis
如果 是在 K 上的线性空间,子集 被称为 V 的 Hamel basis,如果:
- 的每个有限子集 都是线性不相关的,即
- 是 V 的一个 generating/spanning set,即:
- 上面定义也可以转换为如下表示:
从而有
^def-hamel-basis
Hamel Basis 有一些有用的性质:
- V 是一个向量空间, 是 V 的一组 hamel basis,那么 是一个 minimal spanning and maximal independent subset of V,即,如果 ,有
- S 是线性独立的
我们定义线性空间的维数为:,其中 是线性空间 V 的 Hamel basis,我们可以证明,对一个给定的线性空间,其不同的 hamel basis 具有相同的势,那么表明我们的定义是 well-defined
如果我们对有限维线性空间 V 选取了 hamel basis 有:,那么可以构造 上的对偶基: :
^eqn-induced-dual-basis
可以证明,这是满足定义的对偶基,这也给我们信息:在有限维的情形,V 和 V* 和 (V*)* 都是同构的,且保持了线性性
一旦我们有了空间中的基底,我们就可以将空间中的元素在基底下进行表示,从而将坐标对这种东西扩展到张量上:
tensor components
V 是一个 K 上的有限维线性空间,有基底 ,取张量 ,我们定义 T 在基底 B 下的 components 为:
其中 是数, 是 B 的对偶基
^def-tensor-componenets
如果我们将一个 tensor T 表示成了一堆数字 ,那么应该如何将其重构回一个抽象的多重线性映射呢?
根据张量的 components,我们可以重构张量:
^eqn-reconstruct-tensor
其中 代表 的元素, 代表 的元素。根据我们定义的张量积计算方法,^def-tensor-product, 是 p 个 张量和 q 个 之张量积,因此结果为一个 张量。我们在前面已经给出了 tensor space 作为 线性空间的结构,其中给出了其上的 scalar 运算符号 。根据我们张量积的定义,将还原后的结果丢进去算,可以发现结果正确,这表明我们的还原映射操作大成功!
note
在表示^eqn-reconstruct-tensor时,其中的求和符号我们一般省略掉,根据后面的求和指标约定。
简单来说,V的基底放在下方,的基底放在上方,一旦出现上方下方一样指标,就直接求和。
具体可以参考后面部分Einstein Summation Convention
我们完成了在给定基底下张量的分量表示,并对分量表示进行了还原。下面我们可以考虑,如果有 2 个不同的基底,那么基底之间的转换应该如何表示?
考虑一个有限维向量空间,,有基底:,新基底为:
,其中 (输入 2 个变量,输出一个 scalar),而其对应的运算 ,即在线性空间 V 上定义的 scalar product。为了保证新基底确实是一个基底,应该还可以转换回去,即:
如果采用矩阵记号,我们有
Einstein Summation Convention
首先展示基本例子:
我们写出:
而不是:
我们将上下重复的指标称为哑指标 (dummy indices),他们总是成对出现在上下部分,我们将其加起来;不是哑指标的 indices 我们称为自由指标 (free indices);包含自由指标的式子代表多个表达式,每一个自由指标代表一个 slot 的位置 (对应该 slot 上多个值对应的表达式),且自由指标必须在等式两边匹配:
- 正确式子:
- 不正确式子:
一般来说:
- V 的基底写在下方
- V 对偶基底写在上方
举例来说:
其中 , 是 V 的基, 是 V 的对偶基
remark
注意,Einstein 的求和规则只适用于线性空间和多重线性映射,否则看下面这个情况:
考虑一个映射 ,取 ,,从而有:
注意上面式子推出最后一步依赖于 是双线性的 (从而针对每个 slot 都是线性的,才能提出 )
线性代数里面我们给出了行向量和列向量。我们在了解了指标过后很容易想到这样的理解:
考虑 ,,将其看成下面的情况:
注意到 ,因此取 ,利用张量的分解我们有:,其中 是映射 在给定基地下的分量。回忆矩阵的想法,我们或许会写成:
表示成这样带来了结构上的复杂性,但是也有一定的好处
考虑有限维线性空间 V,我们有:,那么有:
因此对 的分量,我们可以写为:
注意到如果 ,那么考虑复合 :
最后一行就是在域 K 上进行的乘法,域 K 上乘法是可交换的,因此 。如果使用我们前面给出的矩阵记号,后面一个就是矩阵乘法
类似的,考虑:
不幸的是,transpose 是很容易造成误解的,是一个很坏的 notation…比如参考 ^example-matrix-flaw 是其中一个问题 #todo
这个故事的寓意是,你应该尽力不要把向量、向量和张量看作数字数组。相反,总是试着从抽象的、内在的、没有组件的角度来理解它们。
前面介绍了换基的部分操作,即:
有 V 的 2 组基 和 ,不同基底下应该有:,,且有 ,使用 index 进行表示则有:,或者
我们现在考虑张量的分量在改变基前后的变化。
考虑 ,那么有:
考虑 ,有:
总结起来,对 ,基 ,我们有:
考虑一个 tensor ,那么:
根据我们之前定义 matrix 的操作,既然 matrix 是由我们的 convention 鼓捣出来的,那么自然可以鼓捣出 matrix 上的操作,比如一个 matrix 的 determinant(行列式)
problem
考虑一个张量 ,那么我们可以将张量的分量 写成矩阵形式:
类似的,如果我们有张量 ,其分量 ,可以写为:
显然这俩张量完全不同,其中 是 中的一个元素,而 是一个 V 上的双线性形式,但是根据其矩阵形式描述,我们其实很难区分,这也是矩阵描述的一个缺点。
^example-matrix-flaw
总之回到原问题,我们在矩阵上有求行列式的操作,你可能会想这俩都有矩阵形式表述,是不是都可以做行列式操作呢?答案是否定的!我们只能对 ^def-endomorphism 进行这种操作,我们将给出原因:
考虑 M 是一个集合,称 M 的一个置换 (permutation) 是一个 的双射,进一步定义 n 阶对称群 (symmetric group of order n),记为 ,是集合 的置换的集合,其上附带了函数复合的操作作为运算 (来构成群)
我们称一个 transposition 是一个置换,其只改变 2 个元素,其他元素不变。那么我们有下面的结论:
任何置换 ,可以被写成 中 transposition 的复合
尽管一个置换 的分解可能是不唯一的,但是其分解为 transposition 的数目则是要么为奇数要么偶数,是一个 的不变量(否则就存在使用奇数次 transposition 回到原点的操作),从而我们可以定义一个关于 的函数:
sgn
其中 代表分解 的 transpositions 的数量
^def-sgn
n-form
现在回到 tensor space,考虑 V 是一个 d 维向量空间,一个 n-form on V 是一个 张量 ,且是完全反对称的 (totally antisymmetric),即:
^def-n-form
注意到 0-form 是一个 scalar,1-form 是一个 covector,一个 d-form 也被称为一个 top-form。定义 n-form 还有一些别的方式,比如:
theorem
一个 tensor w 被称为 n-form,当且仅当: 当 是线性相关时,
上面的定理告诉我们,尽管我们可以定义 n>d 的 form,但其值只能是 0.
theorem
记 是 V 上 n-form 构成的向量空间,那么我们有:
其中
特别的,,这意味着:
即我们可以称只有一个 top form on V
definition
称一个 choice of top-form on V 是一个 choice of volume form on V,一个带有 chosen volume form 的向量空间被称为一个带有体积的向量空间 (vector space with volume)
^def-vector-space-with-volume
这一定义的有用之处在于下面定义:
考虑 ,取 是一个 V 上的 volume form,那么给定 ,可以定义 扩充出的空间的 体积 为:
直觉上来看,w 上的反对称性质保证了当 是线性相关的时候,定义的体积为 0,这也是符合我们几何直觉的,因为线性相关的时候最多构成一个 V 上的 d-1 维超平面,体积为 0
remark
我们定义体积的时候似乎并没有要求V上的一些其余结构,比如长度、角度、内积啥的,我们唯一要求的是一个top form,其定义依赖于V是一个有限维拓扑流形
现在终于可以给出行列式在 tensor 意义下的定义了:
V 是一个 d 维向量空间,考虑 ,定义 的 determinant 为:
其中 , 是 V 的一组基
我们首先检查是不是 well-defined,注意到 是不依赖于基选取的,也不依赖于 选取的,可以验证,两个都是成立的。
从这里 determinant 的定义可以看出,其只能对 元素进行计算。
现在回顾我们研究的 2 个对象的定义:^example-matrix-flaw
可以发现,如果使用矩阵形式,进行转换基底操作,有::
那么:
对 g 有:
如果按照矩阵方式计算其行列式,有:
至少是和基底无关的;
考虑 (类似度量矩阵) 的 g,有:
表明结果和基底有关,这不是一个 well-defined 的 object
但是我们之后将会遇见一个量 ,其具有下面变换性质:
这表明这一量 X 在换基作用下也不是 well-defined。但是如果结合起来有:
这就是一个 well-defined 的 object 了。这一结果将在 principal fibre bundle 中遇见,使用这一结果,我们可以给 bundle 上定义 tensor,并给出 tensor densities,其直观上来讲是一种可以在换基变换下 随着 detA 的指数变化的量