摘要
本文基于重新学习变分法之后的思考写成的较为直白简单的总结,罗列了一部分泛函及变分法的基础定义,将变分与微分做了很浅显的比较,可能初学者更容易接受,而不是像我当时学习一样一头雾水。全文参考老大中老师《变分法基础》,欧斐君,梁建华老师《变分法及其应用》
导火线:变分法的起源及三个问题
变分法中,最速降线问题就像经典力学中牛顿的苹果一样经典,这是人类开始研究变分法的标志,该问题如下:
假设有位于同一平面内不同铅锤位置的A、B两点(A、B两点不在同一铅锤线上),试求一条路径,使得一个小球在仅受重力的作用下从A点到达B点的时间最短。
相应的该问题的解法以及建模方式已经被讨论烂了,本文在此不再多作赘述,在这里我更想就该问题浅显的谈谈变分法与微积分的不同之处。
该问题乍一看好像就是微积分中的最值问题,我们有一函数,在某个范围内(满足一些约束条件)求函数的最值以及最值所处的点。但仔细看看,好像有一个条件不一样,我们是在约束范围内求对应数值最大的函数,变量从微积分中的标量或向量变为了函数,这样一下引出了三个问题:1.函数是如何对应的数值的(注意我们要选取一个对应最大数值的函数)2.函数是如何变化的?它有像微积分中$dx,dy$一样的无穷小量吗?3.我们可以像在为微积分中找最大值一样,对变量“求导”使其“导数”为零求得驻值从而得到对应数值的最值吗?
照例我们还是先解决第一个问题
泛函
要解决是一个函数对应一个数值的问题我们需要引入泛函这个概念。
为了便于理解,我们先做一个粗暴的解释,我们让一个函数$f(x)$与一个实数$A$相关联,用微积分中的话讲:我们构造由$f(x)$到$A$的映射,则$A$就称为函数$f(x)$的泛函,而$f(x)$则称为实数$A$的宗量。
我们现在再严格的从数学角度构造这个概念:
我们取一组有某种共同性质函数组成的集合,并成为函数类(集合的定义相信所有人都明白,你现在就需要讲集合中的元素由原本的实数换成一系列函数即可),我们称$F={f(x)}$是某一给定的函数类,而$R$就是实数集合,如果对于$F$中的每一个函数,都有$J \in R$按照一定的规律与之对应(注意这里J是个变量,它随着函数的改变而改变),则称$J$为函数$f(x)$的泛函,记作$J = J[f(x)]$,相应的$f(x)$则称为$J$的宗量。
按照上面的定义,我们需要寻求一个规律,将函数与数值相对应起来,我们第一个能想到的就是定积分(我们能得到定积分的前提条件是我们函数集中的所有函数都有相同的定义域,我们将在$(x_1, x_2)$上连续的函数称为连续函数集,记作$C[x_1, x_2]$)由此我们给出最简泛函的定义
若有函数$F(x, y(x), y’(x) )$是在区间$[x_1, x_2]$上有关独立变量$x, y(x), y’(x)$的函数(独立变量是指在该函数中以上三者都是相互独立的量,在之后的变分、求导中以该量为单独的变量,而不将$y(x)$看作是x的函数)则我们可以确定一个有关于$y(x)$的泛函$J(y(x))$为
其中被积函数$F$称作该泛函的核,这种泛函统称为最简泛函。
变分
我们再来解决第二个问题,函数之间的变化量可以像微积分中那样有像$dx, dy$一样的无穷小量吗,答案是肯定的。
函数间的距离
但在定义它之前我们先要来看看两个函数之间的距离该如何确定。我们假设有两个函数$y(x)$和$y_0(x)$,二者都在$[x_1,x_2]$上有n阶的连续导数,我们取二者在0到n阶导数之中最大的差值作为二者的距离,称为n级距离,当$n=0$时该距离被称为零级距离,我们用严格的数学公式表示它
我们由此可以很容易得到$d_0\leqslant d_1\leqslant d_2 \cdots \leqslant d_n$
我们类似复变函数中的定义,得到函数类中的邻域,即设有一在$[a,b]$上有n阶连续函数函数$y_0$,则相应的所有在$[a,b]$内n级距离小于$\delta$的函数类(一个集合)被称为$y_0$在$[a,b]$上的n级$\delta$邻域。我们可以用数学符号将其简练的表达为
我们易得,拥有更高阶$\delta$接近度的两个函数更加接近。
泛函的连续
当出现$\delta$时就应该警觉,因为它的出现往往暗示着无穷小量的定义,即经典的$\varepsilon-\delta$证明。(可以回想数学分析或高等数学中连续性证明)类似的,我们现在来定义泛函(注意是泛函而不是函数类)的连续。
对于任意给定的一个正数$\varepsilon$我们总是可以找到一个$\delta$使得
$y(x)\in \in N_n[\delta, y_0(x)]$且$y(x)\subset F$(其中F是泛函J的定义域)有
$|J(y(x))-J(y(x_0))|<\varepsilon$则称泛函J在$y_0(x)$处有n阶$\delta$接近度的连续泛函
最终我们来定义变分
注意,笔者在此对老大中老师《变分法》中有关变分的定义表示质疑,本节按照维基百科中有关变分的定义写成。
我们首先给出变分的定义,我们有在$[a,b]$上二阶导连续的函数$y_0(x)$我们定义一个有一阶导数的函数$\eta(x)$,其在边界上为零,即$\eta(a)=\eta(b)=0$取一趋近于零的无穷小量$\varepsilon$,则有$\varepsilon \eta(x)$为原函数$y_0(x)$的变分,记为$\delta y_0$。
另外给出等时变分的定义(这将是分析力学中重要部分),我们现在有坐标$x(t)$其是关于时间t的函数,我们根据上述可以得到x的变分就是任意一个满足在边界条件上为零的函数乘以一个无穷小量,原函数加上它就会变为另一个函数;等时变分则侧重另一个问题,即在同一时间(此时t为定值记为$t_0$)两个不同函数之差,我们可以记作$\varepsilon\eta(t_0)$,关于分析力学中虚位移的定义在变分上的定义,请移步《分析力学与变分法》
定义完了变分,我们来比较变分与微分;可以看到变分和微分都是我们对相应研究对象所取的无穷小量,函数中的变量$x$在加了$dx$后就不再是原来的点了,同理函数$y_0$在加了变分$\delta y_0$之后也发生了细微的变化变得不太一样。
总结,为什么变分法和微积分那么像?
稍稍总结一下我们现在所得到的,我们不难看出,泛函和函数之间十分类似,函数所拥有的定义经过变形加工就可以使用在泛函上。对于函数y(x)来说变量,或者研究对象就是自变量x,而对于泛函$J(y(x))$我们的研究对象或者自变量不再是一个值,而是y与x之间的关系,即函数。
冥冥之中自有天意,二者被联系在了一起,其实从数学角度出发,变分是微分的一种,是微分推广到无限空间上的形态。我们在这里不做过多追究,仅凭借一个不太严谨的例子,帮助各位粗浅理解一下。
想象我们有一一元函数,坐落在$x-y$平面上,于是我们有$y(x)$,即一个x就能确定一个y值,但是如果我告诉你,x并不是在平面上的点,而是有一定纵深的关于t的函数呢?这就相当于我们手里攥了数根电线,我们从电线的刨面看去,每一根电线就像是一个个在平面上的点一样,但实际上我们所看到的每一个点都是在空间中来回环绕的线
而我们之前所拥有的函数$y(x)$就正好将每一条“线”对应映射在了一个确定值上,这恰好满足了我们泛函中函数对数值的映射。综上我们可以粗浅理解为泛函就是将微积分中的点扩展在空间上无限长的线条,我们也可以解释,为什么泛函中的定义在微积分中都能找到相应的对照。