本文共 8576 字,大约阅读时间需要 28 分钟。
本文是变分法理解系列的第2篇文章,第一篇文章见变分法理解1——泛函简介,本文的要点如下:
- 基本概念
- 两个引理
- 什么是函数的变分
- 什么是泛函的变分
- 欧拉-拉格朗日方程(Euler–Lagrange equation)的证明
基本概念
具有某种共同性质的函数构成的集合称为类函数,记作F。例如在最速降线例子中的所有曲线都通过点O和A,通过点O和A就是函数集合具有的共同性质。
如果一个类函数中的某个函数能够使某个泛函取得极值或可能取得极值,则该类函数称为变分问题的可取类函数。可取类函数中的函数有无穷多个,其中任何一个都称为可取函数。
类函数中能使泛函取得极值或可能取得极值的函数或曲线称为极值函数,也称为变分问题的解。
变分法的核心问题就是求解泛函的极值函数和极值函数对应的泛函极值。
如果可取曲线类的曲线端点预先给出且为定值,则所求泛函极值的问题称为固定端点变分问题。
引理
引理1
如果函数 f ( x ) f(x) f(x) 在 [ a , b ] [a,b] [a,b]内连续, η ( x ) \eta(x) η(x) 是满足 η ( a ) = η ( b ) = 0 \eta(a)=\eta(b)=0 η(a)=η(b)=0 的任意函数,如果
∫ a b f ( x ) η ( x ) d x = 0 \int_a^b f(x)\eta(x)dx=0 ∫abf(x)η(x)dx=0
成立,那么对于所有的 x ∈ [ a , b ] x\in[a,b] x∈[a,b],有 f ( x ) ≡ 0 f(x)\equiv0 f(x)≡0
证明:
反证法,设f(x)不恒为0
由 η ( x ) \eta(x) η(x) 的任意性,取 η ( x ) = − f ( x ) ( x − a ) ( x − b ) \eta(x)=-f(x)(x-a)(x-b) η(x)=−f(x)(x−a)(x−b) , x x x是 a a a和 b b b之间变动的变量,所以 ( x − a ) ( x − b ) (x-a)(x-b) (x−a)(x−b)为负,由 f ( x f(x f(x)不恒为0,有:
∫ a b f ( x ) η ( x ) d x = ∫ a b − f ( x ) 2 ( x − a ) ( x − b ) > 0 \int_a^b f(x)\eta(x)dx=\int_a^b-f(x)^2 (x-a)(x-b)>0 ∫abf(x)η(x)dx=∫ab−f(x)2(x−a)(x−b)>0
与条件矛盾,所以 f ( x ) ≡ 0 f(x)\equiv0 f(x)≡0
引理2
如果函数 f ( x ) , g ( x ) f(x),g(x) f(x),g(x)在 [ a , b ] [a,b] [a,b]内连续, η ( x ) , ξ ( x ) \eta(x),\xi(x) η(x),ξ(x) 是满足 η ( a ) = η ( b ) = 0 \eta(a)=\eta(b)=0 η(a)=η(b)=0 且 ξ ( a ) = ξ ( b ) = 0 \xi(a)=\xi(b)=0 ξ(a)=ξ(b)=0 的任意函数,如果
∫ a b [ f ( x ) η ( x ) + g ( x ) ξ ( x ) ] d x = 0 \int_a^b[f(x)\eta(x)+g(x)\xi(x)]dx=0 ∫ab[f(x)η(x)+g(x)ξ(x)]dx=0
成立,那么对于所有的 x ∈ [ a , b ] x \in [a,b] x∈[a,b] ,有 f ( x ) ≡ g ( x ) ≡ 0 f(x) \equiv g(x) \equiv 0 f(x)≡g(x)≡0 。
证明:
反证法,设f(x)和g(x)不恒为0
由 η ( x ) , ξ ( x ) \eta(x),\xi(x) η(x),ξ(x) 的任意性,取 η ( x ) = − f ( x ) ( x − a ) ( x − b ) , ξ ( x ) = − g ( x ) ( x − a ) ( x − b ) \eta(x)=-f(x)(x-a)(x-b),\xi(x)=-g(x)(x-a)(x-b) η(x)=−f(x)(x−a)(x−b),ξ(x)=−g(x)(x−a)(x−b), x x x是 a a a和 b b b之间变动的变量,所以 ( x − a ) ( x − b ) (x-a)(x-b) (x−a)(x−b)为负,则:
∫ a b [ f ( x ) η ( x ) + g ( x ) ξ ( x ) ] d x = ∫ a b [ f ( x ) 2 + g ( x ) 2 ] [ − ( x − a ) ( x − b ) ] d x > 0 \int_a^b[f(x)\eta(x)+g(x)\xi(x)]dx=\int_a^b[f(x)^2+g(x)^2][-(x-a)(x-b)]dx>0 ∫ab[f(x)η(x)+g(x)ξ(x)]dx=∫ab[f(x)2+g(x)2][−(x−a)(x−b)]dx>0
这与条件矛盾,所以 f ( x ) ≡ g ( x ) ≡ 0 f(x)\equiv g(x) \equiv0 f(x)≡g(x)≡0
函数的变分
对于任意定值 x ∈ [ x 0 , x 1 ] x \in [x_0,x_1] x∈[x0,x1] ,可取函数 y ( x ) y(x) y(x) 与另一可取函数 y 0 ( x ) y_0(x) y0(x)之差 y ( x ) − y 0 ( x ) y(x)-y_0(x) y(x)−y0(x) 称为函数 y ( x ) y(x) y(x) 在 y 0 ( x ) y_0(x) y0(x)处的变分或者叫函数的变分,记作 δ y \delta y δy ,其中 δ \delta δ 称为变分算子,那么
δ y = y ( x ) − y 0 ( x ) = ϵ η ( x ) \delta y=y(x)-y_0(x)=\epsilon\eta(x) δy=y(x)−y0(x)=ϵη(x)
关于 ϵ η ( x ) \epsilon \eta(x) ϵη(x) 下文会详细讲
这里注意一下函数的变分 δ y \delta y δy 与函数的增量 Δ y \Delta y Δy 之间的区别,如图所示- 函数的变分 δ y \delta y δy 是两个不同的函数 y ( x ) y(x) y(x) 和 y 0 ( x ) y_0(x) y0(x) 在自变量x固定时的差,这是函数发生了改变。
- 函数的增量 Δ y \Delta y Δy 是自变量x的增量使得函数 y ( x ) y(x) y(x) 产生的增量,函数依然是原来的函数。
最简泛函的变分
设 F ( x , y ( x ) , y ′ ( x ) ) F(x,y(x),y'(x)) F(x,y(x),y′(x)) 是三个独立变量 x , y ( x ) , y ′ ( x ) x,y(x),y'(x) x,y(x),y′(x) 在区间 [ x 0 , x 1 ] [x_0,x_1] [x0,x1] 上的已知函数,且二阶连续可微,其中 y ( x ) y(x) y(x) 和 y ′ ( x ) y'(x) y′(x) 是 x x x的未知函数,则泛函:
J [ y ( x ) ] = ∫ x 0 x 1 F ( x , y ( x ) , y ′ ( x ) ) d x J[y(x)]=\int_{x_{0}}^{x_{1}}F(x,y(x),y'(x))dx J[y(x)]=∫x0x1F(x,y(x),y′(x))dx
被称为最简泛函,被积函数F成为泛函的核。
在 y = y ( x ) y=y(x) y=y(x) 的一阶邻域内,任取一曲线 y = y 1 ( x ) y=y_1(x) y=y1(x) ,则:
δ y = y 1 ( x ) − y ( x ) , δ y ′ = y 1 ′ ( x ) − y ′ ( x ) \delta y=y_1(x)-y(x),\delta_y'=y'_1(x)-y'(x) δy=y1(x)−y(x),δy′=y1′(x)−y′(x)
由泰勒展开式,最简泛函 J [ y ( x ) ] J[y(x)] J[y(x)]的增量为:
△ J = J [ y 1 ( x ) ] − J [ y ( x ) ] = J [ y ( x ) + δ y ] − J [ y ( x ) ] = ∫ x 0 x 1 [ F ( x , y ) + δ y , y ′ + δ y ′ ) d x − ∫ x 0 x 1 F ( x , y , y ′ ) d x = ∫ x 0 x 1 [ F ( x , y + δ y , y ′ + δ y ′ ) − F ( x , y , y ′ ) ] d x = ∫ x 0 x 1 ( F y δ y + F y ′ δ y ′ ) d x + ⋯ + ∫ x 0 x 1 [ 1 n ! ( δ y ∂ ∂ y + δ y ′ ∂ ∂ y ′ ) n F ] d x + R n \begin{aligned} \triangle J&=J[y_1(x)]-J[y(x)]=J[y(x)+\delta y]-J[y(x)] \\ &=\int_{x_0}^{x_1}[F(x,y)+\delta y,y'+\delta y')dx-\int_{x_0}^{x_1}F(x,y,y')dx\\ &=\int_{x_0}^{x_1}[F(x,y+\delta y,y'+\delta y')-F(x,y,y')]dx\\ &=\int_{x_0}^{x_1}(F_y\delta y+F_{y'}\delta y')dx+\cdots+\int_{x_0}^{x_1}[\frac{1}{n!}(\delta y \frac{\partial}{\partial y}+\delta y'\frac{\partial}{\partial y'})^{n}F]dx+R_{n} \end{aligned} △J=J[y1(x)]−J[y(x)]=J[y(x)+δy]−J[y(x)]=∫x0x1[F(x,y)+δy,y′+δy′)dx−∫x0x1F(x,y,y′)dx=∫x0x1[F(x,y+δy,y′+δy′)−F(x,y,y′)]dx=∫x0x1(Fyδy+Fy′δy′)dx+⋯+∫x0x1[n!1(δy∂y∂+δy′∂y′∂)nF]dx+Rn
把 ∫ x 0 x 1 ( F y δ y + F y ′ δ y ′ ) d x \int_{x_0}^{x_1}(F_y\delta y+F_{y'}\delta y')dx ∫x0x1(Fyδy+Fy′δy′)dx 称为泛函的变分,记作 δ J \delta J δJ
Euler–Lagrange equation
回顾变分法理解1——泛函简介中的最速降线问题:
设 y ~ ( x ) \tilde y(x) y~(x) 是一个可取类函数,即图中所有实线和虚线的集合。
在可取类函数 y ~ ( x ) \tilde y(x) y~(x) 中存在一个二阶可微的极值函数 y ( x ) y(x) y(x)(图中的实线)使得重物从O到A点的时间最短,即 y ( x ) y(x) y(x)可以使泛函 t = J [ y ~ ( x ) ] = ∫ 0 a ( 1 + ( y ~ ) ′ 2 ) 2 g y ~ d x \displaystyle t=J[\tilde y(x)]=\int_0^a \sqrt{\frac{(1 + (\tilde y)'^2)}{2g \tilde y}}dx t=J[y~(x)]=∫0a2gy~(1+(y~)′2)dx 取得极值。
可以用y(x)表示可取类函数中的所有曲线:
y ~ ( x ) = y ( x ) + δ y = y ( x ) + ϵ η ( x ) \tilde y(x)=y(x)+\delta y=y(x)+\epsilon\eta(x) y~(x)=y(x)+δy=y(x)+ϵη(x)
其中 ϵ \epsilon ϵ 为Lagrange引入的实数, η ( x ) \eta(x) η(x) 是满足 η ( x 0 ) = η ( x 1 ) = 0 \eta(x_0)=\eta(x_1)=0 η(x0)=η(x1)=0 的可微函数,可以看出在 ϵ = 0 \epsilon=0 ϵ=0 时 y ~ ( x ) = y ( x ) \tilde{y}(x)= y(x) y~(x)=y(x) ,使泛函 t = J [ y ~ ( x ) ] = ∫ 0 a ( 1 + ( y ~ ) ′ 2 ) 2 g y ~ d x \displaystyle t=J[\tilde y(x)]=\int_0^a \sqrt{\frac{(1 + (\tilde y)'^2)}{2g \tilde y}}dx t=J[y~(x)]=∫0a2gy~(1+(y~)′2)dx 取得极值为 J [ y ( x ) ] J[y(x)] J[y(x)]。
泛函 J [ y ~ ( x ) ] J[\tilde y(x)] J[y~(x)] 可以表示为:
ϕ ( ϵ ) = J [ y ~ ( x ) ] = J [ y ( x ) + ϵ η ( x ) ] = ∫ x 0 x 1 F ( x , y ( x ) + ϵ η ( x ) , y ′ ( x ) + ϵ η ′ ( x ) ) d x \phi(\epsilon)=J[\tilde y(x)]=J[y(x)+\epsilon\eta(x)]=\int_{x_0}^{x_1}F(x,y(x)+\epsilon\eta(x),y'(x)+\epsilon\eta'(x))dx ϕ(ϵ)=J[y~(x)]=J[y(x)+ϵη(x)]=∫x0x1F(x,y(x)+ϵη(x),y′(x)+ϵη′(x))dx
式是一个关于 x 积分式,在求解积分之后,剩下的只有 ϵ \epsilon ϵ ,因此它其实是 ϵ \epsilon ϵ 的函数,这个函数的特性是在 ϵ = 0 \epsilon=0 ϵ=0 时取得极值 J [ y ( x ) ] J[y(x)] J[y(x)],也就是在 ϵ = 0 \epsilon=0 ϵ=0 时, ϕ ( ϵ ) \phi(\epsilon) ϕ(ϵ) 满足:
d ϕ d ϵ ∣ ϵ = 0 = 0 \frac{d\phi}{d\epsilon}|_{\epsilon=0}=0 dϵdϕ∣ϵ=0=0
由求导与积分顺序的可交换性, d ϕ d ϵ \displaystyle \frac{d \phi}{d \epsilon} dϵdϕ 形式如下:
d ϕ d ϵ = ∫ x 0 x 1 F y [ x , y ( x ) + ϵ η ( x ) , y ′ ( x ) + ϵ η ′ ( x ) ] η ( x ) + F y ′ [ x , y ( x ) + ϵ η ( x ) , y ′ ( x ) + ϵ η ′ ( x ) ] η ′ ( x ) d x \frac{d\phi}{d\epsilon}=\int_{x_0}^{x_1}F_y[x,y(x)+\epsilon\eta(x),y'(x)+\epsilon\eta'(x)]\eta(x)\\+F_{y'}[x,y(x)+\epsilon\eta(x),y'(x)+\epsilon\eta'(x)]\eta'(x)dx dϵdϕ=∫x0x1Fy[x,y(x)+ϵη(x),y′(x)+ϵη′(x)]η(x)+Fy′[x,y(x)+ϵη(x),y′(x)+ϵη′(x)]η′(x)dx
令 ϵ = 0 \epsilon=0 ϵ=0 :
d ϕ d ϵ ∣ ϵ = 0 = ∫ x 0 x 1 [ F y η ( x ) + F y ′ η ′ ( x ) ] d x = 0 \frac{d\phi}{d\epsilon}|_{\epsilon=0}=\int_{x_0}^{x_1}[F_{y}\eta(x)+F_{y'}\eta'(x)]dx=0 dϵdϕ∣ϵ=0=∫x0x1[Fyη(x)+Fy′η′(x)]dx=0
应用分部积分法
0 = ∫ x 0 x 1 [ F y η ( x ) + F y ′ η ′ ( x ) ] d x = ∫ x 0 x 1 F y η ( x ) d x + ∫ x 0 x 1 F y ′ η ′ ( x ) d x = F y η ( x ) d x + ∫ x 0 x 1 F y ′ d η ( x ) = F y η ( x ) d x + F y ′ η ( x ) ∣ x 0 x 1 − ∫ x 0 x 1 η ( x ) ( d d x F ′ y ) d x = ∫ x 0 x 1 ( F y − d d x F ′ y ) η ( x ) d x + F y ′ η ( x ) ∣ x 0 x 1 \begin{aligned} 0&=\int_{x_0}^{x_1}[F_y\eta(x)+F_{y'}\eta'(x)]dx\\ &=\int_{x_0}^{x_1}F_y\eta(x)dx+\int_{x_0}^{x_1}F_{y'}\eta'(x)dx\\ &=F_y\eta(x)dx+\int_{x_0}^{x_1}F_{y'}d\eta(x)\\ &=F_y\eta(x)dx+F_{y'}\eta(x)|_{x_0}^{x_1}-\int_{x_0}^{x_1}\eta(x)(\frac{d}{dx}F'y)dx\\ &=\int_{x_0}^{x_1}(F_y-\frac{d}{dx}F'y)\eta(x)dx+F_{y'}\eta(x)|_{x_0}^{x_1} \end{aligned} 0=∫x0x1[Fyη(x)+Fy′η′(x)]dx=∫x0x1Fyη(x)dx+∫x0x1Fy′η′(x)dx=Fyη(x)dx+∫x0x1Fy′dη(x)=Fyη(x)dx+Fy′η(x)∣x0x1−∫x0x1η(x)(dxdF′y)dx=∫x0x1(Fy−dxdF′y)η(x)dx+Fy′η(x)∣x0x1
由于 η ( x 0 ) = η ( x 1 ) = 0 \eta(x_0)=\eta(x_1)=0 η(x0)=η(x1)=0 ,因此: F y ′ η ( x ) ∣ x 0 x 1 = 0 F_{y'}\eta(x)|_{x_0}^{x_1}=0 Fy′η(x)∣x0x1=0
推出:
∫ x 0 x 1 ( F y − d d x F ′ y ) η ( x ) d x \int_{x_0}^{x_1}(F_y-\frac{d}{dx}F'y)\eta(x)dx ∫x0x1(Fy−dxdF′y)η(x)dx
再由引理1:
F y − d d x F ′ y = 0 F_y-\frac{d}{dx}F'y=0 Fy−dxdF′y=0
这就是Euler–Lagrange equation。Euler–Lagrange equation也可以利用泛函取得极值时, δ J = 0 \delta J=0 δJ=0 来证明。
η ( x ) \eta(x) η(x) 实际上是加在y(x)上一个扰动,Euler–Lagrange equation的意义在于不管扰动是什么形式,如果泛函取得极值,都有 F y − d d x F y ′ = 0 \displaystyle F_y-\frac{d}{dx}F'_y=0 Fy−dxdFy′=0成立。
转载自:
博主:清雅的数学笔记 博客地址: 来源:知乎转载地址:https://jensen-lee.blog.csdn.net/article/details/89148553 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!