Dérivée fonctionnelle
Définition
Soit
un
espace vectoriel de fonctions,
étant le corps des scalaires. On appelle fonctionnelle sur
une application de
dans
. Notons
l'ensemble des fonctionnelles sur
.
Soit une fonctionnelle
et une fonction
. Pour définir la dérivée fonctionnelle de
par rapport à sa variable
, nous avons besoin de la différentiabilité (au sens de Fréchet) de
en
(et donc de munir
et
de structures d'espace vectoriel normé).
Dans ce cadre, la dérivée fonctionnelle de
par rapport à
, notée
se définit comme la fonctionnelle sur
telle que :
![{\displaystyle \forall \phi \in M,{\frac {\delta F}{\delta \rho }}[\phi ]=_{def}D_{\phi }F[\rho ]}](https://img.franco.wiki/i/ff3372c70a1307e015f30d9dd60af42a27e6d1bc.svg)
où
représente la dérivée directionnelle de
dans la direction
, cette dérivée étant bien définie au point
car
est supposée différentiable en
. Ici, l'argument des fonctionnelles est noté entre crochets
pour rappeler que l'argument de
et de
est une fonction.
Propriétés
- On remarque immédiatement que la dérivée fonctionnelle de
par rapport à
s'identifie à la différentielle de
au point
:
grâce à l'identité
. Cela montre que
est une forme linéaire sur
, c'est-à-dire que
appartient au dual (algébrique) de
. Dans ce cadre, la différentielle de
se note aussi
et est appelée différentielle fonctionnelle de
.
- Si
est un ensemble de fonction test, la propriété précédente fait de
une distribution.
- Le fait que
soit stationnaire au point
s'écrit par définition
, donc
est une condition nécessaire pour que
soit un extremum local de
.
Règles de calcul
La dérivée fonctionnelle obéit à des règles similaires à celles du calcul différentiel ordinaire.
Soit deux fonctionnelles
et un scalaire
:
- Linéarité :

- Règle du produit :
![{\displaystyle {\frac {\delta (FG)}{\delta \rho }}=G[\rho ]{\frac {\delta F}{\delta \rho }}+F[\rho ]{\frac {\delta G}{\delta \rho }}}](https://img.franco.wiki/i/06dd80b1a99f0da9e0eba73d73642d7c607374d5.svg)
- On a alors par récurrence la conséquence :
![{\displaystyle {\frac {\delta (F^{n})}{\delta \rho }}=F^{n-1}[\rho ]{\frac {\delta F}{\delta \rho }}+F[\rho ]{\frac {\delta F^{n-1}}{\delta \rho }}=F^{n-1}[\rho ]{\frac {\delta F}{\delta \rho }}+F[\rho ]\times (n-1)F^{n-2}[\rho ]{\frac {\delta F}{\delta \rho }}=n\times F^{n-1}[\rho ]{\frac {\delta F}{\delta \rho }}}](https://img.franco.wiki/i/694e55aa88c5959d8d933f55d8a4a3e5e80ec46b.svg)
Les multiplications étant définies grâce à la multiplication interne sur
:
où
.
Ces propriétés découlent directement de celles de la dérivée directionnelle, ou encore de la différentielle.
Abus de notations
On note
l'ensemble de définition des fonctions de
. Soit
,
Les abus de notations suivants sont fréquemment utilisés :
, avec
, la distribution de Dirac centrée en y considérée comme une fonction de
telle que
(ce qui n'est pas mathématiquement rigoureux
n'étant pas réellement une fonction sur
). On a alors :
![\frac{\delta F \left[\phi\right]}{\delta \phi(y)}=\lim_{\varepsilon \to 0}\frac{F\left[\phi+\varepsilon\delta(x-y)\right]-F\left[\phi\right]}{\varepsilon}](https://img.franco.wiki/i/0ce266873517887c19c40a919b2229edd1ab418f.svg)
- En revanche, dans le cas où
,
est rigoureusement une fonctionnelle sur
:
, et comme
, on note alors :
. Ainsi :
, on obtient alors une formule souvent utilisée en physique :

- Pour donner un sens mathématique à l'expression
aussi fréquemment utilisée on peut aussi voir
comme une fonctionnelle
en identifiant
et
. En commettant alors le premier abus de notation on a : ![{\displaystyle {\frac {\delta \phi (x)}{\delta \rho (y)}}={\frac {\delta \phi (x)[\rho ]}{\delta \rho (y)}}={\frac {\delta \phi (x)}{\delta \rho }}[\delta _{y}]}](https://img.franco.wiki/i/eebe496c111e4ea383dd12a880417b3e93966c46.svg)
Par exemple si
et
sont reliées par une fonction de Green :
.
étant linéaire en
par propriété du produit de convolution, on a :
![{\displaystyle {\frac {\delta \phi (x)}{\delta \rho (y)}}={\frac {\delta \phi (x)}{\delta \rho }}[\delta _{y}]=\lim _{\varepsilon \to 0}{\frac {\phi (x)\left[\rho +\varepsilon \delta _{y}\right]-\phi (x)\left[\rho \right]}{\epsilon }}=(G*\delta _{y})(x)=G(x-y)}](https://img.franco.wiki/i/8cfc5848e84f18fff1e57090b33cf45cce649a3d.svg)
Dans le cadre du deuxième point où
, on a
l'élément neutre du produit de convolution et on retrouve la formule précédente :
![{\displaystyle {\frac {\delta \phi (x)}{\delta \rho (y)}}={\frac {\delta \phi (x)[\rho ]}{\delta \rho (y)}}={\frac {\delta \rho (x)}{\delta \rho (y)}}=G(x-y)=\delta (x-y)}](https://img.franco.wiki/i/c6d10aada827249f7a85c062333bb68db35cca08.svg)
Un exemple fondamental en physique
L'action est une fonctionnelle définie en mécanique analytique qui, d'après le principe de moindre action doit être minimale en la trajectoire suivie par le système physique.
Mathématiquement, en reprenant les notations de la partie définition on pose :
un intervalle de temps
, l'ensemble des fonctions de classe C1 de
dans
qui est dense dans
(voir espace Lp)
le Lagrangien du système physique, qui est supposé suffisamment régulier pour que l'action définie ci dessous soit continûment différentiable
On peut alors définir l'action comme la fonctionnelle :

où
représente l'application coordonnée, aussi appelé chemin, qui à un temps donné associe la position du système physique dans l'espace
.
Pour déterminer le mouvement du système, d'après le principe de moindre action, il faut chercher à minimiser l'action. Un tel chemin
vérifie donc
.
On calcule de la dérivée fonctionnelle de
par rapport à
pour une variation
telle que
, ce qui revient physiquement à prendre une variation du chemin sans faire varier ses points de départ et d'arrivée. Il faut noter que les fonctions définies comme
forment un sous ensemble dense dans
On obtient alors :
![{\displaystyle {\frac {\delta S}{\delta q}}[\Phi ]=\lim _{\epsilon \longrightarrow 0}\int _{t_{A}}^{t_{B}}{{\frac {{\mathcal {L}}(q(t)+\Phi (t),{\dot {q}}(t)+{\dot {\Phi }}(t),t)-{\mathcal {L}}(q(t),{\dot {q}}(t),t)}{\epsilon }}dt}=\int _{t_{A}}^{t_{B}}\Phi (t)\cdot {\Biggl (}\nabla _{q}{\mathcal {L}}(q(t),{\dot {q}}(t),t)-{\operatorname {d} \! \over \operatorname {d} \!t}\nabla _{\dot {q}}{\mathcal {L}}(q(t),{\dot {q}}(t),t){\Biggr )}dt}](https://img.franco.wiki/i/96252fa61df52f34af7cbd622e3633d73cdbf5e8.svg)
en faisant une intégration par partie du terme de droite, où le terme totalement intégré s'annule grâce à la définition de
, et où
désigne le produit scalaire canonique sur
(voir l'article des équations d'Euler-Lagrange pour plus de détails sur ce calcul).
Si on note la fonction :
, on obtient :
, où
désigne le produit scalaire sur l'espace de Hilbert
.
Comme la dérivée fonctionnelle
est représentable au sens du théorème de représentation de Riesz par une forme linéaire sur
et que
est une fonction de
, on peut identifier :
. Ce raisonnement est analogue à l'identification du gradient dans le cas du calcul de la dérivée directionnelle en dimensions finies par exemple.
Le principe de moindre action fournit alors
dans le dual
, ce qui se traduit par les équations d'Euler-Lagrange :

Cet article est issu de
wikipedia. Text licence:
CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.