suivant:  Dualité et théorème de Représentation de Riesz    Précédent: Propriétés élémentaires et Exemples


Orthogonalité -Théorème de la projection

Soit $E$ un espace métrique, $x\in E$ et $F$ une partie non vide de $E$ .

$\bullet$ Existe-t-il un point $a\in F$ qui soit le plus proche de $x$ ? c'est-

à-dire tel que $\forall\,y\in F,\;\;d(x,a)\le d(x,y)$ , autrement dit tel que

\begin{displaymath} % latex2html id marker 353 d(x,a)=\inf_{y\in F}d(x,y)\quad{\rm ou\; encore}\quad d(x;F)=d(x,a)\end{displaymath}

$\bullet$ Si un tel point existe, est-il unique ?

Un tel point, quand il existe, est appelé une projection de $x$ sur $F$ .

Si $F$ n'est pas fermé, on peut citer des exemples triviaux où la réponse à la première question est

déjà négative (prendre par exemple $E=\mathbb{R}$ , $F=[0,1[$ et $x=2$ ). Aussi supposerons-nous dans

la suite que $F$ est une partie fermée non vide. En général, un point n'a pas forcément de projection

sur un sous-ensemble fermé, ou peut en avoir plusieurs (prendre $F$ un cercle et $x$ son centre).

Cependant, ce problème a une solution satisfaisante lorsque $F$ est un sous-espace fermé d'un

espace de Hilbert $E$ . Cela s'accomplit grâce à la notion d'orthogonalité que nous introduisons

maintenant.

 

 

Définition   2.1

Deux éléments $x$ et $y$ d'un espace de Hilbert $E$ sont dits orthogonaux si $\langle x,y\rangle=0$ , on écrit alors $x\perp y$ . On dit que deux parties $F$ et $G$ de $E$ sont orthogonales si tout élément de $F$ est orthogonal à tout élément de $G$ , on écrit alors $F\perp G$ .

L'orthogonal d'une partie $F$ de $E$ , noté $F^\perp$ , est l'ensemble des éléments de $E$ orthogonaux à $F$ .

 

Propriétés   2.2

Soit $E$ un espace de Hilbert.

(1) L'orthogonal d'un sous-ensemble $F$ de $E$ est un sous-espace fermé de $E$ et on a
\begin{displaymath}F\cap F^\perp=\{0\},\quad F^\perp=(\overline{F})^\perp\quad\hbox{et}\quad F\subset(F^\perp)^\perp\end{displaymath}
(2) Si deux sous-ensembles $F$ et $G$ de $E$ vérifient $F\subset G$ , alors leurs orthogonaux vérifient $G^\perp\subset F^\perp$ .

Démonstration


Théorème 2.3 (de Pythagore)

Si $x_1$ , $x_2$ , ..., $x_n$ sont des éléments de $E$ , deux à deux orthogonaux, alors

\begin{displaymath}\Vert x_1+x_2+\cdots x_n\Vert^2=\Vert x_1\Vert^2+ \Vert x_2\Vert^2+\cdots +\Vert x_n\Vert^2\end{displaymath}

Démonstration

 

Proposition   2.4

Si $F$ et $G$ sont deux sous-espaces fermés d'un espace de Hilbert $E$ et s'ils sont orthogonaux,

$F\perp G$ , alors l'ensemble $F+G$ des éléments de la forme $x+y$ , avec $x\in F$ et $y\in G$, est un sous-espace fermé de $E$ .

Démonstration

  La norme d'un espace de Hilbert vérifie les propriétés caractéristiques suivantes :

Théorème 2.5

Dans un espace de Hilbert $E$ la norme vérifie les deux propriétés équivalentes suivantes, valables pour

tout $x$ , $a$ et $b$ dans $E$ ,

(1) L'identité de la médiane :
\begin{displaymath}\Vert x-a\Vert^2+\Vert x-b\Vert^2=2\Vert x-{1\over 2}(a+b)\Vert^2+{1\over 2}\Vert a-b\Vert^2\end{displaymath}
(2) L'identité du parallélogramme :
\begin{displaymath}\Vert x+a\Vert^2+\Vert x-a\Vert^2=2\Bigl[\Vert x\Vert^2+\Vert a\Vert^2\Bigr]\end{displaymath}

Démonstration

 

En interprétant $\Vert x\Vert$ comme la longueur du vecteur $x$ , l'identité du parallélogramme traduit la propriété bien connue en géométrie plane qui dit que ``dans un parallélogramme, la somme des carrés des diagonales est égale à la somme des carrés des côtés''.

Ensembles convexes

Rappelons qu'une partie $F$ d'un espace vectoriel $E$ est dite convexe si elle possède la propriété

géométrique suivante : pour tout $a$ et tout $b$ appartenant à $F$ et pour tout $\alpha\in [0, 1]$ ,

l'élément défini par $x_\alpha=(1-\alpha)a +\alpha b$ appartient aussi à $F$ . Quand $\alpha$ décrit l'intervalle $[0,1]$ , $x_\alpha$ décrit le ``segment de droite'' dans $E$ qui joint l'élément $a$ à l'élément $b$ . La convexité exige donc que $F$ contienne les segments joignant deux de ses points. Les convexes dans $\mathbb{R}$ sont

les intervalles.

Tout sous-espace vectoriel de $E$ est convexe. De même dans un espace vectoriel normé, la boule

fermée $\overline B(a,r)=\{x\mid \Vert x-a\Vert\le r\}$ est convexe. La convexité intervient de manière essentielle

dans les espaces vectoriels de l'analyse, cela est dû au fait que toutes les propriétés d'un espace

vectoriel normé peuvent être décrites uniquement en fonction de sa boule unité (ou même de sa

sphère unité), le lien étant établi grâce à la fonction jauge introduite par Minkowski. Un autre résultat

qui utilise la convexité est le théorème du point fixe de Brouwer-Schauder-Tychonov qui dit que si

$C$ est un compact convexe d'un espace localement convexe et $f$ est une application continue de

$C$ dans $C$ , il existe au moins un point $x\in C$ tel que $f(x)=x$ . Ce théorème est bien connu dans le cas où $C$ est un intervalle fermé borné de $\mathbb{R}$ .

 

Théorème 2.6 (projection sur une partie convexe complète)

Soient $E$ un espace préhilbertien et $F$ une partie non vide de $E$ , convexe et complète (par exemple

convexe fermé si $E$ est un espace de Hilbert). Pour tout élément $x$ de $E$ , il existe un unique élément

$a$ de $F$ tel que  $\Vert x-a\Vert=d(x; F)$ . De plus, $a$ est caractérisé par la propriété suivante :

\begin{displaymath}\Re e\,(\langle x-a, b-a\rangle)\leq 0, \quad\hbox{\rm pour tout}~ b\in F\end{displaymath}

Démonstration

 

Théorème 2.7 (projection sur un sous-espace de Hilbert)

Soient $E$ un espace de Hilbert, $F$ un sous-espace de Hilbert et $x$ un élément de $E$ . Il existe

un unique élément $a_x\in F$ tel que

\begin{displaymath}\Vert x-a_x\Vert=d(x; F)\end{displaymath}

De plus, $a_x$ est l'unique élément de $F$ tel que $x-a_x$ soit orthogonal à $F$ ; il est noté $P_F(x)$ et est appelé la projection orthogonale de $x$ sur $F$ .

Démonstration

Remarque 2.8  

Il faut bien noter que l'utilisation de l'identité de la médiane a été décisive dans la preuve du

théorème 2.6, et donc pour la validité du théorème 2.7. En fait, dans un espace de Banach, ce

théorème n'est pas vrai; par exemple dans l'espace de Banach $\left( C[0,1], \Vert{ . }\Vert_\infty\right )$ des fonctions continues sur $[0,1]$ muni de la norme de la convergence uniforme, l'ensemble

\begin{displaymath}F=\{\, f\in C[0,1]\mid f(0)=0\quad\hbox{et}\quad 0\le f\le1\,\}\end{displaymath}


est une partie convexe femée et pour tout $f\in F$ , on a

\begin{displaymath}\Vert 1-f\Vert_\infty=\sup_{0\le t\le 1}\vert 1-f(t)\vert=1\end{displaymath}


donc pour tout $f\in F$ , $d(1;F)=\Vert 1-f\Vert_\infty=1$ . Ainsi, tous les éléments de $F$ minimisent la distance de $1$ à $F$ .

 

Remarque 2.9  

La réciproque de ce théorème, à savoir que si dans un espace hilbertien $E$ , un ensemble $F$ est tel

que pour tout $x\in E$ il existe un unique $a\in F$ qui est le plus proche de $x$ , alors $F$ est convexe

et fermé, a été avancée depuis longtemps, mais elle n'a été ni prouvée ni réfutée.

 

Corollaire 2.10

Soient $E$ un espace de Hilbert et $F$ un sous-espace de Hilbert de $E$ .

Alors les sous-espaces $F$ et $F^\perp$ sont supplémentaires dans $E$ , c'est-à-dire que:   $E=F\oplus F^\perp$

Démonstration

 

Corollaire 2.11

L'application $P_F$ est un opérateur linéaire de $E$ dans $F$ qui vérifie, pour tout $x$ et tout $y$ dans $E$ ,

\begin{displaymath}\Vert P_Fx\Vert\leq\Vert x\Vert,\quad\langle P_Fx,y\rangle=\langle x,P_Fy\rangle\quad\hbox{\rm et}~~P_F(P_Fx)=P_Fx\end{displaymath}

Démonstration


 

Remarque 2.12  

On doit noter que même si $F$ est un sous-espace vectoriel fermé dans un espace préhilbertien, son orthogonal ne lui est pas nécessairement supplémentaire comme le montre l'exemple suivant : Soit l'espace vectoriel $C[0,1]$ , muni du produit scalaire

\begin{displaymath}\displaystyle\langle f,g\rangle=\int_0^1\!\!f(t)\overline{g(t)}\,dt\end{displaymath}


Soit $F$ le sous-espace vectoriel des fonctions nulles sur $[0, 1/2]$ , alors son orthogonal $F^\perp$ est le sous-espace vectoriel des fonctions nulles sur $[1/2, 1]$ . La fonction constante $1$ ne peut être somme d'une fonction nulle sur $[0, 1/2]$ et d'une fonction nulle sur $[1/2, 1]$ car elle s'annulerait au point $1/2$ . C'est que l'hypothèse ``$F$ fermé'' n'est pas la bonne hypothèse quand l'espace $E$ n'est pas complet (ce qui est le cas de l'espace $C[0,1]$ muni de la norme induite par le produit scalaire ci-dessus). La bonne hypothèse est que $F$ soit complet comme c'est précisé dans le théorème 2.6.

 

Corollaire 2.13

Dans un espace de Hilbert $E$ , un sous-espace vectoriel $F$ (non nécessairement fermé) est partout

dense si, et seulement si, son orthogonal est réduit à $0$ : $F^\perp=\{ 0\}$ .

 

Démonstration

 

Un problème de minimisation

Soit $v_1, v_2,\ldots, v_k$ des éléments d'un espace de Hilbert $E$ , linéaire-ment indépendants et soit $x\in E$ . Il s'agit de trouver un moyen pour calculer la valeur minimum de la quantité

\begin{displaymath}\bigg\Vert x-\sum_{j=1}^kc_jv_j\bigg\Vert\end{displaymath}


lorsque $c_1, c_2,\ldots, c_k$ décrivent $\mathbb{K} $ , et de trouver les valeurs correspondantes de $c_1, c_2,\ldots, c_k$ .

Soit $F$ l'espace vectoriel engendré par les éléments $v_1, v_2,\ldots, v_k$ . C'est un sous-espace fermé de

$E$ (puisque sa dimension est finie égale à $k$ ). La quantité qu'on cherche à minimiser représente la

distance de $x$ à l'élément de $F$ donné par $\sum_1^kc_iv_i$ . le théorème 2.7 précise que $P_F(x)$ est l'unique

élément de $F$ qui rend minimum la quantité ci-dessus, cet élément répond donc à la question posée

et il s'agit de le déterminer. $P_F(x)$ s'écrit sous la forme $P_F(x)=\sum_{j=1}^kc_jv_j$ et est aussi caractérisé

par le fait que $x-P_F(x)\in F^\perp$ , ce qui pourrait alors être utilisé pour obtenir des renseignements

sur le calcul des coefficients $c_1, c_2,\ldots, c_k$ . Posons pour cela

\begin{displaymath}a_{ij}=\langle v_j,v_i\rangle,\quad b_i=\langle x,v_i\rangle\end{displaymath}


La propriété $x-P_F(x)\perp F$ implique que $\langle x-P_F(x),v_i\rangle=0$ pour $1\le i\le k$ , ce qui fournit $k$

équations linéaires dont les inconnues sont $c_1, c_2,\ldots, c_k$ :

\begin{displaymath}\sum_{j=1}^ka_{ij}c_j=b_i,\quad\hbox{\rm o\\lq u}~~ 1\le i\le k\end{displaymath}


L'existence et l'unicité de $P_F(x)$ implique que le déterminant de la matrice $(a_{ij})$ n'est pas nul, et les

$(c_j)$ se calculent en résolvant le système précédent.

Soit maintenant $\gamma$ la valeur minimale de

\begin{displaymath}\bigg\Vert x-\sum_{j=1}^kc_jv_j\bigg\Vert\end{displaymath}


Puisque $x-P_F(x)$ est orthogonal à $F$ , on a $\langle x-P_F(x),P_F(x)\rangle=0$ et donc

\begin{displaymath}\gamma^2=\langle x-P_F(x),x-P_F(x)\rangle=\langle x,x-P_F(x)\rangle=\langle x,x-\sum_{j=1}^kc_jv_j\rangle\end{displaymath}


de sorte que $\displaystyle\gamma^2=\Vert x\Vert^2-\sum_{j=1}^k\overline{c_j}b_j$ . Notre problème est ainsi résolu.

Venons-en maintenant à un cas particulier : On suppose que les éléments $v_1, v_2,\ldots, v_k$ sont deux à deux orthogonaux. Alors

\begin{displaymath}a_{ij}=\cases{\Vert v_i\Vert^2,& si $i=j$\cr 0,& sinon\cr}\end{displaymath}


et par suite le système linéaire que vérifient les coefficients $(c_j)$ donne, pour tout $i$ , $c_i={b_i/\Vert v_i\Vert^2}$ et on a alors

\begin{displaymath}P_Fx=\sum_{j=1}^k\langle x,v_j\rangle {v_j\over\Vert v_j\Vert... ..._{j=1}^k{\vert\langle x,v_j\rangle\vert^2\over\Vert v_j\Vert^2}\end{displaymath}


Si les $v_j$ , $0\le j\le k$ sont orthonormés, ce qui précède se résume comme suit

 

Théorème 2.14

Soient $v_1, v_2,\ldots, v_k$ des éléments deux à deux orthogonaux et de norme 1, dans un espace de Hilbert

$E$ , soit $F$ le sous-espace vectoriel engendré par $(v_j)$ et soit $x$ un élément de $E$ . Alors, quels que

soient les scalaires $\lambda_1, \lambda_2, \ldots,\lambda_k$ , on a

\begin{displaymath}\displaystyle\bigg\Vert x-\sum_{j=1}^k\langle x,v_j\rangle v_j\bigg\Vert\le\bigg\Vert x-\sum_{j=1}^k\lambda_jv_j\bigg\Vert\end{displaymath}

L'égalité a lieu si et seulement si $\lambda_j=\langle x,v_j\rangle$ pour $1\le j\le k$ . La projection orthogonale de $x$ sur le

sous-espace $F$ est

\begin{displaymath}P_Fx=\displaystyle\sum_{j=1}^k\langle x,v_j\rangle v_j\end{displaymath}

La distance $\gamma$ de $x$ au sous-espace $F$ est donnée par
\begin{displaymath}\gamma^2=\displaystyle\Vert x-P_Fx\Vert^2=\Vert x\Vert^2-\sum_{j=1}^k\vert\langle x,v_j\rangle\vert^2\end{displaymath}

Ainsi, on a trouvé un algorithme constructif permettant de trouver la projection orthogonale d'un

élément $x$ de $E$ sur un sous-espace de dimension finie. Cet algorithme sera genéralisé au

paragraphe 4.

Exemple 2.15  

Soit à calculer

\begin{displaymath}\min_{a, b, c}\int_{-1}^1\!\!\vert x^3-ax^2-bx-c\vert^2\,dx\end{displaymath}


Considérons $L^2(-1,1)$ l'espace de Hilbert des (classes de) fonctions de carré sommables sur l'intervalle $(-1,1)$ relativement à la mesure de Lebesgue. Le produit scalaire sur $L^2(-1,1)$ est défini par

\begin{displaymath}\langle f,g\rangle=\int_{-1}^1\!\!f(x)\overline{g(x)}\,dx\end{displaymath}


Soit $F$ le sous-espace vectoriel des polynômes de degré inférieur ou égal à deux à coefficients

réels et posons $g(x)=x^3$ . $F$ étant un sous-espace vectoriel de dimension finie, engendré par

les polynômes

\begin{displaymath}p_0(x)=1, \;\; p_1(x)=x, \;\; p_2(x)=x^2\end{displaymath}


est donc un convexe fermé de $L^2(-1,1)$ .

Il s'agit de trouver le polynôme $p\in F$ qui minimise la distance du polynôme $g$ au sous-

espace $F$ et de calculer cette distance. Posons

\begin{displaymath}p=c_0p_0+c_1p_1+c_2p_2,\quad b_j=\langle g,p_j\rangle,\quad a_{ij}=\langle p_j,p_i\rangle\end{displaymath}


On vérifie rapidement que $b_0=b_2=0$ , $b_1={2/5}$ et que

\begin{displaymath}a_{00}=2, ~~a_{11}=a_{02}={2/3}, ~~a_{22}={2/5}, ~~ a_{01}=a_{12}=0\end{displaymath}


Il en résulte que $c_0=c_2=0$ et $c_1={3/5}$ ; la projection orthogonale du polynôme $g$ sur le sous-espace $F$ est donc

\begin{displaymath}P_F(g)(x)={3x/5}\qquad\hbox{et}\qquad\Vert g-P_F(g)\Vert^2={8/(175)}\end{displaymath}


On en déduit que

\begin{displaymath}\min_{a, b, c}\int_{-1}^1\!\!\vert x^3-ax^2-bx-c\vert^2\,dx={8/(175)}\end{displaymath}


et que ce minimum est réalisé lorsque $a=c=0$ et $b={3/5}$ .

Voyons maintenant l'avantage à disposer dans $F$ d'une base orthogonale : on peut vérifier

facilement (voir exercice 13) que les polynômes

\begin{displaymath}v_0(x)=1,\;\; v_1(x)=x,\;\; v_2(x)=3x^2-1\end{displaymath}


forment une base orthogonale du sous-espace $F$ . On en déduit que

\begin{displaymath}P_F(g)=\langle g,v_0\rangle{v_0\over\Vert v_0\Vert^2}+\langle... ...Vert v_1\Vert^2}+\langle g,v_2\rangle{v_2\over\Vert v_2\Vert^2}\end{displaymath}


Des raisons de parité évidentes montrent que $\langle g,v_0\rangle=\langle g,v_2\rangle=0$ , $\langle g,v_1\rangle={2/5}$ et $\Vert v_1\Vert^2={2/3}$ .

l en résulte que $P_F(g)={(3/5)}x$ .

 

EXERCICES


suivant: Dualité et théorème de Représentation de Riesz       précédent: Propriétés élémentaires et Exemples