Soit n ∈ N∗. Pour tout vecteur x ∈ Rn,
on note (x1, … , xn) ses composantes.
Expression et norme
Soit x = (x1, … , xn) ∈ Rn
et y = (y1, … , yn) ∈ Rn.
Le produit scalaire des deux vecteurs x et y
est le réel ⟨x, y⟩
= ∑i=1n
xiyi.
Le produit scalaire de deux vecteurs n’est pas un vecteur, donc on ne peut avoir d’associativité pour cette opération, que l’on ne note pas avec une croix de multiplication.
Le produit scalaire est bilinéaire et symétrique :
pour tout (x, y, z) ∈ (Rn)3,
on a ⟨x, y⟩
= ⟨y, x⟩
et pour tout λ ∈ R,
⟨x, λ·y + z⟩
= λ⟨x, y⟩
+ ⟨x, z⟩
et ⟨λ·x + y, z⟩
= λ⟨x, z⟩
+ ⟨y, z⟩.
On utilise la commutativité de la multiplication dans R
et la linéarité du symbole somme.
Pour tout x ∈ Rn, on a ⟨x, x⟩ ≥ 0.
Le produit scalaire
⟨x, x⟩
= ∑i=1n
xi2
est une somme de carrés tous positifs.
Pour tout x ∈ Rn, on définit sa norme
‖x‖ = √(⟨x, x⟩).
Pour tout x ∈ Rn, on a ‖x‖ ≥ 0 avec égalité si et seulement si x = 0.
La somme ∑i=1n
xi2
est à termes positifs donc elle est nulle si et seulement si tous ses termes sont nuls.
- Identités remarquables
- Pour tout (x, y) ∈ (Rn)2, on a
- ‖x + y‖2
= ‖x‖2 + ‖y‖2 + 2⟨x, y⟩
- ⟨x + y, x − y⟩
= ‖x‖2 − ‖y‖2
On utilise la bilinéarité et la symétrie du produit scalaire.
La norme est positivement homogène : pour tout x ∈ Rn, pour tout λ ∈ R,
‖λ·x‖ = |λ| × ‖x‖.
On a
‖λ·x‖ = √(⟨λ·x, λ·x⟩)
donc par bilinéarité
‖λ·x‖ = √(λ2⟨x, x⟩)
= |λ| × ‖x‖.
- Inégalité de Cauchy-Schwarz
- Pour tout (x, y) ∈ (Rn)2,
on a ⟨x, y⟩
≤ ‖x‖ × ‖y‖.
Si
x = 0, l’égalité est évidente.
Dans le cas contraire, on introduit la fonction du second degré
f : λ ↦ ‖y − λ·x‖2 = ‖y‖2 + λ2‖x‖2 − 2λ⟨x, y⟩.
Comme f est toujours positive, son discriminant
est négatif : Δ = (−2⟨x, y⟩)2 − 4‖x‖2‖y‖2 ≤ 0
donc 4⟨x, y⟩2 ≤ 4‖x‖2‖y‖2
donc |⟨x, y⟩|
≤ ‖x‖ × ‖y‖.
- Inégalité triangulaire
- Pour tout (x, y) (Rn)2,
‖x + y‖
≤ ‖x‖ + ‖y‖.
D’après les identités remarquables, on a l’équivalence
‖x + y‖
≤ ‖x‖ + ‖y‖
⇔ ‖x‖2 + ‖y‖2 + 2⟨x, y⟩
≤ ‖x‖2 + ‖y‖2 + 2‖x‖ × ‖y‖
donc l’inégalité triangulaire est donnée par l’inégalité de Cauchy-Schwarz.
- Expression matricielle
- On peut définir un produit scalaire de façon analogue sur les vecteurs colonnes : pour tout (X, Y) ∈ ℳn,1(R), en notant
X = [[x1][⋮][xn]]
et Y = [[y1][⋮][yn]],
on pose ⟨X, Y⟩
= ∑i=1n
xiyi
= XT × Y.
Pour tout A ∈ ℳn,m(R),
pour tout X ∈ ℳm(R)
et Y ∈ ℳn(R),
on a ⟨AX, Y⟩
= ⟨X, ATY⟩.
On vérifie ⟨AX, Y⟩
= (AX)TY
= XTATY
= ⟨X, ATY⟩
Orthogonalité
Soient x, y deux vecteurs de Rn.
On dit que x et y sont orthogonaux si leur produit scalaire est nul :
⟨x, y⟩ = 0.
- Théorème de Pythagore
- Deux vecteurs x et y de Rn sont orthogonaux si et seulement si
‖x + y‖2
= ‖x‖2
+ ‖y‖2.
On utilise la première identité remarquable.
Une famille de vecteurs (x1, … , xp)
dans Rn
est dite orthogonale si elle est composée de vecteurs deux à deux orthogonaux : pour tout i ≠ j,
⟨xi,
xj⟩ = 0.
Soit (x1, … , xp) une famille orthogonale.
On a ‖∑i=1p xi‖2
= ∑i=1p
‖xi‖2.
On procède par récurrence en utilisant le théorème de Pythagore.
Toute famille orthogonale de vecteurs non nuls est libre.
Soit
(x1, … , xp) une famille orthogonale
et soit
(a1, … , ap) ∈ Rp
tels que
∑i=1p aixi = 0.
Les vecteurs aixi sont deux à deux orthogonaux donc
∑i=1p
‖aixi‖2 = 0
mais comme tous les termes de cette somme sont positifs,
on a pour tout i ∈ ⟦1 ; p⟧,
‖aixi‖2 = 0
donc aixi = 0
avec xi ≠ 0
donc ai = 0.
Une famille de vecteurs
(x1, … , xp)
est dite orthonormale ou orthonormée
si elle est orthogonale avec
pour tout i ∈ ⟦1 ; p⟧,
‖xi‖ = 1.
- Coordonnées dans une base orthonormée
- Soit (e1, … , en) une base orthonormée d’un sous-espace vectoriel F ⊂ Rn.
Pour tout x ∈ F
on a x = ∑i=1n ⟨x, ei⟩·ei.
L’application
φ : x ↦ ∑i=1n ⟨x, ei⟩·ei est un endomorphisme de F
et pour tout k ∈ ⟦1 ; n⟧,
φ(ek)
= ∑i=1n ⟨ek, ei⟩·ei
= ‖ek‖2·ek
= ek.
Donc l’application φ est l’identité dans F.
Soit (e1, … , en) une base orthonormée de Rn.
Pour tout x ∈ Rn on a‖x‖2
= ∑i=1n⟨x, ei⟩2.
On applique la généralisation du théorème de Pythagore aux coordonnées dans la base orthonormée.
- Orthonormalisation de Gram-Schmidt
- Soit (x1, … , xp) une famille libre dans Rn.
Il existe une unique famille orthonormée
(e1, … , ep)
telle que pour tout k ∈ ⟦1 ; p⟧,
- Vect(e1, … , ek) = Vect(x1, … , xk) ;
- ⟨ek, xk⟩ > 0.
Cette famille orthonormée est appelée orthonormalisation de la famille (x1, … , xp).
On procède par récurrence sur
p ∈ N∗ en raisonnant à chaque fois par analyse-synthèse.
Dans le cas p = 1, tout vecteur de Vect(x1) s’écrit e1 = λ·x1,
avec ⟨ek, xk⟩ = λ × ‖x1‖2 donc la deuxième condition donne λ > 0,
et l’équation ‖e1‖ = 1 impose
λ × ‖x‖ = 1
d’où λ = (1)/(‖x1‖).
Avec cette valeur de λ,
on obtient bien une famille orthonormée (e1) qui satisfait les deux conditions.
Soit p ∈ N∗ telle que la propriété soit vraie pour toute famille orthonormée de p vecteurs. Soit (x1, … , xp+1) une famille orthonormée de Rn.
On note (e1, … , ep) l’orthonormalisation de la famille (x1, … , xp).
Soit ep+1 tel que la famille
(e1, … , ep) satisfasse les conditions de l’énoncé.
On trouve
xp+1
= ∑i=1p+1
⟨xp+1, ei⟩·ei
avec ⟨xp+1, ep+1⟩ ≠ 0
puisque xp+1 ∉ Vect(e1, … , ep) = Vect(x1, … , xp).
Donc en posant λ = (1)/(⟨xp+1, ep+1⟩) > 0,
on trouve ep+1
= λ(xp+1
− ∑i=1p
⟨xp+1, ei⟩·ei)
d’où 1 = λ × ‖xp+1
− ∑i=1p
⟨xp+1, ei⟩·xi‖.
En synthèse, on pose y = xp+1
− ∑i=1p
⟨xp+1, ei⟩·ei
et le vecteur ep+1
= (1)/‖y‖·y
satisfait les conditions de l’énoncé.
Toute famille orthonormée de vecteurs d’un sous-espace vectoriel F peut être complétée en une base orthonormée de F.
Soit
F un sous-espace vectoriel
Rn. On note
d = dim(F).
Soit (x1, … , xp) une famille orthonormée dans F. En particulier, cette famille est orthogonale avec des vecteurs non nuls donc elle est libre et peut être complétée en une base
(x1, … , xd) de F.
On note (e1, … ,
eq) l’orthonormalisation
de (x1, … , xd).
Cette famille est libre avec d vecteurs dans F donc c’est une base orthonormée de F.
La sous-famille (e1, … ,
ep) est une orthonormalisation
de (x1, … ,
xp)
qui est déjà orthonormée, donc pour tout i ∈ ⟦1 ; p⟧,
xi = ei.
Finalement, la base orthonormée (e1, … ,
ed)
prolonge la famille (x1, … ,
xp).
En particulier, on obtient que tout sous-espace vectoriel de Rn admet une base orthonormée.
Sous-espace vectoriel orthogonal
Soit A ⊂ Rn.
L’ensemble {x ∈ Rn : ∀a ∈ A, ⟨a, x⟩ = 0 } est un sous-espace vectoriel de Rn appelé orthogonal de A et noté A⊥.
Soit (x, y) ∈ (A⊥)2 et λ ∈ R.
Par bilinéarité, pour tout a ∈ A on a
⟨a, λ·x + y⟩
= λ⟨a, x⟩ + ⟨a, y⟩
= 0 donc λ·x + y ∈ A⊥.
Si A et B sont deux parties de Rn telles que A ⊂ B
alors A⊥ ⊃ B⊥.
Soit y ∈ B⊥. Pour tout a ∈ A,
on a a ∈ B donc ⟨a, y⟩ = 0, donc y ∈ A⊥.
Tout sous-espace vectoriel F ⊂ Rn est un supplémentaire de son orthogonal : F ⊕ F⊥ = Rn.
Pour tout
x ∈ F ∩ F⊥, on trouve
⟨x, x⟩ = 0
donc
x = 0. Donc
F ∩ F⊥ = {0}.
On complète une base orthonormée de F notée
(e1, … , ed) en une base orthonormée de Rn,
notée (e1, … , en).
Le sous-espace G = Vect(ed+1, … , en) est un sous-espace supplémentaire de F
et G ⊂ F⊥
donc F + F⊥ = Rn.
L’orthogonal d’un vecteur non nul est un
hyperplan.
Soit e ∈ E ∖ {0}.
On a {e} ⊂ Vect(e)
donc {e}⊥ ⊃ Vect(e)⊥
or Vect(e)⊥ est un supplémentaire de Vect(e) donc dim({e}⊥) ≥ dim(Vect(e)⊥ = n − 1.
Mais e ∉ {e}⊥
donc {e}⊥ ≠ Rn
donc dim({e}⊥) < n.
Finalement, {e}⊥ est bien un hyperplan.
Deux vecteurs orthogonaux à un même hyperplan sont colinéaires
Soient x et y deux vecteurs orthogonaux à un même hyperplan H.
Alors x et y
appartiennent tous les deux à l’espace H⊥ de dimension 1, donc ils sont colinéaires.
Tout sous-espace vectoriel F ⊂ Rn est l’orthogonal de son orthogonal :
(F⊥)⊥ = F.
Pour tout
(x, y) ∈ F × F⊥,
on a
⟨y, x⟩ = 0
donc
x ∈ (F⊥)⊥. Donc
F ⊂ (F⊥)⊥.
Or F et (F⊥)⊥ sont des supplémentaires de F⊥ donc ils ont la même dimension.
Donc F = (F⊥)⊥.
Une base de l’orthogonal
d’un sous-espace vectoriel F ⊂ Rn
donne un système d’équations de F.
Soit (y1, … , yq) une base de F⊥.
L’ensemble des solutions du système formé par les équations linéaires
⟨x, yi⟩
contient F
et est contenu dans F⊥⊥
donc il s’agit bien de F.
Soit
F un sous-espace vectoriel
de
Rn.
La
projection orthogonale sur
F est la
projection
sur
F parallèlement à
F⊥.
Soit (e1, … , ep) une base orthonormée d’un sous-espace vectoriel F ⊂ Rn.
L’application définie pour tout x ∈ Rn
par p(x)
= ∑i=1p
⟨x, ei⟩·ei
est la projection orthogonale sur F.
L’application
p ainsi définie
est un endomorphisme de
Rn
et vérifie pour tout
y ∈ F,
p(y) = y par expression des
coordonnées dans une base orthonormée,
et pour tout
z ∈ F⊥,
p(z)
= ∑i=1p
⟨z, ei⟩·ei = 0.
Topologie
Pour tout (x, y) ∈ (Rn)2,
la distance entre x et y est la norme de leur différence :
d(x, y)
= ‖y − x‖.
Pour tout
(x, y, z) ∈ (Rn)3,
- d(x, y) ≥ 0
- d(x, y) = 0 ⇔ x = y
- d(x, y) + d(y, z) ≥ d(x, z)
On dit alors qu’un vecteur x est plus proche d’un vecteur y que d’un vecteur z
si d(x, y) ≤ d(x, z).
Le projeté orthogonal d’un vecteur x sur un sous-espace vectoriel F est le point de F le plus proche de x.
On note
p la projection orthogonale sur
F et
y = p(x).
Soit
z ∈ F.
On a
p(y − x) = p2(x) − p(x) = 0
par
propriété des projections,
donc
y − x ∈ F⊥,
et
z − y ∈ F.
Donc on a
‖z
− y‖2 + ‖y − x‖2
= ‖z − x‖2 par théorème de Pythagore, d’où
d(y, x)
≤ d(z, x).
La distance d’un vecteur x à un sous-espace vectoriel F est la norme ‖x − p(x)‖, où p est la projection orthogonale sur F.
Soit
(xm)m∈N une suite de vecteurs dans Rn. On dit que la suite converge vers un vecteur ℓ
si pour tout i ∈ ⟦1 ; n⟧
on a limm→+∞xm,i = ℓi.
- Convergence vers le vecteur nul
- Une suite de vecteurs (xm)m∈N converge vers le vecteur nul si et seulement si limm→+∞ ‖xm‖ = 0.
On raisonne par double implication.
Si (xm)m∈N converge vers le vecteur nul alors par définition
pour tout i ∈ ⟦1 ; n⟧
on a limm→+∞xm,i = 0,
donc limm→+∞
∑i=1n
xm,i2 = 0
donc limm→+∞ ‖xm‖ = 0.
Réciproquement, supposons limm→+∞ ‖xm‖ = 0.
Pour tout i ∈ ⟦1 ; n⟧ ,
on a xm,i2 ≤ ‖xm‖2
donc limm→+∞xm,i2 = 0,
donc limm→+∞xm,i = 0.
Soit
a ∈ Rn et
r ∈ R+.
La boule ouverte de centre a
et de rayon r est l’ensemble
Ba,r
= {x ∈ Rn :
d(a, x) < r}.
La boule fermée de centre a
et de rayon r est l’ensemble
¯(B)a,r
= {x ∈ Rn :
d(a, x) ≤ r}.
La sphère de centre a
et de rayon r est l’ensemble
Sa,r
= {x ∈ Rn :
d(a, x) = r}.
- La boule ouverte de centre a ∈ R
et de rayon r ∈ R+
est l’intervalle ]a − r, a + r[. La boule fermée correspondante est l’intervalle fermé
[a − r, a + r],
dont les extrémités forment la sphère correspondante.
- En dimension 2, les sphères sont des cercles dont l’intérieur forme une boule ouverte.
- En dimension 3, les sphères et boules correspondent à leur définition en géométrie classique.