Vocabulaire général
- Les projections (x1, x2) ↦ x1 et (x1, x2) ↦ x2 sont définies sur R2.
- Les fonctions linéaires sont des combinaisons linéaires des projections (x1, x2) ↦ ax1 + bx2.
- Les monômes de 2 variables sont les produits de projections et d'une constante, s'écrivant
(x1, x2) ↦ λx1jx2k,
avec λ ∈ R
et (j, k) ∈ N2.
Le degré d'un tel monôme est la somme des exposants j + k. - Les fonctions polynômes de deux variables sont les combinaisons linéaires de monômes. En particulier, les fonctions quadratiques sont les fonctions polynômes de degré inférieur ou égal à 2.
Dans ce cadre, le plan des variables est le plan d'équation z = 0 et l'axe vertical est la droite vectorielle engendrée par le 3e vecteur de la base canonique (0 ; 0 ; 1).
- Les fonctions linéaires sont les fonctions de deux variables dont le graphe est un plan vectoriel.
- Le graphe de la fonction donnant la norme d'un vecteur ‖x‖ = √(x12 + x22) est un cône (infini) autour de l'axe vertical avec la pointe à l'origine.
- L'hémisphère supérieur de la sphère de rayon r centrée à l'origine est le graphe de la fonction x ↦ √(r2 − ‖x‖2).
- La fonction gaussienne standard à deux variables x ↦ exp(−‖‖2/2) a pour graphe une surface en cloche.
- Les lignes de niveau de la fonction linéaire x ↦ ax1 + bx2 (non nulle) sont les droites orthogonales au vecteur (a, b).
- Les courbes de niveau de la norme ou de la fonction gaussienne standard sont des cercles centrés à l'origine.
Dérivées partielles
On utilise aussi les notations ∂1F(x1, x2) = (∂F(x1, x2))(∂x1) et ∂2F(x1, x2) = (∂F(x1, x2))(∂x2).
- Les dérivées partielles d'une fonction linéaire (x1, x2) ↦ ax1 + bx2 sont les fonctions constantes de valeurs respectives a et b.
- La fonction norme admet des dérivées partielles sauf à l'origine.
On dit que F admet un extremum local en a si elle admet un maximum local ou un minimum local en a.
Un extremum local est dit strict si l'inégalité est stricte pour tout x ∈ B(a, r) ∖ {a}.
Tout extremum local intérieur est atteint en un point critique mais la réciproque est fausse : la fonction (x1, x2) ↦ x12 − x22 admet un unique point critique en (0 ; 0) où elle s'annule, mais elle admet des valeurs positives et négatives à l'intérieur de toute boule ouverte centrée en ce point.
Fonctions quadratiques
Soit q une fonction quadratique, avec (λ1, λ2) ∈ R2 ∖ (0 ; 0) et (α1, α2) ∈ R2. La fonction f : t ↦ q(λ1t + α1, λ2t + α2) est une fonction polynomiale de degré inférieur ou égal à 2. En outre, si (α1, α2) est un point critique pour q, alors il existe (A, C) ∈ R2 tel que pour tout t ∈ R, f(t) = At2 + C. On distingue alors 3 cas.
- Si le coefficient A est strictement positif quel que soit (λ1, λ2), alors le point critique est l'unique minimum local (et global) de la fonction quadratique.
- Si le coefficient A est toujours positif mais qu'il existe (λ1, λ2) pour lequel A = 0 d'où une fonction f constante, alors le point critique est dit dégénéré.
- Si le coefficient A peut être strictement positif ou strictement négatif selon la valeur de (λ1, λ2), alors le point critique n'est pas un extremum local et est appelé point col ou point selle.
Les points critiques d'une fonction quadratique de la forme q(x1, x2) = ax12 + bx1x2 + cx22 + dx1 + ex2 + f sont les solutions du système linéaire {2ax1 + bx2 + c = 0 ;bx1 + 2cx2 + d = 0 qui est de Cramer si et seulement si 4ac ≠ b2. Dans le cas contraire, la fonction quadratique est dite dégénérée et elle peut n'admettre aucun point critique (dans le cas d'une fonction linéaire non constante notamment) ou admettre une droite de points critiques, voire tout le plan si la fonction est constante.
Si (α1,α2) est un point critique pour q(x1, x2) = ax12 + bx1x2 + cx22 + dx1 + ex2 + f, alors en posant X1 = x1 − α1 et X2 = x2 − α2, on trouve q(x1, x2) = aX12 + bX1X2 + cX22 + q(α1, α2) et le point critique en (α1,α2) pour q est de même nature que le point critique en (0 ; 0) pour la fonction quadratique Q(X1, X2) = aX12 + bX1X2 + cX22.
Dans ce cas, les coefficients a et c sont nécessairement de même signe, et cet extremum est un minimum si et seulement si a et b sont positifs.
Si a ≠ 0, on trouve la forme canonique q(x1, x2) = a(x12 + (bx1x2)(a) + (cx22)(a)) = a((x1 + (bx2)(2a))2 + (4ac−b2)(4a2)x22) d'où le fait que l'expression (x1 + (bx2)(2a))2 + (4ac−b2)(4a2)x22 soit positive losque le discriminant est négatif. La fonction q s'annule sur toute la droite d'équation x1 + (bx2)(2a) = 0 si le discriminant est nul, mais ne s'annule que lorsque x1 = x2 = 0 si le discriminant est strictement négatif.
Si le discriminant est strictement positif, l'expression a des valeurs négatives sur la droite d'équation x1 + (bx2)(2a) = 0, et des valeurs positives sur la droite d'équation x2 = 0, donc il n'y a pas d'extremum local en (0 ; 0).
Si a = 0, mais c ≠ 0, on utilise la forme canonique de q avec factorisation par c et on obtient le même résultat.
Si a = c = 0, les fonctions t ↦ q(t, t) = bt2 et t ↦ q(t, −t) = −bt2 admettent des extrema locaux opposés en 0.
Un exemple de fonction quadratique est donné par la recherche de la droite de régression linéaire par la méthode des moindres carrés pour une série statistique à deux variables ((x1, y1), … , (xn, yn)) ∈ R2n dans laquelle les valeurs (xi) ne sont pas toutes égales, autrement dit telles que Vx > 0. L'écart quadratique entre la droite d'équation y = ax + b et le nuage de points est défini par la somme f(a, b) = ∑i=1n(yi − (axi + b))2.
L'annulation des dérivées partielles se ramène aux équations
∑i=1nxiyi = a∑i=1nxi2 + b∑i=1nxi
et ∑i=1nyi = a∑i=1nxi + nb.
La deuxième équation se réécrit b = ¯(y) − a¯(x)
et la première donne alors (1)(n)∑i=1nxiyi
− (a)(n)∑i=1nxi2
= b¯(x) = ¯(x)¯(y) − a¯(x)2
d'où ¯(xy) − ¯(x)¯(y)
= a(¯(x2) − ¯(x)2),
ce qui donne l'égalité annoncée.
Le discriminant s'écrit Δ = 4n2¯(x)2 − 4∑i=1nxi2 = −4 Vx < 0, donc l'écart quadratique admet bien un extremum local.
Dérivées partielles du second ordre
- Théorème de Schwarz
- Si F admet des dérivées partielles d'ordre 2 qui sont toutes continues sur un ouvert U alors ∂1,2F = ∂2,1F.