Dans toute cette partie, on note I et J deux intervalles non dégénérés de R.
Soit f une fonction réelle définie sur I. Le taux d’accroissement (ou taux de variation) de f entre deux réels a et b distincts dans I est le quotient (f(b) − f(a))(b − a), correspondant au coefficient directeur de la corde sur la courbe de f entre les points d’abscisse a et b.
Le nombre dérivé (resp. à gauche, resp. à droite) est la limite, si elle existe, du taux d’accroissement (f(a+h) − f(a))h lorsque h tend vers 0 (resp. par valeurs inférieures, resp. par valeurs supérieures). On le note alors f′(a) ou Df(a) (resp. f′g(a), resp. f′d(a)) et on dit dans ce cas que la fonction f est dérivable (resp. à gauche, resp. à droite) en a.
La tangente à la courbe de f au point d’abscisse aest alors la droite d’équation y = f′(a)× (x − a) + f(a).
Si le taux d’accroissement (f(a+h) − f(a))h tend vers l’infini lorsque h tend vers 0, alors la fonction f n’est pas dérivable en a mais sa courbe admet une tangente verticale au point d’abscisse a.
Toute fonction dérivable en un point de son domaine de définition est continue en ce point.
Alors on a limh→0 (f(a+h) − f(a)) h = f′(a) et limh→0 h = 0 donc par produit on trouve limh→0 f(a+h) − f(a) = 0 donc limh→0 f(a+h) = f(a).
Donc la fonction f est bien continue en a.
Pour tout λ ∈ R, la fonction λu + v est dérivable en a et on a (λu + v)′(a) = λu′(a) + v′(a).
De même, la fonction u × v est dérivable en a et on a (u × v)′(a) = u′(a)v(a) + u(a)v′(a).
Si en outre on a v(a) ≠ 0 alors la fonction v ne s’annule pas au voisinage de a et la fonction 1v est dérivable en a avec (1v)′(a) = −v′(a)(v(a))2.
Avec la même hypothèse, le quotient uv est dérivable en a avec (uv)′(a) = u′(a)v(a) − u(a)v′(a)(v(a))2.
Pour tout h ∈ R∗ tel que a + h ∈ I, on a ((λu + v)(a+h) − (λu + v)(a))h = λ(u(a+h) − u(a))h + (v(a+h) − v(a))h.
Donc on trouve limh→0 ((λu + v)(a+h) − (λu + v)(a))h = λu′(a) + v′(a).
De même, pour tout h ∈ R∗ tel que a + h ∈ I, on a ((u × v)(a+h) − (u × v)(a))h = ((u(a+h) − u(a)) × v(a+h) + u(a) × (v(a + h) − v(a)))h = (u(a+h) − u(a)))h × v(a+h) + u(a) × (v(a + h) − v(a))h.
Donc on trouve limh→0 ((u × v)(a+h) − (u × v)(a))h = u′(a) v(a) + u(a) v′(a) par continuité de u et de v en a.
Si on rajoute l’hypothèse v(a) ≠ 0, alors par continuité de v en a on trouve bien que la fonction v ne s’annule pas au voisinage de a et on calcule pour tout h ∈ R∗ tel que a + h soit dans ce voisinage, (1v(a + h) − 1v(a))h = (v(a) − v(a + h))(v(a) v(a + h) × 1h = −(v(a + h) − v(a))h × 1(v(a) v(a + h).
Donc on trouve limh→0 (1v(a + h) − 1v(a))h = −v′(a)(v(a))2.
Le calcul pour le quotient s’obtient en dérivant le produit u × 1v.
Soit u une fonction définie sur I à valeurs dans J et soit g une fonction réelle définie sur J telles que u soit dérivable en un réel a ∈ I et g soit dérivable en b = u(a) ∈ J.
Alors la fonction composée g ◦ u : x ↦ g(u(x)) est dérivable en a et on a
(g ◦ u)′(a) = u′(a) × g′(u(a)).
Pour tout h ∈ R∗ tel que a + h ∈ I, on a (g(u(a + h)) − g(u(a)))h = (u(a + h) − u(a))h × τ(u(a + h)).
Donc on trouve limh→0 (g(u(a + h)) − g(u(a)))h = u′(a) × g′(u(a)).
Soit f une fonction bijective de I vers J et dérivable en un point a ∈ I telle que sa réciproque f−1 soit continue en f(a). Alors la réciproque est dérivable en b = f(a) et on a (f−1)′(b) = 1f′(a)
On en déduit f(a + k) = f(a) + h puis (f−1(b + h) − f−1(b))h = k(f(a + k) − f(a)).
Donc on trouve limh→0 (f−1(b + h) − f−1(b))h = 1f′(a).
Soit f une fonction réelle définie sur I. Si f admet un extremum local en un point a à l’intérieur de I (c’est-à-dire en dehors des bornes) et si f est dérivable en a alors on a f′(a) = 0.
Une fonction f définie sur un intervalle I non dégénéré est dite dérivable sur I si elle est dérivable en tout point de I.
Si tel est le cas, la fonction x ↦ f′(x) est appelée fonction dérivée de f et notée f′ ou Df.
La dérivabilité, comme la continuité, est une propriété locale, c’est-à-dire qu’elle est vraie globalement si elle est vraie en tout point.
Toute fonction dérivable sur un intervalle est continue sur cet intervalle.
Leurs somme, produit et puissances sont dérivables sur I et pour tout λ ∈ R, pour tout n ∈ N, (u + v)′ = u′ + v′, (λ u)′ = λ × u′, (u × v)′ = u′ v + u v′ et (un)′ = nu′ un−1.
Si en outre la fonction v ne s’annule pas sur I alors son inverse est dérivable sur I ainsi que le quotient uv avec (1v)′ = −v′v2 et (uv)′ = (u′ v − u v′)v2.
La dérivée de la puissance se démontre par récurrence à partir de celle du produit.
Pour la réciproque, une fonction dérivable est nécessairement continue donc si elle est strictement monotone, elle établit une bijection entre son intervalle de définition et son intervalle image et sa réciproque est continue. La formule s’obtient à partir de celle calculée en un point.
Dans toute la suite de cette partie, on considère deux réels a et b tels que a < b.
En particulier, on a f(c) ≤ f(a) ≤ f(c′). On distingue alors trois cas.
On pose pour tout x ∈ [a, b], g(x) = f(x) − (f(b) − f(a))(b − a) x.
La fonction g est continue sur [a, b] et dérivable sur ]a, b[ avec g(a) = ((b − a) × f(a) − (f(b) − f(a)) × a)(b − a) = (b f(a) − a f(b))(b − a) et g(b) = ((b − a) × f(b) − (f(b) − f(a)) × b)(b − a) = (b f(a) − a f(b))(b − a).
Par conséquent, d’après le théorème de Rolle il existe c ∈ ]a, b[ tel que g′(c) = 0.
Or g′(c) = f′(c) − (f(b) − f(a))(b − a) donc on trouve f′(c) = (f(b) − f(a))(b − a).
S’il existe (m, M) ∈ R2 tel que pour tout x ∈ ]a, b[ on a m ≤ f′(x) ≤ M alors on obtient m(b − a) ≤ f(b) − f(a) ≤ M(b − a).
Plus généralement, s’il existe M ∈ R2 tel que pour tout x ∈ ]a, b[ on ait |f′(x)| ≤ M alors on obtient |f(b) − f(a)| ≤ M(b − a).
Si la dérivée est (strictement) positive alors la fonction est (strictement) croissante.
Si la dérivée est (strictement) négative alors la fonction est (strictement) décroissante.
Si la dérivée est nulle alors la fonction est constante.
Si la dérivée f′ admet une limite finie en a (resp. en b), alors la fonction f est aussi dérivable en a (resp. en b) et on a f′(a) = limx→a f′(x) (resp. f′(b) = limx→b f′(x)).
Si la dérivée f′ admet une limite infinie en a (resp. en b), alors le taux d’accroissement (f(a+h) − f(a))h (resp. (f(b+h) − f(b))h) tend vers la même limite lorsque h tend vers 0.
On pose pour tout x ∈ ]a, b[, g(x) = f(x) − Lx. La fonction g est continue sur [a, b] et dérivable sur ]a, b[ et pour tout x ∈ ]a, b[, on a g′(x) = f′(x) − L.
Soit ε ∈ R∗+. Il existe δ ∈ R∗+ tel que pour tout x ∈ ]a, a + δ[, on ait L − ε ≤ f′(x) ≤ L + ε donc |g′(x)| ≤ ε.
Par conséquent, pour tout x ∈ ]a, a + δ[, on a d’après l’inégalité des accroissements finis, |(g(x) − g(a))(x − a)| ≤ ε.
Finalement, on trouve bien que la fonction g est dérivable en a avec g′(a) = 0 donc la fonction f est dérivable en a avec f′(a) = L.
Supposons maintenant que f tende vers +∞ (resp. −∞) en a.
Soit M ∈ R. Il existe δ ∈ R∗+ tel que pour tout x ∈ ]a, a + δ[, on ait f′(x) ≥ M (resp. f′(x) ≤ M).
Par conséquent, pour tout x ∈ ]a, a + δ[, on a d’après le théorème des accroissements finis, (f(x) − f(a))(x − a) ≥ M (resp. (f(x) − f(a))(x − a) ≤ M).
Finalement, on trouve bien que le taux d’accroissement (f(x) − f(a))(x − a) tend vers +∞ lorsque h tend vers 0.
Les démonstrations pour les limites de la dérivée en b se font de manière analogue.
Soit I un intervalle non dégénéré dans R.
On rappelle que 𝓒0(I, R) est l’ensemble des fonctions continues sur l’intervalle I.
On note 𝓓1(I, R) ou plus simplement 𝓓1(I) l’ensemble des fonctions dérivables sur I, puis on procède par récurrence sur n ∈ N∗ en définissant l’ensemble 𝓓n+1(I, R) comme l’ensemble des fonctions dérivables sur I et dont la dérivée appartient à 𝓓n(I, R).
Pour tout n ∈ N∗, on dit qu’une fonction est n fois dérivable sur I si elle appartient à 𝓓n(I, R).
La suite de ces ensembles est décroissante : pour tout n ∈ N∗, on a 𝓓n+1(I, R) ⊂ 𝓓n(I, R).
Ces inclusions sont strictes car pour tout n ∈ N∗, la fonction x ↦ xn|x| est n fois dérivable sur R sans être (n + 1) fois dérivable.
On définit par récurrence sur n ∈ N∗ la dérivée (n+1)-ième d’une fonction f ∈ 𝓓n+1(I, R) comme étant la dérivée n-ième de sa dérivée et on la note f(n+1) ou Dn+1f.
Par convention, on note f(0) = f.
Pour tout (n, p) ∈ (N∗)2, pour tout f ∈ 𝓓n(I, R), on a l’équivalence f ∈ 𝓓n+p(I, R) ⇔ f(n) ∈ 𝓓p(I, R) et dans ce cas on a (f(n))(p) = f(n+p).
Soit k ∈ N∗. On dit qu’une fonction est de classe 𝓒k si elle est k fois dérivable et si sa dérivée k-ième est continue. On note 𝓒k(I, R) l’ensemble des fonctions de classe 𝓒k sur I.
La somme, le produit, les combinaisons linéaires de fonctions de classe 𝓒k sur I est aussi de classe 𝓒k sur I.
L’inverse d’une fonction de classe 𝓒k et ne s’annulant pas sur I est aussi de classe 𝓒k sur I.
La composée g ◦ u est aussi de classe 𝓒k sur I.
L’initialisation est assurée par les propriétés de la continuité.
L’hérédité se démontre à l’aide des formules de dérivation d’une somme, d’un produit, d’une inverse et d’une composée.
Alors la fonction établit une bijection entre I et f(I) et la réciproque est aussi de classe 𝓒k.
La contraposée du théorème de Rolle montre que la fonction f est injective, donc est bijective de son intervalle de définition sur son intervalle image. La réciproque est continue et dérivable et la dérivée est de classe 𝓒k−1 par composition et inverse de fonctions de classe 𝓒k.
On a (f × g)(n) = ∑k=0n (k parmi n) f(k) g(n−k).