Utilité combinée avec argsh

La fonction argument sinus hyperbolique (notée argsh en français, ou arcsinh en anglais) est parfois employée en économétrie comme fonction dérivable et croissante sur R tout en étant équivalente à la fonction logarithme en +∞. Elle permet ainsi d’atténuer l’effet marginal d’une grandeur tout en gardant un comportement linéaire au voisinage de 0. Cet article analyse l’utilisation de cette fonction pour l’évaluation de la mesure relative de deux grandeurs qui dépendent de façon affine d’un même paramètre réel.

Courbe de fonction croissante et impaire, convexe sur ]−∞, 0] et concave sur [0, +∞[ x y 0 y = sh(x)
Allure de la courbe de la fonction argsh

Cadre d’analyse

Considérons deux grandeurs qui dépendent de façon affine d’un même paramètre réel x. On peut les noter A = ax + b et B = cx + d. On souhaite optimiser conjointement ces deux grandeurs, ce qui est facile si les coefficients a et c sont de même signe, mais dans le cas contraire toute amélioration de l’une se fait au détriment de l’autre.

Segment de droite représentant une fonction affine x y x0 x1
Extrema aux bornes pour une fonction affine

Il est tentant de calculer alors la somme de ces deux grandeurs, ou une combinaison linéaire avec des coefficients à déterminer, mais le résultat reste une fonction affine du paramètre x. Dans ce cadre, seules les valeurs extrêmes du paramètre peuvent optimiser ce résultat, ce qui revient à complètement négliger une des deux grandeurs au profit de l’autre.

Une piste possible pour trouver une voie médiane consiste à atténuer l’effet marginal des grandeurs lorsqu’elles prennent des valeurs importantes, d’où l’idée d’une croissance logarithmique à l’infini, tout en préservant le caractère linéaire pour des valeurs faibles. On pose alors U = argsh(A) + argsh(B).

Étude de fonction

La fonction F : x ↦ argsh(ax + b) + argsh(cx + d) est dérivable avec pour tout xR, F′(x) = a/((ax + b)2 + 1) + c/((cx + d)2 + 1).

Comme on s’intéresse au cas où a et c sont de signes contraires, on suppose sans perte de généralité a > 0 > c, donc la dérivée ne s’annule que pour a((cx + d)2 + 1) = −c ((ax + b)2 + 1)
a2((cx + d)2 + 1) = c2((ax + b)2 + 1)
a2(2cdx + d2 + 1) = c2(2abx + b2 + 1)
⇔ 2(a2cdc2ab)x = c2(b2 + 1) − a2(d2 + 1)
⇔ (adbc)x = (c2(b2 + 1) − a2(d2 + 1))/2ac.

Pour peu qu’on ait adbc ≠ 0 (ce qui ressemble certes à la condition d’inversibilité d’une matrice 2×2, mais qui représente surtout ici le fait que les grandeurs A et B ne s’annulent pas pour la même valeur de x), on obtient donc un seul point critique de F en x = (c2(b2 + 1) − a2(d2 + 1))/(2ac(adbc)).

Deux courbes de composées de fonctions affines croissantes avec argsh, et un segment représentant l’écart maximal entre les deux courbes x b/a d/c
Écart maximal entre deux courbes de transformées affines de argsh

En outre, l’inéquation F′(x) > 0 se réécrit (adbc)x < (c2(b2 + 1) − a2(d2 + 1))/2ac (avec un changement de sens de l’inégalité à cause du signe de ac < 0) donc le point critique x correspond à un maximum si et seulement si adbc > 0.

Approximation par une formule adimensionnelle

Si les constantes b et d sont assez grandes en valeur absolue, on peut négliger les termes constants de valeur 1 pour aboutir à l’approximation adimensionnelle : x(c2b2a2d2)/(2ac(adbc)) = (ad + bc)/−2ac = 1/2(b/a + d/c).

L’adimensionnalité signifie que cette formule est indépendante des choix d’unité respectifs pour les deux grandeurs.

Cette expression est exactement la moyenne arithmétique des points d’annulation des deux fonctions affines qui décrivent les grandeurs A et B. Elle correspond aussi à la valeur du paramètre qui maximise le produit AB. Cela s’explique par le fait que l’approximation revient à remplacer la fonction argsh par son équivalent ln en +∞, autrement dit on maximise ln(A) + ln(B) = ln(AB).

Arc de parabole orientée vers le bas, coupant l’axe des abscisses en deux points d’abscisses −b/a et −d/c, et atteignant son maximum au milieu x b/a d/c y = (ax + b)(cx + d)
Fonction du second degré comme produit de deux fonctions affines

On peut se contenter de cette approximation si la positivité des deux grandeurs A et B est un prérequis absolu. Cependant, si les valeurs négatives sont admissibles pour l’une ou l’autre, la spécificité de la fonction argsh reste pertinente, et pose alors la question des unités choisies.

Unités et normalisation

La fonction argsh est bien approchée par la fonction identité au voisinage de 0 (moins de 4 % d’écart en 0,5) et par la fonction x ↦ ln(2x) ensuite (moins de 4 % d’écart en 2). L’accroissement d’une unité au voisinage de 0 correspond donc à un doublement de la valeur ensuite. Il s’agit donc de choisir pour chaque grandeur une unité qui ait une valeur typique, par exemple un écart type de variations standard.

Courbes d’équations y=x, y=argsh(x) et y=ln(2x)
Approximations linéaire et logarithmique de la fonction argsh

Si les deux grandeurs A et B n’ont pas été normalisées, on peut alors noter σ et τ leurs valeurs typiques respectives (éventuellement nulles pour des grandeurs qui ne peuvent avoir de valeurs négatives), et la déviation de l’approximation adimensionnelle s’écrit alors Δx = ((σc)2 − (τa)2)/(2ac(adbc)).