
Enoncé du théorème
Étant données une équation polynomiale de degré n, avec n entier ≥ 5
Xn + a1Xn-1 + a2Xn-2 + …+ an-2X2 + an-1X + an = 0
Il n’existe pas de fonction algébrique permettant d’exprimer les racines xi de l’équation à partir des coefficients ai.
Attention nuance : le théorème porte sur le cas général des équations de degré n ≥ 5. Il y a des cas particuliers d’équations résolubles par une fonction algébrique, par exemple :
X10 + a1X5 + a2 = 0
Qui se résout très bien en utilisant la formule des équations de degré 2.
Le théorème se limite à la recherche d’une solution qui s’exprimerait à l’aide d’une fonction algébrique, c’est-à-dire d’une fonction qui utilise comme opérations les additions, soustractions, multiplications, divisions, puissances nièmes, racines nièmes. L’utilisation de fonctions plus complexes, telles que les fonctions elliptiques, permettent de les résoudre.
Histoire du théorème
La résolution des équations du second degré, donc de la forme X2 + a1X + a2 = 0 où l’on cherche l’inconnu X, remonte à plus de trois mille ans. Elles sont au centre de l’algèbre babylonienne, dès avant le XVIIIe siècle av. J.-C.
Au IXe siècle Al-Khwarizmi en fait une étude systématique dans un ouvrage intitulé Abrégé du calcul par la restauration et la comparaison qui, via le mot « restauration » (en arabe : al-jabr) a donné son nom à l’algèbre.
Il faut attendre le XVIe siècle pour voir apparaître une solution générale aux équations de degré 3, donc de la forme : X3 + a1X2 + a2X + a3= 0
Elle est mise au point par l’Italien Tartaglia qui l’utilise lors d’un célèbre concours qui l’oppose à son compatriote Fiore, en 1535.
En 1545, Jérome Cardan publie Ars Magna (Le Grand Art). Il y expose la méthode de résolution de Tartaglia en lui en attribuant bien la paternité. Il complète son exposé par une justification de la méthode et l’étend à l’ensemble de tous les autres cas. Il publie, à cette occasion, la méthode de résolution de l’équation de degré 4 mise au point par son élève Ludovico Ferrari. L’importance de l’œuvre de Cardan fait que la postérité ne retiendra que son nom et que cette méthode de résolution des équations de degré 3 va porter le nom de méthode de Cardan.
Dans son mémoire de 1771, Lagrange réalise une synthèse de toutes les méthodes utilisées dans le passé pour résoudre l’équation algébrique de petit degré. À partir de cette synthèse, il développe une méthode, qui s’applique aux degrés 2, 3 et 4. Il montre de plus que cette méthode ne peut aboutir dans le cas général si le degré est plus élevé. La question de savoir s’il n’existe pas d’autres méthodes qui fonctionneraient reste néanmoins ouverte. A partir de l’idée de Vandermonde d’utiliser les fonctions symétriques ainsi que les relations entre les coefficients et les racines, il montre l’importance des n! permutations des racines pour la résolution du cas général. Il établit à ce propos deux théorèmes préfigurant la théorie des groupes. Le premier est que les n! permutations d’un n-uplets ont comme image par une fonction de n variables un ensemble dont le cardinal est un diviseur de n!. Ce résultat est un ancêtre de ce que l’on appelle maintenant le théorème de Lagrange sur les groupes. Le deuxième concerne les fonctions qu’il qualifie de semblables et qui sont invariantes par le même sous-groupe de permutation. Ce résultat anticipe les théorèmes sur les suites de sous-groupes que l’on trouve dans la théorie de Galois. La conclusion de Lagrange est pessimiste. Il émet l’idée que la résolution algébrique de l’équation soit impossible. Le chemin est tracé, soit pour trouver une méthode générale de résolution, soit pour montrer l’inexistence d’une telle méthode. La solution réside dans une analyse combinatoire des possibles permutations des racines.
L’éventuelle impossibilité de la résolution par radicaux du cas général fait son chemin. Paolo Ruffini publie quatre mémoires à ce sujet, en 1799, 1804, puis en 1808 et 1813. Pour la première fois, l’impossibilité est clairement déclarée. Sa tentative pour le prouver suit la démarche de Lagrange et consiste à montrer que l’usage d’une équation auxiliaire ne permet pas, pour le degré 5, d’abaisser systématiquement le degré de l’équation initiale. Il établit que, si une fonction symétrique de cinq variables prend strictement moins de cinq valeurs par permutations des variables, alors elle n’en prend pas plus de 2. Son approche est lacunaire. Rien n’indique qu’une approche radicalement différente de celles décrites par Lagrange ne pourrait aboutir.
Pour conclure de manière définitive, il fallait raisonner différemment que ne l’avaient fait Lagrange ou Ruffini. Niels Abel l’exprime ainsi : « […] on se proposait de résoudre les équations sans savoir si cela était possible. Dans ce cas, on pouvait bien parvenir à la résolution, quoique ce ne fût nullement certain […] Au lieu de demander une relation dont on ne sait pas si elle existe ou non, il faut se demander si une telle relation est en effet possible. » En 1826, Abel part du résultat et suppose qu’il existe une formule, fonction rationnelle de radicaux, qui donne la solution d’une équation de degré 5. Il sait qu’elle est à même d’exprimer 5 racines différentes et qu’en conséquence, elle possède un comportement précis vis-à-vis des permutations des variables, déjà étudiées par Vandermonde, Lagrange puis Cauchy. Il démontre que ce comportement introduit une absurdité.
Ce résultat reste à ce moment fort peu connu. Son article, pourtant envoyé à Gauss, Legendre et Cauchy n’intéressera personne.
Boîte à outils
La démonstration repose largement sur le concept de symétrie de la fonction par rapport aux variables. Ce que l’on entend par là nécessite quelques explications, à commencer par la notation des variables, et le sens des noms qu’on leur attribue.
Considérons une fonction F de 5 variables. Pour concrétiser la définition de cette fonction, nous avons besoin de donner des noms aux différentes variables, par exemple en les désignant par a, b, c, d, et e, et nous avons besoin d’associer à cette fonction une expression mathématique construite à partir de ces noms de variables. Par exemple :
F(a, b, c, d, e) = a + 3b + 5c + 2d + e. (0-1)
Ce que l’on appelle expression de la fonction est en quelque sorte l’algorithme de calcul de cette fonction, en l’occurrence : somme de la première variable avec 3 fois la deuxième, 5 fois la troisième, 2 fois la quatrième, et la cinquième.
Lorsque l’on dit que l’on note les variables a, b, c, d, et e, cela signifie que l’on affecte le nom a à la première variable, le nom b à la seconde variable, le nom c à la troisième, etc…
On aurait pu tout autant choisir d’autres noms pour les variables, par exemple les noms c, d, e, f, g, h et la même fonction s’écrirait :
F(c, d, e, f, g) = c + 3d + 5e + 2f + g. (0-2)
F(a, b, c, d, e) = a + 3b + 5c + 2d + e et F(c, d, e, f, g) = c + 3d + 5e + 2f + g désignent la même fonction, bien que les noms des variables soit différents.
L’égalité (0-1) qui associe la notation F(a, b, c, d, e) à l’expression a + 3b + 5c + 2d + e est définie et vraie pour toutes les valeurs que pourraient prendre les 5 variables et quel que soit leur nom. C’est le sens de cette égalité.
D’une façon générale si l’on note F(a, b, c, d, e) la fonction, et E(a, b, c, d, e) l’expression de son calcul (a + 3b + 5c + 2d + e en l’occurrence) alors :
F(a, b, c, d, e) = E(a, b, c, d, e)
Et si l’on change le nom de variable dans F, il faut faire le même changement de nom dans E. Si l’on permute des lettres dans F, il faut permuter les lettres de la même façon dans E pour conserver l’égalité et travailler avec la même fonction. Ainsi, si l’on décide d’appeler la première variable b, et la seconde variable a, sans changer le nom des autres variables, la fonction noté F(b, a, c, d, e) aura pour expression (ou algorithme de calcul) : b + 3a + 5c + 2d + e. Ainsi les fonctions F(a, b, c, d, e) avec l’expression a + 3b + 5c + 2d + e, et F(b, a, c, d, e) avec l’expression b + 3a + 5c + 2d + e sont bien identiques.
Mais attention lorsque l’on attribue une valeur numérique à chaque variable.
Exemple : supposons que l’on affecte au quintuplet (a, b, c, d, e) les valeurs (2, 7, 4, 1, 14)
F(a, b, c, d, e) = a + 3b + 5c + 2d + e avec l’expression (0-1) = F(2, 7, 4, 1, 14) = 2 + 21 + 20 + 2 + 14 = 59
F(b, a, c, d, e) = b + 3a + 5c + 2d + e avec l’expression (0-2) = 7 + 6 + 20 + 2 + 14 = 49
Dans les 2 cas on travaille bien avec la même fonction F, mais dans un cas on calcule F(2, 7, 4, 1, 14) et dans l’autre cas F(7, 2, 4, 1, 14) or la fonction F est telle que F(2, 7, 4, 1, 14) ≠ F(7, 2, 4, 1, 14).
En fait, si l’on permute les variables (en l’occurrence a et b), il faut aussi permuter les valeurs (en l’occurrence 2 et 7), pour retrouver les mêmes valeurs numériques :
b + 3a + 5c + 2d + e = 59 avec (7, 2, 4, 1, 14) et a + 3b + 5c + 2d + e = 59 avec (2, 7, 4, 1, 14)
La fonction F donne bien toujours les mêmes valeurs pour un quintuplet de 5 valeurs numériques données, indépendamment de la façon de nommer les variables, et heureusement.
Allons plus loin. Considérons 2 fonctions F1 et F2 quelconques telles que pout tous a, b, c, d, e, on ait l’égalité :
F1(a, b, c, d, e) = F2(a, b, c, d, e). (0-3)
Si l’on échange les 2 premières variables, désormais b est la première variable et a la seconde , on aura :
F1(b, a, c, d, e) = F2(b, a, c, d, e)
Et d’une façon générale, toute permutation entre les variables (2 des 5 ou 3 des 5 ou 4 des 5, ou les 5) conservera l’égalité si elle est appliquée identiquement aux 2 termes. C’est à dire par exemple :
F1(b, a, d, e, c) = F2(b, a, d, e, c), ou bien F1(c, e, d, a, b) = F2(c, e, d, a, b)
Ce que l’on peut écrire : F1(Permut(a, b, c, d, e)) = F2(Permut(a, b, c, d, e))
Une autre façon d’assimiler cette notion consiste à d’introduire la fonction K(b, a, c, d, e) = F1(b, a, c, d, e) – F2(b, a, c, d, e). D’après (0-3) la fonction K(a, b, c, d, e) = 0 quelles que soient les valeurs de ses variables. On aura donc K(b, a, c, d, e) = 0, ce qui donne à nouveau F1(b, a, d, e, c) = F2(b, a, d, e, c), ou K(c, e, d, a, b) = 0, ce qui donne à nouveau F1(c, e, d, a, b) = F2(c, e, d, a, b), et d’une façon générale : K(Permut(a, b, c, d, e)) = 0, soit F1(Permut(a, b, c, d, e)) = F2(Permut(a, b, c, d, e)).
Ce résultat trivial sera très utile au paragraphe 3 de la démonstration, où l’on rencontre le cas de l’égalité
F1(a, b, c, d, e) = F2(a, b, c, d, e) avec F2 vérifiant aussi F2(a, b, c, d, e) = α F1(b, a, c, d, e) (0-4)
Il permet d’écrire
F1(b, a, c, d, e) = F2(b, a, c, d, e) = α F1(a, b, c, d, e) (0-5)
Et comme d’après (0-4) F1(a, b, c, d, e) = α F1(b, a, c, d, e), cela donne en remplaçant dans (0-5)
F1(b, a, c, d, e) = F2(b, a, c, d, e) = α F1(a, b, c, d, e) = α F2(a, b, c, d, e)
= α2 F1(b, a, c, d, e).
Passons à la notion de symétrie.
Une fonction présente une symétrie si son expression reste inchangée lors d’une permutation de variable.
Dans le cas de la fonction F(a, b, c, d, e) = a + 3b + 5c + 2d + e, la fonction n’est pas symétrique pour les échanges entres a et b. En effet si l’on permute a et b alors F(b, a, c, d, e) = b + 3a + 5c + 2d + e qui est une expression différente de a + 3b + 5c + 2d + e. Comme on l’a vu au paragraphe précédent, si l’on permute les variables, il faudra aussi permuter les valeurs des variables pour retrouver le même résultat.
D’où, en général, F(b, a, c, d, e) ≠ F(a, b, c, d, e) pour un même jeu de valeurs de (a, b, c, d, e). C’est ce que l’on a vu lors du calcul de F(2, 7, 4, 1, 14) et de F(7, 2, 4, 1, 14).
Cela n’est pas choquant ce comportement est normal lorsqu’il n’y a pas de symétrie, particulière ce qui est le cas généralement des fonctions. En revanche, si l’on considère la même fonction F et que l’on permute les variables a et e, on a alors :
F(e, b, c, d, a) = e + 3b + 5c + 2d + a = a + 3b + 5c + 2d + e = F(a, b, c, d, e)
a et e sont symétriques, nous pouvons permuter seulement les noms, ou seulement les valeurs, cela ne change pas le résultat.
F(e, b, c, d, a) = F(a, b, c, d, e)
Les expressions des 2 fonctions sont identiques, insensibles à la permutation des variables.
F(2, 7, 4, 1, 14) = F(14, 2, 4, 1, 2)
Par symétrique nous entendons que la valeur du terme reste inchangée lorsque l’on permute la valeur d’un xi avec celle d’un xj quelque soit les valeurs en jeu.
Une fonction peut avoir plus ou moins de symétrie, par exemple :
Soit G(a, b, c, d, e) = a*b*e + d*c
G possède 2 types de symétrie :
- une symétrie d’ordre 2 entre d et c : G(a, b, d, c, e) = G(a, b, c, d, e)
- une symétrie d’ordre 3 entre a, b et e : G(a, b, c, d, e) = G(b, a, c, d, e) = G(e, b, c, d, a) = G(a, e, c, d, b) = G(e, a, c, d, b) = G(b, e, c, d, a)
Notons au passage que la symétrie d’ordre 3 permet de faire une permutation circulaire sur les 3 variables a, b, e, (e prend la place de a qui prend la place de b qui prend la place de e) de sorte que : G(a, b, c, d, e) = G(e, a, c, d, b) = G(b, e, c, d, a)
Pour le corps de la démonstration nous utiliserons non plus les lettres a, b, c, d, e, mais les termes x1, x2, x3, x4, x5 comme noms de variable.
Les grandes lignes de la démonstration
Si le problème n’a pas de solution pour les équations de degré 5, il ne peut pas en avoir pour les équations de degré supérieur. En effet, s’il existait une fonction algébrique donnant les racines pour des degré supérieur, par exemple 7, il suffirait de multiplier l’équation de départ par le polynôme (X + 1)2de degré 2 pour se retrouver avec une équation de degré 7. On appliquerait alors la fonction résolvante qui donnerait les 7 racines, à savoir x1, x2, x3, x4, x5 et -1, -1 .
La démonstration se concentre donc sur les équations de degré 5.
Partie 1 : les propriétés de la fonction que l’on recherche :
S’il existe une fonction algébrique qui exprime dans le cas général les racines d’une équation de degré 5 en fonction des coefficients ai de l’équation, alors on verra que cette fonction doit forcément pouvoir s’exprimer aussi comme une fonction h de ces 5 racines, et donc aussi comme une fonction H de polynômes symétriques de ces 5 racines.
xi = h(a1, a2, a3, a4, a5) => h(a1, a2, a3, a4, a5) = H(x1, x2, x3, x4, x5)
L’expression de H(x1, x2, x3, x4, x5) doit forcément donner des valeurs différentes lorsque l’on fait certaines permutations des variables entre elles. En particulier on doit obtenir les 5 racines de l’équation en appliquant successivement des permutations circulaires de 5 variables.
Par exemple si on dispose de l’expression x1 = H(x1, x2, x3, x4, x5), c’est à dire : x1 – H(x1, x2, x3, x4, x5) = 0, alors en remplaçant x1 par x2 , x2 par x3, x3 par x4, x4 par x5, x5 par x1, on obtient successivement :
x2 = H(x2, x3, x4, x5, x1)
x3 = H(x3, x4, x5, x1, x2)
x4 = H(x4, x5, x1, x2, x3)
x5 = H(x5, x1, x2, x3, x4)
La fonction H ne peut donc pas être invariante pour les permutations circulaires de ses 5 variables.
Partie 2 : Les propriétés d’une fonction algébrique construite à partir des coefficients de l’équation
Toute fonction algébrique h(a1, a2, a3, a4, a5) construite à partir des additions, soustractions, multiplications, divisions, puissances nièmes, et radicaux nièmes appliqués aux coefficients ai sera telle que H(x1, x2, x3, x4, x5) possédera un niveau de symétrie trop élevé, qui laissera H invariante pour les permutations circulaires de ses 5 variables.
La preuve est apportée en examinant successivement l’effet des racines carrées, puis des racines impaires sur les permutations circulaires de degré 3 et 5. Le résultat de l’examen est que ces racines conservent les propriétés de symétrie circulaire.
Conclusion : Les exigences des parties 1 et 2 sont contradictoires. Le problème est insoluble.
La démonstration
1- Formulation du problème :
Étant donné l’équation générale de cinquième degré à coefficients rationnels de la forme :
f(X) = X5 + a1X4 + a2X3 + a3X2 + a4X + a5 = 0 (1)
Nous voulons, dans le cas général, cinq solutions distinctes, notées x1, x2, x3, x4, x5, qui s’exprimeraient sous la forme :
x1 = h1(a1, a2, a3, a4, a5)
x2 = h2(a1, a2, a3, a4, a5)
x3 = h3(a1, a2, a3, a4, a5) (2)
x4 = h4(a1, a2, a3, a4, a5)
x5 = h5(a1, a2, a3, a4, a5)
C’est-à-dire que nous recherchons 5 expressions qui à partir des coefficients ai permettent de calculer algébriquement les valeurs des xi.
Calculer algébriquement signifie que les opérations de calcul ne font intervenir que des additions, soustractions, multiplications, divisions, puissances nièmes, et radicaux nièmes.
Les coefficients ai de (1) peuvent être exprimés sous forme de fonction des racines xi, grâce au fait que la même équation (1) peut être ré-écrite sous la forme (3) suivante :
(X – x1)(X – x2)(X – x3)(X – x4)(X – x5) = 0 (3)
En effectuant le produit des termes de (3), nous obtenons :
X5 – (x1 + x2 + x3 + x4 + x5) X 4 + (x1x2 + x1x3 + x1x4 + … ) X 3 –
(x1x2x3 + x1x2x4 + x1x2x5 + x2x3x4 + x2x3x5 + … ) X 2 + (4)
( x1x2x3x4 + x1x2x3x5 + x1x2x4x5 + x2x3x4x5) X – (x1x2x3x4x5) = 0
Et l’on a, par identité de (1) et (4)
a1 = – (x1 + x2 + x3 + x4 + x5)
a2 = x1x2 + x1x3 + x1x4 + …
a3 = – (x1x2x3x4 + x1x2x3x5 + x1x2x4x5 + x2x3x4x5) (5)
a4 = (x1x2x3x4 + x1x2x3x5 + x1x2x4x5 + x2x3x4x5)
a5 = – (x1x2x3x4x5)
Ainsi, chaque coefficient ai peut être exprimé sous la forme d’un polynôme en (x1, x2, x3, x4, x5) dont il faut noter la remarquable propriété de symétrie. Chacun de ces 5 polynômes est symétrique par rapport aux variables xi, c’est-à-dire invariant pour toute permutation entre les xi, jusqu’aux permutations circulaires d’ordre 5. Ces 5 polynômes sont nommés polynômes symétriques de base pour la suite.
Considérons l’une quelconque des expressions hi (i = 1 ou 2 ou 3 …) de (2)
hi (a1, a2, a3, a4, a5) = xi = fonction hi de ( 5 termes symétriques par rapport aux xi)
Ce que l’on ré-écrit : hi (a1, a2, a3, a4, a5) = xi = Hi(x1, x2, x3, x4, x5) avec Hi une expression algébrique qui est entièrement construite (par addition, multiplication, division, puissances n-ièmes, racines n-ièmes) à partir de termes symétriques par rapport aux xi.
Mais Hi, bien que composée uniquement de termes symétriques en xi doit par exécution successive des opérations de calcul algébrique se simplifier et se réduire finalement à une seule variable xi.
Par symétrique nous entendons que la valeur du terme reste inchangée lorsque l’on permute la valeur d’un xi avec celle d’un xj. Voir chapitre Boîte à outils.
Chacun des termes en xi a le même comportement qu’un autre xj. Mais alors se pose la question : comment fait H1 pour produire à la fin la valeur x1 alors que le calcul n’est fait qu’à partir de termes symétriques, qui ne permettent pas de faire de distinctions entre les xi ?
Pour le comprendre, examinons ce qu’il se passe avec l’équation du second degré.
f(X) = X2 + a1X + a2 = 0
a1 = – (x1 + x2)
a2 = (x1x2)
On sait que pour les équations de degré 2, h1 et h2 ont pour expression :
h1 (a1, a2) = (-a1 + √(a12 – 4a2) )/2, tandis que h2 (a1,a2) = (-a1 – √(a12 – 4a2) )/2
Intéressons-nous à h1 :
(-a1 + √(a12 – 4a2) )/2 = ( x1 + x2 + √((x1 + x2)2 – 4x1x2) )/2 = ( x1 + x2 + √((x1 – x2)2 )/2 , expression qui à ce stade est encore symétrique, c’est à dire qu’elle reste inchangée si l’on remplace x1 par x2 et x2 par x1. En effet la permutation de x2 avec x1 donne alors : ( x2 + x1 + √((x2 – x1)2 )/2 .
√((x2 – x1)2= [ (x1 – x2) ou (x2 – x1) ] expression qui sous cette forme reste encore symétrique, mais la symétrie disparaît dès que l’on choisit une seule des 2 branches de l’alternative :
H1(x1, x2) = ((x1 + x2) + (x1 – x2))/2 si l’on choisit (x1 – x2) pour racine. Dans ce cas H1(x1, x2) = x1
H1(x1, x2) = ((x1 + x2) + (x2 – x1))/2 si l’on choisit (x2 – x1) pour racine. Dans ce cas H1(x1, x2) = x2
Dans les 2 cas H1(x1, x2) ne fait ressortir qu’une seule valeur, soit x1 soit x2 selon le choix de l’alternative ouverte par le traitement de √((x2 – x1)2. L’expression par H1 est bien élaborée au départ à partir de termes symétriques qui sont (x1 + x2) et ((x1 + x2)2 – 4 x1x2), mais pourtant après calcul littéral elle ne donne qu’une seule des 2 variables (soit x1 soit x2), la symétrie a disparu grâce à l’action du radical qui force un choix entre 2 expressions non symétriques. Un radical peut détruire la symétrie de la formule littérale.
Notons qu’une fois le choix fait, l’expression H1 (x1, x2) étant dissymétrique = ((x1 + x2) + (x1 – x2))/2, si l’on échange maintenant x1 et x2 dans la formule de H1 on obtient
H1(x2, x1) = x2
Ainsi on a élaboré une expression H(x1, x2) qui permet de calculer une première racine, et telle que H(x2, x1) donne la deuxième qui est différente en générale de la première.
Le mécanisme de destruction de la symétrie grâce à des radicaux est la clé pour disposer d’une formule qui donne une variable x1 à partir de termes symétriques en x1, x2, x3, x4, x5.
Les cas des équations de degré 3 et 4 montrent le même comportement de destruction de la symétrie pour aboutir finalement à une réduction de l’expression à une seul variable xi, cf annexes.
Revenons au cas des équations de degré 5 :
L’existence d’une expression permettant de calculer les racines à partir des coefficients ai de l’équation (1) implique donc l’existence d’expressions Hi(x1, x2, x3, x4, x5) qui sont entièrement construites à partir de termes symétriques par rapport aux xi au départ, mais qui par exécution successive des opérations de calcul (ou calcul littéral) se simplifient et se réduisent finalement à une seule des 5 variables xi.
Prenons par exemple le cas de H3, H3(x1, x2, x3, x4, x5) = x3, c’est-à-dire que H3 est une expression qui à partir des 5 variables d’entrée se simplifie et donne finalement en résultat la 3ième variable.
Permutons x1 et x3 dans l’expression H3 : partout où il y avait un x3 on aura un x1 et partout où il y avait un x1on aura un x3. On dispose ainsi d’une nouvelle expression, et qui est telle que lorsqu’on l’on exécute successivement les mêmes opérations de calcul (= même calcul littéral, ou même algorithme de calcul) qui avaient abouti avec l’expression H3 à la sortie de la 3ième variable, on obtiendra cette fois H3(x3, x2, x1, x4, x5) = troisième variable = x1. Une autre façon de voir le problème est de considérer que H3(x1, x2, x3, x4, x5) donne l’expression de la troisième racine de l’équation :
(X – x1)(X – x2)(X – x3)(X – x4)(X – x5) = 0
Si l’on considère maintenant l’équation : (X – x3)(X – x2)(X – x1)(X – x4)(X – x5) = 0, dans laquelle x1 est la troisième racine, et x3 la première, l’application de la même formule H3 à (x3, x2, x1, x4, x5) doit donner x1.
De même on obtiendra :
H3(x1, x3, x2, x4, x5) = x2, avec la permutation de x3 et x2 dans l’égalité de départ H3(x1, x2, x3, x4, x5) = x3
H3(x1, x3, x2, x4, x5) = x2, avec la permutation de x3 et x2 dans l’égalité de départ H3(x1, x2, x3, x4, x5) = x3
H3(x1, x2, x4, x3, x5) = x4, avec la permutation de x3 et x4 dans l’égalité de départ H3(x1, x2, x3, x4, x5) = x3
H3(x1, x2, x5, x4, x3) = x5, avec la permutation de x3 et x5 dans l’égalité de départ H3(x1, x2, x3, x4, x5) = x3
On a donc :
H3(x1, x2, x3, x4, x5, x5) = x3
H3(x3, x2, x1, x4, x5) = x1 = H1(x1, x2, x3, x4, x5, x5)
H3(x1, x3, x2, x4, x5) = x2 = H2(x1, x2, x3, x4, x5, x5)
H3(x1, x2, x4, x3, x5) = x4 = H4(x1, x2, x3, x4, x5, x5)
H3(x1, x2, x5, x4, x3) = x5 = H5(x1, x2, x3, x4, x5, x5)
H3 est donc une expression de 5 variables qui se simplifie par calcul littéral pour en donner une seule des 5, et elle permet aussi de produire les 5 racines différentes simplement à partir des permutations entre les 5 variables.
La question de la résolution des équations de degré 5 par une fonction algébrique devient :
Existe-t-il une expression de 5 variables, élaborée à partir d’une combinaison algébrique des 5 polynômes symétriques de ces 5 variables (ceux de (5) ), telles que son expression puisse se simplifier par calcul littéral (c’est-à-dire enchaînement des opérations de calcul formel) pour se réduire finalement à une seule des 5 variables ?
Si une telle expression existe alors elle permet de calculer les 5 racines du polynôme (1) par simple permutation entre les variables.
On se doute que la simplification du calcul permettant de passer d’une expression symétrique à une expression où il ne reste plus qu’une variable s’appuiera sur l’existence de radicaux. En effet les sommes et produits de termes symétriques donnent des résultats symétriques, et ne permettent pas à eux seuls de casser la symétrie qui est pourtant nécessaire pour faire émerger une seule des 5 variables.
En outre, cette expression, si elle existe en donnant successivement les 5 variables qui la composent, ne peut pas être invariante pour une permutation circulaire de ses 5 variables. Démonstration :
Les permutations circulaires de base, de 5 variables sont les suivantes :
- (x1, x2, x3, x4, x5),
- (x5, x1, x2, x3, x4), où x5 est passé en tête et les autres variables se sont décalées de 1 position
- (x4, x5, x1, x2, x3), où x4 est passé en tête et les autres variables se sont décalées de 1 position
- (x3, x4, x5, x1, x2), où x3 est passé en tête et les autres variables se sont décalées de 1 position
- (x2, x3, x4, x5, x1), où x2 est passé en tête et les autres variables se sont décalées de 1 position
On reste dans le cas où Hi(x1, x2, x3, x4, x5, x5) donne toujours comme résultat la troisième variable (le raisonnement s’applique tout autant pour les autres Hi), on aura donc, selon les permutations circulaires des 5 variables :
Hi(x1, x2, x3, x4, x5) = x3
Hi(x5, x1, x2, x3, x4) = x2
Hi(x4, x5, x1, x2, x3) = x1
Hi(x3, x4, x5, x1, x2) = x5
Hi(x2, x3, x4, x5, x1) = x4
Si l’expression est invariante par permutation circulaire des 5 variables alors cela signifie que les 5 résultats donnés par Hi devront être identiques, et donc que les 5 racines x1, x2, x3, x4, x5, x5 sont identiques, ce qui n’est évidemment pas le cas en général.
La fonction que l’on cherche ne peut pas être invariante pour une permutation circulaire de ses 5 variables.
De même la fonction ne peut pas être systématiquement invariante pour toutes les permutations circulaires de 3 variables : en effet, si l’on reprend l’exemple de Hi(x1, x2, x3, x4, x5, x5) = troisième variable = x3, et que l’on permute circulairement x1, x2, x3 pour donner x3, x1, x2 alors Hi(x3, x1, x2, x4, x5) = x2, puisque x2 est devenu la troisième variable.
Existe-t-il une expression de 5 variables, élaborée à partir d’une combinaison algébrique des 5 polynômes symétriques de ces 5 variables, telles que son expression puisse se simplifier par calcul littéral (c’est-à-dire enchaînement des opérations de calcul formel) pour se réduire finalement à une seule des 5 variables, sachant que cette fonction ne pourra pas être invariante pour une permutation circulaire de ses 5 variables et qu’elle ne sera pas non plus systématiquement invariante pour les permutations circulaires de 3 variables?
Cette question est une reformulation du problème de départ, et sa réponse est non, comme le montre la suite.
2- Forme générale de l’expression recherchée
La combinaison des opérateurs +, -, /, * pour construire l’expression recherchée va faire appel à des sommes de polynômes rationnels Cki avec des radicaux de différents ordres de la forme Σ Dij * nij√Ψ , avec Ψ lui-même aussi de cette forme c’est-à-dire somme de polynômes rationnels Cxy avec des radicaux de différents ordres de la forme Σ Dxy * nxy√Z. Cela aboutira à la forme suivante (6) :
x1 = H1(x1, x2, x3, x4, x5, x5) =

avec : nki entiers, Bi, Cki et Dij des polynômes rationnels des coefficients ai de l’équation (1). Ces polynômes peuvent donc s’exprimer à partir de combinaisons des 5 polynômes symétriques vus au début de la démonstration.
3- Analyse des radicaux les plus internes :
Considérons les radicaux les plus interne de la formule (termes entourés en rouge dans la formule du paragraphe précédent). Les plus internes signifie qu’ils ne contiennent plus d’autre radicaux dans leur expression, la fonction mise sous le radical s’expriment donc seulement sous forme de polynômes rationnel des coefficients ai de l’équation (1).
Désignons par Y le radical n√P de l’un d’eux :

Tout d’abord un tel radical existe forcément dans la formule que l’on cherche, car sinon cela signifierait que Hi est une fonction purement rationnelle des coefficients ai de l’équation 1, et donc son expression serait purement symétrique des racines xi ce qui ne pourrait alors produire qu’une seule valeur, indépendante des permutations d’indices. Il n’y aurait qu’une seule valeur de racine possible, or la formule doit en donner 5.
Le terme P de ce radical est quant à lui forcément une expression construite à partir des coefficients ai de l’équation (1), sans radicaux internes, par définition de Y. Donc à ce stade P est purement symétrique par rapport aux racines (puisque les ai le sont). P s’exprimera donc par une fonction symétrique de ces racines, que l’on note sous la forme F(x1, x2, x3, x4, x5).

Et on notera 𝜑 (x1, x2, x3, x4, x5) la racine nième de F :

F est symétrique, c’est à dire qu’elle conserve la même expression, quel que soit la permutation de variable que l’on applique. Mais la fonction 𝜑 , elle, ne peut pas être totalement symétrique par rapport aux xi car sinon cela impliquerait qu’elle soit une fonction des polynômes symétriques de base présentés en (5) et donc qu’elle s’exprime directement sous la forme d’une fonction rationnelle des coefficients ai (on démontre en effet que toute fonction symétrique d’ordre 5 est forcément une combinaison des 5 polynômes symétriques d’ordre 5 de base). Cela impliquerait que n√P s’exprime directement comme une fonction des polynômes symétriques de base et donc qu’elle s’exprime directement en fonction rationnelle des coefficients ai. Autrement dit le terme Y pourrait être exprimé à l’aide des coefficients ai sans avoir besoin d’utiliser de radical, et donc Y ne serait pas le radical le plus interne de la formule.

Les valeurs de F et de 𝜑n ne sont pas modifiées par une permutation quelconque des xi, F et 𝜑n sont des expressions dans lesquelles tous les xi se comportent de la même façon et ne peuvent pas être discriminés dans l’algorithme de calcul littéral (l’application du même algorithme de calcul sur F donne toujours le même résultat formel même quand on échange n’importe quel xi avec n’importe quel xj). Mais dans le même temps 𝜑(x1, x2, x3, x4, x5) ne peut pas être totalement symétrique et son expression littérale change sous l’effet d’au moins une permutation, par exemple entre x1 et x2.
Pourquoi y a-t-il forcément un changement de valeur (et d’expression littérale) pour une permutation entre seulement 2 termes xi ? On pourrait penser que la dissymétrie n’apparait qu’avec une permutation circulaire d’ordre 3 ou 4 ou 5, et qu’il n’y en a pas pour 2, mais non car toute permutation circulaire d’ordre 3 ou 4 ou 5 se décompose en une succession de permutations entre 2 couples de xi, ce qui impose de faire déjà apparaitre la dissymétrie à la suite d’une permutation entre 2 racines.
Plus fort, si à partir de F qui est symétrique, on a trouvé un procédé de calcul tel qu’à partir de la permutation par exemple de x1 et x2, on produit une dissymétrie sur 𝜑, c’est-à-dire tel que les expressions suivantes (et les valeurs qui en découlent lorsque l’on remplace les variables xi par leur valeur) vérifient :

alors le même procédé appliqué à n’importe quel autre couple produira le même effet puisque toutes les variables ont le même comportement et sont indistinctes dans P et que donc tous les couples de variables ont aussi le même comportement, les mêmes propriétés et sont indistincts dans P. Cela signifie que toute permutation de 2 variables xi, xj donnera 2 valeurs différentes associées à 2 expressions différentes.
Ce que nous reformulons de la façon suivante :
Pour toute permutation ‘’permut’’ entre 2 des 5 variables (x1, x2, x3, x4, x5)
F(x1, x2, x3, x4, x5) = F(permut((x1, x2, x3, x4, x5)) mais
𝜑(x1, x2, x3, x4, x5) ≠ 𝜑(permut (x1, x2, x3, x4, x5))
Raisonnons maintenant sur une permutation entre x1 et x2, sachant que le raisonnement sera applicable à toutes les autres permutations :

Ce résultat signifie que l’algorithme de calcul de 𝜑 est tel que lorsque l’on échange les 2 premières variables du quintuplet de départ, l’expression résultante par 𝜑 = α fois l’expression par 𝜑 du quintuplet de départ, en l’occurrence (x1, x2, x3, x4, x5). Cela signifie donc aussi qu’en partant cette fois du quintuplet (x2, x1, x3, x4, x5) l’algorithme de calcul de 𝜑 appliqué à (x1, x2, x3, x4, x5) donnera comme expression résultante α fois l’expression par 𝜑 de (x2, x1, x3, x4, x5). C’est-à-dire :
𝜑 (x1, x2, x3, x4, x5) = α 𝜑(x2, x1, x3, x4, x5) avec le même α
Si l’explication à partir de l’algorithme de calcul ne vous suffit pas pour accepter ce résultat, nous pouvons voir la question sous un autre angle : reprenons la formule 𝜑(x2, x1, x3, x4, x5) et changeons partout dans cette formule x2 par y1, x1 par y2, x3 par y3, x4 par y4, x5 par y5 . On a donc :
𝜑(x2, x1, x3, x4, x5) = 𝜑(y1, y2, y3, y4, y5)
Et en appliquant maintenant sur F(y1, y2, y3, y4, y5) et 𝜑(y1, y2, y3, y4, y5) les mêmes procédés de calcul que ceux décrits précédemment pour F(x2, x1, x3, x4, x5) et 𝜑(x2, x1, x3, x4, x5) on aura bien.
𝜑(y2, y1, y3, y4, y5) = α 𝜑(y1, y2, y3, y4, y5), soit
𝜑(x1, x2, x3, x4, x5) = α 𝜑(x2, x1, x3, x4, x5)
Maintenant que l’on est convaincu, des 2 résultats obtenus, à savoir :
𝜑(x2, x1, x3, x4, x5) = α 𝜑(x1, x2, x3, x4, x5) et
𝜑(x1, x2, x3, x4, x5) = α 𝜑(x2, x1, x3, x4, x5)
On tire 𝜑(x1, x2, x3, x4, x5) = α2 𝜑(x1, x2, x3, x4, x5),
d’où α2 = 1 et donc n=2
En conclusion α2 = 1, c’est à dire α = +/-1. D’où un premier résultat remarquable : le radical le plus interne qui se trouve dans la solution générale d’une équation polynomiale résoluble par voie algébrique est forcément une racine carrée. Et c’est bien ce que l’on constate non seulement dans le cas évident de l’équation du second degré, mais aussi dans ceux des équations du troisième et du quatrième degré.
Notre premier Y en général peut donc prendre deux valeurs opposées +𝜑1 et – 𝜑1. La première valeur, que l’on choisit arbitrairement de noter +𝜑1, correspond à l’expression de Y sous la forme 𝜑(x1, x2, x3, x4, x5) dans laquelle on remplacerait chaque xi par sa valeur, et la seconde valeur – 𝜑1 correspond à l’expression de Y sous la forme 𝜑(x2, x1, x3, x4, x5) dans laquelle on remplacerait chaque xi par sa valeur. Et cela s’applique à toute paire de racines.
De façon plus précise, nous avons démontré que Y = √P où P est exprimé à partir des coefficients ai de l’équation (pour rappel P(a1, a2, a3, a4, a5) = F(x1, x2, x3, x4, x5). Nous savons que P est invariant pour toute permutation des racines xi. Y ne peut donc prendre que 2 valeurs, notées +𝜑1 et – 𝜑1 quelle que soit la permutation considérée. Ces 2 seules valeurs sont aussi le résultat de 2 expressions différentes qui découlent l’une de l’autre en permutant seulement deux racines données :
𝜑(x1, x2, x3, x4, x5) = +𝜑1 = √P
𝜑(x1, x2, x3, x4, x5) = -𝜑1 = -√P
Et cela s’applique à toute paire de racines.
Pour une autre paire de racine, par exemple x3 et x1, les permutations entre xi et xj dans l’expression 𝜑(x1, x2, x3, x4, x5) ne donneront pas d’autre valeur que : soit +𝜑1 soit -𝜑1. En effet, 𝜑(x3, x2, x1, x4, x5) = +/- F(x1, x2, x3, x4, x5) = +/- √P = +/- 𝜑1.
Pour toute permut de 2 racines, 𝜑 (permut (x1, x2, x3, x4, x5)) = -𝜑1 = 𝜑(x1, x2, x3, x4, x5)
Conséquence :
𝜑 (x1, x2, x3, x4, x5) ne changera pas de valeur (ni d’expression) lorsque l’on effectuera une permutation circulaire de trois racines (une permutation où, par exemple, x1, x2, x3 devient x2, x3, x1 ou x3, x1, x2), car une telle permutation équivaut à la succession de deux échanges de deux racines, et donc à un double changement de signe.
x1, x2, x3 devient x2, x1, x3 après le premier échange, puis x2, x1, x3 devient x2, x3, x1 après le deuxième échange.
𝜑(x2, x3, x1, x4, x5) = 𝜑(x3, x1, x2, x4, x5) = 𝜑(x1, x2, x3, x4, x5), égalités valables en valeur et en expression.
De même, les permutations circulaires d’ordre 5 sont la combinaison de 4 échanges de 2 racines, et l’on a : 𝜑(x5, x1, x2, x3, x4) = 𝜑(x4, x5, x1, x2, x3) = 𝜑(x3, x4, x5, x1, x2) = 𝜑(x2, x3, x4, x5, x1) = 𝜑(x1, x2, x3, x4, x5), égalités valables en valeur et en expression.
Cela vaut pour toutes les permutations circulaires d’un nombre impair de racines.
Conclusion de l’analyse des radicaux les plus internes de la formule qui donne les racines de l’équation (1) : Tous les différents termes les plus internes de la formule sont des radicaux second (autrement dit des racines carrées) de la forme √Pi. Ces termes ne peuvent prendre que 2 valeurs différentes et ont des expressions 𝜑(x1, x2, x3, x4, x5) qui seront insensibles à des nombres pairs de permutations entre des couples de xi, c’est-à-dire qu’elles donneront toujours la même valeur lorsque l’on applique un nombre pair de permutation entre 2 variables. Par conséquent les termes les plus internes s’expriment sous la forme √Pi dont l’expression à l’aide des racines est 𝜑(x1, x2, x3, x4, x5) et cette expression est telle que les permutations circulaires de trois ou cinq racines, ne changent pas la valeur de ce terme.
4- Analyse des radicaux qui contiennent les radicaux les plus internes :
4-1) Analyse générale :
On s’intéresse maintenant aux radicaux de niveau supérieur aux radicaux les plus internes (cf expressions entourées en rouge).

Posons Q = Cij + Σ Dij * nki√Pki et Z = nkx√Q
Z est donc un radical qui contient un radical le plus interne. Dans le paragraphe précédent nous avons vu que nki√Pki est en fait : √Pki = 𝜑 (x1, x2, x3, x4, x5) avec 𝜑 fonction rationnelle des racines invariante pour toute permutation circulaire de 3 ou 5 racines.
Tous les éventuels autres radicaux nkj√Pkj qui interviennent dans la somme Σ Dij * nki√Pki sont aussi forcément des racines secondes car sinon cela signifierait qu’ils contenaient un radical dans l’expression de P, et que donc le terme le plus interne n’était pas celui que l’on a défini au paragraphe 3. Comme ils n’en contiennent pas, le raisonnement du paragraphe 3 s’applique, nkj√Pkj est donc aussi une racine seconde, son expression ne peut donner que 2 valeurs, et la valeur produite par cette expression sera invariante pour toute permutation de 3 ou 5 racines.
Les différents termes √Pkjsont combinés avec des termes Dij entièrement symétriques (puisque combinaisons de ai), sommés entre eux et finalement ajouté à Cij qui est aussi entièrement symétrique car combinaison de ai. Cela permet d’affirmer que Q aura une expression qui donnera la même valeur pour toute permutation de 3 ou 5 racines.
A ce stade nous avons donc Z = nkx√Q où Q est une fonction rationnelle des racines, invariante pour toute permutation de 3 ou 5 racines.
4-2) Cas ni = 2 :
Si ni = 2 alors la fonction Z sera encore du même genre, c’est-à-dire fonction rationnelle des racines, invariante pour toute permutation circulaire de 3 ou 5 racines, et cela continuera ainsi tant que la remontée d’un niveau à l’autre de l’expression rencontre des racines secondes (donc y compris des racines quatrièmes). Démonstration :

où √P est définit par l’expression 𝜑(x1, x2, x3, x4, x5).
On note G(x1, x2, x3, x4, x5) l’expression de Z en fonction des racines xi :
G2(x1, x2, x3, x4, x5) = C + D 𝜑(x1, x2, x3, x4, x5)
Et en notant Q(x1, x2, x3, x4, x5) = C + D 𝜑(x1, x2, x3, x4, x5),
G(x1, x2, x3, x4, x5) = +√Q(x1, x2, x3, x4, x5) ou bien -√Q(x1, x2, x3, x4, x5)
On remarque que toute permutation de 2 variables dans Q fait changer la valeur de Q, mais Q est invariante pour toute permutation circulaire de 3 ou 5 variables => Q ne prend que 2 valeurs et oscille entre ces 2 valeurs à chaque permutation.
La fonction G peut prendre 2 expressions différentes : soit avec + devant la racine, soit avec -. Nous allons montrer que quelle que soit le choix que l’on fera nous aurons toujours : G(x1, x2, x3, x4, x5) ≠ G(x2, x1, x3, x4, x5), et cela sera aussi vrai pour toute permutation de 2 variables dans G, mais G restera toujours invariante pour les permutations circulaires de 3 variables, ou 5 variables.
Montrons d’abord que : G(x1, x2, x3, x4, x5) ≠ G(x2, x1, x3, x4, x5),
Q(x1, x2, x3, x4, x5) = C + D 𝜑(x1, x2, x3, x4, x5)
Q(x2, x1, x3, x4, x5) = C + D 𝜑(x2, x1, x3, x4, x5) = C – D 𝜑(x1, x2, x3, x4, x5)
Donc, dans le cas général : √Q(x1, x2, x3, x4, x5) ≠ √Q(x2, x1, x3, x4, x5).
Donc : G(x1, x2, x3, x4, x5) ≠ G(x2, x1, x3, x4, x5).
Montrons maintenant l’invariance pour les permutations circulaires de 3 variables.
Pour les permutations circulaires de 3 variables, considérons les permutations circulaires sur x1, x2, et x3, sachant que le raisonnement qui suit s’applique pour toute autre permutation circulaire de 3 des 5 variables. Il y a 3 permutations circulaires possible pour ces 3 variables : (x1, x2, x3, x4, x5), (x3, x1, x2, x4, x5), (x2, x3, x1, x4, x5) et le passage de l’une à l’autre se construit à partir de 2 des 3 couples de permutations suivant : échange (1,2), échange (1,3), et échange (2,3).
- Construction des permutations circulaires de 3 variables à partir du couple (1,2) et (1,3)
La permutation (1,2) : fait passer de G(x1, x2, x3, x4, x5) à G(x2, x1, x3, x4, x5)
La permutation (1,3) : fait passer de G(x2, x1, x3, x4, x5) à G(x2, x3, x1, x4, x5)
On obtient ainsi la troisième permutation circulaire : G(x2, x3, x1, x4, x5).
Partons maintenant de G(x2, x3, x1, x4, x5) :
La permutation (1,2) : fait passer de G (x2, x3, x1, x4, x5) à G(x1, x3, x2, x4, x5)
La permutation (1,3) : fait passer de G (x1, x3, x2, x4, x5) à G(x3, x1, x2, x4, x5)
On obtient ainsi la deuxième permutation circulaire G(x3, x1, x2, x4, x5).
- Construction des permutations circulaires de 3 variables à partir du couple (1,2) et (2,3)
La permutation (1,2) : fait passer de G(x1, x2, x3, x4, x5) à G(x2, x1, x3, x4, x5)
La permutation (2,3) : fait passer de G(x2, x1, x3, x4, x5) à G (x3, x1, x2, x4, x5)
On obtient ainsi la deuxième permutation circulaire G(x3, x1, x2, x4, x5).
Partons maintenant de G(x3, x1, x2, x4, x5) :
La permutation (1,2) : fait passer de G(x3, x1, x2, x4, x5) à G(x3, x2, x1, x4, x5)
La permutation (2,3) : fait passer de G(x3, x2, x1, x4, x5) à G(x2, x3, x1, x4, x5)
On obtient ainsi la troisième permutation circulaire : G(x2, x3, x1, x4, x5).
- Construction des permutations circulaires de 3 variables à partir du couple (1,3) et (2,3)
La permutation (1,3) : fait passer de G(x1, x2, x3, x4, x5) à G(x3, x2, x1, x4, x5)
La permutation (2,3) : fait passer de G(x3, x2, x1, x4, x5) à G(x2, x3, x1, x4, x5)
On obtient ainsi la troisième permutation circulaire G(x2, x3, x1, x4, x5).
Partons maintenant de G(x2, x3, x1, x4, x5) :
La permutation (1,3) : fait passer de G(x2, x3, x1, x4, x5). à G(x2, x1, x3, x4, x5)
La permutation (2,3) : fait passer de G(x2, x1, x3, x4, x5) à G(x3, x1, x2, x4, x5)
On obtient ainsi la deuxième permutation circulaire G(x3, x1, x2, x4, x5).
Sous l’effet de la permutation (1,2), G(x2, x1, x3, x4, x5) prendra l’une des 2 expressions suivantes : +√Q(x2, x1, x3, x4, x5) ou bien -√Q(x2, x1, x3, x4, x5). De même sous l’effet de la permutation (1,3) G(x3, x2, x1, x4, x5) prendra l’une des 2 expression suivantes : +√Q(x3, x2, x1, x4, x5) ou bien -√Q(x3, x2, x1, x4, x5). Et enfin idem pour la permutation (2,3).
Il y n’a donc que 2 types de comportements possible (soit +, soit -) pour chacune des 3 permutations. Cela implique qu’au moins 2 des 3 permutations (1,2), (1,3), (2,3) auront le même comportement qui sera soit + et + , soit – et -.
Supposons que (1,2) et (1,3) aient le même comportement (- et -) :
G(x2, x1, x3, x4, x5) = –√Q(x2, x1, x3, x4, x5), et
G(x3, x2, x1, x4, x5) = –√Q(x3, x2, x1, x4, x5)
Comme Q(x2, x1, x3, x4, x5) = Q(x3, x2, x1, x4, x5) puisque Q est invariante par permutation circulaire de 3 variables, nous obtenons : G(x2, x1, x3, x4, x5) = G(x3, x2, x1, x4, x5), ce qui donne, en permutant 1 et 3 dans les 2 expressions de l’égalité précédente :
G(x2, x3, x1, x4, x5) = G(x1, x2, x3, x4, x5) (7)
Et aussi en permutant 1 et 2 puis ensuite 1 et 3 dans cette dernière égalité :
G(x3, x1, x2, x4, x5) = G(x2, x3, x1, x4, x5) (8)
De (7) et (8) on déduit que les 3 termes G(x1, x2, x3, x4, x5), G(x2, x3, x1, x4, x5), G(x3, x1, x2, x4, x5) sont égaux. Il en serait de même si nous avions choisi (+ et +) comme comportement de (1,2) et (1,3).
Supposons maintenant que cela soit (1,2) et (2,3) qui ont le même comportement (- et -) :
G(x2, x1, x3, x4, x5) = –√Q(x2, x1, x3, x4, x5)
G(x1, x3, x2, x4, x5) = –√Q(x1, x3, x2, x4, x5)
Nous obtenons : G(x2, x1, x3, x4, x5) = G(x1, x3, x2, x4, x5) car Q invariante pout toute permutation circulaire de 3 variables, ce qui donne, en permutant 1 et 2 dans les 2 expressions de l’égalité précédente :
G(x1, x2, x3, x4, x5) = G(x2, x3, x1, x4, x5)
Et aussi en permutant 1 et 3 puis ensuite 2 et 3 dans cette dernière égalité :
G(x2, x3, x1, x4, x5) = G(x3, x1, x2, x4, x5)
On obtient de nouveau que les 3 termes G(x1, x2, x3, x4, x5), G(x2, x3, x1, x4, x5), G(x3, x1, x2, x4, x5) sont égaux. Cela serait de nouveau idem si l’on supposait que c’est (1,3) et (2,3) qui ont le même comportement.
L’invariance pour les permutations circulaires de 3 variables est démontrée.
Passons maintenant à la démonstration de l’invariance pour les permutations circulaires d’ordre 5 :
Considérons les permutations circulaires de 5 variables : (x1, x2, x3, x4, x5), (x2, x3, x4, x5, x1,), (x3, x4, x5, x1, x2,), (x4, x5 , x1, x2, x3,), et (x5, x1, x2, x3, x4). Nous allons montrer que la valeur par G de chacune d’elle est la même. La démonstration se fait en appliquant successivement 2 permutations circulaires de 3 variables sur G, en exploitant le fait que chaque permutation circulaire de 3 variables conserve la valeur de G.
Partons de G(x1, x2, x3, x4, x5), et appliquons une permutation circulaire sur (x1, x2, x3). Le résultat est G(x2, x3, x1, x4, x5) qui est = G(x1, x2, x3, x4, x5) compte tenu de l’invariance aux permutations circulaires de 3 variables.
Appliquons maintenant une permutation circulaire sur les 3 dernières variables (x1, x4, x5) pour les faire passer à (x4, x5, x1)
Le résultat devient G(x2, x3, x4, x5, x1) = G(x2, x3, x1, x4, x5) = G(x1, x2, x3, x4, x5)
Donc G(x2, x3, x4, x5, x1) = G(x1, x2, x3, x4, x5)
De même en partant de G(x2, x3, x4, x5, x1) et en appliquant une permutation circulaire sur les 3 premières variables, puis une permutation circulaire sur les 3 dernières, on montrera G(x2, x3, x4, x5, x1) = G(x3, x4, x5, x1, x2), puis de la même façon G(x3, x4, x5, x1, x2) = G(x4, x5, x1, x2, x3), et enfin G(x4, x5, x1, x2, x3) = G(x5, x1, x2, x3, x4).
Conclusion : si le radical juste au-dessus du radical le plus interne est une racine seconde, la fonction G(x1, x2, x3, x4, x5), issue de ce radical prend 2 valeurs différentes lorsque l’on permute 2 variables, et G(x1, x2, x3, x4, x5) est invariante pour les permutations circulaires de 3 variables ou de 5 variables. Cela veut dire que G a de nouveau exactement les mêmes propriétés que la fonction Q au début de ce paragraphe. Au fur et à mesure que l’on remonte l’expression en rencontrant des racines carrées, ces propriétés sont conservées. Cela implique que dans cette remontée on doit finir par rencontrer d’autres radicaux que des radicaux seconds puisse que l’on sait que l’expression des racines que l’on cherche ne peut pas être invariante aux permutations circulaires de 5 variables.
4-2) Cas ni > 2 :
Supposons donc que la remontée des radicaux finisse par aboutir à un radical ni > 2. On peut supposer que ni est impair car le cas pair a été traité au paragraphe précédent et l’on a vu qu’il donne des expressions invariantes aux permutations circulaires de 3 ou 5 variables.
Nous notons Z ce radical, et avons Z = ni√Q où Q est une fonction rationnelle des racines, invariante pour toute permutation de 3 ou 5 racines.
On note de nouveau G(x1, x2, x3, x4, x5) l’expression de Z en fonction des racines xi.
Nous avons donc un Z qui, en soumettant les racines de l’équation à une permutation circulaire de trois, ou cinq variables, devra pouvoir prendre différentes valeurs, mais telle que l’on ait toujours Zn = Q, avec Q inchangé, puisqu’il est inchangé pour une permutation circulaire de trois, ou cinq variables.
Considérons une permutation circulaire quelconque de 3 variables, par exemple les 3 premières avec (x2, x3, x1, x4, x5) :
Gn(x2, x3, x1, x4, x5) = Q = Gn(x1, x2, x3, x4, x5) puisque Q est invariant pour une permutation circulaire de trois variables.
d’où G(x2, x3, x1, x4, x5) = α G(x1, x2, x3, x4, x5) avec α racine n-ième de l’unité. (9)
Appliquons maintenant une permutation (1,2) puis (1,3) sur chacun des termes de l’égalité précédente, et nous obtenons successivement :
G(x1, x3, x2, x4, x5) = α G(x2, x1, x3, x4, x5)
G(x3, x1, x2, x4, x5) = α G(x2, x3, x1, x4, x5) et comme, d’après (9) G(x2, x3, x1, x4, x5) = α G(x1, x2, x3, x4, x5) nous aurons
G(x3, x1, x2, x4, x5) = α2 G(x1, x2, x3, x4, x5) (10)
Appliquons de nouveau une permutation (1,2) puis (1,3) sur l’égalité (10) :
G(x3, x2, x1, x4, x5) = α2 G(x2, x1, x3, x4, x5) (11)
G(x1, x2, x3, x4, x5) = α2 G(x2, x3, x1, x4, x5) (12)
D’où d’après (12) et (9) :
G(x1 x2, x3, x4, x5) = α2 G(x2, x3, x1, x4, x5) = α3 G(x1, x2, x3, x4, x5) (13)
Donc α3 = 1, avec α une racine n-ième de l’unité.
De même considérons une permutation circulaire sur les trois dernières variables, par exemple x1, x2, x4, x5, x3 :
Gn(x1, x2, x4, x5, x3) = Q = Gn(x1, x2, x3, x4, x5) puisque Q est invariant pour une permutation circulaire de trois variables.
d’où G(x1, x2, x4, x5, x3) = β G(x1, x2 x3, x4, x5) (14) avec β aussi racine n-ième de l’unité. Nous ne préjugeons pas à ce stade que α et β soit la même racine n-ième de l’unité.
Appliquons une permutation (3,4) puis (3,5) sur chacun des termes de l’égalité, et nous obtenons successivement :
G(x1, x2 x3, x5, x4) = β G(x1, x2, x4, x3, x5)
G(x1, x2 x5, x3, x4) = β G(x1, x2, x4, x5, x3) ,
et comme d’après 14 G(x1, x2, x4, x5, x3) = β G(x1, x2, x3, x4, x5) nous aurons cette fois:
G(x1, x2 x5, x3, x4) = β2 G(x1, x2, x3, x4, x5) (15)
Appliquons de nouveau une permutation (3,4) puis (3,5) sur l’égalité (15) précédente :
G(x1, x2 x5, x4, x3) = β2 G(x1, x2, x4, x3, x5)
G(x1, x2 x3, x4, x5) = β2 G(x1, x2, x4, x5, x3) = en utilisant (14) = β3 G(x1, x2 x3, x4, x5)
Donc cette fois β3 = 1, avec β une racine n-ième de l’unité.
Dans le même temps nous savons que Gn(x1, x2, x3, x4, x5) = Q (x1, x2, x3, x4, x5) avec Q invariant par permutation circulaire de 5 variables.
Considérons maintenant une permutation circulaire quelconque de 5 variables, par exemple : (x2, x3, x4, x5, x1).
Appliquons une permutation circulaire de 3 variables sur x4, x5, x1, c’est-à-dire les 3 dernières variables.
G(x2, x3 x1, x4, x5) = β2 G(x2, x3, x4, x5, x1 ) d’après (15) dans laquelle on a remplacé x1 par x2, x2 par x3, x3 par x4, x4 par x5, et x5 par x1. On a donc :
G(x2, x3, x4, x5, x1 ) = 1/β2 G(x2, x3 x1, x4, x5) = β G(x2, x3 x1, x4, x5) puisque β3 = 1. (16)
Or la relation (12) nous dit : G(x2, x3 x1, x4, x5) = 1/α2 G(x1, x2 x3, x4, x5) = α G(x1, x2 x3, x4, x5) puisque α3 = 1.
De (16) et (12) on déduit : G(x2, x3, x4, x5, x1 ) = βα G(x1, x2 x3, x4, x5). (17)
En décalant d’un rang les variables dans (17) on obtiendra
G(x3, x4, x5, x1, x2) = βα G(x2, x3 x4, x5, x1) (18), puis en décalant encore successivement d’un rang :
G(x4, x5, x1, x2, x3) = βα G(x3, x4, x5, x1, x2) (19)
G(x5, x1, x2, x3, x4) = βα G(x4, x5, x1, x2, x3) (20)
G(x1, x2 x3, x4, x5) = βα G(x5, x1, x2, x3, x4) (21)
De (17) à (21) on tire :
G(x2, x3, x4, x5, x1 ) = βα G(x1, x2 x3, x4, x5) = βα (βα (x5, x1, x2, x3, x4)) = β3α3 (x4, x5, x1, x2, x3) = β4α4G(x3, x4, x5, x1, x2) = β5α5 G(x2, x3 x4, x5, x1)
D’où β5α5 = 1, et comme β3 = 1 = α3, on en déduit β2α2 = 1, et donc βα = 1 puisque β3 α3 = 1.
L’égalité βα = 1 reportée dans les égalités (17) à (21) implique que G est invariant à toute permutation circulaire d’ordre 5.
Nous allons maintenant montrer que α = 1 = β, ce qui impliquera cette fois que G est aussi invariant à toute permutation circulaire d’ordre 3.
Partons de G(x1, x2, x3, x4, x5) = G(x4, x5, x1, x2, x3) (22) par égalité des permutations circulaires d’ordre 5.
Appliquons l’égalité (14), c’est à dire G(x1, x2, x4, x5, x3) = β G(x1, x2, x3, x4, x5), en remplaçant dans cette égalité : x1 par x4, x2 par x5, x4 par x1, et x5 par x2, on obtient alors l’égalité suivante :
G(x4, x5, x1, x2, x3) = β G(x4, x5, x3, x1, x2) (23)
Comme on a, par double permutation circulaire d’ordre 5, G(x4, x5, x3, x1, x2) = G(x3, x1, x2, x4, x5), on obtient en remplaçant G(x4, x5, x3, x1, x2) par G(x3, x1, x2, x4, x5) dans (23) :
G(x4, x5, x1, x2, x3) = β G(x3, x1, x2, x4, x5). (24)
Or, d’après (10), G(x3, x1, x2, x4, x5) = α2 G(x1, x2, x3, x4, x5) ce qui permet finalement d’écrire :
G(x1, x2, x3, x4, x5) = G(x4, x5, x1, x2, x3) d’après (22), = β G(x4, x5, x3, x1, x2) d’après (23), = β G(x3, x1, x2, x4, x5,) d’après (24), = βα2 G(x1, x2, x3, x4, x5) d’après (10)
Donc βα2 = 1, et comme βα = 1, on en déduit α = 1 et β = 1.
Nous voilà donc rendu au même point qu’au début des paragraphe 4-2 ou 4-3, avec un terme Z = ni√Q où Q est une fonction invariante pour toute permutation de 3 ou 5 racines, et Z est de nouveau invariant par permutations circulaires d’ordre 3 ou 5. La remontée des radicaux ne fait jamais apparaître de terme qui ne serait pas invariant aux permutations d’ordre 5.
4-4) Conclusion :
Pour l’équation de degré 5, les radicaux rencontrés au fur et à mesure que l’on remonte dans l’expression des racines ne permettent jamais de construire une expression qui ne serait pas invariante pour une permutation circulaire d’ordre 5. La forme de la fonction que l’on cherche, c’est à dire une fonction algébrique, ne permet pas d’exprimer les racines des équations de degré 5, ni par conséquent les équations de degré supérieur.
Annexe
Réduction de l’expression de la racine d’une équation de degré 3 jusqu’à obtenir x1.
On s’intéressera aux équations de la forme X3 + p X + q = 0 (A1), sachant que toute équation de degré 3 peut se ramener à cette forme.
En notant x1 x2 x3 les trois racines distinctes nous avons :
p = x1 x2 + x1 x3 + x2 x3
q = – x1 x2 x3
x1 + x2 + x3 = 0
Une des racines, notons la x1, est donnée par le calcul de l’expression E suivante :

Exprimons q et q2 + 4(p/3)3 en fonction des racines :
- D’abord q :
– q = x1 x2 x3 = x12(x1+ x2 + x3)+ x1 x2 x3 = x1(x12+x1 x2 + x1 x3 + x2 x3) = x1(x12+p) = x1(4x12+4p)/4 = x1(x12 + 3(x12+4p/3) )/4 = (y1 + y2)*( y12 –y1y2 + y22) = y13 + y23, avec :

D’où :


- Maintenant q2 + 4(p/3)3 :
q2 + 4(p/3)3 = x12 (x2 x3)2 + 4(p/3)3 = x12 (p – x1 x2 – x1 x3)2 + 4(p/3)3 = x12 (p + x12)2 + 4(p/3)3 = x16 + 2px14 + p2x12 + 4(p/3)3 = x16 + 6(p/3)x14 +9 (p/3)2x12 + 4(p/3)3 = (x12 + 4p/3)*( x14 + 2 x12p/3 + (p/3)2) = (x12 + 4p/3) )*(x12 + (p/3))2= (y13 – y23)2
En effet :
(y13 – y23)2 = (y1 – y2)2*( y12 + y1y2 + y22)2 = (x12+4p/3)*(2x12/4 + 2x12/4 + 2*4p/3/4 + x12/4 – ( x12+4p/3)/4)2 = (x12+4p/3)*(x12 + p/3)2
D’où :


En reportant dans E les expressions de q et q2 + 4(p/3)3 en fonction des racines, on a :

L’expression de départ exprimée avec les termes symétriques p et q s’est finalement simplifiée pour se réduire à x1.
