
Enoncé
Le problème de la quadrature du cercle consiste à construire, à l’aide seulement d’une règle et d’un compas, un carré qui aurait la même aire que celle d’un disque donné (cf figure 1).

La démonstration repose sur le fait que la quadrature du cercle nécessiterait la construction à la règle et au compas de √π. Or les nombres qui sont construits à l’aide de la règle et du compas sont tous forcément solutions d’une équation polynomiale particulière (on dit de ces nombres qu’ils sont algébriques). La racine carrée du nombre π ne peut pas , elle, être la solution d’une telle équation, elle ne fait pas partie des nombres algébriques.
Histoire du théorème
La quadrature du cercle était l’un des trois grands problèmes de l’Antiquité, avec la trisection de l’angle et la duplication du cube, et a été celui qui a résisté le plus longtemps. Il a fallu plus de 3 millénaires pour finalement établir définitivement qu’il était insoluble, preuve apportée en 1882 par Ferdinand Lindemann.
Vers 1650 av. J.C. le scribe Ahmes rédige le papyrus de Rhind, En introduction du texte il indique qu’il s’agit de la copie d’une version précédente datant d’un pharaon qui vivait près de trois siècles auparavant. Dans les problèmes 48 et 50 de ce papyrus, le scribe étudie le rapport liant l’aire d’un disque à son diamètre en cherchant à ramener l’aire de la circonférence à celle d’un carré équivalent. Le papyrus Rhind précise ainsi une première approche de la quadrature du cercle : le carré de côté 8 unités a la même surface qu’un cercle de diamètre 9. Cette approximation se traduirait dans nos notations actuelles pour la surface d’un disque et d’un carré par : π×(9/2)2≃82. Ce qui correspond à une valeur de π = 3,16 .
Vers 430 av. J.C Le philosophe Anaxagore aurait énoncé (ou dessiné) la quadrature du cercle. C’est l’écrivain grec Plutarque qui le rapporte, mais il ne dit rien de plus sur la construction d’Anaxagore.
Archimède (Syracuse, 287 – ca 212 av. J.C.), dans son traité intitulé De la mesure du cercle démontre que le rapport du périmètre au diamètre du cercle est compris entre 3 + 10⁄71 et 3 + 10⁄70. A partir de ce résultat Archimède fournit une valeur (22/7) à la fois simple et suffisamment précise (≈ 3,143) pour les applications courantes.
Au moyen age l’approximation de π par 22/7 proposée par Archimède était considéré comme exacte, et la question de la quadrature du cercle ne se posait donc plus.
Ce n’est qu’avec la diffusion des traductions en latin des traités d’Archimède, au Moyen Âge tardif, que l’on réalisa que 22/7 n’était qu’une valeur approchée et que des penseurs, comme Nicolas de Cues, se remirent à la quadrature du cercle.
Au 16e siècle, Oronce Fine et Joseph Juste Scaliger croient avoir démontré la quadrature, mais Adrien Romain et le chevalier Errard de Bar le duc le contestent. Dans cette polémique, François Viète la décrète impossible. Le problème dépasse la sphère des mathématiques et l’on voit surgir des allusions à la quadrature dans des ouvrages ésotériques. Au 17e siècle, Grégoire de Saint-Vincent crut avoir résolu l’énigme de la quadrature et exposa ses solutions dans un ouvrage de 1 000 pages.
A partir du 18e siècle les recherches d’amateurs se multiplient. S’appuyant tantôt sur une construction mécanique, numérique ou une formule d’encadrement, les chercheurs prétendent qu’ils résolvent « exactement » le problème. Les communications sur ce sujet parvenaient en si grand nombre aux sociétés savantes que l’Académie des sciences de Paris décida dès 1775 de ne plus expertiser désormais ce genre de travaux : « L’Académie a pris, cette année, la résolution de ne plus examiner aucune solution des problèmes de la duplication du cube, de la trisection de l’angle ou de la quadrature du cercle, ni aucune machine annoncée comme un mouvement perpétuel. »
Même la démonstration d’impossibilité de Lindemann ne mit pas un terme à la profusion de prétendues solutions au problème.
Pour résoudre la quadrature du cercle, il fallait d’une part traduire la notion de « constructibilité géométrique » en une propriété algébrique, et d’autre part approfondir la compréhension que l’on avait des propriétés du nombre π.
Toute construction à la règle et au compas s’appuie sur un nombre fini de points donnés et consiste à construire en un nombre fini d’étapes de nouveaux points par intersection de deux droites, de deux cercles, ou d’une droite et d’un cercle. La traduction de ce procédé en langage algébrique s’opère par l’emploi d’un système de coordonnées, qui est l’idée fondamentale de la géométrie analytique imaginée au 17e siècle par Pierre de Fermat et René Descartes. Avec un tel système, il est possible de raisonner sur les droites et cercles par leurs équations : les points d’intersection à construire deviennent les solutions d’équations algébriques à calculer. On trouve ainsi que les segments exactement constructibles à la règle et au compas ne sont autres que les nombres obtenus à partir de l’unité par un nombre fini d’opérations arithmétiques (addition, soustraction, multiplication et division) et d’extractions de racines carrées. En particulier, un tel nombre est algébrique, c’est-à-dire solution d’une équation algébrique de degré arbitraire à coefficients rationnels. Les nombres non algébriques sont dits transcendants et ne sont pas constructibles.
C’est en 1837 que Pierre-Laurent Wantzel démontre un théorème qui permet d’exhiber la forme des équations dont sont solutions les nombres constructibles à la règle et au compas : les nombres constructibles sont les nombres rationnels et les racines de certains polynômes de degré 2n à coefficients entiers (plus précisément les éléments d’une tour d’extensions quadratiques) ; les nombres constructibles font donc partie de l’ensemble des nombres algébriques (qui sont les racines de polynômes de degré fini quelconque à coefficients entiers).
Ferdinand von Lindemann parvint finalement à démontrer en 1882 que π n’est pas algébrique, autrement dit qu’il est transcendant ; qu’en conséquence, on ne peut construire à la règle et au compas un segment de longueur π et donc, que la quadrature du cercle est impossible.
Lindemann s’appuya pour cela sur un résultat du mathématicien français Charles Hermite. Ce dernier avait démontré en 1873 que le nombre e est transcendant
Boîte à outils
1. Points constructibles :
Qu’entend-on par construire un point, une droite, un cercle, un carré, un nombre ? Le concept mathématique de « construction » peut être fondé sur une définition par récurrence :
– le point O et le point I situé à une distance unité de 0, sont des points constructibles. Ils constituent les 2 points de départ de la construction.
– une droite est constructible si et seulement si elle passe par deux points constructibles.
– un cercle est constructible si et seulement si son centre est un point constructible et son rayon est la distance entre deux points constructibles.
– tout point du plan est un point constructible si il est intersection de deux ensembles de points constructibles (droite ou cercle)
Autrement dit, si E désigne un ensemble fini de points du plan, on considère l’ensemble P des droites joignant deux de ces points, ainsi que des cercles centrés en l’un de ces points et de rayon la distance entre deux de ces points. On appelle « points construits à partir de E à la règle et au compas » l’ensemble des intersections des éléments de P.
Un point M du plan est alors dit « constructible » s’il existe une suite de points M1, M2, … , Mn avec Mn = M telle que pour tout i < n, Mi soit un point construit à partir de l’ensemble {O, I,M1, . . . ,Mi−1}.
Un réel x est dit « constructible » s’il est l’abscisse ou l’ordonnée d’un point constructible. De manière équivalente, x est constructible s’il est l’abscisse d’un point constructible de l’axe (OI). En effet, si M est constructible, alors le cercle de centre O passant par l’ordonnée de M coupe l’axe des abscisses en un point qui devient constructible. L’axe OI contient l’ensemble des coordonnées des points constructibles (abscisses et ordonnées).
2. Exemples de constructions :
– Construction d’un repère orthonormé O, I, J à partir des points de départ O et I: pour cela on construit le point K symétrique de I par rapport à O (intersection de la droite (OI) et du cercle C de centre O et de rayon OI).

Ensuite, à partir des intersections A et B des 2 cercles de même rayon, l’un centré sur O l’autre sur I, l’axe (OJ) comme médiatrice du segment [IK].

Le point J est alors intersection de cet axe avec le premier cercle de rayon OI déjà construit.

– Construction d’une droite parallèle à une droite (AB) et passant par un point C : On construit le quatrième point D du parallélogramme ABCD en traçant un arc de cercle de centre C et de rayon AB, et un arc de cercle de centre B et de rayon AC.

– Si a et b sont deux nombres constructibles, il en est de même pour leur somme, ou de leur différence :

– Si a et b sont 2 nombres constructibles, il en est de même pour leur produit ou leur rapport (or cas du point 0 évidemment).
Nous avons vu précédemment comment construire une parallèle à une droite donnée passant par un point donné. Pour l’obtention du produit ab, on construit le quatrième sommet C du parallélogramme de sommets A(0, a), J (0, 1) et B(b, 0). Grâce au théorème de Thales, ab est donné par l’intersection de la droite AC avec l’axe OI. Pour l’obtention du rapport a/b, on construit le quatrième sommet C du parallélogramme de sommets A(0, a), B (0, b) et I(1, 0). Grâce au théorème de Thales, a/b est donné par l’intersection de la droite AC avec l’axe OI.

– Construction de la racine carrée d’un nombre a. La figure suivante montre comment le point M construit à partir du cercle C de diamètre a + 1 et de centre (a-1)/2 a pour ordonnée √a. En effet comme M est sur le cercle C, le triangle qu’il forme avec les points K d’abscisse −1 et A d’abscisse a est rectangle en M. Les triangles AOM et KOM sont donc semblable, et l’on obtient :
OK / OM = OM / OA, soit OM2 = a

On voit qu’avec les procédés présentés on peut contruire, à partir de nombres rationnels, des nombres assez élaborés, par exemple de la forme :

3. La croissance de (p-1)! est supérieure à celle de xp :
Pour tout x on a, à partir d’un certain rang, c’est-à-dire pour tout entier supérieur à p0 : (p-1)! > xp
Démonstration :
Le résultat est trivial pour x ≤ 1, on s’intéresse donc à x > 1 et on note h = arrondi de x à sa valeur supérieure + 1 ce qui garantit h > x. Prenons p0 = 2*h2+ 1.
(p0-1)! = (p0-1)*(p0-1-1) … (p0-1 – (p0-1)/2 )*( p0-1 – (p0-1)/2-1) … *3*2*1
Chacun des termes (p0 – k) avec k ≤ (p0-1)/2 est ≥ (p0-1)/2 = h2, et il y en a (p0-1)/2 + 1= (p0+1)/2
Nous avons donc :
(p0-1)! ≥ (h2) (p0+1)/2* ( p0-1 – (p0-1)/2-1) … *3*2*1 ≥ hp0+1*3*2*1 > xp0
Et pour tout p > p0 : p = p0 + i avec i ≥ 1 :
(p-1)! = (p-1)*(p-2) … (p – (i-1))*(p-i)*(p0-1) ! > (p-1)*(p-2) … (p – (i-1))*(p-i) xp0
Dans ce produit tous les termes (p-1) jusqu’à (p–i) sont ≥ p0 et p0 lui-même est > x , donc :
(p-1)! > xi*xp0 = xp
4. Les polynomes symétriques :
4-1 Définition : Un polynôme Q(a1, …, an) en n indéterminées est dit symétrique si pour toute permutation s de l’ensemble d’indices {1, …, n}, l’égalité suivante est vérifiée :
Q(a1, …, an) = Q(as(1), …, as(n))
Par exemple :
- Pour n = 2 : le polynôme a1 + a2 est symétrique alors que le polynôme a1 + a22 ne l’est pas.
- Pour n = 3 : les polynômes a1a2a3 ou (a1 – a2)2(a1 – a3)2(a2 – a3)2 sont symétriques.
Polynômes symétriques élémentaires : On appelle polynôme symétrique élémentaire en n variables les polynômes qui sont la somme de tous les produits de k d’entre ces n variables. Nous notons PSk(a1, …, an) ces polynômes. Exemples de ce type de polynômes :
- PS2(a1, …, an) = Σaiaj avec i et j compris entre 1 et n, et i < j.
- Pour n = 3 : PS2(a1, a2, a3) = a1 a2 + a1 a3 + a2 a3
- Pour n = 2 : PS2(a1, a2) = a1 a2
- PS3(a1, …, an) = Σ ai aj ak avec i, j, k compris entre 1 et n, et i < j < k.
- Pour n = 3 : PS3(a1, a2, a3) = a1 a2 a3
- Pour n = 4 : PS3(a1, a2, a3, a4) = a1 a2 a3 + a1 a2 a4 + a1 a3 a4 + a2 a3 a4
- Pour n = 4 : PS1(a1, a2, a3, a4) = a1 + a2 + a3 + a4
4-2 Propriété des polynomes symétriques :
Tout polynôme symétrique peut être exprimé comme une combinaison algébrique de polynômes symétriques élémentaires, et plus précisément sous la forme d’un polynôme dont les variables sont des polynômes symétriques élémentaires. Ce résultat joue un rôle clé pour faire aboutir les calculs détaillés en annexe.
Par exemple, considérons le polynôme symétrique Q suivant qui n’est pas élémentaire :
Q(a1, a2, a3) = (a1 + a2)2(a1 + a3)2(a2 + a3)2
= ((a1 + a2)(a1 + a3)(a2 + a3))2
= ((a12 + a1a3 + a2a1 + a2a3)(a2 + a3))2 = (a2a12 + a2a1a3 + a22a1 + a22a3 + a3 a12 + a1a32 + a3a2a1 + a2a32)2
On remarque que : a2a12 + a22a1 + a22a3 + a3 a12 + a1a32 + a2a32 = PS1PS2 -3PS3
D’où
Q(a1, a2, a3) = (2PS3 + PS1PS2 -3PS3)2 = (PS1PS2 -PS3)2 = (PS1PS2)2 – 2 PS1PS2PS3 + PS32
Démonstration :
Nous avons tout d’abord besoin d’introduire la notion de monômes d’un polynôme. Le développement d’un polynôme Q(a1, a2, a3 … an), c’est-à-dire la suppression de toutes les factorisations, conduit à l’exprimer sous la forme d’une somme de termes de la forme A*a1m1 a2m2 a3m3 … anmn. où A est un coefficient. Ces termes sont appelés monômes. Par exemple :
Q(a1, a2, a3) = a12 (a1 + a2) – 5(a1 + 2a3)2 = a13 + a12a2 – 5 a12 -10 a1a3 – 20a32
Les termes : a13, a12a2, -5a12, -10a1a3, et -20a32 sont les monômes de Q.
L’ensemble des exposants (m1, m2, m3 …, mn) des monômes A*a1m1 a2m2 a3m3 … anmn peut être ordonné suivant un ordre appelé l’ordre lexicographique. On écrira :
a1m1 a2m2 a3m3 … anmn > a1p1 a2p2 a3p3 … anpn si pour le premier i tel que mi ≠ pi, on a mi > pi. Par exemple, avec le polynôme Q précédent les exposants des monômes sont (3,0,0) pour a13, (2,1,0) pour a12a2 , (2,0,0) pour a12, (1,0,1) pour a1a3, et (0,0,2) pour a32. On écrira donc :
a13 > a12a2 > a12 > a1a3 > a32
Nous pouvons maintenant passer à la démonstration de la décomposition d’un polynôme symétrique en polynômes symétriques élémentaires.
Soit P(a1, a2, a3 … an) un polynôme symétrique non nul, et A*a1m1 a2m2 a3m3 … anmn son monôme le plus grand (au sens de l’ordre lexico graphique défini auparavant. Procédons par récurrence sur les ordres des monômes de P. Pour cela supposons que la propriété de décomposition d’un polynôme symétrique en polynômes symétriques élémentaires soit vraie pour tout polynôme symétrique dont le monôme le plus grand est strictement inférieur à a1m1 a2m2 a3m3 … anmn. Alors nous allons voir qu’elle devient aussi vraie pour A*a1m1 a2m2 a3m3 … anmn.
Puisque P est symétrique, il contient, affectés d’un même coefficient non nul, tous les monômes obtenus en permutant les exposants dans le monôme le plus grand A*a1m1 a2m2 a3m3 … anmn.
Par exemple, pour n = 4, si P est symétrique et contient le monômes 5a1 a22 a33 a44 alors il contient alors forcément 5a2 a12a33 a44 , ou 5a2 a32 a13 a44 ou … 5a14 a23 a32 a31 et son ordre le plus grand est au moins (4,3,2,1).
D’une façon générale si le polynôme est symétrique et contient un monôme de la forme A*a1p1 a2p2 a3p3 … anpn alors il contiendra un monôme de la forme A*a1m1 a2m2 a3m3 … anmn construit à partir de a1p1 a2p2 a3p3 … anpn en permutant les variables de ce monôme pour mettre le plus grand exposant sur a1 puis le suivant sur a2, puis etc. Cela permet d’affirmer que le monôme le plus grand A*a1m1 a2m2 a3m3 … anmn vérifie :
m1 > m2 > m3 … > mn
Posons ri = mi – mi+1 pour 1 ≤ i < n, et rn = mn. Les ri sont tous positifs ou nuls.
Considérons le polynôme symétrique R(a1, a2, a3 … an) = A*PS1r1* PS2r2* PS3r3* … * PSnrn
Notons bien que le monôme maximal de PS1 est a1, le monôme maximal de PS2 est a1a2, le monôme maximal de PS3 est a1a2a3, …etc, et le monôme maximal de PSn est a1a2a3, … an. Etudions les exposants de a1, a2, a3 … an dans le monôme d’ordre maximal de R :
- L’exposant de a1 est donné par : a1r1a1r2a1r3 … a1rm = a1m1–m2a1m2–m3a1m3–m4 … a1mn-1–mna1mm = a1m1
- L’exposant de a2 est donné par : a2r2a2r3 … a2rm = a2m2–m3a2m3–m4 … a2rm = a2m2
- L’exposant de a3 est donné par : a3r3 … a3rm = a3m3–m4 … a3rm = a3m3
- …
- L’exposant de an est donné par : anrm
P et R ont donc le même monôme maximal et donc le polynôme symétrique P – R est nul ou a un monôme maximal strictement inférieur à celui de P.
Si P – R est nul, alors cela signifie que P = R : il est donc bien construit à partir des polynômes symétriques élémentaires.
Si P – R n’est pas nul, alors le polynôme W = P – R est un polynôme symétrique d’ordre maximal strictement inférieur à a1m1 a2m2 a3m3 … anmn , il est donc par hypothèse de la récurrence construit à partir des polynômes symétriques élémentaires, et donc P = W + R l’est aussi.
Ce raisonnement, appliqué de proche en proche à la succession ordonnée des monômes maximaux des polynômes symétriques permet de conclure qu’un polynôme symétrique peut toujours être décomposé en polynômes symétriques élémentaires.
Les éléments clés de la démonstration
1ère étape :
Nous montrerons que les nombres qui sont construits à l’aide de la règle et du compas sont forcément solutions d’une équation polynomiale à coefficients rationnels. C’est à dire une équation de la forme :
a0 + a1x + a2x2 + … akxk + … + am xm = 0, avec m entier et qi nombres rationnels.
2ème étape :
Dans un premier temps nous montrerons que π ne peut pas être solution d’une équation polynomiale à coefficients rationnels. C’est dans cette partie que réside l’essentiel de la difficulté. La démarche qui va permettre de le démontrer se décompose en 3 phases :
1- Nous faisons l’hypothèse que π est solution d’une équation polynomiale à coefficients rationnels. Cela signifie qu’il existe un polynôme noté T(x) tel que T(π) = 0 . En travaillant un peu ce polynôme nous le ramènerons à un polynôme P(x) n’ayant que des coefficients en nombre entiers, et tel que P(i π) = 0 , avec i imaginaire racine de -1.
2- A partir des racines de ce polynôme à coefficients entiers nous allons construire un autre polynôme, plus complexe, de degré plus élevé, qui sera noté F(x). Ce polynôme permet de créer un nombre J qui aurait d’étranges propriétés.
3- Les propriétés sont si étranges qu’elles donnent des résultats contradictoires. J est forcément supérieur à nombre J1 et en même temps J est forcément inférieur à un nombre J2 tout cela avec J2 supérieur à J1. Ces résultats contradictoires prouvent que ce polynôme ne peut pas exister, et que donc l’hypothèse de départ qui dit que π est constructible (donc algébrique) est fausse. En fait π est transcendant.
Il est alors très simple de montrer que π étant non constructible et même transcendant, √π l’est aussi forcément. Un carré d’aire identique à un cercle de rayon 1, c’est à dire un carré d’aire π et donc de côté √π n’est pas constructible à la règle et au compas.
Démonstration de l’impossibilité de la quadrature du cercle
Etape 1: il s’agit de montrer que si un nombre est constructible alors il est solution d’une équation polynomiale à coefficients rationnels.
Soit M un point constructible. Il existe une suite de points du plan M1, M2, … , Mn avec Mn = M telle que pour tout i ≤ n, Mi soit un point construit à partir de l’ensemble des points {O, I, M1, . . , Mi−1}.
A chaque point Mi on va associer l’ensemble Ki de tous les nombres réels que l’on peut former par addition, soustraction, multiplication, division, à partir des coordonnées des points Mi, Mi-1, … M2, M1, I, O. Par exemple, à partir des points de départ O et I on peut générer de cette façon l’ensemble K0 = Q ensemble des nombres rationnels. A la succession des points Mi est ainsi associé une succession d’ensembles Ki telle que Ki ⊆ Ki+1.
Les coordonnées de M = Mn sont par définition dans Kn.
Tout point Mi est construit à partir des points précédents M1,M2, … , Mi-1, c’est-à-dire qu’il est l’intersection soit :
- de 2 droites passant chacune par 2 de ces Mi-1 points,
- d’une droite passant par 2 de ces Mi-1 points et d’un cercle centré en l’un de ces Mi-1 points et de rayon la distance entre deux de ces Mi-1 points.
- de 2 cercles centrés chacun en l’un de ces Mi-1 points et ayant pour rayon la distance entre deux de ces Mi-1 points.
Lemme 1: Les coordonnées de Mi (xi, yi) étant dans Ki, ces coordonnées sont soit déjà dans Ki-1, soit solutions d’une équation polynomiale de degré 2 à coefficients dans Ki-1. En effet :
1) Cas de l’intersection de 2 droites : on pose P1(a1, b1) et R1(c1, d1) les points définissant la première droite, et P2(a2, b2) et R2(c2, d2) les points définissant la seconde. Les coordonnées a, b, c, d sont dans Ki-1.
L’équation de la première droite est : Y = (d1 – b1) / (c1 – a1) (X – a1) + b1
L’équation de la seconde droite est : Y = (d2 – b2) / (c2 – a2) (X – a2) + b2
Le point d’intersection entre les 2 droites est solution d’un système de 2 équations à 2 inconnues, dont les coefficients sont dans Ki-1. Le résultat est issu d’additions, soustractions, multiplications sur ces coefficients, il sera forcément dans Ki-1.
On est dans le cas où les coordonnées de Mi (l’abscisse comme l’ordonnée) sont déjà dans Ki-1, c’est-à-dire que Ki = Ki-1.
2) Cas de l’intersection d’une droite et d’un cercle : On pose P1(a1, b1) et R1(c1, d1) les 2 points définissant la droite, P2(a2, b2) le centre du cercle, et r son rayon. a1, b1, c1, d1, a2, b2, et r sont donc dans Ki-1.
L’équation de la droite est. : Y = (d1 – b1) / (c1 – a1) (X – a1) + b1. (1)
L’équation du cercle est : (X – a2)2 + (Y – b2)2 = r. (2)
En remplaçant Y par (d1 – b1) / (c1 – a1) (X – a1) + b1 dans l’équation (2) du cercle, on en déduit que X est solution de (X – a2)2 + [(X – a1)(d1 – b1) / (c1 – a1) + b1 – b2]2 = r. Donc X est solution d’une équation de degré 2 dont les coefficients sont dans Ki-1. X s’écrira sous la forme X = Ax + Bx√D avec Ax, Bx, et D appartenant à Ki-1. De même Y est solution d’une équation de degré 2, et en vertu de (1) Y s’écrit sous une forme identique à X à savoir Y = Ay + By√D avec Ay, By, et D appartenant à Ki-1. On notera que l’extension en √D est la même pour X et Y.
3) Cas de l’intersection de 2 cercles : On pose P1(a1, b1), P2(a2, b2) les centres des 2 cercles, et r1respectivement r2 les rayons. a1, b1, a2, b2, r1, r2, sont dans Ki-1.
L’équation du premier cercle est. : (X – a1)2 + (Y – b1)2 = r1 (1)
L’équation du second cercle est : (X – a2)2 + (Y – b2)2 = r2. (2)
En soustrayant (2) à (1), le système d’équation équivalent s’écrit :
(X – a1)2 – (X – a2)2 + (Y – b1)2 – (Y – b2)2 = r1 – r2
(X – a2)2 + (Y – b2)2 = r2.
⟺
-2X(a1 – a2) -2Y(b1 – b2) + a12 – a22 + b12 – b22 = r1 – r2
(X – a2)2 + (Y – b2)2 = r2.
On retrouve un système d’équation du même type que lors de l’intersection d’une droite et d’un cercle. La conclusion sera la même : X et Y sont chacun solution d’une équation de degré 2 dont les coefficients sont dans Ki-1 et X et Y s’écrivent sous la même forme Ax + Bx√D pour X et Ay + By√D pour Y avec Ax, Bx, D, Ayet By appartenant à Ki-1.
Le lemme 1 est démontré.
La conséquence du lemme 1 est que pour tout x de Ki, soit x appartient à Ki-1 (si Ki = Ki-1 c’est-à-dire que Mi est construit par l’intersection de 2 droites), soit x s’exprime sous la forme x = x1 +x2√∆i avec x1, x2 et ∆i appartenant à Ki-1. En effet si Mi est construit comme l’intersection d’une droite et d’un cercle, ou de 2 cercles, alors les coordonnées de Mi (l’abscisse, comme l’ordonnée) auront tous les deux la même forme avec une extension en √∆i. Donc tous les nombres générés à partir des coordonnées de Mi soit par addition, soustraction, multiplication, division auront aussi cette forme car :
- (x1 + x2√∆i) +/- (y1 + y2√∆i) = (x1 + y1) +/- (x2 + y2)√∆i)
- (x1 + x2√∆i) * (y1 + y2√∆i) = [(x1*y1 + x2*y2∆i)+ (x1*y2 + x2*y1)√∆i]
- (x1 + x2√∆i) / (y1 + y2√∆i) = (x1 + x2√∆i) ((y1 – y2√∆i) / (y1 + y2√∆i) ((y1 – y2√∆i) = (x1 + x2√∆i) ((y1– y2√∆i) / (y12 – y22∆i) = [(x1*y1 – x2*y2 ∆i) + (-x1*y2 + x2*y1)√∆i] / (y12 – y22∆i)
Lemme 2: soit Ki l’ensemble associé à Mi et Ki-1 associé à Mi-1. Si x est solution d’une équation polynomiale de degré p à coefficients dans Ki, alors x est solution d’une équation polynomiale de degré p ou 2p à coefficients dans Ki-1.
Démonstration : nous supposons donc que x est solution de l’équation :
P(X) = a1 + a2 X + a3X2 +… + ap-1 Xp-1 + ap Xp = 0, avec a1, a2, … , ap-1 , ap coefficients dans Ki. et ap non nul.
Si Ki = Ki-1 nous sommes dans le cas trivial où le lemme est vrai et l’équation a pour degré p.
Si Ki ≠ Ki-1 tous les ai s’écrivent sous la forme : ai = ai1 + bi2 √∆i avec ai1, bi2, et ∆i ϵ Ki-1. En remplaçant les ai par ai1 + bi2 √∆i dans l’équation P(X) = 0 on obtient : P1(X) + P2(X) *√∆i = 0 avec P1(X) et P2(X) deux polynômes de degré p (au moins pour l’un d’entre eux) et à coefficients dans Ki-1. D’où :
P1(X)2 – P2(X)2∆i = 0
x est solution de ce polynôme dont tous les coefficients appartiennent à Ki-1 et qui est de degré 2p (le terme de degré 2p s’écrit ap12 – bp12∆i qui ne peut s’annuler que si ap1 = bp1 √∆i puisque ap est non nul, et ap1 = bp1 √∆i signifierait que √∆i appartient à Ki-1 et que donc Ki = Ki-1 ce qui ne correspond pas à l’hypothèse).
Revenons maintenant au point M = Mn, et à la suite des points M1, M2, … , Mn-1 qui ont permis de le construire. A cette succession de points est associée la succession des ensembles K0, K1, K2, … , Kn-1.
D’après le lemme 1, comme le point M est constructible, ses coordonnées sont soit dans Mn-1, soit solutions d’une équation de degré 2 à coefficients dans Mn-1.
Par le lemme 2 on en déduit que ses coordonnées sont soit dans Mn-2 soit solutions d’une équation de degré 2 ou 2*2 à coefficients dans Mn-2, puis de nouveau par le lemme 2 ses coordonnées sont soit dans Mn-3 soit solutions d’une équation de degré 2 ou 2*2 ou 23 à coefficients dans Mn-3 et ainsi de suite juste qu’à descendre par le lemme 2 au point M1 puis au point I qui correspond à K0 = Q = ensemble des rationnels. Cela qui permet de conclure que les coordonnées de M = Mn sont solutions d’une équation polynomiale de degré < 2n à coefficients dans Q.
Etape 2: il s’agit maintenant de démontrer que π (ou sa racine) n’est pas solution d’une équation polynomiale à coefficients rationnels
La démarche pour ce faire se décompose en 3 phases :
1- Nous faisons l’hypothèse que π est solution d’une équation polynomiale à coefficients rationnels. Cela signifie qu’il existe un polynôme noté T(x) tel que T(π) = 0 . En travaillant un peu ce polynôme nous le ramènerons à un polynôme P(x) n’ayant que des coefficients en nombre entiers, et tel que P(i π) = 0 , avec i imaginaire racine de -1.
2- A partir des racines de ce polynôme à coefficients entiers nous allons construire un autre polynôme, plus complexe, de degré plus élevé, qui sera noté F(x). Ce polynôme permet de créer un nombre J qui aurait d’étranges propriétés.
3- Les propriétés sont si étranges qu’elles donnent des résultats contradictoires. J est forcément supérieur à nombre J1 et en même temps J est forcément inférieur à un nombre J2 tout cela avec J2 supérieur à J1. Ces résultats contradictoires prouvent que ce polynôme ne peut pas exister, et que donc l’hypothèse de la phase 1 est fausse.
Commençons par la première phase de la démarche :
Hypothèse : π est solution d’une équation polynomiale à coefficients rationnels. On note T(x) ce polynôme, supposé de degré m.
T(x) = t0 + t1x + t2x2 + … tkxk + … + tmxm , et on a T(π) = 0
Les tk sont des coefficients rationnels, donc de la forme pk/bk avec pk et bk des entiers relatifs.
π sera alors aussi solution d’une équation polynomiale à coefficients entiers ; il suffit pour l’obtenir de multiplier l’équation de départ par le produit des dénominateurs des coefficients, c’est-à-dire le produit des bk. On note T1(X) ce polynôme à coefficients entier, et ck les coefficients entiers de ce polynôme.
T1(x) = c0 + c1x + c2x2 + … ckxk + … + cm xm , et on a T1(π) = 0
Le nombre (i π) pourra lui aussi être solution d’une équation polynomiale à coefficients entier. Pour la construire on part du polynôme T1(x) dans lequel on réarrange chaque monome ck xk sous la forme ck/(i) k * (i x)k.
Le nouveau polynôme T2(x) avec ses coefficients de la forme ck/(i) k vérifie T2(i π) = 0
Comme 1/(i) k = 1 ou -1 ou i ou –i, les coefficients de T2(x) sont de la forme ck ou – ck ou i ck ou –i ck avec ck nombre entier. Réarrangeons maintenant T2(x) en séparant d’un côté les termes à coefficient purement entier (les +/- ck), et de l’autre ceux qui sont le produit de i par un entier (les +/- i ck) :
T2(x) = T2r(x) + i T2im(x) où cette fois les coefficients de T2r et T2im sont tous des entiers purs.
On considère le polynôme P(X) défini par :

Le premier terme de ce produit est le polynôme T2(x), donc P(i π) = 0
Et l’on a par ailleurs, en développant le produit : P(x) = [T2r(x)]2 + [T2im(x)]2 qui est un polynôme à coefficients purement entiers.
On dispose donc maintenant, comme annoncé pour l’étape 1, d’un polynôme P(x) à coefficients purement entiers et tel que P(i π) = 0
Nous notons pour la suite d le degré de ce polynôme, et son développement :
P(x) = s0 + s1x + s2x2 + … skxk + … + sd xd avec les sk entiers
Ce polynôme possède d racines, dont une au moins vaut (i π). Nous noterons q1, q2, q3, … qd ces d racines, et considérerons que q1 = i π
Passons à la deuxième phase de la démarche :
Construction à partir de P(x) d’un polynôme étrange.
Nous partons du polynôme P(x) = s0 + s1x + s2x2 + … skxk + … + sd xd avec les sk entiers. Nous savons que l’on a P(i π) = 0, et les racines de ce polynôme sont notées qi.
On sait qu’avec la fonction exponentielle e, e i π = -1 donc 1 + eq1 = 0 et donc (1 + eq1) (1 + eq2) ( 1 + eq3) …(1 + eqd) = 0
Développons ce produit, et pour faciliter la compréhension faisons le pour le cas particulier où d = 5
(1 + eq1) (1 + eq2) (1 + eq3) (1 + eq4) (1 + eq5) =
1 + eq1 + eq2 + eq3 + eq4 + eq5 (c’est-à-dire le produit des cinq 1 plus les produits de un terme eqk avec quatre 1, il y en a 5 au total)
+ toutes les combinaisons eqk+qj (c’est-à-dire les produits de 2 termes eqk avec trois 1, il y en a 10 au total)
+ toutes les combinaisons eqk+qi+qj (c’est-à-dire les produits de 3 termes eqk avec deux 1, il y en a 10 au total)
+ toutes les combinaisons eqk+qi+qj+qp (c’est-à-dire les produits de 4 termes eqk avec un 1, il y en a 5 au total)
+ eq1+q2+q3+q4+q5
En final le produit développé est la somme de tous les termes possibles de la forme eε1.q1+ε2.q2+ε3.q3+ε4.q4+ε5.q5 avec ε1, ε2, ε3, ε4, ε5 prenant les valeurs 0 ou 1 indépendamment les uns des autres, ce qui donne 25 possibilités et au total la somme est bien composée de 25 termes, soit 32 termes.
Parmi ces 32 termes il y ceux pour lesquels ε1.q1 + ε2.q2 + ε3.q3 + ε4.q4 + ε5.q5 = 0 et qui donnent donc des 1 avec l’exponentiel (il y en a au moins un c’est le terme q1), et ceux pour lesquels l’exposant est non nul et qui peuvent s’écrire, avec l’exponentiel : eak avec ak non nul.
Revenons maintenant à notre produit de départ :
(1 + eq1) (1 + eq2) (1 + eq3) (1 + eq4) (1 + eq5) = 0, et d’après ce qui précède cette équation peut être ré-écrite en :
N + ea1 + ea2 + ea3 + ea4 + …. + + ean-1 + ean = 0, avec n = nombre de termes à exposant non nul et N = nombre total de termes à exposant nul = nombre total de termes moins ceux à exposant non nul = 25 – n ≥ 1 car nous savons que le terme eq1 a un exposant nul.
D’où l’équation dans sa forme finale : 25 – n + ea1 + ea2 + ea3 + ea4 + …. + ean-1 + ean = 0
Par le même raisonnement, quel que soit le degré d de P(X) on construira l’équation
2d – n + ea1 + ea2 + ea3 + ea4 + …. + ean-1 + ean = 0. (2-1)
avec ai non nul = ε1.q1 + ε2.q2 + ε3.q3 + … + εk. qk + … + εd-1.qd-1 + εd.qd , les εk valant 0 ou 1, et avec (2d – n) ≥1. Notons au passage que parmi les ai il y a q1, q2, … qd, c’est à dire les d racine du polynôme P(X). Sans que cela restreigne la généralité de la démonstration nous pouvons convenir de nommer ai = q1, a2 = q2, a3 = q3, … ad = qd, puis ad+1 = q1 + q2, ad+2 = q1 + q3, … , ad+j = une première somme de j parmi les d racines, … , an = q1 + q2 + q3 + … + qd
Nous voilà maintenant enfin en mesure de définir le polynôme étrange f(x). Ce polynôme s’écrit, par définition :
f(x) = sdnp xp-1 (x – a1)p (x – a2)p … (x – an)p avec p nombre premier qui sera judicieusement choisi plus tard.
Le degré m de f(x) est donné par: m = p – 1 + np = p(n + 1) – 1
Troisième et dernière phase: le polynôme f(x) ne peut pas exister
f(x) a été spécialement construit pour que ses dérivées successives en 0, notées f(j)(0), soient toujours nulles, jusqu’à la dérivée (p-2)ième, la (p-1)ième et les suivantes ne le sont pas. De même ses dérivées successives en ai sont toujours nulles, jusqu’à la dérivée (p-1)ième, la pième et les suivantes ne le sont pas.
Plus précisément, nous avons (le détail des laborieuses démonstrations qui le prouvent est donné en annexe) :
- (3-1) Pour k < p-1, f(k)(0) = 0
- (3-2) Pour k = p-1, f(p-1)(0) est entier, multiple de (p-1)!
- (3-3) Pour k > p-1, f(k)(0) est entier, multiple de p!
Et aussi, pour tout ai :
- (3-4) Pour k < p, f(k)(ai) = 0
- (3-5) Pour k ≥ p, Σ i=1i=n f(k)(ai) est entier, multiple de p!
Ayant ces résultats en tête, calculons J défini par l’équation (3-0) suivante :

Et pour cela commençons par examiner le terme générique = intégrale de 0 à ai de eai–x f(x) dx, en effectuant une première intégration par partie :

Appliquons le même calcul d’intégration par partie, cette fois à f(1)(x), on obtiendra :

Et ainsi de suite pour f(2)(x), f(3)(x), etc … Au rang k on aura :

Et au rang m, sachant que f(m+1)(x) = 0 puisque f(x) est un polynôme de degré m :

Et au rang m+1

En faisant maintenant la somme de toutes les intégrations par partie que l’on vient de calculer, on obtient :

Ce qui permet de ré-écrire J sous la forme :

Souvenons nous de l’équation (2-1) vue à la phase 2 : 2d – n + ea1 + ea2 + ea3 + ea4 + …. + ean-1 + ean = 0. Nous avons donc

Et rappelons nous des résultats (3-1), (3-2), (3-3) qui donnent la valeur de f(k)(0) selon que k est inférieur ou supérieur à (p-1), ainsi que de (3-4), (3-5) qui donnent la valeur de f(k)(ai) en fonction de k. Il vient alors :

Cette dernière égalité peur être mise sous la forme : J = N1(p -1)! + N2p! , avec N1 et N2 nombres entiers relatifs, c’est à dire :
J = (p -1)! (N1+ N2p)
Les calculs menés en annexe montrent que f(p-1)(0) = (-sd )np (p-1)! ( a1a2 … an )p qui est non nul, et comme (n – 2d) est aussi non nul, l’entier relatif N1 qui est le produit de ces 2 termes sera non nul.
Comme p peut être choisi arbitrairement, on prendra p premier > | sdna1a2 … an |, | x | signifiant valeur absolue de x. Comme p est un nombre premier l’application du petit théorème de Fermat nous dit que le reste de la division de (| sdna1a2 … an |)p par p = | sdna1a2 … an | qui est un entier non nul, strictement inférieur à p. Ce choix de p permet donc de garantir que (sdna1a2 … an)p n’est pas divisible par p. Si de plus on choisit aussi p > (2d – n) alors p ne divisera pas non plus (2d – n) et donc p ne pourra pas diviser N1. Avec ce choix de p on aura toujours N1 + p N2 ≠ 0 puisque sinon cela impliquerait que p divise N1. Donc N1 + pN2 sera un entier non nul et donc | N1 + pN2 | ≥ 1.
Avec ce choix de p on aura aussi toujours: | J | = | (p-1)! ( N1 + pN2) | ≥ (p-1)! | N1 + pN2 | ≥ (p-1)! (3-6)
Conclusion : pour tout p premier > (2d – n) | sdna1a2 … an | on aura | J | ≥ (p-1)! . Cela veut dire qu’à partir d’un certain rang, pour tout nombre premier p on aura | J | ≥ (p-1)!, avec J construit conformément à l’équation (3-0) à partir du polynôme f(x) de degré p. Mais par ailleurs, avec cette même valeur de p on pourra écrire :

Et en repartant de la définition de f(x), à savoir f(x) = sdnp xp-1 (x – a1)p (x – a2)p … (x – an)p, nous aurons pour tout x de l’intervalle [0 – ai] :
Si ai ≥ 0 : |x – ai| = (ai – x) ≤ ai = |ai|
Si ai < 0 : |x – ai| = (-ai – (-x)) ≤ –ai = |ai|
Dans les 2 cas |x – ai| ≤ |ai|, ce qui permet d’écrire pour tout x de l’intervalle [0 – ai] : |f(x)| ≤ |sdnp| |aip-1| |a1p| |a2p| … |aip| … |anp|
Par ailleurs, eai – x ≤ e|ai – x| ≤ e|ai| et donc pour tout x de cet intervalle :
|eai – x f(x)| ≤ e|ai| |f(x)| e|ai| |sdnp| |aip-1| |a1p| |a2p| … |aip| … |anp|
D’où :

Avec c0 = |sdn| |a1| |a2| … |ai| … |an| qui est une constante qui ne dépend pas de p. De ce résultat on tire :

et en prenant h entier > c1 d, on pourra écrire | J | ≤ c1p d ≤ c1pd dp-1 ≤ hp (3-7) avec h entier qui ne dépend pas de p.
Or, comme on l’a vu au §3 de la boîte à outils, la fonction (p-1)! croît plus vite que xp quelque soit x, et à partir d’un certain rang p0, tous les p vérifient (p-1)! > xp (3-8)
Cela signifie qu’en prenant p suffisamment grand on aura :
| J | ≤ hp. (3-7)
(p-1)! > hp. (3-8)
| J |≥ (p-1)! (3-6)
Soit | J | < | J |
L’existence de f(x) aboutit à une contradiction. f(x) ne peut pas exister, et donc le polynôme P(X) dont π est racine qui sert à le construire n’existe pas non plus. π ne peut pas être la racine d’un polynôme à coefficients entiers, on dit π est un nombre transcendant. Comme il n’est pas racine d’un tel polynôme il ne peut pas être constructible.
Sachant que π n’est pas constructible, il reste à démontrer que √π ne l’est pas non plus Démonstration : Faisons l’hypothèse que √π soit constructible, alors le produit : √π √π = π le serait (cf Boîte à outils §2 qui montre comment construire le produit de 2 nombres constructibles). La contradiction prouve que √π n’est pas constructible. CQFD.
√π est d’ailleurs aussi transcendant, il ne peut pas être la racine d’un polynôme à coefficient entier. Cela se démontre aisément par l’absurde : si √π est la racine d’un tel polynôme alors à partir du polynôme R(X) dont √π est la racine on peut facilement construire un polynôme dont π sera la racine, en séparant dans R(X) les monômes d’exposants paires et celui à valeur constante (qui formeront R1(X)) et les monômes d’exposants impaires (qui formeront XR2(X) avec R2(X) ne contenant que des exposants paires).
R(√π) = 0 = R1(√π) + √πR2(√π) = S1(π) + √πS2(π), et donc π racine du polynôme S12(X) – XS22(X)
Annexe
Démonstration des relations (3-1) à (3-5)
A-1) Calcul des dérivées d’ordre j, f(j)(x) :
On note Z le produit (x – a1)p(x – a2)p … (x – an)p
f (1)(x) = sdnp [(p – 1)xp-2 Z + xp-1 Z(1)]
f (2)(x) = sdnp [(p – 1)(p – 2)xp-3 Z + 2(p – 1)xp-2 Z(1) + xp-1 Z(2) ]
f (3)(x) = sdnp [(p-1)(p-2)(p-3)xp-4 Z + 2(p – 1)(p – 2)xp-3 Z(1) + (p – 1)xp-2 Z(2) + (p – 1)(p -2)xp-3 Z(1) + 2(p-1)xp-2 Z(2) + xp-1 Z(3)] = sdnp [(p – 1)(p – 2)(p – 3)xp-4 Z + 3(p – 1)(p – 2) xp-3 Z(1) + 3(p – 1)xp-2 Z(2) + xp-1 Z(3)]
…
f (j)(x) = sdnp [(p – 1)(p – 2)(p – 3) … (p – j) xp–j-1 Z + Cj1 (p – 1)(p – 2) … (p – j + 1) xp-j Z(1) + Cj2 (p – 1)(p – 2) … (p – j + 2) xp-j+1 Z(2) + … + Cjk (p – 1)(p – 2) … (p – j + k) xp-j+k-1 Z(k) + …+ Cjj-1(p – 1) xp-2 Z(j-1) + xp-1 Z(j) ] = sdnp [(p -1)!/(p– j – 1)! xp-j-1 Z + Cj1 (p – 1)!/(p – j)! xp-j (Z) (1) + Cj2 (p – 1)!/(p – j + 1)! xp-j+1 (Z) (2) + Cj3 (p – 1)!/(p – j + 2)! xp-j+2 (Z)(3) + …+ Cjk (p-1) !/ (p–j+k-1)! xp-j+k-1 Z(k) +… + C jj-1(p – 1)!/(p – 2)! xp-2 (Z) (j-1) + xp-1 (Z) (j) ]
…
f (p)(x) = sdnp [Cp1 (p-1)! x0 Z(1) + Cp2 (p-1)! / 1! x1 Z(2) + Cp3 (p-1)! / 2! x2 Z(3) + … + Cpp-1(p-1)!/(p-2)! xp-2 Z(p-1) + xp-1 Z(p)] = sdnp [p(p-1)! Z(1) + [Cp2]/p * (p)! / 1! x1 Z(2) + [Cp3]/p * (p)! / 2! x2 Z(3) + … + [Cpp-1]/p * (p)!/(p-2)! xp-2Z(p-1) + xp-1 Z(p)] = sdnp p! [ Z(1) + [Cp2]/p * x1 Z(2) + [Cp3]/p * 1/2! x2 Z(3) + … + [Cpp-1]/p * 1/(p-2)! xp-2 Z(p-1) + 1/p! * xp-1 Z(p)]
Calcul des dérivées à l’ordre j > p :
f (p+r)(x) = sdnp [somme à partir de k = r+1 jusqu’à k = r+p des Cjk (p-1)!/ (p–j+k-1)! xp-j+k-1 Z(k)] avec j ≥ k, formule que l’on utilisera suivant les cas sous la forme :
f (p+r)(x) = sdnp p![somme à partir de k = r+1 jusqu’à k = r+p des (Cjk/p)/ (p–j+k-1)! xp-j+k-1 Z(k)]
ou sous la forme :
f (p+r)(x) = sdnp [somme à partir de k = r+1 jusqu’à k = r+p des Djk xp-j+k-1 Z(k)] avec j ≥ k et Djk entier.
en effet, Ckj (p-1) !/(p–j+k-1)! = j!/[k!(j–k)!]*(p-1)!/(p–j+k-1)! = j!/[k!(j–k)!] Cp-1j–k(j–k)!= j!/k! Cp-1j–k = entier Djk, car Cp-1j–k = (p-1)!/[(p–j+k-1)!(j–k)!]
A-2) Calcul des dérivées d’ordre j : f (j)(0) pour j ≤ p
- En appliquant les formules du § précédent pour j < p – 1, on trouve f(j)(0) = 0
- En appliquant la formule pour j = p-1, on trouve :
f (p-1)(x) = sdnp [(p-1)! x0 Z + C1p-1 (p-1)! x1 Z(1) + C2p-1 (p-1)!/(2)! x2 Z(2) + Cp-13 (p-1)!/(3)! x3 Z(3) …+ Cp-1p-2(p-1)!/(p-2)! xp-2 Z(p-2) + xp-1 Z(p-1)]
D’où, pour x = 0,
f (p-1) (0) = sdnp (p-1)! x0 Z(0) = sdnp (p-1)! (-a1)p (-a2)p … (-an)p = (-sd)np (p-1)! (a1a2 … an)p
- En l’appliquant pour j = p :
f (p)(x) = sdnp [C1p (p-1)! x0 Z(1) + C2p (p-1)! / 1! x1 Z(2) + C3p (p-1)! / 2! x2 Z(3) + … + C pp-1(p-1)!/(p-2)! xp-2 Z(p-1) + xp-1 Z(p) ] = sdnp [ p(p-1)! Z(1) + [C2p]/p * (p)! / 1! x1 Z(2) + [C3p]/p * (p)! / 2! x2 Z(3) + … + [C pp-1]/p x (p)!/(p-2)! xp-2Z(p-1) + xp-1 Z(p) ] = sdnp p! [Z(1) + [C2p ]/p * x1 Z(2) + [C3p]/p * 1/2! x2 Z(3) + … + [C pp-1]/p * 1/(p-2)! xp-2 Z(p-1) + 1/p! * xp-1 Z(p)]
On trouve f (p)(0) = sdnp p! Z(1)(0)
A-3) Calcul des dérivées d’ordre j : f (j)( ai) pour j ≤ p
On a Z(x) = S(x)p avec S(x) = (x – a1)(x – a2) … (x – an)
Les dérivées successives de Z(x) seront :
Z(1) = p S(1)Sp-1
Z(2) = p S(2)Sp-1 + p(p-1) (S(1))2 Sp-2
Z(3) = p S(3)Sp-1 + p(p-1) S(2) S(1)Sp-2 + 2p(p-1) S(2) S(1) Sp-2 + p(p-1)(p-2) (S(1))3 Sp-3
= p S(3)Sp-1 + 3p(p-1) S(2) S(1)Sp-2 + p(p-1)(p-2) (S(1))3 Sp-3
Z(4) = p S(4)Sp-1 + 4p(p-1) S(3) S(1)Sp-2 + 3p(p-1) S(2) S(2)Sp-2 + 6p(p-1)(p-2) S(2) (S(1))2Sp-3
+ p(p-1)(p-2)(p-3)(S(1))4 Sp-4
= p S(4)Sp-1 + p(p-1) [4S(3) S(1) + 3S(2) S(2)]Sp-2 + 6p(p-1)(p-2) S(2) (S(1))2Sp-3
+ p(p-1)(p-2)(p-3)(S(1))4 Sp-4
…
Z(j) = p S(j)Sp-1 +… + somme de termes de la forme Kk[(S(i1).)k1 *…* (S(iu).)ku]Sp–k +… + p(p-1)(p-2)(p-3)…(p–j+1)(S(1))j Sp–j
…
Z(p) = p S(p)Sp-1 + somme de termes de la forme Kk[(S(i1).)k1 *…* (S(iu).)ku]Sp–k + p(p-1)(p-2)(p-3)…(1)(S(1))p S0
Tant que l’exposant k de S dans ces formules est > 0, on a Sk(ai) = 0 pour chaque ai. On en déduit que toutes les dérivées k-ième de Z pour k = 1 à p-1 vérifient Z(k)(ai) = 0 quel que soit ai, et donc que f (k)(ai) = 0 pour tout ai avec k de 1 à p-1.
A ce stade nous avons donc la collection de résultats suivants :
- Pour j < p-1 : f(j)(0) = 0. (3-1)
- Pour j = p-1 : f(p-1)(0) = (-sd)np (p-1)! (a1a2 … an)p
- f (p)(0) = sdnp p! Z(1)(0)
- Pour j < p : f (j)(ai) = 0 pour tout ai (3-4)
Il nous reste à démontrer les 4 points suivants:
- Que (-sd)np(a1a2 … an)p est entier, pour finaliser (3-2)
- Que sdnp Z(1)(0) est entier, pour le cas k = p de (3-3)
- Que f (k)(0) = p! * (nombre entier ) pour k > p pour finaliser (3-3)
- Que Σ1n f (j)(ai) est multiple entier de p! lorsque j ≥ p pour finaliser (3-5)
A-4) Démonstration des 2 premiers points : (-sd)np(a1a2 … an)p et sdnp Z(1)(0) sont entiers.
Pour cela rappelons-nous d’abord de la définition des ai :
ai = e1.q1 + e2.q2 + e3.q3 + … + ek. qk + … + ed-1.qd-1 + ed.qd , les ek valant 0 ou 1 avec q1, q2, q3, … qd les racines du polynôme à coefficients entiers P(X)= s0 + s1x + s2x2 + … skxk + … + sd xd . Les d premiers ai sont les q1, q2, … , qd, les suivants sont les ai de la forme (qi + qj) avec i et j différents, puis les suivants sont les ai de la forme (qi + qj + qk) avec i, j, k différents, puis etc… jusqu’à an = q1 + q2 + q3 + … + qk + … + qd-1 + qd.
Comme les qi sont les racine de P(x), P(x) s’écrit aussi, de façon équivalente :
P(x) = sd (x – q1)(x – q2) … (x – qk) … (x – qd-1)(x – qd) ce qui après développement donne :
P(x) = sd xd + sd (q1 + q2 + … + qk … + qd-1 + qd) xd-1 + sd (Σqiqj) xd-2 + sd (Σqiqjqk) xd-3 + … + sd (somme de tous les produits de k termes qi différents) xd–k + … + sd (somme de toutes les produits de d-2 termes qi différents) x2 + sd (somme de tous les produits de d-1 termes qi différents ) x +(-1)d sd q1 q2 … qk … qd-1 qd
Par identification avec P(x) on tire :
sd (q1 + q2 + … + qk … + qd-1 + qd) = sd-1
sd (Σqiqj) = sd-2
sd (Σqiqjqk)= sd-3
…
sd (somme de tous les produits de k termes qi différents) = sd–k
…
(-1)dsd q1 q2 … qk … qd-1 qd = s0
Avec chacun des termes si qui est un entier.
On en déduit que tous les polynômes symétriques élémentaires construits à partir des d racines qi sont de la forme : si / sd avec si et sd entiers. C’est-à-dire, en reprenant la notation vue au §4 de la boîte à outils :
PS1 : sd-1/sd, PS2 = sd-2/sd, … , PSk = sd–k/sd, … ,PSd = (-1)ds0/sd
Considérons maintenant le produit de tous les ai :
a1a2 … an = Π ai = Π qi * Π (qi+qj) * Π (qi+qj+qk) * … * Π (somme de k des d racines) * (q1 + q2 + … + qk … + qd-1 + qd). Ce produit est une fonction symétrique sur les d indices des racines, il s’exprime donc comme une combinaison des polynômes symétriques élémentaires PS1, PS2, PSk, … PSd. On constate également que Π ai est le produit de n termes de degré 1 car les ai sont de degré 1 lorsqu’ils sont exprimés en qi. Sachant que chaque polynôme symétrique élémentaire PSi est de degré i, cela implique que Π ai s’écrit sous la forme :
Π ai = Somme de termes (PS1)a1*(PS2)a2*…*(PSk)ak* … (PSd-1)ad-1*(PSd)ad dont chacun des vérifie la condition :
a1 + 2a2 + 3a3 + … + kak + … + (d-1)ad-1 + dad = n, où les ai sont les exposants des PSi
On aura donc finalement :
Π ai = Somme de termes (sd-1/sd)a1*( sd-2/sd)a2*…*( sd–k/sd)ak* … (s1/sd)ad-1*((-1)ds0/sd)ad = M1/( sd)a1 + a2 + a3 + … + kak + … + ad-1 + ad = (M1)a2 + 2a3 + … + (k-1)ak + … + (d-2)ad-1 + (d-1)ad /( sd)a1 + 2a2 + 3a3 + … + kak + … + (d-1)ad-1 + dad = Kd/sdn avec M1 et Kd nombres entiers relatifs.
Conclusion : a1a2 … an = Kd / sdn avec Kd entier relatif.
Cela permet de conclure aussi : (-sd)np(a1a2 … an)p = (-sd)np(K0 / sdn)p est un entier, donc f(p-1)(0) = (-sd)np (p-1)! (a1a2… an)p est un entier multiple de (p-1)!
Examinons maintenant Z(1)(x) :
Z (x) = (x – a1)p (x – a2)p … (x – an)p
Commençons par étudier S(x) = (x – a1)(x – a2) … (x – an-1)(x – an)
S(x) = xn + (Σai) xn-1 + (Σaiaj) xn-2 + ((Σaiajal) xn-3 + …+ (Σ produit de k termes ai) xn-k + (Σ produit de n-1 termes ai) x + (a1a2 … an-1an)
On a vu précédemment que a1a2 … an-1an = nombre entier / ( sd )n , de même a1 + a2 + a3 + a4 + … + an est la somme de : Σ qi + Σ (qi+qj) + Σ (qi+qj+qj) + … + (Σ k des d qi) + … + (q1+q2 +…+qk …+qd-1+qd). C’est un polynôme symétrique sur les qi, il s’exprime donc en fonction des polynômes symétriques élémentaires PSi et comme il est de degré 1 en q, il s’écrit forcément sous la forme d’un entier multiplié par PS1 puisque chaque qi est présent un nombre entier de fois dans cette somme. Donc :
a1 + a2 + a3 + a4 + … + an = entier*PS1 = K1/sd avec K1 entier.
De même Σaiaj est la somme de toutes les sommes possibles de 1 ou 2 ou 3 ou k ou…d qi (qui sont les ai) par des sommes de qi du même type mais qui donnent un résultat différent (ai doit être différent de aj), le produit résultant s’exprime forcément comme une somme de termes en Σqiqj , chacun de ses monômes est de degré 2 en q, et c’est un polynôme symétrique sur les qi. Le produit résultant est donc construit comme une somme de PS12 et de PS2. Il s’écrit forcément sous la forme : entier * (sd-1/sd)2 + entier * sd-2 / sd = K2/( sd)2 avec K2 entier.
De même Σaiajal est la somme des produits de :
– toutes les sommes possibles de qi (qui donnent les ai)
– par des sommes de qi du même type mais qui donnent un résultat différent (aj doit être différent de ai)
– par des sommes de qi du même type mais qui donnent encore un résultat différent des sommes précédentes (ak différent de aj ou ai)
Le résultat s’exprime forcément comme une somme symétrique sur les d indices des qi, et avec des termes de degré 3 en q, donc forcément à partir de PS13, PS1*PS2, et PS3.
Le produit résultant s’écrit forcément sous la forme : entier * (sd-1/sd)3 + entier * sd-2 sd-1 /(sd)2 + entier + sd-3/sd = K3/(sd)3 avec K3 entier.
Le même raisonnement tient pour tous les termes de la forme (Σproduit de k termes ai) qui constituent les coefficients du polynôme S(x) = (x – a1)(x – a2) … (x – an-1)(x – an), ce qui permet de conclure que les coefficients de ce polynôme sont tous de la forme : Ki/( sd)i avec i de 0 à n, et avec Ki entier (K0 = 1).
Ce résultat permet d’affirmer que les coefficients du polynôme Z = S(x)p sont de la forme : entier /( sd)j avec j de 0 à np. Donc tous les coefficients de sdnp Z(x) sont entiers et ce sera encore le cas pour les dérivées de sdnp Z(x) puisque la dérivée des monômes d’un polynôme ne fait que multiplier par des entiers les coefficients du monôme de départ, donc sdnp Z(1)(x) est à coefficients entier, or sdnp Z(1)(0) est l’un de ces coefficients, il est donc entier.
Les 2 premiers points ont été démontrés.
A-5) A ce stade, il ne reste à démontrer que :
- f (k)(0) = p! * (nombre entier ) pour k > p pour finaliser (3-3)
- Σi=1n f(j)(ai) est multiple entier de p! pour finaliser (3-5)
Considérons de nouveau S(x). Il ressort du paragraphe précédent que S(x) s’écrit :
S(x) = xn + (Σai) xn-1 + (Σaiaj) xn-2 + ((Σaiajal) xn-3 + …+ (Σproduit de k termes ai) xn–k + (Σproduit de n-1 termes ai) x + (a1a2 … an-1an)
= xn + K1/sd xn-1 + K2/(sd)2 xn-2 + K3/(sd)3 xn-3 + …+ Kk/(sd)k xn–k + … + Kn-1/(sd)n-1 x + Kn / sdn avec Ki entier pour i de 1 à n.
Z(x) = S(x)p sera la somme des termes suivant, classés par degré décroissant :
- xnp , produit des p monômes de plus haut degré xn,
- K1/sd xn(p-1)+n-1 , produit de p-1 monômes de plus haut degré (xn) et du monôme de degré n-1 (K1/sd xn-1),
- [K2/(sd)2+ (K1/sd)2] xn(p-1)+n-2 , produit de p-1 monômes de plus haut degré (xn) et d’un monôme de degré n-2 (K2/(sd)2 xn-2) ou de p-2 monômes de degré n (xn) avec 2 monômes de degré n-1 (K1/sd xn-1),
- …
- Monôme de degré k, produit de p monômes de degré respectifs δ1, δ 2, … δ p tels que δ1 + δ2 + … + δj = k, chacun de ces monômes ayant pour coefficient Kn–δi/(sd)n–δi de sorte que le monôme de degré k aura pour coefficient Dk/(sd)np-Σδi = Dk/(sd)np-k
Le terme général du polynôme Z(x) s’écrit donc pour k de 0 à np : Dk/(sd)np–k xk avec Dk entier, et la dérivée jième de ce terme sera de la forme: (k)(k-1)…(k–j+1)Dk /(sd)np–k xk–j pour j de 1 à k, et = 0 pour j > k.
Pour j de 1 à k cela donnera les termes :
jDj /(sd)np–j + (j+1)(j+2) Dj+1 /(sd)np–j-1 x +…+(j+i)(j+i-1)…(i+1)Dj+i /(sd)np–j–i xi + …
Revenons à f(k)(x) pour calculer f(k)(0) avec k > p.
f (p+r)(x) = sdnp p! * [somme à partir de k = r+1 jusqu’à k = r+p des Ckp+r /p *1/(k–r-1)! xk–r-1 Z(k)]. Pour x = 0, le seul terme non nul correspond à k = r+1 ce qui donne :
f (p+r)(0) = sdnp p! * [Cr+1p+r /p Z(r+1)(0)]. Or comme on vient de le voir :
Z(r+1)(x) = (k)(k-1)…(k-(r+1)+1)Dk /(sd)np–k xk-(r+1), là encore pour x = 0 seul le terme non nul est obtenu avec k = r+1.
Z(r+1)(0) = (r+1)! Dk /(sd)np-(r+1)
Par ailleurs Cr+1p+r = (p+r)!/(r+1)!(p-1)! = (p+r)(p+r-1) … (p)/(p-1)! d’où :
f (p+r)(0) = sdnp p! * [Cr+1p+r /p (r+1)! Dk /(sd)np-(r+1)] = sdnp p ! (p+r)(p+r-1) …(p+1) Dk /(sd)np-(r+1) = sd(r+1) p ! (p+r)(p+r-1) …(p+1) Dk avec Dk et sd entier.
Ce résultat finalise (3-3).
Il reste à montrer que Σi=1n f(j)(ai) est entier, multiple de p! lorsque j ≥ p pour finaliser (3-5).
f(x) = sdnp xp-1 Z(x) et comme Z(x) est une somme de monômes de la forme Dk/(sd)np–k xk avec Dk entier, on en déduit que f(x) est une somme de monômes de la forme : sdk Dk xk+p-1
La dérivée j-ième de chacun de ces monômes donnera sdk(k+p-1)(k+p-2) …(k+p-j) Dk xk+p-1-j
- Pour j = p on trouvera des monômes de la forme : sdk(k+p-1)(k+p-2) …(k) * Dk xk-1 et en remarquant que (k+p-1)(k+p-2) …(k) = (k+p-1)!/(k-1) ! et que Ck+p-1k-1 = (k+p-1)!/(k-1)!p! on obtient (k+p-1)(k+p-2) …(k) = p! * Ck+p-1k-1 ce qui permet d’écrire les monômes de f(x)(p) sous la forme : sdk p! * Ck+p-1k-1 * Dk xk-1 = sdk p! * Ek0 * xk-1 avec Ek0 entier.
- Pour j > p on trouvera des monômes de la forme : sdk(k+p-1)(k+p-2) …(k+p–j) Dk xk-1+p–j et en remarquant que (k+p-1)(k+p-2) …(k+p–j) = (k+p-1)!/(k+p–j-1)! et que Ck+p-1k+p–j-1 = (k+p-1)!/(k+p–j-1)!j! on obtient (k+p-1)(k+p-2) …(k+p–j) = j! * Ck+p-1k+p–j-1 ce qui permet d’écrire les monômes de f(x)(j) sous la forme : sdk j! * Ck+p-1k+p–j-1* Dkj xk+p-j-1. Comme j > p, le monôme peut être écrit sdk p! * Ekp–j * xk+p–j-1avec Ekj entier.
D’une façon générale, pour j ≥ p, f(x)(j) = somme de monômes de la forme sdk p! * Ekp-j * xk+p–j-1, que l’on peut reformuler en Σ sdk p! * Eku * xk–u-1 avec u= p–j indice allant de 0 à k-1.
Appliquons ce résultat à ai :
f(ai)(j) = Σu=0k-1 sdk p! * Eku * aik–u-1 et donc :
Σi=1n f(ai)(j) = Σi=1n Σu=0k–1 sdk p! * Eku * aik–u-1 = p! Σu=0k-1 sdk Eku(Σi=1naik–u-1)
La somme Σ1naik–u-1 est symétrique sur les aik–u-1 et l’exposant k–u-1 vaut au plus k-1. Cette somme s’exprime par une combinaison de polynômes symétriques élémentaires en ai qui sera au plus de degré k-1 en termes qi, on en déduit Σ1naik–u-1 = entier/sdk.
Cela permet de conclure : Σ1n f(ai)(j) = p! * entier lorsque j ≥ p. Ce résultat finalise (3-5).
