Math

Quelques problèmes mathématiques curieux ou amusants

Cette section, en construction permanente, présente des questions de mathématiques, exotiques ou amusantes.

Le Problème de Steiner

Ou comment résoudre un problème variationnel complexe avec de l'eau savonneuse.

L'étonnante équation différentielle de Lee Rubel

Il y a 30 ans déjà, Lee Rubel a publié un résultat étonnant (Bull. Am. Math. Soc. 4, pp345-349 (1981)), présenté ci-dessous de façon informelle. Les détails analytiques sont reportés en annexe (Notebook Mathematica).

Il est bien connu que toute équation différentielle définit une famille de fonctions. Ainsi l'équation linéaire (d'ordre 2 et de degré 1), y''(x) + y(x) = 0, définit la famille des fonctions trigonométriques de base, sinus et cosinus. Pour des raisons de commodité, on a donné un nom aux solutions des équations utiles aux physiciens (et aux autres !) mais qu'il soit bien clair que les autres équations ne sont pas moins respectables : du moment qu'elles ne sont pas sensibles aux conditions initiales, elles définissent d'autres familles de fonctions qui seront peut-être utiles à leur tour. Rubel a trouvé une équation différentielle d'ordre 4 et de degré 7 qui possède une solution approximant, à moins de epsilon près (epsilon aussi petit que l'on veut), n'importe quelle fonction infiniment continûment dérivable ! Certes cette équation n'est pas simple mais il n'empêche que le résultat est surprenant. L'équation s'écrit :

12 y''7 - 29 y'2y''3y'''2 - 12 y'3y''y'''3 + 24 y'2y''4y'''' + 6 y'3y''2y'''y'''' - 4 y'4y'''2y'''' + 3 y''''2y''y'4 = 0

Comment une telle prouesse est-elle possible ? Observons que la fonction exponentielle, y(x)= exp(a x), satisfait l'équation de Rubel et en cherchant bien on en trouverait beaucoup d'autres. Cependant une fonction choisie au hasard, par exemple, y(x) = sin(x), ne la satisfait pas. Ce que le théorème de Rubel affirme c'est qu'il existe un jeu de conditions initiales qui garantit que la solution correspondante est aussi peu distante que l'on veut de la fonction sin(x) ou d'ailleurs de n'importe quelle autre, infiniment continûment dérivable. L'idée est d'approximer la fonction donnée par un modèle adéquat, sur une suite d'intervalles consécutifs, d'autant plus étroits que la précision exigée est grande. Le modèle considéré par Rubel se note :

Fonction de Rubel

Il est viable parce qu'il possède quelques propriétés remarquables :

  • f(a) = ya et f(b) = yb. Autrement dit, le modèle relie, comme souhaité, les points (a, ya) et (b, yb), situés aux extrémités de l'intervalle (a,b).
  • f(x) satisfait l'équation de Rubel. Cela est trivial en-dehors de l'intervalle (a,b) puisque le modèle y est constant mais c'est également vrai à l'intérieur.
  • Sur l'intervalle (a,b) le modèle s'écarte aussi peu que l'on veut de la fonction donnée, à condition de respecter les limites, f(a)=ya et f(b)=yb, aux extrémités a et b et de rapprocher suffisamment b de a.
  • Le raccord du modèle entre deux intervalles consécutifs, (a,b) et (b,c) se fait sans problème grâce aux propriétés remarquables de f(x) : les deux modèles se raccordent, de fait, infiniment continûment au point commun, x=b, car toutes les dérivées y sont nulles.

Si l'un des objectifs de la science consiste à trouver un modèle théorique qui colle à la réalité expérimentale, on constate que l'équation de Rubel apparaît comme universelle au sens où elle rend compte de n'importe quel ensemble de données échantillonnant un phénomène continu. Cependant il faut bien comprendre que cette équation ne possède aucune vertu prédictive dans la mesure où on a déplacé le problème au niveau de la recherche des conditions initiales qui induisent la solution cherchée. Etant donnée une fonction, aucune procédure algorithmique ne peut révéler les conditions initiales à introduire dans l'équation de Rubel afin de calculer la solution qui l'approxime à moins de epsilon près. Cette non-calculabilité limite évidemment l'intérêt de la découverte de Rubel.

On a proposé d'autres équations universelles, plus simples, telles celles de Duffin,

m y'''' y'2 - (3m-2) y''' y'' y' + (2m-2) y''3 = 0
(m>3 est un paramètre entier, au choix) mais les solutions ne sont plus infiniment continûment dérivables.

Trois candidats à la roulette russe

Aucun domaine des mathématiques n'est plus délicat que le calcul des probabilités : l'intuition y est régulièrement mise à mal, au point que les pseudo-paradoxes abondent. Celui des tireurs-fous est particulièrement spectaculaire. Trois amateurs de roulette russe (que nous nommerons A, B et C) conviennent d'adhérer au protocole suivant :

  • Tous ne sont pas mis sur un pied d'égalité : une roulette indépendante décide de charger le pistolet de A avec la probabilité a, celui de B avec la probabilité, b, et celui de C avec la probabilité, c. On a : 1>a>b>c>0. Les joueurs sont au courant de cette différence et ils l'assument.
  • Un autre tirage aléatoire décide d'un ordre immuable parmi les 6 possibilités, ABC, ACB, ..., CBA, et chacun tirera à son tour, dans cet ordre. Si un tireur meurt, les deux survivants continuent à tirer dans l'ordre restant.
  • Tout "joueur" peut a priori tirer en l'air ou sur la cible de son choix, sauf qu'il doit impérativement retenir l'option qui lui laisse la meilleure chance de survie. Ensuite, c'est au tour du deuxième joueur de faire pareil et ainsi de suite, jusqu'à épuisement des combattants.

On demande de déterminer la meilleure stratégie de chacun et de calculer les probabilités de survie respectives.

Solution

Une analyse préalable permet de dégrossir le problème : le lecteur se convaincra facilement que la meilleure stratégie, pour A comme pour B (les mieux armés), consiste à tirer sur le rival le plus dangereux (respectivement B et A). Dans tous les cas de figure, on a que la probabilité de survie de A est au moins égale à celle de B, ce qui ne laisse que trois possibilités (on ignore les cas d'égalités en nombres négligeables) : 0 < pc < pb < pa < 1 (cas 1), 0 < pb < pc < pa < 1 (cas 2) et 0 < pb < pa < pc < 1 (cas 3). C'est ce que l'intuition suggère et ce qu'un calcul facile confirme. Par contre, la meilleure stratégie pour C est bien moins évidente : en fait, tant que les trois tireurs sont en vie, C a intérêt à tirer en l'air, ce qui assure que A et B se rencontreront au tour suivant ! Il y a encore plus fort : sous certaines conditions peu contraignantes et relatives aux valeurs de a, b et c, il peut se faire que C possède la meilleure probabilité de survie !

Graphe de Markov
Graphe de Markov

Le graphe de Markov du problème est composé de 11 états, 8 états internes (numérotés de 1 à 8) et de 3 états de bord (numérotés de 9 à 11). Les états internes ont été coloriés différemment selon le nombre de tireurs demeurant en vie à chaque stade. Les états de bord sont absorbants : une fois un de ces état atteint, le système s'arrête, désignant le survivant.

Il existe plusieurs méthodes de résolution d'un tel graphe. La méthode matricielle repose sur les matrices de transition entre états internes, Q8x8=(pi,j), et vers les états de bord, S8x3=(pi,j) :

Transitions entre états internes
Transitions vers les états de bord

La ligne 1 du produit matriciel, (Id8x8-Q)-1.S, livre les probabilités, pa, pb et pc. Le détail des calculs figure en annexe (Notebook Mathematica).

Probabilités de survie

On peut représenter les zones de l'espace 3D correspondant aux trois cas possibles : une figure fixe la portion d'espace tétraédrique disponible, 0 < c < b < a, et l'autre délimite les zones, 1, 2 et 3, dans l'ordre ascendant. On note que la zone 3 (la partie supérieure du tétraèdre) est loin d'être négligeable.

Zones
Zones 1, 2 et 3
Espace disponible
Espace disponible

Chute libre sur un centre fixe et oscillateur harmonique : le changement de variables de Sundman

Le problème de la chute d'un corps massif, assimilé à un point matériel, sur un centre attractif ponctuel est classique. L'équation de mouvement est celle de Newton, qui, débarrassée des constantes inutiles, peut s'écrire (le choix opéré des conditions initiales est inessentiel) :

Equation de Sundman

Bien que singulière en x=0, cette équation est intégrable en termes de fonctions élémentaires et sa solution se note, en forme inversée :

Solution inversée de l'équation de Sundman
Graphe de la solution de l'équation de Sundman

La singularité évoquée correspond clairement à la collision du point avec le centre qui, vu les conditions initiales retenues, se produit en,

Temps de chute sur le centre

. Une procédure d'intégration numérique se heurte inévitablement à la présence de cette singularité, interdisant toute prolongation numérique de la solution au-delà de cette limite. Cependant Karl Frithiof Sundman (1873-1949) fut le premier à montrer que cette singularité peut être rectifiée, permettant la prolongation sans limite de temps. Physiquement, le point matériel est autorisé à rebondir élastiquement sur le centre ce qui débouche sur un mouvement périodique de période,

Période d'oscillation

Karl Frithiof Sundman (1873–1949) est un astronome finlandais connu pour avoir effectivement résolu, en 1906-1908, le problème à 3 corps en interaction gravitationnelle. La solution qu'il a trouvée s'exprime sous la forme d'un développement en série uniformément convergent pour toute valeur de la variable temps. Hélas la vitesse de convergence est tellement faible que la série est inexploitable en pratique. L'essentiel du travail de Sundman a consisté à régler le problème des singularités qui lorsque N=3 coïncident avec les collisions (Cette solution a depuis été généralisée aux valeurs supérieures de N par Q. D. Wang).


Le changement de variables de Sundman, (x,t) → (X,T), se note,

Changement de variables de Sundman

et les calculs s'amorcent comme suit :

Développements du calcul de Sundman

L'équation de Newton pour la chute libre se transforme dès lors en (ne pas confondre la notation pointée qui désigne la dérivée par rapport à t et la primée qui désigne la dérivée par rapport à T; E est l'énergie conservée du point) :

Equation de Newton

La dernière transformation fait appel à la conservation de l'énergie, traduite en terme des variables X et T, soit : 2 X' 2 - 1 = E X2). Le lecteur intéressé trouvera l'automatisation des calculs en annexe (Notebook Mathematica). On observe que le changement de variables a pour effet d'autoriser le prolongement de la chute libre au-delà de la singularité naturelle que représente la collision avec le centre assimilé à un réflecteur parfait. En terme des nouvelles variables et vu les conditions initiales retenues, le mouvement prolongé est celui d'un oscillateur harmonique, d'équation,

Oscillation de Sundman

. Il est alors possible de trouver la relation

Temps réel versus temps virtuel

qui relie le temps réel, t, au temps virtuel, T, compte tenu des correspondances initiales,

TODO

. Le lecteur motivé peut revenir aux coordonnées naturelles par le changement de variables inverse, (X,T) → (x,t), et retrouver la solution, t(x), calculée au début. Le graphe de la solution prolongée se présente comme suit :

Graphe des oscillations de Sundman

Poincaré ou Fibonacci ?

La transformation du chat d'Arnold est fréquemment proposée comme une illustration ludique du théorème du retour de Poincaré. Seuls les bons auteurs font remarquer qu'il n'en est rien car cette transformation illustre avant tout les propriétés de divisibilité des nombres de Fibonacci.

Transformation d'Arnold
Transformation d'Arnold

La transformation d'Arnold s'applique aux points du pavé carré de côté, c, qu'elle déforme selon une loi linéaire modulo c,

Transformation d'Arnold

En l'absence du modulo, le carré (contour noir sur la figure) se trouverait déformé en parallélogramme (contour rouge). L'opération modulo a pour effet de découper ce parallélogramme en 4 triangles et de les recoller exactement dans le carré primitif car la transformation préserve les aires. L'opération peut être recommencée autant de fois que l'on veut et on conçoit qu'une image quelconque occupant le carré primitif se trouve progressivement brouillée au point de devenir rapidement méconnaissable. Arnold a le premier fait subir cette transformation à l'image d'un chat d'où son nom.

Une solution analytique est théoriquement possible puisque la transformation est linéaire à un modulo près :

Solution de la transformation d'Arnold

où, Fn = ..., 1, 0, 1, 1, 2, 3, 5, 8, ..., désigne la suite des entiers de Fibonacci (n = ..., -1, 0, 1, 2, 3, 4, 5, 6, ...).

Si on applique la transformation d'Arnold à l'ensemble non dénombrable des points occupant le carré primitif, il devrait être clair qu'aussi loin qu'on réitère l'opération, jamais tous ces points ne reviendront simultanément à leur emplacement initial. En effet, les points pour lesquels une périodicité, N, peut se produire ne constituent qu'un ensemble dénombrable, typiquement celui des solutions (x0, y0), du système,

Solution analytique au problème d'Arnold

(On trouvera les détails en annexe (Notebook Mathematica)).

Autrement dit, jamais une image de résolution infinie ne réapparaîtra intacte. Une image n'est jamais de résolution infinie et on peut se demander ce qu'il advient d'une image discrétisée selon une grille comptant cxc pixels. Le nombre des cellules élémentaires étant fini (c2) dans ce cas, le nombre total des images possibles est également fini quoique très grand (2cxc). La réapparition de l'image initiale devient, à présent, une certitude programmée dans un temps probablement très grand mais néanmoins fini.

Si l'on expérimente la transformation sur une image initial de taille, c, on observe que le temps de retour est étonnamment court. L'exemple retenu est celui d'une image de la lettre R, discrétisée selon une trame comportant 64x64 pixels : l'image réapparaît au bout de 48 itérations.

Pixellisation 64x64
Pixellisation 64x64
Itérations d'Arnold de la grille 64x64
Itérations d'Arnold de la grille 64x64

Si on rogne l'image en supprimant un cadre extérieur de largeur n, sa dimension s'en trouve réduite à la valeur (64-2n)x(64-2n) : le phénomène de retour précoce subsiste mais le temps de retour change assez irrégulièrement.

Transformation d'Arnold, modèle rogné
Modèle rogné

Le calcul de la période de retour s'effectue comme précédemment mais cette fois, on impose que les coordonnées, (xn, yn), appartiennent en permanence (= pour tout n) à l'ensemble discret, {0, 1, 2, ..., c-1) :

Calcul de la période de retour

La période cherchée vaut alors la plus petite valeur de N telle que F2N = 0 (mod c) & F2N-1 = 1 (mod c). Le lecteur curieux vérifiera la validité de cette règle, publiée par Freeman Dyson et Harold Falk dans la revue, The American Mathematical Monthly 99 (1992) 603-614, sur les 6 exemples numériques proposés ou il se reportera à l'annexe.

De nombreux auteurs ont voulu voir dans cette expérience numérique une illustration du théorème du retour de Poincaré. Rappelons brièvement en quoi il consiste : un système dynamique instable dont le point représentatif évolue dans un espace des phases borné, y suit une trajectoire chaotique : deux trajectoires initialement proches subissent une divergence localement exponentielle et des repliements successifs qui les séparent définitivement. Toutefois si on découpe l'espace des phases en cellules même microscopiques, un moment viendra où la trajectoire repassera par la même configuration locale, autrement dit, à condition d'être patient le système finira par repasser aussi près que l'on veut de sa configuration de départ. Toutefois cette éventualité ne se produira qu'auterme d'un temps extraordinairement long, sans commune mesure avec ce qu'on observe dans le cas des images discrétisées. Celui-ci est, en fait, la conséquence des propriétés remarquables de divisibilté des entiers de Fibonacci.

Quaternions

Les quaternions sont nés, vers 1843, de l'imagination de Sir William Rowan Hamilton (1805-1865), mathématicien, physicien et astronome irlandais. Considérés d'emblée comme une généralisation des nombres réels et complexes, ils ont été préconisés et réellement utilisés dans une formalisation des équations de la mécanique de Newton et de l'électromagnétisme de Maxwell, jusqu'à ce que le calcul vectoriel les remplace (définitivement ?), au début du 20ème siècle. Aujourd'hui les quaternions refont surface dans des domaines particuliers où leur algèbre concise apporte un vrai confort d'utilisation (Gestion des rotations dans le traitement des images 3D, électromagnétisme et mécanique quantique relativiste).

Une théorie modernisée situe actuellement les quaternions parmi une infinité d'algèbres hypercomplexes, de dimensions croissantes, par exemple dans le cadre de la chaîne de Cayley-Dickson. Celle-ci développe une généralisation de la notion de nombre réel en procédant par récurrence au départ de l'ensemble des réels, muni des règles usuelles d'addition et de multiplication. On y ajoute simplement une notion de conjugaison telle que le conjugué d'un réel est égal à lui-même : Conj[a] = a. Les réels constituent la base de la construction, que l'on pourrait appeler nombres hypercomplexes de rang zéro (K=0). Ayant défini les hypercomplexes de rang, K, par exemple, A, B, C et D, on définit les hypercomplexes de rang (K+1), X et Y, comme des couples ordonnés d'hypercomplexes de rang K, X = {A, B} et Y = {C, D}, entre lesquels on définit les règles suivantes d'addition, de multiplication et de conjugaison :

  • Addition : X+Y = {A, B} + {C, D} = {A+C, B+D}.
  • Multiplication : X Y = {A, B} {C, D} = {A C-Conj[D] B, D A+B Conj[C]}.
  • Conjugaison : Conj[X] = Conj[{A, B}] = {Conj[A], -B}.

La construction progresse comme suit, en respectant ces règles (On trouvera les calculs explicites en annexe (Notebook Mathematica)) :

  • On part de l'ensemble usuel des nombres réels, notés a, b, ... .
  • Première étape : les nombres complexes. On définit un nombre complexe, z, comme un couple ordonné de réels : z = {a1, a2}. Son conjugué se note, Conj[z] = {a1, -a2}. Comme annoncé, la somme de deux complexes, {a1, a2}+{b1, b2}, vaut simplement, {a1+b1, a2+b2} et le produit vaut, {a1, a2} {b1, b2} = {a1b1-a2b2, a1b2+a2b1}. On utilise habituellement une notation algébrique alternative (mais équivalente), z = e a1+i a2, où les deux clés, e=1 et i=√-1, respectent la table de multiplication suivante :
    Table de multiplication pour les complexes
  • Deuxième étape : les quaternions. On définit un quaternion, q, comme un couple ordonné de complexes : q = {{a1, a2}, {a3, a4}}. Son conjugué se note, conformément à la définition générale, Conj[q] = {{a1, -a2}, -{a3, a4}}. La somme de deux quaternions est à nouveau triviale et le produit est détaillé en annexe. On utilise habituellement une notation algébrique alternative (mais équivalente), q = e a1+i a2+j a3+k a4, où les clés, e=1, i, j et k, respectent la table de multiplication suivante :
    Table de multiplication pour les quaternions
  • Troisième étape : les octonions. On définit un octonion, 𝒪, comme un couple ordonné de quaternions : 𝒪 = {{{a1, a2}, {a3, a4}}, {{a5, a6}, {a7, a8}}}. Son conjugué se note, conformément à la définition générale, Conj[𝒪] = {{{a1,-a2}, -{a3, a4}}, {-{a5, a6}, -{a7, a8}}}. La somme de deux quaternions est à nouveau triviale et le produit est détaillé en annexe. On utilise habituellement une notation algébrique alternative (mais équivalente), 𝒪 = e a1+i a2+j a3+k a4+l a5+m a6+n a7+p a8, où les clés, e=1, i, j, k, l, m, n et p, respectent la table de multiplication suivante :
    Table de multiplication pour les octonions

On voit que cette construction double, à chaque étape, la dimension de l'espace utilisé. L'étape suivante définirait les sédénions à 16 composantes dont on ne fait aucun usage concret, du moins en physique. Ces algèbres ne sont pas de qualités égales, perdant une propriété à chaque étape de la construction : complexes (pertes de l'autoconjugaison et de la notion de comparaison <>), quaternions (perte de la commutativité de la multiplication), octonions (perte de l'associativité de la multiplication), etc.

1) Application des quaternions aux rotations 3D

Les quaternions proprement dits, q = e a1+i a2+j a3+k a4, (présup)posent que les coefficients, a1, ..., a4, sont réels. Cela permet de leur associer une norme, ||q|| (positive), via la relation : ||q||2 = q Conj[q] = a12+a22+a32+a42. Ils apparaissent naturellement en géométrie à 3 dimensions sous la forme particulière, purement vectorielle, i ax+j ay+k az, où (ax, ay, az) représentent les composantes cartésiennes du vecteur a. C'est sans doute cette observation qui a motivé le remplacement du calcul quaternionique par le calcul vectoriel, à la fin du 19ème siècle. Pourtant le caractère purement algébrique du calcul quaternionique lui conserve des vertus incontestables, par exemple dans le traitement des rotations dans l'espace 3D. On commence par un détour utile en évoquant brièvement une théorie des fonctions d'une variable quaternionique calquée sur celle, usuelle, des fonctions d'une variable complexe. La fonction exponentielle, exp[q] = exp[e a1+ i a2+ j a3+ k a4], est particulièrement intéressante. En se rappelant sa définition sous forme de développement en série, exp[q] = Sum[qn/n!, {n,0,∞}], on trouve, après quelques calculs faisant un large usage de l'identité, (i a2+ j a3+ k a4)2 = -(a22+a32+a42) = -α2 :

Exponentielle quaternionique

Un cas intéressant apparaît lorsque q est privé de sa partie scalaire (a1 = 0) et que (a2, a3, a4) sont les composantes d'un vecteur unitaire, N = (nx, ny, nz). α valant 1, dans ce cas, la formule précédente se réduit à :

Rotation quaternionique

On trouve alors que le double produit suivant transforme un vecteur de composantes (vx, vy, vz) en un vecteur (v'x, v'y, v'z) tourné en sens inverse d'un angle θ autour du vecteur unitaire (nx, ny, nz) :

Rotation quaternionique

Posant par exemple, nx = ny = 0, nz = 1 et θ = π/4, dans cette formule, on trouve que les produits suivants transforment effectivement i en -j, j en i et k en lui-même :

  • (√2/2)(1-k) i (√2/2)(1+k) = -j
  • (√2/2)(1-k) j (√2/2)(1+k) = +i
  • (√2/2)(1-k) k (√2/2)(1+k) = +k
Rotation quaternionique

On trouvera en annexe un autre exemple d'une pyramide ayant subi une rotation de ce genre.

2) Application des quaternions à l'invariance des équations de Maxwell

Rien ne s'oppose à ce qu'on considère le cas plus général où certains coefficients des quaternions sont complexes, on parle alors de biquaternions. Une précaution doit cependant être prise afin de ne pas confondre la clé i des complexes avec celle des quaternions. Dans ce but, on note ci-après la clé des complexes sous la forme parlante, i=√-1.

En physique (relativiste), on distingue deux structures (bi)quaternioniques principales, correspondant respectivement aux quadrivecteurs et aux tenseurs de la théorie usuelle :

  • La première regroupe, la position spatio-temporelle d'un événement, R = √-1 c t + i x + j y + kz, le potentiel électromagnétique, P = √-1 V/c + i Ax + j Ay + k Az et le courant, C = μ0 (√-1 c ρ + i Ix + j Iy + k Iz). On note que la partie scalaire est imaginaire pure et la partie vectorielle est réelle. Dans le cas unusuel où l'on souhaiterait "compléter" les équations de Maxwell par la présence de pôles (et de courants) magnétiques, rien ne changerait sauf l'écriture du courant qui revêterait la forme quaternionique généralisée, C = μ0 [(-ρm+ √-1 c ρe) + i (Ie,x+ √-1 Im,x /c) + j (Ie,y+ √-1 Im,y /c) + k (Ie,z+ √-1 Im,z /c)]. La convention d'Ampère a été retenue où les pôles isolés et au repos s'attirent ou se repoussent selon la loi, F = μ0/(4π) qmq'm /r2; ils se mesurent en Am.
  • La deuxième s'adresse essentiellement au champ électromagnétique, F = i (√-1 Ex/c - Bx) + j (√-1 Ey/c - By) + k (√-1 Ez/c - Bz). On note que la partie scalaire est absente et que la partie vectorielle est complexe.

De même qu'il ne suffit pas, en calcul tensoriel, d'associer 4 grandeurs pour constituer un quadrivecteur, il ne suffit pas de les assembler au sein d'un (bi)quaternion; il faut encore que les composantes se transforment correctement lors d'un changement de coordonnées, par exemple suite à une rotation des axes ou à une transformation de Lorentz.

  • Lors d'une rotation directe des axes, d'un angle θ, disons autour de Oz pour ne pas compliquer, tous les biquaternions, qu'ils soient du premier groupe (R, P ou C) ou du deuxième (F), se transforment selon la loi du type, R' = exp[kθ/2] R exp[-kθ/2].
  • Lors d'une transformation de Lorentz à vitesse relative, v, disons selon Oz pour ne pas compliquer, les biquaternions du premier groupe (R, P ou C) se transforment selon la loi du type, R' = exp[-kφ] R exp[-kφ] tandis que ceux du deuxième groupe (F) se transforment selon la loi du type, F' = exp[kφ] F exp[-kφ]. Ces lois sont conformes aux transformations usuelles, par exemple celles relatives aux coordonnées spatio-temporelles :
    transformation de Lorentz quaternionique
    transformation de Lorentz quaternionique

L'écriture des équations de Maxwell requiert l'intervention de l'opérateur différentiel (bi)quaternionique, nabla, ∇ = √-1/c ∂t + i ∂x + j ∂y + k ∂z et de son conjugué, ∇- = √-1/c ∂t - i ∂x - j ∂y - k ∂z. Les lois de transformation pour ce nabla se notent, ∇' = exp[kθ/2] ∇ exp[-kθ/2] (idem pour ∇-), dans le cas des rotations spatiales, et ∇' = exp[kφ] ∇ exp[kφ] (mais ∇'- = exp[-kφ] ∇- exp[-kφ]), dans le cas des transformations pures de Lorentz.

On commence par dériver le champ, F, du potentiel, P, puis on condense les 8 équations scalaires de Maxwell en une seule :

  • F = - ∇P
  • -F = C

L'invariance des ces relations se démontre aisément en effectuant les transformations suivantes :

  • Dans le cas des rotations 3D, la loi de transformation est la même quel que soit le type de quaternion, Q, considéré (type quadrivecteur, position, R = √-1 c t + i x + j y + kz, nabla, ∇ ou son conjugué ∇-, potentiel, P, courant, C, ou champ, F). Elle s'écrit (pour une rotation en sens direct d'un angle θ autour de Oz) : Q' = exp(kθ/2) Q exp(-kθ/2). L'invariance annoncée résulte des enchaînements évidents suivants : 1) F' = - ∇'P' ⇒ exp(kθ/2) F exp(-kθ/2) = - exp(kθ/2) ∇ exp(-kθ/2) exp(kθ/2) P exp(-kθ/2), d'où F = - ∇P, après simplifications, et 2) ∇'-F' = C' ⇒ exp(kθ/2) ∇- exp(-kθ/2) exp(kθ/2) F exp(-kθ/2) = exp(kθ/2) C exp(-kθ/2), d'où ∇-F = C, après simplification.
  • Dans le cas d'une transformation de Lorentz proprement dite (selon Oz pour simplifier), l'invariance résulte des enchaînements suivants : 1) F' = - ∇'P' ⇒ exp(kφ) F exp(-kφ) = - exp(kφ) ∇ exp(kφ) exp(-kφ) P exp(-kφ), d'où F = - ∇P, après simplifications, et 2) ∇'-F' = C' ⇒ exp(-kφ) ∇- exp(-kφ) exp(kφ) F exp(-kφ) = exp(-kφ) C exp(-kφ), donc après simplifications, ∇-F = C.

Remarque finale : bien que l'on se soit contenté de cas particuliers (rotation autour du seul axe Oz et translation lorentzienne selon le même axe), les lois de transformations énoncées sont plus générales : il suffit de remplacer le quaternion, k, par N = i nx+j ny+k nz, pour que l'axe Oz soit remplacé par l'axe défini par la direction de N.

1, 2, 4, 8, 16, 31 !, ... et le problème de Moser

Problème de Moser
m=5 points : 10 cordes, 10 sommets, 18 arêtes, 16 (sur)faces

Le problème de Moser dispose m points au hasard sur le périmètre d'un cercle et il trace les m(m-1)/2 cordes possibles. Il pose alors les questions suivantes : combien la figure dessine-t-elle de sommets d'intersection, d'arêtes entre les sommets (y compris les arcs circulaires) et de (sur)faces élémentaires (y compris les secteurs circulaires) ? Ce problème illustre de façon amusante un problème connu d'extrapolation.

1) Les amateurs de soi-disant tests d'intelligence sont férus de questions demandant de compléter une suite donnée d'entiers. Les concepteurs ont une idée logique en tête et entendent récompenser ceux qui vont y adhérer spontanément. C'est ainsi que la séquence, 1, 2, 4, 8, 16, est présumée appeler la suite "naturelle", 32, 64, 128, ..., au motif qu'elle énumère les puissances successives de 2. Au fond, l'interrogateur attend que le candidat propose un programme (au sens informatique du terme) capable non seulement de restituer la séquence donnée mais encore de l'extrapoler dans le sens qu'il a présupposé. Dans l'exemple considéré, le programme attendu pourrait s'écrire simplement dans le langage informatique de votre choix, s1 = 1, sn = 2sn-1 (n = 2, 3, 4, ...).

2) Les esprits critiques ont pourtant beau jeu de faire remarquer que le problème est certainement mal posé et qu'il est facile de proposer d'autres programmes (en fait une infinité) restituant la séquence donnée mais l'extrapolant différemment, par exemple sous la forme, sm = 1, 2, 4, 8, 16, 31, 57, 99, ... (m = 1, 2, 3, ...) ou n'importe quelle autre de votre choix. On s'en convainc aisément en se donnant une formule d'extrapolation, f(m), comprenant autant de paramètres que de valeurs données (5 dans l'exemple) puis en cherchant quelles valeurs il convient de donner à ces paramètres pour que l'on ait, f(m) = sm, pour m = 1, 2, ..., 5. Un modèle simple possible est polynomial, f(m) = c0 + c1 m + c2 m2 + ... + c4 m4 et il exige de résoudre un système linéaire de 5 équations, f(m) = sm = 2m-1, à 5 inconnues, les c0, ..., c4. Le calcul (un brin fastidieux s'il est fait à la main) est détaillé en annexe (Notebook Mathematica) : il livre la formule d'extrapolation, f(m) = 1-3m/4+23m2/24-m3/4+m4/24. On vérifie sans peine que f(m) prend successivement les valeurs, sm = 1, 2, 4, 8, 16, 31, 57, 99, en accord avec les 5 premières valeurs données. Un autre modèle, par exemple inversément polynomial, fonctionnerait de la même façon, extrapolant la suite de départ, 1, 2, 4, 8, 16, de toute autre façon. Il n'y a pas de limite à la fantaisie extrapolatoire.

3) Il est pourtant possible de conférer un sens au problème posé en entrée, à condition de préciser un point. La (bonne) question n'est pas "Extrapolez 1, 2, 4, 8, 16" mais pourrait être "Ecrivez le programme le plus concis qui reproduit la suite, 1, 2, 4, 8, 16, dans le langage usuel de votre choix et voyez comment il poursuit l'énumération. Le programme énoncé précédemment, s1 = 1, sn = 2sn-1 (n = 2, 3, 4, ...), est tellement concis qu'on ne voit pas le moyen de faire plus court, c'est en cela qu'il justifie les attentes du concepteur du test. La longueur du programme le plus court qui imprime une suite après calculs définit la complexité de la suite au sens de Kolmogorov (Pour plus de détails, reportez-vous aux leçons sur la Théorie classique de l'information). C'est dans le cadre de la théorie de l'information que l'extrapolation "attendue", 1, 2, 4, 8, 16, 32, 64, 128, ... prend tout son sens.

Retour au problème de Moser

Le lecteur a compris que tout début de suite pouvait être prolongé algorithmiquement de façon tellement arbitraire qu'il est illusoire, dans la plupart des cas, d'espérer rencontrer une suite prolongée artificiellement dans un problème concret. Le problème de Moser évoqué en introduction est pourtant un exemple célèbre. Les figures suivantes illustrent la géométrie du problème dans les cas simples, m = 1, 2, 3, ..., 7, où les points extérieurs ont été ajoutés un à un au hasard sur les bords du cercle (Le fait de positionner les points au hasard sur le cercle garantit, avec la probabilité 1, que trois cordes ne sont jamais concourantes. Si ce cas se produisait, la figure dégénèrerait et ne conviendrait plus à l'illustration attendue).

Problème de Moser
Construction de Moser entre 1 et 7 points

Sur chacune de ces figures on peut vérifier la validité des dénombrements suivants. Lorsque m points extérieurs sont présents sur les bords du cercle, on dénombre :

  • m(m-1)/2 cordes. En effet, chaque point lance une corde vers ses m-1 voisins et au bilan elles sont comptées deux fois.
  • Cm4 = m(m-1)(m-2)(m-3)/24 sommets (= points) intérieurs. En effet, chaque sommet intérieur se trouve nécessairement à l'intersection de deux cordes définies par 4 points extérieurs; toutes les combinaisons sont distinctes et ne laissent aucun point ignoré. Il y a donc autant de points intérieurs que de façons de combiner m points 4 à 4. Si l'on comptabilise ensemble les sommets intérieurs et extérieurs, ils sont donc en nombre, S = m + Cm4.
  • 2Cm4 + m(m+1)/2 arêtes joignant les points voisins (intérieurs ou extérieurs), y compris les arcs de cercle. En effet, de chaque point intérieur émanent 4 segments rectilignes et de chaque point extérieur émanent m-1 segments rectilignes (un par corde émanant de ce point). Au total, chaque segment rectiligne étant compté deux fois, leur nombre total vaut : 2Cm4 + m(m-1)/2. Si l'on inclut les m arcs de cercles entre points extérieurs voisins, on trouve un nombre d'arêtes valant, A = 2Cm4 + m(m+1)/2.
  • Cm4 + Cm2 + 1 (sur)faces (élémentaires), celles-ci étant définies comme étant les portions d'aires comprises entre les arêtes adjacentes, y compris les m secteurs circulaires périphériques. Ce calcul fait appel à un cousin du théorème d'Euler, qui relie les nombres d'arêtes, de sommets et de faces de tout polyèdre convexe (par la relation universelle, S+F-A=2). Dans le problème plan qui nous occupe, la relation correcte s'écrit plutôt, S+F-A=1. On démontre celle-ci à partir de celle-là en partant de n'importe quelle figure de Moser, supposée parfaitement élastique, et en la déformant pour la faire sortir du plan de manière à reconstituer un polyèdre dont une seule face serait manquante (Celle qui correspondrait au périmètre déformé du cercle). Une démonstration directe par récurrence est également possible en démontant progressivement la figure de Moser par extractions successives d'une arête. Deux cas sont en effet possibles : 1) A et F diminuent d'une unité et S reste intact ou 2) A et S diminuent d'une unité et F reste intact mais dans tous les cas, S+F-A demeure constant. Lorsqu'il ne reste plus qu'une seule arête, S=2, F=0 et A=1, donc la constante ne peut valoir que 1. Le nombre de faces, F, se déduit donc du nombre des arêtes et des sommets et on trouve bien, F = Cm4 + Cm2 + 1.

Le nombre des faces s'écrit encore, en développant l'expression précédente, F = m(m-1)(m-2)(m-3)/24 + m(m-1)/2 +1, un polynôme de degré 4. On ne peut que retrouver le polynôme d'interpolation de degré 4 trouvé en introduction et de fait, on vérifie que l'on a bien, F = 1-3m/4+23m2/24-m3/4+m4/24.

Pour ceux qui veulent comprendre par quelle coïncidence 5 puissances successives de 2 interviennent dans l'inventaire des (Cm4 + Cm2 + 1) faces (pour m = 1, 2, 3, 4, 5), le plus simple est d'observer que les grandeurs, 1, Cm2 et Cm4, occupent les diagonales n°1, 3 et 5 du fameux triangle (symétrique) de Pascal, dont les lignes totalisent notoirement les puissances successives de 2. Les éléments intéressants pour le problème de Moser ont été imprimés en rouge pour faciliter les sommations. On voit qu'à partir de la 6ème ligne, le total vaut 31 et non 32 : on s'écarte inexorablement de la puissance de 2 naïvement espérée.

Triangle de Pascal
Triangle de Pascal (Les lignes sont numérotables : m = 1, 2, 3, etc)

Un problème géométrique élémentaire mais surprenant

Le problème suivant est a priori élémentaire et cependant si on procède à un sondage (en famille, à l'école, ...) en vue de collecter les réponses possibles, obtenues sans effectuer le moindre calcul mais en exerçant simplement son intuition, on se trouve confronté à une grande disparité de résultats. Le problème pourrait avantageusement être discuté en classe : il permettrait à des élèves de 14-15 ans de récapituler de façon ludique quelques notions qu'ils peinent éventuellement à assimiler. L'énoncé est le suivant :

  • On considère un terrain de football de 100 m de long. On tend une corde souple mais inextensible, longue de 100 m, entre les lignes de but et on la fixe à ses extrémités. La surface du terrain étant supposée plane, la corde est forcément parfaitement rectiligne, rien de particulier à ce stade.
  • Si on allonge la corde d'un mètre, sans toucher à ses extrémités qui demeurent fixées, elle mesure à présent 101 m et elle cesse d'être parfaitement rectiligne, lézardant sans doute un (petit) peu. Il est à présent possible de saisir la corde entre le pouce et l'index, soit en son milieu soit quelque part près d'une extrémité de telles manières que, tendue à la verticale de la ligne médiane (cas 1) ou de celle de but (cas 2), elle dessine l'un ou l'autre des motifs représentés ci-après en vue de profil (Pas forcément à l'échelle !).
  • La question posée est : pouvez-vous estimer (deviner), à l'intuition seulement, l'ordre de grandeur de la hauteur, h, que la corde atteint dans les deux cas de figure envisagés ? Personne ne se trompe dans le cas n°2 : de fait la portion oblique de corde mesurant visiblement un peu plus de 100 m, la portion verticale (précisément égale à h) ne peut qu'être légèrement inférieure à 1 m, la valeur exacte ne pouvant résulter que d'un calcul détaillé qui n'est pas demandé à ce stade. Il n'en va pas de même dans le cas n°1 : faites un sondage autour de vous, vous récolterez probablement des avis divergents, compris entre 20 cm et 4 m (voire davantage mais avec une concentration nette en-dessous d'un mètre).
Corde tendue
Cordes (mesurant 100 m ou 101 m) tendues entre deux extrémités distantes de 100 m
(Echelle non nécessairement respectée !)

Pour contrôler les résultats exacts dans chaque cas, un calcul s'impose qui est à la portée de n'importe quel collégien au fait du théorème de Pythagore et capable de mettre un système en équations puis de le résoudre. Tant qu'à faire, effectuons le calcul dans le cas général où la corde est pincée en un point quelconque et épouse le profil final suivant :

Corde tendue
Cas général (Echelle non respectée !)
Système d'équations

Les contraintes géométriques et l'application répétée du théorème de Pythagore aux deux triangles rectangles de la figure précédente imposent le système ci-contre, duquel il convient de tirer h en fonction de u. Soustrayant membre à membre les équations 3 et 4 donne immédiatement : v2 - u2 = c2 - b2, soit encore, 100(v-u) = 101(c-b). En combinant cette équation avec b+c=101, on a ce qu'il faut pour tirer b (et c) en fonction de u. On trouve par exemple (et cela suffit) : b = 101/2 - 100/101 (50-u). En introduisant ce résultat dans la troisième équation, on trouve la réponse souhaitée sous la forme : h2 = [101/2 - (100/101)(50-u)]2 - u2, soit finalement :

Résultat du calcul

On détaille aisément les deux cas proposés :

  • Cas 2 (u=100 et v=0 ou, ce qui revient au même, u=0 et v=100) : h = 50.5 - 5000/101 = 201/202 = 0.995 m. Aviez-vous prédit d'être si proche de 1 m ?
  • Cas 1 (u = v = 50) : h2 = 201/4, d'où h = 7.088 m !

On peut représenter graphiquement la solution, dans le cas général, en affichant la hauteur, h, atteinte selon la valeur de u. La courbe dessinée est manifestement le lieu des points dont la somme des distances aux points fixes de coordonnées (u, h) = (0, 0) et (100, 0) est constante, en effet b+c=101; c'est donc une ellipse très aplatie dont les foyers sont précisément situés en ces points (Ne vous fiez pas aux échelles du graphique, en u et en h, qui sont très différentes !).

Profil final
Cas général (Echelles non proportionnelles !)

Il est facile de voir que la formule trouvée ci-dessus, b = 101/2 - 100/101 (50-u), est équivalente à l'équation de cette ellipse en coordonnées polaires, (b, θ). Il suffit de noter sur la figure générale précédente que l'angle θ est tel que u = b cos(θ). En faisant le remplacement, on trouve alors, après simplifications, l'équation polaire d'une ellipse de distance focale, FF' = 100, et d'excentricité, e = 100/101 :

Equation polaire de l'ellipse
Profil elliptique

On note que le grand axe excède légèrement 100 m, précisément 101 m, valeur calculée d'après la valeur de b = 201/2, en θ = 0. C'était prévisible puisque cela correspond à l'étalement de la corde tendue horizontalement en arrière de l'un quelconque des deux buts.

Parvenu à ce stade, on aperçoit une méthode d'estimation mentale directe de la hauteur h atteinte par la corde tendue à la verticale du milieu du terrain. Le cosinus de l'angle θ vaut clairement 50/50.5 = 100/101, dans ce cas. Pour trouver h, on a besoin de la tangente de θ (car h = 50 tgθ). Or celle-ci est reliée au cosinus par la formule classique, 1 + tg2θ = 1/cos2θ. L'inverse du cosinus valant exactement 1.01, son carré vaut 1.02 avec une excellente approximation donc tg2θ est (très) proche de 2/100 et tgθ est également proche de ✓2/10 = 0.141. Au bilan 2h est proche de 14.1 donc h de 7.05. Dans ce cas précis, il n'y a sans doute pas moyen de faire plus court dans l'estimation de h.

In memoriam John Horton Conway (1937-2020)

CD Herschel

Le Covid19 a eu raison de John Horton Conway, l'un des mathématiciens les plus remarquables de notre temps. Il a fait des recherches dans divers domaines des mathématiques, Théorie des Groupes, Géométrie topologique, Automates cellulaires, Algorithmique, etc, mais le point remarquable qui l'a distingué de la plupart de ses collègues, c'est qu'il a tenté de mettre ses résultats à la portée du plus grand nombre toutes les fois que cela s'est avéré possible. Il s'est montré particulièrement habile pour déconstruire des théories complexes, parfois abstraites, et leur trouver des illustrations ludiques dans le domaine prisé des mathématiques récréationnelles (Cf : E. R. Berlekamp, J. H. Conway and R. K. Guy, Winning Ways for Your Mathematical Plays, A K Peters/CRC Press; 2nd edition, 2004) :

  • Il a fait fortune intellectuelle auprès des amateurs distingués en concevant le plus célèbre des automates cellulaires, désormais connu sous le nom de Jeu de la Vie (Vous trouverez les règles simples du jeu à cette adresse). Cet automate a ultérieurement été démontré équivalent à une machine de Turing universelle, c'est-à-dire capable de calculer tout ce qui est calculable sous réserve d'un codage adéquat. Avec le temps, une communauté active s'est développée à laquelle n'importe quel amateur (doué !) peut contribuer (Voici un exemple qui propose simultanément plusieurs sous-structures aux comportements caractéristiques : invariantes, périodiques, mobiles, etc). Pour vous donner une idée des prouesses réalisées en matière de codage, visitez le musée des oscillateurs connus, c'est à dire des structures qui se répètent périodiquement en suivant les règles prescrites par Conway.
  • Il a récidivé avec son langage minimaliste Fractran évoqué ailleurs sur ce site.
  • Vous trouverez encore sur ce site son algorithme de résolution du problème des 12, 39, 120, ..., boules, celui du calcul de la date de Pâques ou encore, ci-après, cette méthode simplifiée du calcul du jour correspondant à une date donnée.

Le problème posé est lié à celui de la construction d'un calendrier perpétuel (grégorien, celui que nous utilisons actuellement). Pour rappel, le calendrier grégorien (Du nom du pape de l'époque, Grégoire XIII) a remplacé son homologue julien en octobre 1582. Le calendrier julien reposait sur une année fictive comportant 365,25 jours : il comptabilisait le quart de jour excédentaire en imposant une année bissextile de 366 jours tous les 4 ans. Lorsqu'on s'est rendu compte, par un ensemble de mesures astronomiques de la position du soleil, que la vraie valeur tournait plutôt autour de 365,2422 jours, on a été amené à modifier le critère de reconnaissance des années bissextiles selon la règle : les années "multiples de 4 non multiples de 100" ou (inclusif !) les années "multiples de 400". Ce nouveau mode de calcul est meilleur car il table sur une année de 365,2425 jours mais il n'est clairement pas encore parfait (Il faudrait sans doute retirer une année bissextile tous les 4000 ans environ mais à cette échelle temporelle il plane des incertitudes 1) sur la trajectoire terrestre et 2) sur la capacité de l'espèce humaine à se maintenir en vie). Les subtilités relatives au calcul des années bissextiles compliquent l'établissement d'une formule attribuant un jour de la semaine à n'importe quelle date donnée d'avance, sous la forme, d(ay)-m(onth)-y(ear). Ne m'en veuillez pas d'utiliser trois mots anglais mais c'est par respect pour Mike Keith qui a publié la formule réputée la plus simple (Journal of Recreational math. Vol 22 (1980), p 280). Elle s'écrit, j'adapte les notations (accrochez-vous quand même !) :

jour(d,m,y) = Mod[ div(23m,9) + d + 4 + y + div(z,4) - div(z,100) + div(z,400) - If[m≥3,2,0] , 7]

où on a posé : z = If[m≥3,y,y-1].

(Notation : div(a,b) est le quotient entier de a par b, Mod[a,b] est le reste entier laissé par ce quotient et If[condition, a, b] vaut a si la condition est remplie et b sinon. Le résultat est un entier compris entre 0 et 6 qui désigne le jour cherché en commençant par 0 pour dimanche).

Sauf à la programmer, personne n'utilisera jamais cette formule bien trop compliquée. Si vous tenez néanmoins à connaître le jour de votre prochain anniversaire ou de tout autre événement qui vous tient à coeur, Conway a pensé à vous en simplifiant considérablement la procédure. Vous devez simplement connaître le "jour pivot" de l'année qui vous intéresse. Toute année possède son jour pivot; par exemple, en 2020, c'est un samedi. La méthode de Conway vous assure que les jours suivants tombe toujours le jour pivot de l'année en cours :

  • Les 4/4, 6/6, 8/8, 10/10 et 12/12 (En effet, à partir de mars, les couples de mois consécutifs comportent 61 jours et 61+2=63 est multiple de 7).
  • Le dernier jour de février peu importe qu'il comporte 28 ou 29 jours, ainsi que les jours de mars multiples de 7 (donc les 7/3, 14/3, 21/3 et 28/3 car le dernier jour de février pourrait aussi bien s'appeler le 0 mars).
  • Le 3 janvier si l'année est ordinaire (365 jours) et le 4 janvier si elle est bissextile (Retenez 3 et 4, c'est facile).
  • Enfin pour les mois restants, débrouillez-vous pour retenir : les 5/9 et 9/5, d'une part, et les 7/11 et 11/7, d'autre part (Observez, par exemple, que 11-7 = 9-5 = 4).

Connaissant le jour pivot vous êtes assez grand pour trouver le jour qui vous intéresse. Par exemple, si l'anniversaire de votre conjoint tombe un 8 octobre, sachant qu'en 2020, le 10/10 est un samedi (le pivot), la réponse est un jeudi.

Encore faut-il connaître le jour pivot pour l'année considérée : il progresse en général d'un jour par année (en 2021, ce sera un dimanche et en 2022 un lundi car 365 est multiple de 7 plus 1) mais attention aux années bissextiles car on saute un jour supplémentaire vu que 366 est multiple de 7 plus 2 ! En cas de doute, voici la formule exacte :

jour_pivot(y) = Mod[2+y+div(y,4)-div(y,100)+div(y,400), 7]

Exemple : jour_pivot(2020) = Mod[2+2020+505-20+5, 7]=Mod[2512,7]=6 → samedi

Vous le constatez, aussi brillant qu'il ait été dans des domaines qui échappent au commun des mortels, Conway a pensé à vous dans de menus problèmes de la vie de tous les jours. Ne manquez pas, en retour, de penser à lui, là où il repose à présent.