Math

Quelques problèmes mathématiques curieux ou amusants

Cette section, en construction permanente, présente des questions de mathématiques, exotiques ou amusantes.

Le Problème de Steiner


Ou comment résoudre un problème variationnel complexe avec de l'eau savonneuse.

L'étonnante équation différentielle de Lee Rubel

Il y a 30 ans déjà, Lee Rubel a publié un résultat étonnant (Bull. Am. Math. Soc. 4, pp345-349 (1981)), présenté ci-dessous de façon informelle. Les détails analytiques sont reportés en annexe (Notebook Mathematica).

Il est bien connu que toute équation différentielle définit une famille de fonctions. Ainsi l'équation linéaire (d'ordre 2 et de degré 1), y''(x) + y(x) = 0, définit la famille des fonctions trigonométriques de base, sinus et cosinus. Pour des raisons de commodité, on a donné un nom aux solutions des équations utiles aux physiciens (et aux autres !) mais qu'il soit bien clair que les autres équations ne sont pas moins respectables : du moment qu'elles ne sont pas sensibles aux conditions initiales, elles définissent d'autres familles de fonctions qui seront peut-être utiles à leur tour. Rubel a trouvé une équation différentielle d'ordre 4 et de degré 7 qui possède une solution approximant, à moins de epsilon près (epsilon aussi petit que l'on veut), n'importe quelle fonction infiniment continûment dérivable ! Certes cette équation n'est pas simple mais il n'empêche que le résultat est surprenant. L'équation s'écrit :

12 y''7 - 29 y'2y''3y'''2 - 12 y'3y''y'''3 + 24 y'2y''4y'''' + 6 y'3y''2y'''y'''' - 4 y'4y'''2y'''' + 3 y''''2y''y'4 = 0

Comment une telle prouesse est-elle possible ? Observons que la fonction exponentielle, y(x)= exp(a x), satisfait l'équation de Rubel et en cherchant bien on en trouverait beaucoup d'autres. Cependant une fonction choisie au hasard, par exemple, y(x) = sin(x), ne la satisfait pas. Ce que le théorème de Rubel affirme c'est qu'il existe un jeu de conditions initiales qui garantit que la solution correspondante est aussi peu distante que l'on veut de la fonction sin(x) ou d'ailleurs de n'importe quelle autre, infiniment continûment dérivable. L'idée est d'approximer la fonction donnée par un modèle adéquat, sur une suite d'intervalles consécutifs, d'autant plus étroits que la précision exigée est grande. Le modèle considéré par Rubel se note :

Fonction de Rubel

Il est viable parce qu'il possède quelques propriétés remarquables :

  • f(a) = ya et f(b) = yb. Autrement dit, le modèle relie, comme souhaité, les points (a, ya) et (b, yb), situés aux extrémités de l'intervalle (a,b).
  • f(x) satisfait l'équation de Rubel. Cela est trivial en-dehors de l'intervalle (a,b) puisque le modèle y est constant mais c'est également vrai à l'intérieur.
  • Sur l'intervalle (a,b) le modèle s'écarte aussi peu que l'on veut de la fonction donnée, à condition de respecter les limites, f(a)=ya et f(b)=yb, aux extrémités a et b et de rapprocher suffisamment b de a.
  • Le raccord du modèle entre deux intervalles consécutifs, (a,b) et (b,c) se fait sans problème grâce aux propriétés remarquables de f(x) : les deux modèles se raccordent, de fait, infiniment continûment au point commun, x=b, car toutes les dérivées y sont nulles.

Si l'un des objectifs de la science consiste à trouver un modèle théorique qui colle à la réalité expérimentale, on constate que l'équation de Rubel apparaît comme universelle au sens où elle rend compte de n'importe quel ensemble de données échantillonnant un phénomène continu. Cependant il faut bien comprendre que cette équation ne possède aucune vertu prédictive dans la mesure où on a déplacé le problème au niveau de la recherche des conditions initiales qui induisent la solution cherchée. Etant donnée une fonction, aucune procédure algorithmique ne peut révéler les conditions initiales à introduire dans l'équation de Rubel afin de calculer la solution qui l'approxime à moins de epsilon près. Cette non-calculabilité limite évidemment l'intérêt de la découverte de Rubel.

On a proposé d'autres équations universelles, plus simples, telles celles de Duffin,

m y'''' y'2 - (3m-2) y''' y'' y' + (2m-2) y''3 = 0
(m>3 est un paramètre entier, au choix) mais les solutions ne sont plus infiniment continûment dérivables.

Trois candidats à la roulette russe

Aucun domaine des mathématiques n'est plus délicat que le calcul des probabilités : l'intuition y est régulièrement mise à mal, au point que les pseudo-paradoxes abondent. Celui des tireurs-fous est particulièrement spectaculaire. Trois amateurs de roulette russe (que nous nommerons A, B et C) conviennent d'adhérer au protocole suivant :

  • Tous ne sont pas mis sur un pied d'égalité : une roulette indépendante décide de charger le pistolet de A avec la probabilité a, celui de B avec la probabilité, b, et celui de C avec la probabilité, c. On a : 1>a>b>c>0. Les joueurs sont au courant de cette différence et ils l'assument.
  • Un autre tirage aléatoire décide d'un ordre immuable parmi les 6 possibilités, ABC, ACB, ..., CBA, et chacun tirera à son tour, dans cet ordre. Si un tireur meurt, les deux survivants continuent à tirer dans l'ordre restant.
  • Tout "joueur" peut a priori tirer en l'air ou sur la cible de son choix, sauf qu'il doit impérativement retenir l'option qui lui laisse la meilleure chance de survie. Ensuite, c'est au tour du deuxième joueur de faire pareil et ainsi de suite, jusqu'à épuisement des combattants.

On demande de déterminer la meilleure stratégie de chacun et de calculer les probabilités de survie respectives.

Solution

Une analyse préalable permet de dégrossir le problème : le lecteur se convaincra facilement que la meilleure stratégie, pour A comme pour B (les mieux armés), consiste à tirer sur le rival le plus dangereux (respectivement B et A). Dans tous les cas de figure, on a que la probabilité de survie de A est au moins égale à celle de B, ce qui ne laisse que trois possibilités (on ignore les cas d'égalités en nombres négligeables) : 0 < pc < pb < pa < 1 (cas 1), 0 < pb < pc < pa < 1 (cas 2) et 0 < pb < pa < pc < 1 (cas 3). C'est ce que l'intuition suggère et ce qu'un calcul facile confirme. Par contre, la meilleure stratégie pour C est bien moins évidente : en fait, tant que les trois tireurs sont en vie, C a intérêt à tirer en l'air, ce qui assure que A et B se rencontreront au tour suivant ! Il y a encore plus fort : sous certaines conditions peu contraignantes et relatives aux valeurs de a, b et c, il peut se faire que C possède la meilleure probabilité de survie !

Graphe de Markov
Graphe de Markov

Le graphe de Markov du problème est composé de 11 états, 8 états internes (numérotés de 1 à 8) et de 3 états de bord (numérotés de 9 à 11). Les états internes ont été coloriés différemment selon le nombre de tireurs demeurant en vie à chaque stade. Les états de bord sont absorbants : une fois un de ces état atteint, le système s'arrête, désignant le survivant.

Il existe plusieurs méthodes de résolution d'un tel graphe. La méthode matricielle repose sur les matrices de transition entre états internes, Q8x8=(pi,j), et vers les états de bord, S8x3=(pi,j) :

Transitions entre états internes
Transitions vers les états de bord

La ligne 1 du produit matriciel, (Id8x8-Q)-1.S, livre les probabilités, pa, pb et pc. Le détail des calculs figure en annexe (Notebook Mathematica).

Probabilités de survie

On peut représenter les zones de l'espace 3D correspondant aux trois cas possibles : une figure fixe la portion d'espace tétraédrique disponible, 0 < c < b < a, et l'autre délimite les zones, 1, 2 et 3, dans l'ordre ascendant. On note que la zone 3 (la partie supérieure du tétraèdre) est loin d'être négligeable.

Zones
Zones 1, 2 et 3
Espace disponible
Espace disponible

Chute libre sur un centre fixe et oscillateur harmonique : le changement de variables de Sundman

Le problème de la chute d'un corps massif, assimilé à un point matériel, sur un centre attractif ponctuel est classique. L'équation de mouvement est celle de Newton, qui, débarrassée des constantes inutiles, peut s'écrire (le choix opéré des conditions initiales est inessentiel) :

Equation de Sundman

Bien que singulière en x=0, cette équation est intégrable en termes de fonctions élémentaires et sa solution se note, en forme inversée :

Solution inversée de l'équation de Sundman
Graphe de la solution de l'équation de Sundman

La singularité évoquée correspond clairement à la collision du point avec le centre qui, vu les conditions initiales retenues, se produit en,

Temps de chute sur le centre

. Une procédure d'intégration numérique se heurte inévitablement à la présence de cette singularité, interdisant toute prolongation numérique de la solution au-delà de cette limite. Cependant Karl Frithiof Sundman (1873-1949) fut le premier à montrer que cette singularité peut être rectifiée, permettant la prolongation sans limite de temps. Physiquement, le point matériel est autorisé à rebondir élastiquement sur le centre ce qui débouche sur un mouvement périodique de période,

Période d'oscillation

Karl Frithiof Sundman (1873–1949) est un astronome finlandais connu pour avoir effectivement résolu, en 1906-1908, le problème à 3 corps en interaction gravitationnelle. La solution qu'il a trouvée s'exprime sous la forme d'un développement en série uniformément convergent pour toute valeur de la variable temps. Hélas la vitesse de convergence est tellement faible que la série est inexploitable en pratique. L'essentiel du travail de Sundman a consisté à régler le problème des singularités qui lorsque N=3 coïncident avec les collisions (Cette solution a depuis été généralisée aux valeurs supérieures de N par Q. D. Wang).


Le changement de variables de Sundman, (x,t) → (X,T), se note,

Changement de variables de Sundman

et les calculs s'amorcent comme suit :

Développements du calcul de Sundman

L'équation de Newton pour la chute libre se transforme dès lors en (ne pas confondre la notation pointée qui désigne la dérivée par rapport à t et la primée qui désigne la dérivée par rapport à T; E est l'énergie conservée du point) :

Equation de Newton

La dernière transformation fait appel à la conservation de l'énergie, traduite en terme des variables X et T, soit : 2 X' 2 - 1 = E X2). Le lecteur intéressé trouvera l'automatisation des calculs en annexe (Notebook Mathematica). On observe que le changement de variables a pour effet d'autoriser le prolongement de la chute libre au-delà de la singularité naturelle que représente la collision avec le centre assimilé à un réflecteur parfait. En terme des nouvelles variables et vu les conditions initiales retenues, le mouvement prolongé est celui d'un oscillateur harmonique, d'équation,

Oscillation de Sundman

. Il est alors possible de trouver la relation

Temps réel versus temps virtuel

qui relie le temps réel, t, au temps virtuel, T, compte tenu des correspondances initiales,

TODO

. Le lecteur motivé peut revenir aux coordonnées naturelles par le changement de variables inverse, (X,T) → (x,t), et retrouver la solution, t(x), calculée au début. Le graphe de la solution prolongée se présente comme suit :

Graphe des oscillations de Sundman

Poincaré ou Fibonacci ?

La transformation du chat d'Arnold est fréquemment proposée comme une illustration ludique du théorème du retour de Poincaré. Seuls les bons auteurs font remarquer qu'il n'en est rien car cette transformation illustre avant tout les propriétés de divisibilité des nombres de Fibonacci.

Transformation d'Arnold
Transformation d'Arnold

La transformation d'Arnold s'applique aux points du pavé carré de côté, c, qu'elle déforme selon une loi linéaire modulo c,

Transformation d'Arnold

En l'absence du modulo, le carré (contour noir sur la figure) se trouverait déformé en parallélogramme (contour rouge). L'opération modulo a pour effet de découper ce parallélogramme en 4 triangles et de les recoller exactement dans le carré primitif car la transformation préserve les aires. L'opération peut être recommencée autant de fois que l'on veut et on conçoit qu'une image quelconque occupant le carré primitif se trouve progressivement brouillée au point de devenir rapidement méconnaissable. Arnold a le premier fait subir cette transformation à l'image d'un chat d'où son nom.

Une solution analytique est théoriquement possible puisque la transformation est linéaire à un modulo près :

Solution de la transformation d'Arnold

où, Fn = ..., 1, 0, 1, 1, 2, 3, 5, 8, ..., désigne la suite des entiers de Fibonacci (n = ..., -1, 0, 1, 2, 3, 4, 5, 6, ...).

Si on applique la transformation d'Arnold à l'ensemble non dénombrable des points occupant le carré primitif, il devrait être clair qu'aussi loin qu'on réitère l'opération, jamais tous ces points ne reviendront simultanément à leur emplacement initial. En effet, les points pour lesquels une périodicité, N, peut se produire ne constituent qu'un ensemble dénombrable, typiquement celui des solutions (x0, y0), du système,

Solution analytique au problème d'Arnold

(On trouvera les détails en annexe (Notebook Mathematica)).

Autrement dit, jamais une image de résolution infinie ne réapparaîtra intacte. Une image n'est jamais de résolution infinie et on peut se demander ce qu'il advient d'une image discrétisée selon une grille comptant cxc pixels. Le nombre des cellules élémentaires étant fini (c2) dans ce cas, le nombre total des images possibles est également fini quoique très grand (2cxc). La réapparition de l'image initiale devient, à présent, une certitude programmée dans un temps probablement très grand mais néanmoins fini.

Si l'on expérimente la transformation sur une image initial de taille, c, on observe que le temps de retour est étonnemment court. L'exemple retenu est celui d'une image de la lettre R, discrétisée selon une trame comportant 64x64 pixels : l'image réapparaît au bout de 48 itérations.

Pixellisation 64x64
Pixellisation 64x64
Itérations d'Arnold de la grille 64x64
Itérations d'Arnold de la grille 64x64

Si on rogne l'image en supprimant un cadre extérieur de largeur n, sa dimension s'en trouve réduite à la valeur (64-2n)x(64-2n) : le phénomène de retour précoce subsiste mais le temps de retour change assez irrégulièrement.

Transformation d'Arnold, modèle rogné
Modèle rogné

Le calcul de la période de retour s'effectue comme précédemment mais cette fois, on impose que les coordonnées, (xn, yn), appartiennent en permanence (= pour tout n) à l'ensemble discret, {0, 1, 2, ..., c-1) :

Calcul de la période de retour

La période cherchée vaut alors la plus petite valeur de N telle que F2N = 0 (mod c) & F2N-1 = 1 (mod c). Le lecteur curieux vérifiera la validité de cette règle, publiée par Freeman Dyson et Harold Falk dans la revue, The American Mathematical Monthly 99 (1992) 603-614, sur les 6 exemples numériques proposés ou il se reportera à l'annexe.

De nombreux auteurs ont voulu voir dans cette expérience numérique une illustration du théorème du retour de Poincaré. Rappelons brièvement en quoi il consiste : un système dynamique instable dont le point représentatif évolue dans un espace des phases borné, y suit une trajectoire chaotique : deux trajectoires initialement proches subissent une divergence localement exponentielle et des repliements successifs qui les séparent définitivement. Toutefois si on découpe l'espace des phases en cellules même microscopiques, un moment viendra où la trajectoire repassera par la même configuration locale, autrement dit, à condition d'être patient le système finira par repasser aussi près que l'on veut de sa configuration de départ. Toutefois cette éventualité ne se produira qu'auterme d'un temps extraordinairement long, sans commune mesure avec ce qu'on observe dans le cas des images discrétisées. Celui-ci est, en fait, la conséquence des propriétés remarquables de divisibilté des entiers de Fibonacci.