L’autre conjecture de Goldbach

Si je vous disais que j’ai résolu la conjecture de Goldbach et que cela m’a pris en tout et pour tout 5 minutes, vous me croiriez ? Probablement pas. Et pourtant…

Vous connaissez sans doute la grande conjecture de Goldbach, qu’il a énoncée en 1742  et  qui dit que tout nombre pair supérieur ou égal à 4 peut s’écrire comme la somme de deux nombres premiers. Par exemple, 12 = 5 + 7  ou encore 30 = 13 + 17 = 11 + 19. On pense que cette conjecture est probablement vraie même si, plus de 3 siècles après qu’elle a été énoncée, on n’a toujours pas été capable de la démontrer.

Cependant, je vous arrête tout de suite, ce n’est pas de cette conjecture-là dont il sera l’objet ici. Oh, je sens votre déception, mais attendez un peu avant de me vilipender… Car peu de gens le savent, mais Goldbach avait énoncé une autre conjecture en 1752 qui, elle, est complètement tombée aux oubliettes. Et pour cause, celle-là est fausse !

Quelle est donc cette conjecture dont personne ne parle et dont tout le monde se fout ?

Dans une lettre à Euler datée du 18 Novembre 1752, Goldbach formulait la conjecture suivante (qu’il pensait être vraie):

 Tout nombre impair est de la forme p+2a²a est un entier et où p est soit un nombre premier, soit 1.

Par exemple, 9 = 7 + 2 \times 1^2 ou encore 35 = 17 + 2 \times 3^2.

Goldbach énonce sa conjecture à Euler. Il est amusant de constater que Goldbach écrivait dans un mélange d'allemand et de latin !

Goldbach énonce sa conjecture à Euler (le nombre 1 était inclus dans la définition des nombres premiers à l’époque). Il est amusant de constater que Goldbach écrivait dans un mélange d’allemand et de latin !

A la lecture de la lettre de Goldbach, Euler se mit en tête de vérifier cette conjecture. Il envoya une réponse à Goldbach un mois plus tard (le 16 Décembre 1752) pour lui dire qu’il avait vérifié que cette conjecture était vraie pour tous les nombres impairs jusqu’à 1000.

reponse_correspondance_Goldbach_Euler_16_decembre_1752_

Euler répond à Goldbach pour lui dire qu’il s’est tapé tous les nombres impairs jusqu’à 1000. Lui aussi parle dans un mélange d’allemand et de latin… c’était sans doute le parler djeun’s de l’époque !

Mais Euler ne lâcha pas l’affaire aussi vite: il envoya une nouvelle lettre à Goldbach 5 mois plus tard (le 3 Avril 1753) pour lui dire qu’il avait testé tous les nombres impairs jusque 2500 et que tous vérifiaient bien cette conjecture !

Pauvre Euler… Il aurait pu continuer comme ça longtemps sans pouvoir infirmer la conjecture. Et pour cause, le premier contre-exemple arrive bien plus tard…

Résolution informatique

Certes, nous avons beaucoup (mais alors beaucoup…) moins de talent et de génie qu’Euler, mais nous avons à notre disposition des ordinateurs ! Je vous propose donc de démontrer que cette conjecture est fausse à l’aide d’un programme qui exhibera un contre-exemple, c’est-à-dire un nombre impair qui ne peut pas s’écrire sous la forme p+2a².

Voici le programme que j’ai écrit pour tester chaque nombre impair jusqu’à ce que l’on tombe sur un qui mette en défaut la propriété:

Réfutation de l’autre conjecture de Goldbach

Et voici ce qu’on obtient:

autre_conjecture_Goldbach_algorithme_affiche_la_reponseEt voilà ! La conjecture est fausse car 5777 ne peut pas s’écrire comme la somme d’un nombre premier (ou 1) et du double d’un carré. En fait, si on teste de manière exhaustive tous les nombres impairs jusqu’à 10 000, on trouve qu’il y a un autre contre-exemple: 5993.

Bien qu’à nous il ne nous a fallu que quelques centièmes de seconde avec notre programme pour trouver ces contre-exemples de 5777 et 5993, historiquement, il a fallu attendre 1856 pour que le mathématicien Stern et ses élèves trouvent  ces deux valeurs et démontrent ainsi que la conjecture est fausse. Contrairement à Euler, ils ont eu le courage de vérifier tous les nombres jusque 9000 ce qui leur a permis de trouver ces deux contre-exemples. Mais honnêtement, comment en vouloir à Euler de s’être arrêté à 2500…

Une démonstration mathématique

La démonstration informatique donnée plus haut est correcte (quoiqu’il y a débat si une preuve informatique est une vraie preuve), mais elle laisse tout de même un goût d’inachevé. Le programme nous dit que 5777 ne vérifie pas la conjecture sans qu’on voit vraiment pourquoi. Je vous propose d’essayer de le prouver par des raisonnements plus jolis, qui permettent de faire un minimum de calculs. Allons-y !

1) Le cas trivialement imposssible

Commençons par écarter un premier cas: on ne peut avoir de relation de la forme 5777 = 1 + 2a^2 car dans ce cas on aurait a^2 = 2888 . Cela est impossible parce qu’un carré parfait ne peut jamais se finir par un 8. Pour s’en convaincre, il suffit de regarder tous les cas possibles modulo 10:

Comme on le voit dans la ligne du bas, le dernier chiffre d’un carré est soit 0, 1, 4, 5, 6 ou 9. Le nombre 2888 ne peut donc pas être un carré.

2) Le cas général

Supposons qu’il existe un nombre premier p et un entier a tels que 5777 = p + 2a^2. On peut d’abord resserrer l’étau autour du nombre a car l’égalité précédente entraîne 5777 \geqslant 2a^2 ce qui donne a \leqslant \sqrt{\frac{5777}{2}} < 54. Le nombre a peut prendre toute les valeurs entre 0 et 53. Nous n’allons évidemment pas tester ces 53 cas, oh non… Nous allons faire plus amusant que cela: une partie de Bingo !5777_grille_bingo_viergeJe m’explique: en écrivant l’égalité 5777 = p + 2a^2 , on obtient la relation p = 5777 - 2a^2 que nous allons regarder modulo 3, 5, 7, 11 et 13, ce qui nous donnera des conditions nécessaires sur le nombre a et nous permettra de barrer plein de cases !

a) Relation prise modulo 3

Comme 5777 \equiv 2 \mod[3], on peut obtenir la factorisation suivante:

p = 5777 - 2a^2 \equiv 2 - 2a^2 \equiv 2(1-a^2) = 2(1-a)(1+a) \mod [3]

Souvenons-nous que p est un nombre premier, donc on ne peut avoir p \equiv 0 \mod [3] (cela voudrait dire que p est divisible par 3) sauf si p=3. Mais, si on avait p=3, on aurait 5777 = 3 + 2a^2 donc a^2 = 2887 ce qui est impossible car un carré ne peut se finir par 7. Nous avons donc forcément p \not\equiv 0 \mod[3] ce qui entraîne 2(1-a)(1+a) \not\equiv 0 \mod[3]. Or,

2(1-a)(1+a) \equiv 0 \mod [3] \Leftrightarrow 1-a \equiv 0 \mod [3] \text{ ou } 1+a \equiv 0 \mod [3]

(on a pu se débarrasser du 2 dans cette équation car 2 est premier avec 3 et donc 2 est inversible modulo 3) donc

a \equiv 1 \mod [3] \text{ ou } a \equiv -1 \equiv 2 \mod [3]

Tout cela est bien beau mais qu’avons-nous démontré ? Tout simplement que si 5777 = p + 2a^2 alors nécessairement a ne peut pas être congru à 1 ou 2 modulo 3. Ainsi, dans notre grille de Bingo, nous pouvons donc barrer tous les nombres a qui sont congrus à 1 ou 2 modulo 3:

5777_grille_bingo_modulo_3b) Relation prise modulo 5

Comme 5777 \equiv 2 \mod [5], on aura la même factorisation que précédemment:

p = 5777 - 2a^2 \equiv 2 - 2a^2 \equiv 2(1-a^2) = 2(1-a)(1+a) \mod [5]

Puisque p est premier, on a soit p=5 ou bien p \not\equiv 0 \mod[5]. Mais p=5 est impossible car sinon on aurait 5777 = 5 + 2a^2 donc a^2=2886, ce qui est absurde car un carré ne peut pas se terminer par 86 (en faisant un raisonnement modulo 100, on peut montrer que les deux derniers chiffres d’un carré sont 00, 01, 04, 09, 16, 21, 24, 25, 29, 36, 41, 44, 49, 56, 61, 64, 69, 76, 81, 84, 89, ou 96). Ainsi, on a forcément p \not\equiv 0 \mod[5], ce qui va nous donner une nouvelle condition nécessaire sur a. En effet,

p \equiv 0 \mod [5] \Leftrightarrow 2(1-a)(1+a) \equiv 0\mod[5]

ce qui entraine

a \equiv 1 \mod[5] \text{ ou } a \equiv -1 \equiv 4\mod[5]

Dans notre grille de Bingo, il faut donc barrer tous les nombres qui sont congrus à 1 ou à 4 modulo 5:

5777_grille_bingo_modulo_5c) Relation modulo 7

Il se trouve qu’on a encore 5777 \equiv 2 \mod[7], donc exactement comme auparavant p \equiv 2(1-a)(1+a) \mod[7].

De plus, p=7 est impossible car sinon on aurait 5777 = 7 + 2a^2 c’est-à-dire a^2 = 2885. Comme ce nombre se termine par 85, ce n’est pas un carré. Ainsi, p \not\equiv 0 \mod[7] et un calcul identique à ce qu’on fait plus haut montre que a ne peut pas être congru à 1 ou 6 modulo 7, ce qui nous permet de barrer encore plus de nombres:

5777_grille_bingo_modulo_7d) Relation modulo 11

Bon, je pense que vous avez compris la mécanique, donc j’abrège. On a encore (!) 5777 \equiv 2 \mod[11] donc en refaisant la même chose que précédemment on trouve que a ne peut pas être congru à 1 ou 10 modulo 11. On raye donc tous les nombres congrus à 1 ou 10 modulo 11:

5777_grille_bingo_modulo_11e) Relation modulo 13

Là, les choses vont être légèrement différentes car 5777 \equiv 5 \equiv 18 \mod[13]. Pourquoi prendre 18 plutôt que 5 comme reste modulo 13 ? Car cela nous permet de factoriser:

p = 5777 - 2a^2 \equiv 18 - 2a^2 = 2( 9-a^2) = 2(3-a)(3+a) \mod[13]

Après avoir montré que p=13 est impossible, le raisonnement précédent montre qu’on ne peut avoir a \equiv 3 \mod[13] ou a \equiv -3 \equiv 10 \mod[13], ce qui nous permet de rayer encore des nombres:

5777_grille_bingo_modulo_13e) Bouquet final

A ce stade, nous voyons dans notre grille de Bingo qu’il ne reste que 4 possibilités: 0, 18, 30 ou 33. Nous allons montrer que chacune des ces possibilités est impossible, ce qui montrera que 5777 met bien en défaut la conjecture.

  • Si on avait a=0, on aurait p=5777-2\times 0^2 = 5777 et donc 5777 serait un nombre premier, ce qui n’est pas le cas car 5777 = 53 \times 109
  • On peut pas avoir a=18 car cela donnerait p = 5777 - 2 \times 18^2 = 5129 et 5129 n’est pas un nombre premier (5129 = 23 \times 223)
  • Le cas a=30 est tout aussi impossible car 5777 - 2 \times 30^2=3997 qui n’est pas premier (3997 = 7 \times 571)
  • Enfin, a=33 ne marche pas non plus car 5777 - 2 \times 33^2 = 3599 qui n’est pas premier non plus (3599 = 59 \times 61)

Et voilà, nous avons bien montré que 5777 ne peut pas s’écrire sous la forme p+2a^2 !

Retour sur cette preuve

On peut se demander ce que cette démonstration mathématique apporte de plus par rapport à la démonstration informatique. Elle nous fait comprendre que 5777 met en défaut la conjecture car il y a beaucoup de nombres premiers (3, 5, 7, 11, 13)  modulo lesquels 5777 s’écrit comme le double d’un carré (par exemple 5777 \equiv 2 = 2 \times 1^2 \mod[3] ou encore 5777 \equiv 18 = 2 \times 3^2 \mod[13] ), ce qui nous a permis d’obtenir une factorisation et d’éliminer beaucoup de cas !

Cette remarque me permet aussi de répondre à une autre question que vous pourriez poser: pourquoi n’avons-nous pas regardé la relation modulo 17 ? Tout simplement, car 5777 ne s’écrit pas sous la forme du double d’un carré modulo 17, ce qui nous empêche d’obtenir une factorisation de p, contrairement aux autres cas. (Petit exercice: montrer que si 5777 s’écrivait sous la forme du double d’un carré modulo 17, alors 7 serait un carré modulo 17… conclure que ce n’est pas possible en établissant la liste des carrés modulo 17 ou bien avec la loi de réciprocité quadratique pour les plus savants).

D’autres questions

La résolution de cette conjecture n’est en fait pas une fin en soi, mais le début d’autres conjectures.

Par exemple, on peut se demander si 5777 et 5993 sont les seules valeurs qui ne marchent pas. Autrement dit, cette conjecture de Goldbach est-elle vraie pour tout entier excepté ces deux nombres ? (spoiler alert: il n’y a aucun autre contre-exemple jusqu’à 1 000 000). Si ce n’est pas le cas, une autre question qu’on peut se poser est: existe-t-il une infinité de contre-exemples à cette conjecture ou y en a-t-il qu’un nombre fini ?

Comme bien souvent en mathématiques, la résolution de cette conjecture n’a fait qu’ouvrir d’autres problèmes !

Sources:

Publié dans Arithmétique | Tagué , , , , , , | 1 commentaire

Ce chercheur qui réinventa la roue sans le savoir

En Février 1994, Mary Tai, chercheuse dans le domaine médical, publia un article de recherche intitulé

A mathematical model for the determination of total area under glucose tolerance and other metabolic curves.

ce qui peut se traduire par: Un modèle mathématique pour déterminer l’aire totale sous les courbes de la tolérance au glucose et d’autres métabolismes. Dans cet article (que j’ai posté à la fin), le Dr Tai annonce tout fièrement qu’elle a découvert une méthode pour calculer l’aire sous la courbe d’une fonction (donc une intégrale) qu’elle nomme tout simplement la méthode Tai et dont l’élément essentiel est une formule, elle aussi sobrement appelée formule de Tai.

Je ne sais pas ce que vous en pensez mais il faut quand même avoir un ego surdimensionné pour donner son propre nom à une formule. Personnellement, je n’ai pas souvenir d’un mathématicien qui ait donné lui-même son nom à une formule ou un théorème qu’il a découvert.

Mais le pire dans tout cela, c’est que cette méthode et cette formule révolutionnaires n’ont en fait rien de bien nouveau car ce que vient de redécouvrir sans le savoir cette chercheuse n’est rien d’autre que… la méthode des trapèzes !

Extrait de l'article original: le Dr. Tai nous explique sa formule, sans se rendre compte qu'un triangle rectangle sur un rectangle, ça fait un trapèze...

Extrait de l’article original: le Dr. Tai nous explique sa formule, sans se rendre compte qu’un triangle rectangle sur un rectangle, ça fait un trapèze…

La méthode des trapèzes est une méthode de calcul approché d’intégrales qui est connue depuis au moins 300 ans (et peut-être même depuis Newton, mais je n’en suis pas sûr…), c’est dire si elle n’a rien de nouveau !

Qu’est-ce que la méthode des trapèzes ?

L’idée de la méthode des trapèzes est simple: elle consiste à remplacer une fonction f par une fonction affine et à dire que l’aire sous la courbe de f est proche de l’aire sous la courbe de cette fonction affine (qui se trouve être l’aire d’un trapèze, d’où le nom de la méthode !):

Methode_des_trapezes_n_egal_1Vous connaissez sans doute tous l’aire d’un trapèze: \dfrac{(B+B')\times h}{2}B est la grande base, B' est la petite base et h est la hauteur.  Ici, notre trapèze est horizontal: la grande base est f(b), la petite base est f(a) et la hauteur est la distance de a à b c’est-à-dire b-a. On en déduit que l’aire sous la courbe vaut environ:

\displaystyle \int_{a}^{b} f(x) dx \simeq \frac{ \left[f(a)+f(b) \right] \times (b-a)}{2}

Cependant, on remarque visuellement que l’approximation est tout de même assez grossière. Pour remédier à cela, on va couper l’intervalle de départ en 2 puis, sur chaque intervalle, on remplace la fonction par une fonction affine:

Methode_des_trapezes_n_egal_2_Ce qui donne, en additionnant l’aire des deux trapèzes, l’approximation suivante:

\displaystyle \int_{a}^{b} f(x)dx \simeq \frac{ \left[ f(a)+f(x_1) \right] (x_1 -a)}{2} + \frac{ \left[ f(x_1)+f(b) \right] (b - x_1)}{2}

et après simplification:

\displaystyle \int_{a}^{b} f(x)dx \simeq \frac{b-a}{4} \left[ f(a) + 2f(x_1) + f(b)\right]

Bien entendu, au lieu de le couper en deux, on peut subdiviser l’intervalle en autant de fois que l’on veut, et on sent bien que plus le nombre de subdivisions est grand, et plus la somme des aires des trapèzes va se rapprocher de l’aire totale sous la courbe:

Methode_des_trapezes

Nous aussi, redécouvrons la formule

Tentons de donner une formule explicite pour l’aire totale des trapèzes. Pour cela, on se donne n>0 un entier naturel ainsi que x_0=a < x_1 < x_2 < ... < x_n =b une subdivision régulière de l’intervalle [a,b] c’est-à-dire telle que la distance en abscisse d’un point à un autre est la même. Ainsi, x_{i+1}-x_i = \frac{b-a}{n} (en fait, chaque x_i vaut a + i \frac{b-a}{n}).

On coupe l'intervalle [a,b] en plusieurs intervalles de même longueur.

On coupe l’intervalle [a,b] en plusieurs intervalles de même longueur.

Comme expliqué précédemment, l’aire du trapèze correspondant à l’intervalle [x_i , x_{i+1}] est

\displaystyle \frac{\left[ f(x_i) + f(x_{i+1})\right] (x_{i+1} - x_i)}{2}

La somme T_n des aires de tous les trapèzes vaut donc:

\displaystyle T_n = \sum_{i=0}^{n-1} \frac{\left[ f(x_i) + f(x_{i+1}\right] (x_{i+1}-x_i)}{2}

C’est bien cette formule qu’a donnée le Dr Tai dans son article. Transformons-la pour la rendre plus jolie: comme, x_{i+1}-x_i = \frac{b-a}{n}, l’aire du trapèze est donc

\displaystyle T_n = \sum_{i=0}^{n-1} \frac{\left[ f(x_i) + f(x_{i+1})\right] (b-a)}{2n}

D’où

\displaystyle T_n = \frac{b-a}{2n} \left( \sum_{i=0}^{n-1} f(x_i) + \sum_{i=0}^{n-1} f(x_{i+1}) \right)

En se souvenant que x_0=a et x_n=b, on trouve que la somme des aires des trapèzes est:

\boxed{ \displaystyle T_n = \frac{b-a}{2n} \left[ f(a) + 2 f(x_1) + 2f(x_2) + \cdots + 2 f(x_{n-1}) + f(b) \right] }

Puisque moi aussi je viens de la redécouvrir, je vous propose de l’appeler la formule de Blogdemaths-Tai. Inutile de vouloir me la voler, je suis déjà en train de la soumettre à plusieurs revues.

Preuve de la méthode et incertitude

Dans son papier, après avoir donné sa formule, le Dr Tai tente de donner la précision de sa méthode. Pour cela, elle compare le résultat obtenu avec sa formule avec l’aire obtenue à partir du graphe (?).

Le Dr Tai verifie que sa méthode marche de façon pour le moins étrange...

Le Dr Tai verifie que sa méthode marche de façon pour le moins étrange…

Là encore, elle passe complètement à côté du fait que la méthode des trapèzes est entièrement connue et qu’il existe déjà une estimation mathématique de la précision de cette méthode: si on découpe l’intervalle de départ en n sous-intervalles, l’erreur commise (c’est-à-dire la différence entre l’aire des trapèzes et l’aire exacte sous la courbe) est inférieure à

\dfrac{M (b-a)^3}{12n^2}

M est une constante dépendant de la fonction à intégrer (plus précisément, M=\sup_{x \in [a,b]} |f''(x)|).

Pour ceux qui souhaitent savoir d’où sort cette estimation de l’erreur (ou bien pour le Dr Tai, si jamais elle lit cet article), voici une démonstration :

Preuve de la méthode des trapèzes

La méthode des trapèzes en pratique

L’étude que nous avons faite reste assez théorique pour le moment. Je vous propose de voir comment utiliser la méthode des trapèzes sur un exemple concret.

Prenons la fonction f(x)= \frac{1}{\sqrt{2\pi}} \text{e}^{ -\frac12 x^2} (vous reconnaissez la fonction densité de la loi normale centrée réduite) et calculons une valeur arrondie à 10^{-2} près de l’aire située sous la courbe de f entre 0 et 1. Vous savez sans doute que cette fonction n’a pas de primitive qui s’exprime avec les fonctions usuelles, donc le calcul de \displaystyle \int_{0}^{1}f(x)dx est a priori peu aisé. Mais heureusement que nous avons redécouvert la méthode des trapèzes !

On va appliquer la formule de Blogdemaths-Tai avec n=3.

On va appliquer la formule de Blogdemaths-Tai avec n=3.

Puisque f ''(x) = \frac{1}{\sqrt{2\pi}} (x^2-1) \text{e}^{-\frac12 x^2}, et comme f'' est décroissante et négative sur [0,1] (on peut dériver f'' pour le voir), on a |f''(x)| \leqslant |f''(0)| = \frac{1}{\sqrt{2 \pi}}. Nous pouvons donc prendre M = \frac{1}{\sqrt{2\pi}}. Ainsi, pour avoir une valeur arrondie à 10^{-2} près, il suffit de choisir n tel que:

\dfrac{M(1-0)^3}{12 n^2} \leqslant 5 \times 10^{-3}

(ainsi notre valeur approchée sera dans un intervalle autour de la valeur exacte de longueur 2\times 5 \times 10^{-3} =10^{-2}) c’est-à-dire tel que

\dfrac{1000}{12 \times 5 \times \sqrt{2\pi}} \leqslant n^2

ce qui donne 2,57 \leqslant n. Nous pouvons donc appliquer la méthode des trapèzes avec n=3:

\displaystyle \int_{0}^{1} f(x) dx \simeq \frac{1-0}{2 \times 3} \left( f(0) + 2f\left(\frac13\right) + 2f\left(\frac23\right) + f(1) \right)

Le résultat de ce calcul est 0,3390... (\pm 0,005) donc \displaystyle \int_{0}^{1} f(x) dx \simeq 0,34 à 10^{-2} près. Au passage, nous venons donc de montrer que si X suit la loi normale centrée réduite, alors

P(0\leqslant X \leqslant 1) \simeq 0,34

C’est quand même beaucoup plus sympa de calculer cette probabilité de cette façon plutôt qu’en utilisant simplement la fonction « Loi normale » de sa calculatrice (comme il fallait bêtement le faire dans le sujet de Bac S 2015…).

Autre méthodes

Nous avons vu que la méthode des trapèzes consiste à remplacer une fonction sur chaque intervalle par une fonction affine. On peut aussi la remplacer autrement:

  • Si on remplace la fonction de départ par une fonction constante, on obtient ce qu’on appelle la méthode des rectangles bien connue des lycéens;
  • Si on remplace la fonction de départ par une fonction polynôme de degré au plus 2, on obtient ce qu’on appelle la méthode de Simpson.

Cliquez ici pour voir les 3 méthodes en action !

Si un jour vous aussi pensez avoir découvert une nouvelle méthode de calcul d’intégrales, vérifiez d’abord que ce n’est pas une de ces 3 méthodes ! Ah,  j’oubliais: l’article du Dr Tai a été cité dans d’autres articles de recherche plus de 250 fois à ce jour ! Ca laisse perplexe.

Notes:

Voici l’article original complet du Dr. Tai (pdf – 8Mo) avec en bonus, les réponses sans concession de ses autres confrères. Ils ne sont pas tendres avec elle, et pour ainsi dire, elle se fait laminer. C’est donc délicieux à lire (oui, je suis sadique !). Extrait:

Le Dr. Tai se fait démolir par un confrère.

Le Dr. Tai se fait démolir par un confrère.

Publié dans Analyse | Tagué , , , , , | 3 commentaires

Jusqu’où peut-on voir à l’horizon ?

C’est bientôt les grandes vacances, et vous allez peut-être profiter du soleil et de la mer durant cette période estivale. Au bord de la plage, les pieds dans l’eau, vous regarderez au loin vers l’horizon… Et là vous vous direz peut-être: mais ce point lointain à l’horizon, à quelle distance se situe-t-il ? Puis-je voir les côtes américaines si je regarde la mer depuis les plages de Bretagne ? C’est à cette question existentielle que nous allons répondre ci-dessous.

La Terre est bleue comme une orange (et ronde comme Maïté)

Comme vous le savez, la Terre est ronde (ou plutôt ellipsoïdale !), donc si vous regardez droit devant vous, il y a un moment où une partie de la Terre va être cachée. Nous allons essayer de préciser où se situe cet endroit géométriquement.

On assimile la Terre a une sphère de centre O et de rayon R=6371km. Imaginons un observateur M de hauteur h situé les pieds dans l’eau et regardant le point P à l’horizon devant lui:horizon_modelisation_du_problemePuisque le rayon lumineux venant de l’horizon qui parvient aux yeux de notre observateur ne touche la Terre qu’en un seul point (l’horizon, justement !), la droite (PM) est donc une tangente à la Terre:

horizon_modelisation_triangle_rectanglePour savoir jusqu’où on peut voir à l’horizon, il nous faut calculer la distance d. Je ne vais pas faire durer le suspense plus longtemps car tout le monde voit qu’il faut utiliser le théorème de Pythagore. En effet, comme le triangle PMO est rectangle en P, on a la relation (R+h)^2=R^2+d^2 qui est équivalente à  d^2= (R+h)^2-R^2. En développant cette dernière, on obtient :

d^2=R^2+2Rh+h^2-R^2

ce qui donne

d^2=2Rh+h^2

et on en déduit ainsi que:

\boxed{d=\sqrt{2Rh+h^2}}

Application numérique

Si on choisit une personne de taille moyenne, c’est-à-dire h = 1,70m, on trouve que la distance d qui la sépare de l’horizon est:

d = \sqrt{2 \times 6371 \times 1.7 \cdot 10^{-3} + (1.7 \cdot 10^{-3})^2} \simeq 4,65km

Donc, quand vous regardez à l’horizon, vous voyez seulement à environ 5km devant vous ! Je ne sais pas vous, mais j’étais persuadé qu’on voyait plus loin que cela. On n’a donc aucune chance de voir les côtes américaines depuis les côtes du Finistère… Quelle déception.

Aller plus haut…

Bon, maintenant qu’on a une formule, autant la rentabiliser. Si vous montez au sommet de la Tour Eiffel, vous verrez évidemment beaucoup plus loin à l’horizon que si vous avez les pieds au sol. Le 3ème étage étant situé à 276m au-dessus du sol, de cet endroit vous pouvez voir à 59 km à la ronde !

Depuis la tour Eiffel, vous pouvez voir jusqu'à environ 60km au loin. Sauf en cas d'alerte pollution de niveau 3 (c'est-à-dire 2 jours par an). Source de l'image: http://fr.wikipedia.org/wiki/Tour_Eiffel

Depuis la tour Eiffel, vous pouvez voir jusqu’à environ 60km au loin. Sauf en cas d’alerte pollution (donc seulement 2 jours par an).
Source de l’image: http://fr.wikipedia.org/wiki/Tour_Eiffel

Et si on monte encore plus haut ? Le monument le plus grand créé par l’homme est la tour Burj Khalifa, située à Dubaï et qui mesure 828 mètres. Le 163ème et dernier étage est situé à une hauteur de 584 mètres. De cet étage, on peut donc voir à 86 km au loin !

Et à la nage ?

Remettons les pieds sur Terre et revenons au bord de la plage. Puisque la Terre est ronde, la distance à la nage et la distance à vol d’oiseau ne sont pas exactement les mêmes. Que vaut donc cette distance à la nage ?horizon_distance_vol_oiseau_distance_nagePour faire le calcul exact de la distance à la nage, il va falloir utiliser un peu de trigonométrie élémentaire:horizon_distance_nage_notationsLe fameux CAHSOHTOA™ appliqué au triangle PMO (qui est toujours rectangle, il n’a pas changé) nous donne

\cos(\theta) = \dfrac{R}{R+h}

La distance à la nage est la longueur d' de l’arc de cercle bleu. On sait que la longueur de cet arc est donnée par la formule  d' = R \cdot \theta. Ainsi,

\boxed{ d'= R \cdot \cos^{-1} \left( \frac{R}{R+h} \right) }

Lorsqu’on fait l’application numérique pour un humain d’1,70m, on trouve que la distance d' vaut environ 4,65 km, ce qui est autant que ce qu’on avait trouvé pour la distance à vol d’oiseau (en fait les distances à vol d’oiseau et à la nage sont égales jusqu’à la 5ème décimale !).

Je ne pense pas que cela étonne grand monde que ces distances soient semblables, mais essayons tout de même de donner une explication mathématique à cela.

Équivalents

Le fait que ces distances soient très proches vient, comme on s’y attend, du fait que la taille d’un homme (ou même de la Tour Eiffel !) est très petite par rapport à celle de la Terre.

Pour le prouver, commençons par donner deux équivalents (au sens mathématique du terme). Si x est voisin de 0 alors:

\sqrt{2x+x^2} \sim \sqrt{2x}

et

\cos^{-1}\left(\dfrac{1}{1+x}\right) \sim \sqrt{2x}

La démonstration de ces deux propriétés est donnée en fin d’article.

Si la hauteur h est très petite devant le rayon R alors le rapport h/R est très proche de 0. Donc on pourra remplacer x par h/R dans les équivalents précédents:

d= \sqrt{2Rh+h^2}=R\sqrt{2 \frac{h}{R}+\left(\frac{h}{R} \right)^2} \sim R \sqrt{2\frac{h}{R}} = \sqrt{2Rh}

et

d' = R \cos ^{-1} \left( \frac{R}{R+h} \right) = R \cos^{-1} \left( \frac{1}{1+ \frac{h}{R}} \right) \sim R\sqrt{2 \frac{h}{R}} = \sqrt{2Rh}

Voilà donc pourquoi ces distances sont du même ordre si h est petit !

Cas d’un satellite

En revanche, si on s’élève très haut dans le ciel, les distances à vol d’oiseau et à la nage vont commencer à ne plus être comparables.

Par exemple, imaginons un satellite géostationnaire, c’est-à-dire situé à une altitude h=36 000 km. La distance à vol d’oiseau est environ de 41 900 km alors que la distance au sol (« à la nage ») est environ de 9 045 de km (autrement dit, si une personne située au sol exactement sous le satellite devait marcher tout droit pour rejoindre le point le plus éloigné que le satellite peut voir, elle marcherait 9 045 km). Comme la hauteur n’est plus négligeable devant le rayon de la Terre, il n’est donc pas étonnant que ces deux valeurs ne soient plus du même ordre de grandeur.

Si on s’élève indéfiniment dans le ciel, la distance à vol d’oiseau va bien entendu tendre vers +\infty alors que la distance à la nage va tendre vers le quart de la circonférence de la Terre, comme on le devine sur l’animation ci-dessous:

En rouge, la distance à vol d’oiseau et en bleu, la distance à la nage. Si on zoome, on peut voir George Clooney dans le satellite, en train de tourner Gravity.

Voilà donc un bel exemple visuel de bijection d’un intervalle de longueur infini vers un intervalle de longueur finie !

Note:

Voici les calculs des équivalents donnés dans l’article.

Publié dans Géométrie | Tagué , , , , , , | 1 commentaire

La loi de Poisson… avec des poissons

La loi de Poisson (du mathématicien Siméon Denis Poisson) est une loi de probabilité permettant de mesurer le nombre d’événements qui se produisent dans un intervalle de temps donné, lorsque ces événements sont plutôt rares et indépendants. Par exemple, la loi de Poisson permet de décrire plutôt précisément le nombre X de voitures qui passent dans votre rue dans un laps de temps donné (sauf si vous habitez en face du périph’).

Dans le cas d’une loi de Poisson, la probabilité que k événements se produisent dans un intervalle de temps fixé (par exemple, que 10 voitures passent dans votre rue en une heure) est donnée par la formule:

P(X=k)= \dfrac{\lambda^k\text{e}^{-\lambda}}{k!}

\lambda est un paramètre donné.

C’est une formule étonnante et qui a l’air compliquée… la première fois que je l’ai vue, j’ai vraiment eu le sentiment qu’elle sortait de nulle part. Comment une exponentielle et une factorielle peuvent se retrouver à expliquer plutôt correctement des phénomènes rares ?

Nous allons tenter d’expliquer d’où vient cette expression qui semble tomber du Ciel. Et pour cela, quoi de mieux que des poissons pour illustrer la loi de Poisson ?

La cabane du pêcheur

Tous les dimanches, un pêcheur s’installe au bord d’une rivière pour pêcher la truite cendrée. On sait qu’en moyenne il attrape \lambda =2,4 poissons par heure.

Notre pêcheur vient de s’installer à son endroit favori pour commencer sa partie de pêche hebdomadaire. Quelle est la probabilité qu’il attrape k poissons en une heure ? (où k est un entier naturel quelconque).

Ca, c'est de la punchline.

Ca, c’est de la punchline où je ne m’y connais pas en truites.

Découpages temporels

Tout d’abord, on peut raisonnablement faire les hypothèses suivantes sur cette partie de pêche:

  • Le fait d’attraper un poisson à une minute donnée est indépendant du fait d’attraper un poisson à la minute suivante
  • Le pêcheur attrape au plus une truite à chaque minute (le temps de la sortir de l’eau, de la décrocher de l’hameçon et de boire une gorgée de Heineken…)
  • Le pêcheur a autant de chances d’attraper un poisson à chaque minute, donc la probabilité d’attraper une truite à une minute donnée est p=\frac{2,4}{60}.

Si on découpe une heure en 60 minutes, une heure de pêche revient donc à considérer qu’on répète 60 fois de suite et de manière indépendante une même expérience aléatoire à deux issues (« j’attrape un poisson » ou « je n’attrape pas un poisson ») . Vous reconnaissez ainsi une bonne vieille loi binomiale: si on note X le nombre de poissons pêchés en une heure, alors X suit la loi binomiale de paramètres n=60 et p=\frac{2,4}{60}.

Si notre pêcheur attrape 3 poissons en une heure, on peut considérer cela comme 60 expériences d'une minute durant lesquelles soit il attrape un poisson, soit il n'en attrape pas.

Si notre pêcheur attrape k=3 poissons en une heure, on peut considérer cela comme 3 succès lors de 60 expériences aléatoires indépendantes d’une minute chacune.

Si vous vous souvenez de vos années lycée, vous devriez vous rappeler de cette formule pour la loi binomiale:

\displaystyle P(X=k) = {60 \choose k} \left(\frac{2,4}{60} \right)^k \left(1-\frac{2,4}{60} \right)^{60-k}

Mais où sont les exponentielles et les factorielles dont je vous ai parlé au départ ? Elles arrivent, patientez encore un peu…

Chasse, pêche, nature et traditions

Il y a peut-être des spécialistes de la pêche (ils sont nombreux à lire ce blog, je le sais) qui vont me dire qu’il se peut qu’un bon pêcheur puisse attraper plus d’un poisson en une minute. Cela remettrait donc en cause notre loi binomiale précédente.

Pour ne pas les contrarier, nous allons affiner notre raisonnement précédent et, au lieu de découper une heure en 60 minutes, nous allons la découper en 3600 secondes (car je doute fort qu’un pêcheur attrape plus d’un poisson par seconde !).

Autrement dit, le nombre X de poissons pêchés suit là encore une loi binomiale, mais les paramètres sont cette fois n=3600 et p=\frac{2,4}{3600}. Ainsi, la probabilité de pêcher k poissons en une heure est:

\displaystyle P(X=k) = {3600 \choose k} \left( \frac{2,4}{3600} \right)^k \left( 1- \frac{2,4}{3600}\right)^{3600-k}

Mais si on y réfléchit bien, au lieu de découper une heure en 60 minutes ou en 3600 secondes, on peut la découper en n unités de temps quelconques, sans que cela change grand chose si n est assez grand, c’est-à-dire si cette unité de temps est suffisamment petite pour que le pêcheur ne puisse pas attraper plus d’un poisson pendant celle-ci. Ainsi,

\displaystyle P(X=k) = {n \choose k} \left( \frac{2,4}{n} \right)^k \left( 1- \frac{2,4}{n}\right)^{n-k}

Si on considère que plus nos intervalles de temps sont fins (c’est-à-dire plus n est grand), plus notre modèle se rapproche de la réalité, alors on peut affirmer que la probabilité de pêcher k poissons en une heure est:

\displaystyle P(X=k) = \lim_{n \to \infty} {n\choose k} \left( \frac{\lambda}{n} \right)^k \left( 1- \frac{\lambda}{n}\right)^{n-k}

(où \lambda=2,4). Il nous reste à présent à calculer cette limite pour voir apparaître une factorielle et une exponentielle.

Calcul de la limite

La première chose à faire pour calculer cette limite va être d’exprimer le coefficient binomial {n \choose k} en fonction de n et k. Vous n’êtes sans doute pas sans connaître la formule suivante:

\displaystyle {n \choose k} = \dfrac{n!}{(n-k)! k!} = \dfrac{n(n-1)(n-2) \cdots (n-k+1)}{k!}

Nous voyons déjà apparaître notre factorielle. De cela et de quelques manipulations algébriques élémentaires, on en déduit que:

\begin{array}{ccl}  \displaystyle {n \choose k} \left( \frac{\lambda}{n} \right)^k \left( 1- \frac{\lambda}{n}\right)^{n-k} &=& \displaystyle \frac{n(n-1)(n-2) \cdots (n-k+1)}{k!} \left( \frac{\lambda}{n} \right)^k \left( 1- \frac{\lambda}{n}\right)^{n-k}\\  & & \\  & = & \displaystyle \frac{n(n-1)(n-2) \cdots (n-k+1)}{n^k} \frac{\lambda^k}{k!} \left( 1- \frac{\lambda}{n}\right)^{n} \left( 1- \frac{\lambda}{n}\right)^{-k}\\  \end{array}

Pour trouver la limite de cette expression quand n tend vers +\infty, il nous suffit donc de trouver la limite de chacun des facteurs de cette expression.

Tout d’abord, \displaystyle \lim_{n \to +\infty} \frac{n(n-1)(n-2) \cdots (n-k+1)}{n^k} = \lim_{n\to \infty} \frac{n^k}{n^k} = 1 car la limite en l’infini d’une fraction rationnelle est la limite des monômes de plus haut degré.

D’autre part, \displaystyle \lim_{n \to +\infty} \frac{\lambda^k}{k!} = \frac{\lambda^k}{k!} car cette expression ne dépend pas de n.

Ensuite, \displaystyle \lim_{n \to +\infty} \left(1 - \frac{\lambda}{n} \right)^n = \text{e}^{-\lambda} (c’est donc de là que vient notre exponentielle !). On peut prouver cela de manière élémentaire et j’ai mis les détails en fin d’article pour ceux que ça intéresse.

Enfin, \displaystyle \lim_{n \to +\infty} \left(1-\frac{\lambda}{n}\right)^{-k} = 1 car \displaystyle \lim_{n \to +\infty} 1 - \frac{\lambda}{n}=1 (n’oublions pas que k est fixé et que la limite d’un produit (fini) est le produit des limites).

En mettant cela bout à bout, on trouve ainsi que :

\begin{array}{cl}  \displaystyle \lim_{n \to +\infty} \frac{n(n-1)(n-2)\cdots (n-k+1)}{n^k} \frac{\lambda^k}{k!} \left(1- \frac{\lambda}{n} \right)^n \left(1- \frac{\lambda}{n} \right)^{-k}=& \displaystyle 1\times \frac{\lambda^k}{k!} \times \text{e}^{-\lambda} \times 1 \\  &  \end{array}

Nous retrouvons donc bien la formule annoncée au début de l’article:

P(X=k) = \dfrac{\lambda^k \text{e}^{-\lambda}}{k!}

Mais au fait, c’est quoi la différence entre un bon pêcheur et un mauvais pêcheur ?

Notes

Publié dans Probabilités | Tagué , , , , , | 7 commentaires

Le théorème de Kuratowski

Choisissez une partie quelconque du plan. A cette partie, on peut lui appliquer deux types d’opérations:

  • Soit on prend son complémentaire;
  • Soit on prend sa fermeture (au sens topologique du terme). Pour ceux qui ne sauraient pas vraiment ce que représente la fermeture d’un ensemble, considérez que cela revient à ajouter son bord à l’ensemble de départ.
lolilolol

Prendre la fermeture d’un ensemble revient à lui ajouter son bord.

Maintenant, appliquez ces opérations autant de fois que vous le souhaitez, dans l’ordre que vous voulez sur la partie du plan que vous voulez. Selon vous, combien d’ensembles différents pourra-t-on obtenir au maximum avec ce procédé ?

Disque rayé…

Pour bien comprendre le problème, voici un exemple. Dans le plan \mathbb{R}^2, on considère le disque ouvert D de centre (0,0) et de rayon 1, c’est-à-dire l’ensemble des points (x,y) tels que x^2+y^2 <1.

theoreme_Kuratowski_disque_ouvertDe ce disque, on peut commencer par en prendre son complémentaire:

theoreme_Kuratowski_complementaire_du_disque_ouvertOn peut aussi en prendre sa fermeture:

theoreme_Kuratowski_fermeture_du_disque_ouvertOn peut itérer ce processus, et à partir de chaque nouvel ensemble obtenu, on prend soit le complémentaire, soit la fermeture. Voici ci-dessous tous les ensembles qu’on obtient lorsqu’on applique ces deux opérations de fermeture (F) et de complémentaire (C) à notre disque initial:

Chaque ensemble obtenu est représenté en bleu. Un contour en pointillés signifie que ce contour est exclu et ne fait pas partie de l'ensemble.

Chaque ensemble obtenu est représenté en bleu. Un contour en pointillés signifie que ce contour est exclu et ne fait pas partie de l’ensemble.

Vous voyez qu’à partir d’un certain moment, on retombe sur des ensembles que l’on déjà vus et il est donc inutile d’aller plus loin. Ainsi, en prenant autant de fois que l’on veut la fermeture et le complémentaire de notre disque de départ, nous avons obtenu 4 ensembles différents.

Peut-on faire mieux que 4 ? Car ce que nous avons fait pour un disque, vous comprenez bien que nous pouvons le faire pour n’importe quelle partie du plan, aussi biscornue et bizarre soit-elle. Essayez par vous-même avec d’autres parties du plan avant de lire la suite (par exemple, avec un triangle plein dont deux des côtés sont exclus, ou bien avec l’ensemble de Cantor pourquoi pas !)

Le théorème de Kuratowski

Le théorème qui va nous intéresser dans cet article, est le théorème démontré par le mathématicien polonais Kuratowski en 1922 qui dit que:

En prenant autant de fois que l’on veut la fermeture et le complémentaire d’une partie A quelconque, on ne peut obtenir que 14 ensembles différents au plus.

Vous pouvez donc partir de n’importe quel ensemble au départ, vous ne pourrez jamais créer plus de 14 ensembles différents juste en prenant la fermeture et le complémentaire !

Au fait, pourquoi 14 ? D’où peut bien sortir ce 14 ?! Lisez attentivement la suite pour comprendre car nous allons démontrer ce théorème.

Quelques notations

Pour dire qu’on prend le complémentaire d’une partie A, on notera C(A) et pour dire qu’on en prend la fermeture, on notera F(A). Puis, pour dire qu’on prend d’abord le complémentaire de cette partie puis sa fermeture, on notera FC(A)  — un peu à la manière de la notation de la composée de deux fonctions.

D’ailleurs, cette notation FC(A) est adaptée à  la langue française, car lorsque l’ont dit « Je prends la fermeture du complémentaire de A », on prend bien d’abord le complémentaire et ensuite la fermeture ! (qui eut crû que le Français utilisait la même structure que celle de la notation d’une composée de fonctions ?).

Enfin, pour alléger les notations, au lieu de noter FC(A), on notera plus simplement FC.

Bref, tout ça pour dire que si j’écris CFCF, ça veut dire: « Je prends la fermeture, puis je prends le complémentaire, puis je prends la fermeture, puis je prends le complémentaire ». Dans cet ordre !

Crise des monoïdes

Nous allons à présent nous intéresser à toutes les combinaisons possibles que l’on peut former avec F et C (en termes plus savants, nous allons étudier le monoïde engendré par F et C). Par exemple, on peut commencer par prendre 10 fois le complémentaire, puis 8 fois la fermeture, puis 34 fois le complémentaire, puis 21 fois la fermeture puis 13 fois le complémentaire. On notera cette suite d’opérations par:

C^{13}F^{21}C^{34}F^{8}C^{10}

Plus généralement, une suite de fermetures et de complémentaires, qu’on appellera opération complexe dans la suite de l’article, peut être représentée par l’une des 4 formes suivantes:

\begin{array}{c}  C^{n_1} F^{n_2} \cdots C^{n_k}\\  ou \\  C^{n_1} F^{n_2} \cdots F^{n_k}\\  ou \\  F^{n_1} C^{n_2} \cdots C^{n_k}\\  ou\\  F^{n_1} C^{n_2} \cdots F^{n_k}\\  \end{array}

Première réduction

Vous aurez sans doute constaté les deux faits suivants:

  • Prendre deux fois de suite le complémentaire revient à ne rien faire;
  • Prendre deux fois de suite la fermeture revient à prendre une seule fois la fermeture.

Ces propriétés sont faciles à comprendre: quand on prend le complémentaire du complémentaire, on revient au point de départ. De même, si j’ajoute le bord alors que je viens de l’ajouter, je ne fais rien de plus !

Si on note Id l’opération qui consiste à ne rien changer, on peut traduire les deux faits précédents de la façon suivante: C² = Id et F²=F.

Cette première réduction montre qu’une opération complexe peut s’écrire comme une simple suite de C et de F. Par exemple, C^{13} = C et C^{34}=Id. De même, F^{21}=F et F^{8}=F. Ainsi,

C^{13}F^{21}C^{34}F^{8}C^{10} = C F Id F Id = CFF= CF

Une opération complexe n’est donc, après réduction, qu’une suite de C et de F qui alternent successivement !

Seconde réduction

On peut montrer que FCFCFCF=FCF. J’ai mis la démonstration de ce fait dans le fichier suivant:

Démonstration

Cette propriété fait bien comprendre que la longueur d’une opération complexe (qui est une suite de F et de C qui alternent comme on l’a vu) ne peut pas dépasser 7 termes après réduction (7 étant la longueur de l’opération complexe FCFCFCF).

Fin de la démonstration

A présent, nous allons utiliser les deux réductions précédentes pour montrer qu’il n’y a que 14 opérations complexes possibles. Le plus simple pour le voir est de faire le graphe de Cayley du monoïde engendré par F et C (ça y est je sors les grands termes !). Il s’agit du graphe obtenu en partant de Id et qui, à chaque étape, ajoute F ou C. Chaque fois qu’on prend le complémentaire, j’ai mis une flèche rouge et chaque fois qu’on prend la fermeture, j’ai mis une flèche bleue:theoreme_Kuratowski_graphe_de_CayleyLa flèche en pointillés de gauche exprime l’égalité FCFCFCF=FCF démontrée plus haut. La flèche en pointillés de droite vient du fait que F(CFCFCFC) = (FCFCFCF)C=(FCF)C=FCFC.

Au final, vous voyez qu’il n’y a que 14 sommets sur ce graphe, donc au plus 14 ensembles différents. CQFD.

Peut-on descendre en dessous de 14 ?

Pour être tout à fait complet, il faudrait se poser la question de savoir si la borne de 14 est optimale, c’est-à-dire s’il existe une partie qui, quand elle est soumise aux différentes opérations de fermeture et de complémentaire donne effectivement 14 ensembles différents. Si vous vous souvenez de notre exemple du disque, nous n’avions obtenu que 4 ensembles distincts, ce qui était loin du compte !

En fait, il existe bel et bien une partie qui donne 14 ensembles différents: il s’agit de la partie A de \mathbb{R} donnée par:

A = ]0;1[ \bigcup ]1;2[ \bigcup \{ 3\} \bigcup \left( [4;5] \bigcap \mathbb{Q} \right)

Voici les 14 ensembles obtenus en partant de A (rappelons que \mathbb{Q} est dense dans \mathbb{R}…):

theoreme_Kuratowski_14_ensembles_differentsComme vous le constatez, il y a bien 14 ensembles différents !

Notes:

Publié dans Topologie | Tagué , , , , , , | Laisser un commentaire