
Jean le Rond D'Alembert, l'un des plus prestigieux savants du XVIIIe siècle, est réputé pour avoir dirigé avec Denis Diderot la rédaction d'une encyclopédie mythique. Il est également connu pour ses positions atypiques, voire uniques, sur quelques problèmes de probabilités. En particulier, son article analysant le jeu « croix ou pile » (« pile ou face », de nos jours) a fait l'objet d'une critique quasi unanime, le plus souvent feutrée (vu son rang) mais parfois virulente. Le mathématicien Joseph Bertrand écrira plus tard : « L'esprit de D'Alembert, habituellement juste et fin, déraisonnait complètement sur le Calcul des probabilités. » Daniel Bernoulli aurait même qualifié ses réflexions de « ridicules ». Aujourd'hui encore, le propos de D'Alembert est repris dans l'enseignement des probabilités pour montrer ce qu'il ne faut pas faire. Et si, en fait, ce grand savant avait une autre vision des probabilités, tout aussi pertinente que celle des grands savants de l'époque ?
Un article polémique
L'article Croix ou pile publié en 1754 dans le tome 1 de Mathématiques de l'Encyclopédie méthodique focalisa les critiques. D'Alembert conclut le texte en demandant aux « calculateurs » de s'y pencher sérieusement. En bon élève, Laplace (comme Bernoulli et bien d'autres) tente d'expliquer à D'Alembert son erreur et le bien fondé des réponses « trois contre un » et « sept contre un » (voir en encadré). Par l'analyse de ce jeu, D'Alembert attaque la pensée unique des mathématiciens de l'époque : « L'hypothèse d'équiprobabilité, qui est l'objet central de ces critiques, ne lui paraît pas physiquement fondée, précisément parce qu'elle s'abstrait, à ses yeux, totalement et sans justification de ces caractères, causal et temporel, des événements physiques réels » écrit Michel Paty en 1988.
On pourrait être tenté de considérer le point de vue de D'Alembert comme une interprétation causaliste et chronologiste de la probabilité conditionnelle ; c'est un problème que l'on rencontre souvent chez les étudiants. Il n'en n'est rien : D'Alembert ne parle pas de théories mathématiques mais d'événements physiques réels, pour lesquels une modélisation probabiliste adéquate ne pourrait s'abstraire des causes et du temps. Il semble cependant que son analyse fasse, en réalité, également l'hypothèse de l'équiprobabilité (celle des observables). Mais il précise en 1761 : « Je ne voudrois pas cependant regarder en toute rigueur les trois coups dont il s'agit, comme également possibles. Car 1° il pourroit se faire en effet (& je suis même porté à le croire), que le cas pile–croix ne fût pas exactement aussi probable que le cas croix seul ; mais le rapport des probabilités me paroit inappréciable. »
Aussi, à défaut de pouvoir déterminer précisément les probabilités auxquelles il aspire, D'Alembert préfèrerait l'équiprobabilité des combinaisons physiquement observables à l'équiprobabilité des combinaisons théoriquement possibles. Nous savons maintenant ce que nous cherchons : ce rapport de probabilité entre pile–croix et croix de telle sorte que, dans le jeu croix ou pile, il y ait deux contre un à parier qu'on amènera croix en deux coups, trois contre un en trois coups… n contre 1 en n coups.
Père du principe de la raison insuffisante (ou d'indifférence), Pierre-Simon de Laplace érige ce principe non seulement en méthode d'attribution d'une équiprobabilité a priori des possibles en l'absence de toute autre information, mais également comme probabilité de départ pour l'estimation d'une probabilité actualisable au cours du temps. En effet, dans son essai philosophique sur les probabilités en 1774, Laplace propose une règle d'attribution (on dirait aujourd'hui d'estimation) de la probabilité d'un événement en fonction des observations passées. Supposons qu'un événement ait seulement deux tirages possibles, valant « succès » ou « échec ». Avec l'hypothèse que l'on sache peu ou rien a priori en rapport aux probabilités relatives aux tirages, Laplace propose une formule de probabilité pour que le tirage suivant soit un succès : P(le prochain tirage est un succès) = (s+1) / (n+2), où P désigne la probabilité, s est le nombre de succès observés précédemment et n est le nombre total d'essais réalisés. C'est la règle de succession de Laplace.
De nos jours, on sait que cette règle s'obtient par un a priori uniforme sur la probabilité de l'évènement considéré. En supposant une loi uniforme continue sur [0, 1] pour la probabilité de croix, l'estimation du maximum de vraisemblance bayésien de P(croix) après avoir effectué, par exemple, n lancers indépendants et ayant observé n piles consécutifs est de 1 / (n+2).
Les probabilités conditionnelles
D'Alembert remet essentiellement en cause l'équiprobabilité des possibles. Aussi, même lorsque l'on lance une pièce, il est physiquement envisageable que P(croix) et P(pile) diffèrent. Pour autant, tant qu'il n'existe aucune raison pour attribuer des probabilités différentes, il ne peut que se plier à l'indifférence et à l'équiprobabilité. En revanche, toute observation pourrait venir modifier ces probabilités (ces estimations) du premier jour, par exemple si des indices laissent penser que la pièce est biaisée. Dans l'analyse du jeu croix ou pile, que se passe-t-il en appliquant la règle de Laplace ?
La probabilité estimée que la pièce tombe sur croix au premier lancer (événement Croix1) est P(Croix1) = 1 / 2 ; il en est de même pour P(Pile1).
Au deuxième lancer, on estimera :
P(Pile1 et Croix2) = P(Croix2 | Pile1) P(Pile1) = (1 / 3)(1 / 2) = 1 / 6
ainsi que
P(Pile1 et Pile2) = P(Pile2 | Pile1) P(Pile1) = (2 / 3)(1 / 2) = 1 / 3
où P(A | B) désigne la probabilité conditionnelle de A sous l'hypothèse B, soit P(A et B) / P(B).
Aussi, les probabilités estimées sont les suivantes :
P(Croix1) = 1 / 2, P(Pile1 et Croix2) = 1 / 6 et P(Pile1 et Pile2) = 1 / 3.
On en déduit alors que la probabilité d'amener croix en deux coups est de 2/3 et qu'il y a donc deux contre un à parier dans le jeu croix ou pile en deux coups.
Coïncidence ? Non, car pour trois coups :
P(Croix1) + P(Pile1 et Croix2) + P(Pile1 et Pile2 et Croix3) = 1/2 + 1/6 + 1/12 = 3/4.
Et ainsi de suite : il y a n contre un à parier au jeu croix ou pile en n coups, et pourtant les n + 1 événements possiblement observables ne sont pas supposés équiprobables.
Réviser ou pas son a priori
On serait en droit de rétorquer que l'on met, dans l'attribution des probabilités du jeu, des estimations basées sur des hypothèses et non sur des faits (distinction essentielle pour D'Alembert). En particulier, on dit que si la pièce ne tombe pas sur croix au premier lancer, on devra réviser la probabilité de croix au deuxième lancer. Soit, mais avant que le jeu ne commence, cela n'est qu'une hypothèse. Alors pourquoi ne pas faire les calculs avec une probabilité constante de 1/2 ? Pour répondre, une petite variante du jeu est proposée en encadré ; elle décompose le pari et l'espérance de gain selon la règle de Laplace est clairement nulle.
Dans le jeu original en deux coups, selon la loi de D'Alembert, on gagne avec probabilité 2/3 et on perd avec probabilité 1/3. En pariant à deux contre un, l'espérance de gain vaut (2/3)1 + (1/3)(–2) = 0.
Aussi, parier séquentiellement un contre un sur croix en un coup puis, si l'on perd, un contre deux sur croix est exactement équivalent à parier à deux contre un sur croix dans le jeu en deux coups : les gains et les pertes en fin de jeu ainsi que les probabilités associées sont identiques. Il serait bien délicat ici d'imaginer que les paris puissent globalement différer simplement par le fait que les paris seraient possiblement simultanés ou séquentiels… La question sous-jacente de D'Alembert est en réalité de savoir si, au fur et à mesure que les piles apparaissent, on doit continuer à estimer que pile et croix sont aussi probables ou procéder, comme le propose Laplace, à une ré-estimation. Laplace lui-même n'a pas vu que sa propre règle de succession donnait sens aux doutes de D'Alembert ! La proposition de pari de D'Alembert semble aussi raisonnable que celle des « calculateurs » de l'époque. On peut ne pas y adhérer, mais c'est alors en réalité la loi de succession de Laplace que l'on refuse.
La loi du croix ou pile propose d'attribuer la valeur 1/6 à la probabilité de pile-croix (et classiquement 1/2 à la probabilité de croix). Le rapport entre ces deux probabilités, que D'Alembert pensait indéfinissable, serait finalement de un à trois. D'Alembert avait bien raison d'avoir des doutes sur les sommes à parier. Il n'y a ici ni erreur, ni paradoxe. Les deux conclusions (trois contre un et deux contre un) proviennent de deux interprétations raisonnables du principe d'indifférence.