Les tribulations d’un (ex) astronome

Corrélation et causalité

jeudi 13 décembre 2018 par Guillaume Blanc

La corrélation, c’est le rapport d’une chose à une autre, la relation qui existe entre ces choses ou entre ces quantités. Par exemple, on constate que la quantité de gaz carbonique augmente dans l’atmosphère depuis des décennies :

On constate également que l’espérance de vie en France augmente depuis des décennies :

Quand on trace la quantité de gaz carbonique en fonction de l’espérance de vie, on obtient :

On constate ainsi que la quantité de gaz carbonique dans l’atmosphère est en relation avec l’espérance de vie : on pourrait presque tracer une droite (avec une certaine pente) sur ce graphique. On dit que la quantité de gaz carbonique dans l’atmosphère et l’espérance de vie sont corrélées. Il existe un lien mathématique entre les deux, en l’occurrence, ici, une droite, presque, qui, connaissant la relation et la valeur de l’une des grandeurs permet d’en déduire la valeur de l’autre.

On quantifie la corrélation linéaire entre deux quantités avec un coefficient, qui vaut 1 si les deux quantités s’alignent effectivement sur une droite de pente positive, -1 si la droite est de pente négative, et nulle si les deux quantités s’agencent selon un nuage de points qui ne permet pas de définir une relation entre elles. Si le nuage de points permet malgré tout de définir une droite avec un certain « flou », la corrélation se trouve entre 0 et 1 (ou -1), selon que le nuage est moins ou plus allongé... Pour juger de corrélations plus complexes qu’une simple droite, on utilise un outil mathématique matriciel, la covariance.

La causalité, c’est la relation de cause à effet, la relation entre deux phénomènes, c’est-à-dire le fait que l’un cause l’autre ou inversement : l’un est la cause qui produit un effet dont le deuxième est le résultat, ou une facette du résultat.

Mais ce n’est parce que deux quantités sont corrélées qu’elles sont forcément liées de manière causale. Dans l’exemple ci-dessus, on a vu que la quantité de gaz carbonique dans l’atmosphère est liée (corrélée) avec l’espérance de vie, mais ce n’est pas parce que la quantité de gaz carbonique dans l’atmosphère augmente que l’on vit plus longtemps, ou inversement que l’on vit plus longtemps donc que l’on rejette plus de gaz carbonique dans l’atmosphère. Il n’y a donc pas de relation causale : le gaz carbonique ne « cause » pas de surcroît de longévité. Et inversement, une espérance de vie plus grande n’est pas à l’origine d’un surplus de gaz carbonique dans l’atmosphère.

La corrélation entre les deux s’explique par une concomitance fortuite : nous sommes à une époque où les différents facteurs (progrès de la médecine et de l’hygiène, entre autre) susceptibles d’allonger l’espérance de vie permettent à celle-ci d’effectivement croître. Époque qui est aussi celle où les progrès technologiques sont très dispendieux en énergie et se font donc avec des rejets de gaz carbonique dans l’atmosphère, gaz carbonique qui s’y accumule donc. Il est tout à fait possible, voire souhaitable, que dans un avenir plus ou moins lointain, l’espérance de vie continue de progresser (les connaissances en médecine progressent chaque jour un peu plus), tandis que le gaz carbonique dans l’atmosphère finisse par stagner avant de décroître, si l’humanité réussit le tournant décisif de la crise environnementale qui s’impose à elle. Il est également possible, bien que beaucoup moins souhaitable, que ce soit l’inverse qui se produise, à savoir que le gaz carbonique continue de s’accumuler, l’humanité ayant loupé le virage, auquel cas, l’espérance de vie diminuera, probablement brutalement (guerres, épidémies, événements climatiques extrêmes, etc). Dans les deux cas, la corrélation, alors, disparaîtra.

Il n’est pas possible de déduire une causalité — relation de cause à effet — à partir d’une corrélation : il faut des éléments supplémentaires pour cela. On peut, par exemple, regarder la relation entre l’augmentation du gaz carbonique dans l’atmosphère et l’augmentation de la température de l’atmosphère. Le graphique suivant montre l’augmentation de l’« anomalie de température » moyenne annuelle en fonction du temps. L’anomalie de température est la différence de température de la basse atmosphère par rapport à une période de référence (1951-1980, ici, en l’occurrence).

Tandis que le graphique suivant montre cette anomalie de température en fonction de la quantité de gaz carbonique dans l’atmosphère entre 1973 et 2013. On constate que les deux quantités sont corrélées, bien que moins fortement que précédemment, la corrélation est plus « diffuse » : les points se répartissent globalement sur une droite, mais avec une certaine « épaisseur. » Le coefficient de corrélation est « seulement » de 0,9 contre quasiment 1 ci-dessus.

À la différence près que cette corrélation-ci est causale, contrairement à la précédente : le gaz carbonique rejeté par les activités humaines depuis plus d’un siècle s’accumule dans l’atmosphère, ce qui augmente l’effet de serre responsable des températures moyennes relativement douces à la surface de la Terre, et provoque ainsi une augmentation de la température moyenne à la surface de la planète. Bien que non triviale, cette causalité est démontrée par les climatologues.

La science et en particulier l’expérimentation scientifique s’efforce de trouver les liens entre différentes variables ou observables. Si les corrélations entre ces variables sont souvent mesurables expérimentalement, les relier causalement nécessite souvent tout un arsenal théorique (simulation, modèle, etc) pour interpréter l’observation. D’ailleurs la science peut aussi se tromper et trouver des causalités où il n’y en a pas (comme par exemple le fait qu’un certain maïs OGM donne le cancer à des rats !)

Notre esprit (cerveau) est ainsi fait qu’il a facilement tendance à associer deux phénomènes simultanés ou corrélés, par une cause commune ou un rapport de cause à effet. La psychologie sociale appelle ce biais cognitif « l’illusion de corrélation », issue de travaux des psychologues Chapman et Chapman en 1967. Cette illusion de corrélation — qu’au passage il aurait mieux valu nommer « illusion de causalité », car c’est la causalité qui est une illusion, pas la corrélation — explique un grand nombre de nos croyances et comportements, à commencer par les stéréotypes. Dont le racisme. Nous voyons facilement des liens de causalité entre des événements ou entre des caractéristiques.

Une tentative d’explication reposant sur la théorie des deux systèmes de la pensée du psychologue Daniel Kahneman pourrait être que notre cerveau a besoin de faire des liens causaux en permanence, sans réfléchir (système 1), sinon la vie serait invivable et le quotidien dangereux ! Anticiper la trajectoire d’une voiture pour l’éviter, se douter qu’un plan d’eau peut receler un piège, surtout si on ne sait pas nager, corréler le fruit « pomme » avec le fait que c’est mangeable et bon, etc, sont des calculs intuitifs de corrélations causales que notre cerveau fait en permanence. Mais parfois il arrive que l’intuition ne fonctionne pas. Le cerveau veut aller trop vite, prendre l’habituel raccourci de l’intuition, alors qu’il aurait dû activer le système 2, celui de la réflexion, et il se trompe, il associe trop rapidement une corrélation à une apparente causalité. Ça arrive rarement, beaucoup plus rarement que les « calculs » corrects, mais à cause de ça, on n’a pas forcément conscience de s’être trompé. Ce qui peut être problématique (par exemple, manger un fruit impropre à la consommation qui ressemble à une pomme mais qui n’en est pas une ou bien penser que l’augmentation de dioxyde de carbone est bon pour l’espérance de vie...).

La zététique, la science du doute selon Henri Broch, la science qui met à disposition des phénomènes para-normaux l’arsenal de la méthodologie scientifique, nomme cette confusion entre corrélation et causalité l’effet cigogne. Dans les régions qui abritent des cigognes, le taux de natalité est plus élevé, ce sont donc les cigognes qui apportent les bébés !

Un site rassemble les corrélations les plus diverses et surtout les plus saugrenues : http://www.tylervigen.com/spurious-correlations.

Il faut parfois prendre le temps de réfléchir, de ne pas nous laisser prendre au piège de nos intuitions. Ce n’est malheureusement pas aussi simple : par exemple les médias regorgent de corrélations trompeuses, quand ils ne prennent pas le temps nécessaire à la vérification des informations.


forum

Accueil | Contact | Plan du site | | Statistiques du site | Visiteurs : 3585 /

Suivre la vie du site fr  Suivre la vie du site Science  Suivre la vie du site Réflexions   ?

Site réalisé avec SPIP + AHUNTSIC

Creative Commons License

Visiteurs connectés : 6