UN PEU DE STATISTIQUES

POUR CEUX QUI N’Y CONNAISSENT RIEN

 

A PROPOS DE NOTRE CAMPAGNE DE MESURE DE RADIOACTIVITE

 

Parlons d’abord de moyenne.

C’est une notion connue de toutes et tous : si j’ai 2 notes pour le trimestre, par exemple 10 et 14, pour calculer ma moyenne trimestrielle, je fais la somme des deux : 10 + 14 = 24, puis je divise par 2 : m = 24/2 = 12. Si j’ai 3 notes, j’additionne les trois, et je divise la somme par 3.

Dans la campagne de mesures dans l’air entre le 21 mars et le 19 mai, j’ai 60 mesures. Je fais donc la somme des 60 mesures, puis je divise cette somme par 60. Je trouve : m = 11,4. Vous n’êtes pas censé(e)s me croire sur parole, vous pouvez reprendre l’ensemble des bulletins radiamétriques et faire l’opération.

Le temps de comptage élémentaire du Quartex (environ 30 secondes) est calibré de façon à ce que le nombre qu’il indique, divisé par 100, donne le débit de dose en µSv/h (microSievert par heure). Ainsi, pour une mesure de 10, cela nous donne un débit de dose de 10/100 = 0,1 µSv/h. Sachant qu’il y a 24 h dans la journée, et 365,25 jours par an, une année compte donc 8 766 heures. Cela nous donne un débit de dose de 0,1 X 8 766 = 876,6 µSv/an, soit 0,8766 mSv/an (milliSievert par an). En effet, 1 000 µSv = 1 mSv. Nous pouvons arrondir à 0,9 mSv/an. Cette valeur est à mettre en regard de la réglementation qui, depuis 2 002, fixe à 1 mSv/an la dose maximale admissible en plus de celles dues à la radioactivité naturelle et aux examens médicaux (ces derniers apportent 1,1 mSv/an en moyenne dans les pays industrialisés). La radioactivité naturelle, fréquemment appelée le bruit de fond, varie selon le type de sol, et donc la concentration plus ou moins importante de matières radioactives qui y sont incluses. On considère que la moyenne est de 0,1 µSv/h sur sol calcaire ou sédimentaire, de 0,2 sur sol granitique. En Ile-de-France, on s’attend donc à une valeur proche de 0,1 µSv/h.

De fait, avec une moyenne de 11,4, nous avons un débit de dose de 11,4/100 = 0,114 µSv/h, très proche de 0,1. Ce qui fait pour 1 an : 0,114 X 8 766 = 999,324 µSv/an = 0,999 324 mSv/an, que l’on peut arrondir à 1 mSv/an.

Pour les mesures au contact de la végétation, la moyenne, très peu différente, se situe à 11,7 (moyenne de 56 mesures, du 25 mars au 19 mai). Cela nous donne un débit de dose de 0,117 µSv/h, ou 0,117 X 8 766 = 1 025,622 µSv/an = 1,025 622 mSv/an, que l’on peut arrondir également à 1 mSv/an.

Et maintenant, l’écart-type.

Cette grandeur, beaucoup moins connue que la moyenne, mesure la dispersion des valeurs autour de la moyenne. Plus l’écart-type est grand, plus les valeurs se situent loin de la moyenne. Concrètement, il faut mesurer l’écart à la moyenne de chaque mesure, donc la différence entre mesure et moyenne, et faire la moyenne de toutes les différences obtenues. Je vous passe la formule mathématique, un peu plus complexe que ce que je viens d’en dire. Mais avec une calculette niveau collège, dite calculette scientifique, on a un mode statistique qui permet, après avoir entré toutes ses mesures, de demander la valeur de l’écart-type. Je rappelle aussi que dans tous les PC, vous avez cet outil : il suffit de faire Démarrer / tous les programmes / accessoires / calculatrice / affichage / statistique. L’écart-type est noté σn-1.

Mais je ne vais pas calculer l’écart-type sur les moyennes quotidiennes, justement parce qu’il s’agit de moyennes, où les écarts ont été gommés. La moyenne globale est peu affectée par ce calcul à double détente. En revanche, l’écart-type en serait très affecté.

Il me faut donc reprendre l’ensemble des mesures, soit 10 par jour. Malheureusement, je ne peux pas le faire pour l’ensemble de la période, puisque je n’ai pas conservé toutes les séries de 10 mesures journalières. Je ne l’ai fait qu’à partir du 11 avril, date à laquelle j’ai envisagé ce travail de bilan. Du 11 avril au 19 mai, il y a 39 jours de mesure, avec 10 mesures par jour, ce qui fait 390 mesures. Comme vous n’avez pas ces mesures, force vous est de me croire sur parole. Pour les mesures dans l’air, je trouve une moyenne de 11,2. Cette valeur est très proche de celle trouvée en faisant la moyenne des moyennes journalières, soit 11,4, et encore cette dernière valeur est-elle calculée sur une période plus longue, ce qui justifie ce que j’écrivais plus haut : le calcul de la moyenne est peu affectée par cette opération à double détente. L’écart-type est de : σn-1 = 3,364. Mais qu’en faire ?

La donnée en soi de l’écart-type n’a que peu d’intérêt. Elle prend tout son intérêt quand on sait que les statisticiens ont montré que, dans une distribution « normale » (le terme a un sens plus précis que dans le langage courant), et cette distribution de mesures est tout à fait « normale », une mesure donnée a 95% de chances de se situer dans un intervalle compris entre m – 2σn-1 et m + 2σn-1. Autre façon de le dire : nous pouvons nous attendre à trouver 95% des valeurs dans cet intervalle. Et donc 5% des valeurs hors de cet intervalle. Voyons quel est précisément cet intervalle :   m – 2σn-1 = 11,2 – 2 X 3,3641 = 4,5 en arrondissant à un chiffre derrière la virgule. Et m + 2σn-1 = 11,2 + 2 X 3,3641 = 17,9. Nous nous attendons donc à trouver 95% X 390 = 370,5 valeurs dans l’intervalle, et donc 5% X 390 = 19,5 valeurs en dehors (soit 19 ou 20). En dehors de cet intervalle, nous trouvons effectivement 21 valeurs. Ce qui est conforme aux prévisions. Ceci tend à prouver que nous sommes bien en présence d’une distribution aléatoire. Mais, direz-vous, il y a des valeurs bien élevées par rapport à la moyenne. On trouve en effet 3 fois 20, 3 fois 21 et une fois 22. Les statisticiens ont montré que, toujours dans une distribution « normale », 0,1% des valeurs se situent en dehors de l’intervalle entre m – 3σn-1,  et m + 3σn-1. Voyons ce que cela donne ici. 0,1% X 390 = 0,39. On s’attend donc à 0 ou 1 valeur en dehors de cet intervalle. m – 3σn-1 = 11,2 – 3 X 3,3641 = 1,1 et m + 3σn-1 = 11,2 + 3 X 3,3641 = 21,3. On trouve effectivement une valeur supérieure à 21,3, c’est 22. Et c’est la seule. Encore une fois, la distribution est conforme à ce que l’on peut attendre d’une distribution parfaitement aléatoire. On n’observe bien sur toute cette période que la radioactivité naturelle, avec un débit de dose de 0,112 µSv/h, et une dispersion attendue des valeurs autour de cette moyenne. La radioactivité naturelle est un phénomène purement aléatoire. Impossible de dire quel atome va se désintégrer, et quand. Et sur une courte période de temps, nous pouvons observer beaucoup plus ou beaucoup moins que la moyenne attendue.

Encore une remarque. Pour des raisons mathématiques que je ne développerai pas ici, il se trouve que σn-1 est environ égal à la racine carrée de la moyenne. Ici, m = 11,2 et sa racine carrée (le nombre qui, multiplié par lui-même, donne 11,2) est 3,3466. Nous sommes effectivement très proches de la valeur calculée précédemment : 3,3641. Surtout si on arrondit à deux chiffres derrière la virgule : 3,35 contre 3,36. C’est pratique pour avoir rapidement une idée de la valeur de l’écart-type sans faire tout le calcul. Et cela permet de vérifier rapidement le calcul une fois qu’il est fait.

Vous me direz que nous avons observé des moyennes journalières un peu plus fortes au contact de la végétation. Et j’ajouterai que nous avons des mesures individuelles plus fortes que dans l’air, puisque j’ai noté une fois 24 et une fois 25. Voyons ce que cela donne pour cette autre série de mesures. La période où l’étude est possible est bien sûr la même que précédemment : du 11 avril au 19 mai. La moyenne est m = 11,7949 que l’on peut arrondir à 11,80 et l’écart-type σn-1 = 3,4662. Remarquons qu’ici encore, l’écart-type est très proche de la racine carrée de la moyenne, qui donne 3,4344. Nous nous attendons donc à trouver 5% des valeurs, soit 19,5 (19 ou 20), en dehors de l’intervalle entre m - 2σn-1 = 11,80 – 2 X 3,4662 = 4,9 et m + 2σn-1 = 11,80 + 2 X 3,4662 = 18,7. Il y a en fait 2 valeurs en dessous de l’intervalle, et 11 valeurs au-dessus, ce qui fait en tout 13. Nous avons donc une distribution un peu plus resserrée que ce à quoi nous pouvions nous attendre. Et qu’en est-il de l’intervalle m – 3σn-1 à m + 3σn-1 ? m – 3σn-1 = 11,80 – 3 X 3,4662 = 1,4 et m + 3σn-1 = 11,80 + 3 X 3,4662 = 22,2. Nous nous attendons à trouver 0,1% des valeurs, soit 0,39 (0 ou 1) en dehors de l’intervalle. Or, nous en avons 1 en dessous, et 2 au-dessus. Ce qui fait 3. Peut-être cela permet-il de montrer que nous avons détecté un léger excès par rapport au bruit de fond à certains moments très limités, mais cet excès était très faible. Si c’est bien le cas, il résultait vraisemblablement de la chute au sol par le simple effet de la gravité de particules radioactives dans la mesure où il a très peu plu dans la période, et jamais avant les mesures les plus hautes. A noter que ces mesures sont restées ponctuelles, jamais confirmées par des séries de même hauteur. Cela renforce donc le point de vue que nous avions exprimé alors, selon lequel nous n’avions nulle inquiétude à avoir.

Merci de m’avoir suivi jusqu’au bout, mais le lecteur a bien compris que pour en arriver à cette conclusion étayée scientifiquement, il convenait d’introduire quelques notions mathématiques pas toujours évidentes.