UN PEU DE STATISTIQUES
POUR CEUX QUI N’Y
CONNAISSENT RIEN
A PROPOS DE
NOTRE CAMPAGNE DE MESURE DE RADIOACTIVITE
Parlons
d’abord de moyenne.
C’est une notion connue de toutes et tous : si
j’ai 2 notes pour le trimestre, par exemple 10 et 14, pour calculer ma moyenne
trimestrielle, je fais la somme des deux : 10 + 14 = 24, puis je divise
par 2 : m = 24/2 = 12. Si j’ai 3 notes, j’additionne les trois, et je
divise la somme par 3.
Dans la campagne de mesures dans l’air entre le 21
mars et le 19 mai, j’ai 60 mesures. Je fais donc la somme des 60 mesures, puis
je divise cette somme par 60. Je trouve : m = 11,4. Vous n’êtes pas
censé(e)s me croire sur parole, vous pouvez reprendre l’ensemble des bulletins
radiamétriques et faire l’opération.
Le temps de comptage élémentaire du Quartex (environ
30 secondes) est calibré de façon à ce que le nombre qu’il indique, divisé par
100, donne le débit de dose en µSv/h (microSievert par heure). Ainsi, pour une
mesure de 10, cela nous donne un débit de dose de 10/100 = 0,1 µSv/h. Sachant
qu’il y a 24 h dans la journée, et 365,25 jours par an, une année compte donc
8 766 heures. Cela nous donne un débit de dose de 0,1 X 8 766 = 876,6
µSv/an, soit 0,8766 mSv/an (milliSievert par an). En effet, 1 000 µSv = 1
mSv. Nous pouvons arrondir à 0,9 mSv/an. Cette valeur est à mettre en regard de
la réglementation qui, depuis 2 002, fixe à 1 mSv/an la dose maximale
admissible en plus de celles dues à la radioactivité naturelle et aux examens
médicaux (ces derniers apportent 1,1 mSv/an en moyenne dans les pays
industrialisés). La radioactivité naturelle, fréquemment appelée le bruit de
fond, varie selon le type de sol, et donc la concentration plus ou moins
importante de matières radioactives qui y sont incluses. On considère que la
moyenne est de 0,1 µSv/h sur sol calcaire ou sédimentaire, de 0,2 sur sol
granitique. En Ile-de-France, on s’attend donc à une valeur proche de 0,1
µSv/h.
De fait, avec une moyenne de 11,4, nous avons un débit
de dose de 11,4/100 = 0,114 µSv/h, très proche de 0,1. Ce qui fait pour 1
an : 0,114 X 8 766 = 999,324 µSv/an = 0,999 324 mSv/an, que l’on peut
arrondir à 1 mSv/an.
Pour les mesures au contact de la végétation, la
moyenne, très peu différente, se situe à 11,7 (moyenne de 56 mesures, du 25
mars au 19 mai). Cela nous donne un débit de dose de 0,117 µSv/h, ou 0,117 X
8 766 = 1 025,622 µSv/an = 1,025 622 mSv/an, que l’on peut arrondir
également à 1 mSv/an.
Et
maintenant, l’écart-type.
Cette grandeur, beaucoup moins connue que la moyenne,
mesure la dispersion des valeurs autour de la moyenne. Plus l’écart-type est
grand, plus les valeurs se situent loin de la moyenne. Concrètement, il faut
mesurer l’écart à la moyenne de chaque mesure, donc la différence entre mesure
et moyenne, et faire la moyenne de toutes les différences obtenues. Je vous
passe la formule mathématique, un peu plus complexe que ce que je viens d’en
dire. Mais avec une calculette niveau collège, dite calculette scientifique, on
a un mode statistique qui permet, après avoir entré toutes ses mesures, de
demander la valeur de l’écart-type. Je rappelle aussi que dans tous les PC,
vous avez cet outil : il suffit de faire Démarrer / tous les programmes /
accessoires / calculatrice / affichage / statistique. L’écart-type est noté
σn-1.
Mais je ne vais pas calculer l’écart-type sur les
moyennes quotidiennes, justement parce qu’il s’agit de moyennes, où les écarts
ont été gommés. La moyenne globale est peu affectée par ce calcul à double
détente. En revanche, l’écart-type en serait très affecté.
Il me faut donc reprendre l’ensemble des mesures, soit
10 par jour. Malheureusement, je ne peux pas le faire pour l’ensemble de la
période, puisque je n’ai pas conservé toutes les séries de 10 mesures
journalières. Je ne l’ai fait qu’à partir du 11 avril, date à laquelle j’ai
envisagé ce travail de bilan. Du 11 avril au 19 mai, il y a 39 jours de mesure,
avec 10 mesures par jour, ce qui fait 390 mesures. Comme vous n’avez pas ces
mesures, force vous est de me croire sur parole. Pour les mesures dans l’air,
je trouve une moyenne de 11,2. Cette valeur est très proche de celle trouvée en
faisant la moyenne des moyennes journalières, soit 11,4, et encore cette
dernière valeur est-elle calculée sur une période plus longue, ce qui justifie
ce que j’écrivais plus haut : le calcul de la moyenne est peu affectée par
cette opération à double détente. L’écart-type est de : σn-1
= 3,364. Mais qu’en faire ?
La donnée en soi de l’écart-type n’a que peu
d’intérêt. Elle prend tout son intérêt quand on sait que les statisticiens ont montré
que, dans une distribution « normale » (le terme a un sens plus
précis que dans le langage courant), et cette distribution de mesures est tout
à fait « normale », une mesure donnée a 95% de chances de se situer
dans un intervalle compris entre m – 2σn-1 et m + 2σn-1.
Autre façon de le dire : nous pouvons nous attendre à trouver 95% des
valeurs dans cet intervalle. Et donc 5% des valeurs hors de cet intervalle.
Voyons quel est précisément cet intervalle : m – 2σn-1 = 11,2 – 2 X 3,3641
= 4,5 en arrondissant à un chiffre derrière la virgule. Et m + 2σn-1
= 11,2 + 2 X 3,3641 = 17,9. Nous nous attendons donc à trouver
95% X 390 = 370,5 valeurs dans l’intervalle, et donc 5% X 390 = 19,5 valeurs en
dehors (soit 19 ou 20). En dehors de cet intervalle, nous trouvons
effectivement 21 valeurs. Ce qui est conforme aux prévisions. Ceci tend à
prouver que nous sommes bien en présence d’une distribution aléatoire. Mais,
direz-vous, il y a des valeurs bien élevées par rapport à la moyenne. On trouve en
effet 3 fois 20, 3 fois 21 et une fois 22. Les statisticiens ont montré que,
toujours dans une distribution « normale », 0,1% des valeurs se
situent en dehors de l’intervalle entre m – 3σn-1, et m + 3σn-1. Voyons ce que cela donne ici.
0,1% X 390 = 0,39. On s’attend
donc à 0 ou 1 valeur en dehors de cet intervalle. m
– 3σn-1 = 11,2
– 3 X 3,3641 = 1,1 et m + 3σn-1 = 11,2 + 3 X 3,3641 = 21,3. On
trouve effectivement une valeur supérieure à 21,3, c’est 22. Et c’est la seule.
Encore une fois, la distribution est conforme à ce que l’on peut attendre d’une
distribution parfaitement aléatoire. On n’observe bien sur toute cette période que
la radioactivité naturelle, avec un débit de dose de 0,112 µSv/h, et une
dispersion attendue des valeurs autour de cette moyenne. La radioactivité
naturelle est un phénomène purement aléatoire. Impossible de dire quel atome va
se désintégrer, et quand. Et sur une courte période de temps, nous pouvons
observer beaucoup plus ou beaucoup moins que la moyenne attendue.
Encore une remarque. Pour des raisons mathématiques que je ne
développerai pas ici, il se trouve que σn-1 est environ égal à
la racine carrée de la moyenne. Ici, m = 11,2 et sa racine carrée (le nombre
qui, multiplié par lui-même, donne 11,2) est 3,3466. Nous sommes effectivement
très proches de la valeur calculée précédemment : 3,3641. Surtout si on
arrondit à deux chiffres derrière la virgule : 3,35 contre 3,36. C’est
pratique pour avoir rapidement une idée de la valeur de l’écart-type sans faire
tout le calcul. Et cela permet de vérifier rapidement le calcul une fois qu’il
est fait.
Vous me direz que nous
avons observé des moyennes journalières un peu plus fortes au contact de la
végétation. Et j’ajouterai que nous avons des mesures individuelles plus fortes
que dans l’air, puisque j’ai noté une fois 24 et une fois 25. Voyons ce que
cela donne pour cette autre série de mesures. La période où l’étude est
possible est bien sûr la même que précédemment : du 11 avril au 19 mai. La
moyenne est m = 11,7949 que l’on peut arrondir à 11,80 et l’écart-type σn-1
= 3,4662. Remarquons qu’ici encore, l’écart-type est très proche de la racine
carrée de la moyenne, qui donne 3,4344. Nous nous attendons donc à trouver 5%
des valeurs, soit 19,5 (19 ou 20), en dehors de l’intervalle entre m - 2σn-1
= 11,80 – 2 X 3,4662 = 4,9 et m + 2σn-1 = 11,80 + 2 X 3,4662 =
18,7. Il y a en fait 2 valeurs en dessous de l’intervalle, et 11 valeurs
au-dessus, ce qui fait en tout 13. Nous avons donc une distribution un peu plus
resserrée que ce à quoi nous pouvions nous attendre. Et qu’en est-il de
l’intervalle m – 3σn-1 à m + 3σn-1 ? m –
3σn-1 = 11,80 – 3 X 3,4662 = 1,4 et m + 3σn-1 =
11,80 + 3 X 3,4662 = 22,2. Nous nous attendons à trouver 0,1% des valeurs, soit
0,39 (0 ou 1) en dehors de l’intervalle. Or, nous en avons 1 en dessous, et 2
au-dessus. Ce qui fait 3. Peut-être cela permet-il de montrer que nous avons
détecté un léger excès par rapport au bruit de fond à certains moments très
limités, mais cet excès était très faible. Si c’est bien le cas, il résultait
vraisemblablement de la chute au sol par le simple effet de la gravité de
particules radioactives dans la mesure où il a très peu plu dans la période, et
jamais avant les mesures les plus hautes. A noter que ces mesures sont restées
ponctuelles, jamais confirmées par des séries de même hauteur. Cela renforce
donc le point de vue que nous avions exprimé alors, selon lequel nous n’avions
nulle inquiétude à avoir.
Merci de m’avoir suivi
jusqu’au bout, mais le lecteur a bien compris que pour en arriver à cette
conclusion étayée scientifiquement, il convenait d’introduire quelques notions
mathématiques pas toujours évidentes.