Je voudrais présenter un outil statistique assez utile pour ce genre d'étude, car il permet de répondre à des questions intéressantes. Je ne suis pas très fort pour expliquer, et ça pourrait être un peu long/obscur, donc je le mets en spoiler :
Spoiler :
Je vais tenter d'expliquer "avec des mots" plutôt que faire une vrai présentation mathématique, ça peut donc manquer un peu de rigueur:
Le contexte: On réalise plein d'essais à la forge, en s'appuyant sur le résultat intuitif suivant: "au fur et à mesure que l'on fait des essais, la moyenne des résultats va tendre vers la probabilité d'avoir un précurseur"
Les questions que l'on se pose intuitivement: -Avec nos 2901 essais, à quel point notre résultat va-t-il être proche de la vrai probabilité ? -Quelles sont les chances que notre résultat soit en fait éloigné de la vrai probabilité ?
Pour répondre à ces questions intuitives, il faut d'abord définir clairement les termes: -que veulent dire "précis" et "éloigné" mathématiquement ?
L'intervalle de confiance est un outil qui permet de répondre à ces questions, en quantifiant la "précision" du résultat, il donne un résultat de la forme suivante:
"Si je veux être sûr à X% de chances de ne pas me tromper, pour 2900 essais, je dois considérer que la vraie probabilité est dans un intervalle de telle largeur autour de mon résultat"
On a fait N essais et on a calculé une probabilité p d'avoir un précurseur. (je note RC la racine carrée) En prenant s=RC(p*(1-p)) comme écart-type (qui quantifie justement la tendance de notre moyenne à s'écarter de la valeur théorique), on a:
-On est sûr à 95% que l'écart entre p et la vraie valeur est de moins de 2*s/RC(N) -On est sûr à 99% que l'écart entre p et la vraie valeur est de moins de 2,6*s/RC(N)
Je vous laisse les calculs si ça vous tente, je voudrais juste attirer l'attention sur un dernier point: le terme "/RC(N)" signifie que, à un niveau de confiance donné, pour être 2 fois plus précis, il faut quand même 4 fois plus d'essais (et donc de ).