Accueil |

Statistiques

                         

La statistique est une branche des mathématiques appliquées et inclut la planification, le résumé et l'interprétation d'observations. Le mot statistique vient du Latin statisticus signifiant "probabilité". La théorie des probabilités joue un rà´le critique dans le développement de la théorie des statistiques.

Le statisticien décrit la connaissance (ou l'ignorance) mathématique et tente d'en apprendre plus selon ses observations. Cela demande:

  1. la planification d'expériences,
  2. le résumé statistique de données
  3. l'interprétation de données statistiques.

Dans certaines formes de résumés statistiques, surtout la collecte d'information, la planification elle-même disparaît au profit des deuxième et troisième étapes. Dans ces disciplines les données sont collectées sans contrà´le de la personne faisant l'analyse et le résultat devient plus un mode opérationel qu'un consensus sur le sujet.

Certaines sciences utilisent des statistiques appliquées à  leur domaine utilisant une terminologie spécifique (Biostatistique, Géostatistique,Statistique économique ou économétrie ...).

Sommaire
1 Le hasard
2 Probabilité
3 Lois statistiques
4 Acquisition et traitement des données
5 Incertitude de mesure
6 Voir aussi
7 Liens externes

Le hasard

Le but de la statistique est d'essayer de modéliser le hasard. Par essence, on ne peut pas prédire le résultat d'un phénomène aléatoire (par exemple un jet de dés). Les statistiques essaient tout de même de caractériser ces phénomènes, grà¢ce à  la notion de variable aléatoire (σ-algèbre, voir théorie des probabilités).

Probabilité

On remarque que sur un grand nombre d'essais, les différents résultats d'un événement reviennent avec une fréquence constante, par exemple, sur un jet de dés à  six faces, chaque face apparaît en moyenne une fois sur six. On peut donc associer un nombre, appelé probabilité, qui représente cette fréquence. Dans certains cas simples, on peut calculer ces probabilités par dénombrement.

On commence en général l'étude des statistiques par l'étude des probabilités, de leurs propriétés et des calculs que l'on peut faire avec (moyenne, Écart type) sans s'occuper de la manière dont on établit ces probabilités.

Lois statistiques

La répartition des probabilités, ou de la densité de probabilité, des phénomènes aléatoires suit souvent des lois relativement simples. Les lois de probabilité les plus connues sont :

La connaissance de la probabilité complète peut se résumer à  la connaissance du type de loi et de deux paramètres : l'espérance E (la moyenne) et l'écart type σ.

Acquisition et traitement des données

Pour établir la loi de probabilité, et notamment déterminer le type de loi adapté et les paramètres E et σ, il faut utiliser des mesures. Se pose alors le problème de l'échantillonnage : choix de la population à  sonder (au sens large : cela peut être un sondage d'opinion en interrogeant des humains, ou bien le ramassage de roches pour déterminer la nature d'un sol en géologie), la taille de la population et sa représentativité.

Dans le cas le plus simple, on fait n mesures, et on obtient n valeurs (''xi).

Une fois que l'on a collecté les résultats du sondage, il faut estimer E et σ. On utilise pour cela des estimateur sans biais, en générale la moyenne arithmétique àŠ pour estimer l'espérance

et la variance empirique corrigée pour le carré de l'écart type (ou variance)
Il faut ensuite faire des tests pour vérifier que la loi choisie est judicieuse, notamment le test du χ2 (ou Chi-deux, prononcer "ki-deux").

Lorsque l'on collecte deux valeurs (xi,yi) par mesure, on travaille en fait avec deux variables aléatoires X et Y. X et Y sont dites corrélées si la connaissance de la valeur de X permet de prédire plus facilement la valeur de Y. Concrètement, cela peut vouloir dire que le paramètre X influence le paramètre Y, ou que Y influence X, ou encore que X et Y ont une origine commune. On calcule pour cela un coefficient de corrélation. L'utilisation de cette notion est souvent abusive, le fait que deux variables aléatoires soient corrélées ne signifie pas qu'elles soient dépendantes l'une de l'autre.

Incertitude de mesure

En physique et en chimie, on utilise souvent la loi de Student pour déterminer les incertitudes ; dans ces domaines, son utilisation se réduit souvent à  multiplier l'estimateur de l'écart type par deux ou par trois pour avoir l'erreur acceptable.

Souvent, un phénomène physique obéit à  une loi simple, linéaire :

Y = a ·X + b
c'est le cas caricatural de variables corrélées. à€ partir de mesures de couples de valeurs (xi,yi), on veut établir '\'a et b''. Ceci s'appelle la régression linéaire.

Voir aussi

Liens externes