Comment calculer la variance : explication avec des exemples

Table des matières:

Comment calculer la variance : explication avec des exemples
Comment calculer la variance : explication avec des exemples
Anonim

La théorie des probabilités fonctionne avec des variables aléatoires. Pour les variables aléatoires, il existe des lois dites de distribution. Une telle loi décrit sa variable aléatoire avec une complétude absolue. Cependant, lorsque l'on travaille avec des ensembles réels de variables aléatoires, il est souvent très difficile d'établir immédiatement la loi de leur distribution et on se limite à un certain ensemble de caractéristiques numériques. Par exemple, calculer la moyenne et la variance d'une variable aléatoire est souvent très utile.

Pourquoi est-ce nécessaire

Si l'essence de l'espérance mathématique est proche de la valeur moyenne de la quantité, alors dans ce cas la dispersion indique comment les valeurs de notre quantité sont dispersées autour de cette espérance mathématique. Par exemple, si nous mesurons le QI d'un groupe de personnes et que nous voulons examiner les résultats de mesure (échantillon), l'attente mathématique montrera la valeur moyenne approximative du quotient intellectuel pour ce groupe de personnes, et si nous calculons la variance de l'échantillon, nous découvrirons comment les résultats sont regroupés autour de l'espérance mathématique: un groupe près d'elle (petite variation de QI) ou plus uniformément sur toute la plage du résultat minimum au maximum (grande variation, et quelque part au milieu - espérance mathématique).

Pour calculer la variance, vous avez besoin d'une nouvelle caractéristique d'une variable aléatoire - l'écart de la valeur par rapport à la valeur mathématiqueen attente.

Déviation

Pour comprendre comment calculer la variance, vous devez d'abord comprendre l'écart. Sa définition est la différence entre la valeur que prend une variable aléatoire et son espérance mathématique. En gros, pour comprendre comment une valeur est "dispersée", vous devez regarder comment son écart est distribué. Autrement dit, nous remplaçons la valeur de la valeur par la valeur de son écart par rapport au tapis. attentes et explorez sa loi de distribution.

La loi de distribution d'un discret, c'est-à-dire une variable aléatoire qui prend des valeurs individuelles, est écrite sous la forme d'un tableau, où la valeur de la valeur est corrélée à la probabilité de son occurrence. Ensuite, dans la loi de distribution des écarts, la variable aléatoire sera remplacée par sa formule, dans laquelle il y a une valeur (qui a conservé sa probabilité) et son propre tapis. en attente.

Propriétés de la loi de distribution de l'écart d'une variable aléatoire

Nous avons écrit la loi de distribution de l'écart d'une variable aléatoire. Nous ne pouvons en extraire jusqu'à présent qu'une caractéristique telle que l'espérance mathématique. Pour plus de commodité, il est préférable de prendre un exemple numérique.

Soit une loi de distribution d'une variable aléatoire: X - valeur, p - probabilité.

droit de la distribution
droit de la distribution

Nous calculons l'espérance mathématique en utilisant la formule et immédiatement l'écart.

Valeur attendue
Valeur attendue

Dessiner un nouveau tableau de distribution des écarts.

Loi de distribution pour l'écart
Loi de distribution pour l'écart

Nous calculons également l'attente ici.

Espérance mathématique pour l'écart
Espérance mathématique pour l'écart

Il s'avère zéro. Il n'y a qu'un exemple, mais il en sera toujours ainsi: il n'est pas difficile de le prouver dans le cas général. La formule de l'espérance mathématique de l'écart peut être décomposée en la différence entre les espérances mathématiques d'une variable aléatoire et, aussi tordue que cela puisse paraître, l'espérance mathématique du tapis. attentes (récursion, cependant), qui sont les mêmes, donc leur différence sera nulle.

C'est normal: après tout, les écarts de signe peuvent être à la fois positifs et négatifs, par conséquent, en moyenne, ils devraient donner zéro.

Comment calculer la variance d'un cas discret. quantités

Si mat. il est inutile de calculer l'espérance de déviation, il faut chercher autre chose. Vous pouvez simplement prendre les valeurs absolues des écarts (modulo); mais avec les modules, tout n'est pas si simple, donc les écarts sont au carré, puis leur espérance mathématique est calculée. En fait, c'est ce que l'on veut dire lorsqu'ils parlent de la façon de calculer la variance.

C'est-à-dire que nous prenons les écarts, les mettons au carré et créons un tableau des écarts au carré et des probabilités qui correspondent à des variables aléatoires. Il s'agit d'une nouvelle loi de distribution. Pour calculer l'espérance mathématique, vous devez ajouter les produits du carré de l'écart et de la probabilité.

Formule simplifiée

Cependant, l'article commence par le fait que la loi de distribution de la variable aléatoire initiale est souvent inconnue. Il faut donc quelque chose de plus léger. En effet, il existe une autre formule qui permet de calculer la variance de l'échantillon en utilisant uniquement le tapis.en attente:

Dispersion - la différence entre le tapis. espérance du carré d'une variable aléatoire et, inversement, du carré de son tapis. en attente.

Il existe une preuve pour cela, mais cela n'a pas de sens de la présenter ici, car elle n'a aucune valeur pratique (et nous n'avons qu'à calculer la variance).

Comment calculer la variance d'une variable aléatoire dans une série variationnelle

Dans les statistiques réelles, il est impossible de refléter toutes les variables aléatoires (car, grosso modo, il y en a, en règle générale, un nombre infini). Par conséquent, ce qui entre dans l'étude est le soi-disant échantillon représentatif d'une population générale générale. Et, puisque les caractéristiques numériques de toute variable aléatoire d'une telle population générale sont calculées à partir de l'échantillon, elles sont appelées échantillon: moyenne de l'échantillon, respectivement, variance de l'échantillon. Vous pouvez le calculer de la même manière que d'habitude (à travers les écarts au carré).

Variance biaisée de l'échantillon
Variance biaisée de l'échantillon

Cependant, une telle dispersion est dite biaisée. La formule de variance impartiale est un peu différente. Il est généralement nécessaire de le calculer.

Échantillon de variance impartiale
Échantillon de variance impartiale

Petit ajout

Une autre caractéristique numérique est liée à la dispersion. Il sert également à évaluer comment la variable aléatoire se disperse autour de son tapis. attentes. Il n'y a pas beaucoup de différence dans la façon de calculer la variance et l'écart type: ce dernier est la racine carrée du premier.

Conseillé: