Critères et méthodes pour tester les hypothèses statistiques, exemples

Table des matières:

Critères et méthodes pour tester les hypothèses statistiques, exemples
Critères et méthodes pour tester les hypothèses statistiques, exemples
Anonim

Le test d'hypothèse est une procédure nécessaire en statistique. Un test d'hypothèse évalue deux déclarations mutuellement exclusives pour déterminer quelle déclaration est la mieux étayée par les données de l'échantillon. Lorsqu'un résultat est dit statistiquement significatif, cela est dû à un test d'hypothèse.

Méthodes de vérification

Les méthodes de test des hypothèses statistiques sont des méthodes d'analyse statistique. En règle générale, deux ensembles de statistiques sont comparés, ou un ensemble de données échantillonnées est comparé à un ensemble de données synthétiques à partir d'un modèle idéalisé. Les données doivent être interprétées de manière à ajouter de nouvelles significations. Vous pouvez les interpréter en supposant une certaine structure du résultat final et en utilisant des méthodes statistiques pour confirmer ou rejeter l'hypothèse. L'hypothèse est appelée une hypothèse, et les tests statistiques utilisés à cette fin sont appelés des hypothèses statistiques.

H0 et H1 hypothèses

Il y a deux principauxles concepts de test statistique d'hypothèses - ce qu'on appelle «l'hypothèse principale ou nulle» et «l'hypothèse alternative». Elles sont aussi appelées hypothèses de Neyman-Pearson. L'hypothèse du test statistique est appelée l'hypothèse nulle, l'hypothèse principale ou H0 en abrégé. On l'appelle souvent l'hypothèse par défaut ou l'hypothèse que rien n'a changé. Une violation d'hypothèse de test est souvent appelée première hypothèse, hypothèse alternative ou H1. H1 est un raccourci pour une autre hypothèse, car tout ce que nous en savons, c'est que les données H0 peuvent être ignorées.

test d'hypothèse nulle
test d'hypothèse nulle

Avant de rejeter ou non l'hypothèse nulle, le résultat du test doit être interprété. Une comparaison est considérée comme statistiquement significative s'il est peu probable que la relation entre les ensembles de données soit la mise en œuvre de l'hypothèse nulle selon la probabilité seuil - le niveau de signification. Il existe également des critères de qualité d'ajustement pour les tests d'hypothèses statistiques. C'est le nom du critère de test d'hypothèse, qui est associé à la supposée loi de la distribution inconnue. Il s'agit d'une mesure numérique de l'écart entre les distributions empirique et théorique.

Procédure et critères de test des hypothèses statistiques

Les méthodes de sélection d'hypothèses les plus courantes sont basées soit sur le critère d'information d'Akaike, soit sur le coefficient bayésien. Le test d'hypothèse statistique est une technique clé à la fois dans l'inférence et l'inférence bayésienne, bien que les deux types présentent des différences notables. Tests d'hypothèses statistiquesdéfinir une procédure qui contrôle la probabilité de décider par erreur d'une hypothèse par défaut incorrecte ou nulle. La procédure est basée sur la probabilité qu'elle fonctionne. Cette probabilité de prendre une mauvaise décision est l'improbabilité que l'hypothèse nulle soit vraie et qu'aucune hypothèse alternative particulière n'existe. Le test ne peut pas montrer s'il est vrai ou faux.

Méthodes de test des hypothèses statistiques
Méthodes de test des hypothèses statistiques

Méthodes alternatives de la théorie de la décision

Il existe des méthodes alternatives de théorie de la décision, dans lesquelles les hypothèses nulle et première sont considérées sur un pied d'égalité. D'autres approches décisionnelles, telles que la théorie bayésienne, tentent d'équilibrer les conséquences des mauvaises décisions dans toutes les possibilités plutôt que de se concentrer sur une seule hypothèse nulle. Un certain nombre d'autres approches pour décider laquelle des hypothèses est correcte sont basées sur les données, lesquelles d'entre elles ont les propriétés souhaitées. Mais le test d'hypothèses est l'approche dominante de l'analyse des données dans de nombreux domaines scientifiques.

Tester l'hypothèse statistique

Chaque fois qu'un ensemble de résultats diffère d'un autre ensemble, il faut s'appuyer sur des tests d'hypothèses statistiques ou des tests d'hypothèses statistiques. Leur interprétation nécessite une bonne compréhension des valeurs p et des valeurs critiques. Il est également important de comprendre que, quel que soit le niveau de signification, les tests peuvent toujours contenir des erreurs. Par conséquent, la conclusion peut ne pas être correcte.

Le processus de test consiste àplusieurs étapes:

  1. Une hypothèse initiale est en cours de création pour la recherche.
  2. Les hypothèses nulles et alternatives pertinentes sont indiquées.
  3. Explique les hypothèses statistiques concernant l'échantillon dans le test.
  4. Déterminer quel test est approprié.
  5. Sélectionnez le niveau de signification et le seuil de probabilité en dessous desquels l'hypothèse nulle sera rejetée.
  6. La distribution de la statistique de test d'hypothèse nulle montre les valeurs possibles auxquelles l'hypothèse nulle est rejetée.
  7. Calcul en cours.
  8. Une décision est prise de rejeter ou d'accepter l'hypothèse nulle en faveur d'une alternative.

Il existe une alternative qui utilise une p-value.

Exemples de tests d'hypothèses statistiques
Exemples de tests d'hypothèses statistiques

Tests de signification

Les données pures n'ont aucune utilité pratique sans interprétation. En statistique, lorsqu'il s'agit de poser des questions sur les données et d'interpréter les résultats, des méthodes statistiques sont utilisées pour garantir l'exactitude ou la probabilité des réponses. Lors du test d'hypothèses statistiques, cette classe de méthodes est appelée test statistique ou test de signification. Le terme « hypothèse » rappelle les méthodes scientifiques, où les hypothèses et les théories sont étudiées. En statistique, un test d'hypothèse donne une quantité donnée pour une hypothèse donnée. Il vous permet d'interpréter si une hypothèse est vraie ou si une violation a été commise.

Interprétation statistique des tests

Tests d'hypothèsessont utilisés pour déterminer quels résultats de recherche conduiront au rejet de l'hypothèse nulle pour un niveau de signification prédéterminé. Les résultats d'un test d'hypothèse statistique doivent être interprétés afin que le travail puisse se poursuivre. Il existe deux formes courantes de critères de test d'hypothèses statistiques. Il s'agit de la valeur p et des valeurs critiques. Selon le critère choisi, les résultats obtenus doivent être interprétés différemment.

Qu'est-ce qu'une p-value

La sortie est décrite comme statistiquement significative lors de l'interprétation de la valeur de p. En fait, cet indicateur signifie la probabilité d'erreur si l'hypothèse nulle est rejetée. En d'autres termes, il peut être utilisé pour nommer une valeur qui peut être utilisée pour interpréter ou quantifier un résultat de test, et pour déterminer la probabilité d'erreur en rejetant l'hypothèse nulle. Par exemple, vous pouvez effectuer un test de normalité sur un échantillon de données et constater qu'il y a peu de chance de valeur aberrante. Cependant, l'hypothèse nulle n'a pas à être rejetée. Un test d'hypothèse statistique peut renvoyer une valeur de p. Cela se fait en comparant la valeur de p à une valeur seuil prédéterminée appelée niveau de signification.

Test statistique des hypothèses nulles
Test statistique des hypothèses nulles

Niveau d'importance

Le niveau de signification est souvent écrit avec la lettre minuscule grecque "alpha". La valeur générale utilisée pour alpha est de 5 %, soit 0,05. Une valeur alpha plus petite suggère une interprétation plus fiable de l'hypothèse nulle. La valeur de p est comparée àvaleur alpha présélectionnée. Le résultat est statistiquement significatif si la valeur p est inférieure à alpha. Le niveau de signification peut être inversé en le soustrayant de un. Ceci est fait pour déterminer le niveau de confiance de l'hypothèse compte tenu des données d'échantillon observées. Lors de l'utilisation de cette méthode de test d'hypothèses statistiques, la valeur P est probabiliste. Cela signifie que dans le processus d'interprétation du résultat d'un test statistique, on ne sait pas ce qui est vrai ou faux.

Théorie des tests d'hypothèses statistiques

Le rejet de l'hypothèse nulle signifie qu'il existe suffisamment de preuves statistiques pour qu'elle semble probable. Sinon, cela signifie qu'il n'y a pas assez de statistiques pour le rejeter. On peut penser aux tests statistiques en termes de dichotomie rejet et acceptation de l'hypothèse nulle. Le danger du test statistique de l'hypothèse nulle est que, si elle est acceptée, elle peut sembler vraie. Au lieu de cela, il serait plus correct de dire que l'hypothèse nulle n'est pas rejetée car il n'y a pas suffisamment de preuves statistiques pour la rejeter.

Hypothèse statistique testant la qualité des critères d'ajustement
Hypothèse statistique testant la qualité des critères d'ajustement

Ce moment confond souvent les figurants novices. Dans un tel cas, il est important de se rappeler que le résultat est probabiliste et que même accepter l'hypothèse nulle a encore une petite chance d'erreur.

Vraie ou fausse hypothèse nulle

L'interprétation de la valeur de p ne signifie pas que zérol'hypothèse est vraie ou fausse. Cela signifie qu'un choix a été fait de rejeter ou non l'hypothèse nulle à un certain niveau de signification statistique sur la base des données empiriques et du test statistique choisi. Par conséquent, la valeur p peut être considérée comme la probabilité des données fournies sous une hypothèse prédéterminée intégrée dans les tests statistiques. La valeur de p est une mesure de la probabilité que l'échantillon de données soit observé si l'hypothèse nulle est vraie.

Interprétation des valeurs critiques

Certains tests ne renvoient pas p. Au lieu de cela, ils peuvent renvoyer une liste de valeurs critiques. Les résultats d'une telle étude sont interprétés de la même manière. Au lieu de comparer une seule valeur p avec un niveau de signification prédéterminé, la statistique de test est comparée à une valeur critique. S'il s'avère inférieur, cela signifie qu'il n'a pas été possible de rejeter l'hypothèse nulle. Si supérieur ou égal, l'hypothèse nulle doit être rejetée. La signification de l'algorithme de test d'hypothèse statistique et l'interprétation de son résultat est similaire à la valeur p. Le niveau de signification choisi est une décision probabiliste de rejeter ou non l'hypothèse de test de base compte tenu des données.

Erreurs dans les tests statistiques

L'interprétation d'un test d'hypothèse statistique est probabiliste. La tâche de tester des hypothèses statistiques n'est pas de trouver une affirmation vraie ou fausse. Les preuves du test peuvent être erronées. Par exemple, si l'alpha était de 5 %, cela signifie que pour la plupart 1 sur 20l'hypothèse nulle sera rejetée par erreur. Ou ce ne sera pas le cas à cause du bruit statistique dans l'échantillon de données. Compte tenu de ce point, une petite valeur p à laquelle rejeter l'hypothèse nulle peut signifier qu'elle est fausse ou qu'une erreur a été commise. Si ce type d'erreur est commis, le résultat est appelé un faux positif. Et une telle erreur est une erreur de premier ordre lors du test d'hypothèses statistiques. D'autre part, si la valeur de p est suffisamment grande pour signifier le rejet de l'hypothèse nulle, cela peut signifier qu'elle est vraie. Ou n'est pas correct, et un événement improbable s'est produit en raison duquel l'erreur a été commise. Ce type d'erreur s'appelle un faux négatif.

Test statistique des hypothèses nulles
Test statistique des hypothèses nulles

Probabilité d'erreurs

Lorsque vous testez des hypothèses statistiques, il y a toujours une chance de faire l'un de ces types d'erreurs. De fausses données ou de fausses conclusions sont tout à fait probables. Idéalement, un niveau de signification doit être choisi qui minimise la probabilité d'une de ces erreurs. Par exemple, le test statistique d'hypothèses nulles peut avoir un très faible niveau de signification. Bien que des niveaux de signification tels que 0,05 et 0,01 soient courants dans de nombreux domaines scientifiques, le niveau de signification le plus couramment utilisé est 310 ^ -7, ou 0,0000003. Il est souvent appelé "5-sigma". Cela signifie que la conclusion était aléatoire avec une probabilité de 1 sur 3,5 millions de répétitions indépendantes des expériences. Les exemples de tests d'hypothèses statistiques comportent souvent de telles erreurs. C'est aussi la raison pour laquelle il est important d'avoir des résultats indépendants.vérification.

Exemples d'utilisation de la vérification statistique

Il existe plusieurs exemples courants de tests d'hypothèses dans la pratique. L'un des plus populaires est connu sous le nom de "Tea Tasting". Le Dr Muriel Bristol, une collègue du fondateur de la biométrie, Robert Fisher, a affirmé être en mesure de dire avec certitude si elle avait été ajoutée en premier à une tasse de thé ou de lait. Fisher a proposé de lui donner huit tasses (quatre de chaque variété) au hasard. La statistique du test était simple: compter le nombre de succès dans le choix d'une tasse. La région critique était le seul succès sur 4, peut-être basé sur le critère de probabilité habituel (< 5 %; 1 sur 70 ≈ 1,4 %). Fisher a fait valoir qu'une hypothèse alternative n'est pas nécessaire. La dame a correctement identifié chaque tasse, ce qui a été considéré comme un résultat statistiquement significatif. Cette expérience a conduit au livre de Fisher, Statistical Methods for Researchers.

Défendeur Exemple

La procédure d'un procès statistique est comparable à un tribunal pénal où l'accusé est présumé innocent jusqu'à preuve du contraire. Le procureur essaie de prouver la culpabilité de l'accusé. Ce n'est que lorsqu'il existe des preuves suffisantes pour une accusation que l'accusé peut être reconnu coupable. Au début de la procédure, il y a deux hypothèses: « L'accusé n'est pas coupable » et « L'accusé est coupable ». L'hypothèse d'innocence ne peut être rejetée que lorsque l'erreur est très peu probable car on ne veut pas condamner un accusé innocent. Une telle erreur est appelée une erreur de type I et son apparitionrarement contrôlée. En raison de ce comportement asymétrique, l'erreur de type II, c'est-à-dire l'acquittement de l'auteur, est plus courante.

Exemples de validation statistique
Exemples de validation statistique

Les statistiques sont utiles lors de l'analyse de grandes quantités de données. Cela s'applique également à la vérification des hypothèses, qui peuvent justifier les conclusions même si aucune théorie scientifique n'existe. Dans l'exemple de dégustation de thé, il était "évident" qu'il n'y avait pas de différence entre verser du lait dans du thé ou verser du thé dans du lait.

L'application pratique réelle des tests d'hypothèses comprend:

  • tester si les hommes font plus de cauchemars que les femmes;
  • attribution du document;
  • Évaluer l'influence de la pleine lune sur le comportement;
  • déterminer la plage dans laquelle une chauve-souris peut détecter un insecte à l'aide d'un écho;
  • choisir le meilleur moyen d'arrêter de fumer;
  • Vérifier si les autocollants pour pare-chocs reflètent le comportement du propriétaire de la voiture.

Les tests d'hypothèses statistiques jouent un rôle important dans les statistiques en général et dans l'inférence statistique. Le test de valeur est utilisé en remplacement de la comparaison traditionnelle de la valeur prédite et du résultat expérimental au cœur de la méthode scientifique. Lorsqu'une théorie est uniquement capable de prédire le signe d'une relation, les tests d'hypothèses dirigées peuvent être configurés de telle sorte que seul un résultat statistiquement significatif appuie la théorie. Cette forme de théorie de l'évaluation est la plus rigidecritique de l'utilisation des tests d'hypothèse.

Conseillé: