Spredningsindeks i statistik

Læsningstid ~5 Min.
Spredningsindekser er vigtige, fordi de beskriver den variabilitet, der findes i en given population eller prøve. Sådan bruger du dem.

I en datadistribution spiller spredningsindekser en meget vigtig rolle. Disse målinger supplerer målingen af ​​den såkaldte centrale position ved at karakterisere variabiliteten af ​​dataene.

De spredningsindekser supplere dem med central tendens. De er også væsentlige i en datadistribution. Dette er fordi de karakteriserer dens variabilitet. Deres relevans i statistisk træning blev fremhævet af Wild og Pfannkuch (1999).

Opfattelsen af ​​datavariabilitet er en af ​​de grundlæggende komponenter i statistisk tænkning, da den giver os information om spredningen af ​​data i forhold til et gennemsnit.

Fortolkningen af ​​gennemsnittet

De aritmetisk middelværdi det er meget udbredt i praksis, men kan ofte misfortolkes. Dette sker, når variabelværdierne er meget sparsomme. Ved disse lejligheder er det nødvendigt at ledsage de gennemsnitlige spredningsindekser (2).

Spredningsindekser har tre vigtige komponenter relateret til tilfældig variabilitet (2):

  • Opfattelsen af ​​dens allestedsnærværende i verden omkring os.
  • Konkurrencen om dens forklaring.
  • Evnen til at kvantificere det (hvilket indebærer forståelse og viden om, hvordan man anvender begrebet spredning).

Hvad bruges spredningsindekser til?

Når det er nødvendigt at generalisere dataene fra en stikprøve af en population spredningsindekser er meget vigtige, da de direkte påvirker den fejl, vi arbejder med . Jo mere spredning vi indsamler i en prøve, jo større størrelse skal vi bruge for at arbejde med den samme fejl.

På den anden side hjælper disse indekser os med at afgøre, om vores data er langt fra den centrale værdi. De fortæller os, om denne centrale værdi er tilstrækkelig til at repræsentere undersøgelsespopulationen. Dette er meget nyttigt til at sammenligne distributioner og forstå risici i beslutningsprocessen (1).

Disse forhold er meget nyttige til at sammenligne fordelinger og forstå risici i beslutningstagning. Jo større spredning, jo mindre repræsentativ er den centrale værdi .

De mest brugte er:

  • Rækkevidde.
  • Statistisk afvigelse .
  • Varians.
  • Standard eller typisk afvigelse.
  • Variationskoefficient.

Funktioner af spredningsindekser

Rækkevidde

Brugen af ​​rang er til primær sammenligning. På denne måde tager den kun hensyn til de to ekstreme observationer . Derfor anbefales det kun til små prøver (1). Det er defineret som forskellen mellem den sidste værdi af variablen og den første (3).

Statistisk afvigelse

Middelafvigelsen angiver, hvor dataene ville være koncentreret, hvis alle var lige langt fra det aritmetiske middelværdi (1). Vi betragter afvigelsen af ​​en variabel værdi som forskellen i absolut værdi mellem den variable værdi og det aritmetiske middelværdi af serien. Det betragtes derfor som det aritmetiske gennemsnit af afvigelserne (3).

Varians

Variansen er en algebraisk funktion af alle værdier passende til inferentielle statistiske opgaver (1). Det kan defineres som kvadratisk afvigelse (3).

Standard eller typisk afvigelse

For prøver taget fra samme population er standardafvigelsen en af ​​de mest anvendte (1). Det er kvadratroden af ​​variansen (3).

Variationskoefficient

Det er et mål, der primært bruges til at sammenligne ændringen mellem to sæt data målt i forskellige enheder Og. F.eks højde og vægt gruppe af studerende i en prøve. Det bruges til at bestemme, i hvilken fordeling dataene er mest klynget, og gennemsnittet er mest repræsentativt (1).

Variationskoefficienten er et mere repræsentativt spredningsindeks end de foregående, da det er et abstrakt tal. Med andre ord den er uafhængig ved de enheder, hvori variabelværdierne optræder. Generelt er denne variationskoefficient udtrykt i procent (3).

Konklusioner om spredningsindekser

Indekserne af spredning angiver på den ene side graden af ​​variabilitet i prøven. På den anden side repræsentativiteten af ​​den centrale værdi da hvis du får en lav værdi, betyder det, at værdierne er koncentreret omkring det center. Dette ville betyde, at der er lidt variabilitet i dataene, og centret repræsenterer det hele godt.

Tværtimod, hvis du opnår en høj værdi, betyder det, at værdierne ikke er koncentrerede, men spredte. Det betyder, at der er stor variation, og centret vil ikke være særlig repræsentativt. På den anden side, når vi laver slutninger, har vi brug for en større prøve, hvis vi vil reducere fejlen øget netop på grund af stigningen i variabiliteten.

Populære Indlæg