Percentages van de normale verdeling

Wat is de normale verdeling

De normale verdeling, ook wel bekend als de ‘Gaussische verdeling’ of ‘bell curve’, is een van de belangrijkste begrippen in de statistiek. Deze verdeling beschrijft hoe data zich gedraagt van onderwerpen zoals lengte, gewicht of eindexamencijfers van middelbare scholieren. De grafiek van een normale verdeling herken je aan de klokvormige grafiek. Deze klokvorm is symmetrisch met het gemiddelde als middelpunt.

De normale verdeling: een simpele uitleg!

Formules bij de normale verdeling

Waarom is die normale verdeling nou belangrijk? En wat heb je eraan? Om dit te begrijpen is het handig om eerst goed te snappen wat het gemiddelde en de standaarddeviatie is.

Het gemiddelde is het ‘centrum’ van de data. Als je de lengte van een groep mensen meet, dan is het gemiddelde hiervan de gemiddelde lengte van deze groep mensen. Je berekent het gemiddelde dus door alle metingen bij elkaar op te tellen gedeeld door het aantal Het aantal herken je in de statistiek aan de letter N. Stel dat je een groep van vijf mensen (N = 5) hebt die 1.68, 1.72, 1.76, 1.79 en 1.86 meter zijn. Het gemiddelde is dan: (1.68 + 1.72 + 1.76 + 1.79 +1.86)/5 = 1.76 meter.

De standaarddeviatie, ook wel standaardafwijking, geeft aan hoe ver de data uit elkaar ligt. Als de standaarddeviatie klein is, hebben de meeste mensen een lengte die dichtbij het gemiddelde ligt. Als de standaarddeviatie groot is, zijn de verschillen in lengte groter. Om de standaarddeviatie te berekenen is het handig om eerst te kijken naar de deviatie. De formule voor deviatie is: d = x – x̄
- d = deviatie
- x = waarde van meting
- x̄ = gemiddelde

Als we als voorbeeld de meting van 1.68 pakken, bereken je de deviatie zo: d = 1.68 – 1.76 = -0.08 meter

De standaarddeviatie (symbool: s) bereken je door vervolgens alle deviaties te kwadrateren en bij elkaar op te tellen. Dan krijg je dus de som (symbool: ∑) van alle d’s: -0.08² + -0.04² + 0² + 0.03² + 0.10² = 0,027. Vervolgens deel je die door N van 5, dus: 0,027 / 5 = 0,005. Van 0,005 trek je de wortel, daarmee kom je op 0,07. Hiermee heb je (eindelijk ;)) de standaarddeviatie van jouw steekproef berekend.

de normale verdeling percentages

Hoe werken de percentages?

In een normale verdeling verdeelt de data zich op een voorspelbare manier rond het gemiddelde. Dit leidt tot percentages die je altijd terugziet bij de normale verdeling:

68% binnen één standaarddeviatie van het gemiddelde: Dit betekent dat 68% van de data zich binnen één standaarddeviatie van het gemiddelde bevindt, zowel een standaarddeviatie boven als beneden het gemiddelde. Gekeken naar het voorbeeld hierboven betekent dat dus dat de lengte van 68% van de steekproef ligt tussen 1.69 en 1.83 meter (1.76 – en + 0.07)
95% van de lengtes ligt binnen twee standaarddeviaties van het gemiddelde, dus tussen de 1.62 en 1.90 meter.
99,7% van de lengtes ligt binnen drie standaarddeviaties van het gemiddelde: het bereik van 1.55 tot en met 1.97 meter. Bij drie standaarddeviaties valt bijna alle data (99,7%) binnen dit bereik. Hiermee heb je dus het overgrote stuk van je data te pakken.

Deze percentages worden vaak samengevat in de ‘68-95-99,7 regel,’ wat een makkelijke manier is om te onthouden hoe de data verdeeld is in een normale verdeling.

Waarom zijn deze percentages belangrijk?

Deze percentages zijn belangrijk, omdat ze je een manier geven om voorspellingen te doen en conclusies te trekken over je verzamelde data. Als je bijvoorbeeld weet dat de lengte van een groep mensen normaal verdeeld is met een gemiddelde van 1.70 m en een standaarddeviatie van 0.1 m, dan kun je met zekerheid zeggen dat 68% van de mensen tussen de 1.60 m en 1.80 m lang is.

De normale verdeling is een bekend begrip in de statistiek. Het is een voorspelbare en symmetrische verdeling van data rond het gemiddelde. De percentages (68%, 95%, en 99,7%) die binnen respectievelijk één, twee, en drie standaarddeviaties van het gemiddelde vallen, helpen je om beter te begrijpen hoe data zich spreidt. Of het nu gaat om het analyseren van lengtes, examencijfers of klanttevredenheidscijfers, veel type data is normaal verdeeld. De normale verdeling zorgt ervoor dat je de meeste statistische toetsen kan gebruiken om jouw data te onderzoeken

Aan de slag met statistiek? Volg een green belt training!

Alle artikelen bekijken