Statistiek hoofdstuk 3 numerieke methoden deel 2


Publicatie datum:

Vervolg op deel 1 van numerieke methoden, in dit deel meer over verschillende manieren van weergeven.

Gesponsorde koppelingen

In deel 2 vind je de verschillende manieren van weergeven, van de numerieke methoden.

Gesponsorde koppelingen

Z-scores: bepaalt de relatieve positie van een waarde, door te kijken naar de standaarddeviatie (σ) en het gemiddelde (de mean). De z-score word ook wel de standaardwaarde genoemd.

Stelling van Chebyshev: Zegt iets over het aantal (percentage) waardes dat tussen een aantal standaarddeviaties ligt. Deze stelling kan bij alle gegevens gebruikt worden. Bij een klokvorm van gegevens zijn er enkele vuistregels, waarbij de gegevens bij een bepaald percentage ook een bepaalde waarde zullen hebben. Uitbijters (opvallend hoge of lage uitkomsten) moet voor het analyseren van de gegevens eruit gehaald worden, als het een fout betreft. De z-score is hiervoor een goede maatstaf. Als een waarde meer dan 3 afwijkt van de z-score, zou het een fout kunnen zijn.

3.4
Een aantal vormen van verkennende gegevensanalyse is:

5-getallenresumé (boxplot) : Hierbij worden de volgende uitkomsten op een rijtje gezet:

1) Kleinste waarde
2) Kwartiel 1, Q1
3) Mediaan (median)
4) Kwartiel 3, Q3
5) Grootste waarde

Boxdiagram (boxplot): grafiek waarbij de interkwartielafstand toegepast wordt. Op de horizontale as wordt een variabele uitgezet, waarna er een verticale lijn getrokken wordt voor Q1 en Q3, en het verschil ertussen (Q3 - Q1). Met deze lijnen wordt dan een vierhoek gemaakt; een box.

3.5
Verschillende manieren om de samenhang tussen 2 variabelen weer te geven, zijn:

Covariantie: Formule waarbij de afwijkingen van beide variabelen bij elkaar opgeteld worden, en vervolgens gedeeld door het aantal waarnemingen - 1. De uitkomsten kunnen in een grafiek gezet worden, waarbij de 2 variabelen uitgezet worden op beide assen, en de grafiek gevuld wordt met de uitkomsten bij verschillende waardes van de variabelen. Deze grafiek geeft dan de lineaire samenhang weer tussen de variabelen. Deze samenhang kan positief zijn (opwaartse beweging), of negatief (neerwaartse beweging). Er kan ook geen duidelijke beweging zijn. Er is dan geen samenhang. (zie 2.4) Zodra er een andere eenheid wordt gebruikt bij de berekening (centimeters in plaats van meters) ontstaan er wel hele andere uitkomsten.

Correlatiecoëfficiënt: Formule waarbij het probleem van verandering van eenheid bij het berekenen geen problemen oplevert. Hier worden de standaarddeviaties van beide variabelen met elkaar vermenigvuldigd. De covariantie wordt dan gedeeld door deze uitkomst. Ook deze gegevens kunnen in een grafiek gezet worden, op dezelfde manier als bij de covariantie. Positieve uitkomsten gelden dan als positieve samenhang; negatieve als een negatieve samenhang. Is de uitkomst 0; dan is er geen samenhang. (zie 2.4) Wederom moet men bij beide methodes een andere notatie gebruiken voor een steekproef, dan wel gehele populatie.

3.6
Ook voor deze methoden zijn er computerprogramma's, die kunnen helpen bij het weergeven van de gevonden informatie. Een voorbeeld is Excel. Verder geen nieuwe dingen in dit hoofdstuk.

3.7
Gewogen gemiddelde:
Wordt in sommige gevallen toegepast. Alle waardes worden dan apart gewaardeerd naar hoe belangrijk die waarde is voor het onderzoek, waarna op de gebruikelijke manier het gewogen gemiddelde berekend kan worden.

 Gegroepeerde gegevens: Als er geen echte metingen bekend zijn, maar alleen de uitkomsten van toegepaste berekeningen, moet men werken met gegroepeerde gegevens. Het gewogen gemiddelde kan hierbij helpen. Door deze berekening toe te passen op de al bekende gegevens, kan men het gemiddelde berekenen. Om de variantie te berekenen bij gegroepeerde gegevens, wordt de al bestaande formule voor variantie aangepast, waarbij hier ook een gewicht aan waardes toegekend wordt. De standaarddeviatie bij deze aangepaste gegevens wordt verkregen door de wortel (√) uit de variantie van de gegroepeerde gegevens te trekken. Hoewel deze berekeningen goed werken bij gegroepeerde gegevens, moet men bij de keus tussen verzamelde gegevens, en daadwerkelijke metingen, altijd kiezen voor de oorspronkelijke gegevens. Dit om zo nauwkeurig mogelijk te werken met de gevonden gegevens.


Auteursinformatie


Geschreven artikelen: 24
Leden aangebracht: 0

Meer uit de categorie werk-opleiding

Geld verdienen via Facebook is het een hype?

Je komt ze misschien wel eens tegen, advertenties verdien 284 euro per dag, zonder enige technische kennis, ervaring of andere zooi.

Is www.indeed.nl betrouwbaar

Indeed.nl beloofd je goed betaald thuiswerk, hoe werkt dat en is www.indeed.nl betrouwbaar

HBO opleiding Civiele Techniek

dit artikel gaat over de opleiding Civiele Techniek

Iemand inwerken makkelijker gezegd dan gedaan

Het lijkt heel makkelijk om iemand goed in te werken toch komt er iets meer bij kijken dan de meeste mensen denken.

Een sollicitatiebrief schrijven

Leer hier hoe je een goede sollicitatiebrief schrijft