100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting Hoofdstuk 2 - Discovering Statistics - Andy Field

Beoordeling
-
Verkocht
-
Pagina's
6
Geüpload op
07-01-2023
Geschreven in
2022/2023

Hoofdstuk 2 van Discovering Statistics, the SPINE of statistics. Samenvatting in het Nederlands










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
H2
Geüpload op
7 januari 2023
Aantal pagina's
6
Geschreven in
2022/2023
Type
Samenvatting

Voorbeeld van de inhoud

Discovering statistics using IBM SPSS statistics – Andy Field
Samenvatting van Rianne Weijts – Erasmus Universiteit Rotterdam


CHAPTER 2: THE SPINE OF STATISTICS


De meeste statistische modellen zijn een variatie op het idee van het voorspellen van een uitkomst van
één of meer voorspellende variabelen. Verder hebben de meeste statische modellen een aantal dingen
gemeen en als je dat begrijpt ben je al een heel eind, de SPINE van statistiek.
S: standaard error
P: parameters
I: Interval estimates (betrouwbaarheids interval)
N: Null hypothesis significance tests
E: Estimation (schatting)

2.3 Statistical Models
Wetenschappers gebruiken over het algemeen een lineair model, een model gebaseerd op een rechte
lijn. Het statistische model zou de verzamelde data zo goed mogelijk moeten representeren. De mate
waarin een statistisch model de data representeert wordt ook wel de fit van het model genoemd.

In principe zijn alle statistische modellen terug te brengen tot één
simpele vergelijking. Deze vergelijking houdt in dat de data die
we observeren voorspelt kan worden door het model dat we kiezen plus een bepaalde hoeveelheid
error. De kleine i refereert aan de i’de score. Het betekent dat de waarde van de uitkomst en de error
verschillend zullen zijn voor elke persoon. We voorspellen een uitkomst variabele vanuit een model,
maar zullen dit niet perfect doen dus we voegen ook wat error toe.

Een populatie kan heel breed zijn (alle mensen) of heel specifiek (alle mannelijke roodharige katten
die Bob heten). Over het algemeen kijken wetenschappers vaak naar algemene populaties. Omdat we
vaak niet iedereen in een populatie kunnen ondervragen verzamelen we data uit een deel van de
populatie, we nemen dus een sample. Dit gebruiken we vervolgens om conclusies te trekken over de
populatie in zijn geheel.

2.5 P is for Parameters
Parameters zijn niet iets wat ‘gemeten’ wordt, in tegenstelling tot variabelen, het zijn constructen
waarvan gedacht wordt dat een fundamentele waarheid beschrijven over de relaties tussen variabelen
in een model. Voorbeelden van parameters zijn de gemiddeldes (mean en mediaan), en de correlatie en
regressie coëfficiënten. Verschillende parameters krijgen vaak verschillende
namen en symbolen (X, r, b), maar het is veel simpeler om voor de
parameter altijd b te gebruiken. De onderdelen tussen de haakjes in de
vergelijking staan dus voor ‘het model’ oftewel het statistische model wat we toepassen.
We kunnen waarden van een uitkomstvariabele voorspellen op basis van een model. De vorm van het
model verandert, maar er zal altijd een fout in de voorspelling zijn en er zullen altijd parameters zijn
die ons vertellen over de shape of vorm van het model. We gebruiken de data uit het sample om de
parameters in de populatie in te schatten (parameter estimates).

, 2.5.1. The mean as a statistical model
Het gemiddelde is een hypothetische waarde, het is een model dat is
gecreëerd om de data samen te vatten en er zal altijd error zijn in deze
voorspelling. Wanneer je een vergelijking ziet met een hoedje → dan
betekent dit alleen dat dit estimates zijn die een schatting van de
populatie voorstellen.

2.5.2 Assessing the fit of a model: sums of squares and variance revisited
Het is belangrijk om te kijken hoe goed de fit van een statistisch model is, omdat we moeten weten
hoe representatief het is voor de populatie. De deviance (afwijking) is een ander woord voor error.
De error voor een specifieke entiteit is geobserveerde score – de voorspelde score.
Deze vergelijking laat zien dat we de sum of squares ook
kunnen gebruiken om de totale error in een model te bepalen.
Deze vergelijking laat zien hoe je de gemiddelde error in de
populatie kan berekenen. Hierbij gebruiken we degrees of
freedom (df), dat is het aantal scores dat is gebruikt om het
totaal te berekenen, gecorrigeerd voor het feit dat we proberen de populatiewaarde te schatten. De
mean squared error staat ook wel bekend als de variantie.

2.6 E is for estimating parameters
De vergelijking voor het gemiddelde is ontworpen om die parameter te schatten om de error te
minimaliseren. Met andere woorden, het is de waarde met de minste error. Dit betekent niet
noodzakelijkerwijs dat de waarde goed bij de gegevens past, maar het past beter dan elke andere
waarde die er mogelijk is gekozen. Hoewel de vergelijkingen voor het schatten van deze parameters
verschillen van die van het gemiddelde, zijn ze gebaseerd op dit principe van het minimaliseren van
errors: ze geven je de parameter met de minste error vanuit de data die je hebt. Dit betekent overigens
niet dat deze parameter accuraat, niet biased, of representatief is voor de populatie.

2.7 S is for standard error
Sampling variation of steekproef variatie betekent dat steekproeven variëren omdat ze verschillende
mensen uit de populatie bevatten. Een sampling distribution of steekproef distributie, is de frequentie
distributie van de steekproef gemiddelden uit dezelfde populatie. Deze distributie verteld ons iets over
hoe de steekproeven van de populatie zich gedragen en deze is gecentreerd rondom dezelfde waarde
als het gemiddelde van de populatie.
De standaarddeviatie van de steekproef gemiddelden is de standard error of the mean
(SE) of standard error. Als onze steekproef groot genoeg is (>30) kunnen we deze
vergelijking gebruiken om de standaard error te schatten. Een grote standaard error (SE) betekent dat
er veel variatie is tussen de gemiddelden van de verschillende steekproeven en het steekproef
gemiddelde is daarom wellicht niet representatief voor de populatie.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
rvw999 Erasmus Universiteit Rotterdam
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
33
Lid sinds
4 jaar
Aantal volgers
19
Documenten
12
Laatst verkocht
7 maanden geleden
PsycholoogInSpe

5,0

1 beoordelingen

5
1
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen