Statistiek 2 SPSS
Praktijkles 1
Boxplot
Y in functie van X
De zwarte lijn in de box geeft de mediaan aan.
De verticale lijnen vanuit de box zijn de whiskers.
De horizontale markeringen boven en onder de whiskers geven de hoogst resp. en laagst
voorkomende waarde aan binnen een afstand van 1,5 IKA (= boxlengte) tot aan de box.
!!Verschil kennen tussen outlier en extreme waarde in SPSS :
De cases die buiten de whiskers vallen worden apart vermeld.
- Cases die op een afstand van 1,5 IKA tot 3 IKA van de box liggen zijn outliers en worden
weergegeven door een rondje/bolletje.
- Cases op meer dan 3 IKA van de box zijn de extreme waarden en krijgen een
asterisk/sterretje
Staafdiagram
Geslacht op x-as
Count op y-as
Cluster on X : categorieën
Of Percentage op y-as
Histogram met klassenbreedte
Variabele op x-as
Dubbelklik balken in chart editor
Properties scherm opent en bij binning klassenbreedte en aantal klassen aanduiden
Dubbelklik op cijfers x-as
Properties scherm opent en bij scale ‘major increment’ niet auto laten doen maar de
klassenbreedte
In chart editor ‘show distribution curve’ voor lijn over histogram
Spreidingsdiagram, scatterplot
Y in functie van x
In chart editor ‘add fit line’
y = b + a*x (met b = snijpunt y-as en a = rico = richtingscoëfficiënt)
a > 0 d.w.z. stijgende rechte, a < 0 d.w.z. dalende rechte
als *1 komt dan zal y + 1,04
b = 0 d.w.z. rechte door de oorsprong
De verklaarde variantie R² = 0,450 = 45,0%
Ook te vinden door correlatiecoëfficient ^2 te doen
hoe goed de variatie in de afhankelijke variabele (y) verklaard wordt door de
onafhankelijke variabele (x)
Orden de file
Data > Sort Cases of op de kolom van de variabele gaan staan en met
linkermuisknop ascending of descending aanklikken
, Ascending = oplopend van klein naar groot of van A naar Z
Descending = aflopend van groot naar klein of van Z naar A
Split de file
Data > Split file
Compare groups geeft 1 tabel
Organize outputs by groups geeft aparte tabel
Selecteer bepaalde waarden
Data > Select Cases > If condition is satisfied…
Bij het opgeven van een conditionele expressie moet je deze regels in acht nemen:
• Alfanumerieke waarden moeten tussen aanhalingstekens staan (‘ ’ of “ ”).
• Tekst zet je tussenhaakjes!
• Bij numerieke waarden gebruik je nooit aanhalingstekens.
• Bij numerieke waarden moet het decimale scheidingsteken een punt (.) zijn.
• Invoer is hoofdlettergevoelig (de opgegeven waarde moet dus identiek zijn
aan de waarde in je gegevensbestand wat betreft hoofdletters en kleine
letters).
• Value labels mogen niet worden gebruikt.
Operatoren
~= ongelijk aan
& (AND)
| (OR)
~ (NOT)
** machtsverheffing
* vermenigvuldigen
/ delen
Select cases terug afzetten!
Bv. Alle mannen jonger of gelijk aan 30 jaar leeftijd<=30 & geslacht=‘m’
Ontbrekende waarden
Analyze > Descriptive Statistics > Frequencies > Variabele gezochte missende waarden
Aantal waarden met voorwaarden
Transform > Count Values within Cases
Target variabele : nieuwe naam zonder spaties
Numeric variabeles : variabele gezocht
Define values : voorwaarde
Frequentietabel maken van deze NIEUWE variabele
Uitkomst frequency = 1 voorkomt –> aantal cases dat voldoet aan de
voorwaarde
Praktijkles 1
Boxplot
Y in functie van X
De zwarte lijn in de box geeft de mediaan aan.
De verticale lijnen vanuit de box zijn de whiskers.
De horizontale markeringen boven en onder de whiskers geven de hoogst resp. en laagst
voorkomende waarde aan binnen een afstand van 1,5 IKA (= boxlengte) tot aan de box.
!!Verschil kennen tussen outlier en extreme waarde in SPSS :
De cases die buiten de whiskers vallen worden apart vermeld.
- Cases die op een afstand van 1,5 IKA tot 3 IKA van de box liggen zijn outliers en worden
weergegeven door een rondje/bolletje.
- Cases op meer dan 3 IKA van de box zijn de extreme waarden en krijgen een
asterisk/sterretje
Staafdiagram
Geslacht op x-as
Count op y-as
Cluster on X : categorieën
Of Percentage op y-as
Histogram met klassenbreedte
Variabele op x-as
Dubbelklik balken in chart editor
Properties scherm opent en bij binning klassenbreedte en aantal klassen aanduiden
Dubbelklik op cijfers x-as
Properties scherm opent en bij scale ‘major increment’ niet auto laten doen maar de
klassenbreedte
In chart editor ‘show distribution curve’ voor lijn over histogram
Spreidingsdiagram, scatterplot
Y in functie van x
In chart editor ‘add fit line’
y = b + a*x (met b = snijpunt y-as en a = rico = richtingscoëfficiënt)
a > 0 d.w.z. stijgende rechte, a < 0 d.w.z. dalende rechte
als *1 komt dan zal y + 1,04
b = 0 d.w.z. rechte door de oorsprong
De verklaarde variantie R² = 0,450 = 45,0%
Ook te vinden door correlatiecoëfficient ^2 te doen
hoe goed de variatie in de afhankelijke variabele (y) verklaard wordt door de
onafhankelijke variabele (x)
Orden de file
Data > Sort Cases of op de kolom van de variabele gaan staan en met
linkermuisknop ascending of descending aanklikken
, Ascending = oplopend van klein naar groot of van A naar Z
Descending = aflopend van groot naar klein of van Z naar A
Split de file
Data > Split file
Compare groups geeft 1 tabel
Organize outputs by groups geeft aparte tabel
Selecteer bepaalde waarden
Data > Select Cases > If condition is satisfied…
Bij het opgeven van een conditionele expressie moet je deze regels in acht nemen:
• Alfanumerieke waarden moeten tussen aanhalingstekens staan (‘ ’ of “ ”).
• Tekst zet je tussenhaakjes!
• Bij numerieke waarden gebruik je nooit aanhalingstekens.
• Bij numerieke waarden moet het decimale scheidingsteken een punt (.) zijn.
• Invoer is hoofdlettergevoelig (de opgegeven waarde moet dus identiek zijn
aan de waarde in je gegevensbestand wat betreft hoofdletters en kleine
letters).
• Value labels mogen niet worden gebruikt.
Operatoren
~= ongelijk aan
& (AND)
| (OR)
~ (NOT)
** machtsverheffing
* vermenigvuldigen
/ delen
Select cases terug afzetten!
Bv. Alle mannen jonger of gelijk aan 30 jaar leeftijd<=30 & geslacht=‘m’
Ontbrekende waarden
Analyze > Descriptive Statistics > Frequencies > Variabele gezochte missende waarden
Aantal waarden met voorwaarden
Transform > Count Values within Cases
Target variabele : nieuwe naam zonder spaties
Numeric variabeles : variabele gezocht
Define values : voorwaarde
Frequentietabel maken van deze NIEUWE variabele
Uitkomst frequency = 1 voorkomt –> aantal cases dat voldoet aan de
voorwaarde