STATISTIEK & EXCEL BLOK A LIFE SCIENCE
LES 1 Wat is data?
Data: alles wat je meet, bepaalt.
Kwantitatieve data: meetbaar, met eenheid.
● Ratio = leeftijd, gewicht (nulpunt)
● Interval = klok, graden (geen nulpunt)
Kwalitatieve data: aantal per categorie.
● Nominaal = geen volgorde
● Ordinaal = wel volgorde
Steekproef: populatie
→ moet representatief zijn = alle verschillen die er zijn moeten gelijk zijn.
Variabele: wat je gaat meten (kan variëren).
● Afhankelijk: wat je weet
● Onafhankelijk: wat je meet
Type onderzoeksvragen =
● Beschrijvende vraag: je wilt een getal weten, gemiddelde.
● Verschilvraag: tussen 2 Staafdiagram
● Verbandvraag: connectie met 2 Scattergrafiek/ijklijn
LES 2 Meten en onnauwkeurigheid
We onderscheiden 3 type meetfouten =
Toevallige fouten: zijn altijd aanwezig, niet te vermijden.
● Biologische variatie
● Temperatuur en drukschommelingen
● Gevoeligheid van meetapparatuur
● Fouten bij aflezen
Systematische fouten: geven een consequente overschatting of een onderschatting van de
werkelijke waarden.
● Verouderd materiaal
● Verkeerde materiaal
● Werkfouten
Vermijdbare fouten: echte fouten of blunders, leiden tot een uitschieter (outlier).
● Verkeerde notatie
Significantie =
Optellen en aftrekken: meetwaarde bepaalt.
Vermenigvuldigen en delen: kleinste getal bepaalt.
Logaritmen en pH: aantal cijfers achter de komma.
Biologische variatie: biologische verschillen.
● Histogram-interval van de populatie → normaalverdeling.
- Gemiddelde (μ) = midden
- Populatiestandaarddeviatie (σ) = breedte → Excel = stdev.p
(lang = verschil, kort = amper verschil
- Gemiddelde (x) → Excel = average
, - Standaarddeviatie (s) = spreiding/variatie → Excel = stdev.s
LES 3 Regressie en correlatie
Corelatieanalyse = kwantitatieve data
● De correlatie is de statistische samenhang tussen twee grootheden.
● Dit kunnen twee reeksen metingen zijn, of mogelijke waarden van twee toevalsvariabelen
zijn.
→ Twee afhankelijke variabele (slaap en koffie inname docenten.)
Causaal: oorzaak (Is koffie de oorzaak van slaap)
Statisch: toevallige oorzaak (niks mee te maken, toeval)
Correlatiecoëfficiënt (r): geeft aan hoe sterk het verband is. Getal tussen de -1 en 1.
Formule = op formuleblad.
0: geen verband (geen rechte lijn)
-1: perfect negatief (omlaag)
1: is perfect positief (omhoog)
Regressieanalyse = kwantitatieve data → “Kan ik de waarde van y voorspellen op basis
van x?”
● IJklijn
● Liniear verband → eerst een scatterplot maken
● a = richtingscoëfficiënt
● 1 onafhankelijke en 1 afhankelijke (formules)
● r2 = correlatie coëfficiënt
● R2 = determinale coëfficiënt
Extinctie: richtingscoëfficiënt * concentratie + afsnede
y = ax + b —> y - b / a = x
LES 4 Kansverdeling en outliers
Normaalverdeling: onder de grafiek is hoeveel procent iets is.
De standaard-normaalverdeling = de Z-verdeling.
→ Z-waarde: z = x−μ / σ = afstand tot het gemiddelde
x = onderzochte getal
μ = gemiddelde
σ = populatiestandaarddeviatie
Berekeningen =
Bij een normaalverdeling met populatiegemiddelde μ=175 en populatiestandaarddeviatie σ=9, is een
waarde van 185 (x) dus:
Z = 185− =1.11
→ Dus 1.11 standaarddeviaties van het gemiddelde.
Je zoekt in de z-tabel in de rij 1,6 en kolom 0,07 (samen 1,67) en vindt de waarde 0,047460. Je kunt
dan concluderen dat het gearceerde deel in de grafiek gelijk is aan 4,8% van het totale oppervlak;
4,8% van de Nederlanders is dus langer dan 1,90 meter.
Zoek Z-waarde op. Dit van 100% geeft vaak 91%. 0,09 * 100 = 9% dit van 100% is 91%.
Z-waarde berekenen tussen 2 getallen:
1. Eerst het grootste getal (520-500/12) = 1,67
2. Opzoeken in tabel. Geeft 0,047 = 4,7% * 2 en 100- = 90,6%, want symmetrisch.
LES 1 Wat is data?
Data: alles wat je meet, bepaalt.
Kwantitatieve data: meetbaar, met eenheid.
● Ratio = leeftijd, gewicht (nulpunt)
● Interval = klok, graden (geen nulpunt)
Kwalitatieve data: aantal per categorie.
● Nominaal = geen volgorde
● Ordinaal = wel volgorde
Steekproef: populatie
→ moet representatief zijn = alle verschillen die er zijn moeten gelijk zijn.
Variabele: wat je gaat meten (kan variëren).
● Afhankelijk: wat je weet
● Onafhankelijk: wat je meet
Type onderzoeksvragen =
● Beschrijvende vraag: je wilt een getal weten, gemiddelde.
● Verschilvraag: tussen 2 Staafdiagram
● Verbandvraag: connectie met 2 Scattergrafiek/ijklijn
LES 2 Meten en onnauwkeurigheid
We onderscheiden 3 type meetfouten =
Toevallige fouten: zijn altijd aanwezig, niet te vermijden.
● Biologische variatie
● Temperatuur en drukschommelingen
● Gevoeligheid van meetapparatuur
● Fouten bij aflezen
Systematische fouten: geven een consequente overschatting of een onderschatting van de
werkelijke waarden.
● Verouderd materiaal
● Verkeerde materiaal
● Werkfouten
Vermijdbare fouten: echte fouten of blunders, leiden tot een uitschieter (outlier).
● Verkeerde notatie
Significantie =
Optellen en aftrekken: meetwaarde bepaalt.
Vermenigvuldigen en delen: kleinste getal bepaalt.
Logaritmen en pH: aantal cijfers achter de komma.
Biologische variatie: biologische verschillen.
● Histogram-interval van de populatie → normaalverdeling.
- Gemiddelde (μ) = midden
- Populatiestandaarddeviatie (σ) = breedte → Excel = stdev.p
(lang = verschil, kort = amper verschil
- Gemiddelde (x) → Excel = average
, - Standaarddeviatie (s) = spreiding/variatie → Excel = stdev.s
LES 3 Regressie en correlatie
Corelatieanalyse = kwantitatieve data
● De correlatie is de statistische samenhang tussen twee grootheden.
● Dit kunnen twee reeksen metingen zijn, of mogelijke waarden van twee toevalsvariabelen
zijn.
→ Twee afhankelijke variabele (slaap en koffie inname docenten.)
Causaal: oorzaak (Is koffie de oorzaak van slaap)
Statisch: toevallige oorzaak (niks mee te maken, toeval)
Correlatiecoëfficiënt (r): geeft aan hoe sterk het verband is. Getal tussen de -1 en 1.
Formule = op formuleblad.
0: geen verband (geen rechte lijn)
-1: perfect negatief (omlaag)
1: is perfect positief (omhoog)
Regressieanalyse = kwantitatieve data → “Kan ik de waarde van y voorspellen op basis
van x?”
● IJklijn
● Liniear verband → eerst een scatterplot maken
● a = richtingscoëfficiënt
● 1 onafhankelijke en 1 afhankelijke (formules)
● r2 = correlatie coëfficiënt
● R2 = determinale coëfficiënt
Extinctie: richtingscoëfficiënt * concentratie + afsnede
y = ax + b —> y - b / a = x
LES 4 Kansverdeling en outliers
Normaalverdeling: onder de grafiek is hoeveel procent iets is.
De standaard-normaalverdeling = de Z-verdeling.
→ Z-waarde: z = x−μ / σ = afstand tot het gemiddelde
x = onderzochte getal
μ = gemiddelde
σ = populatiestandaarddeviatie
Berekeningen =
Bij een normaalverdeling met populatiegemiddelde μ=175 en populatiestandaarddeviatie σ=9, is een
waarde van 185 (x) dus:
Z = 185− =1.11
→ Dus 1.11 standaarddeviaties van het gemiddelde.
Je zoekt in de z-tabel in de rij 1,6 en kolom 0,07 (samen 1,67) en vindt de waarde 0,047460. Je kunt
dan concluderen dat het gearceerde deel in de grafiek gelijk is aan 4,8% van het totale oppervlak;
4,8% van de Nederlanders is dus langer dan 1,90 meter.
Zoek Z-waarde op. Dit van 100% geeft vaak 91%. 0,09 * 100 = 9% dit van 100% is 91%.
Z-waarde berekenen tussen 2 getallen:
1. Eerst het grootste getal (520-500/12) = 1,67
2. Opzoeken in tabel. Geeft 0,047 = 4,7% * 2 en 100- = 90,6%, want symmetrisch.