100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached 4.2 TrustPilot
logo-home
Summary

Samenvatting statistiek

Rating
-
Sold
2
Pages
40
Uploaded on
18-04-2024
Written in
2022/2023

Volledige en nauwkeurige samenvatting voor het vak statistiek (cursus + PPT + notities)

Institution
Course











Whoops! We can’t load your doc right now. Try again or contact support.

Written for

Institution
Study
Course

Document information

Uploaded on
April 18, 2024
Number of pages
40
Written in
2022/2023
Type
Summary

Subjects

Content preview

Statistiek Prof. Stefan Van Dongen 2022-2023



Samenvatting statistiek
Op examen:
Definities
- 5 definities
Zie extra blad
- Two way ANOVA
o Fixed type I
Inleiding o Type III
Het algemene principe van statistiek o Nested type III
- Verband model
- Chi of Kolmogrov




Data, hun voorstelling en de lukrake steekproef
Soorten data
• Kwalitatieve variabelen
o Nominale variabelen
o Ordinale variabelen
• Kwantitatieve variabelen
o Intervalschaal
o Ratioschaal

Hiërarchie van meetschalen

• Meest informatieve meetschaal: ratioschaal
• Gevolgd door: intervalschaal, ordinale meetschaal en nominale meetschaal

De data matrix
• Matrix:
o Rijen: elementen van steekproef
o Kolommen: verschillende gemeten variabelen
• Kleine dataset: rechtstreeks invoeren in script van R
• Grotere dataset: via bestand in Excel
o Opslaan als: “tab delimited txt” bestand

, • Gegevens ingeven in R
o Gevoelig voor spaties, hoofdletters… codes moeten heel correct zijn!
o Bij het plaatsen van een ‘#’ voor je iets schrijft, zal dit niet opgenomen worden in de
calculaties. Gemakkelijk als je (tussen) titels of andere dingen wil schrijven in R
o File --> new file --> R script
o Code laten werken: selecteren --> Run line or selection
o R gebruikt een punt als decimaal teken (geen komma)


Voorstelling van univariate kwantitatieve data
- Bestandtype moet ‘txt’ zijn
- Om het bestand te linken met RStudio:




- Dit bestand moet vervolgens gelinkt worden aan een ‘object’ (soort geheugen).
- Vervolgens moeten de gegevens gelinkt worden adhv ‘attach()’, deze stap zeker doen!!!


Wanneer het bestand gelinkt is, zal dit rechtsboven te zien zijn als:




- Extra: indien een cijferreeks gelinkt wordt aan een object, heet dit een ‘vector’.
vb. b<-c(1,2,5,3.5,6,10)


Stengelblad diagram

Code voor R: stem()

,Staafdiagram

Code voor R:
- Table()
- Plot()

Voorbeeld



xlab en ylab: titel voor X en Y-as

main: titel voor histogram




Histogram

Code voor R: hist()

Voorbeeld




Empirische cumulatieve frequentieverdeling

Code voor R:
- Ecdf()
- Plot()

Voorbeeld

, Voorstelling van bivariate data
• Optie 1: kruistabel maken → table()
• Optie 2: scatterplot maken → plot()



Lukrake steekproef
1. Onafhankelijk
2. Representatief
3. Unbiased (niet vertekend)
4. Nauwkeurig
a. Vuistregel: 30-300 regel
b. Tel aantal stappen tussen minimum en maximum waarde → tss 30 en 300:
accuraatheid voldoende en niet te gedetailleerd
c. Voorbeeld:
i. koolmezen tussen 16 en 21g, 5 stappen nodig om van min. naar max. te gaan
op 1g nauwkeurig→ onvoldoende nauwkeurig
ii. op 0.01g nauwkeurig: 500 stappen nodig → te gedetailleerd
iii. op 0.1g nauwkeurig: 50 stappen nodig → goede keuze



Opdrachten lukrake steekproef
Bespreek van onderstaande voorbeelden het design van het experiment rekening houdend met de 4
criteria die hierboven overlopen werden.

1) Een bioloog wilt nagaan of er een verschil is in tarsuslengte van kokmeeuwen in Scandinavië
en het Iberisch schiereiland. Hij reist naar Stockholm en meet daar de tarsus van 10
meeuwen tot op een halve cm nauwkeurig en doet hetzelfde voor 10 meeuwen in Lissabon.

o Niet nauwkeurig genoeg (halve cm niet gedetailleerd genoeg)
o Op verschillende locaties onderzoeken (niet alleen in steden)

2) Om na te gaan wat het effect is van temperatuur (25 vs 28 graden) en CO2 gehalte (hoog vs.
laag) op de groei van populieren kweekt een bioloog in totaal 40 populierenplantjes op van
eenzelfde kloon. Hij heeft 4 klimaat kasten. In 2 daarvan stelt hij de temperatuur in op 28
graden en houdt hij een hoog CO2 niveau aan. In de twee andere kasten wordt de
temperatuur op 25 graden gehouden bij een laag CO2 gehalte.

o Alles zeer afhankelijk van hypothese die je wil testen
o Hier wordt één kloon getest: wil je algemeen over populieren onderzoeken →
meerdere klonen onderzoeken + random steekproef
o Hier worden niet alle combinaties getest (bv. er bestaan ook situaties hoge T en hoge
CO2) → hangt opnieuw af van wat je wil meten

3) Een arts wil nagaan wat het effect is van roken op de kans om vroegtijdig te sterven. Hij volgt
200 jongeren, waarvan er 90 roken, gedurende 25 jaar op.

o Bepaalde factoren kunnen een rol spelen
o Is 25j lang genoeg om conclusies te trekken?

Get to know the seller

Seller avatar
Reputation scores are based on the amount of documents a seller has sold for a fee and the reviews they have received for those documents. There are three levels: Bronze, Silver and Gold. The better the reputation, the more your can rely on the quality of the sellers work.
jeliencornelis Universiteit Antwerpen
Follow You need to be logged in order to follow users or courses
Sold
31
Member since
1 year
Number of followers
6
Documents
30
Last sold
2 weeks ago

4.0

2 reviews

5
1
4
0
3
1
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Frequently asked questions