100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Samenvatting les 3 t.e.m. de laatste les: Inleiding tot de Digitale Tekstanalyse

Beoordeling
-
Verkocht
-
Pagina's
94
Geüpload op
10-12-2025
Geschreven in
2025/2026

Samenvatting les 3 tem de laatste les

Instelling
Vak











Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Heel boek samengevat?
Nee
Wat is er van het boek samengevat?
Les 3 tem laatste les
Geüpload op
10 december 2025
Aantal pagina's
94
Geschreven in
2025/2026
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Les 3: tekstcollecties analyseren en visualiseren


Concordanties

Concordantie = woordgebruik in context




Distant reading → automatische analyse van tekst

• Grote volume tekst analyseren
• bijv. computationele literatuurwetenschappen (computational literary studies)



Populaire methodes tekstanalyse:

• Concordanties: woordgebruik in context
• Topic modeling: identificatie van belangrijke thema’s/topics
• Stylometrie: statistische analyse / bestuderen van schrijfstijl (lexicale en
syntactische informatie)

Stylometrie: toepassingen

- Bepalen van auteurschap (authorship attribution)
- Forensische taalkunde

Autorship attribution

→ Bepalen op basis van lexicale en syntactische kenmerken wie de auteur van een
tekst is

 Bv: frequenties van functiewoorden, PoS-patronen, frequente opeenvolging van
woorden

Bekende voorbeelden:

• Authenticiteit van werken van Shakespeare (Frantzeskou et al., 2006)

, • JK Rawling / Robert Calbraith (pseudoniem)



Forensische taalkunde

➔ Alles wat met taal en wet/strafrecht te maken heeft
• Forensische fonetiek: identificeren van een spreker met spraak- en stemanalyse
• Bestuderen van juridische en strafrechtelijk interessante teksten, bijv.
dreigbrieven, chantagebrieven, plagiaat, bekentenissen, testamenten, … waarvan
de precieze auteur niet bekend is.

Doel: achterhalen van de auteur van anonieme teksten (analyse van handschrift,
schrijfstijl)



Bekend voorbeeld: Unabomber case

- 16 bommen (verschillende locaties in Amerika)
- Manifest van de dader (35,000 woorden) in krant
- Broer herkent schrijfstijl en belt de politie




Frequenties van woorden
Woordfrequentie analyseren om te onderzoeken hoe belangrijk woorden zijn in een
corpus

Frequentie = aantal keer dat woord voorkomt in corpus

➢ absolute frequentie /vs/

Relatieve frequentie = frequentie / aantal woorden in corpus

=> Belang van relatieve frequentie: frequenties vergelijken in corpora van
verschillende groottes

Frequentielijst = gesorteerde woordenlijst op basis van frequentie in het corpus



Voorbeelden:

2 corpora op basis van vrij beschikbare boeken (via Project Gutenberg:
https://www.gutenberg.org/) + sample van Vlaams boek:

1. Shakespeare – “Romeo en Julia” (vertaling)

, 2. Multatuli - ”Max Havelaar”

3. Sample van Lize Spit – “Het smelt”

Corpus Aantal woorden




Shakespeare – “Romeo en Julia” (vertaling) 31,817


Multatuli - ”Max Havelaar” 120,824


Sample van Lize Spit – “Het smelt” 1,005

, Frequentielijst “Het smelt”: zelfstandige naamwoorden



• Meest frequente woorden per woordsoort, gesorteerd op dalende frequentie
• Distributie berekenen per woordsoort:
o 206 zelfstandige naamwoorden / totaal 1005
woorden = 20%




Type-token ratio (TTR)

• Tokens = totale aantal woorden in een tekst
• Types = totaal aantal unieke woorden in een tekst
o Type-token ratio =
o #types / #tokens
$11.44
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper
Seller avatar
margotmarchal

Maak kennis met de verkoper

Seller avatar
margotmarchal Universiteit Gent
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
1
Lid sinds
1 week
Aantal volgers
0
Documenten
4
Laatst verkocht
4 dagen geleden

0.0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen