Tentamen (uitwerkingen)

COS4861 Assignment 3 due 10 September 2025

Beoordeling

Verkocht

Pagina's

Cijfer

A+

Geüpload op

06-09-2025

Geschreven in

2025/2026

COS4861 Assignment 3 2025 - Due 10 September 2025; 100% TRUSTED workings with detailed Answers for A+ Grade.

Instelling

Vak

Voorbeeld van de inhoud

COS4861
ASSIGNMENT 3 2025

UNIQUE NO.
DUE DATE: 10 SEPTEMBER 2025

, COS4861 Assignment 3 2025

Question 1 [12 points] – Theory

1. What is a corpus and how does it differ from other data types? (2) A corpus is a
large, structured, and machine-readable collection of texts that is systematically
compiled for linguistic or natural language processing (NLP) research (Meyer, 2021).
Unlike ordinary datasets (e.g., spreadsheets or numerical data), a corpus contains raw
or annotated natural language data, enabling analysis of patterns in language use.

2. What is the technical term for splitting a corpus into different linguistic units
such as paragraphs, sentences, and words in NLP? (1) The process is called
tokenization (Jurafsky & Martin, 2023).

3. Define N-grams and provide references. (2) An N-gram is a contiguous sequence
of N items (characters, syllables, or words) from a given text or speech sample
(Manning & Schütze, 1999). For example, in the sentence “data is noisy”:

 Unigrams = [“data”, “is”, “noisy”]
 Bigrams = [“data is”, “is noisy”]
 Trigrams = [“data is noisy”]

4. Describe the problem of data sparseness with regard to an N-gram model.
Explain smoothing and name two algorithms. (7)

 Data sparseness problem: In N-gram models, many possible word
combinations never appear in the training corpus, resulting in zero probabilities
for valid but unseen sequences. This weakens generalization (Jurafsky & Martin,
2023).

 Smoothing: A statistical technique that adjusts raw frequency counts to avoid
assigning zero probability to unseen events.

 Two smoothing algorithms:

Meld schending auteursrecht

Geschreven voor

Instelling: University of South Africa
Vak: Natural Language Processing (COS4861)

Alle documenten voor dit vak (22)

Documentinformatie

Geüpload op: 6 september 2025
Aantal pagina's: 12
Geschreven in: 2025/2026
Type: Tentamen (uitwerkingen)
Bevat: Vragen en antwoorden

Onderwerpen

cos4861 assignment 3 2025 due 10 september 2025

$2.97

Krijg toegang tot het volledige document:

100% tevredenheidsgarantie

Direct beschikbaar na je betaling

Lees online óf als PDF

Geen vaste maandelijkse kosten

Maak kennis met de verkoper

StudyAidPro

4.0

(22)

Maak kennis met de verkoper

StudyAidPro Tutors International

Bekijk profiel

Volgen

Verkocht

192

Lid sinds

1 jaar

Aantal volgers

Documenten

560

Laatst verkocht

1 maand geleden

StudyAidPro

On this page, you find all documents, package deals, and flashcards offered by seller StudyAidPro. All Modules!

4.0

22 beoordelingen

Populaire documenten

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper StudyAidPro. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor $2.97. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 52759 samenvattingen verkocht Opgericht in 2010, al 16 jaar dé plek om samenvattingen te kopen