100% Zufriedenheitsgarantie Sofort verfügbar nach Zahlung Sowohl online als auch als PDF Du bist an nichts gebunden 4.2 TrustPilot
logo-home
Zusammenfassung

Samenvatting - Data Science Methods (6414M0320Y)

Bewertung
-
Verkauft
2
seiten
18
Hochgeladen auf
27-09-2024
geschrieben in
2023/2024

Extensive summary of the course data science methods.

Hochschule
Kurs










Ups! Dein Dokument kann gerade nicht geladen werden. Versuch es erneut oder kontaktiere den Support.

Schule, Studium & Fach

Hochschule
Studium
Kurs

Dokument Information

Hochgeladen auf
27. september 2024
Anzahl der Seiten
18
geschrieben in
2023/2024
Typ
Zusammenfassung

Themen

Inhaltsvorschau

Data Science

, Model evaluation
3
After having a trained model one would like to know the prediction capabilities on new, unseen, data
Model selection: comparing performance of different models, to identify best one
e




Model assessment: having chosen a final model, estimating how well it predicts on new data
&




Linear models for regression
S
example model troughout the course

Y =
A(X ,
B) +




- N(0 ga)
,
M




FoBmhm(X)
~
A(X ,
B) :





Basic function/derived future
&
ex. In linear regression hm(X) =
Xm




Determine the model parameters using maximum likelihood
&
Take product/likelihood function
[(B 02) : re ,




2
Take logaritme
In 2(B 02) Nh(8)-(2)-(yn,
: -
-



Sh(xn))
3
Take derivatives
O
with respect to B e
with respect to 8

In[(B 02) : (yn- Sh(xn))hm(xn) ,
=
0 so In 2(B :),
:





: (Xx)"xy 02 : Z (yn-BXn)



Y
Generalization error
To determine the performance of a model, we define a loss function that measures the size of a prediction error
examples of loss functions
We want the error to be as small as possible as this
S
(Y E(x)))
squared error -




means that there is a high generalization
L(Y , (x)) Y E(X)
absolute error
=
-




Estimating the generalization error is often not possible,
3 types of errors

3
therefore we use estimate of prediction error
1 Err : E L(Y ,
E(x)) Err :
Er Err


2 Erro :
E[L(Y , (X)) It

, 3 er
: (yn , (xn))


Bias-variance decomposition
Err(xo) : EL/Y-E(X))"(X =
xo



=
(E[E(xo)] f(xo))2 E[(xo)
- + ·
ETE(xo)" -8 When we increase the polynomial,
=
Bias
&
((xo)) + Var((xo)) + 8
higher variance but lower bias
=
Bias + Varianee + G When decrease in polynomial,
&
variance of error lower variance but higher bias
S
variance of estimated model
&
squared bias of estimated model * We need to make a trade-off such
that the variance + bias are minimal




s
High variance, low bias Low variance, high bias


Data
When dealing with a data set, it is not possible to simulate additional data points to compute the
generalization errors and expected prediction error. We therefore need alternative procedures to estimate
the generalization and prediction errors. In the next three sections we will describe several of those
procedures 2
1
O
Data-rich situations: many data available
In-sample errors: calculating
errors from data on which
Training set Validation set Test set the model was trained

D Out-of-sample errors:
Used to test the model calculation errors from data
& that was excluded from the
Used to measure the performance training set
&
Used to train the data

Insufficient data: not enough data available
2

Information theoretical measures
&
The maximum log-likelihood is a measure for how well the model can describe the data, however we need
an penalty term that takes model complexity in account

3 Choose model with smallest AIC/BIC
-
Ale : - 2h([) + 2 (M 1) +




- Ble =
-2ln() + In (N) (M 1) +

Lerne den Verkäufer kennen

Seller avatar
Bewertungen des Ansehens basieren auf der Anzahl der Dokumente, die ein Verkäufer gegen eine Gebühr verkauft hat, und den Bewertungen, die er für diese Dokumente erhalten hat. Es gibt drei Stufen: Bronze, Silber und Gold. Je besser das Ansehen eines Verkäufers ist, desto mehr kannst du dich auf die Qualität der Arbeiten verlassen.
maaikekoens Universiteit van Amsterdam
Folgen Sie müssen sich einloggen, um Studenten oder Kursen zu folgen.
Verkauft
33
Mitglied seit
4 Jahren
Anzahl der Follower
0
Dokumente
9
Zuletzt verkauft
1 Jahren vor

4,5

2 rezensionen

5
1
4
1
3
0
2
0
1
0

Kürzlich von dir angesehen.

Warum sich Studierende für Stuvia entscheiden

on Mitstudent*innen erstellt, durch Bewertungen verifiziert

Geschrieben von Student*innen, die bestanden haben und bewertet von anderen, die diese Studiendokumente verwendet haben.

Nicht zufrieden? Wähle ein anderes Dokument

Kein Problem! Du kannst direkt ein anderes Dokument wählen, das besser zu dem passt, was du suchst.

Bezahle wie du möchtest, fange sofort an zu lernen

Kein Abonnement, keine Verpflichtungen. Bezahle wie gewohnt per Kreditkarte oder Sofort und lade dein PDF-Dokument sofort herunter.

Student with book image

“Gekauft, heruntergeladen und bestanden. So einfach kann es sein.”

Alisha Student

Häufig gestellte Fragen