100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
Samenvatting

Zusammenfassung Multivariate Data Analysis Prof. Sousa-Poza WS 2017/2018

Beoordeling
-
Verkocht
-
Pagina's
23
Geüpload op
02-12-2018
Geschreven in
2017/2018

Zusammenfassung der Grundlagenvorlesung Multivariate Data Analysis bei Prof. Sousa-Poza aus dem Wintersemester 2017/2018

Instelling
Vak










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Heel boek samengevat?
Ja
Geüpload op
2 december 2018
Aantal pagina's
23
Geschreven in
2017/2018
Type
Samenvatting

Onderwerpen

Voorbeeld van de inhoud

Einführung:
Measurement Scales:
Nicht-metrisch
Nominal: Die Größe der Zahl hängt nicht mit der Menge des gemessenen Merkmals
zusammen  Ausprägungen sind Namen oder Kategorien  können nur nach dem
Kriterium „gleich“ oder „ungleich“ geordnet werden  keine natürliche Rangfolge möglich
(z.B. Geschlecht)
Ordinal: größere Zahlen zeigen mehr (oder weniger) der gemessenen Eigenschaf ann aber
nicht wie viel (oder weniger) (z.B. Schulnoten)  es ist eine Rangfolge möglichn aber die
Abstände zwischen den Merkmalsausprägungen sind nicht interpreterbar  Unterschiede
zwischen den Werten haben keine Bedeutung/sind nicht vergleichbar
Metrisch
Interval: enthält ordinale Eigenschafen und die Abstände zwischen den
Merkmalsausprägungen sind interpreterbar/haben eine Bedeutung und sind vergleichbar
(e.g. Fahrenheit und Celsius Skala)  es gibt keinen natürlichen Nullpunkt

Rato: enthält Eigenschaten einer Intervallskala und es gibt einen natürlichen Nullpunkt (z.B.
Gewicht in kg)
Messfehler
 Gradn zu dem die beobachteten Werte nicht repräsentatv für den “wahren” Wert sind
 verzerrt beobachtete Beziehungen und macht multvariate Techniken weniger
aussagekräfig
Gründe:
 Ungenauigkeit der Messung
 Unfähigkeit der Befragten genaue Informatonen zu liefern
 Fehler in der Dateneingabe

Wichtge Merkmale der Messung:
Validity/Gültgkeit = Grad zu dem eine Messung genau das darstelltn was sie darstellen soll
Reliability/Zuverlässigkeit = Gradn zu dem der beobachtete Wert den “wahren” Wert misst
und somit fehlerfrei ist

H0 ist richtg H0 ist falsch
H0 kann nicht abgelehnt 1-α β- Fehler
werden richtge Entscheidung Fehler 2.Art
H0 ablehnen α- Fehler 1-β
Fehler 1.Art Power

,Fehler 1.Art (α Fehler): Wahrscheinlichkeit die Nullhypothese abzulehnenn obwohl sie richtg
ist  die Nullhypothese wird verworfenn d.h. es wird von einem statstsch signifkanten
Unterschied ausgegangenn obwohl in der Realität kein Unterschied besteht
Fehler 2.Art (β Fehler): Wahrscheinlichkeit die Nullhypothese nicht abzulehnenn obwohl sie
falsch ist  die Nullhypothese wird nicht verworfenn d.h. es kann nicht von einem statstsch
signifkanten Unterschied ausgegangen werdenn obwohl in der Realität ein Unterschied
besteht
Power (1-β): die Wahrscheinlichkeitn die Nullhypothese zu verwerfenn wenn sie falsch ist
 Wahrscheinlichkeit der korrekten Ablehnung der Nullhypothese  Wahrscheinlichkeitn
dass statstsche Signifkanz angezeigt wirdn wenn sie vorhanden ist
Fehler 1.Art und Fehler 2.Art sind umgekehrt proportonaln d.h. der Fehler 1.Art wird
restriktvern wenn die Wahrscheinlichkeit für einen Fehler 2.Art zunimmt
Eine Reduzierung des Fehlers 1.Art reduziert die power eines statstschen Tests
Power wird von 3 Faktoren beeinfusst:
1. Effekt Größe: das tatsächliche Ausmaß des interessierenden Effekts (z.B. Unterschied des
Durchschnitseinkommens zwischen Mann und Frau)
2. Alpha (α): Wenn alpha kleiner istn nimmt die power ab (typischerweise α = 0n05)
3. Stchprobengröße: Wenn die Stchprobengröße zunimmtn erhöht sich die power. Bei sehr
großen Stchproben können sogar sehr kleine Effekte statstsch signifkant seinn weshalb es
zu dem Problem der praktschen Signifkanz gegenüber der statstschen Signifkanz kommt
 strengere Signifkanzniveaus (z.B. 0n01 anstelle von 0n05) erfordern größere Stchprobenn
um das gewünschte Niveau an power zu erreichen
 power kann erhöht werdenn indem ein weniger strenges Signifkanzniveau gewählt wird
(z.B. 0n1 anstelle von 0n05)
 kleinere Effektgrößen erfordern immer größere Stchprobenn um die gewünschte power
zu erreichen
Statstcal vs. practcal signifcance:
There is statstcal signifcancen an arbitrary limit whereby an observed difference could
reasonably be assumed to be due to some factor other than pure chance.
Then there is practcal signifcancen an arbitrary limit whereby at observed difference is of
some practcal use in the real world.
 Mit größeren Stchproben nimmt die power eines Tests zun d.h. es ist wahrscheinlicher
das statstsche Signifkanz beobachtet wird. Die praktsche Signifkanz muss sich jedoch nicht
ändern

, Examining your data:
Missing Data: informaton not available for a subject (or case) about whom other
informaton is available. Typically occurs when respondent fails to answer one or more
questons in a survey.
 fehlende Daten reduzieren die für die Analyse verfügbare Stchprobengröße
 fehlende Daten können Ergebnisse verzerren

In general: 10 % random missings and 5 variables  only 40 % of sample remains if you want
to use all variables in a regression!!

 Missing data under 10% for an individual case or observaton can generally be ignoredn
except when the missing data occurs in a specifc nonrandom fashion (e.g. concentraton i a
specifc set of questonsn atriton at the end of the questonnairen etc.)
 the number of cases with no missing data must be sufcient for the selected analysis
technique if replacement values will not be substtuted (imputed) for the missing data
Missing at Random (MAR):
Missing values of Y depend on Xn but not on Y  the observed Y values represent a random
sample of the actual Y values for each value of Xn but the observed data for Y do not
necessarily represent a truly random sample of all Y values
Missing completely at Random (MCAR):
Missing values of Y are completely random  the observed values of Y are a random sample
of all Y values
 only MCAR is truly random!!!

Diagnostc test for randomness:
Partton your variable into 2 groups: missing and no missingsn then compare the averages of
these groups on other variables. Signifcant differences indicate the possibility of a non-
random missing data process.
Select the imputaton method:
Imputaton of a MCAR missing data process:
 using replacement values: Replacing missing values with estmated values based on
further informaton available in the sample (true imputaton)
€3,49
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten


Ook beschikbaar in voordeelbundel

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
snaimn Universität Hohenheim
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
16
Lid sinds
7 jaar
Aantal volgers
16
Documenten
17
Laatst verkocht
4 jaar geleden

5,0

1 beoordelingen

5
1
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen