Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien 4.2 TrustPilot
logo-home
Resume

Zusammenfassung Multivariate Data Analysis Prof. Sousa-Poza WS 2017/2018

Note
-
Vendu
-
Pages
23
Publié le
02-12-2018
Écrit en
2017/2018

Zusammenfassung der Grundlagenvorlesung Multivariate Data Analysis bei Prof. Sousa-Poza aus dem Wintersemester 2017/2018

Établissement
Cours










Oups ! Impossible de charger votre document. Réessayez ou contactez le support.

Livre connecté

École, étude et sujet

Établissement
Cours
Cours

Infos sur le Document

Livre entier ?
Oui
Publié le
2 décembre 2018
Nombre de pages
23
Écrit en
2017/2018
Type
Resume

Sujets

Aperçu du contenu

Einführung:
Measurement Scales:
Nicht-metrisch
Nominal: Die Größe der Zahl hängt nicht mit der Menge des gemessenen Merkmals
zusammen  Ausprägungen sind Namen oder Kategorien  können nur nach dem
Kriterium „gleich“ oder „ungleich“ geordnet werden  keine natürliche Rangfolge möglich
(z.B. Geschlecht)
Ordinal: größere Zahlen zeigen mehr (oder weniger) der gemessenen Eigenschaf ann aber
nicht wie viel (oder weniger) (z.B. Schulnoten)  es ist eine Rangfolge möglichn aber die
Abstände zwischen den Merkmalsausprägungen sind nicht interpreterbar  Unterschiede
zwischen den Werten haben keine Bedeutung/sind nicht vergleichbar
Metrisch
Interval: enthält ordinale Eigenschafen und die Abstände zwischen den
Merkmalsausprägungen sind interpreterbar/haben eine Bedeutung und sind vergleichbar
(e.g. Fahrenheit und Celsius Skala)  es gibt keinen natürlichen Nullpunkt

Rato: enthält Eigenschaten einer Intervallskala und es gibt einen natürlichen Nullpunkt (z.B.
Gewicht in kg)
Messfehler
 Gradn zu dem die beobachteten Werte nicht repräsentatv für den “wahren” Wert sind
 verzerrt beobachtete Beziehungen und macht multvariate Techniken weniger
aussagekräfig
Gründe:
 Ungenauigkeit der Messung
 Unfähigkeit der Befragten genaue Informatonen zu liefern
 Fehler in der Dateneingabe

Wichtge Merkmale der Messung:
Validity/Gültgkeit = Grad zu dem eine Messung genau das darstelltn was sie darstellen soll
Reliability/Zuverlässigkeit = Gradn zu dem der beobachtete Wert den “wahren” Wert misst
und somit fehlerfrei ist

H0 ist richtg H0 ist falsch
H0 kann nicht abgelehnt 1-α β- Fehler
werden richtge Entscheidung Fehler 2.Art
H0 ablehnen α- Fehler 1-β
Fehler 1.Art Power

,Fehler 1.Art (α Fehler): Wahrscheinlichkeit die Nullhypothese abzulehnenn obwohl sie richtg
ist  die Nullhypothese wird verworfenn d.h. es wird von einem statstsch signifkanten
Unterschied ausgegangenn obwohl in der Realität kein Unterschied besteht
Fehler 2.Art (β Fehler): Wahrscheinlichkeit die Nullhypothese nicht abzulehnenn obwohl sie
falsch ist  die Nullhypothese wird nicht verworfenn d.h. es kann nicht von einem statstsch
signifkanten Unterschied ausgegangen werdenn obwohl in der Realität ein Unterschied
besteht
Power (1-β): die Wahrscheinlichkeitn die Nullhypothese zu verwerfenn wenn sie falsch ist
 Wahrscheinlichkeit der korrekten Ablehnung der Nullhypothese  Wahrscheinlichkeitn
dass statstsche Signifkanz angezeigt wirdn wenn sie vorhanden ist
Fehler 1.Art und Fehler 2.Art sind umgekehrt proportonaln d.h. der Fehler 1.Art wird
restriktvern wenn die Wahrscheinlichkeit für einen Fehler 2.Art zunimmt
Eine Reduzierung des Fehlers 1.Art reduziert die power eines statstschen Tests
Power wird von 3 Faktoren beeinfusst:
1. Effekt Größe: das tatsächliche Ausmaß des interessierenden Effekts (z.B. Unterschied des
Durchschnitseinkommens zwischen Mann und Frau)
2. Alpha (α): Wenn alpha kleiner istn nimmt die power ab (typischerweise α = 0n05)
3. Stchprobengröße: Wenn die Stchprobengröße zunimmtn erhöht sich die power. Bei sehr
großen Stchproben können sogar sehr kleine Effekte statstsch signifkant seinn weshalb es
zu dem Problem der praktschen Signifkanz gegenüber der statstschen Signifkanz kommt
 strengere Signifkanzniveaus (z.B. 0n01 anstelle von 0n05) erfordern größere Stchprobenn
um das gewünschte Niveau an power zu erreichen
 power kann erhöht werdenn indem ein weniger strenges Signifkanzniveau gewählt wird
(z.B. 0n1 anstelle von 0n05)
 kleinere Effektgrößen erfordern immer größere Stchprobenn um die gewünschte power
zu erreichen
Statstcal vs. practcal signifcance:
There is statstcal signifcancen an arbitrary limit whereby an observed difference could
reasonably be assumed to be due to some factor other than pure chance.
Then there is practcal signifcancen an arbitrary limit whereby at observed difference is of
some practcal use in the real world.
 Mit größeren Stchproben nimmt die power eines Tests zun d.h. es ist wahrscheinlicher
das statstsche Signifkanz beobachtet wird. Die praktsche Signifkanz muss sich jedoch nicht
ändern

, Examining your data:
Missing Data: informaton not available for a subject (or case) about whom other
informaton is available. Typically occurs when respondent fails to answer one or more
questons in a survey.
 fehlende Daten reduzieren die für die Analyse verfügbare Stchprobengröße
 fehlende Daten können Ergebnisse verzerren

In general: 10 % random missings and 5 variables  only 40 % of sample remains if you want
to use all variables in a regression!!

 Missing data under 10% for an individual case or observaton can generally be ignoredn
except when the missing data occurs in a specifc nonrandom fashion (e.g. concentraton i a
specifc set of questonsn atriton at the end of the questonnairen etc.)
 the number of cases with no missing data must be sufcient for the selected analysis
technique if replacement values will not be substtuted (imputed) for the missing data
Missing at Random (MAR):
Missing values of Y depend on Xn but not on Y  the observed Y values represent a random
sample of the actual Y values for each value of Xn but the observed data for Y do not
necessarily represent a truly random sample of all Y values
Missing completely at Random (MCAR):
Missing values of Y are completely random  the observed values of Y are a random sample
of all Y values
 only MCAR is truly random!!!

Diagnostc test for randomness:
Partton your variable into 2 groups: missing and no missingsn then compare the averages of
these groups on other variables. Signifcant differences indicate the possibility of a non-
random missing data process.
Select the imputaton method:
Imputaton of a MCAR missing data process:
 using replacement values: Replacing missing values with estmated values based on
further informaton available in the sample (true imputaton)
€3,49
Accéder à l'intégralité du document:

Garantie de satisfaction à 100%
Disponible immédiatement après paiement
En ligne et en PDF
Tu n'es attaché à rien


Document également disponible en groupe

Faites connaissance avec le vendeur

Seller avatar
Les scores de réputation sont basés sur le nombre de documents qu'un vendeur a vendus contre paiement ainsi que sur les avis qu'il a reçu pour ces documents. Il y a trois niveaux: Bronze, Argent et Or. Plus la réputation est bonne, plus vous pouvez faire confiance sur la qualité du travail des vendeurs.
snaimn Universität Hohenheim
S'abonner Vous devez être connecté afin de suivre les étudiants ou les cours
Vendu
16
Membre depuis
7 année
Nombre de followers
16
Documents
17
Dernière vente
4 année de cela

5,0

1 revues

5
1
4
0
3
0
2
0
1
0

Récemment consulté par vous

Pourquoi les étudiants choisissent Stuvia

Créé par d'autres étudiants, vérifié par les avis

Une qualité sur laquelle compter : rédigé par des étudiants qui ont réussi et évalué par d'autres qui ont utilisé ce document.

Le document ne convient pas ? Choisis un autre document

Aucun souci ! Tu peux sélectionner directement un autre document qui correspond mieux à ce que tu cherches.

Paye comme tu veux, apprends aussitôt

Aucun abonnement, aucun engagement. Paye selon tes habitudes par carte de crédit et télécharge ton document PDF instantanément.

Student with book image

“Acheté, téléchargé et réussi. C'est aussi simple que ça.”

Alisha Student

Foire aux questions