100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
College aantekeningen

Curso de análisis multivariante con ejemplos

Beoordeling
-
Verkocht
-
Pagina's
25
Geüpload op
24-11-2021
Geschreven in
2021/2022

En este documento vais a encontrar un curso básico de análisis multivariante con con ejemplos al final usando las técnicas vistas anteriormente.

Instelling
Vak










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
24 november 2021
Aantal pagina's
25
Geschreven in
2021/2022
Type
College aantekeningen
Docent(en)
Antonio santos
Bevat
Alle colleges

Onderwerpen

Voorbeeld van de inhoud

TEMA 1: Análisis multivariante




1 Introducción
¿Qué es la estadı́stica multivariante?
Son todas aquellas técnicas estadı́sticas que analizan simultáneamente múltiples
resultados sobre unas observaciones (individuos, encuestas, paı́ses...) respecto
de unas variables bajo estudio (nivel de renta, intención de voto, ...).
El objetivo de la estadı́stica multivariante es:
• Medir, explicar y predecir el grado de relación que existe entre las variables
y las observaciones.
• Es multivariante no solo por el número de variables sino principalmente
por las múltiples combinaciones y relaicones que existen entre ellas.
• La estadı́stica multivariante no es la combinación de estaddı́sticas univari-
antes.
A continuación, definiremos el concepto de unidad experimental.
Una unidad experimental es cualquier objeto o concepto sobre el que se puede
medir o evaluar atributos o caracterı́sticas de alguna manera. A cada atributo
o caracterı́stica se le llama variable. Siempre que un investigador mide o evalue
más de un atributo o caracterı́stica en cada unidad experimental obtendrá datos
de variables múltiples.
El objetivo principal de estos métodos es resumir grandes cantidades de datos
por medio de un número reducido de parámetros.
El Análisis Factorial y el Análisis de Correlación Canónica están dirigidos hacia
las variables. Ambos métodos tratan de detectar las relaciones que existen entre
ellas.
Otras técnicas como el Análisis Discriminante y Clasificación están enfocadas
hacia el establecimiento de relaciones entre las observaciones.




1

,1.1 Tipos de variables
Las variables que se utilizan en las ténicas multivariantes pueden ser:

• Continuas: son aquellas cuyos valores pueden tomar cualquier número
real de un intervalo dado.
• Numéricas discretas: son aquellas que sólo pueden tomar un número
finito o infinito numerable de valores y entre ellos existe un orden.
• Discretas no numéricas: pueden tomar un número finito de valores y
entre ellos, no se puede establecer ningún tipo de orden. Las llamaremos
cualitativas o categóricas y a los posibles valores que tomen les llamaremos
categorı́as.
En muchas técnicas multivariantes se utiliza la hipótesis de Normalidad mul-
tivariant para un conjunto de variables, esto implica que las variables deberı́an
ser continuas, simétricas, etc.

1.2 Datos faltantes y atı́picos
Antes de llevar a cabo cualquier técnica multivariantes es preciso tratar de cribar
los datos. Los errores en la entrada de datos suelen ser inevitables y es necesario
tratarlos.
Dos de los errores que se producen en todo el proceso son:
• La existencia de datos faltantes (otra denominación que usaremos
será la de missing), que suelen producirse durante la fase de muestreo.

• La existencia de datos atı́picos. Estos últimos pueden producirse por
simple error en la codificación posterior a la toma de la muestra.

1.2.1 Datos faltantes
Muchas de las observaciones que se recogen en una muestra no se encuentran
completas, es decir, existen valores faltantes para algunas de las variables. La
manera de actuar ante esta situación es variada, las dos opciones más utilizadas
son:
• Reemplazar por el valor medio. Suele ser desaconsejable produciendo
situaciones aberrantes y disminuyendo la variabilidad de los datos.
• Eliminar las observaciones con algún dato faltante. Es la más razonable
pero provoca una reducción de la muestra que puede llegar a ser dramática.

• Utilizar técnicas de imputación multivariantes cuando exista relación entre
variables.




2

, 1.2.2 Datos atı́picos
Los datos atı́picos se definen como datos de la muestra que parecen no ser
coherentes con el resto. La caracterización de estos valores se basa en que su
distancia con el resto de los datos debe ser grande. Existen diferentes métodos
para su localización:
• Gráficos
• Análisis de Componentes Principales

• Inferencia

1.2.3 Datos estandarizados
A veces los datos son más fácilmente comprensibles y comparables cuando las
variables se estandarizan, de modo que se midan en las mismas unidades. Esto
se consigue mediante la eliminación de las unidades de medida.
Dada una variable Xi se define como Zi = X√iσ−µ i,j
i
a la variable estandarizada
(se le resta su valor esperado y se divide por su desviación tı́pica).
Se recomienda la estandarización cuando las variables medidas tienen unidades
completamente diferentes.


1.2.4 Correlación muestral. Pruebas estadı́sticas
La correlación mide la intensidad de relación lineal entre las variables. Dos vari-
ables pueden estar relacionadas entre sı́ y su correlación ser nula (incorreladas).
A partir del coeficiente exacto de correlación deberemos determinar si el valor
es significativo o no.
Siempre que la muestra esté formada por más de 12 observaciones una cor-
relación superior de 0.6 se puede considerar significativa.

1.2.5 Etapas del análisis multivariante
1. Objetivos del análisis
• Definir el problema
• Fijar los objetivos
• Elección de técnicas estadı́sticas multivariantes

2. Diseño, descriptiva y preprocessing
• Tamaño muestral
• Missing data
• Outliers
• Distancia a calcular


3
€2,99
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper
Seller avatar
perdi12

Maak kennis met de verkoper

Seller avatar
perdi12 Universidad Complutense de Madrid
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
0
Lid sinds
9 jaar
Aantal volgers
0
Documenten
9
Laatst verkocht
-

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen