100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
College aantekeningen

Estadística aplicada. Análisis multivariante.

Beoordeling
-
Verkocht
-
Pagina's
22
Geüpload op
25-09-2014
Geschreven in
2013/2014

Instelling
Vak










Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
25 september 2014
Aantal pagina's
22
Geschreven in
2013/2014
Type
College aantekeningen
Docent(en)
Onbekend
Bevat
Alle colleges

Onderwerpen

Voorbeeld van de inhoud

ANÁLISIS MULTIVARIANTE

Pedro Miranda Menéndez




Resumen
En este tema veremos una introducción a dos de las técnicas del Análisis Multivariante. En
primer lugar estudiaremos el Análisis de Componentes Principales; esta técnica permite
una reducción de la dimensión del vector aleatorio que se está estudiando, lo que simplifica
mucho el coste computacional de estudios posteriores.
En segundo lugar estudiaremos el Análisis Cluster o de Clasificación; este análisis
busca obtener grupos de individuos homogéneos dentro de una muestra aleatoria de una
población.


1. Análisis de componentes principales
El Análisis Multivariante estudia técnicas que se van a aplicar sobre vectores aleatorios
o datos muestrales provenientes de un vector aleatorio, en principio de muchas compo-
nentes. Un problema muy importante en Análisis Multivariante es el de la reducción de
la dimensionalidad de la variable. Esto es posible en muchas circunstancias en las que las
distintas componentes están bastante relacionadas entre sı́; de esta forma, si sabemos el
resultado de algunas de las componentes, podemos dar una estimación bastante fiable del
resultado en las otras componentes. Ası́, si tenemos una variable p-dimensional y somos
capaces de representarla en otra variable q-dimensional sin una gran pérdida de informa-
ción, entonces hemos conseguido reducir el coste computacional y de interpretación de la
variable. Este es el objetivo del Análisis de Componentes Principales. Además, veremos
que las componentes principales que resultan de este estudio permiten obtener unas va-
riables incorreladas entre sı́, y esto proporciona múltiples ventajas, como se vio al tratar
el problema de la regresión múltiple.
La idea del Análisis de Componentes Principales es la siguiente: Consideremos una
columna tal y como aparece en la Figura 1 y supongamos ahora que tenemos que re-
presentar esa columna en dos dimensiones. En este caso, lo más razonable es considerar
la cara con mayor superficie, pues es la que más fielmente refleja a toda la columna. Si
ahora queremos representar esa cara en una sola dimensión, lo más razonable parece ser
considerar la longitud de una de las diagonales y no tiene sentido considerar, por ejemplo,
el lado más corto. Nótese que en cada reducción se pierde algo de información sobre la
figura original.
Consideremos una variable p-dimensional X  = (X1 , ..., Xp ). Supondremos que este
vector aleatorio tiene como vector de medias 0; en caso de no ser ası́, basta restar al
vector original su vector de medias y la representación no varı́a (sólo varı́a la posición);
en realidad esta suposición se hace para simplificar la notación posterior. Denotemos la
matriz de varianzas-covarianzas de X  por Σ. El Análisis de Componentes Principales
consiste en hacer un cambio de variable lineal:

, ⇒ ⇒




Figura 1: Reducción de la dimensión de un vector aleatorio.



 ⇔ y1 = at1 X,
Y = AX  ..., yp = at1 X.

Cada una de estas variables y1 , ..., yp se llaman componentes principales. Este
estudio puede hacerse a partir de la distribución de probabilidad pero en la mayor parte
de las ocasiones esta distribución es desconocida y debe afrontarse a partir de los datos
muestrales que nos proporciona una m.a.s. de tamaño n. En este caso contamos con
n puntos en el espacio p-dimensional y el estudio se hace tomando como referencia la
estimación de Σ proporcionada por la matriz de varianzas-covarianzas muestral. Nótese
que en este caso obtendremos estimaciones de las componentes principales.
En principio el ACP es un cambio de variable; sin embargo, veremos al tratarlo con
más detalle que las últimas variables yi, i = q + 1, ..., p suelen ser casi degeneradas, con
lo que aportan muy poco al vector de cambio de variable o, en otras palabras, conocidas
las componentes anteriores, es posible determinar o dar una buena estimación de las
últimas componentes. Por ello, podemos suprimirlas sin perder mucha información del
vector original y esto redunda en una mayor simplicidad de la variable.
Adicionalmente, el ACP se puede plantear desde otros tres puntos de vista que dan
lugar al mismo resultado:

Enfoque descriptivo. Se trata de encontrar un subespacio de dimensión menor
que p de forma que al proyectar sobre él los puntos (muestrales o poblacionales)
se mantenga lo más posible la estructura de los mismos. Esto se traduce en que la
distancia entre los puntos y sus proyecciones sobre el nuevo espacio sea lo menor
posible (véase la Figura 2).
Si pensamos en un espacio de dimensión 1, entonces este subespacio viene determi-
nado por un vector en él; supongamos sin pérdida de generalidad que este vector es
de módulo 1. Ası́, se busca en primer lugar un vector a de módulo 1 de forma que
la distancia entre el punto xi y su proyección sea mı́nima. Como a es de módulo
1, la proyección viene dada por (atxi )a; esto es ası́ porque atxi = axi cos(a, xi )
(véase la Figura 3).
Buscamos entonces a de módulo 1 de forma que se minimice

, × ×
× ××
×× ×

×




Figura 2: Enfoque descriptivo del ACP.




xi
ri



a (atxi )a


Figura 3: Proyección del vector xi .
€2,99
Krijg toegang tot het volledige document:

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Maak kennis met de verkoper
Seller avatar
cvlopez

Maak kennis met de verkoper

Seller avatar
cvlopez Universidad Complutense de Madrid
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
0
Lid sinds
11 jaar
Aantal volgers
0
Documenten
4
Laatst verkocht
-

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via Bancontact, iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo eenvoudig kan het zijn.”

Alisha Student

Veelgestelde vragen