Práctica de análisis multivariante aplicado a las ciencias sociales (16/11/2020)

Objetivo: Elaboración de análisis factorial de ejes principales.

Pasos previos

  1. Bajad vuestro fichero personal DNI.dta ubicado en Studium. Bajad también el guión básico de la pasada semana (practica4.do)
  2. Tras abrir Stata, cambiar al directorio donde están ambos ficheros y abrir los datos con la orden use.
  3. Ejecutar el guión de la semana pasada con la orden do.
. cd "c:\Users\vdi\Downloads"
. use "00000000X.dta", clear
. do practica4.do
(PSOE: 1286 changes made)
(PP: 1313 changes made)
(CS: 1375 changes made)
(Podemos: 1292 changes made)
(IU: 1449 changes made)
(VOX: 1383 changes made)
(PACMA: 3018 changes made)

. count
     17,650
. summarize $partidos

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
        PSOE |     16,364    3.667074    3.780979          0         10
          PP |     16,337     2.34376    3.291869          0         10
          CS |     16,275     1.91828    2.763632          0         10
     Podemos |     16,358    1.827668    2.829132          0         10
          IU |     16,201    1.627739    2.656042          0         10
-------------+---------------------------------------------------------
         VOX |     16,267    1.108195    2.501439          0         10
       PACMA |     14,632    .9685621    2.104987          0         10

. corr $partidos
(obs=14,253)

             |     PSOE       PP       CS  Podemos       IU      VOX    PACMA
-------------+---------------------------------------------------------------
        PSOE |   1.0000
          PP |  -0.2430   1.0000
          CS |  -0.0983   0.4875   1.0000
     Podemos |   0.1457  -0.2194  -0.1012   1.0000
          IU |   0.1779  -0.1998  -0.0922   0.7816   1.0000
         VOX |  -0.2247   0.3298   0.2898  -0.1433  -0.1203   1.0000
       PACMA |   0.0839  -0.0423   0.0821   0.3740   0.4132   0.0188   1.0000


. factortest $partidos
    
Determinant of the correlation matrix
Det                =     0.176
 
 
Bartlett test of sphericity
    
Chi-square         =         24744.659
Degrees of freedom =                21
p-value            =             0.000
H0: variables are not intercorrelated
 
 
Kaiser-Meyer-Olkin Measure of Sampling Adequacy
KMO               =     0.647

Análisis de ejes principales. I Extracción.

  1. Abrir el fichero de resultados.
  2. Verificar el número de casos del fichero.
  3. La instrucción básica del análisis de ejes principales es factor.
  4. También son importantes las opciones, especialmente mineigen(#.#), components(#) y blank(#.#)
. log using practica5
------------------------------------------------------------------------------------------------------
      name:  
       log:  c:\Users\vdi\Downloads\practica4.smcl
  log type:  smcl
 opened on:   7 Nov 2020, 18:23:01
 . count
      17,650
. factor $partidos
(obs=14,253)

Factor analysis/correlation                      Number of obs    =     14,253
    Method: principal factors                    Retained factors =          3
    Rotation: (unrotated)                        Number of params =         18

    --------------------------------------------------------------------------
         Factor  |   Eigenvalue   Difference        Proportion   Cumulative
    -------------+------------------------------------------------------------
        Factor1  |      1.84845      0.91531            0.8047       0.8047
        Factor2  |      0.93314      0.85331            0.4062       1.2110
        Factor3  |      0.07984      0.11279            0.0348       1.2457
        Factor4  |     -0.03296      0.09698           -0.0143       1.2314
        Factor5  |     -0.12994      0.02991           -0.0566       1.1748
        Factor6  |     -0.15985      0.08184           -0.0696       1.1052
        Factor7  |     -0.24168            .           -0.1052       1.0000
    --------------------------------------------------------------------------
    LR test: independent vs. saturated:  chi2(21) = 2.5e+04 Prob>chi2 = 0.0000

Factor loadings (pattern matrix) and unique variances

    -----------------------------------------------------------
        Variable |  Factor1   Factor2   Factor3 |   Uniqueness 
    -------------+------------------------------+--------------
            PSOE |   0.2786   -0.1839    0.2153 |      0.8422  
              PP |  -0.4253    0.5042    0.0168 |      0.5646  
              CS |  -0.2790    0.5271    0.1255 |      0.6286  
         Podemos |   0.7952    0.2417   -0.0629 |      0.3054  
              IU |   0.8034    0.2713   -0.0262 |      0.2802  
             VOX |  -0.2885    0.3863   -0.0875 |      0.7599  
           PACMA |   0.3887    0.2933    0.0720 |      0.7577  
    -----------------------------------------------------------

Análisis de ejes principales. II Rotación.

  1. Para una interpretación más clara de los ejes o factores, se recurre a la rotación (rotate)
  2. Por defecto realiza una rotación ortogonal varimax. Pero hay otras como quartimax y la oblicua (oblimin(-.##).
  3. Otras opciones posibles para rotate son components(#) y blanks(.##), aunque aquí no se empleen.
. rotate
    Factor analysis/correlation                      Number of obs    =     14,253
    Method: principal factors                    Retained factors =          3
    Rotation: orthogonal varimax (Kaiser off)    Number of params =         18

    --------------------------------------------------------------------------
         Factor  |     Variance   Difference        Proportion   Cumulative
    -------------+------------------------------------------------------------
        Factor1  |      1.68887      0.62363            0.7353       0.7353
        Factor2  |      1.06525      0.95794            0.4638       1.1990
        Factor3  |      0.10730            .            0.0467       1.2457
    --------------------------------------------------------------------------
    LR test: independent vs. saturated:  chi2(21) = 2.5e+04 Prob>chi2 = 0.0000

Rotated factor loadings (pattern matrix) and unique variances

    -----------------------------------------------------------
        Variable |  Factor1   Factor2   Factor3 |   Uniqueness 
    -------------+------------------------------+--------------
            PSOE |   0.1647   -0.2518    0.2594 |      0.8422  
              PP |  -0.1831    0.6297   -0.0730 |      0.5646  
              CS |  -0.0477    0.6056    0.0488 |      0.6286  
         Podemos |   0.8269   -0.1042    0.0044 |      0.3054  
              IU |   0.8441   -0.0761    0.0391 |      0.2802  
             VOX |  -0.0997    0.4553   -0.1512 |      0.7599  
           PACMA |   0.4688    0.1209    0.0890 |      0.7577  
    -----------------------------------------------------------

Factor rotation matrix

    -----------------------------------------
                 | Factor1  Factor2  Factor3 
    -------------+---------------------------
         Factor1 |  0.9109  -0.3978   0.1097 
         Factor2 |  0.4074   0.9093  -0.0851 
         Factor3 | -0.0659   0.1222   0.9903 
    -----------------------------------------

Análisis de ejes principales. III Gráficos.

Los principales gráficos del análisis factorial son:
  1. El gráfico de sedimentación, que se hace con screeplot
  2. Más importante es el gráfico de saturaciones que se realiza con loadingplot
  3. En ambos casos, conviene dar un nombre al gráfico mediante la opción name.
. screeplot, name(scep, replace)
. loadingplot, name(loep, replace)

Análisis de ejes principales. IV Puntuaciones factoriales.

1. Una vez que se ha realizado el análisis de ejes principales (y opcionalmente se ha rotado), pueden obtenerse las puntuaciones factoriales con la orden predict. A esta orden conviene darle un nombre acompañado de un asterisco, que indica los distintos ejes obtenidos.

. predict ep1 ep2 ep3
(option regression assumed; regression scoring)

Scoring coefficients (method = regression; based on varimax rotated factors)

    --------------------------------------------
        Variable |  Factor1   Factor2   Factor3 
    -------------+------------------------------
            PSOE |  0.01428  -0.09226   0.23366 
              PP | -0.00788   0.37945  -0.04215 
              CS |  0.03042   0.34486   0.11544 
         Podemos |  0.41686  -0.01238  -0.09759 
              IU |  0.47127   0.04171   0.02437 
             VOX |  0.01163   0.21087  -0.13090 
           PACMA |  0.11394   0.09978   0.08701 
    --------------------------------------------

2. Los coeficientes de puntuación no son útiles en la interpretación, pero son el medio para obtener las puntuaciones factoriales (una por cada factor y por cada individuo) a las que se pueden aplicar los análisis que se deseen posteriormente.

. summarize ep*

    Variable |        Obs        Mean    Std. Dev.       Min        Max
-------------+---------------------------------------------------------
         ep1 |     14,253    2.46e-09    .8928022  -.6541969   3.311752
         ep2 |     14,253   -4.45e-09    .7597417  -.8354484   3.173762
         ep3 |     14,253    4.05e-10    .3120451  -.9760086   1.206657

Final de la práctica.

1. No olvidar cerrar el fichero de resultados y salir de Stata.

. log close
      name:  
       log:  c:\Users\vdi\Downloads\practica5.smcl
  log type:  smcl
 closed on:   14 Nov 2020, 18:24:46
------------------------------------------------------------------------------------------------------
. exit, clear