Práctica de análisis multivariante aplicado a las ciencias sociales (24/10/2020)

Objetivo: Aprender a modificar y tabular variables en tres dimensiones.

Pasos previos

  1. Abrir el fichero VuestroDNI.dta (CIS-DA3263) publicado en Studium
  2. Instalar un programa de usuario (Stata no oficial).
  3. ssc install fre
    

Examen de las frecuencias

  1. Obtener frecuencias de genero (p23), edad (p24) y partido votado (p17r).
  2. Previamente se puede escribir la orden set more off para que no se detenga la pantalla, abrir un fichero de resultados. Se piden frecuencias de p23, p24 y p17r. Finalmente, mandamos la orden log off para no grabar nada hasta que volvamos a escribir log on, porque vamos a realizar unos cambios en los datos que no interesan que queden registrados como resultados.
. set more off

. log using Practica3, replace
-------------------------------------------------------------------------------------
      name:  <unnamed>
       log:  D:\Documentos\Practica3.smcl
  log type:  smcl
 opened on:  17 Oct 2020, 20:57:12


. fre p23 p24 p17r

p23 -- Sexo de la persona entrevistada
--------------------------------------------------------------
                 |      Freq.    Percent      Valid       Cum.
-----------------+--------------------------------------------
Valid   1 Hombre |       8592      48.68      48.68      48.68
        2 Mujer  |       9058      51.32      51.32     100.00
        Total    |      17650     100.00     100.00           
--------------------------------------------------------------

p24 -- Edad de la persona entrevistada
-------------------------------------------------------------
                |      Freq.    Percent      Valid       Cum.
----------------+--------------------------------------------
Valid   18      |        196       1.11       1.11       1.11
        19      |        186       1.05       1.05       2.16
        20      |        189       1.07       1.07       3.24
        21      |        176       1.00       1.00       4.23
        22      |        181       1.03       1.03       5.26
        23      |        199       1.13       1.13       6.39
        24      |        198       1.12       1.12       7.51
        25      |        216       1.22       1.22       8.73
        26      |        186       1.05       1.05       9.78
        27      |        188       1.07       1.07      10.85
        28      |        217       1.23       1.23      12.08
        29      |        212       1.20       1.20      13.28
        30      |        214       1.21       1.21      14.49
        31      |        208       1.18       1.18      15.67
        32      |        249       1.41       1.41      17.08
        33      |        257       1.46       1.46      18.54
        34      |        283       1.60       1.60      20.14
        35      |        292       1.65       1.65      21.80
        36      |        263       1.49       1.49      23.29
        37      |        249       1.41       1.41      24.70
        :       |          :          :          :          :
        80      |        147       0.83       0.83      94.05
        81      |        123       0.70       0.70      94.74
        82      |        144       0.82       0.82      95.56
        83      |        138       0.78       0.78      96.34
        84      |        141       0.80       0.80      97.14
        85      |        106       0.60       0.60      97.74
        86      |         95       0.54       0.54      98.28
        87      |         80       0.45       0.45      98.73
        88      |         60       0.34       0.34      99.07
        89      |         42       0.24       0.24      99.31
        90      |         39       0.22       0.22      99.53
        91      |         26       0.15       0.15      99.68
        92      |         17       0.10       0.10      99.77
        93      |          8       0.05       0.05      99.82
        94      |          9       0.05       0.05      99.87
        95      |          6       0.03       0.03      99.90
        96      |          7       0.04       0.04      99.94
        97      |          3       0.02       0.02      99.96
        98      |          3       0.02       0.02      99.98
        99 N.C. |          4       0.02       0.02     100.00
        Total   |      17650     100.00     100.00           
-------------------------------------------------------------

p17r -- Recuerdo de voto en las elecciones generales de abril de 2019 de los votantes
------------------------------------------------------------------------
                           |      Freq.    Percent      Valid       Cum.
---------------------------+--------------------------------------------
Valid   1   PP             |       2412      13.67      13.67      13.67
        2   PSOE           |       5243      29.71      29.71      43.37
        4   Ciudadanos     |       1678       9.51       9.51      52.88
        6   En Comú Podem  |        170       0.96       0.96      53.84
        7   Compromís      |         57       0.32       0.32      54.16
        8   ERC            |        433       2.45       2.45      56.62
        9   JxCat          |        142       0.80       0.80      57.42
        11  EAJ-PNV        |        172       0.97       0.97      58.40
        12  EH Bildu       |        163       0.92       0.92      59.32
        13  CC-PNC         |         35       0.20       0.20      59.52
        14  NA+            |         54       0.31       0.31      59.82
        18  VOX            |        784       4.44       4.44      64.27
        21  Unidas Podemos |       1530       8.67       8.67      72.93
        24  BNG            |         56       0.32       0.32      73.25
        43  PRC            |         24       0.14       0.14      73.39
        77  Voto nulo      |        107       0.61       0.61      73.99
        95  Otros partidos |        186       1.05       1.05      75.05
        96  En blanco      |        213       1.21       1.21      76.25
        98  No recuerda    |        372       2.11       2.11      78.36
        99  N.C.           |       1528       8.66       8.66      87.02
        999 No procede     |       2291      12.98      12.98     100.00
        Total              |      17650     100.00     100.00           
------------------------------------------------------------------------


. log off
      name:  <unnamed>
       log:  D:\Documentos\Trabajo\Docencia\Programas\Analisis\DA3263\Practica3.smcl
  log type:  smcl
 paused on:  17 Oct 2020, 20:58:46
-------------------------------------------------------------------------------------

Asignar valores perdidos

  1. Revisar frecuencias y anotar qué valores deben ser catalogados como perdidos.
  2. Básicamente hay dos modos de asignar valores perdidos: a) Con mvdecode. Por ejemplo: mvdecode p31r, mv(0 77 99). b) Con recode (Los valores perdidos en Stata son valores con “.”. También es posible “.a”, “.b”, “.c”,… “.z”.
. recode p17r (77 98 99 999=.)
(p17r: 4298 changes made)

Recodificar valores de las variables

  1. A menudo las variables tienen demasiados valores y conviene agruparlos.
  2. La instrucción básica para la recodificación es recode. En Stata ser permite poner etiquetas al mismo tiempo.
  3. Si se recodifica en otra variable sin poner etiquetas porque se mantienen, hay que emplear la instrucción label value. En este caso aparece labels139, porque este es el nombre que tienen las etiquetas de los valores de la variable original, esto es, p17r.
. recode p23 (1=1 "Hombre") (2=2 "Mujer"), generate(genero)
(0 differences between p23 and genero)

. recode p24 (min/34=1 "Hasta 34")(35/49=2 "35-49") (50/64=3 "50/64") (65/max=4 "65 y más"), generate(edad)
(17650 differences between p24 and edad)

. recode p17r(6 7 21 =21)(8/20 24/43 96=95)(missing=.), copyrest generate(partido)
(2303 differences between p17r and partido)

. label value partido labels139

Comprobar que las recodificaciones están bien hechas.

. tab p17r partido

   Recuerdo de |
   voto en las |
    elecciones |
  generales de |
 abril de 2019 |   RECODE of p17r (Recuerdo de voto en las elecciones
        de los |             generales de abril de 2019 de
      votantes |        PP       PSOE  Ciudadano  Unidas Po  Otros par |     Total
---------------+-------------------------------------------------------+----------
            PP |     2,412          0          0          0          0 |     2,412 
          PSOE |         0      5,243          0          0          0 |     5,243 
    Ciudadanos |         0          0      1,678          0          0 |     1,678 
 En Comú Podem |         0          0          0        170          0 |       170 
     Compromís |         0          0          0         57          0 |        57 
           ERC |         0          0          0          0        433 |       433 
         JxCat |         0          0          0          0        142 |       142 
       EAJ-PNV |         0          0          0          0        172 |       172 
      EH Bildu |         0          0          0          0        163 |       163 
        CC-PNC |         0          0          0          0         35 |        35 
           NA+ |         0          0          0          0         54 |        54 
           VOX |         0          0          0          0        784 |       784 
Unidas Podemos |         0          0          0      1,530          0 |     1,530 
           BNG |         0          0          0          0         56 |        56 
           PRC |         0          0          0          0         24 |        24 
Otros partidos |         0          0          0          0        186 |       186 
     En blanco |         0          0          0          0        213 |       213 
---------------+-------------------------------------------------------+----------
         Total |     2,412      5,243      1,678      1,757      2,262 |    13,352 



. tab edad p24 if inlist(p24,18,34,35,49,50,64,65,98)

 RECODE of |
 p24 (Edad |
     de la |
   persona |
entrevista |                             Edad de la persona entrevistada
       da) |        18         34         35         49         50         64         65         98 |     Total
-----------+----------------------------------------------------------------------------------------+----------
  Hasta 34 |       196        283          0          0          0          0          0          0 |       479 
     35-49 |         0          0        292        307          0          0          0          0 |       599 
     50/64 |         0          0          0          0        374        311          0          0 |       685 
  65 y más |         0          0          0          0          0          0        307          3 |       310 
-----------+----------------------------------------------------------------------------------------+----------
     Total |       196        283        292        307        374        311        307          3 |     2,073 
  1. Si ha habido alguna equivocación Borrar la variable y volver a recodificar:
. drop partido

. recode p17r(6 7 21 =21)(8/20 24/43 96=95)(missing=.), copyrest generate(partido)
(2303 differences between p17r and partido)

. label value partido labels139

Solicitar tablas de análisis.

1.Crucemos partido por genero y edad. 2. Previamente, se activa la grabación de los resultados (.log).

. log on
------------------------------------------------------------------------------------
      name:  <unnamed>
       log:  D:\Documentos\Trabajo\Docencia\Programas\Analisis\DA3263\Practica3.smcl
  log type:  smcl
resumed on:  17 Oct 2020, 22:51:10


. tab2 partido genero edad, chi2 V nofreq col

-> tabulation of partido by genero  


RECODE of p17r |
  (Recuerdo de |
   voto en las |
    elecciones |  RECODE of p23 (Sexo
  generales de |     de la persona
 abril de 2019 |     entrevistada)
            de |    Hombre      Mujer |     Total
---------------+----------------------+----------
            PP |     17.25      18.85 |     18.06 
          PSOE |     36.81      41.64 |     39.27 
    Ciudadanos |     12.20      12.92 |     12.57 
Unidas Podemos |     14.38      11.98 |     13.16 
Otros partidos |     19.36      14.61 |     16.94 
---------------+----------------------+----------
         Total |    100.00     100.00 |    100.00 

          Pearson chi2(4) =  84.9812   Pr = 0.000
               Cramér's V =   0.0798
			   
-> tabulation of partido by edad  

RECODE of p17r |
  (Recuerdo de |
   voto en las |
    elecciones |
  generales de |      RECODE of p24 (Edad de la persona
 abril de 2019 |                entrevistada)
            de |     18-34      35-49      50-64   65 y más |     Total
---------------+--------------------------------------------+----------
            PP |      9.71      11.93      15.95      32.34 |     18.06 
          PSOE |     31.61      34.49      44.10      44.31 |     39.27 
    Ciudadanos |     16.03      16.48      12.25       6.52 |     12.57 
Unidas Podemos |     23.00      16.73      11.16       4.83 |     13.16 
Otros partidos |     19.66      20.37      16.54      12.00 |     16.94 
---------------+--------------------------------------------+----------
         Total |    100.00     100.00     100.00     100.00 |    100.00 

         Pearson chi2(12) =  1.4e+03   Pr = 0.000
               Cramér's V =   0.1837

-> tabulation of genero by edad  

 RECODE of |
 p23 (Sexo |
     de la |
   persona |      RECODE of p24 (Edad de la persona
entrevista |                entrevistada)
       da) |     18-34      35-49      50-64   65 y más |     Total
-----------+--------------------------------------------+----------
    Hombre |     51.05      50.63      49.59      43.88 |     48.68 
     Mujer |     48.95      49.37      50.41      56.12 |     51.32 
-----------+--------------------------------------------+----------
     Total |    100.00     100.00     100.00     100.00 |    100.00 

          Pearson chi2(3) =  59.1504   Pr = 0.000
               Cramér's V =   0.0579

Tablas con más de dos dimensiones.

  1. Cruce tridimensional de partido según edad para cada género.
  2. Observar la preinstrucción by con su opción sort.
  3. Se termina cerrando el fichero de resultados y grabando los cambios en los datos.
. by genero, sort: tab partido edad, chi2 V nofreq col

------------------------------------------------------------------------------------------
-> genero = Hombre

RECODE of p17r |
  (Recuerdo de |
   voto en las |
    elecciones |
  generales de |      RECODE of p24 (Edad de la persona
 abril de 2019 |                entrevistada)
            de |  Hasta 34      35-49      50/64   65 y más |     Total
---------------+--------------------------------------------+----------
            PP |      9.21      11.07      15.53      32.70 |     17.25 
          PSOE |     28.74      32.51      41.57      42.39 |     36.81 
    Ciudadanos |     15.21      15.24      12.20       6.35 |     12.20 
Unidas Podemos |     23.94      17.76      11.94       5.91 |     14.38 
Otros partidos |     22.90      23.41      18.75      12.64 |     19.36 
---------------+--------------------------------------------+----------
         Total |    100.00     100.00     100.00     100.00 |    100.00 

         Pearson chi2(12) = 676.5074   Pr = 0.000
               Cramér's V =   0.1855
-----------------------------------------------------------------------------------------
-> genero = Mujer

RECODE of p17r |
  (Recuerdo de |
   voto en las |
    elecciones |
  generales de |      RECODE of p24 (Edad de la persona
 abril de 2019 |                entrevistada)
            de |  Hasta 34      35-49      50/64   65 y más |     Total
---------------+--------------------------------------------+----------
            PP |     10.22      12.81      16.38      32.03 |     18.85 
          PSOE |     34.58      36.52      46.67      45.87 |     41.64 
    Ciudadanos |     16.87      17.75      12.30       6.66 |     12.92 
Unidas Podemos |     22.03      15.67      10.37       3.95 |     11.98 
Otros partidos |     16.29      17.25      14.29      11.48 |     14.61 
---------------+--------------------------------------------+----------
         Total |    100.00     100.00     100.00     100.00 |    100.00 

         Pearson chi2(12) = 674.5185   Pr = 0.000
               Cramér's V =   0.1819

. log close
      name:  <unnamed>>
       log:  D:\Documentos\Trabajo\Docencia\Programas\Analisis\DA3263\Practica3.smcl
  log type:  smcl
 closed on:  17 Oct 2020, 22:57:52
----------------------------------------------------------------------------------------

. save da3263r.dta, replace
file da3263r.dta saved

Final de la práctica.

  1. Subir el fichero Practica3.scml a Studium. En la actividad “Subir segundo fichero de resultados(smcl) de Stata”.

Universidad de Salamanca. Grado de Sociología. Análisis Multivariable Aplicado a las Ciencias Sociales. Modesto Escobar