Table of Contents Table of Contents
Previous Page  12 / 96 Next Page
Information
Show Menu
Previous Page 12 / 96 Next Page
Page Background

8

J. J. Egozcue, V. Pawlowsky-Glahn

empleados y parados

solo parados

uAgr uInd uCon uSer

uAgr uInd uCon uSer

uAgr

1 -0.01 0.63 0.60 uAgr

1 -0.13 0.01 -0.69

uInd -0.01

1 -0.21 -0.49 uInd -0.13

1 -0.12 -0.58

uCon 0.63 -0.21

1 0.71 uCon 0.01 -0.12

1 -0.20

uSer

0.60 -0.49 0.71

1 uSer -0.69 -0.58 -0.20

1

Tabla 1: Correlaciones (espurias) de las proporciones entre los parados de distin-

tos sectores en las CA, tercer trimestre de 2015. Derecha: usando la composici´on

de empleados y parados (9 partes); Izquierda: usando la subcomposici´on de pa-

rados asignados a sectores (4 partes).

las composiciones representadas en el s´ımplex. En esta estrategia se detectan

inmediatamente defectos como el hecho de que la suma (resta) de vectores en el

s´ımplex no sea del s´ımplex; que el elemento neutro (0

,

0

, . . . ,

0) no est´e en

S

D

y

otros detalles matem´aticos. Los efectos devastadores de esta opci´on al intentar

hacer estad´ıstica con datos en el s´ımplex fueron detectados por K. Pearson ha-

ce m´as de 100 a˜nos (Pearson, 1897) y que se reflejan en la llamada correlaci´on

espuria. Esta problem´atica fue recogida particularmente por F. Chayes (1971)

qui´en insisti´o sobre todo en su importancia para las Ciencias de la Tierra, como

demuestran sus numerosos art´ıculos y los de sus disc´ıpulos. Para ilustrar este fe-

n´omeno, se han tomado los datos de la Encuesta de Poblaci´on Activa (EPA) en

Espa˜na en el tercer trimestre de 2015 (INE, 2015). All´ı se consignan el n´umero

(en miles) de personas paradas y empleadas en cada uno de los sectores para ca-

da comunidad aut´onoma (CA): agricultura (Agr), industria (Ind), construcci´on

(Con), servicios (Ser) y sin sector asignado (Nos). Los empleados se designan con

una “e” precediendo al sector y los parados (unemployed) precedidos por “u”. El

grupo Nos solo se define para parados. Las comunidades de Ceuta y Melilla se

han excluido del an´alisis. Una vez traducidos los miles de personas a proporcio-

nes en la CA (operaci´on de clausura), se obtiene una muestra composicional de

9 partes de tama˜no 17 CA’s. La Tabla 1 en su parte izquierda muestra la matriz

de correlaciones que se obtiene para las partes correspondientes a los parados

con sector asignado (4 partes). Las correlaciones no son altas pero pueden des-

tacarse algunos valores mayores que 0.60. A continuaci´on, se procede a extraer

la subcomposici´on que corresponde a los parados con sector asignado que solo

tiene 4 partes y se calculan las proporciones dentro de la subcomposici´on. La

correlaci´on entre las proporciones de esa subcomposici´on se muestran en la parte

derecha de la Tabla 1. La comparaci´on de ambas partes de la Tabla es desas-

trosa; por ejemplo, la correlaci´on entre uAgr y uSer es de 0

.

60 considerando la

composici´on de 9 partes, mientras que se obtiene

0

.

69 con la subcomposici´on

de 4 partes; o tambi´en, la correlaci´on entre uCon y uSer es 0

.

71 y

0

.

20 en las

correlaciones con 9 partes y 4 partes respectivamente. Al mismo tiempo otras