Table of Contents Table of Contents
Previous Page  11 / 96 Next Page
Information
Show Menu
Previous Page 11 / 96 Next Page
Page Background

What are compositional data and how should they be analyzed?

7

ppm ...). Este hecho motiv´o que se considerase que una composici´on es un con-

junto de n´umeros positivos que suman una constante en todas las observaciones

que se realicen (Aitchison, 1986). No obstante, en las concentraciones qu´ımicas

pueden utilizarse unidades como miligramos por litro (mg/L); las partes de es-

tas composiciones observadas en estas unidades no suman un valor concreto.

En cada comunidad, los parados por sectores de actividad suman el n´umero

total de parados, que no es una constante a trav´es de las comunidades. Sin em-

bargo, las razones entre las partes siguen conteniendo la informaci´on propia de

una composici´on. Desde el punto de vista formal conviene definir una equiva-

lencia composicional. Dos vectores de

D

componentes,

x

= (

x

1

, x

2

, . . . , x

D

) e

y

= (

y

1

, y

2

, . . . , y

D

), con todas sus componentes positivas, se consideran com-

posicionalmente equivalentes si sus componentes son proporcionales, es decir, si

existe una constante

α >

0 tal que

x

=

α

y

(Barcel´o-Vidal et al., 2001; Mart´ın-

Fern´andez et al. 2003; Egozcue, 2009; Pawlowsky-Glahn et al., 2015). Se dice

que cada clase de equivalencia es una composici´on de

D

partes.

Como en cualquier estudio estad´ıstico, uno de los objetivos del an´alisis de

datos composicionales es realizar inferencias sobre poblaciones de las que se ob-

servan muestras de caracter´ısticas composicionales. Por tanto, resulta necesario

determinar un espacio muestral adecuado para estudiar la informaci´on de in-

ter´es. Recordemos que es particularmente importante la estructura del espacio

muestral, pues de ella dependen tanto los m´etodos que puedan aplicarse, como

las conclusiones que puedan extraerse. El

κ

-s´ımplex de

D

-partes, definido como

S

D

=

!

(

x

1

, x

2

, . . . , x

D

)

R

D

" " " " "

x

i

>

0

, i

= 1

,

2

, . . . , D ,

D

#

i

=1

x

i

=

κ

$

,

se ha tomado como espacio muestral para los datos composicionales. La constante

κ

es arbitraria, aunque frecuentemente se toma

κ

= 1 (proporciones) o

κ

= 100

(porcentajes). En efecto, de cualquier clase de equivalencia composicional de

D

partes puede seleccionarse un elemento en

S

D

sin m´as que dividir por la

suma de las componentes y multiplicar por

κ

. A esta operaci´on de selecci´on del

representante de la clase se le suele llamar clausura y se la denota como

C

, de

forma que

C

x

=

%

κ

·

x

1

&

D

j

=1

x

j

,

κ

·

x

2

&

D

j

=1

x

j

, . . . ,

κ

·

x

D

&

D

j

=1

x

j

'

.

Espacio muestral

Una cuesti´on crucial en el dise˜no de cualquier espacio muestral es decidir

cu´ales son las operaciones y la m´etrica que reflejan la naturaleza de las observa-

ciones a tratar. Esta decisi´on debe atenerse a la interpretabilidad. Sin embargo,

el hecho de que

S

D

sea un subconjunto de

R

D

puede tentar al analista a adop-

tar la m´etrica y operaciones (suma y multiplicaci´on por escalares) de

R

D

para