De
las cuatro dimensiones del análisis estadístico; centro, bordes, segmentos y
variación; vamos a referirnos, en este post, a los bordes o cobertura de la
distribución. Esta dimensión es sencilla, pero muy importante. La cobertura
está formada por el mínimo valor, el máximo, el rango, la suma (cuanto la
distribución es sumable) y la cuenta
o conteo de valores. Todos estos estadísticos tienen que ver con la estructura
general de la distribución; con el espacio que ocupa. ¿Qué importancia tiene?
La cobertura nos indica, en primera instancia, las similitudes que pueden
existir entre dos distribuciones; supongamos que dos poblaciones de colesterol,
A y B, tienen los siguientes valores de cobertura (ver tabla)
Población A
|
Población B
|
Rango
|
41
|
Rango
|
100
|
|
199
|
Mínimo
|
150
|
Máximo
|
240
|
Máximo
|
250
|
Suma
|
20469
|
Suma
|
16850
|
Cuenta
|
96
|
Cuenta
|
90
|
Observamos
que ambas poblaciones parten de valores distintos, es decir, sus mínimos son
diferentes, pero sus máximos se parecen más; ahora bien, sus rangos, por lo tanto,
son muy diferentes. En consecuencia, la población A es mucho más estrecha que
la B, lo que equivale a decir que sus valores están más concentrados; esa
distribución es más densa; mientras que la B, es más holgada, y a pesar que el valor
máximo de la población B es mayor que el de A, la suma de los valores de en A
supera al de B con tan solo una pequeña diferencia en el total de sus valores o
cuenta.
Por lo visto decimos que hay más colesterol en la población A que en la
B, este está mas concentrado en la población A que en la B.
Con esta primera visión de
los datos esperaríamos comportamientos diferentes en esta variable. Obviamente
que la cobertura de las distribuciones ayuda a formarse una conjetura inicial
que nos indique qué buscar; en este caso habría que ver los segmentos y
despejar en cuales de ellos se presenta mayor densidad de colesterol.
Comentarios
Publicar un comentario