1.2.4. MEDIDAS DE ASIMETRÍA Y CURTOSIS
Es una medida de forma de una distribución que permite identificar y describir la
manera como los datos tiende a reunirse de acuerdo con la
frecuencia con que se hallen dentro de la distribución. Permite identificar las
características de la distribución de datos sin necesidad de generar el
gráfico.
La asimetría presenta las siguientes formas:
Asimetría Negativa
o a la Izquierda: Se da cuando
en una distribución la minoría de los datos está en la parte izquierda de la
media. Este tipo de distribución presenta un alargamiento o sesgo hacia la
izquierda, es decir, la distribución de los datos tiene a la izquierda una cola
más larga que a la derecha. También se dice que una distribución es simétrica a
la izquierda o tiene sesgo negativo cuando el valor de la media aritmética es menor que la
mediana y éste valor de la mediana a su vez es menor que la moda.
Nota: Sesgo es el grado de asimetría de una
distribución, es decir, cuánto se aparta de la simetría.
Simétrica: Se da cuando en una distribución se
distribuyen aproximadamente la misma cantidad de los datos a ambos lados de la
media aritmética. No tiene alargamiento o sesgo. Se representa por una curva
normal en forma de campana llamada campana de Gauss (matemático Alemán
1777-1855) o también conocida como de Laplace (1749-1827).También se dice que una
distribución es simétrica cuando su media aritmética, su mediana y su moda son
iguales, en símbolos
Md=Mo
Asimetría Positiva
o a la Derecha: Se da
cuando en una distribución la minoría de los datos está en la parte derecha de
la media aritmética. Este tipo de distribución presenta un alargamiento o sesgo
hacia la derecha, es decir, la distribución de los datos tiene a la derecha una
cola más larga que a la izquierda.
Curtosis o Apuntamiento
La Curtosis mide el grado de agudeza o
achatamiento de una distribución con relación a la distribución normal, es
decir, mide cuán puntiaguda es una distribución.
La Curtosis determina el grado de
concentración que presentan los valores en la región central de la distribución.
1.3. REPRESENTACIONES GRÁFICAS
Una gráfica es la
representación en unos ejes de coordenadas de los pares ordenados de una tabla.
Las gráficas describen relaciones entre dos variables.
La variable que se representa en el eje horizontal se llama variable independiente o variable x.
La que se representa en
el eje vertical se llama variable dependiente o variable y.
La variable y está en función de la variable x.
Una vez realizada la
gráfica podemos estudiarla, analizarla y extraer conclusiones.
Para interpretar una
gráfica, hemos de observarla de izquierda a derecha, analizando cómo varía la
variable dependiente, y, al aumentar la variable independiente, x.
Diagrama de dispersión:
Un diagrama de dispersión es un tipo
de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos
variables para un conjunto de datos.
Los datos se muestran
como un conjunto de puntos, cada uno con el valor de una variable que determina
la posición en el eje horizontal y el valor de la otra variable determinado por
la posición en el eje vertical.1 Un diagrama de dispersión se llama
también gráfico de dispersión.
Se emplea cuando una
variable está bajo el control del experimentador. Si existe un parámetro que se
incrementa o disminuye de forma sistemática por el experimentador, se le
denomina parámetro de control o variable
independiente = eje de x y
habitualmente se representa a lo largo del eje horizontal. La variable medida
o dependiente = eje de y usualmente se representa a lo largo del eje
vertical. Si no existe una variable dependiente, cualquier variable se puede
representar en cada eje y el diagrama de dispersión mostrará el grado de correlación (no causalidad) entre las dos variables.
Diagrama de Tallos y Hojas:
El diagrama "tallo
y hojas" (Stem-and-Leaf Diagram)
permite obtener simultáneamente una distribución de frecuencias de la variable
y su representación gráfica. Para construirlo basta separar en cada dato el
último dígito de la derecha (que constituye la hoja) del bloque de cifras restantes (que formará el tallo).
Esta representación de
los datos es semejante a la de un histograma pero además de ser fáciles de
elaborar, presentan más información que estos.
Un diagrama donde cada
valor de datos es dividido en una "hoja" (normalmente el último
dígito) y un "tallo" (los otros dígitos). Por ejemplo "32"
sería dividido en "3" (tallo) y "2" (hoja).
Los valores del "tallo" se escriben hacia abajo y los valores "hoja" van a la derecha (o izquierda) de los valores tallo.
El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los puntajes individuales dentro de cada grupo.
Los valores del "tallo" se escriben hacia abajo y los valores "hoja" van a la derecha (o izquierda) de los valores tallo.
El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los puntajes individuales dentro de cada grupo.
1.3.3
HISTOGRAMAS
En estadística, un histograma es una
representación gráfica de una variable en forma de barras, donde la superficie
de cada barra es proporcional a la frecuencia de los valores representados. En
el eje vertical se representan las frecuencias, y en el eje horizontal los
valores de las variables, normalmente señalando las marcas de clase, es decir,
la mitad del intervalo en el que están agrupados los datos.
Se utilizan para variables continuas o para
variables discretas, con un gran número de datos, y que se han agrupado en
clases.
Se utiliza cuando se estudia una variable
continua, como franjas de edades o altura de la muestra, y, por comodidad, sus
valores se agrupan en clases, es decir, valores continuos. En los casos en los
que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o
nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en
ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y
permite la comparación de los resultados de un proceso.
1.3.4 OJIVAS
La ojiva es la distribución de frecuencias,
es decir, que en ella se permite ver cuántas observaciones se encuentran por
encima o debajo de ciertos valores, en lugar de solo exhibir los números
asignados a cada intervalo.
La ojiva apropiada para información que
presente frecuencias mayores que el dato que se está comparando tendrá una
pendiente negativa (hacia abajo y a la derecha) y en cambio la que se asigna a
valores menores, tendrá una pendiente positiva. Una gráfica similar al polígono
de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la
misma técnica a una distribución acumulativa y de igual manera que éstas,
existen las ojivas mayores que y las ojivas menores que.
Existen dos diferencias fundamentales entre
las ojivas y los polígonos de frecuencias (y por esto la aplicación de la
técnica es parcial):
Un extremo de la ojiva no se toca al eje
horizontal, para la ojiva "mayor que" sucede con el extremo
izquierdo; para la ojiva "menor que", con el derecho.
En el eje horizontal en lugar de colocar las
marcas de clase se colocan las fronteras de clase. Para el caso de la ojiva
mayor que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la
izquierda la "mayor que", a la derecha la "menor que",
utilizando los datos que se usaron para ejemplificar el histograma:
La ojiva "mayor que" (izquierda) se
le denomina de esta manera porque viendo el punto que está sobre la frontera de
clase “4:00″ se ven las visitas que se realizaron en una hora mayor que las
4:00 horas (en cuestiones temporales se diría, sin errores de gramática:
después de las 4:00). De forma análoga, en la ojiva "menor que" la
frecuencia que se representa en cada frontera de clase son el número de
observaciones menores que la frontera señalada (en caso de tiempos sería el
número de observaciones antes de la hora que señala la frontera).
1.3.5 POLÍGONO DE FRECUENCIAS
Es el nombre que recibe una clase de gráfico que se crea a
partir de un histograma de
frecuencia. Estos histogramas emplean columnas verticales para
reflejar frecuencias): el
polígono de frecuencia es realizado uniendo los puntos de mayor altura de estas
columnas.
Es decir, por tanto, podríamos establecer que
un polígono de frecuencia es aquel que se forma a partir de la unión de los
distintos puntos medios de las cimas de las columnas que configuran lo que es
un histograma de frecuencia. Este se caracteriza porque utiliza siempre lo que
son columnas de tipo vertical y porque nunca debe haber espacios entre lo que
son unas y otras.
Se conoce como polígonos de frecuencia para datos agrupados a aquellos que
se desarrollan mediante la marca de clase que tiene coincidencia con el punto
medio de las distintas columnas del histograma. En el momento de la
representación de todas las frecuencias que forman parte de una tabla de datos
agrupados, se genera el histograma de frecuencias acumuladas que posibilita la diagramación del
polígono correspondiente.
Los polígonos de frecuencia se suelen usar
cuando se pretende retratar varias distribuciones distintas o la clasificación
cruzada de una variable cuantitativa continua con una cualitativa o
cuantitativa discreta en el mismo dibujo.
El punto de más altura de un polígono de
frecuencia equivale a la mayor frecuencia, mientras que el área que se sitúa
debajo de la curva incluye todos los datos que existen. Cabe recordar que la
frecuencia es la repetición mayor
o menor de un evento, o el número de veces que un acontecimiento
periódico se reitera en una unidad temporal.
1.3.6 DIAGRAMA DE
CAJA Y EJES
Un diagrama de caja es un gráfico, basado en cuartiles, mediante
el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la
"caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información
sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o
mediana y Q3, y sobre la existencia de valores atípicos y la simetría de
la distribución. Primero es necesario encontrar la mediana para luego encontrar
los 2 cuartiles restantes
Como expresarlo gráficamente
- Ordenar
los datos y obtener el valor mínimo, el máximo, los cuartiles Q1, Q2 y Q3
y el Rango Inter Cuartilico (RIC)
- Para
dibujar los bigotes, las líneas que se extienden desde la caja, hay que
calcular los límites superiores e inferior, Li y Ls, que identifiquen a
los valores atípicos.
- Para
ello se calcula cuándo se consideran atípicos los valores. Son aquellos
inferiores a Q1-1.5*RIC o superiores a Q3+1.5*RIC.
- Ahora
se buscan los últimos valores que NO son atípicos, que serán los extremos de los bigotes.
- Marcar
como atípicos todos los datos que están fuera del intervalo (Li, Ls).
- Además,
se pueden considerar valores extremadamente atípicos aquellos que exceden
Q1-3*RIC o Q3+3*RIC.
1.3.7 DIAGRAMA DE
SECTORES
Se toma un círculo y se divide en tantos
sectores como clases tengamos, siendo el arco del círculo proporcional a las
frecuencias absolutas (también lo podemos hacer con las frecuencias relativas o
porcentajes).
Para determinar el arco circular que
corresponde a cada clase relacionamos el total de observaciones con los 360º
grados de la circunferencia.
Un diagrama de sectores se puede utilizar para todo tipo
de variables, pero se usa frecuentemente
para las variables cualitativas.
Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.
Se representan los datos en un círculo, de
modo que la frecuencia de cada valor viene dada por un trozo de área del
círculo. Así, el círculo queda dividido en sectores cuya amplitud es
proporcional a las frecuencias de los valores. Sirve para representar cualquier
tipo de variable.
No hay comentarios:
Publicar un comentario