R nos da la posibilidad de hallar los datos resumen de una muestra o un grupo de datos de una manera muy sencilla por medio del comando summary(). Luego de ejecutar este comando obtenemos el mínimo, el 1er cuartil, mediana, media, el 3er cuartil y el máximo.
Summary(nombreVector). Comando Medidas resumen
Estos datos nos indican que:
La cantidad mínima de hijos por hogar es 1.
El 25% de las personas tiene 2 hijos.
La mitad de las personas encuestadas tienen entre 3 y 4 hijos.
El numero promedio de hijos por hogar es 3.
El 75% tiene 4 hijos.
La cantidad máxima de hijos hallada en la muestra equivale a 6 hijos.
3.1 Media o Promedio
Para determinar la media en R, debemos considerar el uso del comando mean() con el cual calculamos el valor medio para un grupo de datos.
Ejemplo:
Se realizo una encuesta en la Universidad Nacional a 10 estudiantes donde se indagaba acerca de su edad. Las edades obtenidas fueron:
25,26,27,28,29,26,25,24,26,30
Descripción
1. Creamos el vector edades junto con los datos obtenidos.
2. Utilizamos la función mean() asignándole como parámetro el vector edades.
3. Interpretamos el resultado. La edad media para el grupo de 10 estudiantes equivale a 27 años.
3.2 Mínimo y Máximo
Representan los valores máximo y mínimo del conjunto de datos, conoceremos entre que valores se encuentra acotada la población a analizar.
Haremos uso de las funciones min() y max() para hallar estos valores. Partiremos del ejemplo anterior edades.
Descripción
1. Recordemos que anteriormente habíamos creado un vector de edades y calculamos la edad promedio.
2. Ahora vamos a determinar el valor máximo y mínimo del vector edades.
3. Para hallar el valor mínimo basta con escribir en la consola de comandos la función min(), que en este caso es min(edades).
4. Nuestra ultima instrucción servirá para determinar el valor máximo, max(edades).
Del grupo de estudiantes pudimos conocer quien tenia menos años, 24 años.
El estudiante de mayor edad del grupo tiene 30 años.
3.3 Mediana
Básicamente, la mediana nos indicara cual es el 50% de los datos. En R utilizaremos la función median() para llevar a cabo esta tarea.
Descripción
1. Del vector edades calcularemos la mediana.
2. Llamaremos a la función median() y le pasaremos como parámetro edades.
Por lo tanto, vemos que el 50% de los estudiantes tiene 26 años.
3.4 Percentil
Otra de las prestaciones que tiene R es calcular los percentiles, podemos hallar el percentil 25, 75 y 50 los mas comunes
Este tipo de medida nos da un estimado de los datos por sectores, es decir, subdivide la población en partes iguales.
Descripción
1. La función quantile nos permite hallar porcentajes de forma individual o por grupos, como se puede observar la primera vez que hacemos uso de quantile recibe dos parametros, quantile(edades,0.25), el vector edades y el porcentaje que queremos conocer con respecto a los datos el 25%.
2. Luego aplicamos nuevamente el uso de la función quantile pero esta vez tenemos ideado calcular el 25% y 75%.
3. Debido a que la función intenta calcular dos porcentajes al mismo tiempo debemos seguir la siguiente notación:
Primero hacemos un llamado a la funcion quantile(), despues pasamos como parámetro el vector de edades y el arreglo de porcentajes a calcular.
Los resultados muestran que el 25% de los estudiantes tiene 25 años y el 75% tiene 28 años.
3.5 Rango
Da a conocer los valores extremos del conjunto de datos. El comando range() se encarga de esta operación.
Este comando agrupa el máximo y mínimo en uno solo, evitándonos cálculos extras e instrucciones.
El rango de edades esta entre 24 y 30 años.
3.6 Recorrido Intercuartilico
Repasemos que es el recorrido intercuartilico, no es mas que la diferencia entre el cuartil 3 y el cuartil 1. El comando IQR se utiliza para dicha función.
Repasemos que es el recorrido intercuartilico, no es mas que la diferencia entre el cuartil 3 y el cuartil 1. El comando IQR se utiliza para dicha función.
3.6 Varianza y Desviación Estándar
Son las medidas mas comunes de dispersión. En R podemos acceder a estas por medio de las funciones sd() y var() respectivamente.