miércoles, 23 de octubre de 2013

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS



MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS    

Recuerda que los datos se agrupan cuando estos corresponden a una Población muy grande. Se consideran Poblaciones grandes las que se describen en los siguientes casos

1.-Los artículos producidos en una empresa grande, como por ejemplo, los miles de tornillos producidos de 4 cm. de largo.
2.-Alguno de los componentes de una computadora, del cual se producen millones en un solo día.
3.-Cierto tipo de conector de plástico empleado en los transfusores de sangre, de los cuales se producen miles en un solo día.
4.-Alguna de las partes de la cubierta de algunas televisiones LED, de las que se hacen también cientos en un solo día.
5.-Los millones de tuercas que se generan, las que como todo articulo, debe cumplir con ciertas especificaciones establecidas en los estándares de calidad empleados por la empresa.
6.-Los datos derivados por las encuestas que se aplican durante el Censo Poblacional.

  En todos estos casos, es necesario extraer muestras representativas de tamaño moderado para efectuar el análisis de la Población. Los datos, que la mayoría de las veces corresponden a variables numéricas se agrupan y se ordenan en lo que ya conocemos como Tabla de Distribución de Frecuencia(TDF).

  Para estos datos ordenados, es necesario efectuar los cálculos de las diferentes Medidas de Tendencia Central con la finalidad de que a través de un análisis de sus valores, podamos llegar a  conocer el comportamiento de los mismos, así como también hacer diversas inferencias que serian valiosas para el proceso del cual procede la población referida.

  El calculo de de las Medidas de Tendencia Central para datos agrupados es ligeramente distinto a aquellas que corresponden a los datos individuales.
  No esta de mas indicar que los significados de estos parámetros estadísticos dados en secciones anteriores, no cambian.

MEDIA

  La formula para calcular la Media Aritmética(media muestral) es



MEDIANA
  Recuerde que para el calculo del valor de la Mediana es necesario primero calcular el valor de la Posicion. Este ultimo valor me indicara la clase o intervalo en el que se ubica la Mediana.

  La formula para la posición de la Mediana




en donde

MD=Mediana
LRIMD=Limite Real Inferior de la clase donde esta la Mediana
N=Numero total de datos
Facum-1=Frecuencia acumulada anterior a la clase donde esta           la mediana
AC=Ancho de Clase

MODA

  Para tomar los datos necesarios en la formula que se exhibe enseguida, se toma como referencia la clase que tenga el mayor valor de Frecuencia Absoluta.

  Para encontrar el valor de la Moda, se aplica la la formula:


    

en donde 

MO=Valor de la Moda
Fabs=frecuencia absoluta de la clase donde cae la Moda
Fabs-1=frecuencia absoluta de la clase anterior a donde cae              la Moda
Fabs+1=frecuencia absoluta de la clase posterior a la que                   contiene la Moda

EJERCICIOS RESUELTOS

Calcule la Media, la Mediana, la Moda, el Q2, D5 y el P50. para la Tabla de Frecuencias que se da


CALCULO DE LA MEDIA

  Note que para calcular la Media es necesario lograr los productos de cada una de las Marcas de Clase con las Frecuencias Absolutas(MCi*Fabs) de cada una de las clases  en la TDF.
  Para esto, es conveniente incluir una nueva columna en la TDF, en la que se incluyan estos productos. Aquí se muestra la Tabla



en la TDF se observa la suma de los productos de la Marca de Clase por la Frecuencia Absoluta(MC*Fabs=5093) y ademas la suma de las Frecuencias Absolutas(N=94). La 

La formula para calcular la Media es








CALCULO DE LA MEDIANA

  Para efecto de calcular la Mediana, teniendo los datos ya ordenados en la TDF, determinamos primero el valor de su Posición. A saber




  Para saber la ubicación de la Mediana en la TDF, el valor 47.5 obtenido, se busca en la columna de las Frecuencias Acumuladas, es necesario por ello, incluir en la Tabla de Frecuencias que estamos empleando esta columna. La TDF quedaría así




    En la columna de la Frecuencia acumulada tenemos un numero de datos que van de 0 a 2, en la primera clase. En la segunda clase tendremos una cantidad de datos que van de 3 a 3, en la tercera clase tendremos de 4 a 11, en la cuarta clase de 12 a 37, en la clase 5 tendremos de 38 a 58. En esta ultima clase esta contenido el 47,5 logrado en el calculo de la Posición de la Mediana.

  Otra forma de determinar la clase en la que esta incluido el 47.5, es buscando el valor próximo superior a esta cantidad en la columna de las Frecuencias acumuladas. Note que el valor mayor a 47.5 es el numero 58. Este ultimo valor corresponde a la clase 5.

  Entonces, para calcular el valor de la Mediana, tomaremos como referencia la clase 5, para sustituir los datos que indica su respectiva formula. 

DATOS

LRIMD=Limite Real Inferior de la Clase de la Mediana=49.5

      N=Suma de las Frecuencias Absolutas=94

Facum-1=Frecuencia Acumulada Anterior a la de la Clase de la             mediana=37
FabsMD=Frecuencia Absoluta de la Clase de la Mediana=21

    AC=Ancho de Clase=8

 Recuerde que el AC se calcula como la diferencia entre el Limite Superior y  Limite Inferior.



Enseguida se muestra el procedimiento

  La formula que da el valor de la Mediana es




  Una forma de verificar que el calculo lo hemos realizado debidamente, es comprobar que el valor obtenido para la Mediana, este dentro del intervalo de la clase 5, esto es, entre 49.5 y 57.5. Observamos que, efectivamente, 53.5 si pertenece a este intervalo.

CALCULO DE LA MODA

  Para calcular la Moda debemos saber que esta se ubica en la clase que contenga la mayor Frecuencia Absoluta.
 La clase 4 tiene una Frecuencia Absoluta de 26, la cual es la mayor. Esto indica que la Moda se encuentra en esta clase. Por ello, la clase 4 es la que tomaremos como referencia para escoger  los datos que requiere la formula que nos permitirá calcular su valor. Veamos la forma de realizar el calculo

DATOS

LRIMO=Limite Real Inferior que contiene la Moda=41.5

Fabsmo=Frecuencia Absoluta de la Clase Modal=26

Fabsmo - 1=Frecuencia Absoluta anterior a la de la Clase modal=8

Fabsmo + 1=Frecuencia Absoluta posterior a la de la Clase            Modal=21 

       AC=Ancho de Clase=8

         N=94

la formula que calcula el valor de la Moda es



Como en el caso de la Mediana, se debe comprobar que el valor de la Moda esta comprendido dentro del intervalo de la clase 4, en la cual se predijo su ubicación  El intervalo correspondiente a esta clase es 41.5 a 49.5. Notese que el valor 47.76 si es parte de este intervalo, lo cual da certidumbre de la precisión del calculo. 

CALCULAMOS EL CUARTIL 2(Q2).  

  Recuerde que, los Cuartiles, al igual que la Mediana y cualquier Cuantil, son Medidas de Posición, por lo tanto se debe calcular primero la Posición del Q2.

DATOS

N=94

se calcula la Posición del Q



este valor se busca en la columna de las Frecuencias Acumuladas y se observa que cae en la Clase 5, en donde esta el 58, sobre esta columna. Recuerde que la Clase 5 contiene la cantidad de números que van de 38 a 58.
  Esto indica que la Clase 5 es la referencia para tomar los datos que se sustituirán en la formula que permitirá calcular el Q2. 

DATOS

LRIQ2=Limite Real Inferior de la Clase del Q2=49.5

FacumQ2 -1=Frecuencia Acumulada Anterior a la de la Clase                     del Q2.=37

FabsQ2=Frecuencia Absoluta donde esta el Q2.=21

      AC=Ancho de Clase=8

         N=94

  La formula




Note que este ultimo valor es parte del intervalo de la Clase 5. Note también que el Valor del Cuartil dos es igual al Valor de la Mediana.

CALCULAMOS EL DECIL 5

 Se calcula primero la posición de este cuantil.



  
  Este valor cae en la Clase 5, en donde esta el 58 sobre la columna de la Frecuencia Acumulada. Al igual que en los casos anteriores, escogemos los datos tomando de referencia a esta Clase.

DATOS

LRID5=Limite Real Inferior de la Clase del D5=49.5

FacumD5 -1=Frecuencia Acumulada Anterior a la de la Clase                     del D5.=37

FabsD5=Frecuencia Absoluta donde esta el D5.=21

      AC=Ancho de Clase=8

         N=94

la formula del Decil 5 es




  Se observa que este valor es parte del intervalo de la Clase 5. 
  Note también que el D5 es igual a la Mediana e igual al Cuartil 2. Esto es porque todos ellos indican la misma posición en en cualquier base de datos. Las medidas de posición anteriores también son iguales a el Porcentil 50, ya que indica exactamente la misma posición que aquellas.
Esto significa que podemos predecir, sin necesidad de realizar ningún calculo, que el valor del P50=53.31.



EJERCICIOS PROPUESTOS

a)CALCULE LA MEDIA, MEDIANA, LA MODA, EL Q1, Q2, D2, P25, P50,Y P75. PARA ESTA TDF




b) CALCULE LA MEDIA MEDIANA, LA MODA, EL CUARTIL 3, EL D7, EL PORCENTIL 2 Y EL PORCENTIL 36 PARA ESTA TDF




martes, 22 de octubre de 2013

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS INDIVIDUALES

MEDIDAS DE TENDENCIA CENTRAL

  Una medida de Tendencia Central es útil para describir el comportamiento de un grupo de datos que se haya tomado de una Población como Muestra para analizarlo, ya que esta representa en algún sentido la base de datos. Estas también son conocidas como Medidas de Posición, ya que dividen la serie de valores en dos grupos en un punto especifico de la serie.

Cada una de las Medidas de Tendencia Central, cumplen con una característica peculiar relacionada con los datos de la Muestra que la hacen valiosa para deducir comportamientos o tendencias de este grupo de datos.
   Empleando  estas medidas de centralización, las conclusiones a las que se llega gracias al análisis estadístico de la Muestra,  son  validas para la Población, siempre y cuando esta se haya tomado  a través de una técnica de muestreo acertada para que se pueda afirmar categóricamente que dicha Muestra es representativa de la Población.

  Las Medidas de Tendencia Central mas conocidas son:
1) La Media
2) La Mediana
3) La Moda
4) Los Cuantiles(cuartiles, deciles y  porcentiles)
5) La Media Geométrica

  Estas medidas estadísticas se calculan de manera diferente si los datos son individuales o si estos se han agrupado en una Tabla de Distribución de Frecuencia(TDF). Por esta razón, estos parámetros estadísticos se verán para ambos casos.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS INDIVIDUALES.

MEDIA

  La Media se define como el promedio de una serie de valores, de los cuales, la mayoría se aproxima mas a esta medida, esto es, la mayor parte de los valores de la serie están mas cerca de esta medida estadística. Por otro lado, la Media divide la serie de datos en dos grupos, uno de ellos esta por debajo de su valor y el otro queda por arriba del mismo.

La formula para datos individuales es




  La media presenta ciertas propiedades interesantes y entender su significado permite resolver problemas practicos. Algunas de estas propiedades se aplicaran posteriormente, por lo pronto solo las enunciaremos.

PROPIEDADES

1) La Media Aritmética se afecta con la presencia de valores muy grandes o muy pequeños.

2) La suma de las diferencias de los valores de los cuales se origina la Media con respecto a esta, es igual a cero

3) La sumatoria de los cuadrados de las desviaciones o diferencias de cada valor con respecto a la media es un valor mínimo.


 MEDIANA

    La Mediana de una serie de datos individuales, ordenados de menor a mayor( o viceversa), se define como el valor que divide a todos los datos en dos partes iguales, el 50% de estos menores y el otro 50% mayores que el. La mediana entonces quedaría ubicada en el punto medio de la serie de valores ordenados. 

  Para determinar el valor de la mediana se siguen los pasos que se describen

1.-Se ordenan los datos en forma creciente o al revés.
2.-Se calcula su  posición con la formula


      


3.-El valor que se obtiene con la formula anterior corresponde a la posición en la que se lee la Mediana en la lista de datos, si el numero de datos es impar. En el caso en el que el numero de datos sea par, el valor de la Mediana se calculara como el promedio de los dos valores centrales.

MODA

  La Moda, para una serie de datos individuales, es aquella que se repite con mayor frecuencia.
  Una incertidumbre que es común al pensar cual parámetro estadístico emplear, entre la Media y la Mediana se disipa si tomamos en consideración lo siguiente:

1.- La media es mas representativa en el caso del empleo de datos numéricos que originen distribuciones simétricas.



  En este tipo de distribuciones, los valores de la media y la mediana son iguales y por ello ocupan el mismo lugar en la distribución de los datos.

2.-La mediana se emplea con mejor efectividad como medida de tendencia central, cuando los datos numéricos originan una distribución sesgada.



  Note que en esta gráfica el sesgo se da a la izquierda y en ella se observa que la mediana tiene un valor menor que el valor de la media. Cuando la distribución muestra un sesgo hacia la derecha, el valor de la media es menor que aquel que corresponde a la mediana.



EJERCICIOS RESUELTOS

  Determine la Media, Mediana y la Moda para la lista de calificaciones de 11 alumnos del Grupo 5ELM. Las calificaciones son 10, 10, 4, 0, 10, 9, 0, 10, 0, 10, 0, las cuales corresponden a los primeros alumnos en la lista de asistencia.

Calculamos la Media
  El numero de datos es 11, por lo tanto n=11, entonces la media es

MEDIA=5.73

Determinamos el valor de la Mediana.

  Para lograr el valor de la Mediana primero se calcula su posición, para lo cual, se ordenan los datos de menor a mayor. Los datos ordenados quedarían 0, 0, 0, 0, 9, 9, 10, 10, 10, 10, 10

  La posición de la Mediana

Esto significa que el Valor de la Mediana se encuentra en la sexta posición en los datos ordenados, 0, 0, 0, 0, 9, 9, 10, 10, 10, 10, 10. En la posición 6 de estos datos hay un valor de 9. Concluimos que el valor de la Mediana es igual a 9.

Determinamos el valor de la Moda

  Observe que el cero se repite 4 veces, el nueve 2 veces y el 10 se repite 5 veces. Entonces el valor de la Moda es 10, ya que es el numero que se repite mayor numero de veces.


  Calcule el valor de la Media, Mediana y Moda de la lista de datos 6, 2, 8, 5, 6, 3, 6, 10, 8, 5, 5, 15, 14 y 9.

Calculamos la MEDIA



Calculamos la MEDIANA

  Ordenamos los datos

2, 3, 5, 5, 5, 6, 6, 6, 8, 8, 9, 10, 14, 15

    Determinamos su Posición

  La posición 7.5 corresponde al punto medio entre la posición 7 y 8. Esto significa que tenemos que calcular el promedio entre los valores que corresponden a la posición 7 y 8. En la posición 7 esta el seis y en la posición 8 esta también un  seis. El promedio de ambos valores es 6, según el calculo



 por lo que el valor de la Mediana es 6.


  Calculamos la MODA  
  
  Se observa que el 5 se repite tres veces, el 6 también se repite tres veces, el 8 se repite solo dos veces. Como el 5 y el 6 se repiten el mismo numero de veces y son los que con mayor frecuencia se repiten, se puede decir que esta lista de datos tiene dos modas. La lista de datos es bimodal.

CUANTILES
  
  Los Cuantiles son empleados como medida de posición. Esto es, indican valores ubicados en diferentes posiciones en una lista de datos. Se manejan tres diferentes tipos de Cuantiles; Cuartiles, Deciles y Porcentiles.  
  
  Cuartiles. Se identifican con la letra Qn, y dividen la lista ordenada de datos en cuatro partes. 

 El Cuartil 1(Q1), indica el valor que esta ubicado a un cuarto(al 25%) de la totalidad de la lista de datos.

 El Cuartil 2(Q2), muestra el valor que esta justo a los dos cuartos, o a la mitad(al 50%), de la lista ordenada de datos.  
 El Cuartil 3(Q3), da el valor que se encuentra a las 3 cuartas partes(al 75%) de la lista ordenada de los datos. en cuestión.

  Para conocer el valor de los Cuartiles, al igual que en el caso de la Mediana, la cual también es una medida de posición, es necesario proceder como se describe;

1) Se ordenan los datos, preferentemente de menor a mayor.
2) Se calcula la Posición del Cuartil deseado.
3) Se lee el Valor del Cuartil en la lista ordenada de datos en la posición calculada en el paso 2.

  Las formulas para calcular la posición de los Cuartiles 1, 2 y 3 son




   EJERCICIOS

  Para la lista de datos 4, 6. 8, 9, 15, 20, 23, 30, 32, 40, determine los valores del Cuartil 1 y Cuartil 3.

  Como la lista de datos ya esta ordenada, nos ahorramos el trabajo del paso 1 y procedemos a calcular la posición de cada Cuantil pedido, que es lo que indica el paso 2.
  
En esta lista tenemos 10 datos, por lo tanto N=10. Procedemos a calcular la posición del Cuartil 1
  

  lo cual indica que el valor del Cuartil 1 esta en la posición 3 de la lista ordenada de los datos en este problema

Note que en la posición 1 esta el 4, en la posición 2 esta el 6, y por ultimo vemos el valor 8 en la posición 3. Esto indica que el Valor del Cuartil 1 es igual a 8.




  Ahora calculamos el Cuartil 3(Q3), determinando primero su posición. LA Posición del Q3 es




lo cual indica que el valor del Cuartil 3 esta exactamente en la posición 8 de la lista de los datos ordenados dada en el ejercicio. Este valor corresponde a 30, entonces el Q3 =30.

  Deciles. Los Deciles seccionan la lista ordenada de datos en 10 partes.
  
El Decil 1(D1) indica la el valor que esta a una décima del total de la lista de los datos ordenados, esto es, indica el valor que esta a un 10% de el total de esta lista.
El Decil 2(D2) apunta el valor que esta a dos décimas(al 20%) del total de la lista ordenada de datos.
.
.
.
El Decil 9(D9) muestra el valor que esta ubicado a 9 décimas(90%) de el total de la lista de datos ordenados.

Las formulas para calcular la posición de los Deciles son




EJERCICIOS
  Determine el tercer Decil(D3) de la lista anterior de datos.
  Calculamos la posición del D3 con la formula



  esto  indica que el valor del Decil 3 esta justo en medio de la posición 3 y 4. Observando la lista anterior, nos damos cuenta que los valores en estas posiciones son el 8 y el 9, respectivamente Podemos calcular el valor de Decil 3  empleando la formula siguiente



esta formula es empleada para los casos en que resulte cualquier posición entre dos valores, o sea, para el caso en que la posición calculada, contenga cualquier fraccion decimal. En los casos especiales en los que  la posición lograda, resulte como decimal el 0.5, se puede determinar el valor del Cuantil deseado, calculando el promedio de los dos valores que están en las posiciones 3 y 4, esto es


  Porcentiles(Pn). Esta medida de posición, divide la lista de datos ordenada en 100 partes.
  El Porcentil 1(P1) da el valor que se encuentra al 1% del inicio de la serie ordenada de datos.
  El Porcentil 2(P2), indica e valor que se encuentra al 2% del inicio de la serie ordenada de datos.
  El Porcentil 3(P3) indica el valor que esta al 3% de la serie ordenada de datos, y así sucesivamente,  de forma que el Porcentil 99(P99) nos da el valor que se encuentra al 99% de los datos ordenados.

  Las formulas para determinar la posición de los Porcentiles son

EJERCICIO
  Calcule el valor del Porcentil 3 y el  Porcentil 25 de la lista de datos  4, 6. 8, 9, 15, 20, 23, 30, 32, 40.

  Primero determinamos la posición del P1 empleando la formula


este valor indica que el valor del Porcentil 1 esta entre la Posición cero y la Posición 1 de la lista ordenada de datos. En la posición cero no hay ningún valor, esto significa que a esta posición le corresponde un cero. En la posición 1 se tiene un cuatro, por lo tanto el Valor del Porcentil 1 es



Calculamos ahora el Porcentil 25, empleando la formula


esto quiere decir que el valor del Porcentil 25 se encuentra en la posición 3 de la lista de datos dada, a saber,


P25 = 8
ya que en la posición tres de la lista indicada hay un 8.

EJERCICIOS PROPUESTOS

  Calcule la Media, Mediana y Moda para cada una de la lista de datos dada

1) 5, 8, 9, 0, 3, 5, 7, 2, 4
2) 5, 12, 18, 20, 6, 5, 18, 21, 7, 4
3) 20, 30, 12, 17, 16
4) 10, 21, 44, 20, 1000, 2, 8, 11
5) 2, 4, 7, 3, 8, 3, 5, 2 7, 120, 4, 3, 5, 25
6) Observe la influencia de los valores muy grandes en el valor de la Media en el inciso 4 y la influencia de los valores pequeños en el inciso 5. Explique.
6) El promedio de una serie de 10 valores es igual a 120, cual sera la suma de estos?
7) El promedio de las  calificaciones de 5 alumnos de Estadística es de 8.4. Si la calificación de Pedro es 10, la de Pepe es 8, la de Viridiana es 9, la de Casandra es 9.7. Ayuda a Casimiro a recordar su calificación.
8) Para la lista de datos 3, 6, 7, 10, 20, 26, 30, 35, 39, 41
calcule el Cuartil 2, Cuartil 3, Decil 4, Decil 5. Decil 7, Porcentil 25, Porcentil 50 y Porcentil 75.