Sunday, October 5, 2008

MEDIDAS DE DISPERSION

El rango semi-intercuartil o desviación cuartil de un conjunto de datos se determina mediante la siguiente expresión:

Rango percentilar
El rango percentilar 10-90 de un conjunto de datos se define
rango percentil 10-90=P90-P10

Desviación estándar
La desviación estándar de un conjunto de n de números x1, x2, ... xn se denota por S
donde x representa las desviaciones de cada uno de los números xj, respecto de la Xmedia. Por lo tanto S es la media cuadrática de las desviaciones en relación con la media o, como se le llama en forma común desviación de la media cuadrática.

Ejemplo.
Calcule el rango de los conjuntos, la desviación media
a) 12, 6, 7, 3, 15, 10, 18, 5
b) 9, 3, 8, 8, 9, 8, 9, 18

a) S=4.25
b) S=2.125

Tarea de desviacion estandar

Desviación estándar

Desviaciones estándar en una distribución normal.

La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.

Para abordar las cuestiones que comentábamos en el párrafo anterior, nos valemos de herramientas como la varianza y la desviación estándar. Ambas medidas están estrechamente relacionadas ya que definimos una a partir de la otra.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.

La varianza representa la media aritmética de las desviaciones con respecto a las media elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral.  \sqrt{{\sigma^2}} =\sqrt{{\frac{ \sum\limits_{i=1}^N \left( X_i - {\mu} \right) ^ 2 }{N}}}

El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.

Por la formulación de la varianza podemos pasar a obtener la desviación estándar, tomando la raíz cuadrada positiva de la varianza. Así, si efectuamos la raíz de la varianza muestral, obtenemos la desviación típica muestral; y si por el contrario, efectuamos la raíz sobre la varianza poblacional, obtendremos la desviación típica poblacional.


Cuartiles, Deciles y perceptiles

Encuentre:
a) Los cuartiles Q1, Q2, Q3
b) los deciles D1, D2, D3... D9 para los salarios de la empresa Pr.

Salarios No. de empleados
$250.00-$259.99 8
$260.00-$269.99 10
$270.00-$279.99 16
$280.00-$289.99 14
$290.00-$299.99 10
$300.00-$309.99 5
$310.00-$319.99 2
Total: 65
El primer cuartil Q1 es el salario obtenido contando N/4=65/4. De los casos empezando con la primera clase (inferior). Ya que la primera clase incluye 8 casos, debemos tomar 16.25-8=8.25 de los 10 casos de la segunda clase. Por el método de interpolación lineal se obtiene Q1= $259.99 + 8.25/8 ($10.00)= $268.25
El segundo cuartil Q2 se obtiene contando los primeros 2N/4 = N/2 = 65/2 = 32.5 casos. Dado que las dos primeras clases incluyen 18 casos, habra que tomar 32.5-18=14.5, entonces Q2=269.99+(14.5/16)*10 = $279.06
El tercer cuatil Q3 se obtiene contando los primeros 3N/4= 48.75 casos. Dado que las 3 primeras clases incluyen 34 casos habra que tomar 48.75-34=14.75, entonces Q3=279.99+(14.75/14)*10= $290.52

Por lo tanto 25% de los empleados reciben $268.25 pesos o menos, el 50% reciben $269.06 pesos o menos y 75% reciben $290.75 o menos.

REPASO DE LA UNIDAD I

Notación sumatoria

Media aritmética

Propiedades de la media aritmética

Mediana