Wednesday, September 10, 2008

Problemas y ejercicios:

Supongamos que el siguiente conjunto de datos en una muestra aletoria de 40 calificaciones de autoconcepto.

100

112

88

105

100

102

98

113

102

87

93

93

117

100

98

92

100

117

97

100

83

67

76

100

106

117

89

83

100

109

109

93

105

108

104

63

81

109

100

98

a) Determine Xmax y Xmin y el rango.

Xmax= 117, Xmin= 63, rango= 54.

b) ¿Cuantos intervalos sugeriría para mostrar la distribución?

Cerca de 10 intervalos a menos que n sea muy grande.

c) Determine el ancho del intervalo, w, para permitir 10 intervalos.

w=rango/10 = 54/10= 5.4, redondeado a 5.

d) Si w=5 ¿cual es el primer intervalo (valores mas bajos)?

El menor múltiplo de 5 que es menor que 63 es 60:60-64

e) Si w= 5, liste los intervalos.

f) Construya una distribución de frecuencias agrupadas para los 40 valores. (Utilice el método de conteo con estacas).

g) Construya columnas de porcentaje y porcentaje acumulado para esos datos.

intervalo

conteo

ƒ

%

% acumulado

60-64

I

1

2.5

2.5

65-69

I

1

2.5

5,0

70-74

0

0,0

5,0

75-79

I

1

2.5

7.5

80-84

I I I

3

7.5

15,0

85-89

I I I

3

7.5

22.5

90-94

I I I I

4

10,0

32.5

95-99

I I I I

4

10,0

42.5

100-104

I I I I I I I I I

11

27.5

70,0

105-109

I I I I I I

7

17.5

87.5

110-114

I I

2

5,0

92.5

115-119

I I I

3

7.5

100,0

n= 40

100,0

h) ¿Seria un polígono de frecuencias una grafica apropiada para estos datos? ¿Por qué?

Si los polinomios de frecuencia son excelentes para variables continuas.

i) Construya un polígono como el de la figura 2,.4 con estos datos

Frecuencia Vs Punto medio de intervalo

j) Construya una ojiva de esos datos

% acumulado vs limite superior

k) Estime P10 y P50 y P90 utilizando la ojiva.

P10=80; P50=100;P90=110

l) Construya una grafica horizontal de caja y patillas para esto datos. (nota: las graficas de caja pueden tener una orientación vertical u horizontal. para la orientación horizontal, las patillas se extiende a la izquierda y a la derecha de la caja).

https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEgZmWYEZoPh85w39aY4rtxK2PrpVMXwQs3nz4E7sEAdpwjYn1IH97WUs51rn3k-ZxyerQ68VtQFojc9m1am8dotTdVtKgL7k7Z02q8qfj6ZtQZD8m0h6AAp5iCnjF9bT9PIIwi39Pghsg0/s400/ScannedImage.jpg

m) Comente sobre la aparente simetría o asimetría de esos datos.

Parece que la distribución es asimétrica y sesgada a la izquierda.

n) ¿Como diferirá una ojiva de asimetría positive de la asimetría negativa?

La ojiva de una distribución asimétrica positiva se elevaría muy rápido de la línea base en el lado izquierdo de la ojiva debido al conjunto de valores en las regiones mas bajas. Por otro lado, la ojiva de una distribución asimétrica negativa no comenzara a elevarse rápidamente sino hasta que alcance los valores altos en el lado derecho de la figura.

o) ¿Puede suponer como podría aparecer la ojiva de una distribución rectangular?

Una línea recta inclinada hacia arriba desde el extremo inferior izquierdo hasta el extremo superior derecho.




2.- El siguiente conjunto de datos es de una muestra aleatoria de 50 casos de los datos del HSB. En este caso, los números representan la raza de los individuos, de donde 1 = hispano, 2= asiático, 3= negro, 4= blanco.

4

1

4

4

1

1

4

4

4

2

4

4

2

4

4

4

3

4

4

4

1

4

4

4

1

4

4

3

4

4

4

3

1

4

4

4

1

3

4

4

4

3

3

4

4

3

3

4

4

4

a) ¿Un polígono de frecuencias es apropiado para graficar esos datos? ¿Por que? No ya que esos datos son categóricos mas que cuantitativamente continuos.

b) ¿Es apropiada una grafica de barras para graficar esos datos? ¿Por que? Una excelente elección, ya que los datos no tienen un continuo fundamental.

c) Construya una distribución de frecuencias agrupadas para estos datos. (Utilice el método de Tukey).

d) Construya una columna de porcentajes para esos datos.

e) Construya un histograma de frecuencias para esos datos.

f) Etiquete el eje vertical de la figura en el e) para indicar frecuencia y porcentajes.

g) ¿Habría probablemente brechas entre las columnas del histograma? ¿Por qué? Si, ya que es congruente con los datos categóricos no clasificables.




Problemas y ejercicios

Los ejercicios del 1 al 10 están basados en los siguientes datos.

En un grupo de sexto grado con 36 estudiante, se administra una tecnica sociométrica de “adivina quien” para evaluar el grado de relaciones positivas entre ellos para cada estudiante. Los valores para los 36 estudiantes fueron:

22

3

12

2

0

7

1

9

1

28

5

2

2

2

33

4

8

13

2

3

1

28

10

14

22

1

4

15

1

52

5

8

3

11

17

1

1.- ¿Cual es el rango?

Rango = Xmax-Xmin = 52-0 = 52

2.- Construya una distribución de frecuencias no agrupada.

X

ƒ

X

ƒ

X

ƒ

X

ƒ

X

ƒ

X

X

ƒ

52

1

44

0

36

0

28

2

20

0

12

1

4

2

51

0

43

0

35

0

27

0

19

0

11

1

3

3

50

0

42

0

34

0

26

0

18

0

10

1

2

5

49

0

41

1

33

1

25

0

17

1

9

1

1

6

48

0

40

0

32

0

24

0

16

0

8

2

0

1

47

0

39

0

31

0

23

0

15

1

7

1

46

0

38

0

30

0

22

2

14

1

6

0

45

0

37

0

29

0

21

0

13

1

5

2

3.- Construya una distribución de frecuencias agrupada, w= 5.

Intervalo

ƒ

Intervalo

ƒ

Intervalo

ƒ

50-54

1

30-34

1

10.-14

5

45-40

0

25-29

2

5.-9

6

40-44

0

20-24

2

0-4

17

35-39

0

15-19

2

4.-Construya un histograma de esos datos y comente sobre la forma de la distribución.
La distribución es asimétrica y altamente sesgada positivamente

Frecuencia Vs punto medio


5.- Construya una ojiva.

6.- Estime Q1 y Q2.

Q1 = 2 o 3, Q3 = 13.5

7.- Calcule la media.

9.78

8.- Determine la mediana.

5

9.- Determine la moda.

1

10.-Comparte la distancia de Q1 a Q2 con la distancia de Q2 a Q3. El patrón sugiere asimetría.

Q3-Q2 es mayor que Q2-Q1. Positiva.

11.- Para una década reciente, el incremento en el ingreso medio en el sur fue 74 % para blanco y 113 % para no blancos. ¿Cuál es el incremento medio para ambos grupos combinados si de cada 100 trabajadores 82 fueron blancos?

12.-Suponga que siete amigos viven junto a una autopista y quieren juntarse en la casa de uno de ellos para comer tacos y discutir las medidas de tendencia central y sus tipos favoritos de graficas. Si sus casas a lo largo de la autopista están situadas de este a oeste en este orden: A, B, C, D, E, F Y G, ¿Dónde deberían reunirse para minimizar la suma de las distancias recorridas?
Md en el punto D. (La suma de las derivaciones absolutas es un mínimo alrededor de la mediana).


13.- Suponga que una distribución tiene una media de 70, una mediana de 65 y una moda 55. ¿En que dirección esta sesgada la distribución?
Esta sesgada a la derecha, es decir, positivamente.



14.- Si aplica prueba de Cl a una clase en dos ocasiones separadas, como regla general, comente sobre las diferencias relativas entre las dos medias, las dos medianas y las dos modas.
Se espera que las medias difieran menos y que las modas difieran más.


Las preguntas 15-16 corresponden a los datos presentados en la tabla 2.2.
15.- Mo=?
50


16.- Md=?
51

Tuesday, September 9, 2008

Distribuciones de frecuencias

Definición

La distribución de frecuencias es una lista de valores de datos (ya sea de manera individual o por grupos de intervalos), junto con sus frecuencias (o conteos) correspondientes.

Límites de clase inferiores.- Son las cifras más pequeñas que pueden pertenecer a las diferentes clases.

Límites de clase superiores.- Son las cifras más grandes que pueden pertenecer a las diferentes clases.

Frontera de clase.- Son las cifras utilizadas para separar las clases, aunque sin los espacios creados por los límites de clase. Se obtienen de la siguiente manera: se determina el tamaño del espacio entre el límite de clase superior de una clase y el límite de clase inferior de la siguiente. Se suma la mitad de esa cantidad a cada límite de clase superior, para obtener las fronteras de clase superiores; se resta la mitad de esa cantidad de cada límite de clase inferior, para obtener las fronteras de clase inferiores.

Tabla. Distribución de frecuencias de los niveles contaminantes de nicotina.

Nicotina

Frecuencia

0-99

11

100-199

12

200-299

14

300-399

1

400-499

2

Límites de clase inferiores:

0, 100, 200, 300, 400

Límites de clase superiores:

99, 199, 299, 399, 499

Fronteras de clase:

-0.5, 99.5; 99.5, 199.5; 199.5, 299.5; 299.5, 399.5; 399.5, 499.5

Marca de clase.- Son los puntos medio de las clases.

99.5, 199.5, 299.5, 399.5

Anchura de clase.- Es la diferencia entre 2 límites de clase inferiores consecutivos.

100

Visualización de los datos

Histograma

Entre los distintos tipos de gráficos que se presentan, éste es particularmente importante.

Es una gráfica de barras en donde la escala horizontal representa clases de valores de datos y la escala vertical representa frecuencia. Las alturas de las barras corresponden a los valores de frecuencias.

Distribución de frecuencias

Toma de datos datos

Los datos estadísticos generalmente son numéricos. Con ellos se realiza el estudio de situaciones variadas en los más diversos campos de la ciencia y la tecnología. Dicho estudio se refiere a situaciones en las cuales es indispensable obtener información confiable para tomar decisiones certeras; las cuales en gran medida se producen gracias a que los datos se organizan en tablas o gráficos.

Fuentes de datos estadísticos

Se clasifican en dos tipos:

Experimentales.- Provienen de experimentos planteados y quizás controlados en algunas de las variables por un investigador.

Por observación.- No proceden de experimentos, sino de fuentes no controlables.

Datos agrupados

Cuando se toman datos experimentales o por observación, éstos aparecen sin orden, por eso se les llama datos en bruto o crudas. Éstos datos se pueden agrupar, se pueden ordenar del mayor a menor o del menor al mayor. Esto al menos permite saber cual es el dato mayor, menor y cuales de éstos están en el centro. Si son pocos datos, si se repiten los datos, es decir, los más frecuentes.

Frecuencia. Es el número de veces que se repite un dato.



Estos datos también se pueden agrupar en tablas de frecuencia y frecuencias relativas. La agrupación de éstas tablas se hace mediante la distribución de los datos numéricos en clases, según se a su frecuencia.

Ejemplo. Los siguientes datos corresponden a las utilidades en pesos de una panificadora (La Conchita), durante cada uno de los últimos 24 meses. Se dan tal cual se recogieron, por eso aparecen en desorden. El dueño desea traspasar la panadería y requiere conocer ésos datos para tomar una decisión.

9803.7

13686.85

19272.21

18030.36

21169.32

15737.43

14528.9

14307.33

16400.36

16505.53

16946.47

16573.73

15179.04

7814.889

13859.12

14228.12

18623.63

16573.94

18702.29

20733.58

17558.97

17383.31

12109.07

17991.51


Cuál es la pregunta del dueño de la panificadora?
Cuáles son las utilidades generadas por la panadería en los últimos 24 meses?

Cuál es la población bajo estudio?
El dinero, las ganacias monetarias que ha reportado la panadería.

Cuál es la variable correspondiente?
Las utilidades generadas cada mes.

Ordena los datos anteriores en una tabla de menor a mayor.

7814.889

9803.7

12109.07

13686.85

13859.12

14228.12

14307.33

14528.9

15179.04

15737.43

16400.36

16505.53

16573.73

16573.94

16946.47

17383.31

17558.97

17991.51

18030.36

18623.63

18702.29

19272.21

20733.58

21169.32


Cuál es el mayor dato y cuál el menor?
El mayor es 21169.32 y el menor es 7814.889

Cuál es la diferencia entre el dato mayor y el menor?
13354.431

Cuáles son los dos valores en el centro de los datos?
16505.53 y 16573.73

Tuesday, September 2, 2008

2-sep-08

Distribución de frecuencias

Toma de datos: Los datos estadísticos generalmente son numéricos. Con ellos se realiza es estudio de situaciones variadas en los mas diversos campos de la ciencia y la tecnología. Dicho estudio se refiere a situaciones en las cuales es indispensable obtener información, confiable para tomar decisiones certeras; las cuales en gran medida se producen gracias a los datos, se organizan en tablas o graficas.

Fuentes de datos estadísticos:

  1. Experimentales: Provienen de de experimentos planeados y quizás controlados en alguna de las variables por un investigador.
  1. Por observación: No proceden de experimentos, sino de fuentes no controlables.

Datos agrupados:

Cuando se toman datos experimentales o por observación estos aparecen sin orden alguno, por eso se llaman datos en bruto o crudos. Estos datos se pueden agrupar, ordenar de menor a mayor o viceversa. Esto nos permite saber cual es el dato mayor y menor y cuales están en el centro, si son pocos datos, si se repiten los datos y los más frecuentes.

Frecuencia: Es el numero de veces que se repite un dato, estos datos se pueden agrupar en tablas de frecuencia.

Frecuencia relativa: La agrupación de estas tablas de hace mediante la distribución de los datos numéricos en clases, según sea su frecuencia.

Ejemplo:

Los siguientes datos corresponden unas utilidades en pasos de una panificadora (La conchita), durante cada uno de los 24 meses se dan tal cual se recogieron, por eso aparecen en desorden. El dueño desea traspasar la panadería y requiere conocer esos datos para tomar una decisión.

Tabla:

7814.889 13859.12 15179.04 16573.73 17558.97 18702.29
9839.7 14228.12 15737.43 16573.94 17991.51 19272.21
1209.07 14307.33 16400.36 16946.47 18030.36 20773.58
13686.86 14528.9 16505.53 1783.31 18623.63 21169.32

¿Cual es la pregunta del dueño de la panificadora?

Cuales son las utilidades durante los últimos 24 meses

¿Cual es la población bajo estudio?

Las utilidades durante los últimos 24 meses

¿Cual es la variante correspondiente?

Mensualmente

¿Cual es el mayor dato y el menor dato?

Menor: 7814.889 Mayor: 21169.32

¿Cual es la diferencia entre el dato mayor y el menor?

13354.931

¿Cuales son los dos valores en el centro de los datos?

16505.53

16573.73


Trabajo 2 30-ago-08

Del siguiente conjunto de datos, obtener Moda; mediana; media aritmética.

Tabla.

324 322.1 24.1 234
432 324 32.1 444.1
372.1 712.08 512 432.12
276.08 432 732 782.34
762.12 276.08 324 1024.1
423 423 712.1 732.32
373.1 701.1 632.44 423.4
324 432.1 837.32 932.5
272.1 324.08 632 632.43
722.08 232.1 844.42 324

Moda: 324

Mediana: 128.1

Media: 494.57

Promedio 1: 427.058

Promedio 2: 379.864

Promedio 3: 528.248

Promedio 4: 596.131