domingo, 26 de junio de 2011

organización de datos y distribución de frecuencias

1. Organización y Presentación de Datos

El proceso subsecuente a la recolección de datos se refiere a la organización de los mismos para realizar presentación que permitan realizar cierto nivel de análisis y de descripción del fenómeno en estudio.

1.1- Frecuencia y Distribución de frecuencias
Las técnicas más habituales para ordenar, clasificar y presentar datos son las distribuciones de frecuencias. Comenzaremos concretando el concepto de frecuencia.
Frecuencia hace alusión al número de veces que se da un fenómeno. En estadística, la frecuencia va referida al número de veces en que aparece un determinado valor para una variable. Comenzaremos diferenciando dos tipos de frecuencias:
 Frecuencia absoluta individual (fi) de un valor. Es el número de veces que aparece repetido dicho valor en un conjunto de n puntuaciones. La suma de las frecuencias fi para todos los valores coincide con el valor de n.
 Frecuencia relativa individual (pi) de un valor. Es el cociente entre la frecuencia absoluta individual y el tamaño de la muestra. Es decir, pi = fi/n. Lo más frecuente es utilizar este tipo de frecuencia en términos porcentuales, expresándola como Pi=(fi /n) x 100. En este caso, la suma de las Pi para todos los valores es 100.
A partir de las frecuencias alcanzadas por las distintas modalidades de una variable, puede organizarse una distribución de frecuencias.
Una distribución de frecuencias consiste en presentar ordenadamente todos los valores asumidos por la variable estudiada, situando a su derecha la frecuencia con que aparecen (al menos, su frecuencia absoluta).
En la distribución de frecuencias podrían aparecer además otro tipo de frecuencias. Vamos a considerar ahora las frecuencias acumuladas:
 Frecuencia absoluta acumulada (fa) de un valor. Es la suma de las frecuencias absolutas que corresponden a todos los valores iguales o menores que él. La frecuencia fa para el valor más alto de la variable coincide con n.
 Frecuencia relativa acumulada (pa) de un valor. Es la suma de las frecuencias relativas de los valores iguales o menores que él. Expresada en términos de porcentaje, aparece como Pa, y la Pa correspondiente al valor más alto resulta ser 100.



1.2- Distribución de frecuencias y frecuencias agrupadas

Una distribución de frecuencias agrupadas se origina cuando en lugar de modalidades consideramos clases. Suele recurrirse a ellas cuando se pretende simplificar la presentación de variables que poseen muchas modalidades posibles.
Un caso particular de agrupamientos se da en los valores correspondientes a variables continuas, medidas al menos en escala de intervalos. En esta situación, la clase de valores que adoptamos se denomina intervalo y comprende las modalidades de una variable contenidas entre los dos valores que delimitan el intervalo.
Conceptos relativos al agrupamiento en intervalos:
 Límites aparentes de un intervalo. Son los valores que delimitan el segmento de valores que constituyen un intervalo. Para cada intervalo existe un límite inferior y un límite superior.
 Límites reales de un intervalo. El límite real inferior de un intervalo es el valor que resulta de disminuir el valor del límite aparente inferior en media unidad de medida. El límite real superior de un intervalo resulta de incrementar el límite superior aparente en media unidad de medida.
 Amplitud de un intervalo. Es la distancia existente entre el límite real inferior y el límite real superior de un intervalo. También se podría definir como la diferencia entre los límites aparentes del intervalo incrementado en la unidad de medida.
 Punto medio de un intervalo. Es el valor que se obtiene como promedio de los dos límites del intervalo (real o aparente).



Observemos los siguientes ejemplos de distribución de frecuencias

1.- Hemos recogido los siguientes datos, correspondientes a las puntuaciones obtenidas por 25 alumnos en un test de inteligencia. Se organiza en una distribución de frecuencias sin agrupar en intervalos.
105, 99, 109, 100, 94, 100, 97, 120, 99, 107, 96, 107, 100, 109, 105, 97, 100, 105, 96, 99, 100, 97, 105, 107, 99.
Para realizar la distribución de frecuencias debemos, en primer lugar, ordenar los datos (de mayor a menor o de menor a mayor), representarlos en una tabla y realizar el recuento correspondiente a cada uno de los valores (las "marcas o palotes" facilitan dicha labor), tal y como se expresa en la tabla siguiente:

Clasificación del Puntaje obtenido por 25 alumnos como
resultado de un test de inteligencia

Puntuaciones Marcas Frecuencias absoluta
94 / 1
96 // 2
97 /// 3
99 //// 4
100 ///// 5
105 //// 4
107 /// 3
109 // 2
120 / 1
TOTAL 25
Fuente: resultado de la evaluación a estudiantes de nuevo ingreso. Departamento de Orientación. Universidad Central del Este ,D. N. 2010



2.- Construir la distribución de frecuencias absolutas y relativas, tanto individuales como acumuladas, para las siguientes puntuaciones. Agrupar los datos en intervalos de amplitud 5.
3, 6, 7, 9, 9, 12, 12, 13, 13, 14, 14, 15, 15, 16, 16, 20, 20, 20, 20, 20, 22, 23, 24, 24, 24, 25, 25, 28, 35, 37.
En primer lugar, calculamos la amplitud total para la serie de puntuaciones con las que vamos a trabajar.
A.T. = PMAYOR - PMENOR + 1 = 39 - 3 + 1 = 37
A continuación determinamos el número de intervalos necesarios. Teniendo en cuenta que la amplitud del intervalo sera igual a 5, de acuerdo con el enunciado del problema, el número de intervalos vendrá dado por la relación (cociente) entre la amplitud total y la de cada intervalo: 37/5 = 7.4.
Este valor nos indica que necesitamos un número superior a 7 intervalos para distribuir todas nuestras puntuaciones en intervalos de amplitud 5. El número de intervalos mínimo necesario sería 8. Una vez construidos los intervalos, determinamos la frecuencia absoluta individual (f) en cada uno de ellos, la proporción (p), el porcentaje (P) y los correspondientes valores acumulados para todos ellos (fa, pa y Pa).




Bibliografía:
http://maralboran.org/wikipedia/index.php/Gr%C3%A1ficos_estad%C3%ADsticos
http://apuntes.rincondelvago.com/organizacion-y-presentacion-de-datos-estadisticos.html
http://thales.cica.es/rd/Recursos/rd98/Matematicas/01/texto2.html

domingo, 12 de junio de 2011

Origen de la Estadistica

Hola, luego de expresar comentarios sobre la reflexion, les dejo un video sobre el origen de la estadistica.

sábado, 4 de junio de 2011

Ambientacion estadistica

Reflexionemos según su área y coloquemos los comentarios aquí
Como tomar una decisión lo más acertada posible?
Porque las personas involucrada en sectores políticos, salud, agrícola, pecuaria, veterinaria, sociales y económicos en nuestro país precisan de los datos? Son bien considerados?
 Que implicación tiene planificar y ejecutar sin datos o con estos de mala calidad y creados a partir de un criterio no ético y segados?

 Se levantan y se registran o almacenan de la mejor manera, y se procesan?
 Porque los abogados acuden a estos para sus evidencias?

 En la educación porque los docentes, planificadores, y coordinadores de estrategias pedagógicas deben orientarse con datos organizados y bien presentados?


 Mas en el área de la salud: los investigadores, por no decir ninguna, mencionemos el área farmacéutica y calidad de diagnósticos y las pruebas en general que nos conducen a llevar un tratamiento o seguimiento a un paciente clínico o implementar políticas de salud pública, ambos procurando brindar soluciones y atender con eficiencia a las personas.

 En la producción distintos rubros, como diferenciar los tratamientos, con que garantía aseguramos y aplicamos el de mayor rendimiento? Como verificar la inocuidad de los productos? Será pertinente además del registro de los datos, aplicar un muestreo.


 Exportar y consumir localmente sin riesgos de contaminantes?