lunes, 2 de marzo de 2009

UNIDAD I. Introducción

I N T R O D U C C I Ó N

La estadística es el conjunto de procedimientos y técnicas empleadas para recolectar, organizar y analizar datos, lo cual sirve de base para tomar decisiones en situaciones de incertidumbre. 

La estadística deductiva, a partir del conocimiento de la población trata de caracterizar cada muestra posible.

La estadística inductiva a partir del conocimiento derivado de una muestra pretende caracterizar a la población.

La estadística descriptiva recolecta datos, los organiza y analiza para elaborar conclusiones a partir de ellos. 

La estadística inferencial realiza predicciones (inferencias) utilizando métodos establecidos.

Para obtener datos estadísticos se realizan experimentos.

Un experimento es una situación que arroja datos estadísticos. Los resultados de un experimento se clasifican utilizando variables.

La variable cuantitativa tiene un origen medible en escala.

La variable cualitativa tiene su origen en las cualidades de un objeto o fenómeno.



MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central intentan en una sola cifra representar a todos los datos que les dieron origen.

Algunas de las más comunes son:

Media Arimética 

Para datos no agrupados


Para datos agrupados


Mediana:  Valor que se encuentra a la mitad de un arreglo de datos.

Moda: En un arreglo de datos el valor que más se repite.  Puede no existir o no ser única:
  • Arreglo amodal: Sin moda
  • Bimodal: 2 modas
  • Multimodal: Más de 2 modas.

Un estadístico se obtiene de cálculos realizados a datos tomados de una muestra.

Media muestral


Un parámetro se obtiene de cálculos realizados a datos tomados de toda la población.

Media Poblacional




MEDIDAS DE DISPERSIÓN

Las medidas de dispersión miden la representatividad de las medidas de tendencia central. Entre más pequeño sea el valor obtenido mayor será la representatividad y viceversa. 

Dos de las principales medidas de dispersión son la desviación estándar y la varianza:

Varianza

Varianza muestral para datos no agrupados



Varianza poblacional para datos no agrupados


Varianza para datos agrupados


Desviación estándar

Desviación estándar muestral para datos no agrupados


Desviación estándar poblacional para datos no agrupados


Desviación estándar para datos agrupados


DISTRIBUCIÓN DE FRECUENCIAS 

En el caso de que la cantidad de datos sea elevada se utiliza la distribución de frecuencias para facilitar su manejo. 

Primero se ordenan los datos, posteriormente se establecen las clases o intervalos de clase, los que tienen un límite inferior de clase (LIC) y un límite superior de clase (LSC).

Se escriben los intervalos en una columna y a su derecha el número de valores que entran en cada clase, a lo que se conoce como frecuencia (f)

La frecuencia acumulada (fa) indica cuantos casos hay por debajo o arriba de un determinado intervalo de clase.

La frecuencia relativa (fr) es la proporción de cada intervalo de clase en relación al total. 

La frecuencia acumulada relativa (far) indica la proporción de datos que se encuentra por arriba o abajo de cierto intervalo de clase. 

La marca de clase (X) es el punto medio de cada intervalo de clase.

Para determinar las medidas de tendencia central y de dispersión se utilizan fórmulas ya establecidas.


Media aritmética


Varianza 



Desviación estándar 

Un histograma es una representación gráfica de la distribución de frecuencias, formado por rectángulos, la base de estos corresponde a la amplitud del intervalo y la altura a la frecuencia de cada uno.


No hay comentarios:

Publicar un comentario