Busca monografías, tesis y trabajos de investigación

Buscar en Internet 

       Revistas   Cursos   Biografías

rss feeds RSS / /

Análisis de Datos

Resumen: Contraste de hipótesis. Inferencia. Media muestral. Muestras. Distribución Normal. Pruebas de Bondad del Ajuste. Frecuencia.

Publicación enviada por Ilustrados




 


INTRODUCCIÓN

INTRODUCCIÓN

La estadística es la disciplina que nos proporciona una metodología para recoger, organizar, resumir, analizar datos y hacer inferencias a partir de ellas.

Puede deducirse de la definición que hay dos ramas claramente diferenciadas dentro de la estadística: La Estadística Descriptiva y La Inferencia Estadística que es el punto a tratar en el presente trabajo.

La inferencia Estadística tiene como función inferir las características de un colectivo a partir de un subconjunto de éste.

Referente al contraste de hipótesis, sabemos que un problema es investigable cuando existen dos o más soluciones alternativas y tenemos dudas acerca de cual de ellas es la mejor. Esta situación permite formular una o más hipótesis de trabajo, ya que cada una de ellas destaca la conveniencia de una de las soluciones sobre las demás. Si nuestro propósito es comprobar una teoría ella misma será la hipótesis del trabajo, pero es importante destacar que al formular dicha o dichas hipótesis no significa que ya esté resuelto el problema, al contrario, que nuestra duda nos impulsa a comprobar la verdad o falsedad de cada una de ellas.

La decisión final partirá de las decisiones previas de aceptar o rechazar las hipótesis de trabajo.

CAPITULO I

Contraste de Hipótesis

Etapas Básicas en Pruebas de Hipótesis.

Al realizar pruebas de hipótesis, se parte de un valor supuesto (hipotético) en parámetro poblacional. Después de recolectar una muestra aleatoria, se compara la estadística muestral, así como la media (x), con el parámetro hipotético, se compara con una supuesta media poblacional (


). Después se acepta o se rechaza el valor hipotético, según proceda. Se rechaza el valor hipotético sólo si el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.

Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una diferencia de esa magnitud o mayor, pudiera ocurrir aleatoriamente con una probabilidad de 1.05 o menos.

Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la estadística muestral (el estimador no segado del parámetro que se prueba) o una versión transformada de esa estadística muestral. Por ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de esa distribución normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve como estadística de prueba.

Tabla 10.1. Consecuencias de las Decisiones en Pruebas de Hipótesis.

 

 

 

Decisiones Posibles

 

Situaciones Posibles

 

 

 

 

La hipótesis nula es verdadera

 

La hipótesis nula es falsa

 

Aceptar la Hipótesis Nula

 

Se acepta correctamente

 

Error tipo II

 

 

Rechazar la Hipótesis Nula

 

Error tipo I

 

Se rechaza correctamente

 

 

Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo especificado la hipótesis nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se produce a establecer el o los valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a realizar una prueba de uno o dos extremos.

Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un valor hipotético de la media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.

Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística muestral con el valor (o valores) críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de mercadotecnia utilizar.

Conceptos Básicos para el Procedimiento de Pruebas de Hipótesis.

Hipótesis Estadística:

Al intentar alcanzar una decisión, es útil hacer hipótesis (o conjeturas) sobre la población aplicada.

Tales hipótesis, que pueden ser o no ciertas, se llaman hipótesis estadísticas.

Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones.

Hipótesis Nula:

En muchos casos formulamos una hipótesis estadística con el único propósito de rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada, formulamos la hipótesis de que la moneda es buena ( o sea p = 0,5, donde p es la probabilidad de cara).

Analógicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hipótesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma población). Tales hipótesis se suelen llamar hipótesis nula y se denotan por Ho.

Hipótesis Alternativa.

Toda hipótesis que difiere de una dada se llamará una hipótesis alternativa. Por ejemplo: Si una hipótesis es p = 0,5, hipótesis alternativa podrían ser p = 0,7, p " 0,5 ó p > 0,5.

Una hipótesis alternativa a la hipótesis nula se denotará por H1.

Errores de tipo I y de tipo II.

Si rechazamos una hipótesis cuando debiera ser aceptada, diremos que se ha cometido un error de tipo I.

Por otra parte, si aceptamos una hipótesis que debiera ser rechazada, diremos que se cometió un error de tipo II.

En ambos casos, se ha producido un juicio erróneo.

Para que las reglas de decisión (o no contraste de hipótesis) sean buenas, deben diseñarse de modo que minimicen los errores de la decisión; y no es una cuestión sencilla, porque para cualquier tamaño de la muestra, un intento de disminuir un tipo de error suele ir acompañado de un crecimiento del otro tipo. En la practica, un tipo de error puede ser más grave que el otro, y debe alcanzarse un compromiso que disminuya el error más grave.

La única forma de disminuir ambos a la vez es aumentar el tamaño de la muestra que no siempre es posible.

Niveles de Significación.

Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuesto a correr el riesgo de cometerán error de tipo I, se llama nivel de significación.

Esta probabilidad, denota a menudo por


 se, suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra elección.

En la practica, es frecuente un nivel de significación de 0,05 ó 0,01, si bien se une otros valores. Si por ejemplo se escoge el nivel de significación 0,05 (ó 5%) al diseñar una regla de decisión, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la hipótesis cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis ha sido rechazada al nivel de significación 0,05, lo cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de ser falsa.

Prueba de Uno y Dos Extremos.

Cuando estudiamos ambos valores estadísticos es decir, ambos lados de la media lo llamamos prueba de uno y dos extremos o contraste de una y dos colas.

Con frecuencia no obstante, estaremos interesados tan sólo en valores extremos a un lado de la media (o sea, en uno de los extremos de la distribución), tal como sucede cuando se contrasta la hipótesis de que un proceso es mejor que otro (lo cual no es lo mismo que contrastar si un proceso es mejor o peor que el otro) tales contrastes se llaman unilaterales, o de un extremo. En tales situaciones, la región critica es una región situada a un lado de la distribución, con área igual al nivel de significación.

La siguiente tabla de valores críticos de “z” para contraste de unos o dos extremos en varios niveles de significación.

 

Nivel de significación


 

0.10

 

0.05

 

0.01

 

0.005

 

0.02

 

Valores críticos de “z” para Test Unilaterales

 

-1.28 o 1.28

 

-1.645 o 1.645

 

-2.33 o 2.33

 

-2.58 o 2.58

 

-2.88 o 2.88

 

Valores Críticos de “z” para Test Bilaterales

 

- 1.645 y 1.645

 

- 1.96 y 1.96

 

-2.58 y 2.58

 

-2.81 y 2.81

 

-3.08 y 3.08

Curva Característica Operativa y Curva de Potencia.

Hemos visto como limitar el error de tipo I eligiendo adecuadamente el nivel de significación.

Es posible evitar el riesgo de cometer error de tipo II simplemente no aceptado nunca hipótesis, pero en muchas aplicaciones prácticas esto es inviable.

En tales casos se suele recurrir a curvas de operación características o curvas de “OC”, que son gráficos que muestran las probabilidades de error de tipo II bajo diversas hipótesis.

Proporcionan indicadores de hasta que punto un test dado nos permitirá evitar un error de tipo II; es decir, nos indicará la potencia de un test a la hora de prevenir decisiones erróneas. Son útiles en el diseño de experimentos porque sugieren entre otras cosas al tamaño de muestra a manejar.

Grados de Libertad.

Para el cálculo de un estadístico, es necesario emplear tanto observaciones de muestra como propiedades de ciertos parámetros de la población. Si estos parámetros son desconocidos, hay que estimarlos a partir de la muestra el número de grados de libertad de un estadístico, generalmente denotado por “v” se define como el número “N” de observaciones independientes en la muestra (o sea, el tamaño de la muestra) menos el número K de parámetros de la población, que debe ser estimado a partir de observaciones muéstrales.

En símbolos, v = N - k.

Capitulo II

Contraste de hipótesis referentes a la diferencia entre:

 

Una media muestra y una media población; utilizando la distribución (z)

El uso de la distribución normal z se busca en las mismas condiciones que en el caso de una muestra excepto que ahora se tienen dos muestras independientes. La formula general para determinar el valor de z para probar la diferencia entre dos medidas, dependiendo de sí se conocen los valores  para las dos poblaciones



Valora este artículo 5   4   3   2   1

Comparte  Enviar a facebook Facebook   Enviar a menéame Menéame   Digg   Añadir a del.icio.us Delicious   Enviar a Technorati Technorati   Enviar a Twitter Twitter
Artículos Destacados