· Prueba de la hipótesis nula utilizando t-test e intervalos de
confianza.
· Evaluación del Power de la prueba de hipótesis utilizando el análisis
del Power.
Prueba de Hipótesis
Ejemplo 1 Llenado Cajas de cereal
El propósito de este ejemplo es de introducir los conceptos de la prueba
de hipótesis. Tu usaras un one-sample t-test para analizar datos
procesados para determinar sí el proceso esta en el objetivo.
Problema
El objetivo. Tu quieres determinar sí el proceso esta en el objetivo
Recolección de datos
Para evaluar el proceso de la media. Elegirás 6 cajas de cereal al
azar, las pesaras, y usaras los datos de ejemplo para estimar la media
de la población.
Herramientas
Stat> Estadísticas básicas>1-Sample t
Data set
CEREALBX.MPJ
Nombre Tipo de dato Tipo de variable
BoxWeigh Numérico Respuesta
One-Sample T
N Mean StDev SE Mean 95% CI
6 0.365000 0.050000 0.020412 (0.312528, 0.417472)
Prueba de hipótesis
¿Qué es una prueba de hipótesis?
Una prueba de hipótesis usa datos de ejemplo para probar una hipótesis
acerca de la población de cual el ejemplo es tomado. El one-sample
t-test es uno de los muchos procedimientos disponibles para la prueba de
una hipótesis en MINITAB.
Por ejemplo, suponga que quiere probar la medida de las ruedas del
pistón es igual a la longitud deseada del objetivo. Usted medirá un
numero de ruedas y usara la medida de esas ruedas de ejemplo para
estimar la medida de la rueda de la población. Este es un ejemplo de
stastistical inference, usando información acerca de un ejemplo para
hacer una inferencia acerca de una población.
¿Cuándo usar una prueba de hipótesis?
Usa una prueba de hipótesis cuando tengas datos de ejemplo y quieras
hacer inferencias acerca de una o más poblaciones.
¿Por qué usar una prueba de hipótesis?
La prueba de hipótesis puede ayudar a contestar preguntas como:
¿Esta el proceso correctamente centrado?
¿Es el producto de un proveedor mejor que el producto de otro?
¿Hay diferencias entre el tratamiento de los grupos y los experimentos?
Por ejemplo,
¿ Es tu surtido de tu papel en media de 8.5 pulgadas de ancho?
¿La gasolina del proveedor es de mejor octanaje que la del proveedor B?
¿El cliente prefiere una formulación de una bebida sobre otra?
Probando la hipótesis nula
Necesitas determinar si la media de un proceso de empaque difiere
significativamente del peso correcto que es 365 gramos. En Términos
estadísticos, el proceso de la media es también llamado la población de
la media.
Hipótesis de estadística
Hay 2 posibilidades, µ es igual a 365 o no lo es. Estas alternativas
pueden ser usadas como 2 hipótesis:
La hipótesis nula (H0): µ es igual a .365 gramos
La hipótesis alternativa(H1): µ no es igual a 35 gramos
Por que no puedes medir cada caja en la población, nunca podrás saber
con exactitud cual hipótesis es correcta. Sin embargo una prueba de
hipótesis apropiada pueda ayudarte a hacer un cálculo formal. Para estos
datos la prueba apropiada es la one-sample t-test
1- Sample t
1.- Abre el proyecto CEREALBX.MPJ.
2.- Escoge STAT > Basic Statistics > 1-Sample t.
3.- Complete el recuadro como se indica a continuación:
4.- Click OK.
Interpretando tus resultados
La lógica de la prueba de hipótesis
Todas las pruebas de hipótesis siguen los mismos pasos:
Asumir que H0 es verdadera.
Determinar que tan diferente es tu muestra de lo que esperas dado que
H0 es verdad.
Si tu muestra es diferente dado que H0 es verdad, entonces descarta H0.
Por ejemplo, los resultados de t-test indican que la muestra es 366.704.
De esta manera el examen contestara la pregunta, “Si µ es igual a 365,
como obtendrás una muestra de 366.704(o mayor). La respuesta es dada
como una probabilidad que vale (P), que para esta prueba es igual a
0.143.
Tomando una decisión
Para tomar una decisión, necesitas Escoger el nivel de importancia, α
(alpha), antes de la prueba:
Si P es menor o igual a α, rechazas H0 .
Si P es mayor que α, si fallas al rechazar H0 (Técnicamente, nunca
aceptas H0 , simplemente fallas al rechazarlo).
Un valor típico para α es 0.05, pero valores mayores o menores puedes
ser escogidos dependiendo de la exactitud requerida para la prueba.
Asumiendo que escojas un α-Nivel de 0.05 para los datos del peso de la
caja no tendrás suficiente evidencia para rechazar H0. P(0.143) es mayor
que α.
One-Sample T: Boxweigh
Test of mu = 365 vs not = 365
Variable N Mean StDev SE Mean 95% CI T P
BoxWeigh 6 366.704 2.403 0.981 (364.183, 369.226) 1.74 0.143
Consideraciones finales
Conclusiones prácticas
Basado en tus datos de muestra, no puedes rechazar la hipótesis nula al
0.05 nivel α. No hay suficiente evidencia para sugerir que los pesos
completos son diferentes a .365 gramos.
Consideraciones de estadística
Cuando es conducida una prueba de hipótesis, siempre empiezas con dos
hipótesis contrarias:
La hipótesis nula(H0):
· Normalmente dice que si una propiedad de una población (tal como la
media) no es diferente de un valor especifico o de otra población.
· Es asumido que es verdad hasta que tengas suficiente evidencia de lo
contrario.
· Nunca es aceptado--- simplemente fallas al rechazarlo.
La hipótesis alternativa(H1):
· Dice que la hipótesis nula esta equivocada.
· También especifica la dirección de la diferencia.
· Cada prueba de hipótesis esta basada en una o más suposiciones acerca
de los datos que están analizando. Si esas suposiciones no son
conocidas, los resultados puede que no sean precisos. Las suposiciones
de cada prueba serán exploradas cuando cada prueba sea discutida.
El Power de una prueba de estadística es la probabilidad de rechazar
correctamente la hipótesis nula. La tabla de abajo muestra los 4
posibles resultados de la prueba de hipótesis.
Hipótesis nula
Decisión Verdadero Falso
Falla al rechazar
Rechazar
El nivel α debe ser escogido antes de conducir la prueba:
· Incrementando α incrementas tus posibilidades de detectar una
diferencia (y tu Power) pero también incrementas la posibilidad de
rechazar H0 cuando es verdad (error tipo I).
· Disminuyendo α disminuyes tus posibilidades de cometer el error tipo
I, pero también disminuyes el poder de la prueba.
Intervalos de confianza
Ejemplo 2 peso de la caja de cereal
Problema
Recuerde que esta tratando de confirmar que el embalaje del cereal esté
en un objetivo. El objetivo del peso es de 365 gramos y necesitas
asegurarte que el proceso de la media esté dentro de 2.5 gramos que es
el objetivo.
Recolección de datos
Seis cajas de cereal fueron elegidas al azar y pesadas.
Herramientas
Stat > Basic statistics > 1-sample t
Set de Datos
CEREALBX.MPJ
Nombre Tipo de dato Tipo de variable
BoxWeigh Numérico Respuesta
Intervalos de confianza
¿Que es un intervalo de confianza?
Un intervalo de confianza es un rango de posibles valores para un
perímetro de una población (tal como µ) que esta basada en un dato de
muestra. Por ejemplo, muy seguido usaras una muestra para calcular µ. Un
intervalo confidencial te dirá que tan lejos esperes ese cálculo.
¿Cuándo usar el intervalo de confianza?
Usa un intervalo de confianza para hacer inferencias de una o más
poblaciones de muestra de datos.
¿Por que usar intervalos de confianza?
Los intervalos de confianza te pueden ayudar a contestar muchas de las
mismas preguntas de la prueba de hipótesis:
· ¿Que tan grande podría ser µ?
· ¿Qué tan grande podría ser la desviación estándar de la población?
· ¿Podría µ ser un valor cierto?
Por ejemplo,
· Es posible que la longitud de la media de los lápices sea mayor a 5.75
pulgadas?
· Podría σ para la longitud de los lápices ser tan alto como 0.25
pulgadas?
Usando el intervalo de confianza
En el ejemplo anterior, usamos una prueba de hipótesis para determinar
si la media de tu proceso fuera diferente al valor del objetivo. También
puedes usar un intervalo de confianza para evaluar ésta diferencia.
Esta Sesión window resulta para 1-sample t incluye valores para los
fines mayor y menores del 95% del intervalo de confianza. Obtiene una
grafica representativa del intervalo al seleccionar Boxplot en Graphs
subdialog box.
1-Sample t
1.- Escoge Stat > Basic Statistics > 1-Sample t, or press Ctrl + E.
2.- Click Graphs
3.- Completa el recuadro como se indica a continuación:
4.- Clik OK en cada recuadro.
Interpretando tus resultados
Intervalo de confianza
El intervalo de confianza es un rango de posibles valores para µ.
Esta mostrado gráficamente como una línea roja y dos escuadras cuadradas
debajo del boxplot.
Es un intervalo de confianza de 95% por que tomamos 100 muestras de la
misma población, los intervalos de 95 de las muestras incluirá a µ. Por
lo tanto para cualquier ejemplo que pueda ser 95% seguro que la µ está
dentro del intervalo de confianza.
Prueba de hipótesis
El punto rojo de la X representa la media de la muestra y el punto
azul de H0 representa la prueba de la media (365). Puedes usar el
intervalo de confianza para probar la hipótesis nula:
· Si H0 está fuera del intervalo, la p-value para la prueba de hipótesis
también será menor que 0.05. Puedes rechazar la hipótesis nula en
α–level 0.05.
· Si H0 esta adentro del intervalo, la p-value será mayor que 0.05. No
podrás rechazar la hipótesis nula en α-level 0.05.
Por que H0 cae adentro del intervalo de confianza no puedes rechazar la
hipótesis nula. No hay suficiente evidencia para concluir que µ no es
365 gramos, en el 0.05 nivel significante.
Consideraciones finales
Conclusiones prácticas
El intervalo de confianza de 95% (como el t-test) no provee suficiente
evidencia para rechazar la hipótesis nula que la población de la media
para el peso de las cajas de cereal sea de 365 gramos.
Consideraciones de Estadística
El intervalo de confianza provee un posible rango para valores de µ(u
otros parámetros de población).
En muchos casos, no puedes conducir un prueba de hipótesis usando un
intervalo de confianza. Por ejemplo, si el valor de la prueba no es
entre un 95% de un intervalo de confianza, puedes rechazar H0 en el
nivel α 0.05. Sin embargo si tu estructuras un 99% de intervalo de
confianza y no tiene una prueba de la media, puedes rechazar H0 en el
nivel α 0.01.
Intervalos de confianza
Ejemplo 3 Entendiendo los intervalos de confianza
Problema
Este ejemplo Explora el concepto de las intervalos de confianza.
Simularas la recolección de muestras al azar para una población normal
usando MINITAB’s generador de números al azar.
Recolección de Datos
Tu debes generar 10 columnas de datos al azar
Herramientas
Calc > Random data > Normal.
Stat > basic Statistics > Display Descriptive Statistics.
Data set
None
Generando datos normales al azar
Usando un generado de datos al azar, puedes simular la recolección de
datos al azar de una población con una media dada. (Esto es una
situación en la cual de hecho puedes saber el valor de µ.)
Usando el generador de datos al azar para simular la colección de 10
muestras de una población con una media(µ) de 10 y de una desviación
estándar de 1. Se generan 20 observaciones para cada muestra.
Normal
1. - Escoge File > New
2. - Selecciona MINITAB Project.
3. - Click OK.
4. - Escoge Calc > Random Data > Normal.
5.- Completa el recuadro como se indica a continuación:
6.- Click OK en cada recuadro.
Calculando intervalos de Confianza del 90%
Usa Display Descriptive Statistics para calcular intervalos de confianza
del 90% para cada muestra. Por definición, 9 de cada 10 intervalos deben
contiener la µ. Desde que sabes que la µ representa muestras que son
iguales a 10, puedes verificar esto directamente.
En contraste a los intervalos de confianza del 95%, los de 90% son más
angostos( esto es que incluyen menos valores). Porque estos contiene
menos valores, es menos probable que contengan la µ.
Para probar la hipótesis nula que la µ no es igual a un valor dado, un
intervalo de confianza de 90% corresponde a un .10. nivel de α.
Display Descriptive Statistics
1.- Escoge Stat > Basic Statistics > Graphical Summary.
2.- En Variables, enter C1-C10.
3.- Completa el Confidence level como se muestra :
4.- Clik Ok.
Interpretando tus resultados
90% de Intervalo de confianza para Mu (µ)
Toma un momento para repasar los intervalos de confianza para cada
uno de tus muestras, Las opciones seria que uno de tus intervalos no va
a contener µ(10).
Es posible que todos tus intervalos contengan µ. También es posible que
ninguno lo tenga (aunque es extremadamente inusual). Sin embargo, si
repites el ejercicio de la generación de muestras al azar y calculando
el intervalo de confianza del 90%, encontraras ese aproximado 90% de los
intervalos que contiene µ.
Resultados hipotéticos
Un ejemplo de un intervalo de confianza de 90% que no contenga µ es
proveído por derecho. El intervalo se extiende de 10.0275 a 10.7894.
Date cuenta que este ejemplo en particular te llevará a un rechazo
incorrecto de la hipótesis nula que µ es igual a 10 (asumiendo que
escojas el nivel α de 0.10).
Intervalo de confianza de 90% para sigma
Date cuanta que la suma gráfica también incluye a un intervalo de
confianza de 90% para σ (la desviación estándar de la población). El
intervalo tiene en rango de 0.7882 a 1.3501. Si repites este
procedimiento para un numero largo de muestras, cerca de 9 de 10
intervalos incluirá el valor para σ.
Estadísticas Descriptivas
Consideraciones finales
Conclusiones prácticas
Es probable que 1 de 10 intervalos de confianza de 90% que calcules no
contengan µ. Si este procedimiento fuera repetido para un número largo
de muestras, cada 10% de todos los intervalos confidenciales de 90% no
tendrán µ.
Consideraciones de estadística
Este intervalo de confianza provee un rango de valores para µ(ó los
parámetros de la población).
En promedio, el 90% de los intervalos de confianza de 90% calculados
para muestras al azar tomado de una distribución normal de poblaciones
incluirá a µ.
Power
Ejemplo 4 Evaluando el Power
Ejercicio
No estas seguro que confías en el resultado del análisis del llenado del
peso (página 1-6). Vas a conducir el análisis del Power para determinar
si recolectaste suficientes datos.
Quieres asegurarte que el llenado de las cajas no difiera del
objetivo del peso de 365 gramos no más de 2.5 gramos.
Recolección de datos
Vas a basar el análisis del Power en los resultados del t-test del
ejemplo 1.
Herramientas
Stat> Power and Sample Size> 1-Sample t
Data set
Ninguno
Análisis del Power
¿Que es un análisis del Power?
Power es la habilidad de una prueba para detectar un efecto cuando
existe. Cuando conduces una prueba de hipótesis, hay 4 posibles
resultados:
Hipótesis nula
Decisión Verdadero Falso
Falla al rechazar
Rechazar
El Power de la prueba es la probabilidad que rechazara la hipótesis nula
correctamente, dado que la hipótesis nula es falsa. Puedes usar un
análisis Power para determinar cuanto poder tiene esta prueba, o ayudar
a designar una nueva prueba para que tenga el poder adecuado.
Cuando usar un análisis del Power
Usa un análisis del Power cuando estas diseñando un experimento o
después de conducir una hipótesis nula. No se requieren datos.
Necesitaras estimar σ (excepto por las pruebas de proporción).
¿Por qué usar un análisis del Power?
El análisis del Power te puede ayudar a responder preguntas como:
· ¿Es tu muestra lo suficiente grande?
· ¿Qué diferencia puedes detectar con tu prueba?
· ¿Deberías confiar en los resultados insignificantes de la prueba ?
Por ejemplo,
· ¿Cuántas muestras necesitas recolectar para determinar si el papel de
proveedor es más delgado que el de otro por 0.0015 pulgadas?
· ¿Qué tan grande es la diferencia que puedes detectar entre la
resistencia de una viga de acero y un historial de la media si reúnes 8
muestras?
· ¿Puedes confiar en los resultados de una prueba t-test que indica la
resistencia de 2 fórmulas de pegamento que no tienen diferencia?
Determinando el Power
Tu meta es determinar que tan ciertos son los resultados del análisis
del llenado de las cajas de cereal (pagina1-6)
Valores
Si especificas valores para cualquiera de los 2 parámetros de la prueba, MINITAB calculará el parámetro restante:
· Sample size----- el número de observaciones en la muestra
· Differences----- un significado cambio en el alejamiento del objetivo
que estas interesado en detectar con alta probabilidad.
· Power values----- el poder (probabilidad de rechazar H0 cuando es
falso) que te gustaría que tuviera la prueba.
Sigma
Porque el poder de una prueba es parcialmente determinada por la
variabilidad en los datos, debes proveer un estimado para σ . Usa un
estimado del historial o la desviación estándar de la muestra.
1- Sample t
1.- Escoge Stat > Power and Sample Size > 1-Sample t.
2.- Completa el recuadro como se indica a continuación:
3.- Click OK.
Interpretando tus resultados
Con 6 observaciones, una desviación estándar de 2.043 y un α de 0.05, el
Power solo es de .5376. Esto significa que µ esta fuera del objetivo por
2.5 gramos, solo tienes un 53.76% de oportunidad para detectarlo.
De otra manera, hay un 46.24% de probabilidad que falles al rechazar H0
e incorrectamente concluye que el proceso está en el objetivo.
¿Qué sigue?
De manera que incrementes tu probabilidad de detectar un cambio si
existe, es incrementar el tamaño de la muestra. Determinar él numero de
observaciones requeridas para lograr el Power adecuado.
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403
Sample
Difference Size Power
2.5 6 0.537662
Determinando el Power
Con 6 observaciones el Power de tu prueba fue solo de 0.5376. Para tener
mejores posibilidades de detectar un efecto si es que existe, deberás
incrementar el poder de tu prueba, que por lo menos sea de 0.80 (como
regla general).
Calcular el tamaño de la muestra requerida para llegar los niveles de
Power de 0.80, 0.85, 0.95, y 0.95.
1-Sample t
1.- Escoge Stat > Power and Sample Size > 1-Sample t.
2.- Completa el recuadro como se indica a continuación:
3.- Clic OK.
Interpretando tus resultados
Para tener un Power de al menos 0.80 (objetivo del Power) para detectar
una diferencia de 2.5 gramos al nivel α de 0.05, necesitaras una muestra
de tamaño 10.
Porque el tamaño de las muestras debe ser siempre un numero entero.
El Power actual de la prueba con 10 observaciones (0.8327) es
escasamente mayor que el objetivo Power.
Observaciones adicionales que dan mas Power:
· Con 11 observaciones, el Power es de 0.8739.
· Con 12 observaciones, el Power es de 0.9058.
· Con 15 observaciones, el Power es de 0.9625.
Al duplicar el tamaño de la muestra de 6 a 12 cajas, incrementas tus
posibilidades de detectar una diferencia de 2.5 gramos (sí es que
existe) de 53.76% a 90.58%.
Tal ves no quieran incrementar tu Power demasiado. Si tu Power es
demasiado alto, podrías empezar a detectar cambios que son demasiado
pequeños para ser parcialmente importantes.
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 2.403
Sample Target
Difference Size Power Actual Power
2.5 10 0.80 0.832695
2.5 11 0.85 0.873928
2.5 12 0.90 0.905836
2.5 15 0.95 0.962487
Power
Ejemplo 5 incrementando Power
Ejercicio
El resultado del análisis de tu Power sugiere que necesitas una muestra
más grande para evaluar tu proceso. Con solo 6 observaciones, había muy
poco Power para detectar un diferencia de 2.5 gramos
Recolección de datos
12 cajas de cereal son recolectadas al azar y pesadas
Herramientas
Stat> Basic statistic> 1-sample t
Data set
CEREALBX.MPJ
Nombre Tipo de dato Tipo de variable
BoxWeigh Numérico Respuesta
Probando la hipótesis nula
Analiza la nueva muestra para determinar si el proceso de la media es
diferente a 365 gramos.
1-Sample t
1.- Abre el proyecto CEREALBX.MPJ.
2.- Escoge Stat> Basic Statistics> 1-Sample t
3.- Completa el recuadro como se indica a continuación:
4.- Haz clic en Graphs.
5.- Checa Boxplot of data.
6.- Click OK en cada recuadro.
Interpretando tus resultados
El t-test indica que la diferencia entre el proceso de la media y el
objetivo de 365 gramos es significante en el nivel α 0.05
· El p-value (0.019) es menos que α (0.05).
· El intervalo de confianza de 95% no incluye el valor del objetivo.
Aparece que las cajas de cereal están siendo sobre llenadas. Se deben
tomar acciones correctivas para ajustar el proceso.
One-Sample T: MoreObs
Test of mu = 365 vs not = 365
Variable N Mean StDev SE Mean 95% CI T P
MoreObs 12 366.636 2.060 0.595 (365.327, 367.945) 2.75 0.019
Interpretando tus resultados
El boxplot ilustra lo que encontró la prueba:
· El valor del objetivo(H0) esta afuera del intervalo de confianza.
· La muestra de la media (X) es mayor que el valor del objetivo.
Conclusión
La diferencia entre el proceso de la media y el valor del objetivo de
365 gramos es significante en el nivel α es de 0.05.
Consideraciones finales
Conclusiones prácticas
Es probable que tu primera prueba del llenado de las cajas de cereal no
sea significante porque tu Power era demasiado bajo. Basado en el numero
de observaciones (6), la diferencia que quieres detectar (2.5), y la
variabilidad en los datos, la prueba tuvo un Power de solo 0.5376.
Usando una muestra grande te da mas Power, habilitándote para detectar
la diferencia.
Consideraciones estadísticas
Para asegurar que tu prueba tenga suficiente Power, es una buena idea el
conducir un análisis power para recolectar datos.
Las maneras de incrementar el Power de una prueba incluye:
· Incrementar el tamaño de la muestra.
· Disminuir la variabilidad que no esta atribuida al efecto de interés.
· Incrementar α (aunque esto también te llevara a incrementar un error
del tipo I).
Mayor Power significa una mayor probabilidad de detectar los errores.
Sin embargo también incrementa la probabilidad de detectar errores
pequeños que puede que no sean de interés. El proceso del conocimiento
ayuda a determinar el nivel optimo del Power en una prueba.
Ejercicio 5.1 Detectando posibilidades en el diámetro de un balero
Ejercicio
Una parte del Balero manufacturado está fuera de especificaciones 0.05
cm de lo correcto. Un cambio de 0.01cm es considerado lo suficientemente
importante para permitir el ajuste al equipo.
La desviación estándar de los diámetros es casi siempre de 0.004 cm.
Recolección de datos
Ninguno
Instrucciones
1 Use Stat > Power and sample size > 1-sample t para calcular el tamaño
de la muestra necesitaras detectar una diferencia de 0.01cm con el Power
de 0.85 en un nivel α de 0.05
2 Calcular las diferencias puedes detectarlas con un power de 0.90
cuando recolectes 5 y 10 observaciones.
Data set
Ninguno
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 0.05
Sample Target Actual
Difference Size Power Power
0.5 3 0.85 1.00000
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 0.05
Sample
Size Power Difference
5 0.9 0.0982944
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not = null)
Calculating power for mean = null + difference
Alpha = 0.05 Assumed standard deviation = 0.05
Sample
Size Power Difference
10 0.9 0.0577282
2. Prueba t y Pruebas de Proporción
Objetivos
Evaluar la diferencia entre la media del proceso y un valor de un
objetivo usando un One-Sample t-test.
Evaluar la diferencia entre 2 muestras de la media usando en Two-Sample
t-test.
Evaluar las diferencias entre 2 observaciones usando un Paired t-test.
Evaluar la diferencia entre una proporción y un valor de un objetivo
usando una prueba de una proporción.
One-Sample t-Test
Ejemplo 1 Problema del Gran Queso
Ejercicio
Tu compañía, El Gran Queso, Inc., sospecha que uno de tus proveedores de
leche le esta añadiendo agua a su leche para incrementar sus beneficios.
Añadir agua a la leche incrementa su punto de congelación, que
normalmente es de –0.545º C.
Recolección de datos
El punto de congelación es medido para 10 muestras al azar de la leche
del proveedor.
Herramientas
Stat> Basic Statistics> Normality Test.
Stat> Basic Statistics> 1-Sample t.
Data set
CHEESE.MPJ
Nombre Tipo de Dato Tipo de Variable
FrzTemp Numérico Respuesta
One-Sample T: FrzTemp
Variable N Mean StDev SE Mean 95% CI
FrzTemp 10 -0.539368 0.007799 0.002466 (-0.544947, -0.533790)
One-sample t-test
¿Qué es un One-Sample t-test?
Un One-Sample t-test te ayuda a determinar si µ (la población de la
media) es igual a un valor d una hipótesis (la prueba de la media).
La prueba utiliza desviaciones estándar de una muestra para estimar σ
(la desviación estándar de la población). Si la diferencia entre la
muestra de la media y la prueba de la media es grande relativamente a la
variabilidad en la muestra, entonces µ es improbable que sea igual a la
prueba de la media.
¿Cuándo usar un one-sample t-test?
Usa un one-sample t-test cuando tienes datos continuos de una sola
muestra al azar.
La prueba asume que la población esta distribuida normalmente. Sin
embargo es muy justo a las violaciones de esta suposición, proveídas las
observaciones son recolectadas al azar y los datos son continuos y
racionalmente simétricos. (ver Box, Hunter & Hunter (1978). Statistics
for Experimenters, John Wiley & Sons, Inc.).
¿Por qué usar un one-sample t-test?
Un one-sample t-test te puede ayudar a responder preguntas tales como:
· ¿Esta el proceso en el objetivo?
· ¿El producto de tu proveedor cumple con tu criterio?
Por ejemplo,
· Es el ancho de la media de las navajas mayor o menor que el objetivo?
· Es la resistencia de la media de los tornillos de tu proveedor menor
de lo requerido?
Probando la suposición de una normalidad
La prueba de Estadística apropiada para los datos de la temperatura
congelante es un one-sample t-test. Esta prueba asume que la población
esta normalmente distribuida.
Usa una prueba de normalidad para determinar si la suposición de la
normalidad es valida para esos datos.
Prueba de normalidad
1. Abre el proyecto CHEESE.MPJ
2. Elige Stat> Basic statistics> Normality Test
3. Completa el recuadro como se indica a continuación:
4. Haz clic en OK
Interpretando tus resultados
Usa el normal probability plot para verificar que tus datos no se
desvíen significativamente de una distribución normal.
· Si los datos vienen de una distribución normal, los puntos muy apenas
seguirán la línea de referencia.
· Si los datos no vienen de una distribución normal, los puntos no
seguirán la línea.
Anderson-Darling normality test
Un p-value de Anderson-Darlin Test (0.0352) accesa a la probabilidad que
los datos son de una población con distribución normal. Usando en α de
0.05, no hay suficiente evidencia para sugerir que los datos no son de
una población normal.
Conclusión
Basado en el argumento y en la prueba es razonable asumir que tus
datos no se desvían substancialmente de una distribución normal. Puedes
proceder con el t-test.
Conduciendo el 1-sample t-test
Conducir un 1-sample t-test para determinar si la temperatura congelante
de la leche del proveedor es mayor a –0.545º C.
No hay razón para sospechar que el proveedor quitara el agua de la
leche. Así, no necesitas probar si la temperatura congelante es menor
que –0.545º C. En esta situación, puedes usar una prueba 1-tailed (en la
cual H1 es direccional):
· H0 :µ = -0.545
· H1 :µ > -0.545 (En una prueba 2-tailed, H1 No es direccional: µ es
diferente a –0.545)
La ventaja de la prueba 1-tailed es que te da mas Power para detectar la
diferencia especificada. Sin embargo, una prueba 1-tailed no puede
detectar una diferencia en la dirección contraria que especifica en H1.
De esta manera si hay diferencias en ambas direcciones son de interés,
deberás usar una 2 tailed test.
1-Sample t
1. Escoge Stat> Basic Statistics> Sample t.
2. Completa el recuadro como se indica a continuación:
3. Haz click Options.
4. De Alternative, Escoge greater than.
5. Click OK en cada recuadro.
Interpretando tus resultados
Usa un nivel α de 0.05 para la prueba.
T
El t-statistic (2.28) es calculado de esta manera:
T = (muestra de la media – prueba de la media) / SE media
Donde SE media es el error estándar de la media (una medida de
variabilidad). Como el valor de t se incremente, el p-value se hace mas
pequeño.
P
El p-value es 0.024. Porque este valor es menor que α(0.05), puedes
rechazar la hipótesis nula. El resultado sugiere que el agua o cualquier
otro liquido halla sido añadido a la leche.
Power
Cuando sea apropiado, una prueba 1-tailed es mas poderosa que una prueba
2-tailed. Por ejemplo, una prueba 2-tailed (H1 : µ es diferente a
–0.545) regresa a p-value de 0.048, que es mayor que 0.024.
One-Sample T: FrzTemp
Test of mu = -0.545 vs > -0.545
95% Lower
Variable N Mean StDev SE Mean Bound T P
FrzTemp 10 -0.539368 0.007799 0.0024 -0.5438 2.28 0.024
Consideraciones finales
Conclusiones prácticas
El 1-tailed, 1-sample t-test sugiere que la temperatura congelante de la
leche del proveedor es mayor a la que debe ser, indicando que se le pudo
haber añadido agua. Esta es una acusación muy seria para el proveedor.
Podría ser mejor evaluar que tan cierto es antes de tomar una decisión.
Con un nivel α de 0.05, las probabilidades de haber concluido que se le
ha añadido agua cuando no es así son de 5%. Para estar seguro que no
rechaces H0 incorrectamente, deberás Escoger valores menores para α,
tales como 0.01 o hasta 0.001. Con un α de 0.01, no concluirás que se le
allá añadido agua a la leche (p = 0.024).
Consideraciones estadísticas
Cuando uses una 1-sample t-test:
· Tu muestra debe de ser al azar.
· Los datos de muestra deben de ser continuos .
· Los datos de muestra deben de distribución normal.
Debe de ser notado que los procedimientos del t-test son muy justas a
las violaciones de las suposiciones de normalidad, dadas esas
observaciones son recolectadas al azar y los datos son continuos y
racionalmente simétricos. (ver Box, Hunter & Hunter (1978). Statistics
for Experimenters, John Wiley & Sons, Inc.).
Una prueba 1-tailed es mas poderosa que una prueba 2-tailed. A menos que
la diferencia no este en la dirección esperada, Por ejemplo una prueba
1-tailed con una hipótesis alternativa, H1 : µ > -0.545 nunca será capaz
de detectar la diferencia si alguien disminuye la temperatura congelante
de la leche.
Ejercicio 1.1 Diámetro de los Valeros de Bola
Ejercicio
Tu compañía produce Valeros de bola y necesitas verificar que el tamaño
del Balero que esté en las especificaciones. La especificación del
diámetro para los Valeros es de 0.5cm.
Usa un nivel α de 0.05 para todas las pruebas.
Recolección de datos
10 Valeros son escogidos al azar y medidos.
Instrucciones
1. Prueba la muestra de normalidad usando Stat> Basic Statics> Normality
Test.
2. Usa Stat> Basic Statistics> 1-sample t para determinar si el proceso
esta en el objetivo. Conduce una prueba 2-tailed (H1 : µ es diferente a
0.5) y crea un boxplot de los datos.
3. Usando la desviación estándar de la muestra como un estimado de σ,
¿cuál es el Power de la prueba para detectar una diferencia de 0.005cm.?
4. ¿Cuál es el tamaño mínimo para la muestra requerida para detectar la
misma diferencia con un Power de 0.80?
Data set
BEARINGS.MPJ
Nombre Data type Variable type
Bearings Numeric Response
Two-Sample t-Test
Ejemplo 2 Resistencia plástica
Ejercicio
Tu compañía hace estuches de plástico para calculadoras. Necesitas
comparar muestras de plásticos de 2 proveedores en cuanto a su
resistencia. El proveedor A dice tenar el plástico mas fuerte, pero
cuesta mas que del proveedor B.
Recolección de datos
Pellets seleccionadas al azar de un grupo de plástico son prensadas en
agua hasta ser barquillas del mismo grueso. La resistencia para
romperlos( en psi, libra por pulgada cuadrada) es tomada para cada
barquilla.
Herramientas
Stat> Basic Statistics> Normality Test
Stat> Basic Statistics> 2 variances
Stat> Basic Statistics> 2-sample t
Set de Datos
PLASTIC.MPJ
Nombre Data type Variable type
SupplrA Numeric Response
SupplrB Numeric Response
Two-sample t-test
¿Qué es un two-sample t-test?
Una two-sample t-test te ayuda a determinar si 2 poblaciones de la media
son iguales.
La prueba usa las desviaciones estándar de la muestra para estimar σ
para cada población. Si la diferencia entre la muestra de la media es
grande relativamente para la variabilidad estimada entre las
poblaciones, entonces la media de la población son improbables a ser
iguales.
Un two-sample t-test también te puede ayudar a evaluar si la media de
2 poblaciones es diferente por una cantidad especifica.
¿Cuándo usar una prueba two-sample t-test?
Usa una prueba two-sample t-test cuando tengas datos continuos de 2
muestras al azar independiente. Las muestras son independientes si las
observaciones de un one.sample no están relacionadas a las observaciones
de la otra muestra. Por ejemplo, 2 medidas son tomadas por un mismo
operador no son independientes.
La prueba también asume que tus datos vienen de una población
normalmente distribuida. Sin embargo es muy justo hacia las violaciones
de esta suposición proveídas las observaciones son recolectadas al azar
y los datos son continuos y razonablemente simétricos. (ver Box, Hunter
& Hunter (1978). Statistics for Experimenters, John Wiley & Sons, Inc.).
¿Por que usar una prueba two-sample t-test?
Un two-sample t-test te puede ayudar a contestar preguntas tales como:
· ¿Son los productos de dos proveedores comparables?
· ¿Es la formula de un producto mejor que el otro?
Por ejemplo,
· ¿Es similar la viscosidad del aceite de dos proveedores?
· ¿Es la formula de una tinta más brillante que otra?
Probando las suposiciones de la normalidad
La prueba de estadística mas apropiada para los datos del proveedor es
la two-sample t-test. Esta prueba asume que los datos son de poblaciones
distribuidas normalmente.
Usa la prueba de normalidad para determinar si la suposición de la
normalidad es valida para estos datos.
Prueba de normalidad
1. Abre el proyecto PLASTIC.MPJ.
2. Escoge Stat> Basic statistics> Normality Test.
3. En Variable, enter ´SupplrA´.
4. Click OK.
5. Escoge Stat > Basic Statistics > Normality Test, or press ctrl. + E.
6. En Variable, enter ´SupplrB.
7. Click OK
Interpretando tus resultados
Usa la normal probability plot para verificar que tus datos no se
desvíen significativamente de una distribución normal.
· Si los datos vienen de una distribución normal, los puntos muy
apenas seguirán la línea de referencia.
· Si los datos no vienen de una distribución normal, los puntos no
seguirán la línea.
El plot para el SupllrA indica que la distribución de la muestra es
razonablemente normal; todos los puntos están cerca de la línea.
El plot para el SupplrB sin embargo aparentemente muestra desviación de
la normalidad.
Anderson-Darling Normality test
La desviación de la normalidad observada de SupplrB no es significante
en un nivel α de 0.05. Ambas p-values(0.664 para SupplrA, y 0.083 para
SupplrB) son mayor que 0.05.
Conclusión
Basado en el plot y las pruebas, es racional asumir que tus datos no
se desvían substancialmente de una distribución normal. La suposición de
una normalidad es relativamente satisfecha, así que puedes proceder con
el t-test.
Comparando las variaciones
Antes de conducir el t-test, debes evaluar las variaciones de las 2
distribuciones para ver si difieren. Hay dos razones para esto:
· Es importante saber sí el producto de un proveedor varia mas que el
del otro
· Los cálculos para el two-sample t-test depende si las variaciones de
las muestras son iguales o diferentes.
Para asegurar que encontraste una diferencia entre 2 variaciones si es
que existe una. Debes usar un nivel α de 0.10 para esta prueba en lugar
de la normal de 0.05. Esto incrementara el power de la prueba.
2 Variances
1. Escoge Stat> Basic statistics> 2 Variances.
2. Completa el recuadro como se indica a continuación:
3. Click Options.
4. En Confidence level, enter 90.
5. Click OK en cada recuadro.
Interpretando tus resultados
Intervalos de confianza
Los intervalos de confianza son útiles para comparar σ de las 2
poblaciones. Sin embargo, tu decisión acerca de sí las 2 variaciones son
iguales será basadas en una apropiada prueba de variación.
Pruebas de variación
Los resultados incluyen 2 pruebas de variación separadas. El uso de la prueba depende de tus datos.
· Si tus datos son continuos y de distribución normal, usa el F-test.
· Si tus datos son continuos pero no necesariamente de distribución
normal, usa el Levene`s test.
Los datos dados son racionalmente normales, así que puedes usar el
F-test. Sin embargo, porque el p-value de la prueba de normalidad del
proveedor B fue muy baja (0.083), hay que revisar los resultados de la
prueba de Levene`s también.
Conclusión
Los p-values para ambos F-test (0.067) y la Levene`s (0.052) son
menos que α (0.10), así que puedes rechazar la hipótesis nula que las
variaciones son iguales. Los resultados sugieren que las variaciones del
plástico del proveedor A son más pequeños que las del proveedor B.
F-Test (normal distribution)
Test statistic = 0.28, p-value = 0.067
Levene's Test(any continuous distribution)
Test statistic = 4.27, p-value = 0.052
Test for Equal Variances for SupplrA, SupplrB
Interpretando tus resultados
Los mismos intervalos de confianza y las pruebas estadísticas incluidas
en la ventana de resultados de la grafica también son proveídas en la
ventana de sesión.
Test for Equal Variances: SupplrA, SupplrB
95% Bonferroni confidence intervals for standard deviations
N Lower StDev Upper
SupplrA 10 0.391949 0.59920 1.20658
SupplrB 12 0.764926 1.13118 2.09100
F-Test (normal distribution)
Test statistic = 0.28, p-value = 0.067
Levene's Test(any continuous distribution)
Test statistic = 4.27, p-value = 0.052
Conduciendo el Two-Sample t-test
Por que los datos son razonablemente normales, tu puedes usar 2 Sample t
-to test ya sea la resistencia del plástico de los dos diferentes
proveedores.
La prueba de Hipótesis es:
· H0 : µ A – µ B = 0
· H1 : µ A – µ B ≠ 0
Elabora dotplots y boxplots para ayudar a visualizar los datos.
Asumir discrepancias desiguales
Si asumes que las varianzas de las dos poblaciones son iguales, tu
t-test será más confiable. Sin embargo, si asumes que la varianza es
igual cuando no lo son, los resultados de tu t-test serán falsos. Así,
si hay alguna duda, es mejor no asumir que son iguales.
Porque la variance test indica que la población de la varianza es
diferente, no asuma que las varianzas son iguales.
2-Sample t
1. Escoge Stat > Basic Statistics > 2-Sample t.
2. Complementa el recuadro como se indica a continuación:
3. Click Graphs.
4. Revisa Dotplots of data y Boxplots of data.
5. Click OK en cada recuadro.
Interpretando los Resultados
Las graficas ilustran dos puntos :
· El plástico del proveedor A se muestra más resistente que el del
proveedor B.
· Hay mas variabilidad en la resistencia del Plástico del Proveedor B
que del Proveedor A.
Interpretando tus Resultados
Two-Sample T-Test and CI: SupplrA, SupplrB
Two-Sample T-Test and CISupplrA, SupplrB
Individual Value Plot of SupplrA, SupplrB
Boxplot of SupplrA, SupplrB
El promedio del punto de quiebre del plástico (media) y dos medidas
de la variabilidad—la desviación estándar (StDev) y el error estándar de
la media (SE Mean)—se presentan en cada Proveedor.
Intervalos de Confianza
La diferencia entre la muestra de la media (7.484) se utiliza para
estimar la diferencia entre la población de la media (mu SupplrA—mu
SupplrB). El intervalo de confianza por la diferencia se basa en esta
estimación y la variabilidad de las muestras.
Puede ser 95% confiable que la diferencia entre la población de la media
es entre 6.687 y 8.281 psi.
T-value y p-value
El T-value para la prueba es 19.82, lo cual se asocia con un p-value
menor que 0.0005 (lo cual se redondea a 0.000)
Así, puedes rechazar la Hipótesis nula en 0.05 α-level, donde concluye
que las resistencias son diferentes.
Consideraciones finales
Conclusiones prácticas
El proveedor de plástico A es significativamente resistente y menos
variable que el proveedor B. Sin embargo, observamos que el Proveedor A
también nos cobra mas por el producto. Ahora tienes que decidir si la
diferencia entre los Proveedores es significativa.
Se cuenta con el 95% de confianza de la verdadera diferencia entre el
proveedor 6.687 y 8.281 psi. Tu decides pagar o no un precio alto por
una pequeña diferencia en la resistencia.
Consideraciones estadísticas
Cuando utilizas two-sample t-test :
· Las muestras deben ser al azar.
· Las muestras deben ser independientes.
· Las muestra deben ser continuas.
· Las muestras deber ser de distribución normal.
Debe acentuarse que el procedimiento para la t-test es lo
suficientemente veraz a las violaciones de la Asunción de la normalidad,
proveídas estas observaciones los datos son recolectados al azar, son
continuos, unimodal y razonablemente sistemáticos. (ver Box, Hunter &
Hunter (1978). Statistics for Experimenters, John Wiley & Sons, Inc.).
Interpretando tus resultados
Dos-ejemplos T para Supp1 rA vs Supp1 Rb
Diferencia = mu Supp1rA – mu Supp1rB
Estimación por diferencia: 7.484
95% CI para diferencia: (6.687, 8.281)
T- Testo de diferencia = 0 ( vs no = ): T- Valor = 19.82 P-Valor = 0.000
DF = 17
La resistencia a ruptura media (medio), y dos medidas de desviación
estándar de la variabilidad-(StDev) y del error de estándar del medio
(el SE Mean)- se presenta para cada surtidor.
Los intervalos de confianza.
La diferencia entre los medios de la muestra (7.484) se utilizan para
estimar la diferencia entre los medios de la población (mu SupplrA-mu
SupplrB). El intervalo de la confianza para la diferencia se basa en
esta estimación la variabilidad dentro de las muestras.
Usted puede tener una confianza del 95% que la diferencia entre los
medios de la población está entre 6.687 y 8.281 PSI.
T-valor y el p-valor
El t-valor para la prueba es 19.82, que se asocia a un p-valor de menos
de 0.0005 (que redondeado a 0.000).
Así, usted puede rechazar la hipótesis nula en el 0.05 ά - nivel, y
concluye que las fuerzas son diferentes.
Consideraciones Finales.
Conclusiones prácticas.
El plástico de A`s del surtidor es perceptiblemente más fuerte y menos
variable que el surtidor B`s. sin embargo recuerda que el surtidor A
también carga más para su producto. Ahora usted debe decidir si la
diferencia entre los surtidores es de significación práctica.
Usted es el 95% confiable que la diferencia verdadera entre los
surtidores es entre 6.687 y 8.281 pis. Usted decide que no está
dispuesto a pagar el precio alto más elevado para la pequeña fuerza de
diferencia.
Consideraciones Estadísticas.
Al usar una t-prueba de la dos-muestra:
La muestra debe ser al azar.
Las muestras deben ser independientes.
Los datos de la muestra deben ser continuos.
Los datos independientes de la muestra deben ser distribuidas
normalmente
Debe ser observado que el procedimiento de la t-prueba es bastante
robusto a las violaciones de la asunción de la normalidad, la condición
de que las observaciones se recogen aleatoriamente y los datos son
continuos, unimodal, y razonablemente simétricas (véase a la caja, al
cazador, y a Cazador (1978). Estadística para Experimentos, John Wiley &
Sons, Inc.).
Prueba- t Pareada
3 Ejemplos del Estacionamiento de los Carros.
Problema
Un grupo de consumidor desea determinar si hay una diferencia en la
manipulación de capacidad entre dos coches populares. Para medir la
capacidad de dirección de los coches, el tiempo lleva conductores el
parque paralelo que cada uno de los coches se registra.
Recolección de datos
Veinte conductores parquean ambos coches (en orden al azar), y el tiempo
del estacionamiento registrado (en segundos).
Herramientas
Stat > Estadísticas Básicas > Paired
Set de Datos
CARCLT.MPJ
Prueba-t Pareada
¿Qué es una prueba t pareada?
En una prueba t pareada tu puedes determinar si la media de la
diferencia entre las observaciones pareadas es significativa
Estadísticamente, es equivalente a realizar una Prueba t de una-muestra
de una diferencia. Una t-prueba pareada se puede también utilizar para
evaluar si la diferencia es igual al valor específico.
Las observaciones pareadas se relacionan de una cierta manera. Los
ejemplos incluyen:
· Pesos registrados para los individuos antes y después un programa de
ejercicio.
· Muestras tomadas de la misma parte con dos diferentes dispositivos de
medida.
¿Cuándo utilizar una prueba t pareado?
Use una Prueba t pareada cuando tengas una muestra escogida al azar de
observaciones pareadas. Los datos deben ser continuos.
¿Porqué usar una prueba t pareada?
Las pruebas t pareadas t puede ayudar a responder preguntas tales como:
¿Un nuevo tratamiento causa la diferencia en el producto?
¿Dos instrumentos de medida hacen lo mismo?
Para el ejemplo:
¿Tratando la madera de construcción con ciertos productos químicos
aumenta su vida útil?
· ¡Pueden dos calibradores medir idénticas partes de la misma manera?
Conduciendo una prueba t de pareada
Tu estas intentando determinar si un coche se puede estacionar más
rápidamente que otro. Porque se emparejan los datos (cada individuo
estaciono ambos coches), tu utilizaras una prueba t pareado para probar
las hipótesis siguientes:
Ho: La diferencia de la media entre las observaciones pareadas en la
población es cero.
H1: La diferencia de la media entre las observaciones pareadas en la
población no es cero.
Cree los dotplots y los boxplots para ayudar a visualizar los datos.
Utilice el nivel de la confianza del defecto del 95% para la prueba.
t Pareadas
1.- Abre el Project CARCLT.MPJ.
2.- Elija Stat > Estadísticas básicas > Pareo t.
3.- Completa el recuadro como se indica a continuación:
4.- Click Graficas.
5.- Elija Doplot de diferencias y Boxplot de diferencias.
6.- Click OK en cada recuadro.
Interpretando tus resultados
El boxplot y el dotplot ilustran las diferencias entre las observaciones
pareadas.
La diferencia de la media ( aproximadamente 2) es representa por el X.
Ho representa la diferencia de la población que estas probando (cero.
El intervalo de confianza
MINITAB también dibuja el intervalo de confianza para la diferencia de
la media de la población. Así que la hipótesis nula es verdad, tu
esperarais que Ho estuviera dentro de este intervalo.
Porque el intervalo de la confianza no esta incluido en Ho, tu puedes
rechazar la hipótesis nula y concluir que al coche A le toma mas tiempo
estacionar que al coche B.
Interpretando tus resultados
Las medias de los tiempos para estacionarse son 34.87 segundos para el
coche A y 32.90 segundos para el coche B. La diferencia es 1.967
segundos.
Los puntos finales para el intervalo de confianza del 95% para la
diferencia de la media son de 0.171 y 3.764.
T-valor y p-valor
La prueba da un valor de t de 2.29, se asocia con un p-valor de 0.034.
Así, tu puedes rechazar la hipótesis nula en el nivel 0.05 ά y concluir
que el tiempo requerido para estacionar el coche A es mayor que el
tiempo requerido para estacionar el coche B.
Prueba T para Carros A – Carros –B
Consideraciones finales
Conclusiones prácticas
En promedio, a los conductores les tomo 1.967 segundos mas estacionar el
coche A que el coche B. Esta diferencia aunque pequeña es
estadísticamente significativa.
¿Es una diferencia de 2-segundos de importancia practica?. Esto lo
decides tu.
Los tiempos levemente más largos para estacionarse se asocian a la
frustración creciente del conductor, los 2 segundos pueden ser
importantes. También, esta diferencia puede ser de mayor importancia a
los conductores que seguido se estacionan paralelo.
Consideraciones Estadísticas
Cuando usar una prueba t pareada:
Ø Las observaciones deben ser pareadas.
Ø Los datos deben ser continuos.
Ø Las diferencias deben ser distribuidas normalmente.
Debe ser observado que el procedimiento de la prueba t es bastante
robusto para las violaciones de las suposiciones de la normalidad, a
condición de que los pares de observaciones se recojan aleatoriamente y
los datos sean continuos, unimodal, y razonablemente simétricos (véase a
la caja, al cazador, y a Cazador (1978). Estadística para Experimentos,
John Wiley & Sons, Inc.).
Utilizando observaciones pareadas eliminas la variabilidad causada por
individuos. Por ejemplo, al conductor 1 le tomo 18.9 segundos para
estacionar el coche y 18.2 segundos para estacionar el coche B. En
contraste, al conductor 18 le tomó 43.8 y 41.1 segundos para estacionar
los mismos coches. Obviamente, hay mucha variabilidad entre los
conductores. Pero analizando las diferencias para cada conductor, tu
eliminas esta variabilidad de los cálculos, aumentando el power de tu
prueba.
Ejercicio 3.1 Comparaciones de Calibradores
Ejercicio
Tu estás considerando la compra de dos diversos gage para medir
válvulas: Calibradores por EasyGage y Too1It. Tu deseas comparar las dos
marcas de fábrica del calibrador para determinarse si ofrecen las mismas
medidas de promedio.
Utilice un ά-nivel de 0.05 para todas las pruebas.
Recolección de datos
Doce operadores cada uno midieron la misma válvula con los dos diversos
calibradores. (El orden en la cual utilizaron el calibrador fue
seleccionado aleatoriamente.)
Instrucciones
1.- Use una prueba t pareada para determinar si las medidas de cada
calibrador son diferentes.
2.- Con la desviación de estándar de la diferencia de la muestra como
estimación de ά , calcule la energía de la prueba al detectar una media
de la diferencia de 0.005 cm.. (Indirecta: Conducir una t-test paired es
lo mismo que conducir una t-prueba de la una-muestra es la diferencia
entre las observaciones apareadas.
Por lo tanto, tu puedes utilizar Stat > Power and sample size > 1-
Sample t para evaluar el power de la prueba t pareada.
3.- ¿cuál es la energía de la prueba de detectar una diferencia de la
media de 0.001 centímetro?
Set de datos
CALIPERS.MPJ
Prueba de una Proporción
Ejemplo 4 Televisiones Reparadas por Tarifa
Ejercicio
Tu quieres determine si la proporción de tu sistema de televisión de
35- pulgada necesitara ser reparado en el plazo de 4 años de la compra,
es diferente que el índice de la industria 6.8% ( 0.068)
Recolección de datos
Aproximadamente 100,000 encuestas fueron enviadas a los clientes que
compraron una televisión 35-plagadas. De los 2,856 clientes que
regresaron las encuestas, 236 indicaron que su televisión había
requerido la reparación en el plazo de 4 años de la compra.
Herramientas
Stat > Estadísticas Básicas > 1 Proporción
Set de datos
Ninguno
Prueba de una proporción
¿Qué es una prueba de proporción?
Una prueba de una proporción te ayuda determina si una proporción de la
población es diferente de un valor específico (proporción de la prueba.)
¿Cuándo utilizar una prueba de una proporción?
Usa una prueba de proporción para evaluar la proporción de los datos de
una sola muestra.
¿Porqué usar una prueba de una proporción?
Una prueba de una proporción te puede ayudar a contestar preguntas
tales como:
¿Es una población diferente de 0.5?
b) ¿Es una proporción mayor o menor que el criterio?
Por el ejemplo,
¿En un programa de inteligencia artificial es posible contestar Sí / No
preguntas con mayor exactitud del 50%?.
¿Está el porcentaje de averías de los sujetadores plásticos debajo del
máximo aceptable?.
Conduciendo una prueba de una proporción
Tu estás evaluando los resultados de un examen enviado a los clientes
que compraron una de sus televisiones.
La proporción de los que respondieron con televisión que la necesito
reparación dentro de los 4 años es 236 / 2856 = 0.0826. El promedio de
la industrial es 0.068.
Utiliza una prueba de una proporción para determinar si esta
diferencia es significativa.
Las hipótesis para la prueba es:
· Ho: la proporción de la población para sus clientes es igual a 0.068.
· H1: la proporción de la población para los clientes no es igual a
0.068.
Utilice un nivel de la confianza del 95%.
1 Proporción:
1.- Elija Stat > La Estadística Básica > 1 Proporción.
2.- Seleccione Summarized data.
3.- En el Número de ensayos, tipo 2856.
4.- En el Número de éxitos, tipo 236.
5.- Click Opciones.
6.- Complete el recuadro como se indica a continuación:
7.- Click OK en cada recuadro.
Interpretando tus resultados
Utilice ά de 0.05 para la prueba.
Los resultados sugieren que el índice de la reparación para su
televisión (muestra p = 0.083) sea más alta que el índice a nivel
industrial de 0.068
El intervalo de confianza del 95% (0.0727992 A 0.093339) no incluye
0.068.
El p-valor (0.003) es menos que ά (0.005.)
Tu debes rechazar la hipótesis nula, ya que el índice de tu reparación
igual que el índice a nivel industrial.
Mas / Para cálculos de intervalos de confianza, vea ayuda de Minitab.
Test y CI para una Proporción
Consideraciones finales
Conclusiones prácticas
Que sigue.
Porque AFR tiene la relación lineal más fuerte con la regresión de uso
de golpe para ajustarse a un modelo de la regresión lineal simple con el
golpe como la contestación y AFR como las predicciones.
Encajando a un modelo de la regresión simple
Usa la regresión para realizar un análisis de la regresión lineal simple
para el golpe y AFR. Podrías también usar Fitted Line Plot antes de
realizar un análisis.
Regresión
1.- Escoja Stat > Regresión > Regression
2.- Completa el recuadro como se indica a continuación:
3.- Click OK
Interpretando tus resultados
Ecuación de la Regresión
La ecuación relacionada con la respuesta y la predicción es:
Knock = 25.5+4.25 AFR
Esto indica que el golpe aumenta 4.25 veces por el aumento de la unidad
en AFR
Tabla de coeficientes
Las hipótesis para cada coeficiente es:
Ø Ho: el coeficiente es igual a cero
Ø H1: el coeficiente no es igual a cero
El valor-p para la constante (β0 , la intercepción) y el coeficiente de
AFR (β1, la cuesta) ambos son menores de 0.05. Así nosotros podemos
rechazar Ho para cada uno a los 0.05 α-level y concluimos que estos
coeficientes no son cero. En este modelo, AFR es una predicción
significativamente estadística del golpe.
El análisis de la regresión: el golpe contra AFR
Interpretando tus resultados
R²(R-Sq)
El R² indica los 92.3% de la variabilidad del golpe predicho por este
modelo.
El Análisis de la varianza
Llamada que las hipótesis para un modelo de la regresión lineal simple
son:
Ø Ho: β1 es igual a cero
Ø H1: β1 no es igual a cero
¿Qué sigue?
El modelo de la regresión simple con AFR es útil para la predicción del
golpe. Sin embargo, es posible que el Power de la predicción adicional
puede ser ganada incluyendo otras predicciones en el modelo de
regresión.
El análisis de la regresión: el golpe contra AFR
Examinando la asociación residual
Los residuos contra las variables
Una técnica por determinar si otras variables pueden ser importantes en
predecir la respuesta es la grafica de los residuales contra cada
predicción potencial.
Regresión
1.- Escoja el Stat > Regresión > Regression o presione ctrl+E para
regresar al cuadro de diálogo.
2.- Click Graphics.
3.- Completa el recuadro como se indica a continuación:
4.- Pulse el botón OK en cada recuadro.
Interpretando tus resultados
Cuando el plotted en contra de la descarga, los residuales no parecen
completamente aleatorios. Los residuales aparecen más grandes para los
valores de descarga más grandes.
Esto indica que la descarga puede ser útil respondiendo a la
variabilidad adicional en el golpe.
La entrada y la chispa también parecen ser relacionadas con el golpear y
pueden responder a la variabilidad adicional.
Es posible para dos o más variables explicar la misma variabilidad en la
respuesta. En este caso, el modelo final puede que no incluya todas las
variables.
Encajando a un modelo de la regresión múltiple
Usa la regresión para analizar el modelo de la regresión múltiple con
todos las cuatro predicciones.
Regresión
1.- Escoge Stat > Regresión > Regresión o presione Ctrl.+E para regresar
a la Regresión en el recuadro.
2.- Presione F3 para borrar el cuadro de diálogo
3.- Completa el recuadro como se indica a continuación:
4.-Click OK.
Interpretando tus resultados
Use un α de 0.05 para todos los análisis.
Ecuación de regresión
La ecuación que relaciona la respuesta y la predicción es:
Knock = 23.8 - 0.296 +3.19 AFR +0.359 entrada + 0.0134 descarga
Tabla de coeficientes
Tenga el cuidado al interpretar los coeficientes de la regresión
múltiple.
El p-valor para cada variable sólo indica si es significante en el
modelo presente.
Por ejemplo, la chispa no es una predicción significante en el modelo
presente (p = 0.363). Sin embargo, si quitas la descarga del análisis,
la chispa se hace significativa, está altamente correlacionados (r = -
0.723,p = 0.005, vea página 3.49) y así explica la misma variación en el
golpe.
El análisis de la regresión: el golpe contra la chispa, succión, la
descarga,
Interpretando tus resultados
Cuidado con multicolinealidad
Cuando las predicciones son sumamente correlacionadas, la estimación del
coeficiente de regresión puede ser inestable (Significa que varían
ampliamente de un ejemplo al siguiente). Esta condición es llamada
multicolinealidad, y eso hace que la evaluación sea importante en
términos individuales en la dificultad del modelo.
Puedes usar la correlación para tratar de identificar las fuentes
potenciales de la multicolinealidad. Si hay multicolinealidad extrema en
un modelo, MINITAB mostrará un mensaje en la ventana de la sesión y
quita una o más variables para reducir el problema.
Nunca quites mas de una predicción en ningún momento
Una buena forma de Escoger las predicciones de un modelo de regresión
múltiple es tratar a todas las combinaciones potenciales usando el
modelo de procedimientos de comparación como el mejor subconjuntos o una
regresión gradual.
El análisis de la regresión: el golpe contra la chispa, succión, la
descarga
Interpretando tus resultados
R²(R-Sq) y R² ajustó (R-Sq(adj))
El nuevo modelo explica 98.8% de la variabilidad en la respuesta, lo
cual es una mejora sobre el R² logrando usar solamente AFR para predecir
el golpe
Sin embargo R² nunca disminuirá cuando aumente la predicción al modelo,
aun cuando eso no resulte un buen modelo. La estadística de R² ajustada
(R-Sq(adj) = 98.2%) es ajustado para el número de condiciones en el
modelo, y debe usarse cuando son comparados los modelos con diferente
números las predicciones.
El R² ajustado para el modelo con sólo AFR como el predictor tenía 91.6%
años. así, el modelo actual con un R² esta ajustado 98.2% se mejora.
Análisis de Variación
Las hipótesis para un modelo de la regresión múltiple es:
Ho: todo β1 (a excepción de β0) son iguales a cero
H1: al menos uno βi (no incluye β0 ) no es igual a cero
Porque p (0.000) es menos que α (0.05), puedes rechazar Ho.
El modelo de la regresión, con la chispa, AFR, Succión, y descarga como
las predicciones, es significativamente mejor que la restricción del
modelo el cual incluye no predicciones.
El análisis de la regresión: el golpe contra la chispa, succión, la
descarga,
Consideraciones Finales
Conclusiones prácticas
La ecuación de la regresión para la Chispa usando ejemplar, AFR, Succión
y Descarga para predecir el Golpe es:
El golpe = 23.8-0.296 Chispa + 3.19 AFR + 0.359 Succión +0.0134
Descarga.
Este modelo responde de 98.8% de la variabilidad en el Golpe.
Hay problemas del multicolieanidad con el modelo. Sin embargo, la chispa
sumamente correlacionado con la Descarga.
En el próximo ejemplo, usarás los mejores Subconjuntos para procesar a
todos los posibles modelos con estas cuatro predicciones y Escoger el
mejor.
Consideraciones estadísticas
No puedes usar el análisis de la regresión para afirmar que los cambias
en las predicciones causan cambios en la respuesta, a menos que los
valores de las predicciones cambien niveles predeterminados en un
experimento controlado. Si los valores de las predicciones variar al
azar, otros factores pueden influir en las predicciones y la respuesta.
No deberías aplicar los resultados de regresión y los valores de respuesta que son salidas de tu rango de los ejemplos.
La precisión de medida es importante. La falta de precisión te lleva a la inexactitud estimada de los coeficientes.
Ten cuidad de no pasar por alto los factores potencialmente
importantes al diseñar un estudio de regresión.
Tenga cuidado con multicolinealidad.
Cuando las variables de la predicción están sumamente correlacionadas:
Los coeficientes estimados de la regresión pueden ser inestables
(Ellos pueden variar ampliamente de una muestra a la siguiente muestra)
Puede ser difícil evaluar la importancia de las condiciones individuales
del modelo.
Nunca quite más de una predicción en ningún momento.
Una buena forma de Escoger las predicciones de un modelo de regresión
múltiple es tratar a todas las combinaciones potenciales usando el
modelo de procedimientos de comparación como el mejor sub conjuntos o
una regresión gradual.
Mejores Subconjuntos de la Regresión
El ejemplo 5 Reduciendo el Golpe del Motor
Problema
Estás intentando identificar las variables importantes que efectúan el
Golpe del motor. Las siguientes variables están bajo las
consideraciones:
Ø La elección del momento adecuado de la chispa
Ø La proporción de aire-combustible (AFR)
Ø La temperatura de la succión
Ø La temperatura de la descarga
Recolección de datos
Los datos son recolectados al azar de 13 motores seleccionados
Herramientas
Stat > Regressions>Best subsets.
Stat>Regressions>Regressions.
Set de Datos
KNOCK.MPJ
Nombre Tipo de dato Tipo de variable
¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨
Spark Numérico Predictor
AFR Numérico Predictor
Intake Numérico Predictor
Exhaust Numérico Predictor
Knock Numérico Respuesta
Regresiones de los mejores subconjuntos
¿Cuál es el mejor subconjunto de regresión?
La regresión de los mejores subconjuntos evalúa todas las posibles
combinaciones de las predicciones para ayudarle a determinar qué
combinación hace al mejor modelo de las regresiones. MINITAB usa un
criterio de R2 máximo para Escoger al mejor modelo . Otro criterio puede
proporcionar a un modelo diferente.
¿Cuándo usar los mejores conjuntos de regresión?
Use la regresión de los mejores subconjuntos cuando usted tiene mucho
potencial de predicciones y así varios modelos de regresión para
Escoger.
¿Por qué usar el mejor subconjunto de regresión?
Los mejores subconjuntos pueden disipar las siguientes preguntas:
¿ Qué combinación de tus factores es él más eficaz para predecir tu
respuesta?
¿Cuál es el mejor modelo de regresión posible usando de 5 a 20
predicciones?
Por ejemplo,
¿Está un modelo usando 10 variables para predecir la suavidad del helado
mas que uno que usa sólo temperatura y velocidad en la mezcla?
Escogiendo un modelo apropiado
Use los mejores Subconjuntos para ayudarle a Escoger a un modelo de las
regresiones múltiples para el Golpe y evita los problemas siguientes:
Los modelos incómodos e ineficaces son el resultado de muchas
predicciones.
Coeficientes inestables que resultan de redundante y predicciones
correlacionadas.
Habilidad inadecuada de predicciones que resulta pocas predicciones.
Predicciones libres
Entre todas las cuatro variables en las predicciones Libre. MINITAB
probará todas las posibles combinaciones de estas variables y el reporte
estadístico para los mejores modelos. (Variables de entradas de las
Predicciones en todos los modelos serán incluidas en cada modelo.)
Best Subsets
1.- Seleccione Stat>Regressions>Best.
2.-Completa el recuadro como se indica a continuación:
3.- Click OK
Interpretando tus resultados
Los Xs al derecho de la tabla indica qué predicciones son incluidas en
cada modelo.
Variables
La columna de Vars indica el número de predicciones en el modelo.
R2 (R-Sq) y R2 ajustó (R-Sq(adj))
Al comparar a modelos:
Si el número de predicciones es el mismo, busque al modelo con el R2 más
alto.
Si el número de predicciones es diferente, busque al modelo con el R2
más alto.
Cp
Busque a modelos dónde Cp es pequeño y acerca el número de parámetros en
el modelo. Por ejemplo, para modelo con 3 predicciones y el interceptor,
busque a un modelo con un Cp cerca de 4 La fórmula Para Cp es:
Cp = (SSEp/MSEm)-(n-2p)
Donde SSEp son las sumas de error de los cuadrados para el modelo con
los parámetros de p (incluso el interceptor), MSEm el error de la media
cuadrada para el modelo con toda las predicciones de m, y n es el número
de observaciones.
Los mejores Subconjuntos de regresión: el Golpe contra la Chispa, AFR,
la Succión, la Descarga,
La contestación es el Golpe
Interpretación tus resultados
Variabilidad
S es una estimación de la media variabilidad sobre la línea de las
regresiones.
Matemáticamente, S es la raíz cuadrada positiva del MSE. En general,
tu quieres que S sea tan pequeño como posible.
Conclusión
Basado en éstos criterios, el modelo con AFR, la Succión, y la Descarga
es el mejor. El modelo
Conteniendo todos las cuatro predicciones es comparable, pero S para
este modelo es ligeramente más grande y allí no parece ser cualquier
ganancia en R2 ajustado para usar el modelo. Es generalmente sabio
Escoger al modelo más simple a menos que un modelo más complicado sea
claramente mejor.
Los mejores Subconjuntos de regresión: el Golpe contra la Chispa, AFR,
la Succión, la Descarga
La contestación es el Golpe
Evaluando el último Modelo
Usa la Regresión para evaluar al último modelo. Calcule la ecuación de
regresión y confirme que todas las asunciones sobre los residuales sean
conocidas.
Regression
1.- Escoge Stat > Regresión > Regresión
2.- En Response, enter knock.
3.- En Predictors, enter AFR intake exhaust
4.- Click Graphs
5.- Complete el recuadro como se indica a continuación:
6.- click OK en cada recuadro.
Interpretando tus resultados
Use una α de 0.05 para todos los análisis.
La ecuación de regresión
La ecuación de regresión es:
El golpe = 16.5 +3.21 AFR +O.386 Succión +0.0166 Descarga
Tabla del coeficiente
El valor de p más bajos (p < 0.05) en la tabla del coeficiente indica
que todas las condiciones en el modelo son significantes.
Análisis de variación
Porque p (0.000) es menor que α (0.05) puedes rechazar H0. El modelo de
la regresión que incluye AFR; las Succiones y la Descarga son
significativamente buenas que el modelo restringido que no incluye
ninguna predicción.
Interpretando tus resultados
Las graficas residuales verifican que se han reunido todas las
asunciones acerca de los residuales. Los residuales:
No parta substancialmente de la normalidad.
Aparece la distribución aleatoria a cero.
Aparece tener la variación constante por los todos valores de ajustes.
No exhiba un tiempo - el efecto del orden.
Consideraciones finales
Conclusiones prácticas
El mejor modelo para predecir el golpe es:
Knock= 16.5 +3.21 AFR+0.386 Intake + 0.0166 Exhaust
Consideraciones estadísticas
Antes de usar el mejor subconjunto de regresión para evaluar los modelos
de regresión que son diferentes, asegúrate de que tus predicciones y
respuestas son validas para todo el modelo potencial sean modelos
validos de regresión.
Todos reglas y las guías también pertenecen a los modelos de la
regresión múltiple también aplican cuando Escoge un modelo que usa este
procedimiento.
4. El análisis de variación
Objetivos:
· Compare grupos de variables usando una prueba de varianza.
• Puede ser usado para evaluar las diferencias entre niveles
individuales de medias.
Es importante validar las suposiciones del residual, antes de dibujar
cualquier conclusión final de los resultados del ANOVA.
Este análisis incluye factores estables significando que los niveles
incluidos fueron de interés directo y no significo que fueran
generalizados a otros niveles. El procedimiento del modelo lineal
general puede también ser usado con factores aleatorios, los cuales son
factores para que los niveles sean seleccionados aleatoriamente y sean
proyectados para representar una mayor población de posibles niveles.
Un ejemplo excelente es un estudio de un gage R&R.
Todos los factores en este análisis fueron cruzados significando por
ejemplo, que cada nivel de llanta puede ser probado con cada nivel de
banda de rodadura. Los factores son considerados jerarquizados si todos
lo niveles de un factor suceden completamente dentro de un nivel de
otro.
Ejercicio 4.1 Prueba de vinos
Problema:
Tú tratas de determinar si existen diferencias significativas en la
calidad de tres vinos: Matador, Conquistador y Saeta.
Colección de datos
10 jueces de vinos probaron tres vinos cada uno y cada uno califico su
calidad. El orden de las pruebas fue aleatorio y cada juez pruebo los
vinos en diferente orden.
Instrucciones:
1.- Use el modelo lineal General para analizar los puntajes en función
del vino.
• Incluye los jueces en el bloque de variables para reducir la
variabilidad.
• Realiza el ajuste (Fits) y el residual.
• Incluye el pairwise comparación en el factor del vino en tus
resultados.
2.- Genera los efectos principales en la gráfica de vinos.
3.- usa Stat > Regression > Residual Plots para validar las suposiciones
del modelo.
Set de Datos
RIOJA.MPJ
Ejercicio 4.2 Contenido de fosfato
Problema
Tú quieres evaluar cuanto tiempo toma el uso del gravímetro contra el
método spectometrico para medir el contenido fosfato que contienen dos
tipos de material.
Colección de datos
Seis ingenieros tomaron muestras del contenido de fosfato de cada
material usando cada método.
Los datos son de J. Neter, W. Wasserman y M.H. Kutner (1985) Aplicación
lineal del modelo estadístico, segunda edición Irwin , In. Pagina 936.
Instrucciones
1.- Use el modelo lineal general para analizar el tiempo como una
función del material y del método.
• Incluye a los ingenieros en el bloque de variables para reducir la
variabilidad.
• Realiza el ajuste (Fits) y el residual.
• Incluye el pairwise comparación y la interacción entre el método *
material en tus resultados.
2.- Genera una grafica de interacción del material * método.
3.- Usa Stat > Regression > Residual Plot para validar el modelo de
suposiciones.
Set de datos
PHOSPHAY.MPJ
Nota: Es probable que en esta página web no aparezcan todos los elementos del presente documento. Para tenerlo completo y en su formato original recomendamos descargarlo desde el menú en la parte superior
Lic. Angélica Esquivel Ing. Maria Valle Alumnas de la Universidad del Noreste de Coahuila
ccdiagararrobahotmail.comAcerca de GestioPolis: Qué es GestioPolis — Términos de uso y Política de privacidad — Mapa del sitio — Contácto — Aliados — Contratar publicidad
Derechos de Autor: Los contenidos están bajo la licencia Reconocimiento - No comercial - Compartir bajo la misma licencia 3.0 Unported de Creative Commons a menos que se indiquen derechos de autor específicos. Si desea citar o utilizar públicamente alguno de los contenidos le solicitamos ponerse en contacto con el respectivo autor.
Derechos Reservados sobre el concepto del sitio web GestioPolis.com © 2008 Carlos López