Los temas más recientes de mi blog han tenido que ver conComponentes de máquinas de soldadura por olapero también me interesa la estadística . ¿Alguna vez ha tenido que comparar dos o más conjuntos de datos para tratar de entender si no estaban relacionados o eran estadísticamente significativos? Hace poco tuve que resolver este problema comparando variables de dos máquinas de ensamblaje SMT diferentes.
Es la primera vez que tengo que utilizar la estadística desde que la estudié en la universidad, así que tuve que repasar algunas cosas. La prueba concreta que tenía que realizar no la tenía clara al principio del análisis. Digamos que las máquinas medían exactamente la misma variable, la única diferencia era la máquina. Quería saber qué máquina era más precisa. O, mejor aún, si había una diferencia estadísticamente significativa entre los dos conjuntos de resultados. Empecemos con la definición de "estadísticamente significativo". Según Googleladefinición de estadísticamente significativo es. "La probabilidad de que un resultado o una relación se deba a algo distinto del mero azar. Tradicionalmente se emplean pruebas estadísticas de hipótesis para determinar si un resultado es estadísticamente significativo o no".
Tras investigar un poco, descubrí que podía utilizar la prueba t o el análisis de la varianza (ANOVA). La prueba t examina las diferencias entre dos grupos utilizando una única variable, mientras que la variable independiente sólo debe tener dos grupos. El análisis ANOVA comprueba la significación de las diferencias entre dos o más grupos de datos. La variable independiente debe tener dos o más categorías. El ANOVA sólo determina que hay una diferencia entre grupos, pero no dice cuál es diferente. Por extraño que parezca, si se realiza el análisis ANOVA para dos variables independientes se obtiene el mismo resultado que utilizando la pruebat. He aquí una instantánea del aspecto de mis datos:
Después de utilizar el software JMP y activar la opción "Medias/ANOVA/Pooled t", mis datos tienen ahora este aspecto:
Según la página de soporte de JMP, "El valor Prob > F mide la probabilidad de obtener una Razón F tan grande como la observada, dado que todos los parámetros excepto la intercepción son cero. Los valores pequeños de Prob > F indican que la razón F observadaes improbable. Tales valores se consideran evidencia de que hay al menos un efecto significativo en el modelo". Estos datos se ajustan a la descripción, así que utilicé una prueba secundaria, la prueba de Tukey-Kramer, para verificar mis resultados. Al seleccionar esta prueba, la imagen de los datos cambia ligeramente a esto:
La primera vez que empleé esta prueba no entendí muy bien lo que representaban los círculos. He aquí el gráfico más completo que he encontrado.
Como los círculos no se superponen en absoluto, los resultados son significativamente diferentes.
También hay una matriz de diferencia mínima significativa o umbral LSD que aparece cuando se selecciona el análisis Tukey-Kramer. Se muestra a continuación:
La forma de leer la matriz es que, cuando se compara A con B, hay un número positivo que indica que el par de medias es significativamente diferente.
De vez en cuando voy a salpicar en los puestos que son diferentes de mi programa estándar de fundentes, precalentadoresetc. para discutir otros temas o experimentos que he llevado a cabo aquí en la Indium Corporation. Por favor, no dude en ponerse en contacto conmigo con cualquier pregunta, preocupación o datos curiosos. (Siempre estoy abierto a nuevas ideas y conceptos.







