I miei argomenti più recenti sul blog hanno avuto a che fare conComponenti di saldatrici a ondama anche la statistica è un argomento che mi interessa. Vi è mai capitato di dover confrontare due o più serie di dati per cercare di capire se non fossero correlate o se fossero statisticamente significative? Recentemente ho dovuto risolvere questo problema confrontando le variabili di due diverse macchine di assemblaggio SMT.
È la prima volta che devo usare la statistica da quando ho frequentato il corso all'università, quindi ho dovuto ripassare un po' di cose. Il test particolare che dovevo eseguire non mi era chiaro all'inizio dell'analisi. Diciamo che le macchine misuravano esattamente la stessa variabile, l'unica differenza era la macchina. Volevo capire quale macchina fosse più precisa. O, meglio ancora, se ci fosse una differenza statisticamente significativa tra le due serie di risultati. Cominciamo con la definizione di "statisticamente significativo". Secondo Googleladefinizione di statisticamente significativo è. "La probabilità che un risultato o una relazione siano causati da qualcosa di diverso dal semplice caso. I test statistici di ipotesi sono tradizionalmente utilizzati per determinare se un risultato è statisticamente significativo o meno".
Dopo alcune ricerche, ho scoperto che potevo usare il test T o l'analisi della varianza (ANOVA). Il test-test esamina le differenze tra due gruppi utilizzando una singola variabile, mentre la variabile indipendente deve avere solo due gruppi. L'analisi ANOVA verifica la significatività delle differenze tra due o più gruppi di dati. La variabile indipendente deve avere due o più categorie. L'ANOVA determina solo l'esistenza di una differenza tra i gruppi, ma non dice quale sia la differenza. Stranamente, se si esegue l'analisi ANOVA per due variabili indipendenti, si ottiene lo stesso risultato del test-t. Ecco un'istantanea di come appaiono i miei dati:
Dopo aver utilizzato il software JMP e aver attivato "Means/ANOVA/Pooled t", i miei dati si presentano ora come segue:
Secondo la pagina di supporto di pagina di supporto di JMP, "Il valore Prob > F misura la probabilità di ottenere un rapporto F grande quanto quello osservato, dato che tutti i parametri tranne l'intercetta sono pari a zero. Valori piccoli di Prob > F indicano che il rapporto F osservatoè improbabile. Tali valori sono considerati una prova dell'esistenza di almeno un effetto significativo nel modello". Questi dati corrispondono alla descrizione, quindi ho utilizzato un test secondario, il test di Tukey-Kramer, per verificare i miei risultati. Quando si seleziona questo test, l'immagine dei dati cambia leggermente in questo modo:
Quando ho impiegato per la prima volta questo test, non ho capito bene cosa rappresentassero i cerchi. Ecco il grafico più completo che ho trovato.
Poiché i cerchi non si sovrappongono affatto, i risultati sono significativamente diversi.
Quando si seleziona l'analisi Tukey-Kramer, viene visualizzata anche una matrice della differenza minima significativa o soglia LSD. È visualizzata di seguito:
Il modo in cui si legge la matrice è che quando si confronta A con B, c'è un numero positivo che indica che la coppia di medie è significativamente diversa.
Di tanto in tanto inserirò a pioggia dei post diversi dal mio programma standard di flussi, preriscaldatoriecc. per parlare di altri argomenti o esperimenti che ho condotto qui alla Indium Corporation. Non esitate a contattarmi per qualsiasi domanda, dubbio o curiosità. (Sono sempre aperto a nuove idee e concetti.







