Les sujets les plus récents de mon blog ont porté surComposants de la machine à souder à la vaguemais les statistiques sont également un sujet qui m'intéresse. Avez-vous déjà eu à comparer deux ou plusieurs ensembles de données pour essayer de comprendre s'ils n'étaient pas liés ou s'ils étaient statistiquement significatifs ? J'ai récemment dû résoudre ce problème en comparant les variables de deux machines d'assemblage SMT différentes.
C'est la première fois que j'ai dû utiliser des statistiques depuis le cours que j'ai suivi à l'université, et j'ai donc dû rafraîchir mes connaissances. Le test particulier que je devais effectuer n'était pas clair pour moi au début de l'analyse. Disons que les machines mesurent exactement la même variable, la seule différence étant la machine. Je voulais savoir quelle machine était la plus précise. Ou, mieux encore, s'il y avait une différence statistiquement significative entre les deux séries de résultats. Commençons par la définition de "statistiquement significatif". Selon Googleladéfinition de "statistiquement significatif" est la suivante. "Les tests d'hypothèses statistiques sont traditionnellement utilisés pour déterminer si un résultat est statistiquement significatif ou non."
Après quelques recherches, j'ai découvert que je pouvais utiliser soit le test t, soit l'analyse de la variance (ANOVA). Le test-t examine les différences entre deux groupes en utilisant une seule variable, alors que la variable indépendante ne doit comporter que deux groupes. L'analyse ANOVA teste la signification des différences entre deux ou plusieurs groupes de données. La variable indépendante doit comporter deux catégories ou plus. L'ANOVA détermine seulement qu'il y a une différence entre les groupes, mais ne dit pas laquelle est différente. Curieusement, si vous effectuez l'analyse ANOVA pour deux variables indépendantes, vous obtenez le même résultat qu'en utilisant le test-t. Voici un aperçu de mes données :
Après avoir utilisé le logiciel JMP et activé l'option "Means/ANOVA/Pooled t", mes données ressemblent maintenant à ceci :
D'après la page d'aide du page d'aide de JMP, "La valeur Prob > F mesure la probabilité d'obtenir un rapport F aussi important que celui observé, étant donné que tous les paramètres, à l'exception de l'ordonnée à l'origine, sont nuls. De petites valeurs de Prob > F indiquent que le rapport F observéest improbable. De telles valeurs sont considérées comme la preuve qu'il y a au moins un effet significatif dans le modèle". Ces données correspondent à la description, j'ai donc utilisé un test secondaire, le test de Tukey-Kramer, pour vérifier mes résultats. Lorsque vous sélectionnez ce test, l'image des données change légèrement :
Lorsque j'ai utilisé ce test pour la première fois, je n'ai pas bien compris ce que les cercles représentaient. Voici le graphique le plus complet que j'ai trouvé.
Comme les cercles ne se chevauchent pas du tout, les résultats sont sensiblement différents.
Une matrice de seuil de la plus petite différence significative (LSD) apparaît également lorsque vous sélectionnez l'analyse de Tukey-Kramer. Elle est affichée ci-dessous :
La lecture de la matrice est la suivante : lorsque vous comparez A à B, un nombre positif indique que la paire de moyennes est significativement différente.
De temps en temps, j'ajouterai des articles qui diffèrent de mon programme habituel de fluxeurs, préchauffeurspour discuter d'autres sujets ou expériences que j'ai menées ici à l'Indium Corporation. N'hésitez pas à me contacter si vous avez des questions, des préoccupations ou des anecdotes. (J'adore les faits amusants !!!) Je suis toujours ouvert aux nouvelles idées et aux nouveaux concepts.







