Os tópicos mais recentes do meu blogue têm a ver comComponentes de máquinas de soldar por ondamas a estatística é também algo que me interessa. Já alguma vez teve de comparar dois ou mais conjuntos de dados para tentar perceber se não estavam relacionados ou se eram estatisticamente significativos? Recentemente, tive de resolver este problema comparando variáveis de duas máquinas de montagem SMT diferentes.
Esta foi a primeira vez que tive de utilizar estatísticas desde que fiz o curso na faculdade, por isso tive de rever algumas coisas. O teste específico que precisava de efetuar não era claro para mim no início da análise. Digamos que as máquinas estavam a medir exatamente a mesma variável, a única diferença era a máquina. Eu queria perceber qual era a máquina mais precisa. Ou, melhor ainda, se havia uma diferença estatisticamente significativa entre os dois conjuntos de resultados. Vamos começar com a definição de "estatisticamente significativo". De acordo com o Googlea definição de estatisticamente significativo é. "a probabilidade de um resultado ou relação ser causado por algo diferente do mero acaso. O teste de hipóteses estatísticas é tradicionalmente utilizado para determinar se um resultado é estatisticamente significativo ou não."
Após alguma pesquisa, descobri que poderia usar o teste-t ou o teste de análise de variância (ANOVA). O teste-t analisa as diferenças entre dois grupos usando uma única variável, enquanto a variável independente deve ter apenas dois grupos. A análise ANOVA testa a significância das diferenças entre dois ou mais grupos de dados. A variável independente tem de ter duas ou mais categorias. A ANOVA apenas determina que existe uma diferença entre grupos, mas não diz qual é a diferença. Por estranho que pareça, se efetuar a análise ANOVA para duas variáveis independentes, obtém o mesmo resultado que utilizando o teste-t. Aqui está uma imagem instantânea do aspeto dos meus dados:
Depois de utilizar o software JMP e ativar a opção "Means/ANOVA/Pooled t", os meus dados têm o seguinte aspeto:
De acordo com a página de suporte do página de suporte do JMP, "O valor Prob > F mede a probabilidade de obter um rácio F tão grande como o observado, dado que todos os parâmetros, exceto a interceção, são zero. Valores pequenos de Prob > F indicam que o rácio F observadoé improvável. Tais valores são considerados evidência de que existe pelo menos um efeito significativo no modelo." Estes dados correspondem à descrição, pelo que utilizei um teste secundário, o teste de Tukey-Kramer, para verificar os meus resultados. Quando se seleciona este teste, a imagem dos dados muda ligeiramente para isto:
Quando utilizei este teste pela primeira vez, não compreendi bem o que os círculos representavam. Aqui está o gráfico mais completo que encontrei.
Uma vez que os círculos não se sobrepõem de todo, os resultados são significativamente diferentes.
Existe também uma diferença menos significativa ou Matriz de limiar LSD que aparece quando seleciona a análise Tukey-Kramer. Ela é exibida abaixo:
A forma de ler a matriz é: quando se compara A com B, há um número positivo que indica que o par de médias é significativamente diferente.
De tempos a tempos, vou espalhar mensagens que são diferentes do meu programa padrão de fluxers, pré-aquecedoresetc., para discutir outros tópicos ou experiências que realizei aqui na Indium Corporation. Por favor, sintam-se à vontade para me contactar com quaisquer questões, preocupações ou curiosidades. (Adoro factos divertidos!!!) Estou sempre aberto a novas ideias e conceitos.







