Estou comparando dois dispositivos de controle de temperatura, ambos projetados para manter a temperatura corporal em exatamente 37 graus em pacientes anestesiados. Os dispositivos foram ajustados para 500 pacientes, formando dois grupos. Grupo A (400 pacientes) - Dispositivo 1, Grupo B (100 pacientes) - Dispositivo 2. Cada paciente teve sua temperatura medida uma vez a cada hora durante 36 horas, fornecendo 18.000 pontos de dados em dois grupos. Preciso determinar qual dispositivo controla a temperatura corporal dos pacientes com mais precisão durante o período de 36 horas. Construí gráficos de linhas unindo os valores medianos em cada ponto do tempo com barras de quartil e, visualmente, parece haver uma diferença. Como devo analisar meus dados para provar uma diferença estatística?
10
Respostas:
Ao formular esse tipo de métrica, você está adotando implicitamente uma "função de penalidade" que penaliza as temperaturas que se desviam da temperatura desejada. Uma opção seria medir a "precisão" pela variação mais baixa em torno da temperatura desejada (tratando-a como a média fixa para o cálculo da variação). A variação penaliza por erro ao quadrado, de modo que fornece uma penalização razoável por altos desvios. Outra opção seria penalizar mais fortemente (por exemplo, erro em cubo). Outra opção seria simplesmente medir a quantidade de tempo que cada dispositivo mantém o paciente fora da faixa de temperatura que é medicamente segura. De qualquer forma, o que você escolher deve refletir os perigos percebidos do desvio da temperatura desejada.
Depois de determinar o que constitui uma métrica de "boa precisão", você estará formulando algum tipo de "teste de heterocedasticidade", formulado no sentido mais amplo de permitir qualquer medida de precisão que você esteja usando. Não tenho certeza se concordo com o comentário de whuber de ajustar a autocorrelação. Depende realmente da sua formulação de perda - afinal, permanecer em uma faixa de temperatura alta por um longo período de tempo pode ser exatamente a coisa mais perigosa; portanto, se você voltar a considerar a correlação automática, poderá terminar falha na penalização de resultados altamente perigosos o suficiente.
fonte
Este é um teste de homoscedasticidade. E por se tratar de uma série temporal, a escolha apropriada é o teste Breusch-Pagan , não o teste F. Este teste responde apenas SOMENTE à questão da igualdade de precisão entre os dois dispositivos. O nível de precisão é outra maneira de pensar na variação.
[Editar: Alterou o teste para o correto, considerando a dependência de tempo]
fonte
Se você estiver interessado em saber como os dispositivos mantêm uma temperatura de 37 ° C, você pode:
Os dados naturalmente se prestam ao tratamento de medidas repetidas. Ao tratar os ensaios em pessoa como clusters, você reduzirá a probabilidade de um intervalo de confiança falsamente estimado em torno do efeito do dispositivo. Além disso, você pode testar o efeito do tempo entre os dois dispositivos ou como uma interação com o dispositivo para verificar se a manutenção da temperatura ao longo do tempo foi boa. Encontrar uma maneira de visualizar tudo isso é de fundamental importância e pode sugerir uma abordagem em detrimento de outra. Algo ao longo das linhas de:
fonte