Conduzi a Correspondência de Pontuação de Prospensidade (em R, usando o pacote R "Matchit"). Eu usei o método correspondente "vizinho mais próximo". Após a comparação, comparei o tratamento e o grupo de controle em termos da variável de resultado. Para esta comparação, usei o teste t. Descobri que, após cada procedimento de correspondência, os resultados do teste t mudavam. Para testar minha suposição de que essa alteração nos resultados ocorreu devido à seleção aleatória dos escores de propensão (que são usados para a correspondência de vizinhos mais próximos), configurei o gerador de números aleatórios para uma semente específica e conduzi o procedimento de correspondência várias vezes. Ao definir o RNG, os resultados não diferiram mais.
- Confrontado com resultados diferentes após cada procedimento de correspondência: como decido qual solução de correspondência eu uso para análises adicionais? É um método válido para realizar a combinação de produtos várias vezes (digamos 10.000) e relatar a mediana dos valores p e t dos resultados que recebo dos vários testes t?
Respostas:
Isso acontece quando você tem (pelo menos) dois indivíduos com a mesma pontuação de propensão. MatchIt seleciona aleatoriamente um para incluir no conjunto correspondente. Minha recomendação seria selecionar um conjunto correspondente e realizar sua análise com ele. Concordo que tentar outros métodos de condicionamento, como correspondência completa e IPW, seria uma boa ideia. Você pode relatar resultados de várias análises em uma seção de análise de sensibilidade.
Edit : Esta é provavelmente a resposta errada. Veja a resposta de Viktor para saber qual é provavelmente a causa real.
fonte
set.seed()
antes da correspondência.Esse é um comportamento padrão do pacote MatchIt. Ele embaralha as observações antes da correspondência, ou seja, seleciona aleatoriamente a ordem da correspondência para as observações tratadas. Você pode usar a
set.seed()
função para corrigir os resultados. Por exemplo, ligueset.seed(100)
antes de ligarmatchit()
. Diferentes argumentos deset.seed()
corresponderão a diferentes correspondências.fonte
Esta é uma questão muito interessante. A primeira explicação que posso sugerir é que seu estudo é bem pequeno e, portanto, poucas diferenças de correspondência são impactantes. Em geral, a correspondência de vizinhos mais próximos não é muito precisa. A conexão do compasso de calibre é mais confiável e, possivelmente, as diferenças relatadas diminuiriam ou desapareceriam com o uso (como no uso da ponderação de tratamento com probabilidade inversa). Por fim, não tenho certeza se você usou o teste t para comparar diferenças de linha de base (o que é inadequado, pois isso deve ser feito calculando diferenças padronizadas) ou para testes de hipóteses (nesse caso, um teste emparelhado). Em qualquer caso, a abordagem típica de relatório é simplesmente relatar os resultados de um único procedimento de correspondência, desde que feito corretamente (por exemplo, com correspondência de paquímetro).
fonte