Resultados diferentes após a correspondência do escore de propensão em R

8

Conduzi a Correspondência de Pontuação de Prospensidade (em R, usando o pacote R "Matchit"). Eu usei o método correspondente "vizinho mais próximo". Após a comparação, comparei o tratamento e o grupo de controle em termos da variável de resultado. Para esta comparação, usei o teste t. Descobri que, após cada procedimento de correspondência, os resultados do teste t mudavam. Para testar minha suposição de que essa alteração nos resultados ocorreu devido à seleção aleatória dos escores de propensão (que são usados ​​para a correspondência de vizinhos mais próximos), configurei o gerador de números aleatórios para uma semente específica e conduzi o procedimento de correspondência várias vezes. Ao definir o RNG, os resultados não diferiram mais.

  1. Confrontado com resultados diferentes após cada procedimento de correspondência: como decido qual solução de correspondência eu uso para análises adicionais? É um método válido para realizar a combinação de produtos várias vezes (digamos 10.000) e relatar a mediana dos valores p e t dos resultados que recebo dos vários testes t?
Brisa
fonte
2
Não sei ao certo por que isso está sendo votado fora do tópico, pois parece haver uma pergunta estatística aqui que é completamente independente de qual software está sendo usado.
Mdewey
1
Parece que esta questão é uma segunda via stats.stackexchange.com/questions/118636/...
Viktor

Respostas:

1

Isso acontece quando você tem (pelo menos) dois indivíduos com a mesma pontuação de propensão. MatchIt seleciona aleatoriamente um para incluir no conjunto correspondente. Minha recomendação seria selecionar um conjunto correspondente e realizar sua análise com ele. Concordo que tentar outros métodos de condicionamento, como correspondência completa e IPW, seria uma boa ideia. Você pode relatar resultados de várias análises em uma seção de análise de sensibilidade.

Edit : Esta é provavelmente a resposta errada. Veja a resposta de Viktor para saber qual é provavelmente a causa real.

Noé
fonte
Obrigado Noah pela sua resposta. Sua explicação é muito útil. Decidi fazer uma correspondência de paquímetro de vizinho mais próximo (ordem aleatória), conforme sugerido por Austin (2014). Como você recomendou, selecionei um conjunto correspondente e realizei minha análise com ele.
Breeze
Eu acho que é uma explicação errada. Observações com pontuações de propensão coincidentes são muito, muito traseiras. O fato é que o MatchIt seleciona aleatoriamente a ordem das observações tratadas para correspondência. Você pode corrigir a correspondência ligando set.seed()antes da correspondência.
Viktor
Eu concordo com você @Viktor. Vou editar minha resposta.
Noah
1

Esse é um comportamento padrão do pacote MatchIt. Ele embaralha as observações antes da correspondência, ou seja, seleciona aleatoriamente a ordem da correspondência para as observações tratadas. Você pode usar a set.seed()função para corrigir os resultados. Por exemplo, ligue set.seed(100)antes de ligar matchit(). Diferentes argumentos de set.seed()corresponderão a diferentes correspondências.

Viktor
fonte
0

Esta é uma questão muito interessante. A primeira explicação que posso sugerir é que seu estudo é bem pequeno e, portanto, poucas diferenças de correspondência são impactantes. Em geral, a correspondência de vizinhos mais próximos não é muito precisa. A conexão do compasso de calibre é mais confiável e, possivelmente, as diferenças relatadas diminuiriam ou desapareceriam com o uso (como no uso da ponderação de tratamento com probabilidade inversa). Por fim, não tenho certeza se você usou o teste t para comparar diferenças de linha de base (o que é inadequado, pois isso deve ser feito calculando diferenças padronizadas) ou para testes de hipóteses (nesse caso, um teste emparelhado). Em qualquer caso, a abordagem típica de relatório é simplesmente relatar os resultados de um único procedimento de correspondência, desde que feito corretamente (por exemplo, com correspondência de paquímetro).

Joe_74
fonte
1
Obrigado! Os tamanhos da amostra basal foram 1096 (controle) e 328 (grupo de tratamento). Após a correspondência, os dois tamanhos de grupo foram reduzidos para 324. Na verdade, realizei a correspondência do vizinho mais próximo usando uma pinça de 0,25 std da pontuação de propensão. Também comparei o par mais próximo com e sem o paquímetro - o que levou a que 4 unidades adicionais em cada grupo fossem descartadas. Eu calculei as diferenças padronizadas das médias das covariáveis ​​antes vs. depois da correspondência. Esses valores não foram alterados após cada correspondência, mas os valores na variável de resultado foram alterados.
Brisa
@ Brisa eu vejo. Você já tentou a correspondência 1: 2 ou IPTW?
21817 Joe_74
1
Olá Joe_74, obrigado pela sua resposta. Tentei a correspondência exata dentro da correspondência do vizinho mais próximo. Infelizmente, o tamanho da minha amostra foi reduzido para 294 unidades nos dois grupos. Se possível, gostaria de manter tamanhos de amostra acima de 300. Mas não encontrei a ponderação inversa do tratamento de probabilidade. Você recomendaria isto?
Breeze
@Breeze Definitivamente. IPTW é a chave para ajustar as diferenças residuais no PS. Usá-lo significa que você também pode manter todos os seus casos, não apenas os correspondentes.
Joe_74 10/02
1
isso parece interessante, obrigado. Eu posso tentar depois. Se eu conduzir minha correspondência conforme descrito acima (vizinho mais próximo com paquímetro), você me aconselharia a relatar os resultados de um único procedimento de correspondência aleatória? Como sempre recebo resultados diferentes, escolher apenas os resultados de um procedimento parece aleatório demais para mim ... qual a sua opinião sobre isso?
Breeze