A versão geral:
Preciso estimar onde e são contínuos e multivariados. Prefiro fazê-lo de forma não paramétrica, porque não tenho uma boa forma funcional em mente e precisa ser algo como imparcial. Eu queria usar um estimador condicional de densidade do kernel, mas percebi que precisaria quantizar o primeiro. Então tive a ideia de estimar e partir dos dados e usá-lo para calcular , ou talvez eu o tenha lido em algum lugar e não lembro onde.
Existe uma razão para esse procedimento não ser válido? Existe uma abordagem melhor ou mais honesta do que a densidade do kernel? Além disso, existe um problema em estimar densidades populacionais a partir de densidades amostrais não parametricamente? Os dados são dados de pesquisa e eu tenho pesos de pesquisa; devo incorporá-los de alguma forma?
A versão específica do caso:
Provavelmente, vale a pena mencionar que vou usar essas estimativas para pesos inversos de probabilidade de tratamento em um modelo estrutural marginal, como em Robins (2000) ( PDF sem porta ). Observo uma sequência de "tratamentos" e uma sequência de fatores de confusão que variam no tempo com relação a alguns resultado que ocorre em . Eu propus uma hipótese de uma relação causal paramétrica simples, , mas como existe um fator de confusão variando no tempoé uma estimativa tendenciosa do "efeito médio do tratamento", e o fator de confusão não pode ser adicionado como um regressor, porque está no caminho causal e isso também irá influenciar . Felizmente, Doc Robins descobriu que posso obter estimativas imparciais / infundadas e razoavelmente eficientes se ponderar novamente minhas observações:
Minha pergunta: Essa sequência de pesos é realmente o que eu preciso de uma estimativa. Robins recomenda regressão logística. Mas está em , é medido em e, para todos os fins práticos, está em um subconjunto finito do mesmo. fica em um intervalo fechado, mas apenas porque é realmente a média de algumas variáveis, cada uma medida em um subconjunto finito de .
Então, eu tive algumas idéias:
- Estimado e não parametricamente
- Estime com regressão beta não parametricamente
- Estime com regressão beta, e estime ) "encadeando" regressões beta de volta no tempo para expressar a coisa toda como condicional.
- Algo realmente coerente e honesto na propagação da incerteza, no qual eu obviamente não pensei.
- Bayes? Conheço Stan e JAGS, mas o MCMC provavelmente explodirá meu computador (não quero lidar com o EC2).
Não encontrei nenhuma dica na literatura, pois tratamentos multivariados são raros na modelagem causal. O que devo fazer?
Pontos de bônus: como você se sente sobre a notação para representar vez de algo como ?
fonte