Lee e Lemieux (p. 31, 2009) sugerem que o pesquisador apresente os gráficos enquanto faz a análise de projeto de descontinuidade por regressão (RDD). Eles sugerem o seguinte procedimento:
" ... por alguma largura de banda , e por algum número de caixas e para a esquerda e à direita do valor de corte, respectivamente, a idéia é construir silos ( , ], para + , onde "K 0 K 1 b k b k + 1 k = 1 , . . . , K = K 0 K 1 b k = c - ( K 0 - k + 1 ) ⋅ h .
c=cutoff point or threshold value of assignment variable
h=bandwidth or window width.
... compare os resultados médios apenas à esquerda e à direita do ponto de corte ... "
..em todos os casos, também mostramos os valores ajustados de um modelo de regressão quártica estimado separadamente em cada lado do ponto de corte ... (p. 34 do mesmo artigo)
A minha pergunta é como é que vamos programar esse procedimento em Stata
ou R
para traçar os gráficos de variável de resultado contra variável de atribuição (com intervalos de confiança) para o RDD afiada .. Um exemplo amostra Stata
é mencionado aqui e aqui (substitua rd com rd_obs) e uma amostra exemplo em R
está aqui . No entanto, acho que os dois não implementaram a etapa 1. Observe que ambos têm os dados brutos junto com as linhas ajustadas nas plotagens.
Gráfico de amostra sem variável de confiança [Lee e Lemieux, 2009] Agradecemos antecipadamente.
Respostas:
twoway
Como você pode ver, as linhas no primeiro gráfico são as mesmas do segundo.
fonte
Aqui está um algoritmo enlatado. Calonico, Cattaneo e Titiunik propuseram recentemente um procedimento para seleção robusta de largura de banda. Eles implementaram seu trabalho teórico para Stata e R , e também vem com um comando de plotagem. Aqui está um exemplo em R:
Isso lhe dará este gráfico:
fonte