Calcular valor p no bootstrap emparelhado

8

Encontrei um novo artigo do grupo de PNL de Berkeley sobre testes estatísticos, Uma Investigação Empírica de Significância Estatística na PNL .

Existe um pseudocódigo para calcular um valor-p no artigo, basicamente, a ideia é que o conjunto de amostras de seja amostrado com a substituição dos dados . Então xx1,x2,...,xNx

valor p=contagem(δ(xEu)>2δ(x))/N , em que é um ganho métrico.δ(xEu)

Eu pude entender a fórmula para calcular o valor-p no artigo de Koehn, testes de significância estatística para avaliação de tradução automática , na qual:

valor p=contagem(δuma(xEu)<δb(xEu))/N , onde e são o ganho de métrica para o sistema de e respectivamente.δ b a bδumaδbumab

Existe alguma explicação ou de referência para a fórmula . Os autores também observaram que se a média de é e é simétrica, as duas fórmulas acima são equivalentes.δ ( x i ) δ ( x ) δ ( x i )valor p=contagem(δ(xEu)>2δ(x))/Nδ(xEu)δ(x)δ(xEu)

Ke Tran
fonte

Respostas:

1

Até onde eu entendo, olhando para a seção 2, os autores parecem explicar sua lógica para o teste de autoinicialização da seguinte maneira:

"o foi amostrado a partir de , portanto, a média não será zero, como exige a hipótese nula; a média será em torno de ... A solução é uma re-centralização a média - queremos saber com que frequência faz mais do que melhor que o esperado.Esperamos que ele supere por . Portanto, contamos quantos têm batendo por pelo menos . " x δ ( x i ) δ ( x ) A δ ( x ) B δ ( x ) x i A B δ ( x )xEuxδ(xEu)δ(x)UMAδ(x)Bδ(x)xEuUMABδ(x)

Os autores desejam testar se o ganho é diferente de zero, para que escrevam o valor p como , que pode ser reescrito como ; porque o RHS da desigualdade se torna , que é o eles estavam tentando rejeitar.δ(xEu)<2δ(x)0 0<2δ(x)-δ(xEu)E[δ(xEu)]=δ(x)δ(x)H0 0

Sameer
fonte