Como posso comparar 2 meios distribuídos pela Laplace?

10

Quero comparar duas médias de amostra para retornos de estoque de 1 minuto. Suponho que eles sejam distribuídos por Laplace (já verificados) e divido os retornos em 2 grupos. Como posso verificar se são significativamente diferentes?

Acho que não posso tratá-los como uma distribuição Normal, porque, embora tenham mais de 300 valores, o gráfico QQ mostra que há uma enorme diferença em relação à distribuição Normal

Roubar
fonte
Pedir código / pacotes está fora do tópico aqui, mas você tem uma questão estatística real oculta aqui. Você pode editar sua pergunta para esclarecer o problema estatístico subjacente. Você pode descobrir que, ao entender os conceitos estatísticos envolvidos, os elementos específicos do software são evidentes ou pelo menos fáceis de obter na documentação.
gung - Restabelece Monica
Quando você diz "diferente", está interessado apenas na diferença de médias e, em caso afirmativo, está assumindo que os spreads são idênticos?
Glen_b -Reinstala Monica
Sim, só quero saber se os meios são significativamente diferentes e suponho que a distribuição seja idêntica. Eu não nessecaraly assumir o desvio padrão a ser idênticos, mas eu acho que seria ok também
Rob
2
Forneça mais detalhes sobre os retornos de estoque de 1 minuto. Deseja comparar meios de dados correlacionados temporalmente?
Michael M
2
Observe também que o número de valores que você verifica não altera a distribuição; você pode estar pensando na distribuição das médias das amostras , que em para um Laplace estarão muito próximas do normal. n=300
Glen_b -Reinstala Monica

Respostas:

12

Supondo que as duas distribuições da Laplace tenham a mesma variação,

a) o teste da razão de verossimilhança envolveria uma estatística de teste como:

L=i=1n12τ^exp(|xiμ^|τ^)i=1n112τ^1exp(|xiμ^1|τ^1)i=n1+1n12τ^2exp(|xiμ^2|τ^2)

Tomando logs, cancelando / simplificando e multiplicando por .2

2l=2(nlog(τ^)n1log(τ^1)n2log(τ^2)) (onde )l=log(L)

onde , o desvio absoluto médio da mediana na amostra combinada e , o desvio absoluto médio da mediana na amostra .τ^=mτ^i=mii

De acordo com o teorema de Wilks, isso é distribuído assintoticamente como sob o valor nulo; portanto, para um teste de 5%, você rejeitaria se ultrapassasse ,.χ123.84

Experimentos de simulação sugerem que o teste é anticonservador em amostras pequenas (a probabilidade de rejeição é um pouco maior que a nominal), mas em cerca de n = 100, parece ser pelo menos razoável (você fica na ordem de 5,3% - 5,4% taxa de rejeição abaixo do nulo para um teste nominal de 5%, por exemplo; para , parece estar mais próximo de 5,25%).n1,n2>300

b) Também esperamos que seja uma boa estatística de teste (onde representa o mediana da amostra ); se eu não cometer um erro lá, em amostras grandes como a sua, ela será normalmente normalmente distribuída sob o nulo, com média 0 e variação 1, em que pode ser baseado no quadrado da desvio médio absoluto a partir da média da amostra combinada, , apesar de esperar que, na prática, tendem a funcionar melhor baseando-se em uma amostra média ponderada das duas a amostra 's .μ~1μ~2vμ~v=2τ^2(1n1+1n2)τ^2m2mi2

(Edit: simulação sugere que a aproximação normal é boa, mas o cálculo da variação não está correto acima; posso ver qual é o problema agora, mas ainda preciso corrigi-lo. A versão de permutação deste teste (consulte o item (c)) ainda deve estar bem).

c) Outra alternativa seria realizar um teste de permutação com base em uma das estatísticas acima. (Uma das respostas aqui fornece um esboço de como implementar o teste de permutação para uma diferença nas medianas.)

d) Você sempre pode fazer um teste de Wilcoxon / Mann-Whitney; será consideravelmente mais eficiente do que tentar usar um teste t no Laplace.

e) Melhor que (d) para os dados de Laplace seria o teste mediano de Mood; embora seja frequentemente recomendado nos livros, ao lidar com os dados da Laplace, eles mostrarão um bom poder. Espero que ele tenha poder semelhante à versão de permutação do teste assintótico da diferença de medianas (um dos testes mencionados em (c)).

A pergunta aqui fornece uma implementação R que usa um teste de Fisher, mas esse código pode ser adaptado para usar um teste do qui-quadrado (o que eu sugeriria mesmo em amostras moderadas); Como alternativa, há um código de exemplo para ele (não como uma função) aqui .

O teste mediano é discutido na Wikipedia aqui , embora não com muita profundidade (a tradução alemã vinculada tem um pouco mais de informação). Alguns livros sobre não paramétricos discutem isso.

Glen_b -Reinstate Monica
fonte
Ótimo, obrigado! Posso então usar a estatística de teste que você usou e rejeitá-la, se o quantil de Laplace para média = 0 e desvio padrão = 1 for excedido, como faria com o teste de distribuição Normal?
Rob
Sinto muito, realmente não sei o que você está perguntando lá, então você precisará explicar em detalhes o que você quer dizer. A que estatística de teste você está se referindo? [Você deve seguir os testes mencionados em (a), (c) ou (d), pois há algo errado com minha variação calculada no segundo, assintótico, rotulado em (b), como minha edição marcada com " " afirma claramente. Eu ainda tenho que consertar esse caso, mas talvez eu não consiga
resolvê-
@Glen_b. Resposta útil obrigado (+1), mas o modelo nulo possui 2 parâmetros ( e ), enquanto a alternativa possui 4. Portanto, deve ser ? (embora para o caso pequeno tamanho da amostra moderada Estou olhando Estou tabular valores de simulação de qualquer maneira)μ^τ^χ22
P.Windridge
Ou talvez você tenha usado uma única estimativa para a escala no modelo alternativo?
P.Windridge
@ P.Windridge Este é um ponto excelente. Sim, como tenho a expressão algébrica, é uma redução de 2 parâmetros livres ao passar da alternativa para a nula (mas, na verdade, eu estava pensando em assumir a mesma escala quando escrevi ). Eu preciso corrigir isso para que tudo fique consistente (e enquanto estiver nisso, devo refazer o trabalho para corrigir qualquer outro problema que eu mencionei na edição)χ12
Glen_b -Reinstate Monica