Por "circular", entendo que a distribuição está concentrada em uma região circular, como neste gráfico de contorno de um pdf.
Se essa estrutura existe, mesmo que parcialmente, uma maneira natural de identificá-la e mensurá-la é calcular a distribuição circular em torno de seu centro . (Intuitivamente, isso significa que, para cada raio possível , devemos espalhar a probabilidade de estar na distância do centro igualmente em todas as direções.) Denotando as variáveis como , o centro deve estar localizado no ponto de primeiros momentos . Para fazer a média, é conveniente definir a função de distribuição radialr ( X , Y ) ( μ X , μ Y )rr(X,Y)(μX,μY)
F(ρ)=Pr[(X−μX)2+(Y−μY)2≤ρ2],ρ≥0;
F(ρ)=0,ρ<0.
Isto captura a probabilidade total de mentir entre a distância e do centro. Para espalhá-lo para fora em todas as direcções, deixe ser uma variável aleatória com CDF e ser uma variável aleatória uniforme em independente de . A variável aleatória bivariada é a média circular de . (Isso faz o trabalho que a nossa intuição exige de uma "média circular" porque (a) tem a distribuição radial correta, ou seja , , por construção e (b) todas as direções do centro (0ρRFΘ[0,2π]R(Ξ,H)=(Rcos(Θ)+μX,Rsin(Θ)+μY)(X,Y)FΘ) são igualmente prováveis.)
Nesse ponto, você tem muitas opções: tudo o que resta é comparar a distribuição de com a de . As possibilidades incluem uma distância e a divergência de Kullback-Leibler (junto com inúmeras medidas de distância relacionadas: divergência simetrizada, distância de Hellinger, informações mútuas etc. ). A comparação sugere que pode ter uma estrutura circular quando está "próximo" de . Neste caso, a estrutura pode ser "extraídos" de propriedades de . Por exemplo, uma medida da localização central de , como sua média ou mediana, identifica o "raio" da distribuição de(X,Y)(Ξ,H)Lp(X,Y)(Ξ,H)FF(X,Y) e o desvio padrão (ou outra medida de escala) de expressa como "espalhado" está nas direções radiais sobre sua localização central .F(X,Y)(μX,μY)
Ao amostrar a partir de uma distribuição, com dados , um teste razoável de circularidade é estimar a localização central como de costume (com médias ou medianas) e, portanto, converter cada valor em coordenadas polares relação ao centro estimado. Compare o desvio padrão (ou IQR) dos raios com a média (ou mediana). Para distribuições não circulares, a proporção será grande; para distribuições circulares, deve ser relativamente pequeno. (Se você tem um modelo específico em mente para a distribuição subjacente, pode elaborar a distribuição amostral da estatística radial e construir um teste de significância com ela.) Separadamente, teste a coordenada angular para uniformidade no intervalo(xi,yi),1≤i≤n(xi,yi)(ri,θi)[0,2π) . Será aproximadamente uniforme para distribuições circulares (e também para algumas outras distribuições); não uniformidade indica um desvio da circularidade.
A informação mútua possui propriedades um pouco análogas à covariância. Covariância é um número que é 0 para variáveis independentes e diferente de zero para variáveis que são linearmente dependentes. Em particular, se duas variáveis são iguais, a covariância é igual à variância (que geralmente é um número positivo). Um problema da covariância é que ela pode ser zero, mesmo que duas variáveis não sejam independentes, desde que a dependência seja não-linear.
Informação mútua (MI) é um número não negativo. É zero se e somente se as duas variáveis forem estatisticamente independentes. Essa propriedade é mais geral que a covariância e cobre quaisquer dependências, incluindo não lineares.
Se as duas variáveis forem iguais, o MI será igual à entropia da variável (novamente, geralmente um número positivo). Se as variáveis forem diferentes e não estiverem relacionadas deterministicamente, o MI será menor que a entropia. Nesse sentido, o IM de duas variáveis varia entre 0 e H (a entropia), com 0 somente se independente e H somente se for dependente deterministicamente.
Uma diferença da covariância é que o "sinal" da dependência é ignorado. Por exemplo, , mas .Cov(X,−X)=−Cov(X,X)=−Var(X) MI(X,−X)=MI(X,X)=H(X)
fonte
Por favor, dê uma olhada no seguinte artigo da ciência - ele aborda exatamente o seu ponto:
Detectando novas associações em grandes conjuntos de dados por David N. Reshef et al.
Do resumo:
Você encontra material suplementar aqui: http://www.sciencemag.org/content/suppl/2011/12/14/334.6062.1518.DC1
Os autores ainda fornecem uma ferramenta gratuita incorporando o novo método que pode ser usado com o R e o Python: http://www.exploredata.net/
fonte