Qual seria o equivalente normalizado ao Skewness que teria a mesma unidade que os dados? Da mesma forma, qual seria o equivalente normalizado à curtose? Idealmente, essas funções devem ser lineares com relação aos dados, o que significa que, se todas as observações fossem multiplicadas por um fator n
, a assimetria normalizada e a curtose resultantes seriam multiplicadas pelo mesmo fator n
. O benefício de ter esses equivalentes normalizados seria poder cobri-los sobre um gráfico padrão de caixa e bigode.
10
Respostas:
As medidas de assimetria são deliberadamente sem unidade .
A distorção de momento usual é um terceiro momento padronizado, .E[(X−μσ)3]
Se você centraliza, mas não padroniza, você tem ... que é claramente então em unidades em cubos .μ3=E[(X−μ)3]
Se você quisesse algo nas mesmas unidades que , teria que pegar a raiz do cubo, da mesma forma que pegamos a raiz quadrada de variação e obtivemos algo nas mesmas unidades dos dados originais. (No entanto, cuidado, porque muitos pacotes não têm raízes negativas em números negativos, você pode calculá-lo como: )X sign(X−μ)×|E(X−μ)3|1/3
Não tenho certeza de quão útil isso será.
Para algumas outras medidas de assimetria, como as duas medidas de assimetria de Pearson, você apenas multiplica por .σ
Para medidas de assimetria da amostra em que e geralmente não são conhecidos, como na assimetria da amostra, você normalmente as substitui por suas próprias estimativas de amostra.σ μ
A curtose segue o mesmo padrão - para curtose momentânea, é necessário criar a quarta raiz do quarto momento não padronizado para obter algo que seja escalonado com os dados.
Para algumas das outras medidas de curtose, elas só precisariam ser multiplicadas por .σ
fonte
A assimetria e curtose são características da forma. Então, se eu lhe disser que a coisa, uma bola, é redonda , não importa o raio da coisa. Pode ser uma bola pequena ou uma bola grande . Por outro lado, quando digo bola pequena ou cubo grande , estou me referindo ao tamanho do objeto, não à forma.
Nesse sentido, o desvio padrão é o tamanho da distribuição, e é por isso que a assimetria e a curtose são normalizadas pelo tamanho. Você também pode dizer que o desvio padrão pertence à mecânica, assimetria e curtose à geometria. Portanto, não, não precisamos tê-los em unidades de medida da variável. Tamanho e forma são separados. Uma bola grande e uma pequena são igualmente redondas , ou seja, o tamanho não importa neste caso :)
fonte
Denotando vetores distribuídos na região , vamos assumir o zeroth e o primeiro momento já está normalizado. O segundo momento é calculado com, portanto, se pudermos encontrar a diagonalização , poderemos definir para que seja normalizado:R M2=∫RxxT|dx| M2=PΛ2PT x′=Λ−1PTx M2
O significado geométrico do segundo momento é "orientação", justificado pelo fato de que a diagonalização normaliza o segundo momento. Quando a assimetria é calculada sob essa normalização, ela é denominada assimetria de Mardia .
fonte