Estatísticas e Big Data

10
Diferença de Média vs. Diferença Média

Ao estudar duas amostras independentes, nos dizem que estamos olhando para a "diferença de duas médias". Isso significa que pegamos a média da população 1 ( ) e subtraímos a média da população 2 ( ). Portanto, nossa "diferença de dois meios" é ( - \ bar y_2 ). ˉ y 2 ˉ y 1 ˉ y 2y¯1y¯1\bar...

10
A mediana é uma propriedade "métrica" ​​ou "topológica"?

Peço desculpas pelo leve abuso de terminologia; Espero que fique claro o que quero dizer abaixo. Considere uma variável aleatória . Tanto a média quanto a mediana podem ser caracterizadas por um critério de otimalidade: a média é o número que minimiza e a mediana esse número que minimiza . Nesta...

10
Distinguir entre efeitos de curto e longo prazo

Li num artigo a seguinte frase: O fato de existir uma diferença entre os coeficientes de curto e longo prazo é resultado de nossa especificação, que inclui variáveis ​​endógenas defasadas. Eles executam uma regressão nas primeiras diferenças e incluem um atraso na variável dependente. Agora...

10
Como evitar o termo log (0) na regressão

Eu tenho os seguintes vetores X e Y simples: > X [1] 1.000 0.063 0.031 0.012 0.005 0.000 > Y [1] 1.000 1.000 1.000 0.961 0.884 0.000 > > plot(X,Y) Quero fazer a regressão usando o log do X. Para evitar o log (0), tento colocar +1 ou +0,1 ou +0,00001 ou +0,000000000000001: >...

10
O que é bucketização?

Eu tenho procurado uma explicação clara de "bucketização" no aprendizado de máquina sem sorte. O que eu entendo até agora é que a bucketização é semelhante à quantização no processamento de sinal digital, onde uma faixa de valores contínuos é substituída por um valor discreto. Isso está...