Estatísticas e Big Data

52
Excel como bancada de estatística

Parece que muitas pessoas (inclusive eu) gostam de fazer análise exploratória de dados no Excel. Algumas limitações, como o número de linhas permitido em uma planilha, são dolorosas, mas na maioria dos casos não tornam impossível o uso do Excel para brincar com dados. Um artigo de McCullough e...

52
Derivação da solução de laço de forma fechada

Para o problema do laço minβ(Y−Xβ)T(Y−Xβ)minβ(Y−Xβ)T(Y−Xβ)\min_\beta (Y-X\beta)^T(Y-X\beta) tal que ∥β∥1≤t‖β‖1≤t\|\beta\|_1 \leq t . Muitas vezes, vejo o resultado do limiar suave βlassoj=sgn(βLSj)(|βLSj|−γ)+βjlasso=sgn(βjLS)(|βjLS|−γ)+ \beta_j^{\text{lasso}}=...

52
Por que nos preocupamos tanto com os termos de erro normalmente distribuídos (e a homocedasticidade) na regressão linear quando não precisamos?

Suponho que fico frustrado toda vez que ouço alguém dizer que a não normalidade de resíduos e / ou heterocedasticidade viola as suposições do OLS. Para estimar parâmetros em um modelo OLS, nenhuma dessas suposições é necessária pelo teorema de Gauss-Markov. Vejo como isso é importante no Teste de...

52
Cumming (2008) afirma que a distribuição dos valores de p obtidos nas repetições depende apenas do valor de p original. Como isso pode ser verdade?

Eu tenho lido o artigo de 2008 de Geoff Cumming, Replication Intervalos: os valores de prevêem o futuro apenas vagamente, mas os intervalos de confiança são muito melhores pppppp p p[~ 200 citações no Google Scholar] - e estou confuso com uma de suas alegações centrais. Este é um dos artigos em que...

51
Estatística e inferência causal?

Em seu artigo de 1984 "Statistics and Causal Inference" , Paul Holland levantou uma das questões mais fundamentais em estatística: O que um modelo estatístico pode dizer sobre causalidade? Isso levou ao seu lema: SEM CAUSA SEM MANIPULAÇÃO que enfatizava a importância de restrições em...

51
O que é um bom recurso no design de tabelas?

Eu já vi vários tratamentos teóricos de gráficos, como a Gramática dos Gráficos . Mas não vi nada equivalente em relação às tabelas. Ao longo do tempo, desenvolvi um modelo informal de boas práticas em design de tabelas. No entanto, eu gostaria de poder fornecer uma boa referência aos alunos. O...