Perguntas com a marcação «high-dimensional»

Pertence a um grande número de recursos ou dimensões (variáveis) para dados. (Para um grande número de pontos de dados, use a tag [dados grandes]; se o problema for um número maior de variáveis ​​que os dados, use a tag [indeterminada].)

23
A redução de dimensionalidade para visualização deve ser considerada um problema "fechado", resolvido pelo t-SNE?

Eu tenho lido muito sobre o algoritmo sne para redução de dimensionalidade. Estou muito impressionado com o desempenho em conjuntos de dados "clássicos", como o MNIST, onde ele consegue uma separação clara dos dígitos ( consulte o artigo original ):ttt Também o usei para visualizar os recursos...

10
É o teorema do contraste relativo de Beyer et al. artigo: “Sobre o comportamento surpreendente das métricas de distância no espaço de alta dimensão” enganoso?

Isso é citado com muita frequência ao mencionar a maldição da dimensionalidade e vai (fórmula à direita chamada contraste relativo) limd→∞var(||Xd||kE[||Xd||k])=0,then:Dmaxkd−DminkdDminkd→0limd→∞var(||Xd||kE[||Xd||k])=0,then:Dmaxdk−DmindkDmindk→0 \lim_{d\rightarrow \infty} \text{var}...

9
Dados correlacionados de alta dimensão e principais recursos / covariáveis ​​descobertos; teste de múltiplas hipóteses?

Eu tenho um conjunto de dados com cerca de 5.000 recursos / covariáveis ​​frequentemente correlacionados e uma resposta binária. Os dados foram dados para mim, eu não os coletei. Uso Lasso e aumento de gradiente para construir modelos. Eu uso a validação cruzada iterada e aninhada. Relato os...