Teste de permutação aleatória para seleção de recursos

9

Estou confuso sobre a análise de permutação para seleção de características em um contexto de regressão logística.
Você poderia fornecer uma explicação clara do teste de permutação aleatória e como ele se aplica à seleção de recursos? Possivelmente com algoritmo e exemplos exatos.

Finalmente, como ele se compara a outros métodos de encolhimento, como Lasso ou LAR?

Ugo
fonte
5
Você quer dizer algo como, por exemplo, onde as entradas de uma única coluna da matriz de design são permutadas, mantendo a resposta e outras covariáveis ​​fixas? Se você tem uma referência específica em uso, pode ser útil listá-la.
cardeal
Penso que este link citeseerx.ist.psu.edu/viewdoc/… se refere à técnica correta. Atualmente, estou tentando entrar novamente em contato com o professor que me disse sobre este método ...
Ugo
Não conseguiu entrar em contato com ele (Donald Geman)
Ugo
2
existem pontos pouco claros na sua pergunta que você pode querer esclarecer. No artigo vinculado, há uma descrição bastante clara do algoritmo. Deseja perguntar algo específico sobre esse algoritmo? É a idéia de fazer a seleção de recursos calculando os valores marginais dos quais você deseja uma explicação? Além disso, você deve questionar a definição 2 do artigo. É uma afirmação não suportada, que pode ser uma suposição de trabalho, mas pequenos valores marginais de geralmente não significam relevância. A propósito, o LAR está fazendo regressão linear e não é realmente para respostas binárias. pp
NRH

Respostas:

10

(Não tem muito tempo agora, responderei brevemente e depois expandirei)

mnθmnθppmn

θpθ

Esse processo é repetido em todos os recursos e, em seguida, o subconjunto de recursos usado para classificação pode ser selecionado de duas maneiras:

  • N
  • <ϵ
Benhamner
fonte