Eu li esta pergunta: Como interpretar a saída de importância do XGBoost? sobre os três tipos diferentes de importância dos recursos: frequência (chamada "peso" no Python XGBoost), ganho e cobertura.
No meu caso, eu tenho um recurso, Gender, que tem uma importância muito baixa com base na métrica de frequência, mas é o recurso mais importante de longe com base nas métricas de ganho e de cobertura.
Eu sei que o gênero deve ser importante para o que estou prevendo. Se eu plotar apenas sexo versus o alvo, há uma correlação clara. Não estou surpreso que seja a característica mais importante. Eu só quero saber por que não é considerado um recurso importante com base na métrica de frequência.