Gostaria de eliminar todas as linhas que contêm valores de NaN pertencentes a uma coluna. Vamos supor que eu tenho um conjunto de dados como este:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
32 5'5 165 NaN
21 NaN 155 F
55 5'10 170 NaN
Quero remover todas as linhas em que 'Gender' possui valores de NaN. A saída que eu gostaria:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
21 NaN 155 F
Desde já, obrigado!
machine-learning
python
data-cleaning
data
uharsha33
fonte
fonte
Respostas:
Bem, se o conjunto de dados não for muito grande, sugiro usar pandas para limpar os dados. Então você precisaria primeiro fazer
Python2
Python3
Se você já possui o anaconda instalado, pode pular a etapa acima. Em seguida, você pode passar por um IDE (como o jupyter) ou pelo tipo de shell, os seguintes comandos
Então você deseja salvar seu resultado em um arquivo com
fonte
Se você estiver trabalhando no Python Dataframe, tente isso.
Ou você pode usar notnull em vez de isfinite.
fonte