Estou tentando converter uma lista de listas que se parece com o seguinte em um Dataframe do Pandas
[['New York Yankees ', '"Acevedo Juan" ', 900000, ' Pitcher\n'],
['New York Yankees ', '"Anderson Jason"', 300000, ' Pitcher\n'],
['New York Yankees ', '"Clemens Roger" ', 10100000, ' Pitcher\n'],
['New York Yankees ', '"Contreras Jose"', 5500000, ' Pitcher\n']]
Estou basicamente tentando converter cada item da matriz em um quadro de dados do pandas que possui quatro colunas. Qual seria a melhor abordagem para isso, como o pd.Dataframe não me dá exatamente o que estou procurando.
Respostas:
fonte
DataFrame["Team"]
deve se referir ao primeiro item de cada sublist (iedata[i][0]
) eDataFrame["Position"]
se referir ao último item de cada sublist (iedata[i][-1]
)?columns
parâmetro DataFrame.from_records .Depois de ter os dados:
Você pode criar um quadro de dados a partir da transposição dos dados:
Outra maneira:
fonte
Você pode defini-lo diretamente como um quadro de dados da seguinte maneira:
fonte
fonte
Este foi de longe o mais simples:
agora, se as chaves forem a primeira lista na lista de listas (dados [0]), você poderá atribuí-las aos cabeçalhos das colunas no quadro de dados da seguinte maneira:
fonte