TypeError: é necessário um objeto semelhante a bytes, não 'str'
ficando acima do erro ao executar o código python abaixo para salvar os dados da tabela HTML no arquivo CSV. não sei como obter rideup.pls me ajudar.
import csv
import requests
from bs4 import BeautifulSoup
url='http://www.mapsofindia.com/districts-india/'
response=requests.get(url)
html=response.content
soup=BeautifulSoup(html,'html.parser')
table=soup.find('table', attrs={'class':'tableizer-table'})
list_of_rows=[]
for row in table.findAll('tr')[1:]:
list_of_cells=[]
for cell in row.findAll('td'):
list_of_cells.append(cell.text)
list_of_rows.append(list_of_cells)
outfile=open('./immates.csv','wb')
writer=csv.writer(outfile)
writer.writerow(["SNo", "States", "Dist", "Population"])
writer.writerows(list_of_rows)
acima da última linha.
csv
python-3.x
beautifulsoup
html-table
ShivaGuntuku
fonte
fonte
Respostas:
Você está usando a metodologia Python 2 em vez do Python 3.
Mudança:
Para:
e você obterá um arquivo com a seguinte saída:
No Python 3, o csv aceita a entrada no modo de texto, enquanto no Python 2 a aceita no modo binário.
Editado para adicionar
Aqui está o código que eu corri:
fonte
csv
módulo, o Python 3open
também deve ternewline=''
como parâmetro [ref ]Eu tive o mesmo problema com o Python3. Meu código estava escrevendo
io.BytesIO()
.Substituindo por
io.StringIO()
resolvido.fonte
io.StringIO()
é a ganância da memória e pode ser uma dor de cabeça com arquivos grandes.No meu caso, usei o BeautifulSoup para escrever um .txt com o Python 3.x. Teve o mesmo problema. Assim como @tsduteba disse, altere o 'wb' na primeira linha para 'w'.
fonte
basta mudar wb para w
para
fonte
Você está abrindo o arquivo csv no modo binário, ele deve ser
'w'
fonte