Perguntas com a marcação «web-scraping»

Web scraping é o processo de extração de informações específicas de sites que não fornecem prontamente uma API ou outros métodos de recuperação automatizada de dados. Perguntas sobre "Como começar a raspar" (por exemplo, com Excel VBA) devem ser * exaustivamente pesquisadas *, pois vários exemplos de código funcional estão disponíveis. Os métodos de web scraping incluem aplicativos de terceiros, desenvolvimento de software personalizado ou até mesmo coleta manual de dados de maneira padronizada.

386
Como encontrar elementos por classe

Estou tendo problemas para analisar elementos HTML com o atributo "class" usando Beautifulsoup. O código fica assim soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div Eu recebo um erro na mesma linha "depois" do script...

16
Como raspar mais rápido

O trabalho aqui é para raspar uma API um site que começa a partir https://xxx.xxx.xxx/xxx/1.jsonde https://xxx.xxx.xxx/xxx/1417749.jsone escrevê-lo exatamente para MongoDB. Para isso, tenho o seguinte código: client = pymongo.MongoClient("mongodb://127.0.0.1:27017") db = client["thread1"] com =...