Existe alguma API para rastrear resumo de papel?

13

Se eu tiver uma lista muito longa de nomes de artigos, como obter um resumo desses artigos na Internet ou em qualquer banco de dados?

Os nomes dos artigos são como "Avaliação da utilidade na mineração da Web para o domínio da saúde pública".

Alguém conhece alguma API que possa me dar uma solução? Eu tentei rastrear o Google Scholar, no entanto, o Google bloqueou meu rastreador.

Alex Gao
fonte
2
Duvido que exista alguma API geral para isso. Você pode tentar rastrear vários serviços, como o Academia.edu, sites de editores e assim por diante. No entanto, seria mais fácil criar um banco de dados local de documentos primeiro e depois experimentar a extração dos resumos.
Wojciech Walczak
Obrigado pela sua resposta! Eu já construí um banco de dados local para isso. O problema de rastrear a partir de vários serviços é que preciso criar regras de análise para cada site.
Alex Gao
Então, que tal converter PDFs em TXTs e depois extrair os resumos com expressões regulares?
Wojciech Walczak
valeu! No entanto, o contrato afirma que o download massivo de documentos não é permitido. Isso cria alguma dor de cabeça.
Alex Gao
2
Acho que esse link de resposta de estouro de pilha fornece a melhor resposta que posso obter. Talvez as pessoas que encontrarem esse problema também possam dar uma olhada nesta página.
Alex Gao

Respostas:

8

Procure em:

Se você obtiver uma única correspondência exata do título, provavelmente encontrará o artigo certo e poderá preencher as demais informações a partir daí. Ambos oferecem links para download e saída no estilo bibtex. O que você provavelmente gostaria de fazer para obter metadados perfeitos é fazer o download e analisar o pdf (se houver) e procurar o identificador no estilo DOI.

Seja gentil e limite os seus pedidos se fizer isso.

Alex I
fonte
5

O arXiv possui uma API e um download em massa, mas se você quiser alguma coisa para periódicos pagos, será difícil encontrá-lo sem pagar um indexador como pubmed ou elsevier ou algo semelhante.

cwharland
fonte
1
Muito obrigado. No entanto, o arXiv fornece os documentos de que preciso.
Alex Gao