Ao avaliar a qualidade de um software que você está prestes a usar (seja algo que você escreveu ou um pacote em lata) no trabalho computacional, geralmente é uma boa ideia ver como ele funciona em conjuntos ou problemas de dados padrão. Onde se pode obter esses testes para verificar as rotinas computacionais?
(Um site / livro por resposta, por favor.)
Respostas:
Se você estiver interessado em conduzir uma análise sobre matrizes esparsas, eu também consideraria a Sparse Matrix Collection da Universidade da Flórida, na Davis, e o mercado de matrizes .
fonte
O método de soluções fabricadas é um padrão para testar PDEs e outros solucionadores. A maioria dos sistemas de álgebra simbólica possui instalações para gerar código, o que é útil para criar soluções fabricadas. SymPy e Maple possuem a função ccode, entre outros para esse fim.
fonte
Um conjunto de testes para IVPs (Initial Value Problems for ODE solucioners) é atualmente mantido por pessoas da Universidade de Bari, Itália, que o substituíram no CWI Amsterdam.
fonte
Para testar algoritmos de particionamento de gráficos, existe o Archive de Particionamento de Gráficos da Walshaw .
fonte
No eletromagnetismo computacional, existe um famoso (ou infame por causa das dificuldades em alguns) problemas de teste: Teste de métodos de análise eletromagnética (TEAM) .
Alguns deles realmente precisam de técnicas numéricas seriamente avançadas para obter os resultados corretos da simulação alinhados com os dados experimentais. Por exemplo, o problema da bobina do condutor .
Outro conjunto de problemas de teste para equações de Maxwell é compilado por Dauge: cálculos de benchmark para equações de Maxwell para a aproximação de soluções altamente singulares . Aquele no famoso (ou infame) cubo Fichera:
fonte
Se você estiver interessado em algoritmos de benchmarking relacionados a estruturas moleculares, o banco de dados pubchem possui uma grande coleção de moléculas principalmente orgânicas. Isso pode ser útil para comparar previsões de propriedades moleculares obtidas com diferentes modelos / programas. O site possui várias opções para baixar grandes lotes de moléculas que atendem a alguns critérios predefinidos (por exemplo, composição química).
fonte
Arnold Neumaier mantém um estábulo de problemas de teste para otimização irrestrita e restrita (programação não linear). Estão incluídos nesta coleção os problemas de teste agora padrão para otimização sem restrições devido a Moré, Garbow e Hillstrom.
fonte
O site CUTEr atualiza o conjunto de testes CUTE mencionado no site de Arnold Neumaier com alguns problemas adicionais para otimização e solucionadores lineares. Além disso, fornece ferramentas de software para teste e atualização de álgebra linear e solucionadores de otimização.
fonte
Os testes de Athena se você estiver resolvendo leis de conservação hiperbólica.
fonte
Utilizamos conjuntos de dados climáticos em nosso software de simulação de energia de edifícios. Para os EUA, os conjuntos de dados consistem em observações meteorológicas realizadas (geralmente em aeroportos) a cada hora nos 20 anos anteriores.
Conjuntos de dados disponíveis para download .
Manual para descrever o formato do arquivo .
fonte
Para testar algoritmos estatísticos, há Um Manual de Conjuntos de Dados Pequenos de DJ Hand, F. Daly, K. McConway, D. Lunn e E. Ostrowski. Alguns desses conjuntos de dados podem ser baixados aqui .
fonte
Para testar análises estatísticas multivariadas e algoritmos de aprendizado de máquina, existe o repositório de conjuntos de dados da UCI em http://www.ics.uci.edu/~mlearn/
fonte
O site de Hans Mittelman é um excelente recurso para navegar pelas opções atuais de software em otimização numérica. Ele inclui seus próprios benchmarks, bem como links para outros benchmarks para problemas de teste em otimização .
fonte
Alan Genz propôs um conjunto de funções de teste no artigo Teste de rotinas de integração multidimensional . Não consigo encontrar uma versão on-line deste documento, mas referências a ele podem ser encontradas nos documentos sobre a biblioteca CUBA .
fonte
Há uma coleção de problemas de otimização de restrição de PDE de referência mantidos por Roland Herzog na TU-Chemnitz aqui .
fonte
Um bom software deve ter sido testado e deve dizer como os autores testaram e fornecer os próprios conjuntos de dados de teste (por exemplo, na forma de testes de regressão) ou pelo menos fornecer links para os dados com os quais foi testado.
fonte
Se você está procurando gráficos grandes ou dados de rede para testar. O SNAP (Stanford Network Analysis Project) possui muitos conjuntos de dados de gráficos grandes, geralmente na forma de uma lista de adjacências anônima. Algumas de suas opções incluem:
Dados
Propriedades dos dados
Estatísticas básicas da verdade disponíveis nos conjuntos de dados:
Ferramentas
fonte
Os dados são fáceis; a API para obtê-lo pode ser difícil. Eu recomendo Quandl . Este site possui mais de 10 milhões de conjuntos de dados disponíveis ao público, acessíveis por meio de uma API fácil e REST. Todos os dados são retornados em CSV ou JSON. Ou, se a programação não é o seu ponto forte, existem maneiras fáceis de inserir os dados no Excel. Os programadores R, Python e Ruby estarão em casa com as bibliotecas nativas.
fonte