Frequentemente, me encontro em uma situação em que não me importo se minha ferramenta produz ou não uma nova classe de recurso, mas me importo quanto tempo leva para combinar todos os meus grandes conjuntos de dados. Demora mais tempo para produzir uma nova classe de recurso usando a ferramenta Mesclar em vez da ferramenta Anexar ou Merge e Anexar são essencialmente os mesmos em termos de desempenho?
12
Respostas:
A mesclagem utiliza geometria e atributos e combina (mescla) todo o conjunto de dados em um novo conjunto de dados do recurso.
Anexar é uma boa maneira de associar dados extras a um conjunto de dados existente - ele pode ter opções para controlar os subtipos de recursos que estão sendo anexados.
http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000055000000
A principal diferença é
Se o Tipo de Esquema TEST for especificado, o esquema (definições de campo) dos conjuntos de dados de entrada deve corresponder ao do conjunto de dados de destino para que os recursos sejam anexados. Se o Tipo de Esquema NO_TEST for especificado, o esquema do conjunto de dados de entrada (definições de campo) não precisará corresponder ao conjunto de dados de destino. No entanto, quaisquer campos dos conjuntos de dados de entrada que não correspondam aos campos do conjunto de dados de destino não serão mapeados para o conjunto de dados de destino, a menos que o mapeamento seja definido explicitamente no controle Mapa de Campo.
subtipo (Opcional) Uma descrição de subtipo para atribuir esse subtipo a todos os novos dados anexados ao conjunto de dados de destino.
http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000050000000
Você pode estar interessado no 'Processamento lado a lado de grandes conjuntos de dados'
http://resources.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000
fonte
Tome essas respostas com base nas próprias ferramentas e não em uma referência real:
A ferramenta de mesclagem cria uma nova classe de recurso, que leva tempo por si só, antes de reunir os dois conjuntos de dados.
A ferramenta de acréscimo com a opção TEST pressupõe que ambos os conjuntos de dados tenham os mesmos campos (nomes de campos) e os agrupam sem precisar criar uma nova classe de recurso (soa mais rápido).
A ferramenta de acréscimo com a opção NO TEST permite que o mapeamento de campo seja combinado como classes de recursos que podem ter nomes de campos diferentes. Isso requer alguns testes condicionais nos bastidores, o que levaria mais tempo.
À medida que o tamanho do conjunto de dados aumenta, a quantidade de tempo que leva para criar um novo fc parece insignificante. A única maneira de saber com certeza seria fazer alguns benchmarks com seus grandes conjuntos de dados e postar as respostas aqui!
Eu suspeito que a diferença não é muito, é mais o que você deseja da ferramenta no final (mapeamento de campo vs. nova classe de recurso vs. nenhuma nova classe de recurso)
fonte
Acabei de executar todas as três variantes. Eu sempre combinei os mesmos 63 shapefiles. Cada shapefile contém cerca de 63000 pontos criados a partir de uma operação RasterToPoint. Todos os shapefiles têm a mesma tabela de atributos.
As diferentes variantes precisavam dos seguintes tempos para compilar:
Parece que Anexar com TESTE como parâmetro de entrada é o mais rápido. Obviamente, a escolha de qual Anexo usar não depende da velocidade, mas dos arquivos de entrada, conforme explicado acima.
Espero que seja útil.
fonte