Usando o pyshp para converter o arquivo .csv em .shp?

10

Estou tentando entender como posso usar o módulo csv em python para abrir um arquivo csv na mesma pasta que o script python e, em seguida, criar um shapefile usando o módulo shapefile pyshp.

O arquivo csv se parece com isso, mas pode ter algumas milhares de linhas de registros:

id_nr;date;target;start_lat;start_lon
1;2012-05-21;navpoint 25x;55.123654;13.456954
1;2012-05-23;navpoint 11f;55.143654;12.456954
kogia
fonte

Respostas:

14

O módulo pyshp é um pouco complicado de entender, mas realmente útil quando você o utiliza. Eu escrevi um script que lê em um csv dos dados de exemplo e grava um shapefile com os dados armazenados como atributos dos tipos de dados corretos. A datatipagem pyshp / xbase sempre foi complicada para mim, até que encontrei este guia do usuário para o formato xbase e, como resultado desta pergunta, escrevi uma pequena nota no meu blog sobre os tipos de dados pyshp relevantes, parte dos quais colei abaixo :

  • C são caracteres ASCII
  • N é um inteiro de precisão dupla limitado a cerca de 18 caracteres
  • D é para datas no formato AAAAMMDD, sem espaços ou hífens entre as seções.
  • F é para números de ponto flutuante com os mesmos limites de comprimento que N
  • L é para dados lógicos que são armazenados na tabela de atributos do shapefile como um inteiro curto como 1 (verdadeiro) ou 0 (falso). Os valores que ele pode receber são 1, 0, y, n, Y, N, T, F ou os python internos True e False

A lista completa é a seguinte:

import shapefile as shp
import csv

out_file = 'GPS_Pts.shp'

#Set up blank lists for data
x,y,id_no,date,target=[],[],[],[],[]

#read data from csv file and store in lists
with open('input.csv', 'rb') as csvfile:
    r = csv.reader(csvfile, delimiter=';')
    for i,row in enumerate(r):
        if i > 0: #skip header
            x.append(float(row[3]))
            y.append(float(row[4]))
            id_no.append(row[0])
            date.append(''.join(row[1].split('-')))#formats the date correctly
            target.append(row[2])

#Set up shapefile writer and create empty fields
w = shp.Writer(shp.POINT)
w.autoBalance = 1 #ensures gemoetry and attributes match
w.field('X','F',10,8)
w.field('Y','F',10,8)
w.field('Date','D')
w.field('Target','C',50)
w.field('ID','N')

#loop through the data and write the shapefile
for j,k in enumerate(x):
    w.point(k,y[j]) #write the geometry
    w.record(k,y[j],date[j], target[j], id_no[j]) #write the attributes

#Save shapefile
w.save(out_file)

Eu espero que isso ajude.

lamentar
fonte
Script muito bom. Eu recebi um erro porque não o lia como texto, então mudei esta linha: com open ('input.csv', 'rt') como csvfile:
againstflow
1
Eu acho que você pode melhorar o desempenho usando next (r) antes do loop for para ignorar o cabeçalho em vez de verificar usando uma instrução if.
Rovyko
@sgrieve - esse script converte um csv com campos pré-determinados específicos. Eu gostaria de um script genérico para converter qualquer CSV em uma classe de recurso. Talvez haja funções arcpy úteis para conseguir isso?
Waterman
2

Como alternativa, você não precisa manter os dados em listas.

# import libraries
import shapefile, csv

# create a point shapefile
output_shp = shapefile.Writer(shapefile.POINT)
# for every record there must be a corresponding geometry.
output_shp.autoBalance = 1
# create the field names and data type for each.
# you can insert or omit lat-long here
output_shp('Date','D')
output_shp('Target','C',50)
output_shp('ID','N')
# count the features
counter = 1
# access the CSV file
with open('input.csv', 'rb') as csvfile:
    reader = csv.reader(csvfile, delimiter=',')
    # skip the header
    next(reader, None)
    #loop through each of the rows and assign the attributes to variables
    for row in reader:
        id= row[0]
        target= row[1]
        date = row[2]
        # create the point geometry
        output_shp.point(float(longitude),float(latitude))
        # add attribute data
        output_shp.record(id, target, date)
        print "Feature " + str(counter) + " added to Shapefile."
        counter = counter + 1
# save the Shapefile
output_shp.save("output.shp")

Você pode encontrar um exemplo de trabalho dessa implementação aqui .

Clubdebambos
fonte