A ferramenta Stanford Wrangle é incrível, e resolvi um problema gigantesco, mas me limita a um tamanho muito pequeno. Meu arquivo tem cerca de 500 MB e me permite processar menos de 1 MB, os dados restantes são apenas enrolados em uma célula. Após a 15ª linha (tentada em vários arquivos), ele simplesmente para
http://vis.stanford.edu/wrangler/app/
Tenho 50k dos seguintes dados, 1 registro
Osnovni podaci
PREDUZETNIK
OLIVA
Registarski broj : 10000015
Matični broj : 02386135
Broj promjene : 1
Puni naziv : OLIVA
Šifra djelatnosti : 5610
Naziv djelatnosti : Djelatnosti restorana i pokretnih ugostiteljskih objekta
Adresa sjedišta : STOLIV BB
Mjesto sjedišta : KOTOR
Adresa prijema službene pošte : STOLIV BB
Mjesto prijema službene pošte : KOTOR
Datum registracije : 28.06.2002
Datum promjene : 28.06.2002
Status : Aktivan
Lica u društvu
Ime : DEJAN
Prezime : BAJO
JMBG : 2910971230014
E com a quebra automática de funções na linha, cheguei à tabela CSV a seguir
Osnovni podaci, PREDUZETNIK, OLIVA, Registarski broj: 10000015, Matjčni broj: 02386135, Broj promjene: 1, Puni naziv: OLIVA, Šifra djelatnosti: 5610, Naziv djelatnosti: : KOTOR, Adresa fundado em: STOLIV BB, membro do fundador: KOTOR, Data de registo: 28.06.2002, data de publicação: 28.06.2002, estatuto: Aktivan, Lica u društvu, Ime: DEJAN, JJMB 2910971230014
De que outra forma isso pode ser feito? Ele transpôs e agrupou dados na primeira linha de cada registro ("Osnovni podaci").
Basicamente, estou utilizando a função transpose, que envolve uma linha específica, e não sei como poderia usar essa função em outras ferramentas como excel, r, python ou sql? Eu estou familiarizado com eles.
Socorro?