Stanford Wrangler ideal, mas impõe limites, quais são as outras opções?

0

A ferramenta Stanford Wrangle é incrível, e resolvi um problema gigantesco, mas me limita a um tamanho muito pequeno. Meu arquivo tem cerca de 500 MB e me permite processar menos de 1 MB, os dados restantes são apenas enrolados em uma célula. Após a 15ª linha (tentada em vários arquivos), ele simplesmente para

http://vis.stanford.edu/wrangler/app/

Tenho 50k dos seguintes dados, 1 registro

Osnovni podaci
PREDUZETNIK
OLIVA
Registarski broj : 10000015
Matični broj : 02386135
Broj promjene : 1
Puni naziv : OLIVA
Šifra djelatnosti : 5610
Naziv djelatnosti : Djelatnosti restorana i pokretnih ugostiteljskih objekta
Adresa sjedišta : STOLIV BB
Mjesto sjedišta : KOTOR
Adresa prijema službene pošte : STOLIV BB
Mjesto prijema službene pošte : KOTOR
Datum registracije : 28.06.2002
Datum promjene : 28.06.2002
Status : Aktivan
Lica u društvu
Ime :   DEJAN
Prezime :    BAJO
JMBG :   2910971230014

E com a quebra automática de funções na linha, cheguei à tabela CSV a seguir

Osnovni podaci, PREDUZETNIK, OLIVA, Registarski broj: 10000015, Matjčni broj: 02386135, Broj promjene: 1, Puni naziv: OLIVA, Šifra djelatnosti: 5610, Naziv djelatnosti: : KOTOR, Adresa fundado em: STOLIV BB, membro do fundador: KOTOR, Data de registo: 28.06.2002, data de publicação: 28.06.2002, estatuto: Aktivan, Lica u društvu, Ime: DEJAN, JJMB 2910971230014

De que outra forma isso pode ser feito? Ele transpôs e agrupou dados na primeira linha de cada registro ("Osnovni podaci").

Basicamente, estou utilizando a função transpose, que envolve uma linha específica, e não sei como poderia usar essa função em outras ferramentas como excel, r, python ou sql? Eu estou familiarizado com eles.

Socorro?

Velletti
fonte
1
Explique o que exatamente você quer que seja feito, para que não precisemos procurar essa ferramenta de organização para entender. Deseja agrupar arquivos csv? Converter xls em csv? Presumo que você esteja usando o Windows?
terdon
Acima é um registro, e eu tenho 50k deles. O arquivo está em txt e eu quero em csv, agrupado e transposto a cada início de registro. Wrangler envolve / transpõe dados em uma linha específica.
Velletti