Existe uma ferramenta de linha de comando para exibir / abrir arquivos excel (.xls)?
Portanto, a resposta funciona muito bem, a menos que as planilhas não tenham um nome personalizado.
Quando tento abrir o arquivo, recebo:
Traceback (most recent call last):
File "/usr/bin/py_xls2csv", line 17, in <module>
for sheet_name, values in parse_xls(arg, 'cp1251'): # parse_xls(arg) -- default encoding
File "/usr/lib/python2.5/site-packages/pyExcelerator/ImportXLS.py", line 334, in parse_xls
raise Exception, 'No workbook stream in file.'
Exception: No workbook stream in file.
No entanto, se eu abrir o arquivo e renomear a planilha para 'teste' ou algo funcionar corretamente. O que preciso ajustar para que ele possa lidar com os nomes padrão? (Folha1, etc)
O arquivo que estou tentando abrir no momento tem apenas 1 planilha, denominada Plan1.
fonte
links -dump /tmp/tempspreadsheet.html
..... Também: como está, imprime caracteres Unicode no\u0950
formato ... Talvez haja uma maneira de processar a saída para produzir o caractere Unicode ... Se alguém souber um " simples assim", eu gostaria de vê-lo ...w3m
agora (porque parece melhor) e isso tem algumas opções de charset (consultew3m --help
). Também reduzi o comprimento, incluindo diminuir a necessidade de canalizá-lo para um arquivo.py_xls2csv
é codificado para funcionar com a página de códigoscp1251
.. Descobri que substituir as 3 instâncias decp1251
comutf-8
resolve o 'problema' de não exibir caracteres unicode ... Suponho que depende do que está na pasta de trabalho. mas usando utf-8 trabalhou para mim ... (I didi não perceber que até depois que eu postei minha resposta, mas pode ser útil para outras conversões)html
tenha mantido vários espaços, a saída renderizada os exibe como um espaço único (típico de html) .. ... ou seja, é<td> cows moo </td>
exibido comocows moo
... Provavelmente, há alguns ajustes simples para isso, mas meu conhecimento de html não vai muito além de ser capaz de soletrar 'html' .. :)Aqui está um método que mantém os caracteres Unicode.
ie ele exibe
आ
, em vez de exibir o valor do Unicode Codepoint\U0906
O script usa o OpenOffice.org e o PyODConverter.py para converter um formato de documento OOo em outro formato OOo. Os tipos de conversão são baseados nas extensões de nome de arquivo:
Provavelmente, existe outra maneira de sair do OOo (mas eu não o conheço).
E provavelmente existe alguma maneira de iniciar uma instância independente do OOo também, mas também não sei como fazer isso. requer que o OOo não esteja sendo executado ...
fonte