Existe ETL livre / de código aberto disponível? [fechadas]

26

Eu estava usando o Pentaho Data Integration antes mesmo de o Pentaho o comprar e chamar assim. Eu tenho a última versão gratuita.

Eu visitei o site deles recentemente para ver se eles haviam lançado outra versão apenas para descobrir que meu código aberto etl favorito não é mais muito aberto e nem totalmente gratuito.

Algum de vocês conhece alternativas em ferramentas ETL acessíveis e fáceis de usar?

Nicolas de Fontenay
fonte
Na verdade, essa é uma duplicata da pergunta Soluções de Business Intelligence / DWH de código aberto . Você encontrará suas respostas.
Marian
@Marian> A resposta aceita na pergunta que você está se referindo é Pentaho Data Integration. Peço código-fonte aberto, mas também gratuito e alternativo ao PDI. Não acho que essa pergunta seja uma duplicata.
Nicolas de Fontenay
As ferramentas são gratuitas. A pergunta vinculada foi feita por mim. Existem versões profissionais (com recursos como suporte 24/7, etc.) e a edição da comunidade em que a versão profissional se baseia. Portanto, a versão é totalmente gratuita e você ainda tem os recursos que você esperaria.
DrColossos
Jaspersoft etl?
Steam

Respostas:

17

O Kettle (Pentaho Data Integration Community Edition) ainda não está disponível sem taxas de licenciamento?

O Kettle 4.1 foi lançado para a comunidade como uma versão estável no quarto trimestre de 2010. A comunidade está atualmente trabalhando em uma versão menor do patch para a 4.1. A chaleira continua a ser um produto suportado pela comunidade. A chaleira pode ser uma ferramenta mais apropriada na sua caixa de areia ou nos ambientes de desenvolvimento.

No entanto, em um ambiente de produção, você pode achar que o PDI Enterprise Edition com suporte técnico da Pentaho é mais apropriado para seus sistemas de missão crítica.

Após a discussão nos comentários abaixo: O Pentaho Data Integration (PDI - também conhecido como "Kettle") ainda é mantido (4.4 foi lançado em 2012-09) e Open Source. Pode ser baixado aqui: http://sourceforge.net/projects/pentaho/files/Data%20Integration

RobPaller
fonte
Oi @RobPaller ~ Você pode dar mais informações sobre por que essa seria uma ferramenta apropriada? Vinculação é bom, mas dar explicações concretas é melhor;)
jcolebrand
a versão que eu uso é o Kettle - Spoon Community Edition - 4.0.1. Eu verifiquei no site da Pentaho e o que eu vejo é o PDI (aka Kettle) apenas por 30 dias de teste. Foi isso que desencadeou minha pergunta. Minha preocupação é que a Kettle não seja mais mantida e, portanto, preciso procurar outra coisa.
Nicolas de Fontenay
@ndefontenay (um pouco tarde, mas ...) O Pentaho Data Integration (PDI - também conhecido como "Kettle") ainda é mantido (4.4 foi lançado em 2012-09) e Open Source. Pode ser baixado aqui: sourceforge.net/projects/pentaho/files/Data%20Integration
a_horse_with_no_name
Esta é uma grande notícia! Gostaria de saber se posso alterar a resposta correta, na verdade ... Vamos ver.
Nicolas de Fontenay
Sim. Isso funciona.
Nicolas de Fontenay
17

Você pode dar uma olhada no Talend Open Studio . O ambiente de desenvolvimento é executado dentro do Eclipse e existem muitos tipos diferentes de conectores e transformações de banco de dados. Além disso, como é um projeto de código aberto, você pode criar seus próprios conectores e transformações para compartilhar com outros usuários (mesmo usuários comerciais) do Talend.

N Oeste
fonte
11
Oi @NWest ~ Você pode dar mais informações sobre por que essa seria uma ferramenta apropriada? Vinculação é bom, mas dar explicações concretas é melhor;)
jcolebrand
11
Achei o Talend um pouco difícil de aprender e lento em relação a enormes conjuntos de dados, mas bastante útil no geral.
randomx
Eu sabia que havia outro jogador nessa arena. Talend passou pela minha cabeça.
precisa saber é o seguinte
I vai definitivamente ter um olhar :)
Nicolas de Fontenay
Btw, qual é a linguagem de script usada pelo talend open studio?
Steam
5

Não o usei porque uso o SSIS para minhas necessidades de ETL, mas você já fez o check-out do expressor Studio ?

Você também pode conferir o ReactiveETL, que é uma reescrita do RhinoETL no CodePlex

Se você estiver em um ambiente que esteja usando o SQL Server, deverá ter acesso ao SSIS, incluído no SQL Server e capaz de se conectar a outros bancos de dados usando conexões OLEDB ou ODBC, para que não precise se conectar ao SQL Server. para usá-lo.

Houve até algumas apresentações sobre o uso do Powershell para ETL, uma delas foi apresentada pelo capítulo virtual App Dev do PASS.

Para mais detalhes sobre essa apresentação, consulte o seguinte link:

http://sev17.com/2010/06/22/powershell-etl-presentation/

Jeff
fonte
1

Eu toquei com o Aptar alguns anos atrás. Não posso dizer o quão bem eles resistiram ao teste do tempo.

D. Lambert
fonte
1

Um pouco mais...

MacGyver
fonte
3
MacGyver - Você tem experiência com algum desses? Você pode atualizar a resposta com alguns prós e contras?
Leigh Riffel
Eu ainda não. Estou pesquisando as ferramentas disponíveis para armazenamento de dados e tentando escolher uma; portanto, incluirei mais alguns detalhes depois de organizá-las.
MacGyver
0

Dependendo do que você está tentando fazer, o Mirth Connect pode ser adequado, embora seja mais um mecanismo de mensagens do que uma ferramenta ETL.

George
fonte
Você é afiliado a eles de alguma forma?
Dez13
Não estou, apenas procurei no Health XML Messaging e parecia que ele poderia ter aplicativos mais amplos. Certamente parece mais polido que o Pentaho.
George
Ah ok. Normalmente, ao recomendar ferramentas comerciais, é aconselhável deixar sua afiliação (não) clara, por isso perguntei.
Dez13
Apenas para salientar, o Mirth Connect é de código aberto.
JP.