Qual é o mecanismo de pesquisa ideal hospedado automaticamente? [fechadas]

11

Eu tenho um site interno (intranet) composto por vários blogs e fóruns, centenas de páginas estáticas, muitos arquivos PDF e vários outros tipos de documentos. Ele foi colado livremente nos últimos dois anos e agora é meu trabalho mantê-lo.

Estou procurando um mecanismo de pesquisa que possa me hospedar idealmente:

  1. Permite pesquisar diretamente os bancos de dados do Blog / Fórum, se houver informações e tabelas do banco de dados a serem pesquisadas.

  2. Manipula a maioria dos documentos de texto (PDF / DOC / ODF)

  3. É de código aberto ou permite o acesso ao código-fonte uma vez adquirido

Não importa para mim em que idioma ou plataforma está escrito. Normalmente, eu usaria a pesquisa no site do Google, mas essa não é uma opção para uma intranet.

Tim Post
fonte

Respostas:

2

Eu usei Sphider antes e fiquei bastante impressionado.

Darryl Hein
fonte
2

O SearchBlox, que é baseado no Lucene, pode atender às suas necessidades. É gratuito e vem com um rastreador.

Matt Wilson
fonte
livre para 25k urls, que não é muito para uma intranet
cweiske
@cweiske Confira o Ambar, é baseado no ElasticSearch e gratuito. github.com/RD17/ambar
Ilya P
0

Normalmente, eu usaria a pesquisa no site do Google, mas essa não é uma opção para uma intranet.

De fato, existe o Google Search Appliance, que é equivalente à pesquisa de sites do Google por intranets. No entanto, isso não é de código aberto (a pesquisa no site do Google também não é, caso você não tenha notado.)


fonte
Eu olhei para isso. Eu realmente quero algo em que possa ter acesso ao código. Também é um pouco pesado no departamento de orçamento.
Tim Post
Além do Google Search Appliance, há um produto similar da "Thunderstone" que é competitivo. Eu usei os dois no passado. Embora possa não funcionar para você, pensei em publicar para outras pessoas que tropeçam na pergunta.
digit1001