Alternativa de código aberto ao "Google Appliance" para pesquisa na intranet? [fechadas]

15

Existem soluções alternativas de código aberto (com um console da web)?

Martin K.
fonte
1
As recomendações de produtos e serviços geralmente não são adequadas para a falha do servidor (consulte as Perguntas frequentes e esta publicação no blog ). Há uma abundância de aparelhos motor de busca e software disponível - Google pode ajudá-lo a encontrar alguma, e você pode, em seguida, combiná-los ao seu ambiente e necessidades ...
voretaq7

Respostas:

3

Tente isto: http://www.flax.co.uk/

(Não tenho experiência com este produto ou outros produtos de pesquisa corporativa).

Estrelas do mar
fonte
link está quebrado ... basta usar flax.co.uk #
Russ
1
Não saiu muito desse projeto recentemente. Veja o linho está vivo? discussão sobre o grupo de discussão sobre linho de julho de 2010 e o último post de setembro de 2011 que não obteve resposta.
Dia
6

Solr, do projeto Apache Lucene. Trecho do site

http://lucene.apache.org/solr/

O Solr é um servidor de pesquisa corporativa de código-fonte aberto baseado na biblioteca de pesquisa Java Lucene, com APIs XML / HTTP e JSON, realce de hits, pesquisa facetada, armazenamento em cache, replicação, uma interface de administração da web e muitos outros recursos. Ele é executado em um contêiner de servlet Java, como o Tomcat.

Will Glass
fonte
SOLR parece muito legal. A questão é como rastrear / indexar páginas da Web sem o Nutch? Eu trabalho com o ASP.Net e não parece haver um rastreador de fato para o SOLR que funcione nativamente com o Windows.
dana 22/02
2

Eu usei 'htdig' no passado para pesquisa na intranet. É bom e indexa documentos PDF por padrão. Depois de adicionar filtros que podem converter documentos em formato de texto para indexação, ele também começará a suportar outros formatos.

Saurabh Barjatiya
fonte
2

Não é de código aberto, mas o Microsoft Search 4.0 é gratuito neste link

Eu diria que vale a pena tentar, gostei da formatação dos resultados retornados, mas o problema é que os resultados incluem documentos que um usuário não pode acessar devido à segurança. Portanto, não foi bom para nós, já que os nomes dos documentos também podem conter informações restritas, como "Bob-Warning Letter.doc"

SpaceManSpiff
fonte
0

Encontrei uma solução com o Google Desktop Search (que pode ser usado como um appliance da web com um plug-in): leia mais ...

Martin K.
fonte
Parece a mesma coisa que o Microsoft Search Server fará, mas com mais esforço.
21410 SpaceManSpiff
Mais esforço, mas grátis!
Martin K.
O Search Server Express da Microsoft é totalmente gratuito e a única diferença entre ele e a edição Enterprise é que o Express não possui balanceamento de carga. By the way necessidade de DNKA plug-in de acordo com o seu link tem uma pequena taxa para uso comercial. Engraçado como o Google exige que você use o hardware para as pesquisas da empresa. Eu acho que o google poderia limpar nessa área se eles lançassem um software de edição de servidor que pudesse ser instalado no seu próprio servidor.
21410 SpaceManSpiff
As informações da página estão desatualizadas! O DNKA agora é gratuito para uso comercial. A solução é totalmente gratuita. Quando tento fazer o download da edição expressa, em todos os lugares "Demo" ou "Teste" é mostrado !? Por que o Google deve exigir o uso de seu hardware? A solução que mencionei é gratuita e requer apenas um ambiente Windows. Também funciona com o Mozilla como cliente (por exemplo, nas caixas Unix / Linux). Eu li que o desempenho da pesquisa no Google é significativamente melhor.
Martin K.
Experimente este link - microsoft.com/enterprisesearch/en/us/… Você provavelmente estava tentando fazer o download da empresa completa, que é uma edição de avaliação. Legal que seu DNKA esteja livre agora. Então é este. O que eu estava tentando dizer é que uma empresa para ter uma pesquisa na intranet do Google (sem ser um mashup) requer um dispositivo do Google. Seria ótimo se o google fizesse uma pesquisa na intranet corporativa de software, que não fosse um mashup de pesquisa de desktop e ferramentas de terceiros. Mais administradores preferem o que eu acho.
21410 SpaceManSpiff