Trabalhos modernos sobre índices de pesquisa geralmente contêm uma declaração de que índices invertidos (listas de postagem) são categoricamente superiores aos arquivos de assinatura (filtros de bloom). Aqui estão alguns exemplos de artigos publicados em 2016:
Embora essa técnica [arquivo de assinatura] forneça uma sobrecarga computacional relativamente baixa, estudos de Zobel et al. [1998] mostraram que os arquivos invertidos superam significativamente os arquivos de assinatura.
Os índices invertidos têm sido comparados como a estrutura mais generalizável e com melhor desempenho (Zobel et al., 1998)
Todo artigo parece citar Zobel et al., Arquivos invertidos versus arquivos de assinatura para indexação de texto .
No entanto, se estou lendo Zobel et al. corretamente, o argumento que eles formulam não é fundamental (por exemplo, um limite assintótico ou um limite teórico da informação). Em vez disso, o argumento parece ser, dados os arquivos de assinatura implementados com as técnicas X, Y e Z em comparação com os índices invertidos implementados com as técnicas A, B e C e a tecnologia atual do dia (discos com sobrecarga de busca / acesso muito alta ), os índices invertidos são superiores porque exigem menos buscas e são mais rápidos.
Existe uma comparação mais recente que compara essas técnicas em SSD, NVMe ou RAM, ou há uma comparação mais recente que analisa as "novas" técnicas que foram inventadas desde 1998?