Recentemente, aprendi sobre a conjectura gananciosa do menor problema das supercordas .
Nesse problema, recebemos um conjunto de seqüências de caracteres e queremos encontrar as menores supercordas ou seja, tais que cada apareça como uma subcadeia de .
Esse problema é difícil para NP e, após uma longa sequência de trabalhos, o algoritmo de aproximação mais conhecido para esse problema possui uma proporção [Paluch '14].
Na prática, os biólogos usam o seguinte algoritmo Greedy:
Em cada etapa, mescle duas cadeias que tenham sobreposição máxima em todos os pares (o sufixo máximo que é o prefixo de outra cadeia) e repita nesta nova instância até que exista apenas uma cadeia (que é uma supercadeia de todas as cadeias de entrada) )
Um limite inferior de na razão de aproximação deste algoritmo ganancioso pode ser obtido a partir da entrada .
Curiosamente, foi conjeturado que este é o pior exemplo, ou seja, que Greedy alcança uma aproximação para o menor problema de supercorda. Fiquei muito surpreso ao ver que um algoritmo tão natural e fácil é tão difícil de analisar.
Existem intuições, fatos, observações, exemplos que sugerem por que essa pergunta é tão desafiadora?
fonte
Respostas:
Deixe-me primeiro tentar resumir o que se sabe sobre a conjectura gananciosa.
Penso que uma das razões pelas quais é difícil provar a conjectura gananciosa pode ser a seguinte. A maioria das abordagens para provar as garantias de aproximação do algoritmo Greedy analisa o gráfico de sobreposição (ou, equivalentemente, o gráfico de prefixos) do conjunto de strings de entrada. Conhecemos apenas algumas propriedades desses gráficos (como as desigualdades de Monge e Triplo), mas essas propriedades provavelmente não são suficientes para provar a conjectura gananciosa ( Weinard, Schnitger ; Laube, Weinard ).
fonte