Arredondamento para minimizar a soma dos erros em distâncias aos pares

O que se sabe sobre a complexidade do seguinte problema:

Dado: números racionais $x_1 < x_2 < \dotso < x_n$ .
Saída: números inteiros $y_1 \le y_2 \le \dotso \le y_n$ .
Objetivo: minimizar $\sum_{1 \leq i < j \leq n} e (i, j),$ $\sum_{1 \le i < j \le n} e(i,j),$ onde $e (i, j) = | (y_{j} - y_{i}) - (x_{j} - x_{i}) | .$ $e(i,j) = | (y_j-y_i) - (x_j-x_i)|.$

Ou seja, gostaríamos de arredondar os números racionais para números inteiros para minimizar a soma dos erros em distâncias aos pares. Para cada par $i, j$ , gostaríamos de ter a distância arredondada $y_j-y_i$ mais próximo possível da distância real $x_j-x_i$ .

Motivação: uma viagem de metrô chata e um pôster que mostra os "locais" das estações na resolução de um minuto do tempo de viagem. Aqui estamos minimizando o erro que as pessoas fazem, se eles usam o cartaz de olhar para cima o tempo de viagem entre as estações $i$ e $j$ , média sobre todos os pares $i<j$ .

mapa de rotas

(fonte)

Por exemplo, aqui podemos ler as seguintes aproximações das distâncias em pares entre as quatro estações (usando A, B, C, D por questões de brevidade):

A – B ≈ 1 minuto, B – C ≈ 2 minutos, C – D ≈ 2 minutos
A – C ≈ 3 minutos, B – D ≈ 4 minutos
A – D ≈ 5 minutos

Essa é a melhor aproximação possível? Se você soubesse o tempo real da viagem, poderia encontrar uma solução melhor?

A princípio, isso soou como um exercício simples de programação dinâmica, mas agora parece que é necessário um pouco de pensamento real.

Alguém reconhece esse problema? Ou vê um algoritmo inteligente para resolvê-lo?

Editar: Existem algumas variantes naturais da pergunta que foram mencionadas nos comentários; vamos dar a eles alguns nomes:

versão piso / teto : é necessário que para todos os . $y_i \in \{ \lfloor x_i \rfloor, \lceil x_i \rceil \}$ $i$
número inteiro versão: é suficiente que para todos os . $y_i \in \mathbb{Z}$ $i$
versão monotônica : é necessário que . $y_1 \le y_2 \le \dotso \le y_n$
versão não monotônica : podemos ter para . $y_i > y_j$ $i < j$

A pergunta original considera a versão inteira monotônica, mas respostas relacionadas a qualquer uma dessas versões são bem-vindas.

ds.algorithms reference-request optimization Jukka Suomela
fonte

O DP funciona para o caso quando você se importa apenas com medições adjacentes?

Suresh Venkat

@SureshVenkat: Na verdade, nesse caso, o problema se torna muito simples: basta selecionar a melhor distância integral

para cada

. Ou seja, você pode minimizar cada

independentemente.

y_{i} - y_{i - 1}

$y_i - y_{i-1}$

i

$i$

e (i - 1, i)

$e(i-1,i)$

Jukka Suomela

Este relatório de Estie Arkin parece relacionado: ams.sunysb.edu/~estie/papers/beautification.pdf Está provado que minimizar o número de distâncias interpontos distintas na saída é difícil para NP. Essa não é a soma total de turnos, como nessas perguntas, mas talvez os dispositivos de dureza no relatório possam sugerir uma prova de dureza para esse problema.

val

Tenho a sensação de que esse problema certamente deve ser solucionado usando técnicas conhecidas. Vamos ver se a recompensa é suficiente para motivar as pessoas a resolver isso. :)

Jukka Suomela

@vzn: Estou interessado na complexidade computacional deste problema. Se você puder provar que existe uma abordagem de pesquisa local em tempo polinomial que garante o melhor global, a recompensa é sua.

Jukka Suomela 28/08/12

Respostas:

ESTÁ BEM. O algoritmo DP parece ser desnecessariamente complicado. Depois de ler os comentários, acho que isso pode resolver a versão monotônica do problema (mas não verifiquei todos os detalhes).

Primeiro, assuma que , onde é a parte integrante, é a parte fracionária. Suponha é arredondado para , onde é um inteiro não negativo (é claro que, em geral, pode ser negativo, mas podemos sempre mudar, de modo que o menor é 0). $x_i = \lfloor x_i\rfloor +\{x_i\}$ $\lfloor x_i\rfloor$ $\{x_i\}$ $x_i$ $\lfloor x_i \rfloor + v_i$ $v_i$ $v_i$ $v_i$

Agora, considere o custo de um par , ao fazer esse arredondamento. O custo deve ser $x_i$ $x_j$

| | v_{i} - v_{j} + ⌊ x_{i} ⌋ - ⌊ x_{j} ⌋ | - | {x_{i}} - {x_{j}} + ⌊ x_{i} ⌋ - ⌊ x_{j} ⌋ | |

$||v_i-v_j+ \lfloor x_i\rfloor - \lfloor x_j\rfloor| - |\{x_i\}-\{x_j\} + \lfloor x_i\rfloor - \lfloor x_j\rfloor||$

A expressão é complicada por causa dos valores absolutos. No entanto, observe que temos monotonicidade; portanto, as coisas dentro dos dois valores absolutos internos devem ter o mesmo sinal. Como temos um valor absoluto externo, realmente não importa qual é esse sinal, a expressão simplesmente simplifica

| v_{i} - v_{j} - ({x_{i}} - {x_{j}}) |

$|v_i-v_j - (\{x_i\} - \{x_j\})|$

A partir de agora, não assumimos que a solução seja monotônica, mas alteramos o objetivo de minimizar a soma do termo acima para todos os pares. Se a solução para esse problema for monotônica, é claro que também é a solução ideal para a versão monotônica. (Pense nisso como: o problema original tem uma penalidade infinita quando a solução não é monotônica, o novo problema tem uma penalidade menor, se uma solução monotônica vence mesmo na nova versão, deve ser a solução para a versão monotônica)

Agora gostaríamos de provar, se , na solução ótima, devemos ter . $\{x_i\} > \{x_j\}$ $v_i \ge v_j$

Suponha que isso não seja verdade, que temos um par mas . Mostraremos que, se trocarmos a solução ficará estritamente melhor. $\{x_i\} > \{x_j\}$ $v_i < v_j$ $v_i$ $v_j$

Primeiro vamos comparar o prazo entre e , aqui é muito claro que a troca é estritamente melhor porque na versão não-swap, e tem o mesmo sinal, o absoluto value será a soma dos dois valores absolutos. $i$ $j$ $v_i-v_j$ $\{x_j\}-\{x_i\}$

Agora, para qualquer , comparamos a soma dos pares e . Ou seja, precisamos comparar $k$ $(i,k)$ $(j,k)$

e $|v_i-v_k-(\{x_i\}-\{x_k\})|+|v_j-v_k-(\{x_j\}-\{x_k\})|$ . $|v_j-v_k-(\{x_i\}-\{x_k\})|+|v_i-v_k-(\{x_j\}-\{x_k\})|$

Uso , , , para denotar as quatro condições no interior do valor absoluto, é evidente que . Também está claro que . Pela convexidade do valor absoluto, sabemos . Assuma a soma de todos os $A$ $B$ $C$ $D$ $A+B = C+D$ $|A-B| \ge |C-D|$ $|A|+|B| \ge |C|+|D|$ $x_k$ sabemos que a troca só pode ser melhor.

Observe que agora já temos uma solução para a versão monotônica de piso / teto: deve haver um limite, quando for maior sempre arredondado, quando for menor sempre arredondado, quando for igual arredondado alguns e outros enquanto a qualidade da solução depende apenas do número. Enumeramos todas essas soluções e escolhemos a que tem a menor função objetiva. (Todas essas soluções são necessariamente monotônicas). $\{x_i\}$

Finalmente, gostaríamos de ir para a versão inteira monotônica do problema. Na verdade, podemos provar que a solução ideal é a mesma da versão monotônica de piso / teto.

Como assumimos, o menor é 0. Grupo todo o 's de acordo com sua ' s, e chamá-los grupo . Primeiro provaremos que não há grupos vazios, mas isso é simples, se o ésimo grupo estiver vazio, pois qualquer deixe . É fácil ver que a função objetivo sempre melhora (basicamente porque ). $v_i$ $x_i$ $v_i$ $0,1,2,...,\max\{v_i\}$ $k$ $v_i > k$ $v_i = v_i-1$ $|\{x_i\}-\{x_j\}| < 1$

Agora vamos provar que a média de no grupo é pelo menos a média de no grupo mais . Se isso não for verdade, basta deixar para todos os , o cálculo novamente mostra que a função objetivo melhora. $\{x_i\}$ $k+1$ $\{x_i\}$ $k$ $1/2$ $v_i = v_i-1$ $v_i > k$

Como a média de está no intervalo , realmente existem no máximo dois grupos, o que corresponde à versão de piso / teto. $\{x_i\}$ $[0,1)$

Rong Ge
fonte

Apenas um comentário prolongado ... (talvez trivial e / ou errado :)

Se e é o múltiplo menos comum dos s, então podemos nos livrar dos racionais: . $x_i = a_i / b_i$ $M$ $b_i$ $x'_i = M*x_i$

Se (restrição de piso, teto), podemos usar variáveis binárias para expressar usando sua distância de ( ou ): $y_i \in \{ \lceil x_i \rceil, \lfloor x_i \rfloor \}$ $v_i$ $y'_i$ $x'_i$ $L_i = x'_i - M*\lfloor x_i \rfloor$ $R_i = x'_i - M*\lceil x_i \rceil$

$y'_i = x'_i + L_i * v_i + R_i * (1 - v_i) = x'_i + (L_i - R_i)*v_i + R_i = x'_i + D_i *v_i + R_i$

E o problema original deve (?!?) Ser equivalente a encontrar o que minimiza: $v_i$

$\sum_{1 \le i < j \leq n} | D_i * v_i - D_j * v_j |$

com $v_i \in \{0,1\}, D_i \in \mathbb{Z}$

Marzio De Biasi
fonte

expandindo seu último somatório usando o erro idéia acima, poderia ser mostrado que o ideal é realmente apenas a escolha em que cada variável binária piso / teto está mais próxima de ? portanto, resta apenas o caso de como arredondar para no formato que é um número inteiro.

e^{'} (i, j)

$e'(i,j)$

x_{n}

$x_n$

x_{n}

$x_n$

m_{n} + \frac{1}{2}

$m_n + {1 \over 2}$

m

$m$

vzn

@ vzn: Eu acho que isso é um contra-exemplo. Se arredondarmos usando os critérios de arredondamento , obtemos que tem um erro de , mas tem um erro de (o resultado é o mesmo se eliminamos os racionais multiplicando pelo LCM).

(0, 1.4, 8.7)

$(0, 1.4, 8.7)$

x_{i}

$x_i$

(0, 1, 9)

$(0, 1, 9)$

1.4

$1.4$

(0, 2, 9)

$(0,2,9)$

1.2

$1.2$

Marzio De Biasi

ok, no entanto, nova idéia. considere novamente. expanda a soma. isso reduzirá a muitos termos com e também . mas o último é igual a ! portanto, reduz-se a um problema na forma de minimizar que é um vetor de linha 0/1 e é um vetor de coluna constante . verdade? então isso é trivial e apenas selecione o modo que seja 1 se o elemento correspondente em for negativo e 0 se for positivo .... QED?

e^{'} (i, j)

$e'(i,j)$

v_{i}

$v_i$

v_{i}^{2}

$v_i^2$

v_{i}

$v_i$

X * D

$X*D$

X

$X$

D

$D$

X

$X$

D

$D$

vzn

@vzn: se você usar o para eliminar a função de valor absoluto, obterá termos como ; como você lida com eles na minimização?

((y_{i}^{'} - y_{j}^{'}) - (x_{i}^{'} - x_{j}^{'}))^{2}

$((y'_i - y'_j) - (x'_i - x'_j))^2$

- 2 * D_{i} * D_{j} * v_{i} * v_{j}

$- 2*D_i * D_j * v_i * v_j$

Marzio De Biasi

oops! você respondeu antes que eu tivesse a chance de excluir esse comentário depois de perceber isso ... mesmo assim ainda parece reduzir a algum problema de otimização de matriz quase linear? também com um termo onde é um vetor de coluna ...?

V * V^{T}

$V * V^T$

V

$V$

vzn

Outro comentário estendido ... Pode estar errado.

Também estou considerando o caso com restrições de piso / teto, e estou tentando resolvê-lo usando programação dinâmica (não posso, mas talvez funcione quando o divisor comum é pequeno).

Seja a parte fracionária de , consideramos as coisas do menor ao maior. Suponha que o maior seja e, como estamos fazendo programação dinâmica, já sabemos "alguma coisa" (explicarei o que é isso) sobre a solução ideal para todo o resto, exceto . $\{x_i\}$ $x_i$ $\{x_i\}$ $\{x_k\}$ $x_k$

Agora considere a diferença na função objetivo quando arredondarmos cima ou para baixo. Se originalmente algum é arredondado, então a diferença é simplesmente 1 (não foi verificado com muito cuidado, mas parece que é esse o caso, é realmente importante que não importa se esteja à esquerda ou à direita de , a diferença é sempre o mesmo); se originalmente algum for arredondado para baixo, a diferença será . Portanto: sabemos qual decisão tomaremos se as três quantidades a seguir forem conhecidas: $x_k$ $x_i$ $x_i$ $x_k$ $x_i$ $2\{x_k\}-2\{x_i\}-1$

quantas coisas são arredondadas
quantas coisas são arredondadas
qual é a soma de entre os que são arredondados para baixo $\{x_i\}$ $x_i$

OK, 1 e 2 são essencialmente os mesmos, podemos permitir que f [N, Ndown, Sdown] seja a solução ideal para os primeiros N pontos (quando os pontos são classificados em ordem crescente de ), o número de O arredondamento de é Ndown, e a soma de para os arredondados é Sdown. Então não é difícil escrever como ir de f [N-1] para f [N]. $\{x_i\}$ $x_i$ $\{x_i\}$

O problema é claro, Sdown pode ter muitos valores exponencialmente. Mas funciona quando o divisor comum é pequeno ou podemos arredondar tudo para um ponto de grade primeiro e obter um FPTAS (se o programa dinâmico acima estiver correto ...)

Rong Ge
fonte

D_{i}

$D_i$

\sum D_{i} v_{i}

$\sum D_iv_i$

(N - 1) D_{k} - \sum D_{i} v_{i}

$(N-1) D_k - \sum D_iv_i$

D_{i}

$D_i$

\sum | D_{i} v_{i} |

$\sum |D_i v_i|$

N d o w n | D_{k} | + N u p D_{k} - \sum D_{i} v_{i}

$Ndown|D_k| + Nup D_k - \sum D_iv_i$

v_{j}

$v_j$

v_{j}

$v_j$

x_{i} = 1.1

$x_i = 1.1$

x_{k} = 1.9

$x_k = 1.9$

x_{i}

$x_i$

x_{k}

$x_k$

x_{k}

$x_k$

Jukka Suomela 29/08/2012

{x_{i}}

$\{x_i\}$

{x_{i}}

$\{x_i\}$

{x_{i}} < {x_{j}}

$\{x_i\} < \{x_j\}$

{x_{k}}

$\{x_k\}$

{x_{i}}

$\{x_i\}$

{x_{j}}

$\{x_j\}$

{x_{k}}

$\{x_k\}$

x_{i}

$x_i$

x_{j}

$x_j$

x_{j}

$x_j$

x_{i}

$x_i$

Rong Ge