Digamos que temos uma grande coleção de tarefas e uma coleção de processadores idênticos (em termos de desempenho) que operam completamente em paralelo. Para cenários de interesse, podemos assumir . Cada leva uma certa quantidade de tempo / ciclos para concluir, uma vez que é atribuído a um processador \ rho_j e, uma vez atribuído, não pode ser reatribuído até que seja concluído (os processadores sempre concluem as tarefas atribuídas). Vamos assumir que cada \ tau_i leva uma quantidade de tempo / ciclos X_i, não conhecido antecipadamente, extraído de alguma distribuição aleatória discreta. Para esta questão, podemos até assumir uma distribuição simples: , e todos os são independentes em pares. Portanto e .
Suponha que, estaticamente, no tempo / ciclo 0, todas as tarefas sejam atribuídas o mais uniformemente possível a todos os processadores, uniformemente aleatoriamente; portanto, a cada processador são atribuídas tarefas (também podemos assumir para os propósitos da pergunta). Chamamos o makepan de tempo / ciclo no qual o último processador para concluir o trabalho designado, termina o trabalho que foi designado. Primeira pergunta:
Em função de , e dos , qual é o makespan ? Especificamente, o que é ? ?
Segunda questão:
Suponha que e todos os sejam independentes aos pares, então e . Em função de , e desses novos , qual é o makespan? Mais interessante, como ele se compara à resposta da primeira parte?
Algumas experiências simples de pensamento demonstram que a resposta é que o makepan é mais longo. Mas como isso pode ser quantificado? Ficarei feliz em postar um exemplo se isso for (a) controverso ou (b) obscuro. Dependendo do sucesso deste, postarei uma pergunta de acompanhamento sobre um esquema de atribuição dinâmica sob essas mesmas suposições. Desde já, obrigado!
Análise de um caso fácil:
Se , todas as tarefas são agendadas para o mesmo processador. O makespan é apenas o momento de concluir tarefas de maneira sequencial completa. Portanto, e n M n E [ M ]V um r [ H ]
Parece que é possível usar esse resultado para responder à pergunta para ; simplesmente precisamos encontrar uma expressão (ou aproximação aproximada) para que , uma variável aleatória com e . Este rumo está na direção certa?max ( Y 1 , Y 2 , . . . , Y m ) Y i = X i n μY=nσ 2 Y =n
fonte
Respostas:
Como , podemos ver isso em termos de e vez de e . Digamos que é o tempo que leva o ésimo processador para concluir seu trabalho.k n n m T i im = k × n k n n m TEu Eu
À medida que cresce, a probabilidade de = (o processador ter sido atribuído apenas a tarefas ) para algumas aproxima de , então makepan é definido como , aproxima de .t i 5 K T = 5 i 1 m um x ( T i ) E [ H ] 5 kn TEu 5 k T= 5 Eu 1 m a x ( TEu) E[ M] 5 k
Para o segundo cenário, isso é portanto, aumentar o número de processadores melhora a divisão 4-2.4 k
E - aumentar o número de tarefas por processador? Aumentar tem o efeito oposto, diminui a probabilidade de ter um processador com um conjunto infeliz de tarefas. Estou indo para casa agora, mas voltarei a isso mais tarde. Meu "palpite" é que, à medida que cresce, a diferença de entre a divisão 4–2 e a divisão 5-1 desaparece, se torna a mesma para ambas. Portanto, eu suporia que 4-2 é sempre melhor, exceto talvez em alguns casos especiais (valores específicos muito pequenos de e ), mesmo que isso.k k E [ M ] E [ M ] k nk k k E[ M] E[ M] k n
Então, para resumir:
fonte
Acho que os argumentos heurísticos geralmente são bastante enganadores ao considerar o agendamento de tarefas (e problemas intimamente relacionados, como empacotamento de lixeira). Podem acontecer coisas que são contra-intuitivas. Para um caso tão simples, vale a pena fazer a teoria da probabilidade.
Seja com um número inteiro positivo. Suponha que seja o tempo necessário para concluir a ésima tarefa dada ao processador . Esta é uma variável aleatória com média e variância . O makepan esperado no primeiro caso é As somas são todas iid com média e variância , assumindo que são todas iid (isso é mais forte que a independência pareada).k T i j j i μ σ 2 E [ M ] = E [ máx { k ∑ j = 1 T i j ∣ i = 1 , 2 , … , m } ] . k μ k σ 2 T i jn = k m k Teu j j Eu μ σ2
Agora, para obter a expectativa de um máximo, é necessário mais informações sobre a distribuição ou um acordo com limites livres de distribuição, como:
que pode ser aplicado se as somas em termos de processador forem iid. Este não seria necessariamente o caso se os tempos subjacentes fossem apenas independentes por pares. Em particular, pelo Teorema 1, o makepan esperado é limitado acima por Downey também fornece uma distribuição específica atingindo esse limite, embora a distribuição mude como , e não seja exatamente natural.
Observe que o limite diz que o makepan esperado pode aumentar à medida que qualquer um dos parâmetros aumenta: a variação , o número de processadores ou o número de tarefas por processador .σ2 n k
Para sua segunda pergunta, o cenário de baixa variância, resultando em uma marca maior, parece ser um resultado improvável de um experimento mental. Seja denota o makepan para a primeira distribuição e para a segunda (com todos os outros parâmetros iguais). Aqui e denotam as somas de durações de tarefas correspondentes ao processador nas duas distribuições. Para todo , a independência produzX= maxmi = 1XEu Y= maxmi = 1YEu XEu YEu k Eu x ≥ k μ
fonte