Eu tenho uma pergunta relacionada ao desempenho. Digamos que eu tenho um usuário com o primeiro nome Michael. Faça a seguinte consulta:
UPDATE users
SET first_name = 'Michael'
WHERE users.id = 123
A consulta realmente executará a atualização, mesmo que esteja sendo atualizada com o mesmo valor? Se sim, como evito que isso aconteça?
postgresql
performance
update
postgresql-performance
OneSneakyMofo
fonte
fonte
Respostas:
Devido ao modelo MVCC do Postgres, e de acordo com as regras do SQL, um
UPDATE
grava uma nova versão de linha para cada linha que não é excluída naWHERE
cláusula.Isto faz ter um impacto mais ou menos substancial no desempenho, direta e indiretamente. "Atualizações vazias" têm o mesmo custo por linha que qualquer outra atualização. Eles acionam gatilhos (se presentes) como qualquer outra atualização, precisam ser registrados no WAL e produzem linhas mortas inchando a tabela e causando mais trabalho para
VACUUM
mais tarde, como qualquer outra atualização.As entradas de índices e as colunas TOASTed nas quais nenhuma coluna envolvida é alterada podem permanecer iguais, mas isso é verdade para qualquer linha atualizada. Relacionado:
É quase sempre uma boa ideia excluir essas atualizações vazias (quando houver uma chance real de que isso possa acontecer). Você não forneceu uma definição de tabela em sua pergunta (o que é sempre uma boa ideia). Temos que assumir que
first_name
pode ser NULL (o que não seria surpreendente para um "primeiro nome"), portanto, a consulta deve usar uma comparação segura com NULL :Se
first_name IS NULL
antes da atualização, um teste com apenasfirst_name <> 'Michael'
seria avaliado como NULL e, como tal, excluiria a linha da atualização. Erro sorrateiro. Se a coluna estiver definidaNOT NULL
, use a verificação simples de igualdade, porque isso é um pouco mais barato.Palavras-chave:
fonte
Indexes entries and TOASTed columns where none of the involved columns are changed can stay the same
Mas eles não precisariam ser atualizados para apontar para o novo local da linha?rollback
, manuseio de snapshot, gerenciamento de bloqueio, WAL, um que não ...ORMs como Ruby on Rail oferecem execução adiada que marca um registro como alterado (ou não) e, em seguida, quando necessário ou chamado, em seguida, envia a alteração para o banco de dados.
O PostgreSQL é um banco de dados e não um ORM. O desempenho seria reduzido se levasse algum tempo para verificar se um novo valor era igual ao valor atualizado na sua consulta.
Portanto, ele atualizará o valor, independentemente de ser o mesmo que o novo valor ou não.
Se você deseja evitar isso, use um código como Max Vernon sugerido em sua resposta.
fonte
Você pode simplesmente adicionar à
where
cláusula:Se
first_name
for definido comoNOT NULL
, aOR first_name IS NULL
peça poderá ser removida.A condição:
também pode ser escrito de forma mais elegante como (na resposta de Erwin):
fonte
NULL
@erwinDo ponto de vista do banco de dados
A resposta para sua pergunta é sim. A atualização ocorrerá. O banco de dados não verifica o valor anterior, apenas define o novo valor.
Como isso acontece na memória (e só será gravado nos arquivos de dados após a emissão de uma confirmação), o desempenho não seria um problema.
De uma perspectiva ORM
Normalmente você terá um objeto representando uma única linha do banco de dados (pode ser muito mais complexo que isso, mas vamos simplificar). Esse objeto é gerenciado na memória (no nível do servidor de aplicativos) e apenas a versão confirmada mais recente desse objeto chegará ao banco de dados em um determinado momento.
Isso pode explicar o comportamento diferente.
Agora, não vamos comparar um navio de carga com uma impressora 3D. O fato de você poder enviar impressoras 3D usando navios de carga não significa que possa haver qualquer tipo de comparação entre elas.
Apreciar!
Espero que isso tenha esclarecido alguns conceitos.
fonte