Eu tenho uma quantidade decente de dados em um banco de dados. Tenho tabelas bem formadas e boas relações entre elas com alguma redundância em meus dados. Mas até onde devo ir com a normalização? Existem desvantagens de desempenho para muita
Eu tenho uma quantidade decente de dados em um banco de dados. Tenho tabelas bem formadas e boas relações entre elas com alguma redundância em meus dados. Mas até onde devo ir com a normalização? Existem desvantagens de desempenho para muita
Um dos meus servidores PostgreSQL hospeda vários (1-3) bancos de dados que recebem um fluxo constante de dados. Os dados não são particularmente estruturados, equivalem ao tempo atual e a uma variedade de dados observados para esse instante em particular. A taxa de dados é bastante alta; funciona...
Eu tenho um banco de dados no PostgreSQL 9.2 que possui um esquema principal com cerca de 70 tabelas e um número variável de esquemas por cliente estruturados de forma idêntica, com 30 tabelas cada. Os esquemas do cliente têm chaves estrangeiras que referenciam o esquema principal e não o...
Fazendo esta pergunta, especificamente para o Postgres, pois possui boa sustentação para índices R-tree / espaciais. Temos a tabela a seguir com uma estrutura em árvore (modelo Nested Set) de palavras e suas frequências: lexikon ------- _id integer PRIMARY KEY word text frequency integer lset...
Estou em uma situação em que quero obter o valor mínimo de 6 colunas. Até agora, encontrei três maneiras de conseguir isso, mas tenho preocupações com o desempenho desses métodos e gostaria de saber qual seria o melhor para o desempenho. O primeiro método é usar uma declaração de maiúsculas e...
Temos um armazém de dados com uma contagem de registros bastante grande (10 a 20 milhões de linhas) e geralmente executamos consultas que contam registros entre determinadas datas ou contam registros com determinados sinalizadores, por exemplo, SELECT f.IsFoo, COUNT(*) AS WidgetCount FROM...
Eu tenho uma instrução SQL que insere linhas em uma tabela com um índice clusterizado na coluna TRACKING_NUMBER. POR EXEMPLO: INSERT INTO TABL_NAME (TRACKING_NUMBER, COLB, COLC) SELECT TRACKING_NUMBER, COL_B, COL_C FROM STAGING_TABLE Minha pergunta é: isso ajuda a usar uma cláusula ORDER BY na...
Eu tenho uma pergunta relacionada ao desempenho. Digamos que eu tenho um usuário com o primeiro nome Michael. Faça a seguinte consulta: UPDATE users SET first_name = 'Michael' WHERE users.id = 123 A consulta realmente executará a atualização, mesmo que esteja sendo atualizada com o mesmo valor?...
Estou tendo dificuldades para entender a ideia de prós e contras do particionamento de tabelas. Estou prestes a começar o trabalho em um projeto com 8 tabelas e uma delas será a principal tabela de dados que conterá entre 180 e 260 milhões de registros. Como a tabela será indexada corretamente,...
Estou executando uma atualização em que exijo uma igualdade exata em uma tstzrangevariável. ~ 1M linhas são modificadas e a consulta leva ~ 13 minutos. O resultado de EXPLAIN ANALYZEpode ser visto aqui , e os resultados reais são extremamente diferentes daqueles estimados pelo planejador de...
Considere uma tabela de valores e hashes, assim: +------------+----------+------+-----+---------+----------------+ | Field | Type | Null | Key | Default | Extra | +------------+----------+------+-----+---------+----------------+ | id | int(11) | NO | PRI | NULL | auto_increment | | val | char(9) |...
Eu só ouvi falar de Robert Martin hoje, e parece que ele é uma figura notável no mundo do software, então não quero que meu título apareça como se fosse uma isca de clique ou eu colocando palavras na boca dele, mas isso é simplesmente como interpretei o que ouvi dele com minha experiência e...
Faz diferença se você filtrar uma visualização dentro ou fora da visualização? Por exemplo, existe alguma diferença entre essas duas consultas? SELECT Id FROM MyTable WHERE SomeColumn = 1 Ou SELECT Id FROM MyView WHERE SomeColumn = 1 E MyViewé definido como SELECT Id, SomeColumn FROM...
Estou fazendo um projeto no qual preciso alterar cerca de 36 mil registros em uma tabela diariamente. Eu estou querendo saber o que terá melhor desempenho: excluir linhas e inserir novas ou atualizar linhas já existentes Para mim, é mais fácil excluir todas as linhas e inserir novas, mas se...
Existem muitos artigos exagerando (IMHO, é claro) a necessidade innodb_file_per_table. Eu entendo que com innodb_file_per_table, deve haver um melhor controle sobre as tabelas individuais; como fazer backup de cada tabela separadamente. No entanto, a reivindicação de melhor desempenho é...
Eu sei que os procedimentos armazenados são mais eficientes pelo caminho de execução (do que o sql embutido nos aplicativos). No entanto, quando pressionado, não sou super conhecedor do porquê. Eu gostaria de saber o raciocínio técnico para isso (de uma maneira que eu possa explicar para alguém...
Esta pergunta foi migrada do Stack Overflow porque pode ser respondida no Database Administrators Stack Exchange. Migrou há 7 anos . Eu tenho uma grande tabela de objetos (15M + linha) no PostgreSQL 9.0.8, para a qual desejo consultar um campo desatualizado. Desejo
Quero testar o desempenho (também conhecido como bake-off) rpm do servidor MySQL em relação a alguns outros garfos, como o servidor Percona, o MariaDB e possivelmente outros. Espero que, ao fazer esta pergunta, eu possa entender melhor a metodologia por trás da configuração de um teste de...
Estamos executando um site (Moodle) que os usuários acham lento no momento. Acho que localizei o problema no MySQL criando tabelas temporárias no disco. Observo a variável created_tmp_disk_tablesna administração do servidor Mysql Workbench e o número aumenta em aproximadamente 50 tabelas / s. Após...
Considere o seguinte plano de consulta no SQL Server 2014: No plano de consulta, uma união automática ar.fId = ar.fIdgera uma estimativa de 1 linha. No entanto, essa é uma estimativa logicamente inconsistente: arpossui 20,608linhas e apenas um valor distinto de fId(refletido com precisão nas...