O tempo necessário para a cópia de 1,5 TB de dados depende muito do tipo de dados. Se você tiver alguns 1.500 arquivos de 1 GB, provavelmente levará apenas algumas horas, mas se você tiver um bilhão e meio de 1 KB, provavelmente levará dias.
Isso ocorre devido a duas especificações rivais nos discos: a taxa de transferência e o tempo médio de acesso. Um disco tradicional com taxa de transferência de 100 MB / s e tempo de acesso de 10 ms é bastante comum. Se você puder transmitir dados sequencialmente, poderá obter 100 MB / s. No entanto, se você precisar pular para outro local, leva 10 ms. Se você estivesse transmitindo, poderia escrever 1 MB de dados no tempo necessário para ir para outro local.
A criação de um arquivo pode levar várias buscas, portanto, a criação de um arquivo de 1 KB pode "custar" tanto quanto o fluxo de vários MB de dados.
Portanto, em alguns casos, é melhor fazer uma cópia em disco bruto do dispositivo de bloco do que copiar no sistema de arquivos por meio de algo como rsync. Se você possui muitos arquivos, em um sistema de arquivos com 50% ou mais de tamanho, geralmente é melhor copiar o dispositivo de bloco completo via "dd", o tempo que for necessário. Obviamente, você não pode fazer isso enquanto o sistema de arquivos está montado, portanto, isso também tem desvantagens.
Os SSDs podem ajudar a atenuar isso, porque seus tempos de acesso são cerca de 100 vezes mais rápidos, mas as unidades SSD MLC têm problemas de acesso complicados, dependendo da disponibilidade de um conjunto de blocos pré-apagados. Os SSDs SLC podem ajudar nisso.
Os controladores RAID com cache interno podem ajudar nas buscas, assim como algo como o módulo do kernel flashcache que permite armazenar em cache um dispositivo de bloco por meio de um SSD.
Os sistemas RAID podem permitir várias buscas paralelas, reduzindo efetivamente o tempo médio de acesso e também a paralelização para aumentar a taxa de transferência. Mas seu desempenho geral geralmente depende de quantos arquivos estão envolvidos.