Qual é a complexidade de tempo para treinar uma rede neural usando retropropagação?

Suponha que um NN contenha nnn camadas ocultas, mmm exemplos de treinamento, xxx recursos e ninin_i nós em cada camada. Qual é a complexidade de tempo para treinar esse NN usando a propagação traseira? Eu tenho uma idéia básica sobre como eles encontram a complexidade do tempo dos algoritmos, mas...