Quais são as diferenças entre o algoritmo de Baum-Welch e o treinamento de Viterbi?

Atualmente, estou usando o treinamento Viterbi para um problema de segmentação de imagem. Eu queria saber quais são as vantagens / desvantagens de usar o algoritmo Baum-Welch em vez do treinamento em Viterbi.