Estou escrevendo um rastreador em Ruby (1.9) que consome muito HTML de muitos sites aleatórios. Ao tentar extrair links, decidi usar apenas .scan(/href="(.*?)"/i)nokogiri / hpricot (maior aceleração). O problema é que agora recebo muitos invalid byte sequence in UTF-8erros " ". Pelo que entendi,...