Contei há poucos dias da minha primeira tentativa, que foi mais um teste, com o Voxcribe. Fiz com um trecho de vídeo em japonês parecido com o tipo de vídeo que representa grande parte de meu trabalho.
Desta vez, testei com um vídeo parecido com esse, mas em inglês. Afinal, o programa foi feito para reconhecer esse idioma. E digo que os vídeos são parecidos pois ambos são de animação e de ficção. Ou seja, os diálogos são dublados e há efeitos sonoros e músicas de fundo.
Infelizmente, minha impressão geral continuou a mesma do primeiro teste. Em um vídeo que deu cerca de 200 legendas, ele acertou bem cerca de 10 delas. E estou sendo bem generosa nessa estimativa.
Para mim, o mais decepcionante nesse segundo teste foi o reconhecimento de fala e separação das legendas ter sido extremamente precário em trechos com quase nenhum ruído de fundo e um inglês mais claro. Na verdade, a impressão geral que eu tive (e que, provavelmente, é bem tendenciosa) foi de que o programa se saiu melhor em trechos com música ou ruído de fundo do que em trechos com o áudio mais limpo.
Enfim, para o meu uso, ficou óbvio que o programa não serve. Caso algum dia eu me depare com uma legendagem de uma palestra, testarei novamente, pois esse é para ser o ponto forte do programa.