Voxcribe – Segunda tentativa

Contei há poucos dias da minha primeira tentativa, que foi mais um teste, com o Voxcribe. Fiz com um trecho de vídeo em japonês parecido com o tipo de vídeo que representa grande parte de meu trabalho.

Desta vez, testei com um vídeo parecido com esse, mas em inglês. Afinal, o programa foi feito para reconhecer esse idioma. E digo que os vídeos são parecidos pois ambos são de animação e de ficção. Ou seja, os diálogos são dublados e há efeitos sonoros e músicas de fundo.

Infelizmente, minha impressão geral continuou a mesma do primeiro teste. Em um vídeo que deu cerca de 200 legendas, ele acertou bem cerca de 10 delas. E estou sendo bem generosa nessa estimativa.

Para mim, o mais decepcionante nesse segundo teste foi o reconhecimento de fala e separação das legendas ter sido extremamente precário em trechos com quase nenhum ruído de fundo e um inglês mais claro. Na verdade, a impressão geral que eu tive (e que, provavelmente, é bem tendenciosa) foi de que o programa se saiu melhor em trechos com música ou ruído de fundo do que em trechos com o áudio mais limpo.

Enfim, para o meu uso, ficou óbvio que o programa não serve. Caso algum dia eu me depare com uma legendagem de uma palestra, testarei novamente, pois esse é para ser o ponto forte do programa.

Voxcribe – primeira tentativa

Esses dias no grupo de tradutores e intérpretes do Facebook, mencionaram o Voxcribe. Não foi a primeira vez que tinha ouvido falar do programa, mas foi a primeira vez que resolvi testá-lo.

É um programa que reconhece áudio em inglês de um dado vídeo e cria a legenda .srt com o texto transcrito automaticamente. Ele é pago de acordo com o uso e o usuário recém-cadastrado ganha 60 minutos como teste.

Primeiras impressões do programa

É um programa pesado. O seu instalador tem 1,3 Gb e os requisitos mínimos já colocam 4 Gb de RAM. Porém, nada anormal para quem trabalha com a área audiovisual.

Apesar disso, o programa roda perfeitamente, sem travar nem enroscar. A interface é bem intuitiva e minimalista. Facílimo de usar.
Funcionalidade

Agora vamos ao que interessa: se o programa faz a legenda bem ou não. Nessa primeira tentativa, eu peguei uma amostra de vídeo que representa cerca de 90% dos meus trabalhos: animação japonesa. Ou seja, diálogos em uma língua não reconhecida pelo programa e com efeitos sonoros e músicas de fundo.

Obviamente, eu não esperava nada do texto em si, e realmente nada foi o que eu obtive. No entanto, tinha esperanças de que a marcação do tempo já viesse mais ou menos feita. Ao menos as partes sem muito ruído de fundo.

Infelizmente, não obtive muitos resultados nesse quesito. O programa deixou de identificar falas em certos momentos e identificou falas inexistentes até em momentos de ruído mínimo, o que eu achei bastante estranho.
Enfim, por enquanto o programa não atende às minhas necessidades. Pretendo em breve fazer um teste com um episódio inteiro, e não só um trecho como desta vez.

Pelos motivos citados (não ser inglês, efeitos sonoros e música de fundo), acho difícil que os resultados sejam muito diferentes dos que já obtive, mas, por enquanto, não custa tentar. Também procurarei programas que transcrevam em japonês.