Voxcribe – Segunda tentativa

Contei há poucos dias da minha primeira tentativa, que foi mais um teste, com o Voxcribe. Fiz com um trecho de vídeo em japonês parecido com o tipo de vídeo que representa grande parte de meu trabalho.

Desta vez, testei com um vídeo parecido com esse, mas em inglês. Afinal, o programa foi feito para reconhecer esse idioma. E digo que os vídeos são parecidos pois ambos são de animação e de ficção. Ou seja, os diálogos são dublados e há efeitos sonoros e músicas de fundo.

Infelizmente, minha impressão geral continuou a mesma do primeiro teste. Em um vídeo que deu cerca de 200 legendas, ele acertou bem cerca de 10 delas. E estou sendo bem generosa nessa estimativa.

Para mim, o mais decepcionante nesse segundo teste foi o reconhecimento de fala e separação das legendas ter sido extremamente precário em trechos com quase nenhum ruído de fundo e um inglês mais claro. Na verdade, a impressão geral que eu tive (e que, provavelmente, é bem tendenciosa) foi de que o programa se saiu melhor em trechos com música ou ruído de fundo do que em trechos com o áudio mais limpo.

Enfim, para o meu uso, ficou óbvio que o programa não serve. Caso algum dia eu me depare com uma legendagem de uma palestra, testarei novamente, pois esse é para ser o ponto forte do programa.

Legendagem com CAT – Processo

Já falei um pouco de como trabalho usando CATs para legendagem, mas ainda não falei como é o processo geral, então vamos a ele:
1. Preparação do arquivo

O primeiro passo do processo é preparar o arquivo para a tradução na CAT. Com arquivos .srt, não é necessário, pois o OmegaT identifica esse formato. No entanto, como trabalho com o formato .ass, preciso passar por esta etapa.

Trata-se de exportar a legenda em formato .txt e retirar os marcadores de quebra de linha (\N).
2. Tradução na CAT

Depois de o arquivo estar pronto, é só traduzi-lo na CAT Tool e ir criando os glossários conforme a necessidade. Depois de pronto, gero o arquivo no idioma alvo e colo o texto de volta no arquivo da legenda com o tempo marcado. Antes, porém, já gosto de passar um corretor ortográfico.
3. Revisão com o vídeo

Agora, com a legenda traduzida, assisto ao vídeo corrigindo os eventuais erros. Como eu não assisto ao vídeo enquanto traduzo na etapa 2, a revisão inclui vários obrigado<>obrigada, você<>vocês e é<>sim. Nesta revisão, o foco é nesse tipo de erro, mas também acaba-se achando erros de concordância, typos etc.

Eu gosto de fazer esta etapa com a fonte da legenda bem maior do que o padrão. Os erros parecem ficar mais evidentes assim.
4. Revisão de texto

Mais uma revisão, agora focada no texto a fim de se corrigir erros gramaticais e de ortografia. Ao final, passo um corretor ortográfico e gramatical.
5. Atualização da TM

Depois da etapa 4, eu entrego o arquivo, que ainda passará por revisores. Depois de ter a versão final em mãos, é hora de atualizar a TM (memória de tradução) para que as propagações de flashbacks e de frases repetitivas em episódios futuros já venham com o texto final.

Para isso, eu vou novamente à CAT Tool e gero o arquivo no idioma alvo. Então, exporto o texto da legenda totalmente corrigido e uso o Excel para encontrar as linhas que têm divergências entre as duas versões. Com isso em mãos, basta ir alterando a TM na própria CAT Tool ou em algum gestor de memórias de tradução.

Controle de CPS é suficiente?

CPS, ou caracteres por segundo, são uma métrica usada em legendagem para analisar a facilidade de leitura de uma legenda na tela. Como o nome já revela, é uma métrica focada na velocidade. No entanto, há vários outros fatores que influenciam a leitura. Então, já partindo à conclusão, digo que só o controle do CPS não basta para garantir uma boa leitura.

Parto para um exemplo que volta e meia eu percebo enquanto trabalho. Como parâmetro, procuro não deixar CPS acima de 20, idealmente até 18. Apesar disso, várias vezes é possível ler com tranquilidade legendas com 23 e 24 CPS. A frase pode ter uma construção simples, ser algum tipo de ditado popular, que já sabemos o que vem a seguir, ou vários outros motivos.

O mesmo vale para a situação contrária. Há frases com construções mais complexas que exigem uma releitura para serem compreendidas. Além disso, quando o personagem pausa, a tendência é também pausar a leitura. Por conta disso, já aconteceu mais de uma vez de eu me bater para ler legendas de apenas 8 CPS.

Legendagem com CAT – Projetos

Mais um pouco sobre o trabalho de legendagem com CAT. Na publicação a respeito de glossários, falei da importância de manter um glossário distinto para cada série, para evitar que certos termos se confundam ou fiquem duplicados (por exemplo game, que na maioria dos jogos basta traduzir como jogo ou partida, mas que no tênis é uma das partes de um set).

Da mesma forma que é importante manter os glossários separados, é importante fazer o mesmo com projetos e memórias de tradução. Na minha primeira tentativa frustrada de usar CATs para legendagem, um dos erros que cometi foi ter um projeto genérico “Legendagem” e só ir trocando os arquivos nele conforme a necessidade.

Não funciona bem.

Claro que, a princípio, haveria a vantagem de ter uma memória de tradução mais robusta com que se trabalhar. No entanto, essa vantagem acaba sumindo com o tempo que se tem que refazer trechos sem sentido justamente pela amplitude dos projetos. Imagino a frase “He went down”. Traduzi há pouco tempo Gokuaku Ganbo, um drama de um grupo de “consultores” financeiros do submundo. Nessa série, muito provavelmente esse “he went down” significaria “ele foi à falência”. No entanto, também estou traduzindo séries de esportes, como já mencionei. No caso de Daiya no A, de beisebol, possivelmente seria “ele (o rebatedor ou corredor) foi eliminado”.

Além desses casos, em que a mesma frase se traduz de maneiras totalmente diferentes, ainda tem a questão do linguajar. Gokuaku Ganbo, que eu acabei de citar, tem um linguajar mais chulo. Afinal, eles são ou trabalham com agiotas e o público-alvo é demais adulto. Seitokai Yakuindomo é totalmente focado em piadas de cunho sexual com o máximo possível de trocadilhos por minuto. Golden Time é um romance que usa uma abordagem mais fofa. Por mais que algum dos segmentos fonte entre essas séries fosse igual ou similar, não me vejo usando a mesma tradução para eles.

Claro que, de qualquer forma, é possível manter uma só memória e ir adequando conforme a série em mãos. No entanto, acho que fica mais claro separar os projetos.

Legendagem com CAT – Glossários

Vou começar outra série de publicações, desta vez sobre o uso de CAT Tools, programas de auxílio à tradução, na legendagem.

Quando comecei a legendar profissionalmente, tentei usar CAT Tools. Estava empolgada, pois queria aprender mais sobre o uso das CAT e porque estava dando os primeiros passos firmes na carreira de tradução. No entanto, minha falta de experiência tanto em legendas quanto em CATs fez com que os resultados fossem toscos. Acabei decidindo que “o jeito certo” de se traduzir legendas é em programa específico de legendagem.

Há cerca de 8 semanas, porém, e não sei exatamente por que razão, resolvi tentar de novo com o OmegaT. Não volto atrás. Tem a vantagem óbvia de não precisar ficar correndo atrás de certa fala de um episódio de várias semanas anteriores que apareceu em um flashback e a possibilidade de busca nos segmentos fonte e alvo ao mesmo tempo.
No entanto, diria que o que me faz não querer voltar atrás de jeito nenhum é a possibilidade de montar glossários.

Glossários são a glória!

Nomes próprios entram no glossário assim que aparecem. Chega de ficar digitando Sawamuras, Kasumioojis, Hringhornis etc. Além disso, há certas palavrinhas que coloco no glossário também porque meus dedos insistem em digitá-las incorretamente. Por exemplo: você (vulgo vocÊ). Outras simplesmente por serem muito compridas e recorrentes.

Além disso, atualmente estou com duas séries de esportes: Daiya no A (beisebol) e Baby Steps (tênis). Ter um glossário explicativo de certos termos do esporte pode ajudar muito. Além de colocar o termo cuttercutter, também deixo uma nota para mim mesma explicando que esse é um arremesso que “cai” diante do rebatedor, com mais velocidade do que um splitter, mas cuja queda é menos abrupta.

E também tem todo o vocabulário próprio do esporte que acaba se repetindo várias vezes. Arremesso, arremessador, arremessar, rebatedor, receptor, interbases etc. E também o nome de competições. De cabeça, nunca lembraria se eu tinha colocado Circuito Júnior Kanagawa ou Circuito Kanagawa Júnior. Com o glossário, basta eu dar um Ctrl+Espaço que já insiro o termo certo na tradução.

O que não fazer?
Na minha primeira tentativa de usar CAT Tools com legendas, eu nem sabia usar glossários, então não digo por experiência própria. Porém, minha sugestão aqui é deixar os glossários de cada projeto separados, e não colocar tudo em um mesmo “pacotão”. Em uma mesma série, é difícil que isso aconteça, mas ao se juntar várias, é muito possível que haja certos desencontros e ambiguidades. Digamos que além de Baby Steps, de tênis, eu estivesse encarregada de Haikyuu, sobre voleibol. Volley em tênis é voleio, quando se devolve a bola antes de ela quicar na quadra. Volley em voleibol é simplesmente o nome abreviado do esporte, usado principalmente em nomes de torneios e de times. Ainda seguindo essa ideia, game na maioria dos casos seria partida ou jogo, mas no caso do tênis, é a subdivisão de um set.

Resumindo a ideia: cada série com seu glossário!

3 Dilemas do tradutor

Em um dia de trabalho, passamos por diversos dilemas. Não estou falando de traduções difíceis, necessariamente, mas de pequenas ações que temos de tomar e que gostaríamos de evitar. Cito aqui três que me são recorrentes:

1. “Entre ele e mim”
Sabemos que esta é a forma certa, mas por algum motivo esse “mim” não cai nada bem aos olhos. Sempre que possível, tentamos trocar por “entre nós”, mas em certos casos não tem como escapar: algum segredo vai ficar só entre ele e mim mesmo.

2. Abandonar nossos regionalismos
Todos temos regionalismo, o que é ótimo, mas ao traduzir, temos que abrir mão delas, pois nosso locale é o Brasil todo, não só a nossa região.
No meu caso, já derramei lágrimas curitibanas quando tive que substituir uma “vina” por uma salsicha genérica. Por algum motivo, porém, não tenho o menor problema em trocar penal por estojo.

3. “Se você o vir, mande um oi”
Talvez este seja um problema maior entre os profissionais da legendagem, pois nosso leitor não tem tempo de processar o texto e qualquer estranhamento pode atrapalhar a fluidez da leitura. Infelizmente, o subjuntivo do verbo ver é um desses elementos que causam estranhamento e muitas vezes acaba preterido por seus sinônimos.
E, ao mesmo tempo, por ser um verbo pequeno, trocar um “vir” por “encontrar” ou “observar” pode fazer estourar o CPS da linha em questão.