Status Update 25/08

Em primeiro lugar gostaria de dizer que estamos muito felizes com a velocidade com que o nosso pequeno projeto está evoluindo!

Para esta edição do projeto mudamos a abordagem da tradução com o objetivo de simplificar o processo para os nossos voluntários e ao mesmo tempo para buscar acelerar o processo de tradução.

Nas edições anteriores a tradução era feita diretamente sobre os arquivos SGMLs, encodados em ISO 8859-1 (Latin-1), e tratávamos a acentuação usando tags tais como é para é , á para á, ã para ã e assim sucessivamente.  Esta forma de trabalho requeria voluntários dispostos a aprender SGML e dispostos a não só traduzir a documentação como formatar os documentos gerados segundo o guia de estilo adotado pelo projeto. O resultado prático era que o trabalho progredia lentamente e os voluntários perdiam rapidamente o interesse em contribuir.

Com o objetivo de simplificar o processo de tradução, nesta edição do Doc-BR  optamos por adotar o uso dos arquivos gettext (.po files) que o Projeto de Documentação do FreeBSD introduziu 2015, e até o momento a decisão se mostrou bastante acertada.

No workflow de tradução estamos usando arquivos encodados em UTF-8 para que os voluntários possam acentuar normalmente suas traduções, e disponibilizamos os mesmos para tradução na plataforma Zanata, uma plataforma web de tradução que possibilita o trabalho simultâneo de vários voluntários em um mesmo arquivo .po., o que simplificou muito o processo por permitir que qualquer pessoa possa contribuir, mesmo aqueles que dispõe de apenas 5 minutos por dia conseguem contribuir.

Conversando com muitos dos nossos voluntários para entender o fluxo de trabalho que eles estavam adotando no Zanata constatamos que a grande maioria considerava normal o uso de ferramentas online de tradução para ajudar no trabalho, como o resultado obtido em muitas destas ferramentas era bastante satisfatório para muito do texto a ser trabalhado decidimos fazer alguns testes para buscar uma forma de simplificar ainda mais o processo para eles.

Como resultado dos testes desenvolvemos um conjunto de scripts para extrair dos arquivos .po todas as strings de texto em en_US e para submete-las para a tradução no serviço do Google Cloud Translation API, o resultado desta tradução foi incorporado nos arquivos sendo trabalhados no Zanata e marcados como draft (fuzzy) de forma que nossos voluntários não precisam mais fazer este processo manualmente, e para a maior parte das strings eles podem simplesmente proceder com uma revisão ajustando o texto para garantir que o mesmo faça sentido dentro do contexto do documento.

Também configuramos um pipeline utilizando Jenkins que além de compilar a documentação automaticamente algumas vezes no dia, também procede com a compilação dos mesmos que o repositório do projeto no GitHub é atualizado.

Dito isto,  o resultado das primeiras após os primeiros 10 dias de esforço de atualização da documentação do FreeBSD para pt_BR, pode ser visto na imagem abaixo:

A imagem acima significa que ~99.6% do conteúdo de todos documentos produzidos pelo Projeto de Documentação do FreeBSD (7 Livros e 35 Artigos) passaram pelo processo de tradução por meio da IA do Google (status amarelo).  Cerca de ~42,2% do conteúdo traduzido automaticamente já passou pela revisão de pelo menos 1 pessoa (status verde), sendo que  ~7% do conteúdo já passou pela revisão de pelo menos 2 pessoas e foi considerado “finalizado” (status azul).

A mudança no processo de tradução e a simplificação que isso trouxe para o projeto nos permitiu alcançar rapidamente a marca de 20 voluntários, caso tenha interesse em contribuir com o projeto, sua ajuda será muito bem vinda! Basta entrar em contato conosco 🙂

Gostaria de deixar aqui o meu MUITO OBRIGADO em nome do Projeto FreeBSD à todos que doaram e estão doando alguns minutos do seu dia para nos ajudar a facilitar o uso do FreeBSD por parte das pessoas que não tem facilidade com o idioma inglês.

[ ]’s Brandi