XML::TMX -- Processamento de Memórias de Tradução de Grandes Dimensões
José João Almeida (Departamento de Informática - Universidade do Minho)
Alberto Simões (Departamento de Informática - Universidade do Minho)
Abstract:
As ferramentas de tradução assistida por computador tentam
reutilizar as traduções realizadas pelo tradutor sempre que uma
frase semelhante tenha sido já traduzida. Para o intercâmbio destes
documentos foi definido um formato denominado TMX (Translation
Memory Exchange) baseado em XML.
Este tipo de documento ganha facilmente tamanhos incomportáveis para
o seu processamento com métodos tradicionais.
Neste artigo propomos uma metodologia de ordem superior para o
processamento de documentos de estrutura repetitiva (em que se
inserem as memórias de tradução) com uma abordagem baseada na
conjunção de SAX e DOM.
São apresentados vários exemplos de filtros sobre memórias de
tradução bem como um conjunto de medidas da sua eficiência.
Keywords:
Edição e Processamento de Documentos XML, Standards XML, Processamento de Linguagem Natural