XML::TMX -- Processamento de Memórias de Tradução de Grandes Dimensões
José João Almeida (Departamento de Informática - Universidade do Minho)
Alberto Simões (Departamento de Informática - Universidade do Minho)

Abstract:
As ferramentas de tradução assistida por computador tentam reutilizar as traduções realizadas pelo tradutor sempre que uma frase semelhante tenha sido já traduzida. Para o intercâmbio destes documentos foi definido um formato denominado TMX (Translation Memory Exchange) baseado em XML.
Este tipo de documento ganha facilmente tamanhos incomportáveis para o seu processamento com métodos tradicionais.
Neste artigo propomos uma metodologia de ordem superior para o processamento de documentos de estrutura repetitiva (em que se inserem as memórias de tradução) com uma abordagem baseada na conjunção de SAX e DOM.
São apresentados vários exemplos de filtros sobre memórias de tradução bem como um conjunto de medidas da sua eficiência.

Keywords:
Edição e Processamento de Documentos XML, Standards XML, Processamento de Linguagem Natural