Also known as parallel text, parallel corpus, tritext
text placed alongside its translation or translations
Um corpus paralelo é um texto colocado ao lado de sua tradução ou traduções. O alinhamento do corpus paralelo é a identificação das sentenças correspondentes em ambas as metades do corpus paralelo. A Loeb Classical Library e a são dois exemplos de séries de textos em duas línguas. As Bíblias de referência podem conter os idiomas originais e uma tradução, ou várias traduções por si mesmas, para facilitar a comparação e o estudo; a Héxapla de Orígenes (grego para 'seis vezes') colocou seis versões do Antigo Testamento lado a lado. Um exemplo famoso é a Pedra de Roseta, cuja descoberta permitiu que a língua egípcia pudesse começar a ser decifrada.Grandes coleções de corpus paralelos são chamados de corpora paralelos (ver ). Alinhamentos de corpora paralelos no nível da frase são pré-requisitos para muitas áreas da pesquisa linguística. Durante a tradução, as frases podem ser divididas, mescladas, excluídas, inseridas ou reordenadas pelo tradutor. Isso torna o alinhamento uma tarefa não trivial.
Abstract from DBpedia / Wikipedia · CC BY-SA
via Wikidata sitelinks · CC0
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).