Traducción automática sensible a la terminología

La ciencia debería hablar todas las lenguas.

TaMTAS traduce textos de ciencias de la vida conservando su terminología y después los adapta a quienes necesitan comprenderlos.

El reto

El inglés no debería decidir quién puede crear o comprender ciencia.

La perspectiva técnica

El proyecto desarrolla un sistema de traducción y aumento textual a nivel de documento, sensible a la terminología y orientado a las ciencias de la vida. Combina modelos de razonamiento de gran escala, estimación de calidad, posedición automática y adaptación de audiencias en inglés, español, catalán, estonio e irlandés.

Cómo funciona

Del lenguaje especializado al conocimiento compartido.

El flujo técnico sigue la interdependencia entre paquetes de trabajo descrita en la memoria del proyecto.

  1. Corpus y terminología

    Construir la base científica

    Los corpus multilingües y las bases terminológicas enriquecidas fijan los términos que el sistema debe preservar.

    WP2 · TBXTools · corpus paralelos y comparables

  2. Razonar y verificar

    Traducir, detectar y corregir

    Un LRM traduce a nivel de documento. La estimación de calidad y la posedición automática identifican errores terminológicos y devuelven correcciones.

    WP3 + WP4 · LRM · QE · APE · DPO

  3. Adaptar

    Ajustar el resultado a quien lo lee

    El texto traducido puede simplificarse y complementarse con resúmenes, glosarios y explicaciones para distintas audiencias.

    WP5 · aumento textual · adaptación de audiencias

La ambigüedad, a la vista

Una palabra correcta aún puede ser una traducción equivocada.

Esta demostración conceptual muestra por qué la traducción científica necesita contexto documental y terminología controlada.

Término de origen culture

Traducción genérica

Selecciona el significado común de la palabra aislada, sin saber si el documento trata de sociedad o de una muestra de laboratorio.

Enfoque sensible a la terminología

Usa el dominio de ciencias de la vida, las frases circundantes y una base terminológica para resolver el concepto previsto de forma coherente en todo el documento.

Validación en contextos reales

Tres entornos donde la terminología tiene consecuencias.

Las entidades colaboradoras aportan documentos auténticos y evaluación experta o ciudadana sobre precisión, claridad, fluidez y utilidad.

Barcelona Catalán
01

Centre de Regulació Genòmica

Investigación genómica, divulgación y enriquecimiento de la terminología científica de alto nivel en catalán.

Irlanda Irlandés
03

Conradh na Gaeilge

Comunicación científica y sanitaria bilingüe y accesible para pacientes, profesionales, investigadores y ciudadanía.

5 lenguas del proyecto
36 meses
Ciencias de la vida dominio inicial
TRL 5–6 validación prevista