Terminoloogiateadlik masintõlge

Teadus peaks kõnelema kõigis keeltes.

TaMTAS tõlgib bioteaduste tekste, säilitab nende terminoloogia ja kohandab tulemuse inimestele, kes peavad seda mõistma.

Probleem

Inglise keel ei tohiks määrata, kes saab teadust luua või mõista.

Tehniline vaade

Projekt arendab bioteaduste jaoks terminoloogiateadlikku dokumenditasandi tõlke- ja tekstikohandussüsteemi. See ühendab suured arutlusmudelid, kvaliteedihindamise, automaatse järeltoimetamise ja sihtrühmapõhise kohandamise inglise, hispaania, katalaani, eesti ja iiri keeles.

Kuidas see töötab

Erialakeelest jagatud teadmiseni.

Tehniline töövoog järgib projekti taotluses kirjeldatud tööpakettide vastastikust sõltuvust.

  1. Korpused ja terminoloogia

    Teadusliku aluse loomine

    Mitmekeelsed korpused ja rikastatud terminibaasid määravad terminid, mida süsteem peab säilitama.

    WP2 · TBXTools · paralleel- ja võrreldavad korpused

  2. Arutlemine ja kontroll

    Tõlkimine, tuvastamine ja parandamine

    LRM tõlgib dokumenditasandil. Kvaliteedihindamine ja automaatne järeltoimetamine tuvastavad terminivead ning annavad parandused tagasi.

    WP3 + WP4 · LRM · QE · APE · DPO

  3. Kohandamine

    Tulemuse sobitamine lugejale

    Tõlgitud teksti saab lihtsustada ning täiendada kokkuvõtete, sõnastike ja selgitustega eri sihtrühmadele.

    WP5 · teksti kohandamine · sihtrühmapõhine esitus

Nähtav mitmetähenduslikkus

Õige sõna võib siiski olla vale tõlge.

See kontseptuaalne näide selgitab, miks teadustõlge vajab dokumendikonteksti ja kontrollitud terminoloogiat.

Lähtetermin culture

Üldtõlge

Valib eraldiseisva sõna tavapärase tähenduse, teadmata, kas dokument käsitleb ühiskonda või laboriproovi.

Terminoloogiateadlik lähenemine

Kasutab bioteaduste valdkonda, ümbritsevaid lauseid ja terminibaasi, et lahendada mõiste kogu dokumendis järjepidevalt.

Valideerimine tegelikus kasutuses

Kolm keskkonda, kus terminoloogial on tagajärjed.

Sidusrühmad annavad autentseid dokumente ning ekspertide või avalikkuse tagasisidet täpsuse, selguse, ladususe ja kasulikkuse kohta.

Barcelona Katalaani
01

Centre de Regulació Genòmica

Genoomiuuringud, teaduse populariseerimine ja kõrgetasemelise katalaanikeelse teadusterminoloogia rikastamine.

Iirimaa Iiri
03

Conradh na Gaeilge

Ligipääsetav kakskeelne teadus- ja tervishoiukommunikatsioon patsientidele, arstidele, teadlastele ja avalikkusele.

5 projekti keelt
36 kuud
Bioteadused esialgne valdkond
TRL 5–6 sihttase valideerimisel