Tehnoloogia ja teadus

Neli tehnilist tööpaketti ühendavad ressursid, arutluse, parandamise ja sihtrühmapõhise kohandamise.

WP2 M1–M15

UOC

Korpused, terminoloogia ja andmete rikastamine

Koostab bioteaduste paralleel- ja võrreldavad korpused, täiustab TBXToolsi ning loob morfoloogilise infoga terminibaasid.

500K segments for EN–ES/CA/ET · 100K for Irish · 2,500 terms per EN/ES/CA/ET · 500 Irish terms

Ülesanded
  • T2.1 Corpus compilation
  • T2.2 Enhancement of TBXTools
  • T2.3 Terminological databases
  • T2.4 Term-substitution augmentation
Tulemused
  • D2.1 Corpora · M6
  • D2.2 TBXTools · M7
  • D2.3 Terminology databases · M9
  • D2.4 Augmented corpora · M15
WP3 M1–M34

BSC

Terminoloogiateadlik masintõlge

Võrdleb suuri arutlusmudeleid juhistega häälestatud LLMidega ning kasutab terminite säilitamiseks sõnastikke, eneseanalüüsi ja dokumendikonteksti.

5 languages · ≥3 scientific genres · ≥20 BLEU · ≤0.4 TER

Ülesanded
  • T3.1 Domain datasets
  • T3.2 Reasoning capabilities
  • T3.3 Emerging terminology
  • T3.4 Comparative experiments
Tulemused
  • D3.1 Instruction and CoT data · M18
  • D3.2 LRM model · M24
  • D3.3 Benchmark results · M33
WP4 M4–M33

University of Surrey

Kvaliteedihindamine ja automaatne järeltoimetamine

Tuvastab, selgitab ja parandab terminivead. QE ja APE treenitakse koos ning integreeritakse tõlkemudeliga.

≥80% F1 terminology-span detection · ≥15% human-rated terminology accuracy improvement

Ülesanded
  • T4.1 Baselines and seed data
  • T4.2 QE-adapted decoding
  • T4.3 Joint QE and APE
  • T4.4 API and integration
Tulemused
  • D4.1 QE-integrated LRM · M18
  • D4.2 QE-adapted decoding · M24
  • D4.3 Joint QE/APE · M33
  • D4.4 Integrated API · M33
WP5 M16–M28

University of Tartu

Tõlkejärgne teksti kohandamine

Kirjutab tõlgitud sisu ekspertidele ja tavalugejatele ümber, kasutades lihtsustamist, terminoloogilist tuge, kokkuvõtteid ja selgitusi.

2 use cases · scientific dissemination and public outreach · ≥75% positive user feedback

Ülesanded
  • T5.1 Augmentation strategies
  • T5.2 Audience-aware implementation
Tulemused
  • D5.1 Augmentation framework · M19
  • D5.2 Implemented strategies · M28