UOC
Corpus, terminologia i augmentació de dades
Construeix corpus paral·lels i comparables de ciències de la vida, millora TBXTools i crea bases terminològiques amb informació morfològica.
500K segments for EN–ES/CA/ET · 100K for Irish · 2,500 terms per EN/ES/CA/ET · 500 Irish terms
Tasques
- T2.1 Corpus compilation
- T2.2 Enhancement of TBXTools
- T2.3 Terminological databases
- T2.4 Term-substitution augmentation
Lliurables
- D2.1 Corpora · M6
- D2.2 TBXTools · M7
- D2.3 Terminology databases · M9
- D2.4 Augmented corpora · M15