Paralelización del corpus sensem: español-catalán

Gloria Vázquez, Ana Fernández Montraveta

Resum


En ese trabajo presentamos un corpus paralelo para las lenguas española y catalana, SenSem. Se trata de un corpus paralelo anotado a distintos niveles lingüísticos (morfológico, sintáctico y semántico) y que abarca distintas unidades de información (palabra, sintagma y oración).  Uno de los valores principales de este recurso es que ha supuesto la creación del primer corpus del catalán con información relativa a aspectos de la semántica oracional, como la aspectualidad y la modalidad. El recurso se ha creado traduciendo al catalán el corpus ya creado para el español en un proyecto anterior y manteniendo los vínculos entre ambas lenguas entre las distintas unidades de información mencionadas. Además, se ha heredado la anotación que se llevó a cabo para el español, corrigiendo cuando ha sido necesario la información para el catalán.


Text complet:

PDF (Español)


DOI: http://dx.doi.org/10.1344/AFEL2011.1.7

Enllaços refback

  • No hi ha cap enllaç refback.




Anuari de Filologia. Estudis de Lingüística
Coordinadora: Dra. Mar Garachana
Deganat de la Facultat de Filologia
Universitat de Barcelona
Gran Via de les Corts Catalenes, 585 - 08007 Barcelona
Adreça electrònica: margarachana@ub.edu

RCUB revistesub@ub.edu Avís Legal RCUB Universitat de Barcelona