Paralelización del corpus sensem: español-catalán

Autors/ores

  • Gloria Vázquez García Universitat de Lleida
  • Ana Fernández Montraveta Universitat Autònoma de Barcelona

DOI:

https://doi.org/10.1344/AFEL2011.1.7

Paraules clau:

anotació de corpus, corpus de l'espanyol, corpus del català, paral·lelització de corpus, sintaxi, semàntica

Resum

En ese trabajo presentamos un corpus paralelo para las lenguas española y catalana, SenSem. Se trata de un corpus paralelo anotado a distintos niveles lingüísticos (morfológico, sintáctico y semántico) y que abarca distintas unidades de información (palabra, sintagma y oración).  Uno de los valores principales de este recurso es que ha supuesto la creación del primer corpus del catalán con información relativa a aspectos de la semántica oracional, como la aspectualidad y la modalidad. El recurso se ha creado traduciendo al catalán el corpus ya creado para el español en un proyecto anterior y manteniendo los vínculos entre ambas lenguas entre las distintas unidades de información mencionadas. Además, se ha heredado la anotación que se llevó a cabo para el español, corrigiendo cuando ha sido necesario la información para el catalán.

Descàrregues

Les dades de descàrrega encara no estan disponibles.

Descàrregues

Publicades

2022-05-13

Com citar

Vázquez García, G., & Fernández Montraveta, A. (2022). Paralelización del corpus sensem: español-catalán. Anuari De Filologia. Estudis De Lingüística, 1(1), 167–193. https://doi.org/10.1344/AFEL2011.1.7