Paralelización del corpus sensem: español-catalán
DOI:
https://doi.org/10.1344/AFEL2011.1.7Palabras clave:
anotación de corpus, corpus del español, corpus del catalán, paralelización de corpus, sintaxis, semánticaResumen
En ese trabajo presentamos un corpus paralelo para las lenguas española y catalana, SenSem. Se trata de un corpus paralelo anotado a distintos niveles lingüísticos (morfológico, sintáctico y semántico) y que abarca distintas unidades de información (palabra, sintagma y oración). Uno de los valores principales de este recurso es que ha supuesto la creación del primer corpus del catalán con información relativa a aspectos de la semántica oracional, como la aspectualidad y la modalidad. El recurso se ha creado traduciendo al catalán el corpus ya creado para el español en un proyecto anterior y manteniendo los vínculos entre ambas lenguas entre las distintas unidades de información mencionadas. Además, se ha heredado la anotación que se llevó a cabo para el español, corrigiendo cuando ha sido necesario la información para el catalán.
Descargas
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
1. El autor o autora conserva los derechos. Creative Commons
El autor/a que publica en esta revista está de acuerdo con los siguientes términos:
a. El autor/a conserva los derechos de autoría y otorga a la revista el derecho de primera publicación de su trabajo.
b. Los textos están sujetos a una licencia de Creative Commons: Reconeixement 4.0 Internacional.