El corpus d’aprenents japonesos CELEN y la seva aplicació a la docència i la investigació en ELE

Autors/ores

DOI:

https://doi.org/10.1344/teisel.v3.42898

Paraules clau:

espanyol, llengua estrangera, corpus d’aprenents, expressió escrita

Resum

En aquest article es presenta el corpus d’ELE al Japó, CELEN (https://ske.li/qqr), una col·lecció de textos escrits per parlants de japonès com a primera llengua amb diversos graus de domini de l’espanyol com a llengua estrangera, des del nivell A1 fins al nivell C2 del MCER. Les dades procedeixen de (1) universitats dels Japó, on l’espanyol s’estudia com a assignatura de llengua estrangera o com a carrera, y (2) àmbits d’interacció real a Internet com blogs electrònics y fòrums. La versió 1.2, d'abril de 2023, consta de 6.196 textos escrits per 1.035 aprenents, en total 658.467 paraules. A l'apartat 1 es resum breument la situació de l'espanyol al Japó i els corpus d'aprenents existents. A l'apartat 2 es descriuen les característiques principals de CELEN, el procés de recollida i anotació de les dades i la interfície de consulta. A l'apartat 3 se n’il·lustra el seu ús amb diversos tipus de cerques (concordances, col·locacions, llistes de paraules i n-grames) aplicades a alguns fenòmens lingüístics rellevants en la docència o la investigació de l'espanyol com a llengua estrangera: l'ús del clític se, les preposicions, la concordança de gènere, l’ordre de paraules, les col·locacions verbals, la freqüència lèxica o les seqüències de categories gramaticals més freqüents. Es tracta d'un recurs obert, que s’actualitza periòdicament, i esperem que d’altres professors i investigadors puguin albergar-hi els seus textos per oferir a la comunitat científica una àmplia mostra d'aprenents japonesos d'espanyol. A la pàgina web del projecte (https://sites.google.com/view/celen) es pot consultar la guia d’ús detallada i descarregar íntegrament algunes parts del corpus sota una llicència CC BY-NC 4.0.

 

Descàrregues

Les dades de descàrrega encara no estan disponibles.

Biografia de l'autor/a

Pilar Valverde, Universidad Kansai Gaidai

Pilar Valverde és llicenciada en Filologia Hispànica per la Universitat de Barcelona, màster en Ciència Cognitiva i Llenguatge per la mateixa universitat i doctora europea a Llengua Espanyola, per la Universitat de Santiago de Compostela. Ha treballat en l'anotació de corpus amb informació sintàctica i semàntica al Centre de Llenguatge i Computació de la Universitat de Barcelona, el Departament de Llengua Espanyola de la Universitat de Santiago de Compostela i l'Institut de Llengua i Comunicació de la Universitat de Dinamarca del Sud. Des del 2010 ensenya espanyol com a llengua estrangera al Japó, a estudiants d'especialitat, i actualment és professora associada a la facultat d'estudis estrangers de la Universitat Kansai Gaidai. El seu camp de recerca són les tecnologies lingüístiques, l'ensenyament/aprenentatge de l'espanyol com a llengua estrangera i l'anàlisi de l'expressió escrita dels estudiants japonesos. Ha estat investigadora principal en projectes de la Japan Society for the Promotion of Science sobre detecció automàtica d'errors gramaticals i creació de corpus d'aprenents.

Descàrregues

Publicades

2023-10-26

Número

Secció

«Articles sobre la creació i ús d'eines i recursos»