El corpus de aprendices japoneses CELEN y su aplicación a la docencia y la investigación en ELE

Autores/as

DOI:

https://doi.org/10.1344/teisel.v3.42898

Palabras clave:

corpus de aprendices, expresión escrita, español, lengua extranjera

Resumen

En este artículo se presenta el Corpus de ELE en Japón, CELEN (https://ske.li/qqr), una colección de textos escritos por hablantes de japonés (L1) con distintos grados de dominio del español como lengua extranjera, desde el nivel A1 hasta el nivel C2 del MCER. Los datos proceden de (1) universidades en Japón, donde el español se estudia como asignatura de lengua extranjera o como carrera, y (2) contextos de interacción real en Internet, como blogs electrónicos y foros. La versión 1.2, de abril de 2023, consta de 6.196 textos escritos por 1.035 aprendices, con un total de 658.467 palabras. En el apartado 1 se resume brevemente la situación del español en Japón y los corpus de aprendices existentes. En el apartado 2 se describen las características principales de CELEN, el proceso de recogida y anotación de los datos y la interfaz de consulta. En el apartado 3 se ilustra su uso con varios tipos de búsquedas (concordancias, colocaciones, listas de palabras y n-gramas), aplicadas a fenómenos lingüísticos relevantes en la docencia o la investigación en ELE: el uso de se, las preposiciones, la concordancia de género, el orden de palabras, las colocaciones verbales, la frecuencia léxica o las secuencias de categorías gramaticales más frecuentes. Se trata de un recurso abierto, que se actualiza periódicamente, y esperamos que otros profesores e investigadores puedan albergar sus textos en él para ofrecer a la comunidad científica una amplia muestra de aprendices japoneses de español. En la página web del proyecto (https://sites.google.com/view/celen) se puede consultar la guía de uso detallada y descargar íntegramente algunas partes del corpus bajo una licencia CC BY-NC 4.0.

Biografía del autor/a

Pilar Valverde, Universidad Kansai Gaidai

Pilar Valverde es licenciada en Filología Hispánica por la Universidad de Barcelona, máster en Ciencia Cognitiva y Lenguaje por la misma universidad y doctora europea en Lengua Española, por la Universidad de Santiago de Compostela. Ha trabajado en la anotación de corpus con información sintáctica y semántica en el Centro de Lenguaje y Computación de la Universidad de Barcelona, el Departamento de Lengua Española de la Universidad de Santiago de Compostela y el Instituto de Lengua y Comunicación de la Universidad de Dinamarca del Sur. Desde 2010 enseña español como lengua extranjera en Japón, a estudiantes de especialidad, y actualmente es profesora asociada en la facultad de estudios extranjeros de la Universidad Kansai Gaidai. Su campo de investigación son las tecnologías lingüísticas, la enseñanza/aprendizaje del español como lengua extranjera y el análisis de la expresión escrita de los estudiantes japoneses. Ha sido investigadora principal en proyectos de la Japan Society for the Promotion of Science sobre detección automática de errores gramaticales y creación de corpus de aprendices.

Descargas

Publicado

2023-10-26

Número

Sección

Sección "Artículos sobre creación y uso de herramientas y recursos"