Description and usability of HARTA, a tool to help writing academic texts in Spanish

Authors

DOI:

https://doi.org/10.1344/teisel.v2.42173

Keywords:

Spanish for academic purposes, writing, lexicography, lexical combinations

Abstract

This article presents the building-up of HARTA (http://www.dicesp.com:8083/), an online tool that combines dictionary and corpus, in line with the trend of recent years in lexicography. HARTA focuses on academic lexical combinations (ALCs) in Spanish. ALCs cover phenomena of a varied nature: both collocations (confirmar/refutar una hipótesis ‘to confirm/ to refute a hypothesis’) and what we have lumped together under the umbrella term formula (sin embargo ‘however’, por otra parte ‘on the other hand’, como ya hemos señalado ‘as we have already noted’, etc.). By the term of ALC we refer to recurrent word segments in academic discourse, which may or may not be compositional and which may fulfil a discursive function ('to compare', 'to reformulate', 'to express certainty or possibility', etc.), as is the case of formulas. For their description, in addition to relying on Meaning-Text Theory, we provide quantitative data from the academic corpus from which we have extracted the list of ALCs (frequency and distribution in different scientific disciplines). Once we have presented the methodology used to obtain the data, we describe the architecture of HARTA to show different entries for ALCs and the different ways of accessing the information. Before concluding with the lines of research in progress, we offer a short experimental study on the usability of the tool.

 

Downloads

Download data is not yet available.

Author Biographies

Eleonora Guzzi, Universidade da Coruña

Es graduada en Lenguas aplicadas por la Universitat Pompeu Fabra (Barcelona) y tiene un Máster de Ciencia Cognitiva y Lenguaje por la Universitat de Barcelona. Actualmente, está finalizando su doctorado en el Programa de doctorado Estudios Lingüísticos de la Universidade da Coruña. Su tesis se centra en la identificación y el tratamiento de colocaciones del discurso académico en español con dos finalidades principales: 1) alimentar la base de datos de HARTA (Alonso-Ramos, García-Salido, Garcia 2017) y 2) utilizarlas como índice en la evaluación del perfil fraseológico de los textos académicos. Desde 2018 es miembro del grupo de investigación LyS (Lengua y Sociedad de la Información). Asimismo, ha participado en los diferentes proyectos de investigación asociados a la herramienta. Ha presentado varias contribuciones a congresos como AELINCO, eLex2019, eLex2021, SEL, etc. sobre el estatus de las colocaciones académicas, las técnicas (semi)automáticas para su identificación a partir de corpus y sobre la complejidad colocacional de expertos y noveles. La investigación más detallada sobre la interdisplinariedad de las colocaciones académicas se encuentra en Guzzi y Alonso-Ramos (2022). Asimismo, Guzzi y Alonso-Ramos (2023) proponen medidas de complejidad léxica para determinar el perfil  colocacional de textos académicos.

Margarita Alonso Ramos, Universidade da Coruña

Profesora Titular de Lingüística de la Universidad de A Coruña. Tiene un doctorado en Lingüística por la Universidad de Montreal. Coordinadora del Grupo de investigación Lengua y Sociedad de la Información (http://www.grupolys.org/).  

Su labor investigadora se centra en el papel del léxico tanto en la modelización teórica de la lengua como en los sistemas de procesamiento automático de lengua natural. Ha dirigido diferentes proyectos de investigación sobre la construcción de bases de datos léxicos del español, con especial interés en las combinaciones léxicas restringidas o colocaciones. Desde hace varios años es la responsable del Diccionario de colocaciones del español (DiCE), sobre el que tiene diferentes publicaciones (Alonso-Ramos, 2003; Alonso-Ramos, Nishikawa & Vincze, 2009; Alonso-Ramos, 2010; Alonso-Ramos, 2017; Orol, Alonso-Ramos, 2013; Vincze & Alonso-Ramos, 2013). En los últimos proyectos se ha centrado especialmente en la construcción de HARTA (Alonso-Ramos, García-Salido, Garcia 2017). Autora de Las construcciones con verbo de apoyo (2004) y editora de la monografía Spanish Learner Corpus Research publicada en John Benjamins.  

Published

2023-04-25

Issue

Section

"Articles about Resources and Tools" section