The processing of melodic speech analysis in the PRESEEA corpus: challenge from a computational perspective




This study explores the processing and melodic analysis of speech through the PRESEEA corpus, focusing on the high level of difficulty presented by the computational proposal. The research highlights the importance of computational environments for phonetic analysis, focusing on the study of tone, intensity, and duration of speech and its relationship with intonational groups in Spanish. Using advanced tools such as Oralstats, the efficacy of the Melodic Analysis of Speech (MAS) methodology for the analysis of phonetic data in large volumes of linguistic data is demonstrated. Despite the advantages of these computational tools, the study also points out challenges and limitations in the accuracy and automatic interpretation of prosody. The results emphasize the complexity of prosody and its variability according to sociolinguistic factors, opening new directions for future research in computational linguistics and phonetics.

Keywords: Melodic Analysis of Speech (MAS); PRESEEA corpus; Prosody; ORALSTATS; Spanish


Alfano, I., Llisterri, J., y Savy, R. (2008). Las características acústicas y perceptivas del acento léxico en español y en italiano: los patrones acentuales paroxítonos. Language Design: Journal of Theoretical and Experimental Linguistics, 10, 23-30.

Anthony, L. (2020). Programming for Corpus Linguistics. En Magali Paquot y Stefan Th. Gries (Eds.), A Practical Handbook of Corpus Linguistics (pp.181–207). Springer International Publishing.

Boersma, P., y Weenink, D. (2022). Praat: Doing Phonetics by Computer.

Cabedo Nebot, A. (2022). Oralstats (1.3).

Cantero, F. J. (2002). Teoría y análisis de la entonación. Edicions de la Universitat de Barcelona.

Cantero, F. J. (2016). Corpus de habla espontánea para el estudio de la entonación. En A.M. Fernández Planas (Ed.), 53 reflexiones sobre aspectos de la fonética y otros temas de lingüística (pp. 153-160). Universitat de Barcelona.

Cantero, F. J. (2019). Análisis prosódico del habla: más allá de la melodía. En M. R. Álvarez Silva, A. Muñoz Alvarado, y L. Ruiz Miyares (Eds.), Comunicación Social: Lingüística, Medios Masivos, Arte, Etnología, Folclor y otras ciencias afines (pp. 485–98). Santiago de Cuba: Ediciones Centro de Lingüística Aplicada.

Cantero, F. J., y Font-Rotchés, D. (2007). Entonación del español peninsular en habla espontánea: patrones melódicos y márgenes de dispersión. Moenia, 13, 69-92.

Cantero, F. J., y Font-Rotchés, D. (2009). Melodic analysis of speech method (MAS) applied to Spanish and Catalan. Phonica, 5, 33–47.

Chang, W., Cheng, J., Allaire, JJ., Sievert, C., Schloerke, B., Xie, Y., Allen, J., McPherson, J., Dipert A., y Borges, B. (2022). Shiny: Web Application Framework for r.

Devís, E. (2011). La entonación de (des)cortesía en el español coloquial. Phonica, 7, 4–44.

Devís, E. (2012). Percepción de la cortesía atenuadora en el español coloquial. Oralia: Análisis del discurso ora,l 15, 125–46.

Elvira-García, W., Roseano, P., Fernández-Planas, A.M., y Martínez-Celdrán, E. (2016). A Tool for Automatic Transcription of Intonation: Eti_ToBI a ToBI Transcriber for Spanish and Catalan. Language Resources and Evaluation, 50 (4), 767–92.

Estruch, M., Garrido, J.M., Llisterri, J., y Riera, M. (2007). Técnicas y procedimientos para la representación de las curvas melódicas. RLA: Revista de lingüística teórica y aplicada, 45, 59–87.

Font-Rotchés, D. y Mateo, M. (2013). Entonación de las interrogativas absolutas del español peninsular del sur en habla espontánea. Onomázein, 28, 256–275.

Garrido, J. M., Escudero, D, Aguilar, L., Cardeñoso, V., Rodero, E., de-la-Mota, C., González, C., et al. (2013). Glissando: A Corpus for Multidisciplinary Prosodic Studies in Spanish and Catalan. Language Resources and Evaluation, 47 (4), 945–71.

Garrido, J.M., y Chica, J. A. (2018). Pitch Range and Identification of Emotions in Spanish Speech: A Perceptual Study. Estudios de Fonetica Experimental, 27, 13-36.

Glynn, D. (2014). Correspondence analysis: Exploring data and identifying patterns. En D. Glynn & J. A. Robinson (Eds.), Human Cognitive Processing, 43 (pp. 443-485). John Benjamins Publishing Company.

Gómez Molina, J. R. (2001). El español hablado de Valencia. Materiales para su studio I. Nivel sociocultural alto. Anejo XLVI Cuaderno de Filología. Publicacions de la Universitat de València.

Greenacre, M. (2007). Correspondence Analysis in Practice. Vol. 67. CRC Press.

Hidalgo, A. (2019). Sistema y uso de la entonación en español hablado. Universidad Andrés Hurtado.

Kassambara, A., y Mundt, F. (2020). Factoextra: Extract and Visualize the Results of Multivariate Data Analyses.

Le, S., Josse, J., y Husson, F. (2008). FactoMineR: A Package for Multivariate Analysis. Journal of Statistical Software, 25 (1), 1-18.

Levshina, N. (2015). How to Do Linguistics with R: Data Exploration and Statistical Analysis. John Benjamins Publishing Company.

Llisterri, J. (1991). introducción a la fonética: el método experimental. Anthropos.

Mateo, M. (2010). Scripts en Praat para la extracción de datos tonales y curva estándar. Phonica, 6, 91-111.

Mota de la, C., Machuca, M. J., Ríos, A., Riera, M., y Llisterri, J. (2005). Corpus orales para el desarrollo de las tecnologías del habla en español. Oralia: Análisis Del Discurso Oral, 8, 289–328.

Pàmies, A., Fernández Planas, A. M., Ortega Escandell, A., y Amorós, M. C. (2002). Umbrales tonales en español peninsular. Actas del II Congreso de Fonética Experimental. Universidad de Sevilla.

R Core Team. (2023). R: A Language and Environment for Statistical Computing.

Sola, A., y Torregrosa, J. (2023). Intonation of Wh-questions in Northern British English Spontaneous Speech. IJES. International Journal of English Studies, 23 (1), 1–25.

Torregrosa, J. (2015). Una propuesta metodológica para el análisis melódico de enunciados orales espontáneos con partículas modales del alemán. Revista de filología Alemana, 23, 193–212.

Vnjis, V. (2016). Radiant, Business Analytics Using R and Shiny.



