Estudio de neologismos a través de big data en un corpus textual extraído de Twitter

Adela González

Resumen

El uso de la informática es cada vez más habitual en el trabajo lingüístico. La Lingüística de Corpus, en especial, se está viendo beneficiada por este emparejamiento, gracias a los avances a la hora de gestionar y procesar los corpora. En este trabajo proponemos la utilización de big data y de Twitter para comprobar su utilidad a la hora de estudiar la formación y aparición de neologismos. Gracias a la creación de una herramienta informática diseñada específicamente para el trabajo lingüístico en big data, obtenemos una inmensa cantidad de datos textuales que nos servirán para la compilación de corpora. Estos datos no solo nos ofrecen información lingüística, sino también temporal y espacial. Mediante la selección de unos parámetros específicos, estudiaremos distintos términos con diferentes patrones de formación para comprobar cómo se forman, dónde y cuándo se introducen en la lengua y cómo y cuánto se utilizan.


Palabras clave

Neologismos; Lingüística de corpus; Big data; Twitter

Texto completo:

PDF (1,58 MB) Estadísticas

Referencias

Alvar Ezquerra, M. (1993). La formación de palabras en español. Madrid: Arco/Libros.

Bastuji, J. (1974). “Aspects de la néologie sémantique”. En Guilbert, L. et al. (Eds.). La néologie lexicale. Langages, 36, pp. 6-19.

Cabré, M. T. (1993). La terminología. Teoría, metodología, aplicaciones, traducción de Carles Tebé. Barcelona: Antártida/Empuries.

Cabré, M. T. et allii. (2004). Metodología del trabajo en neología: criterios, materiales y procesos. Barcelona: Universitat Pompeu Fabra. Papers de l’IULA. Sèrie Monografies, 9: http://www.iula.upf.edu/04mon009.htm (30-01-17)

Díaz Hormigo, M. T. (2004a). “Restricciones del sistema y restricciones de la norma en la formación de palabras”, Lingüística en la Red II: http://www.linred.com (6-1-17)

Díaz Hormigo, M. T. (2004b). “Neología y tecnología: a propósito de los programas de detección automática de neologismos”, Español Actual, 82, pp. 116-119.

Díaz Hormigo, M. T. (2008). “La investigación lingüística de la neología léxica en España. Estado de la cuestión”, LynX. Panorámica de estudios lingüísticos, 7, pp. 5- 60.

Díaz Hormigo, M. T. (2010). “Revisión historiográfica de los conceptos “neología” y “neologismo””. En Assunção, C., G. Fernandes y M. Loureiro, (Eds.). Ideias Linguísticas na Península Ibérica (séc. XIV a séc. XIX). Münster:Nodus Publikationen, I, pp. 167-176.

Díaz Hormigo, M. T. (2015). “Neología aplicada y lexicografía para la (necesaria) actualización de las entradas de los elementos de formación de palabras en diccionarios generales”. Revista de lingüística y lenguas aplicadas, 10, pp 12-20.

Diccionario de la Real Academia Española (DRAE), 23a Edición. (2014). Real Academia española. Recuperado de http://www.rae.es/

Dubois, J. (Coaut.). (1979). Diccionario de lingüística. Madrid: Alianza.

Fuentes, M., S. Gerding, S. Constanza, A. Pecchi, G. Kot. y P. Cañete. (2009). “Neología léxica: reflejo de la vitalidad del español de Chile”, RLA, Revista de lingüística teórica y aplicada, 47(1), pp. 103-124.

Fundación del Español Urgente. (2016). Fundéu BBVA. Recuperado de http://www.fundeu.es/

Gantz, J. y D. Reinsel. (2011). “Extracting Value from Chaos”, IDC iView, pp. 1-12: https://www.emc.com/collateral/analyst-reports/idc-extracting- value-from-chaos-ar.pdf (15-08-15)

González Fernández, A. (2016). Más allá del corpus: Big data en la investigación lingüística. Evolución, análisis y predicción del uso de la lengua a través de Twitter. Tesis doctoral, Universidad de Córdoba, Córdoba, España.

Guerrero Ramos, G. (1995). Neologismos en el español actual. Madrid: Arco/Libros.

Guilbert, L. (1975). La créativité lexicale. Paris: Larousse.

Halliday, M. A. K. (1993). “Quantitative studies and probabilities in grammar”. En Hoey, M. (Ed.), Data, description, discourse. London: HarperCollins, pp. 1-25.

Kilgarriff, A. (2001). “Web as corpus”. En Proceedings of the Corpus Linguistics Conference (CL 2001). University Centre for Computer Research on Language Technical Paper Vol. 13, Special Issue, Lancaster University, pp. 342-344: http://ucrel.lancs.ac.uk/publications/CL2003/CL2001%20conference/papers/kilg arri.pdf (30-09-15)

Kilgarriff, A. & Grefenstette, G. (2003). “Introduction to the Special Issue on the Web as as Corpus”. Computational linguistics, 29(3), pp. 333-347.

Lang, M. F. (1992). Formación de palabras en español. Morfología derivativa productiva en el léxico moderno. Madrid: Cátedra.

Leech, G. y R. Fallon. (1992). “Computer Corpora. What do they tell us about Culture?, ICAME Journal, 16, pp. 29-50.

Leech, G. (2007). “New resources, oro just better old ones? The Holy Grail of representativeness”. En Hundt, M., N. Nesselhauf y C. Biewer, (Eds.) Corpus linguistics and the web. Amsterdan: Rodopi, pp. 132-150.

Merino, M. (2014). “¿Qué es una API y para qué sirve?” Ticbeat: http://www.ticbeat.com/tecnologias/que-es-una-api-para-que-sirve/ (30-01-16)

Renouf, A. y A. Kehoe. (Eds.). (2006). The changing face of corpus linguistics. Amsterdam: Rodopi.

Rondeau, G. (1984). Introduction à la terminologie. Chicoutimi (Québec): Gaëtan Morin.

Tognini-Bonelli, E. (2001). Corpus linguistics at work. Amsterdam: J. Benjamins.

Varela Ortega, S. (2005). Morfología lexica: la formación de palabras. Madrid: Gredos.




DOI: https://doi.org/10.14198/ELUA2017.31.09





Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.