Estudio de neologismos a través de big data en un corpus textual extraído de Twitter

Autores/as

  • Adela González Universidad de Córdoba,

DOI:

https://doi.org/10.14198/ELUA2017.31.09

Palabras clave:

Neologismos, Lingüística de corpus, Big data, Twitter

Resumen

El uso de la informática es cada vez más habitual en el trabajo lingüístico. La Lingüística de Corpus, en especial, se está viendo beneficiada por este emparejamiento, gracias a los avances a la hora de gestionar y procesar los corpora. En este trabajo proponemos la utilización de big data y de Twitter para comprobar su utilidad a la hora de estudiar la formación y aparición de neologismos. Gracias a la creación de una herramienta informática diseñada específicamente para el trabajo lingüístico en big data, obtenemos una inmensa cantidad de datos textuales que nos servirán para la compilación de corpora. Estos datos no solo nos ofrecen información lingüística, sino también temporal y espacial. Mediante la selección de unos parámetros específicos, estudiaremos distintos términos con diferentes patrones de formación para comprobar cómo se forman, dónde y cuándo se introducen en la lengua y cómo y cuánto se utilizan.

Citas

Alvar Ezquerra, M. (1993). La formación de palabras en español. Madrid: Arco/Libros.

Bastuji, J. (1974). “Aspects de la néologie sémantique”. En Guilbert, L. et al. (eds.). La néologie lexicale. Langages, 36, pp. 6-19.

Cabré, M. T. (1993). La terminología. Teoría, metodología, aplicaciones, traducción de Carles Tebé. Barcelona: Antártida/Empuries.

Cabré, M. T. et allii. (2004). Metodología del trabajo en neología: criterios, materiales y procesos. Barcelona: Universitat Pompeu Fabra. Papers de l’IULA. Sèrie Monografies, 9: http://www.iula.upf.edu/04mon009.htm (30-01-17).

Díaz Hormigo, M. T. (2004a). “Restricciones del sistema y restricciones de la norma en la formación de palabras”, Lingüística en la Red II: http://www.linred.com (6-1-17).

Díaz Hormigo, M. T. (2004b). “Neología y tecnología: a propósito de los programas de detección automática de neologismos”, Español Actual, 82, pp. 116-119.

Díaz Hormigo, M. T. (2008). “La investigación lingüística de la neología léxica en España. Estado de la cuestión”, LynX. Panorámica de estudios lingüísticos, 7, pp. 5-60.

Díaz Hormigo, M. T. (2010). “Revisión historiográfica de los conceptos “neología” y “neologismo””. En Assunção, C., G. Fernandes y M. Loureiro, (eds.). Ideias Linguísticas na Península Ibérica (séc. XIV a séc. XIX). Münster:Nodus Publikationen, I, pp. 167-176.

Díaz Hormigo, M. T. (2015). “Neología aplicada y lexicografía para la (necesaria) actualización de las entradas de los elementos de formación de palabras en diccionarios generales”, Revista de lingüística y lenguas aplicadas, 10, pp 12-20. https://doi.org/10.4995/rlyla.2015.3587

Diccionario de la Real Academia Española (DRAE), 23a Edición. (2014). Real Academia española: http://www.rae.es/ (30-09-15).

Dubois, J. (Coaut.). (1979). Diccionario de lingüística. Madrid: Alianza.

Estornell Pons, M. (2009). Neologismos en la prensa: criterios para reconocer y caracterizar las unidades neológicas. Valencia: Universitat de València.

Fuentes, M., S. Gerding, S. Constanza, A. Pecchi, G. Kot. y P. Cañete. (2009). “Neología léxica: reflejo de la vitalidad del español de Chile”, RLA, Revista de lingüística teórica y aplicada, 47(1), pp. 103-124. https://doi.org/10.4067/S0718-48832009000100006

Fundación del Español Urgente. (2016). Fundéu BBVA: http://www.fundeu.es/ (30-09-15).

Gantz, J. y D. Reinsel. (2011). “Extracting Value from Chaos”, IDC iView, pp. 1-12: https://www.emc.com/collateral/analyst-reports/idc-extracting-value-from-chaos-ar.pdf (15-08-15).

González Fernández, A. (2016). Más allá del corpus: Big data en la investigación lingüística. Evolución, análisis y predicción del uso de la lengua a través de Twitter. Tesis doctoral, Universidad de Córdoba, Córdoba, España.

Guerrero Ramos, G. (1995). Neologismos en el español actual. Madrid: Arco/Libros.

Guilbert, L. (1975). La créativité lexicale. Paris: Larousse.

Halliday, M. A. K. (1993). “Quantitative studies and probabilities in grammar”. En Hoey, M. (ed.), Data, description, discourse. London: HarperCollins, pp. 1-25.

Kilgarriff, A. (2001). “Web as corpus”. En Proceedings of the Corpus Linguistics Conference (CL 2001). University Centre for Computer Research on Language Technical Paper Vol. 13, Special Issue, Lancaster University, pp. 342-344: http://ucrel.lancs.ac.uk/publications/CL2003/CL2001%20conference/papers/kilg arri.pdf (30-09-15).

Kilgarriff, A. & Grefenstette, G. (2003). “Introduction to the Special Issue on the Web as as Corpus”. Computational linguistics, 29(3), pp. 333-347. https://doi.org/10.1162/089120103322711569

Lang, M. F. (1992). Formación de palabras en español. Morfología derivativa productiva en el léxico moderno. Madrid: Cátedra.

Leech, G. y R. Fallon. (1992). “Computer Corpora. What do they tell us about Culture?, ICAME Journal, 16, pp. 29-50.

Leech, G. (2007). “New resources, oro just better old ones? The Holy Grail of representativeness”. En Hundt, M., N. Nesselhauf y C. Biewer, (eds.) Corpus linguistics and the web. Amsterdan: Rodopi, pp. 132-150. https://doi.org/10.1163/9789401203791_009

Merino, M. (2014). “¿Qué es una API y para qué sirve?” Ticbeat: http://www.ticbeat.com/tecnologias/que-es-una-api-para-que-sirve/ (30-01-16).

Renouf, A. y A. Kehoe (eds.). (2006). The changing face of corpus linguistics. Amsterdam: Rodopi. https://doi.org/10.1163/9789401201797

Rondeau, G. (1984). Introduction à la terminologie. Chicoutimi (Québec): Gaëtan Morin.

Tognini-Bonelli, E. (2001). Corpus linguistics at work. Amsterdam: J. Benjamins. https://doi.org/10.1075/scl.6

Varela Ortega, S. (2005). Morfología lexica: la formación de palabras. Madrid: Gredos.

Descargas

Estadísticas

Estadísticas en RUA

Publicado

21-12-2017

Cómo citar

González, A. (2017). Estudio de neologismos a través de big data en un corpus textual extraído de Twitter. ELUA: Estudios De Lingüística. Universidad De Alicante, (31), 171–186. https://doi.org/10.14198/ELUA2017.31.09

Número

Sección

Artículos