Hacia una traducción automática inclusiva: la intersección entre inteligencia artificial, terminología LGTBIQ+ y sesgo de género

Autores/as

DOI:

https://doi.org/10.14198/ELUA.29144

Palabras clave:

traducción automática neuronal, chatbot, sesgo de género, LGTBIQ+, inteligencia artificial, inglés, español, lenguaje inclusivo, DeepL, Google Translate, ChatGPT, Gemini

Resumen

La traducción automática (TA) y los chatbots de inteligencia artificial (IA) generativa han transformado la comunicación global al facilitar la transmisión de información entre lenguas y, por ende, entre culturas. No obstante, también plantean desafíos éticos debido a los sesgos lingüísticos. En particular, estos sesgos afectan negativamente a la terminología que representa a las mujeres y al colectivo LGTBIQ+ en las traducciones generadas por estas tecnologías. Partimos de la hipótesis de que tanto las tecnologías de traducción automática como los chatbots de inteligencia artificial presentan dificultades para traducir correctamente los marcadores de género y la terminología LGTBIQ+ del inglés al español. En este sentido, con frecuencia optan por el masculino genérico cuando no se proporciona suficiente información contextual o por términos inadecuados, aunque se espera que los chatbots más recientes ofrezcan mejores resultados en este aspecto. Para validar dicha hipótesis, hemos diseñado una metodología de análisis basada en la recogida de datos cuantitativos y cualitativos a partir de traducciones generadas por sistemas de traducción automática convencionales (DeepL y Google Translate) y chatbots de inteligencia artificial como ChatGPT y Gemini. Para evaluar los datos se ha empleado una adaptación de Multidimensional Quality Metrics (MQM), que permitirá obtener un marco estandarizado para medir la calidad de traducciones. Los resultados que se desprenden del análisis muestran la persistencia de un sesgo marcado hacia el género masculino, con una identificación inconsistente del género femenino. De este modo, se puede concluir que el producto resultante de los sistemas basados en inteligencia artificial generativa no presenta mejoras significativas en comparación con los sistemas de traducción automática convencionales. Por ello, es necesario desarrollar tecnologías lingüísticas más inclusivas, equitativas y libres de sesgos, así como fomentar el diseño de sistemas más justos y respetuosos con la diversidad, esenciales para responder a los desafíos de un contexto cada vez más interconectado y globalizado.

Citas

Adrakatti, V. (2024). Exploring screen summarization with large language and multimodal models [Tesis de maestría, University of Illinois Urbana-Champaign]. https://www.ideals.illinois.edu/items/131510

Alvarez-Vidal, S., Oliver, A., y Badia, T. (2021). What do post-editors correct? A fine-grained analysis of SMT and NMT errors. Revista Tradumàtica Tecnologies de la Traducció, 19, 131-147. https://doi.org/10.5565/rev/tradumatica.286

Baldo, M., Evans, J., y Guo, T. (13 de diciembre de 2023). Investigating LGBTQ+ issues in translation. LSE Review of Books. https://blogs.lse.ac.uk/lsereviewofbooks/2018/12/13/feature-investigating-lgbtq-issues-in-translation-by-michela-baldo-jonathan-evans-and-ting-guo/

Balyan, R., y Chatterjee, N. (2018). Factor-based evaluation for English to Hindi MT outputs. Language Resources and Evaluation, 52(4), 969-996. https://doi.org/10.1007/s10579-018-9426-y

Banerjee, S., y Lavie, A. (2005). METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments. En Proceedings of the ACL Workshop on Intrinsic and Extrinsic Evaluation Measures for Machine Translation and/or Summarization (pp. 65-72). Association for Computational Linguistics. https://aclanthology.org/W05-0909

Bravo-Candel, D., López-Hernández, J., García-Díaz, J. A., Molina-Molina, F., y García-Sánchez, F. (2021). Automatic Correction of Real-Word Errors in Spanish Clinical Texts. Sensors, 21(9), 2893. https://doi.org/10.3390/s21092893

Briva-Iglesias, V., Cavalheiro Camargo, J. L., y Dogru, G. (2024). Large language models "Ad Referendum": How good are they at machine translation in the legal domain? MonTI, (16), 75-107. https://doi.org/10.6035/MonTI.2024.16.02

Calixto, I., y Liu, Q. (2019). An error analysis for image-based multi-modal neural machine translation. Machine Translation, 33, 155-177. https://doi.org/10.1007/s10590-019-09226-9

Cámara de los Comunes (15 de junio de 2023). Debate on Pride Month. [Transcripción]. UK Parliament. https://hansard.parliament.uk/Commons/2023-06-15/debates/EA123D7E-5A79-46AC-9EDE-36C945F1FF84/PrideMonth

Chen, Z., Xu, L., Zheng, H., Chen, L., Tolba, A., Zhao, L., Yu, K., y Feng, H. (2024). Evolution and Prospects of Foundation Models: From Large Language Models to Large Multimodal Models. Computers, Materials & Continua/Computers, Materials & Continua (Print), 80(2), 1753-1808. https://doi.org/10.32604/cmc.2024.052618

Ciora, C., Iren, N., y Alikhani, M. (2021). Examining covert gender Bias: A case study in Turkish and English machine translation models. En A. Belz, A. Fan, E. Reiter, y Y. Sripada (Eds.), Proceedings of the 14th International Conference on Natural Language Generation (Vols. 55-63). Association for Computational Linguistics. https://doi.org/10.18653/v1/2021.inlg-1.7

Dwivedi, R. K., Nand, P., y Pal, O. (2024). Hybrid NMT model and comparison with existing machine translation approaches. Multidisciplinary Science Journal, 7(4), 2025146. https://doi.org/10.31893/multiscience.2025146

Eagle, A. (15 de junio de 2023). Intervención en Pride Month. En Cámara de los Comunes. [Transcripción]. UK Parliament. https://hansard.parliament.uk/Commons/2023-06-15/debates/EA123D7E-5A79-46AC-9EDE-36C945F1FF84/PrideMonth

Ferrag, F., y Bentounsi, I. A. (2024). The use of Artificial intelligence in academic translation tasks Case study of Chat GPT, Claude and Gemini. Ziglôbitha, 2(11), 173-192. https://doi.org/10.60632/ziglobitha.n011.11.vol.2.2024

Fitria, T. N. (2021). Gender Bias in translation using Google Translate: Problems and solution. Language Circle: Journal of Language and Literature, 15(2). https://doi.org/10.15294/lc.v15i2.28641

Forcada, M. L. (2017). Making sense of neural machine translation. Translation Spaces, 6(2), 291-309. https://doi.org/10.1075/ts.6.2.06for

Fulgu, R. A., y Capraro, V. (2024). Surprising gender biases in GPT. Computers in Human Behavior Reports, 16, 100533. https://doi.org/10.1016/j.chbr.2024.100533

Ghosh, S., y Caliskan, A. (2023). ChatGPT perpetuates gender bias in machine translation and ignores Non-Gendered Pronouns: Findings across Bengali and five other Low-Resource languages. En F. Rossi, S. Das, J. Davis, K. Firth-Butterfield, y A. John (Eds.), AIES '23: Proceedings of the 2023 AAAI/ACM Conference on AI, Ethics, and Society (pp. 901-912). Association for Computing Machinery. https://doi.org/10.1145/3600211.3604672

Gromann, D., Lardelli, M., Spiel, K., Burtscher, S., Klausner, L. D., Mettinger, A., Miladinovic, I., Schefer-Wenzl, S., Duh, D., y Bühn, K. (2023). Participatory research as a path to community-informed, gender-fair machine translation. En Vanmassenhove, B. Savoldi, L. Bentivogli, J. Daems, y J. Hackenbuchner (Eds.), Proceedings of the First Workshop on Gender-Inclusive Translation Technologies (pp. 49-59). European Association for Machine Translation. https://aclanthology.org/2023.gitt-1.5

International School of Navarra. (21 de diciembre de 2023). Equivalencia entre cursos UK y España - TBSON. British School of Navarra. https://isnavarra.es/moving-to-spain-with-children-check-our-table-of-grade-equivalencies-between-british-and-spanish-schools-learn-which-school-year-they-belong-to/

Johnson, M. (22 de abril de 2020). A scalable approach to reducing gender bias in Google Translate. Google Research. https://research.google/blog/a-scalable-approach-to-reducing-gender-bias-in-google-translate/

Kaplan, D. M., Palitsky, R., Arconada Alvarez, S. J., Pozzo, N. S., Greenleaf, M. N., Atkinson, C. A., y Lam, W. A. (2024). What's in a name? Experimental evidence of gender bias in recommendation letters generated by ChatGPT. Journal of Medical Internet Research, 26, e51837. https://doi.org/10.2196/51837

Koponen, M., y Salmi, L. (2017). Post-editing quality: Analysing the correctness and necessity of post-editor corrections. Linguistica Antverpiensia New Series - Themes in Translation Studies, 16, 137-148. https://doi.org/10.52034/lanstts.v16i0.439

Lommel, A., Gladkoff, S., Melby, A., Wright, S. E., Strandvik, I., Gasova, K., Vaasa, A., Benzo, A., Marazzato Sparano, R., Foresi, M., Innis, J., Han, L., y Nenadic, G. (2024). The Multi-Range Theory of Translation Quality Measurement: MQM scoring models and Statistical Quality Control. En M. Martindale, J. Campbell, K. Savenkov, y S. Goel (Eds.), Proceedings of the 16th Conference of the Association for Machine Translation in the Americas (Volume 2: Presentations) (pp. 75-94). Association for Machine Translation in the Americas. https://aclanthology.org/2024.amta-presentations.6

Lommel, A., Uszkoreit, H., y Burchardt, A. (2014). Multidimensional Quality Metrics (MQM): A framework for declaring and describing translation quality metrics. Revista Tradumàtica Tecnologies de La Traducció, 12, 455-463. https://doi.org/10.5565/rev/tradumatica.77

MQM Council. (s.f.). The MQM CORE Typology. The MQM. https://themqm.org/the-mqm-typology

OpenAI. (s.f.). Models. Open AI Platform. https://platform.openai.com/docs/models#gpt-4o

Papineni, K., Roukos, S., Ward, T, y Zhu W. (2002). BLEU: a method for automatic evaluation of machine translation. En Proceedings of the 40th Annual Meeting on Association for Computational Linguistics. Association for Computational Linguistics, USA, 311-318. https://doi.org/10.3115/1073083.1073135

Peñuelas Gil, I. (2024). La traducción automática de expresiones multiverbales en el turismo gastronómico: Un estudio de caso. Hikma, 23(3), 1-27. https://doi.org/10.21071/hikma.v23i3.16992

Piazzolla, S. A., Savoldi, B., y Bentivogli, L. (2024). Good, but not always Fair: An Evaluation of Gender Bias for three Commercial Machine Translation Systems. HERMES - Journal of Language and Communication in Business, 63, 209-225. https://doi.org/10.7146/hjlcb.vi63.137553

Prates, M. O. R., Avelar, P. H., y Lamb, L. C. (2019). Assessing gender bias in machine translation: a case study with Google Translate. Neural Computing and Applications, 32(10), 6363-6381. https://doi.org/10.1007/s00521-019-04144-6

Sánchez Ramos, M., y Rico Pérez, C. (2020). Traducción automática: conceptos clave, procesos de evaluación y técnicas de posedición. Comares.

Sánchez-Gijón, P., Moorkens, J., y Way, A. (2019). Post-editing neural machine translation versus translation memory segments. Machine Translation, 33(1-2), 31-59. https://doi.org/10.1007/s10590-019-09232-x

Simon, S. (1996). Gender in translation. Routledge. https://shorturl.at/VaMog

Subramanya, A. (25 de julio de 2024). Gemini's big upgrade: Faster responses with 1.5 Flash, expanded access and more. The Keyword. https://blog.google/products/gemini/google-gemini-new-features-july-2024/

Thelwall, M., Devonport, T. J., Makita, M., Russell, K., y Ferguson, L. (2022). Academic LGBTQ+ Terminology 1900-2021: Increasing Variety, Increasing Inclusivity? Journal of Homosexuality, 70(11), 2514-2538. https://doi.org/10.1080/00918369.2022.2070446

Turovsky, B. (16 de noviembre de 2016). Found in translation: More accurate, fluent sentences in Google Translate. Google. https://blog.google/products/translate/found-translation-more-accurate-fluent-sentences-google-translate/

Ullmann, S. (2022). Gender bias in machine translation systems. En K. Richardson y T. Heffernan (Eds.), Social and cultural studies of robots and AI (pp. 123-144). Palgrave Macmillan. https://doi.org/10.1007/978-3-030-88615-8_7

Von Flotow, L. (1997). Translation and Gender: Translating in the «Era of Feminism». University of Ottawa Press. https://doi.org/10.1353/book6616

Wang, L., Lyu, C., Ji, T., Zhang, Z., Yu, D., Shi, S., Tu, Z., y Lab, T. A. (2023). Document-Level Machine Translation with Large Language Models. En H. Bouamor, J. Pino, y K. Bali (Eds.), Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (pp. 16646-16661). Association for Computational Linguistics. https://doi.org/10.18653/v1/2023.emnlp-main.1036

Wu, Y., Schuster, M., Chen, Z., Le, Q. V., Norouzi, M., Macherey, W., Krikun, M., Cao, Y., Gao, Q., Macherey, K., Klingner, J., Shah, A., Johnson, M., Liu, X., Kaiser, Ł., Gouws, S., Kato, Y., Kudo, T., Kazawa, H., . . . Dean, J. (2016). Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation. arXiv. https://doi.org/10.48550/arxiv.1609.08144

Descargas

Publicado

25-07-2025

Cómo citar

Hernández Fresno, E., & Ortego Antón, M. T. (2025). Hacia una traducción automática inclusiva: la intersección entre inteligencia artificial, terminología LGTBIQ+ y sesgo de género. ELUA: Estudios De Lingüística. Universidad De Alicante, (44), 125–145. https://doi.org/10.14198/ELUA.29144