Sesgo cultural en grandes modelos de lenguaje: estado del arte y brechas de investigación para una IA más inclusiva
Palabras clave:
sesgo cultural, modelos, lenguaje inclusivo, inteligencia artificialResumen
La inteligencia artificial (IA) se ha consolidado como una herramienta de uso generalizado en diversos sectores sociales, educativos y empresariales. No obstante, los sistemas contemporáneos de IA—y en particular los Grandes Modelos de Lenguaje (Large Language Models, LLM)—evidencian un sesgo cultural significativo, predominantemente orientado hacia valores, lenguas
y contextos occidentales. Esta situación genera limitaciones en su aplicabilidad, representatividad y equidad frente a poblaciones culturalmente diversas.
El estudio propone realizar una revisión del estado del arte sobre el sesgo cultural en los LLM, con el propósito de identificar brechas en la investigación actual y proponer una agenda de desarrollo orientada a la construcción de modelos lingüísticos culturalmente inclusivos. Para ello, se efectuó una revisión en bases de datos académicas internacionales del periodo 2020 - 2025, caracterizado por un acelerado avance tecnológico en el ámbito de la IA generativa. Se establecieron criterios de inclusión que permitieron seleccionar investigaciones que evalúan la presencia, impacto o estrategias de mitigación del sesgo cultural. Tras un proceso de filtrado por título, resumen y palabras clave, se extrajeron datos relativos a las metodologías empleadas, los tipos de conjuntos de datos utilizados, los principales hallazgos, los impactos sociales identificados y las estrategias de mitigación propuestas.
El análisis permitió identificar patrones comunes, vacíos de conocimiento y limitaciones metodológicas en la investigación sobre LLM culturalmente inclusivos. Los resultados muestran que los LLM actuales se entrenan mayoritariamente con conjuntos de datos sesgados hacia contextos occidentales, lo cual se traduce en un bajo desempeño y una reducida representatividad en escenarios no occidentales. Asimismo, se evidenció la ausencia de marcos teóricos integrales que orienten el estudio del sesgo cultural, así como una limitada cantidad de investigaciones aplicadas en contextos culturalmente diversos.
En consecuencia, se concluye que es necesario desarrollar marcos teóricos y metodológicos robustos que permitan comprender y mitigar el sesgo cultural en los LLM. La investigación futura deberá orientarse hacia la diversificación de los conjuntos de datos, la implementación de evaluaciones culturalmente sensibles y la promoción de colaboraciones interdisciplinarias e interculturales, con el fin de avanzar hacia la construcción de modelos lingüísticos más equitativos, inclusivos y culturalmente representativos.