Nuria Oliver
Directora científica y cofundadora de la Fundación ELLIS Alicante
El artículo realiza contribuciones significativas al proporcionar la primera evidencia a gran escala de que el sesgo de género relacionado con la edad es una distorsión generalizada, presente en contenido visual digital (imágenes, vídeos) y en nueve modelos de lenguaje, y que es además es sistemáticamente amplificada por los algoritmos. Según este sesgo, existe una tendencia de asumir que las mujeres son más jóvenes –y por tanto menos experimentadas— que los hombres en relación con sus profesiones o roles sociales.
La relevancia de este estudio radica en la cuantificación rigurosa de este sesgo frente a anclajes objetivos verificables —en particular, datos del Censo de EE.UU. que muestran que no existen diferencias sistemáticas de edad entre mujeres y hombres entre la población trabajadora—, lo que permite superar el debate controvertido sobre la exactitud de los estereotipos. El estudio demuestra de manera causal que las búsquedas de Google Imágenes amplifican la brecha de edad percibida en 5,46 años, y que ChatGPT propaga este sesgo al generar currículos que asumen que las mujeres son más jóvenes y menos experimentadas que los hombres, especialmente en ocupaciones de alto estatus y elevados ingresos.
Esto resalta la necesidad urgente de intervenciones, particularmente dado que el sesgo es más fuerte allí donde las mujeres enfrentan una presión persistente para aparentar juventud (el ‘impuesto de belleza’) y donde las mujeres mayores sufren desventajas en contratación y promoción (edadismo de género). Este trabajo está relacionado con el trabajo realizado desde ELLIS Alicante sobre el sesgo del atractivo y los filtros de belleza (What is beautiful is still good: the attractiveness halo effect in the era of beauty filters), ya que los filtros de belleza tienden a hacer que las personas parezcan más jóvenes (5,87 años en media).
La solidez técnica del artículo es elevada, caracterizada por una metodología a gran escala que combina el análisis de casi 1,4 millones de imágenes y vídeos de Google, Wikipedia, IMDb, Flickr y YouTube, un experimento humano prerregistrado con una muestra representativa a nivel nacional en EE.UU. (n=459), y una auditoría cuantitativa que involucra casi 40.000 currículos generados por ChatGPT. Los métodos están cuidadosamente controlados para generalizar los resultados, incluyendo la comparación con datos censales y el uso de información objetiva sobre la edad como es en el caso de personas famosas.
La principal limitación es que, si bien el estudio confirma la amplificación algorítmica, identificar los mecanismos causales precisos mediante los cuales las normas estéticas específicas de la industria o los sesgos se trasladan a los de IA de generativa sigue siendo un área crítica para investigaciones futuras. También sería importante desarrollar estrategias de mitigación de este sesgo, así como extender el trabajo a otras regiones del mundo ya que tanto la información del censo como los estudios de usuario se han realizado con poblaciones representativas de EE.UU.