Tecmerin. Journal of Audiovisual Essays

Nº 12 – 2023 (2)

Ciudades de Iberoamérica vistas por inteligencia artificial

Nadia McGowan (Universidad Internacional de la Rioja)

Cómo citar este artículo: McGowan, N. (2023). Ciudades de Iberoamérica vistas por inteligencia artificialTecmerin. Revista de Ensayos Audiovisuales, 12, 2023(2). ISSN: 2659-4269

Este estudio explora cómo la Inteligencia Artificial Generativa visualiza las ciudades iberoamericanas a través de la creación de contenido sintético (García-Peñalvo & Vázquez-Ingelmo, 2023). Utilizando la herramienta de IA Midjourney, se generaron imágenes de ciudades de 23 países de Iberoamérica. Se utilizó el comando «/imagine <nombre de la ciudad> –ar 16:9» para crear estas imágenes. Esto deja la generación de la ciudad en manos de Midjourney, sin más modificaciones. El único cambio es la relación de aspecto, para adaptarse mejor a los estándares actuales de 16:9 en lugar de la relación  4:3 que utiliza por defecto. La música también se generó con IA mediante el Loudly, para crear un ambiente sonoro.

Las imágenes obtenidas revelan varios aspectos comunes. En primer lugar, las imágenes generadas por la IA tienen a menudo un aspecto extraño e inquietante debido a la mezcla de elementos arquitectónicos. La IA combina diferentes estilos sin coherencia y no siempre sigue las normas del mundo real, lo que da como resultado imágenes que no se ajustan a las leyes de la física (Hanafy, 2023; Wang et al., 2023).

En segundo lugar, aunque visualmente atractivas, las imágenes generadas por la IA no reflejan las ciudades tal y como las ven los humanos (Rico Carranza, Huang & Besems, 2023). Las imágenes resultan familiares pero distantes, no siempre representativas de cómo concebimos estas ciudades ni nuestra experiencia del espacio urbano. Esto se debe a que la IA no comprende las experiencias humanas ni el contexto cultural que conforman nuestra percepción de las ciudades. 

En tercer lugar, ciertos elementos como los grafitis, las cúpulas y las escenas apocalípticas están sobrerrepresentados. Esto ocurre porque la IA aprende de la base de datos usada para su entrenamiento y es probable que estén sobrerrepresentados en ella, dando excesiva importancia a estos elementos. Normalmente, los programas de IA tienden a dar prioridad a las características más fácilmente diferenciables y visualmente atractivas (Anicin & Stojmenovic, 2023). Las cúpulas suelen asociarse a rasgos arquitectónicos icónicos, por lo que es más probable que se incluyan para crear una escena visualmente interesante.

Aunque en las imágenes aparecen lugares emblemáticos, su representación no suele ser realista. Curiosamente, la IA difumina los límites entre las ciudades, lo que a veces crea confusión. Esto pone en tela de juicio el carácter distintivo de las ciudades, ya que la IA entremezcla elementos de distintos lugares (Ye, 2023). Las imágenes de la IA también comparten rasgos con la edición fotográfica moderna, con una iluminación exagerada, colores vibrantes y elementos fantásticos. El protagonismo de las zonas peatonales y los espacios verdes concuerda con el interés de la IA por los espacios centrados en el ser humano.

Este estudio plantea cómo se puede usar la tecnología para crear representaciones de espacios urbanos. Estas son visiones alternativas, más allá de las creados por personas. Muestra la capacidad de la IA para producir imágenes inesperadas a partir de un conjunto de datos. Si bien estas imágenes son visualmente impactantes, carecen de contexto cultural, lo que las hace familiares pero distantes.

Bibliografía

  • Aničin, L., & Stojmenović, M. (2022, December). Bias Analysis in Stable Diffusion and MidJourney Models. In International Conference on Intelligent Systems and Machine Learning (pp. 378-388). Springer Nature Switzerland.
  • García-Peñalvo, F.J., & Vázquez-Ingelmo, A. (2023). What Do We Mean by GenAI? A Systematic Mapping of The Evolution, Trends, and Techniques Involved in Generative AI, International Journal of Interactive Multimedia and Artificial Intelligence. http://dx.doi.org/10.9781/ijimai.2023.07.006
  • Hanafy, N. O. (2023). Artificial intelligence’s effects on design process creativity:» A study on used AI Text-to-Image in architecture». Journal of Building Engineering, 8(1). https://doi.org/10.1016/j.jobe.2023.107999.
  • Rico Carranza, E., Huang, S. Y., & Besems, J. (2023). (In) visible Cities: What Generative Algorithms Tell Us About Our Collective Memory Schema. In CAADRIA proceedings (pp. 463-472). CAADRIA.
  • Wang, B., Zhang, S., Zhang, J., & Cai, Z. (2023). Architectural style classification based on CNN and channel–spatial attention. Signal, Image and Video Processing17(1), 99-107.
  • Ye, S. (2023). Generative AI May Prefer to Present National-level Characteristics of Cities Based on Stereotypical Geographic Impressions at the Continental Level. arXiv preprint arXiv:2310.04897.

Tecmerin. Revista de Ensayos Audiovisuales
ISSN: 2659-4269
© Grupo de Investigación Tecmerin
Universidad Carlos III de Madrid