Redacción MX Político.- El mes pasado se otorgó un premio de arte en la Feria Estatal de Colorado a una obra que, sin que los jueces lo supieran, fue generada por un sistema de inteligencia artificial (IA).
Las redes sociales también han visto una explosión de imágenes extrañas generadas por IA a partir de descripciones de texto, como “la cara de un shiba inu mezclada con el costado de una barra de pan en un banco de cocina, arte digital”.
O tal vez “Una nutria marina al estilo de ‘La joven de la perla’ de Johannes Vermeer”:
Usted se estará preguntando qué está pasando aquí. Como alguien que investiga colaboraciones creativas entre humanos e IA, puedo decirles que detrás de los titulares y los memes se está gestando una revolución fundamental, con profundas implicaciones sociales, artísticas, económicas y tecnológicas.
Como llegamos aqui
Se podría decir que esta revolución comenzó en junio de 2020, cuando una empresa llamada OpenAI logró un gran avance en IA con la creación de GPT-3, un sistema que puede procesar y generar lenguaje de formas mucho más complejas que los esfuerzos anteriores. Puede tener conversaciones con él sobre cualquier tema, pedirle que escriba un artículo de investigación o una historia, resuma un texto, escriba un chiste y realice casi cualquier tarea de lenguaje imaginable.
En 2021, algunos de los desarrolladores de GPT-3 recurrieron a las imágenes. Entrenaron un modelo en miles de millones de pares de imágenes y descripciones de texto, luego lo usaron para generar nuevas imágenes a partir de nuevas descripciones. Llamaron a este sistema DALL-E, y en julio de 2022 lanzaron una nueva versión muy mejorada, DALL-E 2.
Al igual que GPT-3, DALL-E 2 fue un gran avance. Puede generar imágenes muy detalladas a partir de entradas de texto de forma libre, incluida información sobre estilo y otros conceptos abstractos.
Por ejemplo, aquí le pedí que ilustrara la frase “Mind in Bloom” combinando los estilos de Salvador Dalí, Henri Matisse y Brett Whiteley.
Los competidores entran en escena
Desde el lanzamiento de DALL-E 2, han surgido algunos competidores. Uno es el DALL-E Mini de uso gratuito pero de menor calidad (desarrollado de forma independiente y ahora rebautizado como Craiyon), que era una fuente popular de contenido de memes.
Casi al mismo tiempo, una empresa más pequeña llamada Midjourney lanzó un modelo que se acercaba más a las capacidades de DALL-E 2. Aunque todavía un poco menos capaz que DALL-E 2, Midjourney se ha prestado a interesantes exploraciones artísticas. Fue con Midjourney que Jason Allen generó la obra de arte que ganó la competencia de la Feria de Arte del Estado de Colorado.
Google también tiene un modelo de texto a imagen, llamado Imagen, que supuestamente produce resultados mucho mejores que DALL-E y otros. Sin embargo, Imagen aún no se ha lanzado para un uso más amplio, por lo que es difícil evaluar las afirmaciones de Google.
En julio de 2022, OpenAI comenzó a capitalizar el interés en DALL-E y anunció que se otorgaría acceso a 1 millón de usuarios mediante el pago por uso.
Sin embargo, en agosto de 2022 llegó un nuevo contendiente: Stable Diffusion.
Stable Diffusion no solo rivaliza con DALL-E 2 en sus capacidades, sino que, lo que es más importante, es de código abierto. Cualquiera puede usar, adaptar y modificar el código a su gusto.
Ya, en las semanas posteriores al lanzamiento de Stable Diffusion, la gente ha llevado el código al límite de lo que puede hacer.
Para dar un ejemplo: la gente rápidamente se dio cuenta de que, debido a que un video es una secuencia de imágenes, podían modificar el código de Stable Diffusion para generar video a partir de texto.
Otra herramienta fascinante creada con el código de Stable Diffusion es Diffuse the Rest, que le permite dibujar un boceto simple, proporcionar un mensaje de texto y generar una imagen a partir de él.
¿El fin de la creatividad?
¿Qué significa que puedes generar cualquier tipo de contenido visual, imagen o video, con unas pocas líneas de texto y el clic de un botón? ¿Qué pasa cuando puedes generar un guión de película con GPT-3 y una animación de película con DALL-E 2?
Y mirando más adelante, ¿qué significará cuando los algoritmos de las redes sociales no solo seleccionen contenido para su feed, sino que lo generen? ¿Qué pasará cuando esta tendencia se encuentre con el metaverso en unos años y se generen mundos de realidad virtual en tiempo real, solo para ti?
Todas estas son preguntas importantes a considerar.
Algunos especulan que, a corto plazo, esto significa que la creatividad humana y el arte están profundamente amenazados.
El cargo Arte de Inteligencia Artificial está en todas partes; los expertos no saben lo que significará apareció primero en Noticias MX Político.