OpenAI planea integrarlo con ChatGPT en el futuro y ofrecer más protección a los artistas que dicen que los generadores de imágenes se entrenan en su trabajo.
OpenAI presenta una nueva versión de su generador de imágenes por IA, bautizada como Dall-E 3 que, según afirma, puede manejar «muchos más matices y detalles» que Dall-E 2.
«Los sistemas modernos de conversión de texto en imágenes tienden a ignorar las palabras o las descripciones, lo que obliga a los usuarios a aprender ingeniería», afirma OpenAI. «Dall-E 3 representa un salto adelante en nuestra capacidad para generar imágenes que se adhieren exactamente al texto que nos proporcionas».
Esto incluye la creación de representaciones incluso de los detalles más insignificantes del texto y el espaciado adecuado entre otros elementos de la escena, como la luna sobre la calle en la imagen inferior.
Dall-E 3 promete generar con mayor precisión manos humanas, una tarea que se les ha escapado a muchos generadores de imágenes por IA. Su competidor Midjourney hizo un anuncio similar el mes pasado, con una nueva función que permite a los usuarios solicitar ediciones de solo una parte de la imagen (por ejemplo, «Quitar un dedo»).
OpenAI también ha anunciado planes para integrar Dall-E 3 con ChatGPT Plus en las próximas búsquedas. Al combinar las habilidades lingüísticas del chatbot con el generador de imágenes, la idea es crear imágenes aún más precisas con posibilidades de personalización.
«Cuando se le solicite una idea, ChatGPT generará automáticamente indicaciones personalizadas y detalladas para Dall-E 3 que darán vida a su idea», afirma OpenAI. «Si te gusta una imagen en particular, pero no está del todo bien, puedes pedirle a ChatGPT que haga retoques con sólo unas palabras».
Por el momento, Dall-E 2 no es gratuito, OpenAI cobra una pequeña cuota por los «créditos» de las imágenes, y ChatGPT Plus cuesta 20 dólares al mes. El único chatbot de IA importante que ofrece la generación de imágenes de forma gratuita es Bing Chat AI de Microsoft. Bing Chat también funciona con el potente modelo GPT-4 de OpenAI.
Our new text-to-image model, DALL·E 3, can translate nuanced requests into extremely detailed and accurate images.
Coming soon to ChatGPT Plus & Enterprise, which can help you craft amazing prompts to bring your ideas to life:https://t.co/jDXHGNmarT pic.twitter.com/aRWH5giBPL
— OpenAI (@OpenAI) September 20, 2023
En el anuncio de Dall-E 3, OpenAI reconoce la creciente preocupación por el carácter engañoso de las imágenes generadas por IA. «También estamos investigando la mejor manera de ayudar a la gente a identificar cuándo una imagen ha sido creada con IA», afirma OpenAI. La empresa está trabajando en una herramienta interna para descifrar el arte generado por IA frente al arte generado por humanos, y dice que compartirá más información pronto. Todavía estamos esperando que OpenAI recupere su herramienta para detectar texto generado por IA, que desactivó en julio debido a su bajo rendimiento.
En un aparente reconocimiento de las demandas pendientes de los artistas que argumentan que los generadores de imágenes de IA están entrenados en sus obras, OpenAI estrenó una nueva herramienta para que los artistas excluyan sus obras. OpenAI también dice que DALL-E 3 rechazará solicitudes de imágenes «al estilo de un artista vivo».
Un nuevo y mejorado generador de imágenes de IA de OpenAI prepara el terreno para que estas imágenes sean cada vez más comunes. Al no estar protegidas por derechos de autor, según una reciente sentencia judicial, pueden crearse, publicarse y venderse libremente. «No necesitas nuestro permiso para reimprimirlas, venderlas o comercializarlas», afirma OpenAI.