Apple está sacudiendo el mundo del software de inteligencia artificial con su último avance: el Editor de Imágenes MGIE. En este artículo, exploraremos cómo esta innovadora técnica permite a los usuarios interactuar con modelos de IA utilizando lenguaje natural para obtener resultados precisos y sorprendentes.

¿Qué es MGIE y cómo funciona?

MGIE, siglas de Multimodal Large-Language Model-Guided Image Editing, es la respuesta de Apple para cambiar las reglas del juego en la edición de imágenes. Desarrollado en colaboración con la Universidad de Santa Bárbara, este modelo de IA interpreta instrucciones proporcionadas por los usuarios en lenguaje natural y las convierte en comandos de edición de imágenes precisos. Utilizando un modelo de difusión, MGIE aplica ediciones basadas en las características de la imagen original, logrando resultados superiores a métodos más convencionales como Pix2Pix.

La revolución de la edición de imágenes guiada por texto

Con la introducción de MGIE, Apple se acerca cada vez más a lograr capacidades similares a las de ChatGPT Plus de OpenAI. Los usuarios ahora pueden interactuar conversacionalmente con modelos de IA para crear imágenes personalizadas basadas en texto. Desde cambiar el color del pelo hasta eliminar elementos no deseados de una fotografía, las posibilidades son infinitas. La capacidad de MGIE para comprender y ejecutar comandos de edición de imágenes en lenguaje natural marca un hito significativo en la evolución de la IA.

¿Por qué Apple opta por el código abierto?

La decisión de Apple de hacer que MGIE sea de código abierto no solo responde a requisitos de licencia, sino que también refleja una estrategia más amplia. Al utilizar modelos de código abierto como Llava y Vicuna, Apple puede aprovechar un grupo diverso de desarrolladores en todo el mundo para mejorar y evolucionar su tecnología más rápidamente. Esta colaboración no solo impulsa la innovación, sino que también fortalece la posición de Apple en la comunidad de desarrolladores y entusiastas de la tecnología. Además, al liberar MGIE como software de código abierto, Apple establece estándares en la industria de la IA y fomenta la creatividad y la experimentación en el campo de la edición de imágenes.

.

 

525
Suscribirse
Notificación
1 Comment
Inline Feedbacks
Ver todos los comentarios
1
0
¡Aquí puedes dejar tus comentarios!x