Google ha anunciado una mejora significativa en la experiencia del usuario al generar imágenes “fotorrealistas” de personas con su inteligencia artificial, Gemini. Esta actualización llega después de que la versión anterior del modelo fuera duramente criticada por generar imágenes inexactas y sesgadas, como cuando se ilustró a una mujer asiática o un hombre negro al pedir la imagen de un “soldado alemán de 1943”, una representación históricamente incorrecta.
Para abordar estas críticas y calmar la controversia, Google ha decidido eliminar la capacidad de Gemini de crear imágenes de cualquier humano. Según Dave Citron, director de gestión de productos de Gemini Experiences, Imagen 3, el nuevo modelo de conversión de texto a imagen de Google, ha sido configurado para no representar imágenes fotorrealistas de figuras públicas, menores de edad o escenas violentas.
«Con Imagen 3, hemos avanzado significativamente en la mejora de la experiencia del usuario al generar imágenes de personas», explica Citron. Sin embargo, también señala que, como ocurre con cualquier herramienta de IA generativa, no todas las imágenes creadas por Gemini serán perfectas. Este enfoque más cuidadoso y ético refleja el compromiso de Google con la responsabilidad en la tecnología de inteligencia artificial.
En los próximos días, Google planea expandir su último modelo de generación de imágenes a las aplicaciones de Gemini en todos los idiomas, permitiendo a los usuarios experimentar estas mejoras en una variedad de contextos y necesidades.
Nuevas funcionalidades con Gems para usuarios avanzados
Además de las mejoras en la generación de imágenes, Google ha introducido una nueva funcionalidad para los usuarios de Gemini Advanced, Business y Enterprise. A partir de este miércoles, estos usuarios podrán utilizar Gems, una herramienta que permite personalizar Gemini para crear “asistentes” de inteligencia artificial especializados en temas específicos.
Citron explica que los usuarios pueden personalizar las Gems para que actúen como expertos en un tema o perfeccionarlas para alcanzar objetivos específicos. «Solo tienen que escribir las instrucciones para su Gem, darle un nombre y chatear cuando quieran», señala.
Con estas novedades, Google busca no solo mejorar la precisión y la ética en la generación de imágenes, sino también ofrecer herramientas más adaptadas a las necesidades individuales de sus usuarios, fortaleciendo su posición como líder en innovación tecnológica.