Google révolutionne le monde de l’édition d’images avec le déploiement de l’IA native dans son application Gemini. Cette avancée permet aux utilisateurs de transformer des photos en œuvres d’art, rendant l’édition accessible à tous. Découvrez comment cette innovation redéfinit la créativité numérique.
L’Édition d’Images AI dans l’Application Gemini de Google

Déploiement de l’Édition d’Images
Après des tests auprès des développeurs le mois dernier, Google commence à déployer des fonctionnalités d’édition d’images AI directement dans l’application Gemini. Cette fonctionnalité permet aux utilisateurs d’éditer des images qu’ils téléchargent manuellement ainsi que celles générées par l’application, le tout en utilisant des prompts en langage naturel.
Les utilisateurs peuvent demander à Google de modifier les images jusqu’à obtenir un résultat satisfaisant, tout en préservant le contexte. Les possibilités incluent le changement d’arrière-plan, le remplacement d’objets ou l’ajout d’éléments dans les images.
Fonctionnalités d’Édition
Pour illustrer cette fonctionnalité, vous pouvez télécharger une photo personnelle et demander à Gemini de générer une image montrant à quoi vous ressembleriez avec différentes couleurs de cheveux. Dès que la capacité fondamentale sera activée, un prompt en ligne vous permettra d’utiliser n’importe quel modèle actuel pour commencer l’édition d’images.
Édition Multi-Étapes
Un des avantages du processus d’édition que Google qualifie d’« intuitif » est la possibilité d’obtenir des réponses plus riches et contextuelles à vos demandes, intégrant à la fois texte et images. Par exemple, vous pourriez demander à Gemini de créer un premier brouillon d’un conte de fées sur des dragons, avec des illustrations pour accompagner le récit.
Sécurité des Images
Concernant la sécurité, les images créées ou modifiées avec la génération d’images native incluront un watermark numérique invisible, nommé SynthID. Google expérimente également l’ajout d’un watermark visible sur toutes les images générées par Gemini, renforçant ainsi la traçabilité des contenus.
Performances Améliorées
Le mois dernier, lors d’une session à AI Studio, Google a mis en avant les performances du modèle 2.0 Flash, qui excelle dans le rendu d’images contenant du texte, quelle que soit sa longueur. Ce modèle tire parti de connaissances globales et d’un raisonnement amélioré pour générer des images appropriées.
Déploiement Progressif
L’édition d’images est en cours de déploiement progressif dans l’application Gemini. Cette fonctionnalité sera accessible à un public plus large, couvrant plus de 45 langues et la plupart des pays dans les semaines à venir.
Pour plus d’informations sur l’édition d’images et les nouvelles technologies de Google, vous pouvez consulter le site Google AI.
Qu’est-ce que l’édition d’images native dans l’application Gemini ?
L’édition d’images native permet de modifier des images que vous téléchargez manuellement, ainsi que celles générées par l’application Gemini, à l’aide de commandes textuelles en langage naturel.
Comment puis-je utiliser l’édition d’images avec des invites textuelles ?
Vous pouvez demander à Google de faire des modifications jusqu’à ce que vous soyez satisfait, en conservant le contexte tout au long du processus, comme changer l’arrière-plan ou remplacer des objets.
Quels types de modifications puis-je effectuer sur mes images ?
Vous pouvez modifier des photos personnelles pour voir à quoi vous ressembleriez avec différentes couleurs de cheveux, ou demander des instructions étape par étape, accompagnées d’images.
Y a-t-il des mesures de sécurité pour les images générées ou modifiées ?
Toutes les images créées ou modifiées incluront un filigrane numérique invisible SynthID, et Google teste également l’ajout d’un filigrane visible sur toutes les images générées par Gemini.






Discussion about this post