Key10
  • Accueil
  • Tech
  • LOL
  • Meme
  • Voyage
  • Animaux
  • Video
  • Contact
Aucun résultats
View All Result
Key10
Aucun résultats
View All Result

Découvrez Comment Apple Réinvente une Technique d’IA Oubliée pour Générer des Images Éblouissantes !

Key10 par Key10
23 juin 2025
dans Tech
Temps de lecture : 4 mins read
0
A A
0
Partager sur FacebookPartager sur Twitter

Dans un tournant surprenant, Apple redécouvre une technique d’IA oubliée pour générer des images, révélant des capacités prometteuses. Ce processus innovant pourrait transformer la manière dont nous percevons la création visuelle, tout en soulignant l’importance croissante de l’intelligence artificielle dans le paysage technologique contemporain.

La Recherche d’Apple : Génération d’Images avec une Technique d’IA Oubliée

Qu’est-ce que les Flots Normalisants ?

Les Flots Normalisants (NFs) représentent un type de modèle d’IA qui apprend à transformer mathématiquement des données du monde réel, comme des images, en bruit structuré. Ce processus est ensuite inversé pour générer de nouveaux échantillons. L’avantage majeur des NFs réside dans leur capacité à calculer la probabilité exacte de chaque image générée, un aspect que les modèles de diffusion ne peuvent pas offrir. Cela rend les flots particulièrement intéressants pour les tâches où la compréhension de la probabilité d’un résultat est cruciale.

Vous pourriez aussiaimer

Samsung’s Android XR Headset: Why This $1,800 Gaming Revolution Is a Must-Have!

Arlo Révolutionne la Sécurité Domestique : Découvrez ses Nouvelles Caméras Pan/Tilt à Prix Mini dans la Gamme Essentielle !

Découvrez la Révolution d’Édition Photo dans Gemini : L’incroyable Mise à Jour ‘Nano Banana’ qui Va Tout Changer!

Cependant, la raison pour laquelle ils sont moins connus réside dans le fait que les anciens modèles basés sur les flots produisaient des images floues ou manquant de détails et de diversité, contrairement aux systèmes basés sur la diffusion ou les transformateurs.

Étude #1 : TarFlow

Dans l’article "Normalizing Flows are Capable Generative Models", Apple présente un nouveau modèle appelé TarFlow, qui signifie Transformer AutoRegressive Flow. Ce modèle remplace les anciennes couches artisanales utilisées dans les modèles de flots précédents par des blocs de transformateurs. En simplifiant, TarFlow segmente les images en petits morceaux et les génère par blocs, chaque bloc étant prédit sur la base des blocs précédents. Ce processus est dit autoregressif, similaire à la méthode qu’OpenAI utilise actuellement pour la génération d’images.

La différence clé réside dans le fait qu’OpenAI génère des tokens discrets, traitant les images comme de longues séquences de symboles textuels, alors qu’Apple, avec TarFlow, génère directement des valeurs de pixels sans tokeniser l’image. Ce choix évite la perte de qualité souvent associée à la compression des images en un vocabulaire fixe de tokens.

Malgré ces avancées, des limitations subsistaient, notamment lors de la montée en échelle vers des images de haute résolution. C’est là qu’intervient la deuxième étude.

Étude #2 : STARFlow

Dans le document "STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis", Apple s’appuie directement sur TarFlow et présente le modèle STARFlow (Scalable Transformer AutoRegressive Flow), qui intègre des améliorations significatives.

La plus grande innovation de STARFlow est qu’il ne génère plus d’images directement dans l’espace pixel. Au lieu de cela, il travaille sur une version compressée de l’image, puis remet tout à un décodeur qui augmente la résolution à l’étape finale. Cette transition vers l’espace latent signifie que STARFlow n’a pas besoin de prédire des millions de pixels directement, mais peut plutôt se concentrer d’abord sur la structure générale de l’image, laissant les détails fins au décodeur.

Apple a également reconfiguré la manière dont le modèle gère les prompts textuels. Au lieu de construire un encodeur de texte séparé, STARFlow peut intégrer des modèles de langage existants (comme le modèle de langage de Google, Gemma) pour traiter la compréhension du langage lorsque l’utilisateur demande la création d’une image. Cela permet de garder le côté génération d’images du modèle axé sur le raffinement des détails visuels.

Comparaison avec le Générateur d’Images GPT-4o d’OpenAI

Alors qu’Apple réinvente les flots, OpenAI a également récemment évolué au-delà de la diffusion avec son modèle GPT-4o. Cependant, leur approche se distingue fondamentalement. GPT-4o considère les images comme des séquences de tokens discrets, semblables aux mots dans une phrase. Lorsque vous demandez à ChatGPT de générer une image, le modèle prédit un token d’image à la fois, construisant ainsi l’image pièce par pièce. Cette méthode confère une flexibilité énorme à OpenAI : le même modèle peut générer du texte, des images et de l’audio au sein d’un flux de tokens unifié.

Le revers de la médaille est que la génération token par token peut être lente, surtout pour des images volumineuses ou haute résolution. De plus, elle est extrêmement gourmande en ressources informatiques. Toutefois, comme GPT-4o fonctionne entièrement dans le cloud, OpenAI n’est pas autant contraint par la latence ou la consommation d’énergie.

En résumé, Apple et OpenAI avancent tous deux au-delà des modèles de diffusion, mais alors qu’OpenAI construit pour ses centres de données, Apple semble clairement se concentrer sur des solutions destinées à nos appareils portables.

Pour en savoir plus sur les techniques d’intelligence artificielle, vous pouvez consulter des articles sur Google AI.

Qu’est-ce que les Normalizing Flows ?

Les Normalizing Flows (NFs) sont un type de modèle d’IA qui apprend à transformer mathématiquement des données du monde réel (comme des images) en bruit structuré, puis à inverser ce processus pour générer de nouveaux échantillons. Leur principal avantage est qu’ils peuvent calculer la probabilité exacte de chaque image générée, une propriété que les modèles de diffusion ne peuvent pas offrir.

Qu’est-ce que TarFlow ?

TarFlow, abréviation de Transformer AutoRegressive Flow, est un nouveau modèle présenté par Apple. Il remplace les anciennes couches artisanales des modèles de flux par des blocs de Transformers, générant des images en divisant celles-ci en petits morceaux et en prédisant chaque morceau basé sur les précédents. Cela permet de produire des images avec une meilleure qualité.

Qu’est-ce que STARFlow ?

STARFlow (Scalable Transformer AutoRegressive Flow) est une extension de TarFlow qui travaille sur une version compressée de l’image avant de la déchiffrer à pleine résolution. Cela permet au modèle de se concentrer sur la structure de l’image dans un espace latent, améliorant ainsi la génération d’images de haute résolution.

Comment STARFlow se compare-t-il à GPT-4o d’OpenAI ?

Bien qu’Apple et OpenAI avancent au-delà des modèles de diffusion, leur approche diffère. GPT-4o traite les images comme des séquences de tokens discrets, ce qui lui permet de générer du texte, des images et de l’audio dans un flux unifié, mais cela peut être lent et coûteux en ressources. En revanche, Apple se concentre sur l’optimisation pour les appareils mobiles, cherchant à améliorer l’efficacité des modèles d’IA.

Article précédent

Découvrez le Jetblack Galaxy S25 Ultra et la Révolution de la Google Smart TV 165Hz : Tout ce que Vous Devez Savoir !

Article suivant

Découvrez la nouvelle fonctionnalité révolutionnaire d’AirTag désormais prise en charge par JetBlue : ce que vous devez savoir !

Key10

Key10

Articles en relation

Samsung’s Android XR Headset: Why This $1,800 Gaming Revolution Is a Must-Have!
Tech

Samsung’s Android XR Headset: Why This $1,800 Gaming Revolution Is a Must-Have!

26 août 2025
Arlo Révolutionne la Sécurité Domestique : Découvrez ses Nouvelles Caméras Pan/Tilt à Prix Mini dans la Gamme Essentielle !
Tech

Arlo Révolutionne la Sécurité Domestique : Découvrez ses Nouvelles Caméras Pan/Tilt à Prix Mini dans la Gamme Essentielle !

26 août 2025
Découvrez Comment l’App Gemini Éblouit avec un Nouvel Icône Bleu !
Tech

Découvrez la Révolution d’Édition Photo dans Gemini : L’incroyable Mise à Jour ‘Nano Banana’ qui Va Tout Changer!

26 août 2025
Découvrez la Nouvelle Caméra de Sécurité 4K de Wyze à Seulement 60 $ : Un Rapport Qualité-Prix Imbattable !
Tech

Découvrez la Nouvelle Caméra de Sécurité 4K de Wyze à Seulement 60 $ : Un Rapport Qualité-Prix Imbattable !

26 août 2025
Découvrez les Nouvelles Améliorations de la Nest Cam dans l’Application Home : Un Guide Visuel Indispensable !
Tech

Découvrez les Nouvelles Améliorations de la Nest Cam dans l’Application Home : Un Guide Visuel Indispensable !

26 août 2025
Découvrez les innovations révolutionnaires des dernières mises à jour du système Google pour Android !
Tech

Découvrez les Dernières Innovations des Mises à Jour Google System d’Android : Ce qui Vous Attend !

26 août 2025
Article suivant
Découvrez la nouvelle fonctionnalité révolutionnaire d’AirTag désormais prise en charge par JetBlue : ce que vous devez savoir !

Découvrez la nouvelle fonctionnalité révolutionnaire d'AirTag désormais prise en charge par JetBlue : ce que vous devez savoir !

Discussion about this post

Key10

© 2022 Key 10 - Edité par Alliance 123.

Découvrir l'univers des TOP

  • Conditions générales d’utilisation
  • Données personnelles
  • Mentions légales
  • Contact

Suivez nous c'est Top

Aucun résultats
View All Result
  • Accueil
  • Tech
  • LOL
  • Meme
  • Voyage
  • Animaux
  • Video
  • Contact

© 2022 Key 10 - Edité par Alliance 123.

Bienvenue à nouveau !

Connectez-vous à votre compte ci-dessous

Mot de passe oublié ?

Retrieve your password

Please enter your username or email address to reset your password.

Connectez-vous
Ce site Web utilise des cookies. En continuant à utiliser ce site Web, vous consentez à ce que des cookies soient utilisés.