Google dévoile le modèle Gemini Omni Flash

24 Mai 2026 | #HighTech, HIGHTECH – MIS EN AVANT

Gemini Omni Flash

Google a annoncé Gemini Omni Flash, un nouveau modèle d’intelligence artificielle conçu pour la création et la retouche vidéo. Ce modèle multimodal permet de combiner images, audio, vidéo et texte pour générer des vidéos de haute qualité, tout en s’appuyant sur la connaissance du monde réel de Gemini.

Retouche Vidéo Conversationnelle

Gemini Omni Flash simplifie la retouche vidéo en la transformant en une conversation. Les utilisateurs peuvent modifier des vidéos en donnant des instructions textuelles, chaque instruction s’appuyant sur la précédente. Le système assure la cohérence des personnages, le respect de la physique et la continuité de la scène.

Fonctionnalités de Création et de Modification

Les utilisateurs peuvent modifier des détails spécifiques, transformer entièrement une scène, ou réinventer l’action en introduisant de nouveaux personnages ou objets. Il est également possible d’ajuster l’environnement, l’angle de vue, le style et d’autres détails précis, tout en conservant la cohérence de la scène d’origine.

Connaissance et Créativité

Gemini Omni Flash intègre une compréhension intuitive des lois physiques et des connaissances approfondies en histoire, sciences et culture. Cela permet de créer des visuels réalistes et cohérents, allant au-delà de la simple reconnaissance de formes. L’IA peut générer des contenus explicatifs à partir de requêtes simples, en créant des visuels qui clarifient des idées complexes.

Création Vidéo Multimédia

Le modèle accepte diverses références, telles que des images, du texte, des vidéos ou de l’audio, pour créer des vidéos cohérentes. Les utilisateurs peuvent utiliser des images de personnages, de décors ou de dessins comme références pour personnaliser leurs créations. Il est possible de définir l’identité visuelle d’une vidéo avec des références ou des descriptions textuelles, qu’Omni harmonise pour un résultat soigné.

Avatars Numériques et Sécurité

Google met en avant son engagement envers le développement responsable de l’IA. Les utilisateurs peuvent créer des vidéos avec leur propre voix grâce à des avatars numériques. Pour le montage vidéo impliquant la modification de l’audio et de la parole, des tests sont en cours pour garantir une utilisation responsable de cette fonctionnalité. Toutes les vidéos créées avec Omni intègrent le filigrane numérique SynthID.

Disponibilité

Gemini Omni Flash est disponible pour les abonnés Google AI Plus, Pro et Ultra via l’application Gemini et Google Flow. Il est également accessible gratuitement sur YouTube Shorts et YouTube Create App. Google prévoit d’ouvrir l’accès aux développeurs et aux clients entreprise via des API dans les prochaines semaines.

Les utilisateurs peuvent vérifier facilement qu’une vidéo a été générée avec Gemini Omni depuis l’application Gemini, Gemini dans Chrome ou Google Search.