Les améliorations rapides dans la génération de vidéos par IA ne semblent pas ralentir de sitôt, et Google a annoncé une mise à jour majeure de son propre créateur de vidéos sous la forme de Veo 2. Cela fait suite à l’introduction de Veo en mai, et OpenAI a déployé son générateur de vidéos Sora au public plus tôt ce mois-ci.
Google déclare que Veo 2 surpasse Sora et d’autres concurrents en termes de préférences des utilisateurs et d’adhésion aux instructions – vous pouvez voir les graphiques pertinents par vous-même sur le site de Veo 2 – et que le nouveau modèle apporte avec lui “un réalisme et une fidélité améliorés”, ainsi qu’une meilleure gestion du mouvement et des contrôles de caméra améliorés.
Ce que Veo 2 peut faire
Veo 2 a renforcé ses capacités de génération de vidéos grâce à “une compréhension améliorée de la physique du monde réel et des nuances du mouvement et de l’expression humaine”, selon Google – il semble donc que vous verrez moins d’étrangetés dans vos clips.
Le nouveau modèle a également une meilleure compréhension du langage du cinéma et du film. Cela signifie que les instructions peuvent inclure un genre de film spécifique, un certain type d’objectif ou un effet cinématographique particulier. Il y a maintenant un support pour des termes tels que “plan en contre-plongée”, “gros plan” ou “profondeur de champ réduite”, ce qui peut aider les vidéos générées à correspondre plus étroitement à une instruction.
Des vidéos peuvent être créées à des résolutions allant jusqu’à 4K (une mise à niveau par rapport au 1080p) et peuvent maintenant atteindre plusieurs minutes de durée. Certains des clips d’exemple que Google a montrés semblent impressionnants : nous avons des boissons en train d’être versées, des chiens roulant sur des flotteurs dans des piscines, des personnages de dessin animé parlant à la caméra, et des scientifiques regardant dans des microscopes.
Toutefois, ce n’est pas parfait, et Google admet que Veo 2 a encore des difficultés avec la cohérence dans des scènes complexes. C’est un problème général avec les générateurs de vidéos IA – ils ne comprennent pas la physique et l’espace du monde réel, même s’ils peuvent faire une approximation grossière basée sur une vaste quantité de données d’apprentissage. Vous remarquerez qu’aucune de ces vidéos ne montre quelque chose qui sort du cadre puis y revient, probablement parce que l’IA l’oublierait ou le rendrait différemment.
Comment essayer Veo 2
Le processus pour accéder à Veo 2 est le même que pour le premier modèle Veo : il faut se rendre sur l’outil VideoFX de Google sur le web, qui fait partie des Google Labs, et s’inscrire sur la liste d’attente. Pour l’instant, vous devez être aux États-Unis pour essayer Veo 2, et vous devez avoir 18 ans ou plus.
Qu’en pensez-vous jusqu’à présent ?
Google promet une expansion de la disponibilité de Veo 2 au cours de l’année prochaine – y compris son intégration dans YouTube Shorts pour les créateurs – mais pour l’instant, il n’est pas disponible dans d’autres outils comme Google Gemini (qui offre l’accès au dernier modèle de générateur d’art Imagen 3).
Comme je n’ai actuellement pas accès à Veo 2, je ne peux pas vous donner trop de détails sur les limitations qui existent. Google dit “que chaque utilisateur est limité à un certain nombre de générations quotidiennes”, mais il n’est pas clair combien de vidéos vous pouvez réaliser chaque jour, ni leur durée. OpenAI permet aux utilisateurs de ChatGPT Plus de produire jusqu’à 50 vidéos par mois, avec une durée maximale de cinq secondes et une résolution limitée à 720p.
Toutes les vidéos que vous produisez comprendront un “filigrane SynthID invisible” qui les identifie comme ayant été générées par IA – fait partie des tentatives de Google pour minimiser le risque que Veo 2 soit utilisé pour tromper les spectateurs et diffuser de la désinformation (les préoccupations en matière de sécurité font également partie des raisons de la lente mise en œuvre, selon Google).