Après ChatGPT, OpenAI présente son outil révolutionnaire capable de créer des vidéos
Acteur majeur dans l'évolution de l'intelligence artificielle, OpenAI vient de présenter son tout nouvel outil révolutionnaire, capable de générer des vidéos. Bluffant.
Après ChatGPT, OPENAI présente Sora
C'est un grand pas en avant qui vient d'être fait dans le domaine de l'intelligence artificielle. Jusque-là, grâce à des logiciels comme Midjourney ou Dall-E, nous pouvions générer des images à partir d'inscriptions textuelles. Désormais, il est possible de produire de véritables clips d'une minute. Enfin presque.
Open AI, nouveau géant américain de l'intelligence artificielle derrière Dall-E et ChatGPT vient de présenter Sora, son nouvel outil capable de créer des vidéos réalistes à partir d’une simple saisie de texte. Il s'agit-là d'une innovation majeure dans le domaine.
Un trailer d'une minute en quelques secondes
"Sora est capable de générer des scènes complexes avec plusieurs personnages, des mouvements de caméra spécifiques et de nombreux détails apportés au sujet comme à l'arrière-plan. L'outil comprend la requête écrite par l'utilisateur, mais aussi la manière dont existent les différents éléments dans le monde réel" promet OpenAI.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
Pour illustrer son propos Open AI a partagé plusieurs exemples de prompts à la base de la génération desdites vidéos : "Une bande-annonce de film présentant les aventures d'un homme de l'espace de 30 ans portant un casque de moto en laine tricotée rouge, ciel bleu, désert de sel, style cinématographique, filmé en 35 mm, couleurs vives." Résultat, Sora génère une courte vidéo d'une minute au réalisme impressionnant.
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
Une innovation qui n'est pas sans risque
"À partir d’une simple saisie de texte, le programme peut générer des vidéos d’une minute respectant la demande de l'utilisateur", rappelle Sam Altman, le patron d’OpenAI. La société a prévenu que le modèle actuel de la plateforme présentait des défauts avec une confusion entre la gauche et la droite ou l'incapacité à maintenir une continuité visuelle durant toute la vidéo. "Par exemple, une personne peut prendre une bouchée d'un biscuit, mais après, le biscuit peut ne pas avoir de trace de morsure", explique le géant.
Bien entendu, une telle innovation pose des questions cruciales en matière de sécurité, à l'heure des deepfakes et autres campagnes de désinformation. Face aux risques majeurs, Sam Altman précise que pour l'heure, Sora n'est pas intégré à ses services déjà accessibles par le grand public. L'outil est en effet, et pour l'instant, destiné à un usage interne, notamment pour évaluer les risques qu'il peut causer. Il a déclaré sur le réseau social X que sa société allait "offrir à un nombre limité de créateurs l'accès" à ce nouvel outil, dans le cadre d'une phase expérimentale.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
"Nous allons engager des décideurs politiques, des éducateurs et des artistes à travers le monde pour comprendre leurs préoccupations et identifier les cas positifs d'utilisation de cette nouvelle technologie", a indiqué OpenAI.