Sora est le nouveau modèle d'IA générative d'OpenAI, qui fonctionne de manière similaire à l'outil d'imagerie Dall-E de la même maison. Les utilisateurs fournissent simplement une invite de contenu vidéo et Sora renvoie des clips vidéo de haute qualité. De plus, il peut également créer des vidéos à partir d'images fixes, étirer des vidéos ou remplir des cadres vides.
La vidéo pourrait être la prochaine frontière de l’IA générative à mesure que les chatbots et les générateurs d’images entrent dans le monde réel. Bien qu’accueillies favorablement par les passionnés d’IA, les nouvelles technologies suscitent également de sérieuses inquiétudes quant à la désinformation à l’approche des grandes élections politiques mondiales. Selon les données de la société d'apprentissage automatique Clarity, le nombre de deepfakes générés par l'IA a augmenté de 900 % d'une année sur l'autre.
Avec Sora, OpenAI cherche à concurrencer les outils d'IA de génération de vidéos de concurrents comme Meta, Google et des startups comme Stability AI. Amazon a également lancé Create with Alexa, un modèle basé sur des invites pour créer du contenu animé de courte durée pour les enfants.
Sora ne peut actuellement créer que des vidéos d'une minute ou moins. Il existe également un petit groupe – ou « équipe rouge » – qui utilise le modèle pour rechercher des failles de sécurité. OpenAI n'a publié aucune démo publique au-delà des 10 exemples de clips disponibles sur le site Web.
OpenAI construit également un classificateur capable d'identifier les clips vidéo comme des produits Sora et prévoit d'inclure certaines métadonnées dans la sortie pour aider à identifier le contenu généré par l'IA. Cet effort est similaire à ce que fait Meta pour identifier les images générées par l’IA.
Sora, comme ChatGPT, utilise l'architecture Transformer introduite par les chercheurs de Google dans un article de 2017.
(Selon CNBC)
Source
Comment (0)