Il y a quelques années à peine, la Chine s’imaginait dominer la course mondiale à l’IA en exploitant les vastes réserves de données du pays pour développer des applications comme la reconnaissance faciale.

Les récents développements en matière d’IA générative — l’utilisation de grands modèles pour produire du contenu comme du texte, des images et des vidéos — ont modifié l’équilibre, laissant la Chine à nouveau apparaître comme un pays à la traîne.

Sora a été lancé le 16 février alors que la Chine est confrontée à des défis croissants en raison de son exclusion des unités de traitement graphique avancées (GPU) de Nvidia en raison des restrictions d'exportation croissantes imposées par les États-Unis. Les meilleurs acteurs nationaux de l’IA ont plusieurs années de retard sur leurs homologues étrangers.

Zhou Hongyi, fondateur de la société de sécurité Internet 360 Security Technology, a qualifié Sora de « seau d'eau froide versé sur la Chine », a rapporté le site d'information Yicai le 23 février. Il estime que cela aide beaucoup de gens à prendre conscience du fossé qui les sépare des dirigeants mondiaux.

OpenAI n'a pas encore publié Sora au public. Il n'est pas open source comme certains modèles précédents. Seules quelques personnes ont accès au procès Sora.

w9xz2qt5.png
Sora d'OpenAI aide les entreprises technologiques chinoises à combler l'écart qui les sépare des principales technologies d'IA mondiales. (Photo : SCMP)

En Chine, l’Administration nationale du cyberespace exige que tous les grands modèles linguistiques (LLM) accessibles au public soient enregistrés auprès du gouvernement. Les grands noms mondiaux comme OpenAI et Google n’ont pas officiellement fourni de services ici.

Cette absence a conduit de nombreux géants technologiques nationaux à se disputer une place sur le marché avec plus de 200 LLM. Baidu, Tencent et Alibaba ont tous lancé leurs propres LLM.

Cependant, très peu d’outils peuvent se comparer à Sora, en partie parce qu’ils n’utilisent pas encore la nouvelle architecture Diffusion Transformer (DiT). ByteDance – la société mère de TikTok – a déclaré que son outil interne de contrôle de mouvement vidéo Boximator, utilisé pour prendre en charge la création de vidéos, en est encore à ses balbutiements et n'est pas prêt pour une diffusion en masse.

L'entreprise admet qu'il existe un écart important entre Boximator et les principaux modèles de création vidéo en termes de qualité d'image, de fidélité et de durée.

Plutôt que de rattraper Sora, certains acteurs du secteur considèrent que le problème le plus urgent est d'accéder aux modèles d'OpenAI. Cependant, les législateurs américains cherchent à restreindre l’accès de la Chine à ses services cloud d’IA.

Une voie possible pour les ingénieurs chinois en IA est de « d’abord décoder Sora et de l’entraîner avec leurs propres données pour créer un produit similaire », a déclaré un développeur chinois anonyme à SCMP. Xu Liang, un entrepreneur en IA basé à Hangzhou, estime qu'il ne faudra pas longtemps avant que la Chine ne propose des services similaires, même s'il peut encore y avoir un léger écart entre les produits chinois et Sora.

Wang Shuyi, professeur spécialisé en IA et en apprentissage automatique à l'Université normale de Tianjin (TJNU), a commenté : l'expérience du développement de LLM au cours de l'année écoulée a permis aux grandes entreprises technologiques chinoises d'accumuler des connaissances dans ce domaine et de stocker le matériel nécessaire, leur permettant de produire des produits comme Sora dans les 6 prochains mois.

Quelques mois avant le lancement de Sora, un groupe de chercheurs a publié VBench, un outil d'analyse comparative pour les modèles de génération vidéo. L'équipe VBench, qui comprend des chercheurs de l'Université technologique de Nanyang à Singapour et du Laboratoire d'intelligence artificielle de Shanghai en Chine, a constaté que Sora surpassait les autres modèles en termes de qualité vidéo globale, sur la base de démos fournies par OpenAI.

Lu Yanxia, ​​directeur de recherche d'IDC Chine pour les technologies émergentes, a déclaré que les géants de la technologie tels que Baidu, Alibaba et Tencent seront parmi les premiers à déployer des services similaires dans le pays.

De plus, iFlyTek, SenseTime et Hikvision — qui figurent tous sur la liste des sanctions de Washington — rejoindront également la course, a-t-elle déclaré.

Mais la Chine doit encore faire face à une bataille difficile, car son marché technologique est de plus en plus isolé du monde en termes de capitaux, de matériel, de données et même de personnes, selon les analystes.

L'écart de valeur marchande entre les plus grandes entreprises technologiques chinoises et celles des États-Unis telles que Microsoft, Google et Nvidia s'est considérablement creusé ces dernières années, alors que Pékin a resserré son emprise.

En outre, alors que la Chine était autrefois considérée comme ayant un avantage en termes de quantité de données, Lu a souligné que le pays est désormais confronté à une pénurie de données de qualité nécessaires pour former de nouveaux modèles, associée au défi de l'accès limité aux puces avancées.

La pénurie de talents est une autre préoccupation, selon les dirigeants d'IDC, car les meilleurs et les plus brillants en IA ont souvent plus de facilité à briller lorsqu'ils travaillent pour les meilleurs acteurs aux États-Unis. Chez OpenAI, par exemple, des experts technologiques chinois forment une équipe de base. Parmi les 1 677 membres affiliés à OpenAI sur LinkedIn, 23 d'entre eux ont étudié à l'Université Tsinghua.

Cependant, même avec suffisamment de talent, les experts se demandent jusqu'où l'IA chinoise peut aller tout en étant confrontée aux contraintes existantes liées aux tensions commerciales entre les États-Unis et la Chine.

Dans un rapport, Ping An Securities a averti que les efforts continus visant à restreindre les exportations de puces en provenance des États-Unis pourraient accélérer la maturation de l'industrie chinoise des puces d'IA, mais que « les alternatives nationales pourraient ne pas répondre aux attentes ».

Washington a empêché les entreprises chinoises d’accéder aux outils de semi-conducteurs les plus avancés au monde. En octobre 2023, les États-Unis ont de nouveau renforcé la réglementation, bloquant l'accès du continent aux GPU que Nvidia avait conçus spécifiquement pour les clients chinois afin d'éviter les restrictions précédentes.

Alexander Harrowell, analyste informatique avancé au sein du groupe de recherche et de conseil technologique Omdia, note que la Chine dispose d'options au-delà des GPU pour la formation LLM, telles que le TPU de Google, l'Ascend de Huawei, le Trainium d'AWS ou l'une des nombreuses offres de startups. Cependant, cela nécessitera davantage d’efforts en matière de développement de logiciels et d’administration système.

Selon l'entrepreneur Xu, le marché chinois bénéficiera d'opportunités particulières lorsque des rapports techniques sur Sora et le modèle vidéo open source seront publiés. « Il y aura une plateforme sur laquelle les entreprises chinoises pourront s’inspirer », a-t-il déclaré. Les modèles vidéo locaux prennent également mieux en charge le chinois, a-t-il ajouté.

(Selon SCMP)