Noch vor wenigen Jahren träumte China davon, das globale KI-Rennen irgendwann dominieren zu können, indem es die riesigen Datenmengen des Landes nutzte, um Anwendungen wie die Gesichtserkennung zu entwickeln.

Durch die jüngsten Entwicklungen im Bereich der generativen KI – bei der große Modelle zur Erstellung von Inhalten wie Texten, Bildern und Videos verwendet werden – hat sich das Gleichgewicht verschoben, und China sieht erneut wie ein Nachzügler aus.

Sora wurde am 16. Februar eingeführt, da China aufgrund der zunehmenden Exportbeschränkungen der USA vor wachsenden Herausforderungen steht, da es von den fortschrittlichen Grafikprozessoren (GPUs) von Nvidia abgeschnitten ist. Die besten inländischen KI-Spieler hinken ihren ausländischen Kollegen um mehrere Jahre hinterher.

Zhou Hongyi, Gründer der Internet-Sicherheitsfirma 360 Security Technology, bezeichnete Sora als „einen Eimer kaltes Wasser, der über China geschüttet wurde“, berichtete die Nachrichtenseite Yicai am 23. Februar. Er glaubt, dass dies vielen Menschen hilft, die Kluft zwischen ihnen und den führenden Politikern der Welt zu erkennen.

OpenAI hat Sora noch nicht öffentlich freigegeben. Es ist nicht Open Source wie einige Vorgängermodelle. Nur wenige Personen haben Zugriff auf die Sora-Testversion.

w9xz2qt5.png
Sora von OpenAI hilft chinesischen Technologieunternehmen, die Lücke zwischen ihnen und den weltweit führenden KI-Technologien zu erkennen. (Foto: SCMP)

In China verlangt die National Cyberspace Administration, dass alle öffentlich verfügbaren großen Sprachmodelle (LLMs) bei der Regierung registriert werden. Große Namen der Welt wie OpenAI und Google haben hier keine offiziellen Dienste angeboten.

Dieser Mangel hat dazu geführt, dass viele heimische Technologiegiganten mit mehr als 200 LLMs um eine Position auf dem Markt konkurrieren. Baidu, Tencent und Alibaba haben alle ihre eigenen LLMs eingeführt.

Allerdings können sich nur sehr wenige Tools mit Sora messen, was teilweise daran liegt, dass sie die neue Diffusion Transformer (DiT)-Architektur noch nicht verwenden. ByteDance – die Muttergesellschaft von TikTok – sagte, dass sich ihr internes Video-Motion-Control-Tool Boximator, das zur Unterstützung der Videoerstellung verwendet wird, noch in den Kinderschuhen befindet und nicht für die Massenveröffentlichung bereit ist.

Das Unternehmen räumt ein, dass zwischen Boximator und führenden Modellen zur Videoerstellung hinsichtlich Bildqualität, Wiedergabetreue und Dauer eine große Lücke besteht.

Anstatt mit Sora Schritt zu halten, sehen einige in der Branche die dringlichere Aufgabe darin, Zugang zu den Modellen von OpenAI zu erhalten. Allerdings möchten US-Gesetzgeber den Zugang Chinas zu ihren KI-Cloud-Diensten einschränken.

Ein möglicher Weg für chinesische KI-Ingenieure besteht darin , „zuerst Sora zu entschlüsseln und es mit ihren eigenen Daten zu trainieren, um ein ähnliches Produkt zu erstellen“, sagte ein anonymer chinesischer Entwickler gegenüber SCMP. Xu Liang, ein KI-Unternehmer aus Hangzhou, glaubt, dass es nicht mehr lange dauern wird, bis es in China ähnliche Dienste gibt, auch wenn zwischen chinesischen Produkten und Sora möglicherweise noch eine kleine Lücke besteht.

Wang Shuyi, Professor für KI und maschinelles Lernen an der Tianjin Normal University (TJNU), kommentierte: „Die Erfahrungen bei der Entwicklung von LLMs im vergangenen Jahr haben es den großen chinesischen Technologieunternehmen ermöglicht, Wissen auf diesem Gebiet aufzubauen und die notwendige Hardware anzuhäufen, sodass sie in den nächsten sechs Monaten Produkte wie Sora herstellen können.“

Einige Monate vor der Markteinführung von Sora veröffentlichte eine Gruppe von Forschern VBench, ein Benchmarking-Tool für Videogenerierungsmodelle. Das VBench-Team, zu dem Forscher der Nanyang Technological University in Singapur und des Shanghai Artificial Intelligence Laboratory in China gehören, stellte auf der Grundlage von Demos von OpenAI fest, dass Sora andere Modelle in der Gesamtvideoqualität übertrifft.

Lu Yanxia, ​​Forschungsdirektor für neue Technologien bei IDC China, sagte, Technologiegiganten wie Baidu, Alibaba und Tencent würden zu den ersten gehören, die ähnliche Dienste im Land einführen.

Darüber hinaus würden sich auch iFlyTek, SenseTime und Hikvision – die alle auf der Sanktionsliste Washingtons stehen – in das Rennen einmischen, sagte sie.

Doch China steht nach wie vor ein harter Kampf bevor, da sein Technologiemarkt in Bezug auf Kapital, Hardware, Daten und sogar Menschen immer stärker vom Rest der Welt isoliert wird, sagen Analysten.

Die Marktwertlücke zwischen Chinas führenden Technologieunternehmen und denen in den USA wie Microsoft, Google und Nvidia hat sich in den letzten Jahren deutlich vergrößert, da Peking seinen Einfluss verstärkt hat.

Während China früher als im Vorteil hinsichtlich der Datenmenge galt, wies Lu darauf hin, dass das Land heute mit einem Mangel an qualitativ hochwertigen Daten konfrontiert sei, die für das Training neuerer Modelle erforderlich seien. Hinzu käme noch die Herausforderung eines eingeschränkten Zugangs zu fortschrittlichen Chips.

Der Mangel an Talenten ist laut IDC-Führungskräften ein weiteres Problem, da es den besten und klügsten Köpfen im KI-Bereich oft leichter fällt, zu glänzen, wenn sie für Top-Unternehmen in den USA arbeiten. Bei OpenAI beispielsweise bilden Tech-Experten aus China ein Kernteam. Von den 1.677 LinkedIn-Mitgliedern von OpenAI haben 23 an der Tsinghua-Universität studiert.

Doch selbst wenn genügend Talent vorhanden wäre, bezweifeln Experten, wie weit Chinas inländische KI angesichts der bestehenden Einschränkungen durch die Handelsspannungen zwischen den USA und China überhaupt kommen kann.

In einem Bericht warnte Ping An Securities, dass die anhaltenden Bemühungen, Chipexporte aus den USA einzuschränken, die Reifung der chinesischen KI-Chipindustrie beschleunigen könnten, dass jedoch „inländische Alternativen hinter den Erwartungen zurückbleiben könnten“.

Washington hat chinesischen Unternehmen den Zugang zu den fortschrittlichsten Halbleiterwerkzeugen der Welt verwehrt. Im Oktober 2023 verschärften die USA ihre Vorschriften erneut und blockierten den Zugriff des chinesischen Festlands auf GPUs, die Nvidia speziell für chinesische Kunden entwickelt hatte, um frühere Beschränkungen zu umgehen.

Alexander Harrowell, ein Analyst für fortgeschrittenes Computing bei der Technologieforschungs- und Beratungsgruppe Omdia, weist darauf hin, dass es in China für die LLM-Ausbildung neben GPUs noch weitere Optionen gibt, etwa TPU von Google, Ascend von Huawei, Trainium von AWS oder die Angebote zahlreicher Startups. Allerdings ist dafür ein höherer Aufwand bei der Softwareentwicklung und Systemadministration erforderlich.

Dem chinesischen Markt werden sich laut Unternehmer Xu besondere Chancen bieten, wenn technische Berichte zu Sora und dem Open-Source-Videomodell veröffentlicht werden. „Es wird eine Plattform für chinesische Unternehmen geben, von der sie lernen können“, sagte er. Lokale Videomodelle unterstützen Chinesisch auch besser, fügte er hinzu.

(Laut SCMP)