Всего несколько лет назад Китай мечтал о том, что в конечном итоге станет лидером в мировой гонке искусственного интеллекта, используя обширные данные страны для разработки таких приложений, как распознавание лиц.

Недавние разработки в области генеративного искусственного интеллекта — использование крупных моделей для создания такого контента, как текст, изображения и видео — изменили баланс, в результате чего Китай снова оказался отстающим.

Sora был запущен 16 февраля, поскольку Китай сталкивается с растущими проблемами, связанными с отсутствием доступа к передовым графическим процессорам (GPU) компании Nvidia из-за ужесточающихся экспортных ограничений США. Лучшие отечественные игроки в области искусственного интеллекта отстают от своих зарубежных коллег на несколько лет.

Чжоу Хунъи, основатель компании по интернет-безопасности 360 Security Technology, назвал Сору «ведром холодной воды, вылитым на Китай», сообщил новостной сайт Yicai 23 февраля. Он считает, что это помогает многим людям увидеть пропасть между ними и мировыми лидерами.

OpenAI пока не представила Sora широкой публике. В отличие от некоторых предыдущих моделей, это не версия с открытым исходным кодом. Доступ к исследованию Sora имеют лишь несколько человек.

w9xz2qt5.png
Sora от OpenAI помогает китайским технологическим компаниям осознать разрыв между ними и ведущими мировыми технологиями искусственного интеллекта. (Фото: SCMP)

В Китае Национальное управление киберпространства требует, чтобы все общедоступные большие языковые модели (LLM) были зарегистрированы в правительстве. Такие мировые имена, как OpenAI и Google, официально не предоставляли здесь свои услуги.

Это отсутствие привело к тому, что многим отечественным технологическим гигантам приходится конкурировать за место на рынке с более чем 200 степенями магистра права. Baidu, Tencent и Alibaba представили собственные программы LLM.

Однако очень немногие инструменты могут сравниться с Sora, отчасти потому, что они пока не используют новую архитектуру Diffusion Transformer (DiT). ByteDance — материнская компания TikTok — заявила, что ее внутренний инструмент управления движением в видео Boximator, используемый для поддержки создания видео, все еще находится в начальной стадии развития и не готов к массовому выпуску.

Компания признает, что между Boximator и ведущими моделями для создания видео существует большой разрыв с точки зрения качества изображения, точности и продолжительности.

Вместо того чтобы догнать Сору, некоторые представители отрасли видят более насущную проблему в получении доступа к моделям OpenAI. Однако американские законодатели стремятся ограничить доступ Китая к своим облачным сервисам ИИ.

Один из возможных путей для китайских инженеров ИИ — «сначала расшифровать Sora и обучить его с помощью собственных данных, чтобы создать аналогичный продукт», — рассказал SCMP неназванный китайский разработчик. Сюй Лян, предприниматель в сфере искусственного интеллекта из Ханчжоу, считает, что в скором времени в Китае появятся аналогичные сервисы, хотя между китайскими продуктами и Sora все еще может существовать небольшой разрыв.

Ван Шуйи, профессор, специализирующийся на ИИ и машинном обучении в Тяньцзиньском педагогическом университете (TJNU), прокомментировал: опыт разработки степеней LLM за последний год позволил китайским крупным технологическим компаниям накопить знания в этой области и создать необходимое оборудование, что позволит им производить такие продукты, как Sora, в течение следующих 6 месяцев.

За несколько месяцев до запуска Sora группа исследователей выпустила VBench — инструмент для сравнительного анализа моделей генерации видео. Команда VBench, в которую входят исследователи из Наньянского технологического университета в Сингапуре и Шанхайской лаборатории искусственного интеллекта в Китае, на основе демонстраций, предоставленных OpenAI, обнаружила, что Sora превосходит другие модели по общему качеству видео.

Лу Янься, директор по исследованиям новых технологий в IDC China, заявил, что такие технологические гиганты, как Baidu, Alibaba и Tencent, будут одними из первых, кто запустит подобные сервисы в стране.

Кроме того, по ее словам, к гонке также присоединятся iFlyTek, SenseTime и Hikvision, которые все находятся в санкционном списке Вашингтона.

Однако, по мнению аналитиков, Китаю по-прежнему предстоит нелегкая борьба, поскольку его технологический рынок становится все более изолированным от мира с точки зрения капитала, оборудования, данных и даже людей.

Разрыв в рыночной стоимости между ведущими технологическими компаниями Китая и США, такими как Microsoft, Google и Nvidia, значительно увеличился за последние годы, поскольку Пекин ужесточил контроль.

Кроме того, хотя когда-то считалось, что Китай имеет преимущество с точки зрения количества данных, Лу отметил, что теперь страна сталкивается с нехваткой качественных данных, необходимых для обучения новых моделей, а также с проблемой ограниченного доступа к передовым чипам.

По словам руководителей IDC, еще одной проблемой является нехватка талантов, поскольку лучшим и самым ярким специалистам в области ИИ зачастую легче проявить себя, работая на ведущих игроков в США. Например, в OpenAI основную команду составляют технические эксперты из Китая. Из 1677 членов-партнеров OpenAI в LinkedIn 23 учились в Университете Цинхуа.

Однако даже при наличии достаточного количества талантов эксперты сомневаются, насколько далеко может зайти китайский искусственный интеллект, учитывая существующие ограничения, связанные с торговой напряженностью между США и Китаем.

В своем отчете компания Ping An Securities предупредила, что продолжение усилий по ограничению экспорта чипов из США может ускорить развитие китайской индустрии чипов для искусственного интеллекта, однако «отечественные альтернативы могут не оправдать ожиданий».

Вашингтон заблокировал китайским компаниям доступ к самым передовым в мире полупроводниковым приборам. В октябре 2023 года США снова ужесточили правила, заблокировав на материке доступ к графическим процессорам, которые Nvidia разработала специально для китайских клиентов, чтобы обойти предыдущие ограничения.

Александр Харроуэлл, продвинутый аналитик в области вычислений из исследовательской и консалтинговой группы Omdia, отмечает, что в Китае есть и другие варианты обучения на степень магистра права, помимо графических процессоров, такие как TPU от Google, Ascend от Huawei, Trainium от AWS или одно из предложений ряда стартапов. Однако это потребует больше усилий по разработке программного обеспечения и администрированию системы.

По словам предпринимателя Сюй, у китайского рынка появятся особые возможности, когда будут опубликованы технические отчеты о Sora и модели видео с открытым исходным кодом. «Китайским компаниям будет предоставлена ​​платформа для обучения», — сказал он. Он добавил, что местные видеомодели также лучше поддерживают китайский язык.

(По данным SCMP)