Недавно Baidu Baike — сервис на китайском языке, похожий на Википедию, — обновил свой файл robots.txt, который сообщает поисковым системам, к каким веб-адресам они могут получать доступ, и полностью заблокировал Googlebot и Bingbot возможность индексировать контент с платформы.
Фото: Shutterstock
Этот шаг демонстрирует усилия Baidu по защите своих онлайн-активов на фоне растущего спроса на большие данные для разработки моделей и приложений искусственного интеллекта (ИИ).
После обновления robots.txt Baidu Baike расследование SCMP показало, что многие элементы платформы по-прежнему появляются в результатах поиска Google и Bing, вероятно, из ранее заархивированного старого контента.
Спустя более двух лет после того, как OpenAI запустила ChatGPT, многие крупнейшие мировые разработчики ИИ подписывают соглашения с издателями контента для доступа к качественному контенту для своих проектов GenAI.
В июне OpenAI подписала соглашение с журналом Time на доступ ко всему архиву журнала, охватывающему более чем 100-летнюю историю.
Као Фонг (по данным SCMP)
Источник: https://www.congluan.vn/baidu-chan-google-va-bing-thu-thap-noi-dung-truc-tuyen-post309081.html
Комментарий (0)