第三方抓取X/Twitter平台数据并没有违法

中国Twitter网消息:在人工智能兴起后诸如 X/Twitter 这样的社交网络平台包含的大量数据也成为香饽饽,因此埃隆马斯克从 2023 年下半年就调整各种访问限制,包括未登录时禁止阅读更多内容、限制通过 API 抓取数据等。除了从系统层面限制数据被抓取外,X/Twitter 还起诉多个尝试抓取平台数据的公司,希望通过法律手段警告其他数据抓取者,逼迫这些人购买 X/Twitter 上的数据。

例如在 2023 年 8 月数据公司 Bright Data 就遭到起诉,不过该公司并没有否认抓取 X/Twitter 内容,该公司甚至大方承认就在抓取数据,而且认为这是合理的、即便被起诉也不会停止抓取。

日前美国加利福利亚州的联邦法院做出裁决,裁定 X 平台在诉讼中提交的任何主张都不能证明继续审判是合理的,法院驳回 X 的所有主张。

法院在审理过程中强调了一个关键问题:社交网络实际上是不拥有用户数据的,因为社交网络平台不能一方面享受避风港原则带来的好处,一方面又强调数据属于自己。

避风港原则指的是平台对于用户发布的内容不承担法律责任,即用户发布侵权内容后,版权所有者可以通知平台删除内容,只要平台及时处理那么版权方就不能起诉平台,但可以起诉发布侵权的用户。

平台可以根据避风港原则规避各类潜在的版权问题 — 主张用户发布的内容不是平台行为,因此平台自然不需要承担额外的法律责任。

在这起案例中,法院认为 X/Twitter 可能会造成影响公共利益的信息垄断,即该平台本身不拥有数据而是通过其他方式向用户提供公开的数据,因此 Bright Data 抓取这些公开数据自然不算是违法行为。

对于 X 认为 Bright Data 抓取数据、销售数据抓取工具是欺诈、违反使用条款、非法侵入和欺诈的说法,法院同样不认同,法院认定 X 试图对用户信息主张版权的行为不符合法律。

值得注意的是 Bright Data 还在抓取其他社交网络平台的数据,包括 Meta 公司的 Facebook、Instagram 等,因此也遭到了 Meta 的起诉,在今年 1 月份法院同样驳回了 Meta 的诉讼主张,之后 Meta 宣布放弃诉讼。

可以看到在短短 5 个月内这家数据公司已经赢得 Meta 和 X 两家社交网络巨头的诉讼,这些判决也都变成了判例,未来即便 X 尝试起诉更多数据抓取者估计也还是会败诉。

对社交网络平台而言这些判决是危险的,这意味着任何人都可以抓取平台的数据 — 前提是绕过平台的技术限制手段,这些数据公司可以通过技术手段抓取大量数据并出售给 AI 公司或其他公司。

平台除了加强技术手段阻止抓取外,无法通过法律层面获得支持,所以未来就会变成各种技术对抗,一方加强防御、另一方想办法突破限制。