中国Twitter网消息:AI竞争日趋白热化,马斯克和微软间的火药味也越来越浓。
4月19日,微软发布公告称,自本月25日起,其为广告商提供服务的平台Smart Campaigns将不再支持推特。此举意味着用户无法通过微软提供的平台创建并管理推文,同时也将无法在 Microsoft Advertising 平台上查看他们广告及推文的浏览量。
Smart Campaigns为一个面向广告主的社交媒体规划和调度工具,可帮助广告商在该平台管理Facebook、Instagram和LinkedIn等多个社交媒体。
微软“狠狠踹了一脚”,马斯克随即发起反击。
马斯克于4月20日发推文称可能会起诉微软,指控微软“非法”利用推特数据训练AI:
“他们非法使用Twitter数据进行训练。诉讼时间到了。”
而这一切的导火索或许是推特计划向用户收取高额数据访问费用,这也进一步证明了在AIGC热潮下,数据对于科技巨头们显得更为重要。
访问推特数据要付费
今年2月2日,马斯克宣布平台API访问将在一周内设置付费墙。一周后,他决定将这一措施的上线推迟到2月13日。结果因为推特遭遇宕机事件,这个最后期限也过去了,目前这项收费措施没有实施。
自2006年成立以来,学者们可以免费访问推特的应用程序编程接口(API),从而获取平台上的各种信息数据。
根据2020年的数据来看,已有超过17500篇学术论文基于推特平台的数据进行分析。
但推特新规让大多数依赖API访问开展研究的学者和组织将无法继续使用推特。
根据推特客户代表在今年3月初公布的一份文件来看,该公司现在计划就开发者平台向相关用户提供三个级别的企业包 (Enterprise Packages),每年最少支付超50万美元:
其中最便宜的 Small Package 每月需要支付4.2万美元,可以访问 5000 万条推文。更高的级别可以让研究人员或企业访问更多数据,分别为 1 亿条和 2 亿条推文,但每月的费用分别为 12.5 万美元和 21 万美元。
很多免费使用现有推特 API 的用户都证实了这一消息,他们都收到来自推特公司的电子邮件,称新的定价计划将在几个月内生效。
数据已成AI军备竞赛的重要一环
AIGC热潮下,数据重要性愈发凸显,像GPT这样大型语言模型(LLM)的训练往往需要TB级的数据量。
无独有偶,4月18日,美国访问量最大的网站之一Reddit宣布,将向使用其API数据训练的公司收取数据使用费,其中便包含微软、谷歌、OpenAI等:
谷歌聊天机器人Bard的底层算法之一便是用Reddit聊天数据训练而来;OpenAI的ChatGPT也将Reddit数据纳入大型语言模型的训练内容。
目前,Reddit暂未公布具体收费标准,但其表示,将会给出不同的等级,根据使用者的规模和需求来收费。
华尔街见闻此前分析指出,AI公司是否有权从互联网上抓取内容,并把这些数据输入他们的训练模型,是一项模糊不明的法律问题。
今年2月,在线图库Getty Images已起诉AIGC领域独角兽Stability AI,称其侵犯了Getty Images的版权。
此前,OpenAI首席执行官Sam Altman在谈到版权问题时表示,ChatGPT是根据两年前的数据进行训练的。他还表示,OpenAI也在积极和内容公司合作,获得授权,表示公司愿意为特定领域的高质量数据支付高价。
去年,OpenAI与在线图库Shutterstock达成了协议,Shutterstock给OpenAI提供数据,OpenAI给Shutterstock提供技术。与此同时,Shutterstock还设立了一个基金,那些作品被用于AI训练的艺术家提供补偿。