💥 Gate广场活动: #FST创作大赛# 💥
在 Gate广场 发布 CandyDrop 第71期:CandyDrop x FreeStyle Classic Token (FST) 相关原创内容,即有机会瓜分 3,000 FST 奖励!
📅 活动时间:2025年8月27日 – 9月2日
📌 参与方式:
发布原创内容,主题需与 FST 或 CandyDrop 活动相关
内容不少于 80 字
帖子添加话题: #FST创作大赛#
附上 CandyDrop 参与截图
🏆 奖励设置:
一等奖(1名):1,000 FST
二等奖(3名):500 FST/人
三等奖(5名):200 FST/人
📄 注意事项:
内容必须原创,禁止抄袭或刷量
获奖者需完成 Gate 广场身份认证
活动最终解释权归 Gate 所有
活动详情链接: https://www.gate.com/announcements/article/46757
再让AI大厂这么“偷”下去,咱可能就看不到免费的网站了
原文来源:差评
几天前,谷歌突然更新了隐私政策,明确表示要用网上所有的公开数据,来训练自家的 AI 模型。
OpenAI 前脚刚被起诉数据侵权还没多久,谷歌就马上着急来撞枪口。
这事儿啊,自打 ChatGPT 爆火后再也没消停过。
世超先给大家伙儿捋捋时间线。
今年 3 月的时候呢,马斯克带头打响了数据收费第一枪,宣称推特的 API 接口不再免费了。
上个月 Reddit 闹得沸沸扬扬的 “ 停电 ” 运动,就是为了抗议官方的 API 收费政策。
再到这段时间,推特又整了限流的幺蛾子,没有花钱认证的帐号每天就只能阅读 600 条贴文,目的呢也是为了防止机器人抓取用户数据。
世超觉着啊,还是AI 的锅。
现在能做大模型的,要不就是自己家有数据,像百度、阿里和腾讯;要不就是爬人家的数据,这里点名 OpenAI 。
因为很多网站都开放有免费的 API 接口,才给了微软、 OpenAI 这些巨头可乘之机。
甚至于 Reddit 的 CEO 霍夫曼都把话搬上明面儿了:就是不想免费提供数据给巨头们。
不过,法律这次会不会站在 OpenAI 这边,还真不好说。
1.数据爬虫的行为本身是否是合法的?
2.数据是否受到版权的保护?
3.用数据生成的作品是否受到版权保护?
首先第一个问题,要获取数据,无非就是付费购买,或者收集网上公开的数据。
但需要注意的是,公开的数据并不能等同于授权使用,而且还要看网站是不是有相关的条款对数据爬虫行为做出了限制。
其次,关于数据本身是否受到版权保护。
根据美国的版权法,如果 AI 模型训练所用的数据符合 “ 合理使用 ” 的范围,那就不会构成侵权。
但问题就出在这 “ 合理使用 ” 上。
像什么新闻报道、学术研究,适当引用是完全 ok 的。
可 AI 模型上亿万级别的数据使用量、已经商业化的 AI 软件,还能算作 “ 合理使用 ” 吗?
最后,就是 AI 生成作品的版权问题。
因为训练数据版权理不清, AI 生成的内容自然也会存在版权争议。前几天, Steam 还下架了一款使用了 AIGC 生成的游戏,理由就是版权有问题。
因为训练数据是人家的,美国版权局认定 AI 生成的作品不受版权法保护,甚至还可能侵犯著作权。
而日本政府的态度则截然不同,表示日本法律不保护 AI 训练所用数据的版权。
▼OpenAI 被起诉的文件
这事儿呢,对于平台来说,当然是个挣钱的新路子,科技巨头再不济也就是多砸点儿钱。
当年,互联网就是带着开放共享的基因出生的,像什么维基百科、推特,之前常年免费提供 API 接口,开发者调用数据很方便。
毕竟,小开发者没有支付巨额数据费的能力,如果创新只在巨头里发生,这不就是纯纯搞垄断了?
最主要的是,可能很多现在免费能看到的网站之后就要花钱才能看了,这才是对咱们这种普通用户的真实暴击。
所以,关键还要是看监管的大锤什么时候能落下。
厘清数据版权,是 AI 要发展始终绕不过去的一道坎儿,而现在,似乎也同样关乎着互联网的未来走向。
不知道 AI 这艘船,会将我们推向一个更开放,还是更封闭的时代?