2016 年 10 月 19 日,英国剑桥大学理论物理学教授 Stephen Hawking 曾预言:“强大 AI 的崛起,可能将是人类遇到的最好的事情,也可能是最坏的事情。”
此后 7 年还不到,Stephen Hawking 教授的预言似乎就“成真”了:在近半年的 ChatGPT 热潮下,很多人看见了它的强悍和优势,但同时也有越来越多人开始担心 AI 时代下的隐私保护——于是,近来凭借 ChatGPT 和 GPT-4 风头正盛的 OpenAI 和微软,突然就被告了。
上周,16 位匿名人士决定起诉微软和 OpenAI,称这两家公司基于 ChatGPT 的 AI 产品在未获得同意或提供充分通知的情况下,收集并泄露了他们的个人信息,要求索赔 30 亿美元。
图片
图片
“盗窃”而来的 3000 亿单词?
根据这 16 人提交给加利福尼亚州旧金山联邦法院、长达 157 页的诉讼书显示,OpenAI 和微软被指控违反了《电子通讯隐私法》,即无视获取 AI 模型数据的合法途径,选择在不付费的情况下收集数据。
“尽管存在购买和使用个人信息的既定程序,但被告(OpenAI 和微软)还是采取了不同的方式:盗窃。”
在最初 ChatGPT 刚爆火的时候,OpenAI 就曾介绍过 ChatGPT 的强大功能,来自大规模预训练——它有 3000 亿单词的语料库预训练。但原告称,OpenAI 从互联网上的书籍、文章和发帖中所获取的 3000 亿字内容,远远超过其合理授权的范围。
具体来说,这 16 人指控 OpenAI 和微软通过其 AI 产品“收集、存储、跟踪、共享和披露”数百万人的个人信息,并且获得的信息范围很广,包括产品细节、账户信息、姓名、联系方式、登录凭证、电子邮件、支付信息、交易记录、浏览器数据、社交媒体信息、聊天日志、Cookie、搜索记录和其他在线活动等等。
原告坚称,在“从全球数百万毫无戒心的消费者那里非法收集个人资料”后,微软和 OpenAI 将其嵌入至他们的 AI 模型中,这才创造出了现在的 ChatGPT 等 AI 产品:
▶ “OpenAI 大规模使用窃取并盗用个人信息,以此创造了强大且利润丰厚的 AI 产品,并不顾风险地将其对外发布。”
▶ “OpenAl 的技术价值已高达到数百亿美元,而且其进入每一个公共和私营行业的范围还在
来源:微信公众号