随着ChatGPT在全球范围内的迅猛增长,其开发公司OpenAI正面临越来越多的质疑和批评。近期,OpenAI陷入了一连串法律纠纷之中。16名匿名个人向OpenAI及其母公司微软提起诉讼,指控ChatGPT未经告知或同意便收集并泄露了他们的个人信息。
根据诉状,尽管有购买和使用个人信息协议存在,但OpenAI与微软系统性地从互联网上窃取了3000亿个单词,其中包括数百万无需同意即可获取的个人资料。这一行为违反了涉及AI模型数据管理的一系列法律法规,并且没有支付相应费用。
这些被窃取数据来源于互联网、书籍、文章、网站和帖子等多个渠道,其中包含账户信息、姓名、联系方式、电子邮件地址、支付记录以及浏览器历史等敏感信息。此外,这些数据还可能揭示出用户的兴趣爱好、私人观点工作履历甚至家庭照片等细节。
起诉方估计至少30万本书籍进入了OpenAI训练模型,而其中许多来自侵权网站,如Library Genesis和Sci-Hub。虽然在公布GPT-3训练数据时表示15%为来自两个互联网图书库,但原告认为这些内容源自非法提供资源的小型网络图书馆网站。
此前,在去年11月,Copilot代码助手推出时,一群程序员就对其版权侵犯问题向法院提起诉讼,并索赔达90亿美元。不过,该案件至今尚未裁决结论。
这些事件无疑敲响了隐私保护警钟,不仅是针对OpenAI,也是全世界企业必须采取负责态度进行数据收集与使用的问题。随着人工智能技术日益发展,对于如何确保合法透明使用个人数据变得尤为紧迫,尤其是在大规模收集用于训练机器学习模型的情况下。
企业在保护隐私方面扮演关键角色,因此在处理个人数据时必须遵守相关规定,并提供清晰透明的服务条款,以实现人工智能技术发展与用户隐私安全之间平衡共存。