微软下架争议博文:教用户用盗版《哈利 · 波特》全集训练 AI

2026-02-21 发布 · 浏览18次 · 点赞0次 · 收藏0次

2 月 21 日消息,科技媒体 Ars Technica 昨日(2 月 20 日)发布博文,报道称微软遭到舆论强烈反弹后,删除了 Azure 官方博客上一篇发布于 2024 年 11 月的技术教程。

援引博文介绍,该文章由微软高级产品经理 Pooja Kamath 撰写,主要演示如何利用 Azure SQL 数据库和 LangChain 技术快速构建生成式 AI 应用。

不过文章的核心演示案例竟是指导用户下载并使用盗版的《哈利 · 波特》全集来训练大语言模型(LLM)。

图源:已删除的微软博客

为了展示新功能的“亲和力”,该教程设计了两个应用场景:构建问答系统和生成同人小说。作者展示了一个由 AI 生成的营销故事:

在霍格沃茨特快列车上,哈利 · 波特遇到了一位新朋友,这位朋友向哈利热情推销微软 SQL 中的“原生向量支持”(Native Vector Support)功能,并将其比作“麻瓜世界的魔法”。

教程还附带了一张哈利与朋友带有微软 Logo 的生成图片。法律专家 Cathay Y. N. Smith 指出,这种利用受版权保护的角色进行商业营销的行为,极易触犯版权法。

教程中提供的训练数据链接指向数据科学平台 Kaggle 上的一个数据集。该数据集包含《哈利 · 波特》全七册电子书,且被上传者 Shubham Maindola 错误地标记为“公有领域(Public Domain)”。

尽管该数据集已存在多年并积累了超过一万次下载,但《哈利 · 波特》系列显然仍处于版权保护期内。在媒体 Ars Technica 联系上传者后,Maindola 承认标记错误并删除了数据集,称其本无意误导版权状态。

微软下架争议博文:教用户用盗版《哈利 · 波特》全集训练 AI - AI 资讯 - 资讯 - AI 中文社区

声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。本站拥有对此声明的最终解释权。如涉及作品内容、版权和其它问题,请联系我们删除,我方收到通知后第一时间删除内容。

点赞(0) 收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
游客
登录后再评论
  • 鸟过留鸣,人过留评。
  • 和谐社区,和谐点评。