OpenAI 在印度首例生成式人工智能版权侵权诉讼中面临数据抓取指控 - 杭州君度专利代理事务所

OpenAI 在印度首例生成式人工智能版权侵权诉讼中面临数据抓取指控

作者:admin     发布时间:2025年5月9日

印度著名多媒体新闻机构亚洲国际新闻(ANI)在德里高等法院对人工智能公司OpenAI提起了版权侵权诉讼(ANI Media Pvt Ltd诉OpenAI Inc & Anr案)。这是生成式人工智能平台在印度首次面临版权侵权指控。ANI声称,OpenAI的大型语言模型(LLM)ChatGPT一直在从其网站上非法抓取可免费获取且已付费的版权内容。

该案件对许多行业产生了深远的影响,来自出版、音乐和科技行业的公司都提交了干预申请。

OpenAI坚持认为,为LLM抓取数据不构成侵权

OpenAI已开始在法庭上进行辩论,重申对信息进行提取并不一定构成侵权,也没有普遍禁止使用数据的规则。OpenAI的LLM是针对数据中的非表达性元素进行训练的,这些元素不能获得版权,相反,它将数据分解成“标记”,这些标记严格包含“非表达性”的句法、语义和语法信息以及任何模式或相关性。然后,通过分配机器可读的数字,这些标记被转换成向量,LLM利用这些向量进行预测和决策,从而形成ChatGPT生成回复的基础。

OpenAI将这种情况比作阅读一本书。它声称,阅读构成了对一本书内容的使用,但并不等于侵权。该公司还辩称,OpenAI对其模型进行了改进,以防止重复使用,并且在预训练阶段后,这些模型不再能够访问原始训练数据。

专家在法庭上意见不一

两位被任命为该诉讼案公正顾问的版权专家向德里高等法院提交了书面意见和论据。其中一位坚持认为,印度版权法允许将“存储受版权保护的材料”用于训练人工智能模型,法院必须判定OpenAI是否将这些材料用于除此之外的任何目的。然而,另一位则向法院提出,OpenAI未经授权使用版权作品的行为构成侵权,而且不能主张合理使用,因为该公司不是新闻机构,也没有将材料用于批评或评论意见。双方都认同的一点是,由于ANI在德里开展业务,因此法院对这起诉讼具有管辖权。

与此同时,在2025年2月7日的议会会议上,电子和信息技术部在回答询问时表示:

包括社交媒体公司在内的任何中介机构为训练人工智能模型或出于任何其他目的而对任何公开的用户数据进行网络抓取,均受2000年《信息技术法》的监管。

值得注意的是,《信息技术法》第43条对未经授权访问、下载或从计算机系统中提取数据的行为予以处罚。因此,未经同意抓取的任何数据都可能构成违反该法的行为。

该部们还澄清说,2023年《数字个人数据保护法》要求各组织实施强有力的合规措施,如在处理数据前征求明确、知情的同意——包括对公开用户数据进行网络抓取。

第三方提交干预申请,强调对其行业的影响

多个利益相关方最近提交了申请,要求对诉讼进行干预,他们就人工智能生成的内容对各自行业的影响提出了不同的担忧。他们主张保护版权作品,并对未经授权的使用主张赔偿。

代表印度80%以上出版业的印度出版商联合会(Federation of Indian Publishers)认为,OpenAI在未经授权的情况下使用受版权保护的内容会降低文学作品的经济价值,并危及出版业的发展。同样,代表印度主要印刷和电视媒体公司的数字新闻出版商协会(Digital News Publishers Association)也声称,OpenAI的模式非法提取和重新利用了内容,削弱了新闻业的可信度和财务可持续性。

印度音乐产业(IMI)——一个代表印度唱片业发行商的信托机构——声称,在未获得许可的情况下使用受版权保护的歌曲进行人工智能模型训练构成了侵权,并导致了权利所有人蒙受经济损失。

印度治理与政策项目(Indian Governance and Policy Project)是一个以技术为重点的智库,它也提交了一份干预申请,强调了监管方面的问题,以及用平衡的人工智能政策框架来解决版权和合理使用问题的必要性。然而,同样在申请进行干预的初创公司Flux Labs AI已告知法院,对使用受版权保护的作品训练人工智能模型征收强制性许可费可能会阻碍创新,并扼杀小公司的竞争能力。感兴趣的各方可以关注此案的进展。(编译自www.worldtrademarkreview.com)

翻译:王丹 校对:刘鹏



  免责声明:本网转载或编译文章原文均来自网络,不代表本网观点或证实其内容的真实性。若有来源标注错误或涉及文章版权问题,请与本网联系,本网将及时更正、删除,谢谢。